之前我介绍过linux 的join命令和sort命令。有一点没有说明的是,使用join的时候是要对两个比较的文件先排序的。
但是这个排序是要小心进行的,一般使用sort不附加任何参数即可以,因为join实际上是按字符串对两个文件进行“撞”的。所以千万不要使用例如 -n -g这类参数对文件进行排序。
阅读更多…
Say you say me ,say we together~~
之前我介绍过linux 的join命令和sort命令。有一点没有说明的是,使用join的时候是要对两个比较的文件先排序的。
但是这个排序是要小心进行的,一般使用sort不附加任何参数即可以,因为join实际上是按字符串对两个文件进行“撞”的。所以千万不要使用例如 -n -g这类参数对文件进行排序。
阅读更多…
最近一直在间隙性的做着一些统计的工作,所以接触了许多实际工作中用到的一些命令,而这些命令又无一不是有着丰富的参数,这大概是linux系统特有的吧。不了解这些参数就不能好好的工作,当然也就会让你陷入被动。今天就来为大家介绍一个在linux下非常有用的命令:sort。
因为公司用的机器是freeBSD,所以指定的sort的选项和用法可能和标准linux的不太一致。不过大抵是相同的。
本文分成三个部分,分别为大家介绍sort的作用、sort的选项(参数)及其含义、以及一些简单的示例。
阅读更多…
呃,此wc命令不是让大家没有食欲的地方。而是linux下一个简单的小命令。
NAME
wc — word, line, character, and byte countSYNOPSIS
wc [-clmw] [file ...]
继续上周的任务,抽空搞了会儿统计,再不搞头就要怒了。说实话,对这些东西我一向是比较懒的,而且比较怕。 自己不熟的东西总是不肯下手,能拖就拖,这毛病也实在不像话。等拖的不能再拖了,该问人问人,该求爷爷求爷爷,反正基本上在最后时间的尾巴上把东西搞出来,然后仰天长叹,不过而而。
今天主要要用Linux的join命令,join是什么?连接嘛。
功能说明:将两个文件中,指定栏位内容相同的行连接起来。
语 法:join [-i][-a<1或2>][-e< 字符串>][-o< 格式>][-t< 字符>][-v<1或2>][-1< 栏位>][-2< 栏位>][--help][--version][文件1][文件2]
补充说明:找出两个文件中,指定栏位内容相同的行,并加以合并,再输出到标准输出设备。
昨天写的是按照其中的一列消重来取另一列的count,可是却没有交待如何取数组元素的个数,刚才简单写了一个小程序,验证通过。
一会儿就要写更麻烦的东西了,烦啊。PHP操作文件,咋就这么郁闷呢。(弱弱的抱怨一下)
阅读更多…
可能方法笨了点,不过想了半天才想出来,这玩意刚接触写的还真是慢啊。
今天要做的东西是取一列的值,并且按数据表的另一列进行消重,这可太要命了。二维数组这玩意在awk和没有一样,无奈啊。不过好在功夫不负苦心人,好歹咱是弄出来了,虽然代码并不优雅,不过总算是解决了问题。
阅读更多…
马上就要用awk来分析一些日志,所以今天继续恶补。书上的例子看了就懂,有些飘飘然。然而真正动手却发现不是那么回事。看来好记性不如烂笔头,有些东西记下来比较好。
举个最简单的例子吧,用awk求一列的最大值和最小值。按照书中的要求来写出内容。其中最让人恶心的大概就是这个字符串转数字了。
阅读更多…
egrep 是 grep的扩展,使用 egrep的主要好处是其在 grep提供的正则表达式元字符集的基础上增加了更多的元字符。不过,egrep 不支持 grep 的\(\)标记匹配字符和\{\}重复的功能。
下周的任务要用shell来开发,今天在家好好学习一下,原来会的那点皮毛实在不敢说会。因为主要是分析日志,所以我想这个grep一定会用到的。一边看书,一边记录一下。网上虽然也有很多了。但是整理的格式并不是很好,而且这些东西还是放在自己的博客上面看着最放心不是?呵呵。
如有雷同,绝非巧合。我是抄书上的。嗯。
阅读更多…