博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
请大神指导从大日志文件中统计关键字次数的办法
阅读量:5964 次
发布时间:2019-06-19

本文共 465 字,大约阅读时间需要 1 分钟。

  1. awk 'NR==FNR{a[$0]=1;next}{if($0 in a)b[$0]++}END{for (i in b)print i,b[i]}' filea fileb | sort
  2. 文件A中有若干行数据,每行为一个关键字
    文件B为大日志文件,大小为10G以下
    想着能够统计出文件A中每个关键字在B中的出现次数,例如
    行1,3
    行2,10
    行3,100
    。。。。。
    最笨的办法是逐行读入后用grep,但是太费时间,有没有只打开一次B文件,就能把A中所有行都统计出来的办法呢?
    1. aaa 3
    2. bbb 3
    3. ccc 4
    4. ddd 2
    5. 给个大概的思路你,因为不知道你的文本时怎样的,所以没考虑边界问题,自己根据实际情况改一下吧~

      awk 'ARGIND==1{a[$0]}ARGIND==2{for(i in a)if($0~i)a[i]++}ARGIND==3{printf "%s,%d\n",$0,a[$0]}' a b 

       

转载于:https://www.cnblogs.com/liliuguang/p/9541243.html

你可能感兴趣的文章
PostgreSql 分页limit
查看>>
在MySQL中创建cm-hive使用的数据库及账号
查看>>
HDU 2503 a/b + c/d(最大公约数与最小公倍数,板子题)
查看>>
python总结
查看>>
hdu 5215 Cycle
查看>>
GCD学习(五) dispatch_barrier_async
查看>>
file_get_contents("php://input")的使用方法
查看>>
MeasureSpec学习
查看>>
Android View体系(五)从源码解析View的事件分发机制
查看>>
数据结构 之 并查集(Disjoint Set)
查看>>
枚举类的创建和使用
查看>>
如何改变Myeclipse编辑区背景色(转)
查看>>
深入浅出LVM on linux
查看>>
Eclipse+Maven创建webapp项目
查看>>
drill 数据库查询方式简单说明
查看>>
nodeJS之二进制buffer对象
查看>>
sql server 2008安装图解
查看>>
并查集图冲突hdu1272
查看>>
Effective JavaScript Item 40 避免继承标准类型
查看>>
Yocto tips (10): Yocto hellworld 加入一个软件包
查看>>