请大神指导从大日志文件中统计关键字次数的办法-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

请大神指导从大日志文件中统计关键字次数的办法

阅读量：5964 次

发布时间：2019-06-19

本文共 465 字，大约阅读时间需要 1 分钟。

awk 'NR==FNR{a[$0]=1;next}{if($0 in a)b[$0]++}END{for (i in b)print i,b[i]}' filea fileb | sort

文件A中有若干行数据，每行为一个关键字
文件B为大日志文件，大小为10G以下
想着能够统计出文件A中每个关键字在B中的出现次数，例如
行1，3
行2，10
行3，100
。。。。。
最笨的办法是逐行读入后用grep，但是太费时间，有没有只打开一次B文件，就能把A中所有行都统计出来的办法呢？

1. aaa 3
2. bbb 3
3. ccc 4
4. ddd 2
5. 给个大概的思路你，因为不知道你的文本时怎样的，所以没考虑边界问题，自己根据实际情况改一下吧~
  
  awk 'ARGIND==1{a[$0]}ARGIND==2{for(i in a)if($0~i)a[i]++}ARGIND==3{printf "%s,%d\n",$0,a[$0]}' a b

转载于:https://www.cnblogs.com/liliuguang/p/9541243.html

你可能感兴趣的文章

PostgreSql 分页limit

在MySQL中创建cm-hive使用的数据库及账号

HDU 2503 a/b + c/d(最大公约数与最小公倍数,板子题)

GCD学习(五) dispatch_barrier_async

file_get_contents("php://input")的使用方法

MeasureSpec学习

Android View体系（五）从源码解析View的事件分发机制

数据结构之并查集（Disjoint Set）

枚举类的创建和使用

如何改变Myeclipse编辑区背景色(转)

深入浅出LVM on linux

Eclipse+Maven创建webapp项目

drill 数据库查询方式简单说明

nodeJS之二进制buffer对象

sql server 2008安装图解

并查集图冲突hdu1272

Effective JavaScript Item 40 避免继承标准类型

Yocto tips (10): Yocto hellworld 加入一个软件包

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-12-29 02:04:47 当前IP: 3.147.45.159 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我