Linux grep 命令全面使用指南
一、基础搜索语法
1. 基本文本搜索
grep "search_pattern" file.txt
grep "error" /var/log/syslog
2. 多文件搜索
grep "pattern" file1.txt file2.txt
grep "error" *.log
二、常用选项详解
1. 输出控制选项
选项 | 功能 | 示例 |
---|
-i | 忽略大小写 | grep -i "Error" file.txt |
-v | 反向匹配 | grep -v "success" file.txt |
-c | 统计匹配行数 | grep -c "pattern" file.txt |
-n | 显示行号 | grep -n "pattern" file.txt |
-l | 只显示文件名 | grep -l "pattern" *.txt |
-L | 显示不匹配的文件名 | grep -L "pattern" *.txt |
-o | 只显示匹配部分 | grep -o "pattern" file.txt |
2. 上下文控制选项
选项 | 功能 | 示例 |
---|
-A num | 显示匹配行后num行 | grep -A 3 "error" log.txt |
-B num | 显示匹配行前num行 | grep -B 2 "warning" log.txt |
-C num | 显示匹配行前后num行 | grep -C 2 "critical" log.txt |
三、正则表达式搜索
1. 基本正则表达式
grep "error.*failed" file.txt
grep "^start" file.txt
grep "end$" file.txt
2. 扩展正则表达式(-E)
grep -E "error|warning" file.txt
grep -E "[0-9]{3}-[0-9]{4}" phone.txt
grep -E "\b([0-9]{1,3}\.){3}[0-9]{1,3}\b" log.txt
3. Perl兼容正则表达式(-P)
grep -P "\d{3}-\d{4}" file.txt
grep -P "[\x{4e00}-\x{9fa5}]" file.txt
四、文件与目录搜索
1. 递归搜索目录
grep -r "pattern" /path/to/directory
grep -r --include="*.log" "error" /var/log
2. 排除特定文件/目录
grep -r --exclude="*.tmp" "pattern" .
grep -r --exclude-dir=".git" "TODO" .
grep -r --exclude-dir={node_modules,.git} --exclude="*.min.js" "function" .
五、高级搜索技巧
1. 管道组合搜索
find . -name "*.log" -exec grep -H "error" {} \;
cat access.log | grep "GET" | grep "404" | cut -d' ' -f7
2. 二进制文件搜索
grep -a "text" binaryfile.bin
zgrep "error" /var/log/syslog.1.gz
3. 颜色高亮显示
grep --color=auto "pattern" file.txt
alias grep='grep --color=auto'
六、性能优化技巧
1. 加速搜索方法
grep -F "fixed_string" largefile.txt
grep -m 100 "pattern" largefile.txt
find . -type f -print0 | xargs -0 -P 4 grep "pattern"
2. 大文件处理策略
split -l 1000000 largefile.txt chunk_
for file in chunk_*; do
grep "pattern" "$file" >> results.txt
done
rg "pattern" largefile.txt
ag "pattern"
七、实用场景示例
1. 日志分析
grep "ERROR" /var/log/app.log | grep "$(date -d '1 hour ago' +'%Y-%m-%d %H')"
grep -oE "ERROR [A-Z_]+" app.log | sort | uniq -c | sort -nr
2. 代码审查
grep -r --include="*.py" "TODO" src/
grep -r "import" src/ | grep -v "from\|as"
3. 系统管理
netstat -tuln | grep -E ':(80|443)\s'
ps aux | grep -E '\b[0-9]{2,}%\b'
八、常见问题解决
1. 特殊字符处理
grep -F '.' file.txt
grep '\.' file.txt
grep '/path' file.txt
grep '\$' file.txt
2. 多行匹配处理
pcregrep -M 'start.*\n.*end' file.txt
awk '/start/{flag=1} flag; /end/{flag=0}' file.txt
九、替代工具推荐
1. 更高效搜索工具
工具 | 特点 | 安装 |
---|
ripgrep (rg) | 极速搜索 | sudo apt install ripgrep |
ag (silver searcher) | 代码搜索优化 | sudo apt install silversearcher-ag |
ack | Perl开发者友好 | sudo apt install ack |
2. 可视化工具
grep --color=always "pattern" file.txt | less -R
bat file.txt | grep "pattern"
十、最佳实践总结
1. 常用命令组合
grep -i "error" /var/log/syslog
grep -r --include="*.log" "critical" /var/log
grep -C 3 "exception" app.log
grep -E "50[0-9] Error" access.log
2. 性能优化建议
- 优先使用固定字符串:
grep -F
比正则快 - 限制搜索范围:使用
--include
/--exclude
- 大文件分块处理:使用
split
命令 - 并行处理:结合
xargs -P
3. 脚本编写技巧
#!/bin/bash
pattern="$1"
directory="${2:-.}"
if [ -z "$pattern" ]; then
echo "Usage: $0 <pattern> [directory]"
exit 1
fi
grep -r --color=always \
--exclude-dir={.git,node_modules,vendor} \
--include="*.{py,js,html,css}" \
"$pattern" "$directory" | less -R
通过掌握这些 grep 技巧,您可以高效处理各种文本搜索任务。对于大型项目或频繁搜索需求,建议尝试 ripgrep 或 ag 等现代替代工具以获得更好性能。