博客目录
在日常数据处理和配置文件管理中,我们经常需要从大型文件中提取特定内容。
本文介绍的提取特定行技术正是这些高级操作的基础。以提取含有"1"的简单需求为例,我们可以掌握通用的文件处理模式。
1、方法一:使用 grep 命令
1.1 grep 命令基础
grep(Global Regular Expression Print)是 Unix/Linux 系统中强大的文本搜索工具。基本语法为:
grep [选项] 模式 [文件...]
在我们的案例中,命令非常简单:
grep "1" 111.yaml > new_file.yaml
1.2 命令详解
"1"
:搜索模式,这里是要匹配的数字 1111.yaml
:输入文件>
:重定向操作符new_file.yaml
:输出文件
1.3 高级用法
- 忽略大小写:
grep -i "pattern" file
- 显示行号:
grep -n "1" 111.yaml
- 反向匹配:
grep -v "1" 111.yaml
(提取不含 1 的行) - 正则表达式:
grep "^1" 111.yaml
(匹配以 1 开头的行)
2、方法二:使用 Python 脚本
2.1 Python 实现解析
提供的 Python 脚本非常简洁:
with open('111.yaml', 'r') as file, open('new_file.yaml', 'w') as new_file:
for line in file:
if '1' in line:
new_file.write(line)
2.2 代码分步说明
-
文件操作:
open('111.yaml', 'r')
:以只读模式打开源文件open('new_file.yaml', 'w')
:以写入模式打开目标文件with
语句确保文件操作后自动关闭
-
逐行处理:
for line in file:
:迭代文件的每一行if '1' in line:
:检查当前行是否包含字符"1"
-
写入匹配行:
new_file.write(line)
:将匹配行写入新文件
2.3 增强版 Python 实现
更健壮的实现应考虑以下方面:
try:
with open('111.yaml', 'r', encoding='utf-8') as file, \
open('new_file.yaml', 'w', encoding='utf-8') as new_file:
for line_number, line in enumerate(file, 1):
try:
if '1' in line:
new_file.write(line)
except UnicodeDecodeError:
print(f"编码错误发生在第{line_number}行")
continue
except FileNotFoundError:
print("错误:输入文件未找到")
except IOError as e:
print(f"文件操作错误: {e}")
觉得有用的话点个赞
👍🏻
呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍
🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙