「python」re模块 网络爬虫简介 第三方模块下载 openpyxl模块

本文介绍了Python的re模块,包括re.findall(), re.finditer(), re.search()和re.match()等函数,并讲解了网络爬虫的基础知识,如其本质和实操。此外,还讨论了第三方模块下载问题,特别是如何解决下载速度慢和报错的常见问题。最后,文章介绍了openpyxl模块,用于在Python中操作Excel,以及Excel的版本后缀和实操步骤。" 113037489,10544730,理解几何结构因子与消光现象:布拉格衍射解析,"['晶体学', '物理', '光学', '材料科学', '衍射']

昨日内容回顾

  • 正则表达式

    • 简介
    • 字符组
    • 特殊符号
    • 量词
    • 贪婪与非贪婪
    • 取消转义

今日内容详细

re模块*

在python中如果想要使用正则表达式 re模块是选择之一

re.findall()

# 通过正则表达式筛选出文本中所有符合条件的数据
# 语法结构
re.findall('正则','待匹配的文本')
# e.g
res = re.findall('o','jojo johnathan joe john')
print(res)	# ['o', 'o', 'o', 'o', 'o'] 列表

re.finditer()

# finditer与findall作用一致 只不过结果会被处理成迭代器对象 用于节省内存
res = re.finditer('o','jojo johnathan joe john')
print(res)  # <callable_iterator object at 0x7fce8ed708b0>
# 可以通过用__next__打印
print(res.__next__())	#<re.Match object; span=(1, 2), match='o'> #麻烦不推荐
for i in res:		#推荐
    print(i)

re.search()

# search通过正则表达式匹配到一个符合条件的内容就结束
res = re.search('o','jojo johnathan joe john')
print(res)  #<re.Match object; span=(1, 2), match='o'>
print(res.group())	# o

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值