BeautifuSoup和Pyquery解析库方法比较

本文介绍使用BeautifySoup和Pyquery库进行网页解析的方法,包括对象初始化、节点属性获取及文本内容获取等关键步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.对象初始化:

BeautifySoup库:

from bs4 import BeautifulSoup 
html = 'html string......'
soup = BeautifulSoup(html, 'lxml')

Pyquery库:

from pyquery import PyQuery as pq
# 以字符串初始化
html = 'html string...'
doc = pq(html)
# 以url初始化
doc = pq(url='https://....')
# 以文件初始化
doc = pq(filename='XXX.html')

2. 节点属性获取:

BeautifuSoup库:

# 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值
value = li['attr_name']
value = li.attrs['attr_name']

Pyquery库:

# 在根据CSS选择器定位到节点(例如li)后,两种方法获取属性值
value = li.attr.attr_name
value = li.attr('attr_name')

3. 文本内容获取:

BeautifulSoup库:

# 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值
text = li.string
text = li.get_text()

Pyquery库:

# 在根据CSS选择器定位到节点(例如li)后
text = li.text()

转载于:https://www.cnblogs.com/strivepy/p/9253311.html#_label0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值