今天,我们将用Python的pip,安装下载一个第三方库BeautifulSoup4,它可以帮助我们分析HTML网页的内容。
1.安装BeautifulSoup4模块
在Windows系统下,打开一个cmd命令提示符,输入:
pip install BeautifulSoup4
如果没有出现错误信息,则打开一个Python文件,输入:
import bs4
运行代码,没有报错就说明成功安装。
2.使用BeautifulSoup4模块
from bs4 import BeautifulSoup
以上代码导入了bs4(BeautifulSoup4以下用简写)模块的解析对象类,然后,我们请求得到一个网页源代码,这里请求的网页是笔者的博客主页:
from bs4 import BeautifulSoup as bs
import requests
headers = {