介绍
Beautiful Soup 主要是用来解析提取 HTML 和 XML 文件中的数据。
现在官网推荐使用 Beautiful Soup 4 ,已经被移植到了BS4中。
安装 Beautiful Soup:pip instal beautifulsoup4
使用格式:
实例化 Beautifulsoup 传入被 解析的 HTML 文档内容和解析器,得到一个对象。
# 导包 from bs4 import BeautifulSoup # 实例化构造对象 bs = BeautifulSoup(html_doc, "html.parser") # 参数: -html_doc:被解析的html文档内容 -html.parser:解析器
解析器:
常用:BeautifulSoup(html_doc, "html.parser")、BeautifulSoup(xml_doc, "xml")