PyCharm - Beautiful Soup

发布时间 2023-11-18 01:12:49作者: 鹿先森JIAN

介绍

Beautiful Soup 主要是用来解析提取 HTML 和 XML 文件中的数据。

现在官网推荐使用 Beautiful Soup 4 ,已经被移植到了BS4中。

安装 Beautiful Soup:pip instal beautifulsoup4

使用格式:

实例化 Beautifulsoup 传入被 解析的 HTML 文档内容和解析器,得到一个对象。

# 导包
from bs4 import BeautifulSoup
# 实例化构造对象
bs = BeautifulSoup(html_doc, "html.parser")
# 参数:
    -html_doc:被解析的html文档内容
    -html.parser:解析器

解析器:

常用:BeautifulSoup(html_doc, "html.parser")BeautifulSoup(xml_doc, "xml")

 

BeautifulSoup4的使用 - Mr-Yang` - 博客园 (cnblogs.com)