Python BeautifulSoup4或lxml 无法解析嵌套了p标签的h2
今天在使用python的beautiful进行Web分析时发现,BeautifulSoup无法解析嵌套了p标签的h2
1 |
|
运行结果:
1 |
|
这在浏览器上是能正常显示的
但是如果把p
标签换成b
标签,则可以发现显示成功
1 |
|
运行结果:
1 |
|
我的Python版本:Python 3.9.4
bs4: 0.0.1
lxml: 4.7.1
大概率和lxml无关,因为将soup = BeautifulSoup(content, "lxml")
更换为soup = BeautifulSoup(content)
后解析结果相同。
原创不易,转载请附上原文链接哦~
Python BeautifulSoup4或lxml 无法解析嵌套了p标签的h2
https://blog.letmefly.xyz/2022/12/04/Other-Python-BeautifulSoup4lxml-h2ParseError/