300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > python爬虫代码没有结果_beautifulsoup - python爬虫获取不到标签内容

python爬虫代码没有结果_beautifulsoup - python爬虫获取不到标签内容

时间:2022-12-03 05:28:55

相关推荐

python爬虫代码没有结果_beautifulsoup - python爬虫获取不到标签内容

问 题

链接如下:

/vod-detail-i...

使用requests请求此连接,然后用BeautifulSoup解析获取 dl > dd > a 标签的内容,其中:

上图所示的4个 a 标签的内容只能获取到第一个“电影”,后面三个“动作”“喜剧”“剧情”获取不到,输出结果为None:

使用pyquery解析的话连None都不显示,直接跳过这三个标签了:

请问为什么会这样?

代码如下:

bs4解析:

web_data = requests.get('/vod-detail-id-10.html ')

web_data.encoding = 'utf-8'

soup = BeautifulSoup(web_data.text,'lxml')

actor = soup.select('dl > dd > a')

print(actor)

for i in actor:

print(i.string)

pyquery解析:

web_data = requests.get('/vod-detail-id-10.html ')

web_data.encoding = 'utf-8'

pq = pyquery.PyQuery(web_data.text)

print(pq('dl > dd >a').text())

解决方案

因为取到的html A标签不规整,只有电影这个标签是规整的,其他的A标记都提前闭合了

电影

动作

喜剧

剧情

扫一扫关注IT屋

微信公众号搜索 “ IT屋 ” ,选择关注与百万开发者在一起

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。