推荐专题：

300字范文 > python爬取网页某一个a标签_Python爬虫获取某个网页所有的a标签中的超链接网址...

python爬取网页某一个a标签_Python爬虫获取某个网页所有的a标签中的超链接网址...

时间：2021-07-25 18:08:37

相关推荐

python爬取网页某一个a标签_Python爬虫获取某个网页所有的a标签中的超链接网址...

Python爬虫获取某个网页所有的a标签中的超链接网址

安装BeautifulSoup

管理员身份运行命令行，然后命令行中输入以下命令：

pip install beautifulsoup4

爬虫核心代码如下：

# -*- coding:utf-8 -*-

# python 3.7

#引入系统类库

import sys

# 使用文档解析类库

from bs4 import BeautifulSoup

# 使用网络请求类库

import urllib.request

# 输入网址

html_doc = "/"

if len(sys.argv)>1:

website=sys.argv[1]

if(website is not None):

html_doc= sys.argv[1]

# 获取请求

req = urllib.request.Request(html_doc)

# 打开页面

webpage = urllib.request.urlopen(req)

# 读取页面内容

html = webpage.read()

# 解析成文档对象

soup = BeautifulSoup(html, html.parser) #文档对象

# 非法URL 1

invalidLink1=#

# 非法URL 2

invalidLink2=javascript:void(0)

# 集合

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

python爬虫提取a标签_Python爬虫 Pyppeteer获取a标签的文本和链接

2024-03-26

python分析网页上所有超链接办法

2021-01-30

python图片超链接_python自动获得网页上的所有超链接并全部截图

2024-03-19

python爬虫提取a标签_Python爬虫库BeautifulSoup获取对象(标签)名属性内容注释

2019-10-19

扩展阅读

: Python网络爬虫：一步步指导获取小说的方法

: 从零开始的Python爬虫教程（一）:获取HTML文档

: Python 爬虫分析后疫情电影现状：从低迷到稳定

: python爬虫入门实战！爬取博客文章标题和链接！

: Python小伙用简单爬虫实现成语接龙小游戏！

: python爬虫入门实战！爬取博客文章标题和链接！

最近发布

小学一年级作文300字：联欢会

2024-08-05

三年级田园风光的作文300字（精选3篇）

2024-08-05

实习自我鉴定300字实用(通用8篇)

2024-08-05

母之伟大300字作文素材大全

2024-08-04

雪中挖菜300字作文素材大全

2024-08-04

三年级小学生的三个有趣实验

2024-08-04

推荐专题

清明节心得体会300字日记我的老师300字身边那些有特点的人300字作文三年级写日记300字对知音的理解300字成都作文300字一件难忘的事作文300字写泰迪狗的作文300字读书周记300字写观察的作文300字安全教育心得体会300字小学日记300字平津战役观后感300字难忘的运动会300字周记大全300字左右