推荐专题：

300字范文 > python读取html文件中的表格数据_使用解析html表pd.read_html文件其中单元格本身包含完整表...

python读取html文件中的表格数据_使用解析html表pd.read_html文件其中单元格本身包含完整表...

时间：2018-07-30 09:08:25

相关推荐

python读取html文件中的表格数据_使用解析html表pd.read_html文件其中单元格本身包含完整表...

不能使用^{}读取嵌套表，但可以滚动自己的html阅读器，并对表单元格使用read_html：import pandas as pd

import bs4

with open('up_pf00344.test.html') as f:

html = f.read()

soup = bs4.BeautifulSoup(html, 'lxml')

results = soup.find(attrs = {'id': 'results'})

# get first visible header row as dataframe headers

for row in results.thead.find_all('tr'):

if 'display:none' not in row.get('style',''):

df = pd.DataFrame(columns=[col.get_text() for col in row.find_all('th')])

break

# append all table rows to dataframe

for row in results.tbody.find_all('tr', recursive=False):

if 'display:none' in row.get('style',''):

continue

df_row = []

for col in row.find_all('td', recursive=False):

table = col.find_all('table')

df_row.append(pd.read_html(str(col))[0] if table else col.get_text())

df.loc[len(df)] = df_row

df.iloc[0].map(type)的结果：

^{pr2}$

好处：由于表行有一个id，因此可以将其用作数据帧df.loc[row.get('id')] = df_row的索引，而不是df.loc[len(df)] = df_row。在

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

使用Pandas的read_html方法读取网页Table表格数据

2022-03-05

python怎样读取网页中的文本_如何使用python和selenium读取HTML表格单元格中的文本？...

2018-11-22

R语言提取html表格 R语言中使用read.table函数读取文件数据方法详解

2022-06-21

使用read_html爬取网页表哥 Python笔记：用read_html()爬取table形式表格的网络数据...

2019-11-06

扩展阅读

: 如何用PHP读取excel文件内容获取单元格数据

: 如何用PHP读取excel文件内容获取单元格数据

: html中使用pdf.js在网页中加载显示pdf文件

: Excel文件另类操作如何用Python中xlrd模块获取电子表格的信息

: 如何把多个excel表格文件数据内容合并到一个表格中

: 教你使用openpyxl库从Excel文件中提取指定的数据并生成新文件

最近发布

小小导游手把手教你游览景点 - 小学生景点导游词作文300字

2024-08-06

走我们去春游作文300字

2024-08-06

钓鱼作文300字(大全19篇)

2024-08-05

金鱼四年级作文300字-关于金鱼的作文

2024-08-05

【一件小事作文300字】一件小事给我的启示或者一句名言给我的启示作文300字左右

2024-08-05

笨狼的学校生活读后感300字

2024-08-05

推荐专题

我的老师日记300字黄果树作文300字我最喜欢的书作文300字乡村美景作文300字写一则新闻300字新学期新打算作文300字难忘的国庆节300字作文我眼中的世界300字亲子活动作文300字假如我会变作文300字校园的景色作文300字感恩教育观后感300字小公主读后感300字正能量广播稿300字左右西游记第57回概括300字