300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 用 Python 读写 Excel 表格 就是这么的简单粗暴且乏味

用 Python 读写 Excel 表格 就是这么的简单粗暴且乏味

时间:2019-11-22 18:34:04

相关推荐

用 Python 读写 Excel 表格 就是这么的简单粗暴且乏味

过去,在很多金融、市场、行政的招聘中,面试官都会问一句:“你精通 EXCEL 吗?”但今天,他们可能更喜欢问:“你会 Python 吗?”越来越多的企业开始用 Python 处理数据,特别是金融、证券、商业、互联网等领域。在顶级公司的高端职位中,Python 更是成为了标配:Python究竟有什么法力能让大家如此青睐?举个例子:在过去,如果老板想要获取 A 股所有股票近 2 年的数据,你可能需要登录-查询-下载-记录到excel循环 500 多次,即使你是一个没有感情的复制机器人,也需要一两天的时间。但如果你掌握了 Python,只需要写个脚本,泡杯咖啡的功夫数据就全部下载好了。再加上 Python 强大的绘图功能,你可以一次性完成数据收集 — 整理—分析— 绘图的过程,直接把分析结果用图表呈现出来。

今天本篇文章,我们就总结了一下利用 python 操作 Excel 文件的第三方库和方法。内容出自课程——《OpenPyXL 处理 Excel 基础入门》,欢迎大家来实验边敲代码边学习~课程地址:/courses/1585

首先,我们来学习一下,如何用 Python 创建和保存 Excel 文档。对于经常与数据打交道的人来说,Excel 是经常使用的工具;对于与数据打交道的程序员来说,OpenPyXL 库是一个利器。Python 官方提供了这样一个库,让我们可以直接通过 Python 代码实现对 Excel 文件的操作,操作文件格式包括 xlsx、xlsm、xltx、xltm。知识点

创建/打开工作簿

访问工作表单元及其值

保存工作表

让我们先来学习简单的创建和保存功能。创建/打开工作簿首先,下载实验所需shiyanlou.xlsx示例文件,同时安装指定版本的 openpyxl 库。

!wget -nc "https://labfile./courses/1585/shiyanlou.xlsx"!pip install openpyxl==3.0.3

使用 openpyxl 不需要在文件系统上创建文件,只需导入Workbook类并开始工作:教学代码:

from openpyxl import Workbookwb = Workbook() # 实例化一个工作簿对象print(wb)

也可以打开本地已有的工作簿进行实验操作:

from openpyxl import load_workbookwb = load_workbook(filename="shiyanlou.xlsx")print(wb)

load_workbook中可以使用以下几个参数:

>:带有公式的单元格是否具有公式(默认具有)或上一次 Excel 读取工作表时存储的值。

keep_vba:设置是否保留任何 Visual Basic 元素(默认保留),可选择保留但是不支持编辑。

工作簿创建时总是会默认创建一个名为 Sheet 工作表,可以通过使用Workbook.active属性获取:

ws = wb.active # 获取当前活跃的工作表print(ws)

也可以通过Workbook.create_sheet()创建工作表并命名,若不设置名字参数则默认命名为 sheet,sheet1,sheet2...创建的工作表位置默认总是插入到最后:

ws = wb.create_sheet() # sheetws1 = wb.create_sheet("Mysheet") # 命名为 Mysheetws2 = wb.create_sheet("Mysheet1", 0) # 新建 Mysheet1 工作表插入到第一个位置ws3 = wb.create_sheet("Mysheet2", -1) # 新建 Mysheet2 工作表插入到倒数第二个的位置ws.title = "shiyanlou" # 将上述 ws 工作表重命名为 shiyanlouprint("Success")

默认情况下,工作表的标签背景颜色为白色。我们可以通过Worksheet.sheet_properties.tabColor属性改变颜色:

ws.sheet_properties.tabColor = "1072BA" # RGB 格式print(ws.sheet_properties.tabColor)

我们给工作表取名后,可以把它作为该工作簿的一个键,简化后续代码,例如:

ws = wb["shiyanlou"]print(ws)

若想查看该工作簿下的所有工作表,可以通过函数Workbook.sheetname

print(wb.sheetnames)

也可以通过迭代的方式打印所有工作表

for sheet in wb: print(sheet.title)

我们可以通过Workbook.copy_worksheet()方法在单个工作簿中创建工作表的副本:

source = wb.active # 获取活跃的工作表target = wb.copy_worksheet(source) # 上述获取的工作表为其创建副本print(target)

访问工作表单元及其值前面我们已经知道了如何创建获取工作簿及工作表,接下来我们将学习修改单元格的内容。以下操作基于shiyanlou.xlsx工作簿中的shiyanlou工作表进行。单元格可以直接作为工作表的键进行访问赋值,用value属性进行值访问:

c = ws["A4"] # 将访问 A4 单元格ws["A4"] = 4 # 对 A4 单元格进行赋值c.value # 访问 A4 单元格的值,同 ws["A4"].value

注意:在内存中创建工作表时,它不包含任何单元格,单元格都是在首次访问时自动创建的。以上代码也可以通过更简便的代码实现:

d = ws.cell(row=4, column=2, value=10) # B4 进行赋值ws["B4"].value # 访问单元格的值

访问多个单元格可以使用切片访问范围为 A1 到 C2 的所有单元格:

cell_range = ws["A1":"C2"]cell_range

行或列的范围可以类似地获得:

# 访问列colC = ws["C"]col_range = ws["C:D"]# 访问行row10 = ws[10]row_range = ws[5:10]print(col_range, row_range)

也可以使用Worksheet.iter_rows()返回行:

for row in ws.iter_rows(min_row=1, max_col=3, max_row=2): for cell_row in row: print(cell_row)

使用Worksheet.iter_cols()返回列:

for col in ws.iter_cols(min_row=1, max_col=3, max_row=2): for cell_col in col: print(cell_col)

如果需要遍历工作表的所有行或列,则可以使用Worksheet.rows属性。出于性能原因,该属性在只读模式下不可用:

ws["C9"] = "hello world"tuple(ws.rows)

或者使用Worksheet.columns属性。出于性能原因,该属性在只读模式下不可用:

tuple(ws.columns)

访问值如果只需要工作表中的值,则可以使用该Worksheet.values属性。遍历工作表中的所有行,但仅返回单元格值:

for row in ws.values: for value in row: print(value)

Worksheet.iter_rows()Worksheet.iter_cols()可以用values_only参数,只返回单元格的值:

for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True): print(row)

保存工作表将我们之前创建的工作簿保存格式为 xlsx 的文件,若已存在则覆盖:

wb.save("shiyanlou.xlsx")

篇幅有限,后续的课程内容,请在实验楼边敲代码边学习~

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。