看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gr99123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
pandas.ExcelFile 对象还有一个非常重要的属性叫做 book。它直接与 openpyxl 或 xlrd 等 Excel 处理引擎交互,允许用户访问 Excel 文件的底层对象。
book 属性介绍如下:
类型:
openpyxl 读取 .xlsx 文件,book 会返回一个 openpyxl 的 Workbook 对象。xlrd 读取 .xls 文件,book 会返回一个 xlrd.Book 对象。功能: 通过 book 属性,用户可以访问底层的 Excel 文件对象,这在需要执行更底层操作时非常有用,比如操作 Excel 文件的格式、样式、图表等,而这些通常是 Pandas 的高层接口无法直接处理的。
book 对象import pandas as pd
# 使用 ExcelFile 读取 Excel 文件
excel_file = pd.ExcelFile('data.xlsx')
# 获取底层的 Workbook 对象
workbook = excel_file.book
# 打印 Workbook 对象,查看其类型
print(type(workbook))
如果 Excel 文件是 .xlsx 格式,并且 Pandas 使用了 openpyxl 引擎,我们可以利用 book 来做一些高级操作。
import pandas as pd
# 使用 ExcelFile 读取 Excel 文件(确保 openpyxl 已安装)
excel_file = pd.ExcelFile('data.xlsx', engine='openpyxl')
# 获取底层的 Workbook 对象
workbook = excel_file.book
# 访问第一个工作表对象
sheet = workbook.active
# 打印第一个工作表名称
print(sheet.title)
# 获取单元格的值
print(sheet['A1'].value)
如果 Excel 文件是 .xls 格式,并且 Pandas 使用了 xlrd 引擎,我们可以利用 book 来做类似的操作。
import pandas as pd
# 使用 ExcelFile 读取 Excel 文件(.xls 格式)
excel_file = pd.ExcelFile('data.xls', engine='xlrd')
# 获取底层的 Book 对象
book = excel_file.book
# 获取工作表的数量
print(book.nsheets)
# 获取第一个工作表的名称
print(book.sheet_names()[0])
book 属性提供了对底层 Excel 文件对象的访问,允许用户执行 Pandas 无法直接支持的操作,比如自定义格式、修改图表、设置复杂的单元格样式等。更新时间:2024-10-10 15:24:37 标签:pandas python excel