使用Python读取Excel动态文件引用

2024-04-19 14:41:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用Python读取包含对其单元格的动态工作簿引用的excel文件。 当我使用openpyxl并读取它时,它返回动态工作簿引用为“=[1]0”的单元格!T10' 而不是:

'='Q:\OPERATIONS\PERFORMANCE\ANALYSIS\2019[ANALYSIS.xlsx]Sheet0!T10'

我需要有关正在引用的文件路径的信息。 以下是重现问题的代码:

1: from openpyxl import load_workbook
2: import pandas as pd
3: xls = r"C:\TEST\test.xlsx"
4: wb = load_workbook(filename = xls, read_only=True)
5: ws = wb("sheet1")
6: df = pd.DataFrame(ws.values)
7: ws["E11"].value

这将返回'=[1]0!T10'

当我在第6行转换为dataframe时,它返回的df值不是公式,所以这没有帮助。 有没有更好的包或方法来提取python中引用的文件路径


Tags: 文件import路径dfwsload动态analysis
1条回答
网友
1楼 · 发布于 2024-04-19 14:41:43

感谢@Charle Clark为这个难题提供了解决方案。此link可用于获取Excel文件中的动态工作簿引用

for root, dirs, files in os.walk(root, topdown=False):
        for name in files:
            if name.count(".xls"):
                try:
                    xls = os.path.join(root, name)
                    wb = load_workbook(filename = xls, read_only=True)
                    print(xls)
                except Exception as err:
                    msg = "ERROR: {} file failed to read!".format(xls)
                    print(msg)
                    print(err)
                    f.write(str(err)+"\n")
                    continue
                
                items = wb._external_links
                msg = "There are {} external links..".format(len(items))
                print(msg)
                if len(items) > 0:
                    xls_dict[xls] = []
                    for index, item in enumerate(items):                        
                        Mystr = wb._external_links[index].file_link.Target
                        Mystr = Mystr.replace("file:///","").replace("%20"," ")
                        print(Mystr)

此代码可能更简单,但可以完成任务。此外,openpyxl不会打开旧版本的excel(xls),这需要单独处理。您可以通过搜索xlsx或释放错误消息进行过滤,如上所示

相关问题 更多 >