如何在python中读取xlsx文件并将特定的列值存储到数组中?

用户

你好,社区,我正试图找出如何从xlsx文件读取数据并将其存储到数组中。在python27上我能下载的最好的库是什么?在

我想知道如何读取一个特定的列,从列中获取值到某个单元格,然后将其存储到数组中?在

示例:对于线性回归分析,我有一个Y变量和一个多变量X方程。在

Y值将从特定列中读取

例如:

y= [1,2,3,4,3,4,5,4,5,5,4,5,4,5,4,5,6,5,4,5,4,3,4] #<-specific column

其中,多变量X值将从多个列中读取数据值

例如:

^{pr2}$

谢谢


已被浏览了5681次
更新日期: 2020-10-28 19:43:03
3 个回答
fefe Tyson

您可以使用openpyxl,并且应该在其documenation中找到所有需要的信息

评论 - 2020年8月7日 23:26
fefe Tyson

另一个选项是Win32Com。我在python2.7中使用了它来处理Excel和Word文件。在

评论 - 2020年8月7日 23:26
fefe Tyson

Pandas对于这种类型的操作非常有用。在

import pandas as pd
xl_workbook = pd.ExcelFile("my_data.xlsx")  # Load the excel workbook
df = xl_workbook.parse("Sheet 1")  # Parse the sheet into a dataframe
x1_list = df['x1'].tolist()  # Cast the desired column into a python list

具体地说,当您通过列索引调用df时,它将返回一个Numpy系列,而.tolist()则将其强制到python列表中。在

评论 - 2020年8月7日 23:26

最新Python问答

推荐Python问答