我试图找到一种方法,从Python中的一个大数据帧中只读取一个值。 我的项目中有两个数据表。你知道吗
一个是这样的:
Company ID Company 201512 201511 ... 199402 199401
1234 abc 1.1 0.8 ... 2.1 -0.9
.
.
.
4321 cba 2.1 -0.4 ... 0.3 -0.1
大约有260个月和10000家公司。我需要逐个检查他们的月报表,看看那个数据点后面是否有36个有效数据点。这意味着不存在“0”或“NaN”。如果有36个有效的数据点,我需要将这36个数据点与另一个表中列出的7个因子进行回归。你知道吗
另一个表如下所示:
Month Factor1 Factor2 ... Factor6 Factor7
201512 -0.4 1.1 ... 2.1 1.2
.
.
.
199401 0.1 0.2 ... 0.3 0.4
现在我的问题是,我无法从表1中一次只加载一个值并为其创建循环。有人能告诉我吗?你知道吗
可以使用以下代码对行进行迭代:
然后
index
将是行的索引,您可以使用row["Company"]
访问列。你知道吗你不需要for循环。你知道吗
假设
0
是一个有效的月度回报,并且在Company
之后只有36列,您可以很容易地找到所有具有有效月度回报数据的公司:如果出于某种未知的原因,您想摆脱
0
,可以先进行替换:编辑评论:
你可以这样做:
相关问题 更多 >
编程相关推荐