Python中文
首页
教程
问答
标签
搜索
登录
注册
如何以合理的性能向数据帧添加行
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个大约120列的空数据框,我想用文件中的数据填充它。你知道吗</p> <p>我正在迭代一个大约有180万行的文件。 (这些行是非结构化的,我不能直接将它们加载到数据帧)</p> <p>对于文件中的每一行,我执行以下操作:</p> <ul> <li>从当前行中提取所需的数据</li> <li>复制数据帧中的最后一行并将其附加到<code>df = df.append(df.iloc[-1])</code>结尾。<em>副本很重要,前一行中的大部分数据不会更改。</em></li> <li>根据我提取的数据更改最后一行中的几个值<code>df.iloc[-1, df.columns.get_loc('column_name')] = some_extracted_value</code></li> </ul> <p>这是非常缓慢的,我想错误是在附加。你知道吗</p> <p>加快速度的正确方法是什么?预先分配数据帧?你知道吗</p> <p><strong>编辑:</strong></p> <p>在阅读了答案之后,我做了以下工作:</p> <ul> <li>我预先分配了数据帧(节省了大约10%的时间)</li> <li>我将此:<code>df = df.append(df.iloc[-1])</code>替换为:<code>df.iloc[i] = df.iloc[i-1]</code>(<code>i</code>是循环中的当前迭代)。你知道吗</li> <li>做过评测,尽管我删除了append,但主要问题是复制前一行,这意味着:<code>df.iloc[i] = df.iloc[i-1]</code>占用了大约95%的时间。你知道吗</li> </ul>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>最快的方法是直接通过pd.read\U csv文件() 尝试分离逻辑以清除非结构化到结构化数据,然后使用pd.read\U csv文件加载数据帧。你知道吗</p> <p>您可以共享示例非结构化行和逻辑以取出结构化数据,这样就可以共享一些相同的见解。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
Python中两个字典的交集
1 回答
python中两个字符串上的异或操作数?
6 回答
Python中两个字符串中的类似句子
3 回答
Python中两个字符串之间的Hamming距离
2 回答
python中两个字符串之间的匹配模式
6 回答
python中两个字符串之间的按位或
6 回答
python中两个字符串之间的数据(字节)切片
5 回答
python中两个字符串之间的模式
3 回答
python中两个字符串作为子字符串的区别
4 回答
Python中两个字符串元组的比较
5 回答
Python中两个字符串列表中的公共字符串
8 回答
python中两个字符串的Anagram测试
2 回答
Python中两个字符串的正则匹配
2 回答
python中两个字符串的笛卡尔乘积
6 回答
Python中两个字符串相似性的比较
7 回答
python中两个字符串语义相似度的求法
7 回答
Python中两个字符置换成固定长度的字符串,每个字符的数目相等
3 回答
Python中两个对数方程之间的插值和平滑数据
2 回答
Python中两个对象之间的And/Or运算符
1 回答
python中两个嵌套字典中相似键的和值
5 回答