Python中文
首页
教程
问答
标签
搜索
登录
注册
如何在Python中加速此任务
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个大熊猫数据框,24'000'000行×6列加索引。 我需要读取第1列中的整数(即=1或2),然后如果第1列=1,则强制第3列中的值为负值,如果第2列=2,则强制为正值。我在Jupyter笔记本中使用以下代码:</p> <pre><code>for i in range(1000): if df.iloc[i,1] == 1: df.iloc[i,3] = abs(df.iloc[i,3])*(-1) if df.iloc[i,1] == 2: df.iloc[i,3] = abs(df.iloc[i,3]) </code></pre> <p>上面的代码只需要2分钟30秒就可以运行1000行。对于2400万行,需要41天才能完成</p> <p>有点不对。该代码在相当高端的PC上的Jupyter笔记本电脑/Chrome/Windows中运行</p> <p>熊猫数据帧是使用pd.read_csv创建的,然后按以下方式进行排序和索引:</p> <pre><code>df.sort_values(by = "My_time_stamp", ascending=True,inplace = True) df = df.reset_index(drop=True) </code></pre> <p>数据帧的创建和排序只需要几秒钟。我还有其他的计算要在这个数据帧上执行,所以我显然需要理解我做错了什么</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>使用</p> <pre><code>df.iloc[:,3] = df.iloc[:,3].abs().mul( df.iloc[:,-1].map({2:1,1:-1}) ) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
我是否正确构建了这个递归神经网络
6 回答
我是否正确理解acquire和realease是如何在python库“线程化”中工作的
3 回答
我是否正确理解Keras中的批次大小?
1 回答
我是否正确理解PyTorch的加法和乘法?
5 回答
我是否正确组织了我的Django应用程序?
3 回答
我是否正确计算执行时间?如果是这样,那么并行处理将花费更长的时间。这看起来很奇怪
9 回答
我是否每次创建新项目时都必须在PyCharm中安装numpy?(安装而不是导入)
2 回答
我是否每次运行jupyter笔记本时都必须重新启动内核?
2 回答
我是否用python安装了socks模块?
6 回答
我是否真的需要知道超过一种语言,如果我想要制作网页应用程序?
5 回答
我是否缺少spaCy柠檬化中的预处理功能?
1 回答
我是否缺少给定状态下操作的检查?
10 回答
我是否能够使用函数“count()”来查找密码中大写字母的数量((Python)
6 回答
我是否能够使用用户输入作为colorama模块中的颜色?
8 回答
我是否能够创建一个能够添加新Django.contrib.auth公司没有登录到管理面板的用户?
9 回答
我是否能够将来自多个不同网站的数据合并到一个csv文件中?
3 回答
我是否能够将目录路径转换为可以输入python hdf5数据表的内容?
1 回答
我是否能够等到一个对象被销毁,直到它创建另一个对象,然后在循环中运行time.sleep()
3 回答
我是否能够通过CBV创建用户实例,而不是首先创建表单?(Django)
9 回答
我是否要使它成为递归函数?
9 回答