Python中文
首页
教程
问答
标签
搜索
登录
注册
如何循环读取CSV文件
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个基本的CSV。它在源代码中:<a href="https://data.cityofnewyork.us/Social-Services/311-Service-Requests-from-2010-to-Present/7ahn-ypff" rel="nofollow noreferrer">311-Service</a> 这个基地大约有11GB。它有1900万行和41列。你知道吗</p> <p>我只想获取有关城市的信息:新泽西州表格列城市。 我只能对500000行使用此查询。真管用!你知道吗</p> <pre><code>NYPD = pd.read_csv('c:/1/311_Service_Requests_from_2010_to_Present.csv', nrows=500000, low_memory=False) M = NYPD.loc[NYPD.City=='NEW JERSEY', :] M.to_csv('c:/1/NJ_NYPD.csv') </code></pre> <p>我需要的信息,从所有行的CSV文件,而不是从只有50万行。 我想我需要使用一个循环和chunksize=500000,但我不知道如何使用。你知道吗</p> <pre><code>hunksize =500000 i = 0 j = 1 for df in pd.read_csv('c:/1/311_Service_Requests_from_2010_to_Present.csv', chunksize=chunksize, iterator=True, low_memory=False): df.loc[df.City=='NEW JERSEY', :] df.index += j i+=1 df.to_csv('c:/1/NJ_NYPD.csv') </code></pre> <p>我不想把CSV转换成dbase方法。你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>为什么不在解析时使用所需的列:</p> <pre><code>my_filtered_csv = pd.read_csv(filename, usecols=['City']) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
将Pandas数据帧转换为PyTorch张量?
7 回答
将Pandas数据帧转换为scipy稀疏矩阵
9 回答
将Pandas数据帧转换为Spark Datafram时出现问题
3 回答
将pandas数据帧转换为spark DataFram时出错
4 回答
将Pandas数据帧转换为spark datafram时收到错误
9 回答
将Pandas数据帧转换为Spark数据帧
10 回答
将Pandas数据帧转换为Tensorflow数据
1 回答
将Pandas数据帧转换为tkinter obj
2 回答
将pandas数据帧转换为XML
10 回答
将Pandas数据帧转换为值sql语句
4 回答
将pandas数据帧转换为元组
4 回答
将pandas数据帧转换为元组列表
6 回答
将pandas数据帧转换为元组列表并删除所有pandas数据类型
1 回答
将pandas数据帧转换为具有头和数据类型的numpy数组
3 回答
将pandas数据帧转换为内存中的拼花地板,并将其加载到Python中的Hadoop中
8 回答
将pandas数据帧转换为内存中类似文件的对象?
4 回答
将Pandas数据帧转换为内存功能(&F)
4 回答
将pandas数据帧转换为列表列表
6 回答
将pandas数据帧转换为列表列表以输入到RNN
7 回答
将Pandas数据帧转换为单行DataFram
6 回答