大家好
所以我试图根据file1过滤file2,其中file1是file2的子集。但是file2有description列,我需要能够分析file1中的数据。我要做的是过滤file2,只得到file1中的标题及其描述。我试过了,但我不确定它是否完全正确,而且它正在工作,但我的计算机中没有保存任何文件
import re
import mmap
from pandas import DataFrame
output = []
with open('file2.csv', 'r') as f2:
mm = mmap.mmap(f2.fileno(), 0, access=mmap.ACCESS_READ)
for line in open('file1.csv', 'r'):
Title = bytes("")
nameMatch = re.search(Title, mm)
if nameMatch:
# output.append(str(""))
fulltypes = [ 'O*NET-SOC Code', 'Title' , 'Discription' ]
final = DataFrame(columns=fulltypes)
final.to_csv(output.append(str("")))
mm.close()
有什么想法吗?在
假设您的csv文件不是太大,您可以通过读入
pandas
并使用join
方法来实现这一点。以下面的例子为例:打印:
^{pr2}$也就是说,只有存在于两者中的文件。在
由于
pandas
可以本机将csv读入数据帧,因此您可以:相关问题 更多 >
编程相关推荐