我是python新手,我有两个csv文件,一个包含细菌名称
import csv
import pandas as pd
from collections import Counter
import re
import operator
#Bacteria File Open
Bac = []
with open ("/home/shayez/Desktop/Bacteria.csv", "r") as csv_file1:
csv_reader1 = csv.reader(csv_file1,delimiter = ',')
for lines1 in csv_reader1:
Bac.append(lines1)
# print(lines1[0])
#Abstract File Open
Abs = []
with open ("/home/shayez/Desktop/Anti.csv", "r") as csv_file:
csv_reader = csv.reader(csv_file,delimiter = ',')
for lines in csv_reader:
Abs.append(lines[2])
abswordlist = []
for ab in Abs:
abswordlist.append(Counter(ab.split()))
#print (abswordlist)
cntword = Counter(Abs)
for Bac in Bac:
print (f"{Bac}:{abswordlist[Bac]}")
像这样:
这是一个细菌文件,包含大约2200个细菌名称
我必须将第一个细菌文件名的单词和第二个摘要列进行比较,并将细菌的出现频率计算到摘要中,然后保存到第三个csv中
我建议您使用pandas库来完成这项任务,因为您似乎有很多聚合要做。你知道吗
既然你不提供一个[mcve],我只好自己做一个。 因此,您必须读取您的第一个csv,并将值作为列表保留。它们稍后将成为您将保留的列。你知道吗
然后。。。使用此数组。我建议您使用^{} ,与} (来自python集合)结合使用。
然后,^{} 所有这些都使用^{} 。你知道吗
split()
和^{相关问题 更多 >
编程相关推荐