如何根据另一个csv文件中的关键字提取csv文件中的句子，并将其从主csv文件中删除

import sys import pandas as pd import re import string if len(sys.argv) == 1: print("please provide a CSV file to analys") else: fileinput = sys.argv[1] dic = sys.argv[2] wdata = pd.read_csv(fileinput, nrows=0).columns[0] skip = int(wdata.count(' ') == 0) wdata = pd.read_csv(fileinput, names=['sentences'], skiprows=skip) data = wdata['sentences'].str.replace('[^\w\s]', ' ') keywords=pd.read_csv(dic) keywords=keywords.loc[keywords['freq'].between(100, 300, inclusive=False), 'word'] df1 = data[data['sentences'].str.split(expand=True).isin(keywords).any(axis=1)] #deleted rows by keywords df2 = data[~data['sentences'].str.split(expand=True).isin(keywords).any(axis=1)] print(df1)

1条回答

网友

1楼 · 发布于 2024-04-18 08:58:03

我认为您需要^{}来选择关键字：

keywords=keywords.loc[keywords['freq'].between(100, 300, inclusive=False), 'word']
print (keywords)
3     have
4     your
5    sleep
6     work
Name: word, dtype: object

然后通过^{}和^{}选择^{}

df1 = data[data.str.split(expand=True).isin(keywords.tolist()).any(axis=1)]
print (df1)
3    I went to sleep at work
6     have a good sleep home
Name: sentences, dtype: object

#deleted rows by keywords
df2 = data[~data.str.split(expand=True).isin(keywords.tolist()).any(axis=1)]
print (df2)
0                  how are you
1                I want to die
2                   I was home
4      he has a bad reputation
5    it was me who went to him
Name: sentences, dtype: object

相关问题更多 >

编程相关推荐

热门问题

热门文章