我正在使用Python进行情绪分析(我还是这个特定编程语言的新手)。我在csv文件中有一些Twitter数据,在进行真正的分析之前,我需要对这些数据进行预处理。首先,我需要对特定列中的文本进行标记化,在我的例子中是第二列或B列。我找到了一些关于如何进行标记化的建议,但不是选择特定列。有没有人有过这方面的经验
我尝试了这段代码,它似乎适用于所有列,但如何将其隔离到第二列
import csv
import nltk
from nltk import word_tokenize
with open('TwitterData.csv', 'r') as csvfile:
reader = csv.DictReader(csvfile)
for row in reader:
print(row)
对情绪分析的预处理模块和代码有何建议
非常感谢
我可以向您强烈推荐scikit学习文档和模块,特别是关于“使用文本数据”的部分:https://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html
在那里,他们还有一个关于情绪分析的部分:https://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html#exercise-2-sentiment-analysis-on-movie-reviews
如果您需要更具体的代码帮助,最好提供一个“最小可复制示例”:https://stackoverflow.com/help/minimal-reproducible-example 这样,其他人可以更好地帮助您解决您面临的特定问题
我希望这有帮助:)
相关问题 更多 >
编程相关推荐