标题说明了一切;我有一个SQL数据库,里面充斥着在线对话文本。我已经用Python完成了这个项目的大部分工作,所以我想使用Python的NLTK库来完成这个工作(除非有一个不需要的原因)。
数据由线程、用户名和日志组织。每一个线程或多或少地集中讨论一个“产品”的类别,我有兴趣分析。最后,当这一切结束时,我想从每个用户那里得到他们在某个时候讨论过的任何产品的估计意见(喜欢/不喜欢的交易)。
所以,我想知道的是:
1)我怎样才能确定每根线是什么产品?我读到了有关关键字提取的内容。。。这是正确的方法吗?
2)如何根据用户的帖子来确定特定的用户情绪?根据我有限的理解,我必须首先“训练”NLTK来识别某些意见指标,然后当这些词出现在文本中时,我是否简单地确定它们的上下文?
你现在可能已经猜到了,我以前没有使用NLP的经验。从我目前的阅读来看,我想我还是可以学会的。如果有人能给我指一个正确的方向,即使只是一个基本的、粗糙的工作模式也会很好。谷歌对我帮助不大。
p.S.我有权分析这些数据(如果重要的话)
目前没有回答
相关问题 更多 >
编程相关推荐