如何使用多个特征进行文本的NLTK分类

2024-04-27 14:47:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试调整以下代码:http://snipperize.todayclose.com/snippet/py/Use-NLTK-Toolkit-to-Classify-Documents--5671027/以接受一些附加功能。它似乎是基于对不同的信息类使用不同的文件来确定其类,这很好。但我也希望能添加一些额外的数据让它查找。需要修改什么?有什么好的资源吗?关于NLTK/Python的书并没有解决这个问题。在


Tags: to代码py功能com信息httpuse
1条回答
网友
1楼 · 发布于 2024-04-27 14:47:24

你说的特征是什么意思?在我看来,你只想添加更多的数据,而不是特性。在

如果你想考虑新的功能,你必须根据你的需要修改提取词。在

如果您只需要更多的数据,这些数据可能存储在不同的文件中,那么您应该编辑主代码以考虑文件名集,而不是针对功能的单个文件。 当然,这意味着对第74行的循环进行了修改。您必须添加另一个内部循环来迭代集合中的所有文件名

相关问题 更多 >