给定一组文本如何计算单词的信息增益？

2024-05-17 19:28:30 发布

男 | 程序猿一只，喜欢编程写python代码。

给定一个包含短语的数据库

示例：

我需要计算每个不同单词的信息增益。在

我研究了熵和信息增益的概念，但不知道如何在短语中应用。我看到了这个链接：https://mariuszprzydatek.com/2014/10/31/measuring-entropy-data-disorder-and-information-gain/ 但在我的例子中，我没有短语类别。我需要知道哪一个词在给出短语的时候信息量最大。在

Tags： https com 信息数据库概念示例链接增益

1条回答

网友

1楼 · 发布于 2024-05-17 19:28:30

搜索术语tf idf
阅读这个问题，你的术语文本集==文档。在