在两个文档之间找出相似的句子，并计算整个文档中每个部分的相似度得分

1条回答

网友

1楼 · 发布于 2024-06-01 01:28:36

您可以使用^{}模块。在

This module provides classes and functions for comparing sequences. It can be used for example, for comparing files, and can produce difference information in various formats, including HTML and context and unified diffs. For comparing directories and files, see also, the filecmp module.

在您的例子中，只要序列元素是散列的，就需要difflib.SequenceMatcher，类来比较任何类型的序列对。

示例：

from difflib import SequenceMatcher
text_1 = "private Thread currentThread;"
text_2 = "private volatile Thread currentThread;"
s = SequenceMatcher(lambda x: x == " ",
                    text_1,
                    text_2)

现在为了测量序列的相似性，使用ratio()，它在[0, 1]中返回一个float。根据经验，值大于0.6的ratio（）意味着序列非常匹配。在

^{pr2}$

编程相关推荐

java Android应用程序在后台
如何使用java减去日期。sql。时间戳
在Eclipse中使用Tomcat和Maven的java抛出错误
java Runnable jar什么都不做，资源不导出
并发Java内存模型：volatiles和读/写重新排序
使用Morphia在MongoDB中进行java批量升级。可能吗？
java将自己创建的sqlite数据库复制到安卓失败
在java中使用嵌套循环解决消除？
地图上多个标记的java实时动画
java如何在J2EE web应用程序中从服务层调用DAO方法

相关问题更多 >

编程相关推荐

热门问题

热门文章

在两个文档之间找出相似的句子，并计算整个文档中每个部分的相似度得分

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >