使用python进行词干分析

1条回答

网友

1楼 · 发布于 2024-06-16 14:22:15

您可以使用以下简单方法：

with open "root_words.txt" as rfile, "affix_words.txt" as afile:
    try:
        rw_start = aword.index(rword)
        rw_end = rw_start + len(rword)
        result = " ".join( "E" if n==rw_start-1 else \
                           "B" if n==rw_end else \
                           "I" for (n, letter) in enumerate(aword) )
    except:
        result = "NOT FOUND!"
    print("root: '{}', affixed: '{}', stemmed: '{}'".format(rword, aword, result))

示例：

root_words.txt：

read
vote
like

affix_words.txt：

reading
upvote
unlikely

输出：

root: 'read', affixed: 'reading', stemmed: 'I I I I B I I'
root: 'vote', affixed: 'upvote', stemmed: 'I E I I I I'
root: 'like', affixed: 'unlikely', stemmed: 'I E I I I I B I'

See this code running on ideone.com

编程相关推荐

java如何将异步类的结果放入mainActivity EditText
java LDAP目录管理器服务提供，OutOfMemory
java Cassandra NoHostAvailableException，但仍存在活动节点
springboot应用程序的java启动线程
如果poll不一定返回第一项，那么java是ConcurrentLinkedQueue的好选择吗？
解析XML时JSON中出现java意外字符串
当'key'是两个整数时，如何输出Java HashMap键？
java为什么不显示在jsp页面中
java使用流式API转换映射列表中的值
JavaJPA+Spring：基于在持久化实体之前接收到的值，将外键列映射到ID

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用python进行词干分析

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >