为什么Mecab不解析docker上的文本？ - 问答 - Python中文网

为什么Mecab不解析docker上的文本？

2024-05-13 08:17:48 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在使用mecab解析日语文本并提取名词。它在服务器上运行良好。但是当我尝试运行docker容器时，它列出了所有单词，并且没有过滤掉这些单词。这是某种编码问题吗

m = MeCab.Tagger('-Ochasen')
    excluded_part = ['名詞-接続-一般', '名詞-接尾-人名', '名詞-数']
    parsed = m.parse(text)
    df_parsed = pd.read_csv(
        StringIO(parsed), delimiter='\t',
        names=['単語', '読み', '原形', '品詞', '活用', '活用形'
    df_parsed = df_parsed[
            (df_parsed.品詞.str.contains('名詞')) &
            (~df_parsed.品詞.isin(excluded_part))]

它会删除服务器中的“）| ~”等字符，但不会删除docker容器中的字符

Tags： docker 文本服务器编码 df 字符 parsed 单词

0条回答

目前没有回答

相关问题更多 >

编程相关推荐

热门问题

热门文章