如何将数据帧中的所有单词转换成标准形式

2024-06-11 10:11:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要把所有的字从一列的数据帧在正常的形式(由pymorphy2)?你知道吗

例如,我有:

First Sec My Я вчера видел цветы красных цветов

之后我需要:

First Sec My я вчера видеть цвета красных цветок


Tags: 数据mysec形式firstpymorphy2
1条回答
网友
1楼 · 发布于 2024-06-11 10:11:00

试试下面的,让我知道你进展如何。你知道吗

顺便说一句,我不知道怎么用pymorphy2,文件是俄语的,我不会说俄语,所以你可能需要调整那行。你知道吗

import pandas as pd
import pymorphy2

data = pd.read_excel(r'your_file.xlsx')

def converter(sentence):
    list = []
    words = sentence.split()
    for item in words:
        list.append(pymorphy2.MorphAnalyzer().parse(item)[0].word)
    return ' '.join(list)

data['column_to_convert'] = data['column_to_convert'].apply(converter)

相关问题 更多 >