如何在Python中将所有日语平假名转换为片假名字符?

2024-04-27 17:15:38 发布

您现在位置:Python中文网/ 问答频道 /正文

从平假名和片假名图表来看,似乎可以将日语文本“规范化”为平假名或片假名。构建一个表并实现dictionary/regex表进行搜索/替换是非常直接的。有人知道这项工作已经在哪里完成了吗?在


Tags: 文本dictionary图表规范化regex
2条回答

你可以用str.翻译. 在

然而,你为什么要这么做还不清楚。在

在一种以拉丁字母为基础的语言中,我称之为标准化,包括小写、空格标准化和删除重音等等,这样得到的结果就是ASCII。这样做的目的不是为了显示,而是为了在某种模糊搜索/匹配/查找场景中比较用户输入的文本。重点是,口音等错误是相当普遍的,即使是母语作家的问题。在

鉴于平假名在日语书写系统中的作用(单词通常有汉字词干和平假名后缀),我无法想象将平假名字符改为片假名有什么用处。。。请开导我。在

你为什么要这么做?片假名传统上用于从其他语言借来的单词,而平假名用于日语本族语。通过将日语文本规范化为一种或另一种形式,实际上可能会阻碍对它的阅读(至少对我来说,这会更困难,因为我通过规范化来丢失上下文)。在

但在回答您的问题时,这似乎符合您的要求: JCONV

相关问题 更多 >