如何确保用户仅提交英文文本

9 投票
10 回答
1214 浏览
提问于 2025-04-11 09:25

我正在做一个涉及自然语言处理的项目,因为现在的nlp模块只处理英文文本,所以我必须确保用户提交的内容(不长,只有几个单词)是英文的。有没有什么成熟的方法可以做到这一点?我更倾向于用Python或JavaScript来实现。

10 个回答

5

我觉得最有效的方法就是让用户只提交英文文本 :)

你可以在文本框上方放一个语言选择的下拉菜单,选项可以是“英语/其他”。当用户选择“其他”时,就禁用文本框,并显示一条消息,告诉他们目前只支持英文。

6

查看一下这个语言识别图表

7

如果内容比较长,我建议你可以对字母进行一些频率分析

不过如果只是几个单词,我觉得最好的办法是把它们和英语词典对比一下,如果有一半的单词匹配上了,就可以接受这个输入。

撰写回答