NLP：如何使用pythonltk从给定的文本中查找名称和数字

1条回答

网友

1楼 · 发布于 2024-04-26 05:49:48

这是一个实体识别问题。我可能会首先为你想要识别的每个实体创建单独的解析器，然后从那里开始工作。在

例如：创建“Patent”标识符，从您的示例中看，您必须识别忽略案例“Patent No.xxxxxxx”或“USxxxxxxx”以及可能更多的格式。您将需要为这些创建正则表达式，或者训练分类器来识别它们（更困难，但可能更准确）。我个人建议从每个实体的regex解析器开始，然后继续测试直到您满意为止！在

编程相关推荐

如何在不使用java安装outlook的情况下以编程方式创建pst文件？
如何在java中比较泛型方法中的数组？
JavaFXHTML节点元素
java H2数据库要降低的连接设置无效（2019）
安卓 hilt中的java依赖循环
java这个结构什么时候有意义？
带有模式和匹配器的Java正则表达式
来自类变量的java JNI jstring？
尝试从socket读取时发生java非法阻止模式异常
绑定中使用Moxy的java接口映射。xml不能使用多个接口？

相关问题更多 >

编程相关推荐

热门问题

热门文章

NLP：如何使用pythonltk从给定的文本中查找名称和数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >