命名实体分段

neseg的Python项目详细描述


Named Entity Segmentation

简介

本项目是字符串令牌流分割库; neseg -n 中国北京市联想科技有限公司 -d dict

功能

  • 字符串令牌解析;
  • 支持令牌流;
  • 解析器可以是自定义字典机械分割,每个token一个独立字典;
  • 解析器也可以是正则表达式;
  • 分割分正向和反向,都是从头开始;
  • 生成对应令牌名称和解析出来的字符创元组,最后剩下的归为一组;

应用场景

  • 各种名称的解析,如中文机构名、药品名称、地址的分割标注;

TODO

  • 设计参考re.scanner;
  • 可以用生成器yield来做技术实现;
  • 程序返回元组列表;

附录 - 源码文件说明

neseg
    /lib
        FMM.py  正向切词
        RMM.py  反向切词
    seg.py      
    main.py   主程序:无界面,参数命令行
changelog.md    软件更新日志
readme.md       软件使用、安装指南

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
爪哇太阳报。安全验证器。ValidatorException:PKIX路径生成失败   java理解为什么在onDispatchTouchEvent()返回True后仍调用onClick()   java如何在资源包中使用JSF标记/如何在资源包中重写URL?   java什么是流控制异常的替代方案?   java使用Spring数据JPA/MongoDB交叉存储,一个查询可以跨越两个数据库吗?   Apache Sling/felix中的java OSGi slf4j日志记录   为什么当我们想要水平/垂直旋转矩阵时,我们要把这个项除以2?   尝试从外部网页接收JSON字符串时出现安卓 Java NullPointerException   java执行异常:从Callable调用方法时   java在jetty上以调试模式运行webapp,使用maven jetty插件在intellij中构建成功(应用程序应在调试模式下启动)   带有内存数据库的linux Java应用程序的构建时间太长   基于java的随机数单元测试算法   java类型javax。摆动JComponent无法解析   Google日历API和UI小部件Java   java tomcat没有突然和任意地响应   java无法使用jsoup在html中获取图像src   我无法让Java接受键盘输入字符串   java如何开始使用Bambol而不让部署永远继续?   java如何使用另一个类的actionPerformed方法删除一个类/组件中的按钮?   java JSON反序列化brakets{}中的一系列对象