与Spacy的Excel集成。包括,实体训练,实体匹配管道。

excelc的Python项目详细描述


卓越是强大的

简单风格的培训 ,来自Spacy文档,演示如何使用Spacy来培训NER:

TRAIN_DATA=[("Uber blew through $1 million a week",{'entities':[(0,4,'ORG')]}),("Google rebrands its business apps",{'entities':[(0,6,"ORG")]})]nlp=spacy.blank('en')optimizer=nlp.begin_training()foriinrange(20):random.shuffle(TRAIN_DATA)fortext,annotationsinTRAIN_DATA:nlp.update([text],[annotations],sgd=optimizer)nlp.to_disk('/model')

训练数据描述要训练的句子和带注释的实体。总是数字符是很麻烦的。使用excelcy,可以省略(开始、结束)字符。

# download the en model from spacy# python -m spacy download en"fromexcelcyimportExcelCy# collect sentences, annotate Entities and train NER using spaCyexcelcy=ExcelCy.execute(file_path='https://github.com/kororo/excelcy/raw/master/tests/data/test_data_01.xlsx')# use the nlp object as per spaCy APIdoc=excelcy.nlp('Google rebrands its business apps')# or save_storage it for faster bootstrap for applicationexcelcy.nlp.to_disk('/model')

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
box api如何使用box Java SDK从图像文件中获取特定大小的缩略图?   java无法从JNA使用python cffi调用DLL中定义的函数   java在linux中通过Jar文件发送电子邮件   使用lucene+hibernate的java查询时间连接   java在带有循环的arrayList中设置值   java为什么ImageReader返回错误的BuffereImage?   c#TCP数据有时接收顺序错误且不完整   java如果发生IOException,该InputStream是否会正确关闭?   tcp在Java中,如果不使用IP,如何获取MAC地址?   java从批处理方法调用中收集结果   java Android Studio RecyclerView在滚动图像时严重滞后   java如何使用OOP进行retrofti调用?   记录FileAppender在Java中如何工作   与S3连接期间收到java异常   java找不到JNDI资源Tomcat 7