SpacyPipeline组件,用于将图释元数据添加到作为文本图释的Doc、Token和Span对象。

spacyemoticon的Python项目详细描述


spacy emoticon:spacy的emoticon
********************


此扩展名是在“spacymoji<;https://pypi.org/project/spacymoji/>;”“spacy v2.0<;https://spacy.io/usage/v2>;”“扩展名和管道组件”中输入的,用于向“doc”对象添加文本emoticon元数据。检测由一个或多个字符或符号组成的文本表情符号。扩展名
设置自定义的“doc”、“token”和“span”属性。“is”emoticon“`、
和“`.”emoticon“`”。您可以阅读有关自定义管道的更多信息
组件和扩展属性
`here<;https://spacy.io/usage/processing pipeline s>;` ` ` ` `.

表中查找。




代码::bash

pip install spacyemoticon


然后将组件添加到管道中的任何位置。代码::python

import spacy
from spacy emoticon import emoticon

emoticon=emoticon(nlp)
nlp.add_pipe(emoticon,first=true)

doc=nlp(u“这是一个测试:)<;\
assert doc[0].isu emoticon==false
assert doc[4].isu emoticon==true
assert len(doc.emoticon)==2

``spacyemoticon``只关心令牌文本,所以可以在一个空白的
``language``实例上使用(它应该适用于所有可用语言<;https://spacy.io/usage/usage/models/languages>;`languages>;`languages;应该适用于所有可用语言<;https://spacy.io/spaccy.io/usage/usage/models/models/models/languages;`languages;是的,或在带有加载模型的管道中。如果您正在加载模型,并且您的管道
包含标记器、解析器和实体识别器,请确保将emoticon
组件添加为“first=true”,以便在标记化之后、解析文档之前合并跨接。如果您的文本包含大量的表情符号,这甚至可以大大提高解析器的准确性。

available attributes
----


extension设置“doc”、“span”和“token”上的属性。您可以在初始化扩展时更改属性名。有关自定义组件和属性的详细信息,请参阅
“处理管道”文档lt;https://spacy.io/usage/processing pipelines custom components>;` ` ` `.

` ` ` ` `===========
` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` `索引,说明)``文档表情的元组。
``SPAN.\emoticon``list``(表情,索引,说明)``跨度表情的元组。
========

==--您可以定义以下设置:

==================
``nlp````语言``共享的``nlp``对象。用于使用共享的“vocab”初始化匹配器,并创建“doc”匹配模式。
“attrs”要在.\property上设置的元组属性。默认为``('is emoticon','emoticon')``。
``pattern`id``unicode id of match pattern,默认为`'emoticon``。可以更改以避免ID冲突。
``merge\u-spans``bool-merge-spans包含多字符表情符号,默认为``true`。将只合并组合的图释,结果是一个图标,而不是序列。
``lookup``dict可选的查找表,它将图释文本字符串映射到自定义描述,例如翻译或其他批注。
=============


。代码::python

emoticon=emoticon(nlp,attrs=('has_e','e'),lookup={u':s'})
nlp.add_pipe(emoticon)
doc=nlp(u“we can be:s heroes”)
assert doc[3]。\u.is_e



欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java我初始化“temps”的方式有什么问题?   junit有没有办法测试Java方法不会引发特定类型的异常?   java如何覆盖WebSphereCommunityEdition(WCE)2.1的默认持久性提供程序OpenJPA   Java Swing如何使JButton的边界不可见?   java如何在Eclipse中恢复已删除的文件?   java我正在努力争取到第二天某个小时的剩余时间   java将类放入哈希表   语法Java:system。出来println连接字符串中的内容(非常简单的问题)   针对多个单词的java查询文档   Java:循环泛型类型关系不允许从超类型强制转换(javac错误)   swing为第一轮Java切换生成If语句   java使用bufferedReader读取文本文件时添加了一个空格,即安卓   从html文件获取文本字段字符串输入,以便在java类中处理/使用   java如何根据条件进行正则表达式匹配?   在Java中查找字符串中最小的单词   私有void formKeyPressed(java.awt.event.KeyEvent evt)   servlet中文本文件的java读写