自然语言处理中的简化表示
POSPair的Python项目详细描述
位置对
pospair模型是自然语言处理的一种简化表示。pospair模型表示基于词性的数据以及不同词性之间的关系。在pospair模型中,词对是参照句子中的上下文生成的单位值。pospair模型除了考虑词与词之间的紧密性、词频或句法关系外,还考虑了词与词之间关系的实际形式、词与词之间的关系以及词与词之间的关系。
工作原理
文字是最小的元素。根据词的用途和功能,词被分为几种类型的词类。
- 名词-用于命名人、事物、动物、地点、想法或事件。(名词)
- 代词-代替名词的功能。(代词)
- 形容词-用来形容名词或代词。(名词-形容词或代词-形容词)
- 动词-表示动作或存在状态。(名词-动词或代词-动词)
- 副词-形容形容词、动词或其他副词。(动词-副词,副词-副词,形容词-副词)
- 介词-在时间上指定位置或位置的词。(名词-介词或代词-介词)
- 连词-将单词、短语或从句连接在一起。(名词-连词或代词-连词)
- 感叹词-表达情感的词。(感叹词)
根据词性的定义和语义,只有特定词性的词才能相互联系,并提供一些有意义的关系。
根据词类,词语之间通过上述给定的关系相互关联,但有特定的方式。以上关系都是片面的关系。 形容词描述名词,名词不描述形容词
数据的表示是以词对的形式完成的。一次,词类之间的关系只能用两个词来恰当地表示。词对是最简单的表示形式。
词对是以整个文本为参照生成的。当整个句子被置于上下文中时,可以理解词对。
开始:
先决条件:
- python 3.0或更高版本
- 斯坦福核心NLP(3.9.2)
安装:
1. pip install POSPair
[注意:保留斯坦福corenlp服务器端口:9000]
- pospair函数:
1. POSPair.WordPairs(string)
2. POSPair.WordPairsWithValues(string)
3. POSPair.separateWordPair(string) [String should be word-pair]
示例:
importPOSPairwordPairs=POSPair.WordPairs("POSPair model is a simplifying representation.")
输出:
'POSPair model'
'model representation'
'representation is'
'representation a'
'representation simplifying'
联系pospair.contact@gmail.com获取任何查询或帮助。
内置:
- Python
- 斯坦福核心NLP
- Pycorenlp
贡献:
作者:
吉姆·麦克万
许可证:
GNU General Public License v3.0
致谢:
- stanford核心nlp
- pycorenlp
请提供反馈或联系pospair.contact@gmail.com