从英文tex中提取产品名称 - 问答 - Python中文网

从英文tex中提取产品名称

2024-04-26 11:57:01 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我想从英文文本中摘录正在销售的产品的名称。在

例如：

"I'm selling my xbox brand new"
"Selling rarely used 27 inch TV"

应该给我"xbox"和{}

目前我唯一能想到的就是在一个庞大的重要名词和形容词列表中硬编码：['tv', 'fridge', 'xbox', 'laptop', etc]

有更好的方法吗？在

Tags：文本名称 new 产品 my tv used 名词

1条回答

网友

1楼 · 发布于 2024-04-26 11:57:01

看起来nltk会给你一个单词和词类的列表。既然你只对名词感兴趣？this将提供给您

>>> from nltk import pos_tag, word_tokenize
>>> pos_tag(word_tokenize("John's big idea isn't all that bad.")) 
[('John', 'NNP'), ("'s", 'POS'), ('big', 'JJ'), ('idea', 'NN'), ('is',
'VBZ'), ("n't", 'RB'), ('all', 'DT'), ('that', 'DT'), ('bad', 'JJ'),
('.', '.')]

相关问题更多 >

编程相关推荐

热门问题

热门文章