iam gettinig AttributeError:“list”对象在尝试拆分文本d(“”)时没有属性“lower”

2022-12-01 05:10:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图对文本数据进行矢量化,但出现以下错误

AttributeError: 'list' object has no attribute 'lower'

我的代码:

yourResult = [str(sentence).split(' ') for sentence in tag_data["Tags"]]

vectorizer = CountVectorizer()
tag_dtm = vectorizer.fit_transform(yourResult)#tag.apply(lambda x: str(x).split(" ")))

Tags: 数据no文本objecttag错误矢量化sentencelistsplitattributeerrorhasstrvectorizeryourresult
1条回答
网友
1楼 · 发布于 2022-12-01 05:10:47

正如问题所述,yourResult是一个列表列表,因为split(' ')返回一个列表,而它应该是一个字符串列表。CountVectorizer为您执行拆分,因此无需提前执行。这应该很管用:

tag_dtm = vectorizer.fit_transform(tag_data["Tags"])

如果您想完全控制分裂在CounVectorizer中的工作方式,您可以提供自己的标记器:

vectorizer = CountVectorizer(tokenizer=lambda s: s.split(' '))
tag_dtm = vectorizer.fit_transform(tag_data["Tags"])