用一个字来读一个文件。你知道吗
到目前为止,我有以下代码:
import re
import pandas as pd
import numpy as np
from sklearn.feature_extraction.text import CountVectorizer
df = pd.read_sql(q, dlconn)
print(df)
count_vect = CountVectorizer()
X_train_counts= count_vect.fit_transform(df)
print(X_train_counts.shape)
print(count_vect.vocabulary_)
这将给出'cat': 1, 'dog': 0
的输出
它似乎只取了animal
列的名称并从那里开始计数。你知道吗
如何让它访问完整的列并得到一个显示列中每个单词及其频率的图表?你知道吗
根据the ^{} docs ,方法
fit_transform()
需要字符串的iterable。 它不能直接处理DataFrame
。你知道吗但是在数据帧上迭代会返回列的标签,而不是值。我建议你试试^{} 。你知道吗
试着这样做:
value_list
中的每个值都应该是str
类型。 如果有帮助请告诉我们。你知道吗下面是一个小例子:
现在可以显示每行的字数(每个输入字符串分别显示):
您还可以显示总字数(行总数):
这应该说明你如何使用你拥有的工具。你知道吗
相关问题 更多 >
编程相关推荐