将SKLearn 20_新闻组数据集加载到Pandas DataFram

categories = ["alt.atheism", "alt.atheism" ,"comp.os.ms-windows.misc" , "comp.sys.ibm.pc.hardware", "comp.sys.mac.hardware" , "comp.windows.x","misc.forsale", "rec.autos","rec.motorcycles", "rec.sport.baseball","rec.sport.hockey", "sci.crypt","sci.electronics", "sci.med","sci.space", "soc.religion.christian","talk.politics.guns" ,"talk.politics.mideast","talk.politics.misc" ,"talk.religion.misc"] docs_to_train = sklearn.datasets.load_files("/home/Documents03-04-2019/dataset/20_newsgroups", description = None, categories = categories, load_content = True, encoding = 'ISO-8859-1', shuffle = True, random_state = 42) The below code I treid. docs_to_train.keys() data1 = pd.DataFrame(docs_to_train.data, columns=docs_to_train.target_names]) data1['Target'] = pd.Series(data1=docs_to_train.target, index=data1.index)

1条回答

网友

1楼 · 发布于 2024-05-16 16:10:16

有几个关键字引用了不相关的代码：您编写了cancer或{}，而不是data1，并且有一个不匹配的]。在

试试这个：

data1 = pd.DataFrame(docs_to_train.data, columns=[docs_to_train.target_names])
data1['Target'] = pd.Series(data=docs_to_train.target, index=data1.index)

如果这不起作用，试着用这个代替第二行：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章