如何选择列与行

2024-04-24 06:36:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我对熊猫很陌生(几个月),我开始建立一个基于熊猫数据阵列的项目

这样的熊猫数据数组将包含在一个表格中,表格中包含文本集合中存在的不同类型的单词(约10万个文档,约200个关键字)

例如,想象一下单词“car”和单词“motorbike”以及编号为doc1、doc2等的文档

我该怎么安排呢? a) 每一列的名称都是文件编号和索引“car”和“motorbike”或 b) 反之;索引是文档编号,列标题是单词

我对熊猫没有足够的了解,无法预见这样的选择会带来什么后果。所有代码都将基于该决定

顺便说一句,数组不是静态的,每隔一段时间就会有更多的文档和更多的单词添加到数组中

你推荐什么?a还是b?为什么

谢谢


Tags: 数据项目文档文本类型doc1关键字数组