如何下载python非常基本的数据库

2024-06-02 06:51:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我刚开始学习python,我是一个非常新的人。我计划使用逻辑回归分类来预测糖尿病的发病率。我需要下载这个数据库(https://www.kaggle.com/uciml/pima-indians-diabetes-database/discussion

我该怎么做?我知道我最终需要写pd.read\u csv,但整个过程是什么?我是先下载到硬盘上还是什么的?如果有人能一步一步地回答最明显的细节,我会非常感激,因为我对python非常陌生。非常感谢


Tags: httpscom数据库www分类逻辑database计划
2条回答

如果不登录网站,我就无法下载你想要使用的数据库,所以我可以看到它们的限制器、引号等等。您告诉我您需要使用pandas read功能,因此我可以在这里附上pandas手册以使用该功能:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
不要忘记添加导入行以使用它,写入'import pandas as pd'
最后,关于下载它,是的,您需要下载它,建议将它保存在与您的项目相同的路径中,这样您就可以很容易地指定路径,您现在只需'name.csv'。如果需要将其保存在另一个路径中,请记住,在使用read函数时必须告诉它,如'dir/to/path/name.csv'

编辑:我刚才看到一条消息,你说“没有这样的文件或目录问题”。这就是我在第二个pharagraph中所说的,请记住,您需要指定文件的正确路径

你想做的是两个不同的动作

首先,您应该将数据集下载到硬盘上。这应该不是问题,因为数据集非常小

其次,您需要决定如何处理数据。熊猫可能是一个很好的选择。请尝试以下代码:

import pandas as pd

file_path = "/path/to/csv/file.csv"
my_dataframe = pd.read_csv(file_path)

不要忘记下载和安装熊猫模块。这可以通过pip或像conda这样的工具来完成。请同时检查有关读取csv文件的熊猫文档,以执行其他设置(https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

相关问题 更多 >