从github python下载和访问数据

2024-06-16 10:03:59 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我正在通过Python进行数据分析,我想分析他在书中所浏览的数据。在第九章中,他使用了下面的数据。然而,一旦我将ipython笔记本中的数据下载到mac上的github应用程序中,我就很难理解如何利用这些数据。

股票数据在这里:https://github.com/pydata/pydata-book/blob/master/ch09/stock_px.csv

我点击了“打开”,在我的github应用程序上下载了一个大文件。它看起来像下面。如何在我的ipython笔记本中打开这些数据?

**看看其他stackoverflow问题,我知道我可以下载zip文件,我也在做这件事。知道如何有效地使用github应用程序会很酷。

右键单击并保存csv文件似乎可以保存json/html文件

enter image description here


Tags: 文件csv数据httpsgithubcom应用程序利用
1条回答
网友
1楼 · 发布于 2024-06-16 10:03:59

您应该能够使用原始版本的url(原始版本的链接是您提供的链接上的按钮),然后直接使用read_csv将其读入数据帧:

import pandas as pd
url = 'https://raw.githubusercontent.com/pydata/pydata-book/master/ch09/stock_px.csv'
df = pd.read_csv(url,index_col=0,parse_dates=[0])

print df.head(5)

            AAPL   MSFT    XOM     SPX
2003-01-02  7.40  21.11  29.22  909.03
2003-01-03  7.45  21.14  29.24  908.59
2003-01-06  7.45  21.52  29.96  929.01
2003-01-07  7.43  21.93  28.95  922.93
2003-01-08  7.28  21.31  28.83  909.93

编辑:关于我在文件中读取的选项的简要说明:

df = pd.read_csv(url,index_col=0,parse_dates=[0])

第一列(column=0)是文件中日期的一列,因为它没有列名,所以看起来它应该是索引;index_col=0使它成为索引,parse_dates[0]告诉read_csv将column=0(第一列)解析为日期。

相关问题 更多 >