将Numpy数组插入MySQL数据库

3 投票
2 回答
6131 浏览
提问于 2025-04-16 23:29

首先,从这个回答开始:

使用Numpy创建Yahoo财经价格表

import numpy as np
import pylab as pl
import urllib
url = "http://ichart.yahoo.com/table.csv?a=2&c=2011&b=30&e=7&d=7&g=d&f=2011&s=msft&ignore=.csv"
f = urllib.urlopen(url)
title = f.readline().strip().split(",")
data = np.loadtxt(f, dtype=np.float, delimiter=",", converters={0: pl.datestr2num})

我想把返回的行插入到数据库中。数据看起来像下面这样:

 [[734233.0 25.98 26.31 25.86 26.15 65581400 25.98]
 [734232.0 25.82 26.18 25.74 25.78 73694500 25.61]
 [734231.0 25.45 25.66 25.41 25.55 35433700 25.38]
 [734228.0 25.53 25.53 25.31 25.48 63114200 25.31]
 [734227.0 25.60 25.68 25.34 25.39 63233700 25.22]
 [734226.0 25.60 25.72 25.50 25.61 41999300 25.44]]

我该如何把这个numpy数组解析成列表或表格,以便可以插入到数据库中呢?注意,所有的行并不是分开的,而是连成一行的。数据库的部分是可以正常工作的。

data.tolist()并不能把单独的行解析出来。

我希望得到像这样的输出:

    [[734233.0 ,25.98 ,26.31 ,25.86 ,26.15, 65581400, 25.98]  
     [734232.0, 25.82, 26.18, 25.74, 25.78, 73694500, 25.61]
     [734231.0, 25.45 ,25.66, 25.41, 25.55, 35433700, 25.38]
     [734228.0, 25.53, 25.53, 25.31, 25.48, 63114200, 25.31]
     [734227.0, 25.60 ,25.68, 25.34, 25.39, 63233700, 25.22]
     [734226.0, 25.60, 25.72, 25.50, 25.61, 41999300, 25.44]]

用“ ”替换为“,”可以吗?

2 个回答

1

你有一行字符串,看起来像这样 "[734226.0 25.60 25.72 25.50 25.61 41999300 25.44]",你想把它转换成一个包含每个值的列表,对吧?下面这个方法应该可以帮你实现:

my_string = "[734226.0 25.60 25.72 25.50 25.61 41999300 25.44]"
my_list = [float(s) for s in my_string[1:-1].split(' ')]

那为什么你不能直接这样做呢:

for row in data:
    print row #do whatever you want with row here.
2
>>> import sqlalchemy as sa
>>> import numpy as np
>>> import time, datetime
>>> import urllib

日期格式之间的转换。

>>> datestr2timestamp = lambda d: time.mktime(time.strptime(d,"%Y-%m-%d"))
>>> def npvector_to_sadict(vector):
...     row = dict(zip(("open", "high", "low", "close", "volume", "adj_close"),
...                        vector[1:]))
...     row['date'] = datetime.date.fromtimestamp(vector[0])
...     return row
... 

从网络资源加载数据:

>>> url = "http://ichart.yahoo.com/table.csv?a=2&c=2011&b=30&e=7&d=7&g=d&f=2011&s=msft&ignore=.csv"
>>> f = urllib.urlopen(url)
>>> title = f.readline().strip().split(",")
>>> data = np.loadtxt(f, dtype=np.float, delimiter=",", converters={0: datestr2timestamp})

定义数据库表的结构。

>>> metadata = sa.MetaData()
>>> stockdata = sa.Table('stockdata', metadata,
...                      sa.Column('date', sa.Date),
...                      sa.Column('open', sa.Float),
...                      sa.Column('high', sa.Float),
...                      sa.Column('low', sa.Float),
...                      sa.Column('close', sa.Float),
...                      sa.Column('volume', sa.Float),
...                      sa.Column('adj_close', sa.Float))

连接到数据库。你可以把这个改成 mysql://user:password@host/ 来连接MySQL数据库。

>>> engine = sa.create_engine("sqlite:///:memory:")

这个只是为了演示,如果你已经创建了表,可以跳过这一步。

>>> metadata.create_all(engine)

把数据插入到数据库中:

>>> engine.execute(stockdata.insert(), [npvector_to_sadict(datum) for datum in data])
<sqlalchemy.engine.base.ResultProxy object at 0x23ea150>

确认数据是否已经插入。

>>> print data.shape[0], engine.execute(sa.select([sa.func.count(stockdata.c.close)])).scalar()
90 90
>>> 

撰写回答