带有SQLi的NumPy数组

2024-05-16 07:00:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我在Python中看到的最常见的SQLite接口是sqlite3,但是有没有什么可以很好地与NumPy数组或重排一起工作呢?我的意思是一个可以识别数据类型,不需要逐行插入,并提取到NumPy(rec)数组中的程序。。。?类似于RDBsqldf库中的R的SQL函数,如果有人熟悉这些函数的话(它们将整个表或表子集导入/导出/附加到R数据表或从R数据表附加)。


Tags: 函数程序numpysqlitesql数组sqlite3子集
3条回答

道格对redis的建议很好,但我认为他的代码有点复杂,因此相当慢。为了达到我的目的,我必须序列化+写入,然后在不到十分之一秒的时间内抓取+反序列化一个大约一百万个浮点的平方矩阵,所以我这样做了:

写作:

snapshot = np.random.randn(1024,1024)
serialized = snapshot.tobytes()
rs.set('snapshot_key', serialized)

然后读:

s = rs.get('snapshot_key')
deserialized = np.frombuffer(s).astype(np.float32)
rank = np.sqrt(deserialized.size).astype(int)
snap = deserialized(rank, rank)

您可以使用ipython使用%time进行一些基本的性能测试,但是tobytes或frombuffer都不需要超过几毫秒的时间。

这看起来有点旧,但是有什么原因不能只执行fetchall()而不迭代然后在声明时初始化numpy吗?

为什么不试试呢?

您感兴趣的两个平台的驱动程序是可用的——python(redis,通过包索引]2)和R(rredisCRAN)。

redis的天才之处在于它能够神奇地识别NumPy数据类型,并允许您插入和提取多维NumPy数组,就好像它们是原生的redis数据类型一样,而它的天才之处在于您只需几行代码就可以轻松地创建这样的接口。

python中有(至少)几个关于redis的教程;DeGizmo blog上的教程特别好。

import numpy as NP

# create some data
A = NP.random.randint(0, 10, 40).reshape(8, 5)

# a couple of utility functions to (i) manipulate NumPy arrays prior to insertion 
# into redis db for more compact storage & 
# (ii) to restore the original NumPy data types upon retrieval from redis db
fnx2 = lambda v : map(int, list(v))
fnx = lambda v : ''.join(map(str, v))

# start the redis server (e.g. from a bash prompt)
$> cd /usr/local/bin      # default install directory for 'nix
$> redis-server           # starts the redis server

# start the redis client:
from redis import Redis
r0 = Redis(db=0, port=6379, host='localhost')       # same as: r0 = Redis()

# to insert items using redis 'string' datatype, call 'set' on the database, r0, and
# just pass in a key, and the item to insert
r0.set('k1', A[0,:])

# row-wise insertion the 2D array into redis, iterate over the array:
for c in range(A.shape[0]):
    r0.set( "k{0}".format(c), fnx(A[c,:]) )

# or to insert all rows at once
# use 'mset' ('multi set') and pass in a key-value mapping: 
x = dict([sublist for sublist in enumerate(A.tolist())])
r0.mset(x1)

# to retrieve a row, pass its key to 'get'
>>> r0.get('k0')
  '63295'

# retrieve the entire array from redis:
kx = r0.keys('*')           # returns all keys in redis database, r0

for key in kx :
    r0.get(key)

# to retrieve it in original form:
A = []
for key in kx:
    A.append(fnx2(r0.get("{0}".format(key))))

>>> A = NP.array(A)
>>> A
  array([[ 6.,  2.,  3.,  3.,  9.],
         [ 4.,  9.,  6.,  2.,  3.],
         [ 3.,  7.,  9.,  5.,  0.],
         [ 5.,  2.,  6.,  3.,  4.],
         [ 7.,  1.,  5.,  0.,  2.],
         [ 8.,  6.,  1.,  5.,  8.],
         [ 1.,  7.,  6.,  4.,  9.],
         [ 6.,  4.,  1.,  3.,  6.]])

相关问题 更多 >