基于Python磁盘的字典

网友

1楼 · 编辑于 2024-05-13 03:23:50

第三方shove模块也值得一看。它与shelve非常相似，因为它是一个简单的类似dict的对象，但是它可以存储到各种后端（如file、SVN和S3），提供可选的压缩，甚至是线程安全的。这是一个非常方便的模块

from shove import Shove

mem_store = Shove()
file_store = Shove('file://mystore')

file_store['key'] = value

网友

2楼 · 编辑于 2024-05-13 03:23:50

shelve模块可以做到这一点；无论如何，它应该易于测试。而不是：

self.lengths = {}

做：

import shelve
self.lengths = shelve.open('lengths.shelf')

唯一的问题是架子的钥匙必须是串的，所以你必须更换

self.lengths[indx]

与

self.lengths[str(indx)]

（根据你对查尔斯·达菲帖子的评论，我认为你的密钥只是整数）

内存中没有内置缓存，但无论如何，您的操作系统可能会为您这样做。

[实际上，这并不完全正确：您可以在创建时传递参数'writeback=true'。这样做的目的是确保在工具架中正确地存储列表和其他可变内容。但是一个副作用是整个字典都被缓存在内存中。因为这会给你带来麻烦，所以这可能不是个好主意：—）]

网友

3楼 · 编辑于 2024-05-13 03:23:50

磁盘上的散列通常用Berkeley DB或类似的东西来处理-在Python Data Persistence documentation中列出了几个选项。你可以在它前面加一个内存缓存，但我会先测试一下本机性能；如果操作系统缓存到位，它可能也会有同样的结果。