Python脚本非常基本的持久性或数据存储

网友

1楼 · 编辑于 2024-04-26 01:26:59

散列是个好主意。为了在数据库中搜索字符串，它们使用索引。由于可以在字符串上定义比较操作，因此可以构建一个索引，即搜索树，并以对数复杂度处理每个查询

网友

2楼 · 编辑于 2024-04-26 01:26:59

将URL存储在一个集合中，这样可以确保O（1）查找项目，并将其搁置。在这个数量的URL中，存储和恢复所需的时间和内存非常少：

import shelve

# Write URLS to shelve
urls= ['http://www.airmagnet.com/', 'http://www.alcatel-lucent.com/',
       'http://www.ami.com/', 'http://www.apcc.com/', 'http://www.stk.com/',
       'http://www.apani.com/', 'http://www.apple.com/',
       'http://www.arcoide.com/', 'http://www.areca.com.tw/',
       'http://www.argus-systems.com/', 'http://www.ariba.com/',
       'http://www.asus.com.tw/']

s=set(urls)                        # Store URLs as set - Search is O(1)
sh=shelve.open('/tmp/shelve.tmp')  # Dump set (as one unit) to shelve file
sh['urls']=s
sh.close()

sh=shelve.open('/tmp/shelve.tmp')  # Retrieve set from file
s=sh['urls']
print 'http://www.apple.com/' in s # True
print 'http://matan.name/'    in s # False

这种方法非常快速：

^{pr2}$

网友

3楼 · 编辑于 2024-04-26 01:26:59

对于大量数据，使用搁置通常是个坏主意。数据库更适合你有大量的数据。在

选项包括：

ZODB（Python对象数据库）
任何RDBMS
noSQL世界（比如MongoDB，很容易接近而且非常快）

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python脚本非常基本的持久性或数据存储

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >