imdbpy2sql.py 在 FLUSHING MoviesCache 时卡住
我终于在Windows 7上用Python 2.7、minGW和pymsql成功运行了imbdpy2sql,它能顺利连接到数据库并创建所有表格,但在处理“Flushind MoviesCache”时总是卡住,无法继续。它的输出是:
SAVING ImdbID values for ... DONE
DROPPING current database ... DONE
CREATING New tables ... DONE
SCANNING movies
然后它会列出10001,接着是20001,以此类推,一直到90001,然后显示* FLUSHING MoviesCache
但就是停在这里不动。我应该让它这样等多久呢?我至少等了一个小时,甚至两个小时,完全没有进展。有没有什么办法可以让它正常工作?还是说它其实在工作,只是需要我耐心等上几个小时?
另外,如果这有帮助的话,我是通过打开命令提示符,切换到C:\Python27\Scripts\bin\
目录,然后使用这个命令来运行的:
imdbpy2sql.py -d C:\USers\Jordan\DEsktop\IMDB -u mysql://root:lookool@localhost/IMDB
2 个回答
0
[MySQL]
一般来说,如果你看到很多“数据太多...正在拆分”的提示,建议你把MySQL服务器的设置中max_allowed_packet这个参数调高,至少设置到8M或16M。否则,插入数据的速度会很慢,甚至可能会丢失一些数据。
这在他们的文档里有说明哦 :)
1
不,这种情况不正常:刷新操作最多应该只需要几十秒。
我会尝试重现这个问题;同时,你可以试试使用CSV导入系统:再次运行imdbpy2sql.py,保持相同的选项,增加“-c C:\Temp”(不用加引号,或者类似的东西:在Windows系统上,可能需要用两个反斜杠作为目录分隔符)。
如果你能使用linux或unix环境,你也可以尝试用部分数据集进行实验,使用docs/goodies/目录里的reduce.sh脚本。