加快创建随机数据

from random import randint f = open('2014-07-17-1M_testdata_1Mx500.cvs', 'w', 50000000) #50MB write buffer for i in range(1000000): #num rows for i2 in range(500): #entries per row f.write(str(randint(0,1000000))) #Return a random integer N such that a <= N <= b. if(i2 != 499): #entries per row - 1 f.write(",") f.write("\n") if(i != 0 and i % 100000 == 0): print(str(i) + " lines written") f.close

1条回答

网友

1楼 · 发布于 2024-04-20 06:42:32

纯Python是一个困难的问题，但幸运的是，有一些高效的Python库可以帮助加快速度。numpy是一个很好的例子：

import numpy
import numpy.random

f = open('2014-07-17-1M_testdata_1Mx500.csv', 'w', 50000000)

for i in range(1000):
    m = numpy.random.random_integers(0, 1000000, (1000, 500))
    numpy.savetxt(f, m, delimiter=',')

f.close()

在我的MacBook Pro上运行，代码肯定是通过写入磁盘而不是CPU来绑定的，所以这似乎起到了作用。你知道吗

编程相关推荐

java HttpServletResponse在保存时提示输入文件名
基于Java中的XML值重新创建XML
Java中递归调用的一个堆栈占用多少内存？
java数字到二进制到零计数器
java Primefaces选项卡视图：在计数后设置活动索引
xml在Java中可以将XSD转换为XPath吗？
在递归循环中检测JDBC连接的java插件/工具
spring mvc中的java处理错误
java向spring安全认证添加子域
在安卓中设置时，java日期不正确

相关问题更多 >

编程相关推荐

热门问题

热门文章