从数据帧生成带有随机样本的输出文件

for i in range(4): df_subset=df.sample(100) df=df.drop(df_subset.index) time.sleep(1) #added because runs too fast for unique naming df_subset.to_csv(time.strftime('%Y%m%d_%H%M%S') + 'dfsample.csv')

2条回答

网友

1楼 · 编辑于 2024-06-07 06:55:51

另一种方法是洗牌你的行和摆脱可怕的循环

df.sample(frac=1)

并保存无序数据帧的片段

网友

2楼 · 编辑于 2024-06-07 06:55:51

运行代码之后，我认为问题不在于df.drop 但是在包含time.strftime('%Y%m%d_%H%M%S') + 'dfsample.csv'的行中，因为Pandas会在一秒钟内创建多个CSV文件，这可能会导致一些覆盖问题

我认为，如果您希望使用时间戳为文件添加标签，那么使用毫秒级别可能更有用，并且可以防止覆盖的可能性。就你而言

while len(df)>0:
  df_subset=df.sample(100)
   
  df_subset.to_csv(datetime.now().strftime("%Y%m%d_%H%M%S.%f") + 'dfsample.csv')
  df=df.drop(df_subset.index)

编程相关推荐

java开始为Android开发应用程序
在哪种情况下，c++/c#namespace方法比Java方法更好？
java重构帮助。。。基于属性的对象还是大量成员字段？
java如何使用jackon json将嵌套对象作为字符串的对象转换为Pojo？
java是流式传输远程日志文件的有效方法
javajackson数据绑定：读入现有对象
java NullPointerException这是如何发生的？
java需要伪代码来进行文本压缩/解压缩
java JMS Websphere消息在发送时丢失
JUnit测试的Java SVNKit模拟单元测试

相关问题更多 >

编程相关推荐

热门问题

热门文章

从数据帧生成带有随机样本的输出文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >