Python - 按照每个项目的位置将文本分列

2024-05-15 21:08:04 发布

您现在位置:Python中文网/ 问答频道 /正文

Bovespa(巴西证券交易所)提供一个包含所有报价的文件。文件太大,每一行都与实际示例类似:

012016010402AAPL34 010APPLE DRN R$ 000000000415000000000042200000000004150000000000421300000000042080000000003950000000000435000005000000000000012500000000000052664400000000000000009999123100000010000000000000BRAAPLBDR004115

所以,在查找文档时,我发现列映射是这样的:

  • 字符01到02:(int)寄存器类型
  • char 03 to 10:(date)股票报价信息的日期
  • char11到12:(int)某种代码
  • 字符13到24:(str)股票行情
  • 。。。。在

我开始学习Python并尝试读取一个包含这些数据的文件,并用以下代码成功地完成了每一行:

我觉得这可能是一个愚蠢的问题,但我还没有找到解决办法,所以如果你知道解决这个问题的方法,请分享。在

谢谢


Tags: 文件to代码文档示例类型date字符
1条回答
网友
1楼 · 发布于 2024-05-15 21:08:04

你有一个fixedwidthf格式:这就可以了。在

pd.read_fwf(file_path, widths=[...], names=[...])

您应该传递宽度列表,在您的例子中,它以[2,8,2,10,...]开头,列列表['register','date','code','ticker',...]

相关问题 更多 >