用R/Python从非结构化数据中提取数据集

1条回答

网友

1楼 · 发布于 2024-04-28 06:18:54

如果您可以提取单个记录（如第二个示例所示），并且字段之间始终至少有一个空格，那么在Python中提取单个数据片段很简单：

>>> itin = 'EY  275   13FEB HYDAUH 0425   0715'
>>> ifields = itin.split()
>>> ifields[0] # travel type
'EY'
>>> ifields[1] # flight number
'275'
>>> ifields[2] # date of travel
'13FEB'
>>> ifields[3][0:3] # departure airport
'HYD'
>>> ifields[3][3:6] # destination airport
'AUH'
>>> ifields[4] # boarding time
'0425'
>>> ifields[5] # landing time
'0715'

您的第一个示例显示了直接从第一个记录开始的第二个记录，没有空格-对吗？如果是这样，每个记录的长度是否总是相同的字符数？在

^{pr2}$

如果数据在一行上有多条可变长度的记录，或者每个字段之间可能有空格也可能没有空格，那么解析会变得更复杂，但在Python中仍然相当容易。在这种情况下，请张贴一个更完整的例子和几个记录，并显示你想要得到的输出。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

用R/Python从非结构化数据中提取数据集

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >