我有一个大的txt文件,格式如下:
0
1
2
3
4
La situacion es preocupante
5
6
Radio es parte de la vida
7
Dejare de querer muy pronto
我需要生成一个pandas数据帧,类似于:
^{pr2}$使用以下代码,我得到的输出不正确:
import pandas as pd
data = pd.read_csv("nohup.out",sep="\\n")
0
0 1
1 2
2 3
3 4
4 La situacion es preocupante
5 5
6 6
7 Radio es parte de la vida
8 7
9 Dejare de querer muy pronto
谢谢你抽出时间
您正在读取没有标题的CSV。在这种情况下,您可以在导入数据帧时指定列名。在
另外,我想您需要将数值替换为null。 尝试以下操作:
这是默认结果。现在,要用NaN替换数字,请尝试:
^{pr2}$编辑:正如@jezrael所暗示的,将“\d”改为\d+”,以便在以下代码中包含多个数字:
您可以像这样使用DataFrame.replace:
尽管你可能需要整理你的输入文件来得到你想要的。在
相关问题 更多 >
编程相关推荐