将带有tweets的文本文件解析为带有“|”delimi的csv

Date_time|latitude|longitude|tweet_text Mon Jan 01 09:09:57 +0000 2018|-37.8140362|144.9644232|terima kasih 2017 yang ohsem. semoga 2018 akan lebih baik lagi.-selamat tahun baru rakan-rakanâ€¦ Mon Jan 01 09:15:54 +0000 2018|-37.81639|144.9655|we love christmas and new year proposals! happy new year to everyone celebrating love this yearâ€¦ Mon Jan 01 09:42:08 +0000 2018|-37.818|144.985|@michaelpaynter entertaining everyone at yarra park nye event #melbourne| #nye #musicâ€¦ Mon Jan 01 09:45:16 +0000 2018|-37.818|144.985|@emilyurbandiva and brother @jwilliamsimusik entertaining everyone at yarra park nye eventâ€|¦

1条回答

网友

1楼 · 发布于 2024-05-14 21:22:26

所以这只是一个通过指定列名来指定列数的问题。你知道吗

data = pd.read_csv('MelbCBD_scs2018_new.txt', sep="|", names = ["Date_time", "latitude", "longitude","tweet_text"], header=None, quoting=csv.QUOTE_NONE,error_bad_lines=False)

现在，它返回每一行而不跳过，并将其存储在名为“data”的数据帧中。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章