在Python中将Wikipedia表刮到CSV

2024-06-01 01:38:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用python从Wikipedia中抓取一个表。我已经完成了代码,但是在将特定列提取到CSV中以及添加封闭的双撇号时遇到了一些问题。在

我只想提取以下列名:

Kode BPS, Nama, Ibu Kota, Populasi, Luas, Pulau.

以下是表格的结果:

enter image description here

我的代码是:

^{pr2}$

Tags: csv代码wikipedia表格bpsibupr2kode
3条回答

可以将dataframe中的列指定为:

columns = ['Kode BPS', 'Nama', 'Ibu Kota', 'Populasi', 'Luas', 'Pulau']
df = pd.DataFrame(columns=columns)

然后插入所需的值。在

这个怎么样?在

import pandas as pd
link = "https://id.wikipedia.org/wiki/Demografi_Indonesia"
tables = pd.read_html(link,header=0)[2]
df.to_csv(tables, sep='\t')

保持简单。在

将Wikipedia页面的表转换为CSVpd.read_html())(df.empty)(df.to_csv()

import pandas as pd

def wiki_to_csv(wikiurl = str):
    tname  = link.split("/")[-1]
    tables = pd.read_html(link, header=0)

    for i in range(len(tables)):
        if not tables[i].empty:
            fname = tname + " table " + str(i)
            tables[i].to_csv(fname, sep=',')

以获取精确的表并选择特定列df.rename())(Select Columns

^{pr2}$

我不知道你用双引号有什么问题。在

相关问题 更多 >