当数据嵌套且模式不规则时，将字典列表转换为数据帧

wordlist = ['illicitly', 'tray', 'tali', 'tart', 'itty'] rows = [] for word in wordlist: row = {} row['word'] = word print(word) url = "https://api.dictionaryapi.dev/api/v2/entries/en/"+word # time.sleep(5) response = requests.get(url) if response.status_code != 200: row['response'] = "Not found" rows.append(row) continue else: row['response'] = "Found" data = response.json() row['number_of_definitions'] = len(data) for d in data: if 'origin' in d.keys(): row['origin'] = d['origin'] else: row['origin'] = "No origin found" rows.append(row) df = pd.DataFrame(rows)

1条回答

网友

1楼 · 发布于 2024-05-31 23:43:23

尝试使用json_从熊猫规范化：

import requests
import pandas as pd

wordlist = ['illicitly', 'tray', 'tali', 'tart', 'itty']

rows = []
list_data = []
for word in wordlist:
    row = {}
    row['word'] = word
    print(word)
    url = "https://api.dictionaryapi.dev/api/v2/entries/en/"+word
#    time.sleep(5)
    response = requests.get(url)
    if response.status_code != 200: 
        row['response'] = "Not found"
        rows.append(row)
        continue
    else:
        row['response'] = "Found"
    data = response.json()
    list_data.extend(data)
    
for d in list_data:
    if 'origin' not in d:
        d['origin'] = 'NA'

df = pd.json_normalize(list_data, record_path = ['meanings', 'definitions'],
                         meta = ['word', 'phonetic', 'origin',
                                 ['meanings', 'partOfSpeech']],
                         errors = "ignore")

相关问题更多 >

编程相关推荐

热门问题

热门文章