我有一些JSON文件是空的,当我尝试循环遍历它们时,会出现异常。我该怎么做?

2024-04-24 05:35:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一些关于剑桥分析的研究,我想从一些新闻机构得到尽可能多的新闻文章。你知道吗

我可以把它们刮下来,现在在一个文件夹里有一堆JSON文件。 其中一些只有这个[]写在里面,而另一些有我需要的数据。你知道吗

使用pandas,我使用了以下内容并获得了文件中的每个webTitle。你知道吗

df = pd.read_json(json_file)
df['webTitle']

问题是,每当有一个空文件时,它甚至不允许我将df['webTitle']赋值给一个变量。你知道吗

有没有办法让我检查它是否是空的,是否只是转到下一个文件? 我想把它制作成一个电子表格,其中包含一些keys和列,values作为每一篇新闻文章的行。你知道吗

我的文件是按天组织的,我使用了guardian API来获取数据。你知道吗

我还没有写太多,但为了以防万一,下面是代码:

import pandas as pd
import os


def makePathToFile(path):
    pathtoJson = []
    for root,sub,filename in os.walk(path):
        for i in filename:
            pathToJson.append(os.path.join(path, i))
    return pathToJson




def readJsonAndWriteCSV (pathToJson):
    for json_file in pathToJson:
        df = pd.read_json(json_file)

谢谢!你知道吗


Tags: 文件pathinjsonpandasdfforread