使用python从没有数据名的json文件中提取url

2024-05-23 09:13:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含900篇文章元数据的json文件,我想从中提取url。我的档案是这样开始的

[
{
    "title": "The histologic phenotypes of …",
    "authors": [
        {
            "name": "JE Armes"
        },
    ],
    "publisher": "Wiley Online Library",
    "article_url": "https://onlinelibrary.wiley.com/doi/abs/10.1002/(SICI)1097-0142(19981201)83:11%3C2335::AID-CNCR13%3E3.0.CO;2-N",
    "cites": 261,
    "use": true
},

{
    "title": "Comparative epidemiology of pemphigus in ...",
    "authors": [
        {
            "name": "S Bastuji-Garin"
        },
        {
            "name": "R Souissi"
        }
        ],
        "year": 1995,
        "publisher": "search.ebscohost.com",
    "article_url": "http://search.ebscohost.com/login.aspx?direct=true&profile=ehost&scope=site&authtype=crawler&jrnl=0022202X&AN=12612836&h=B9CC58JNdE8SYy4M4RyVS%2FrPdlkoZF%2FM5hifWcv%2FwFvGxUCbEaBxwQghRKlK2vLtwY2WrNNl%2B3z%2BiQawA%2BocoA%3D%3D&crl=c",
    "use": true
    },
 .........

我想用objectpath检查文件以创建json.tree文件用于url的外置。这是我要执行的代码

^{pr2}$

但是在创建树的第4步中,我必须插入文件中没有的数据名。我怎样才能替换这条线?在


Tags: 文件of数据namecomjsontrueurl
3条回答

您可以使用列表理解来获取所有文章的url。在

import json

with open("Data_sample.json") as fh:
    articles = json.load(fh)

article_urls = [article['article_url'] for article in articles]

可以这样实例化树:

tobj = op.Tree(your_data)
results = tobj.execute("$.article_url")

最后:

^{pr2}$

将产生:

["url1", "url2", ...]

您是否尝试删除引用并仅使用:

jsonnn_tree = objectpath.Tree(data)

相关问题 更多 >

    热门问题