我有一个csv文件与公司名称列,我需要找到它的域名,并存储在同一个csv文件旁边的公司名称
到目前为止我使用的代码
import pandas as pd
import clearbit
import json
clearbit.key = 'your secret key'
df = pd.read_csv("/home/vipul/Desktop/new.csv", sep=',', encoding="utf-8")
saved_column = df['Company']
i=0
for data in saved_column:
n = saved_column[i]
i = i+1
domain = clearbit.NameToDomain.find(name=n)
print(domain)
l = json.loads(domain)
print(l['domain'])
这里的代码以json格式提供域名logo和域名,但如何只获取域名
但这会产生错误l = json.loads(domain)
print(l['domain'])
错误:TypeError: the JSON object must be str, not 'NameToDomain'
The csv file looks like this
Company
Accenture
AND Digital
Accenture
Kite Consulting Group
Capgemini
expected output
Company Domain
Accenture accenture.com
AND Digital and.digital
Accenture accenture.com
Kite Consulting Group None
Capgemini capgemini.com
json看起来像
Name: Company, dtype: object
{'name': 'Accenture', 'logo': 'https://logo.clearbit.com/accenture.com', 'domain': 'accenture.com'}
{'name': 'AND Digital', 'logo': 'https://logo.clearbit.com/and.digital', 'domain': 'and.digital'}
{'name': 'Accenture', 'logo': 'https://logo.clearbit.com/accenture.com', 'domain': 'accenture.com'}
None
{'name': 'Capgemini', 'logo': 'https://logo.clearbit.com/capgemini.com', 'domain': 'capgemini.com'}
根据文档,
clearbit.NameToDomain.find(name=n)
返回一个字典,因此您可以像访问任何其他python字典一样访问它的值。你不在乎它来自json,那是为你处理的。(同样,这个问题与csv无关)。你知道吗另外两点:
基于这个问题,有两件事:
像这样:
使用apply
编辑:
clearbit解析器的实现方式如下(我没有尝试过这段代码,但它应该可以工作):
因为它是一个字典,我们可以给它分配一些默认值,并存储在csv文件中,然后删除它就可以了:)
编辑的代码
相关问题 更多 >
编程相关推荐