向DF h添加列

2024-04-24 04:47:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在写一个webscrape脚本。生成的pandas数据框非常棒,但是我需要添加一个唯一的\u id列,其值为HTML中包含的href URL。你知道吗

<td><a href="/admin/tasks/edit/82689"> ADDRESS </a> CLIENT </td>

当前,Pandas数据框有一个包含“ADDRESS CLIENT”的列,但如何添加一个包含href URL的单独列?你知道吗

我目前可以使用以下方法获得一个逗号分隔的唯一\u id值列表:

unique_id = [a['href'] for a in table.select('a[href]')]

任何方向都将不胜感激!你知道吗


Tags: 数据脚本clientidurlpandasadminaddress
1条回答
网友
1楼 · 发布于 2024-04-24 04:47:35

正确的方法是使用文件.DataFrame.assign方法

df.assign(url=unique_id)

这将在DataFrame中为您提供一个名为url的新列和numpy数组中的值。据我所知,像df['url] = unique_id这样的列赋值是不推荐的。你可以读更多 here。你知道吗

相关问题 更多 >