我正在尝试基于不同列和行的数据生成一些新列。例如,以以下系列为例:
df = pd.Series(['Fruit[edit]','Apple','Orange','Banana','Vegetable[edit]','Celery','Beans','Kale'])
0 Fruit[edit]
1 Apple
2 Orange
3 Banana
4 Vegetable[edit]
5 Celery
6 Beans
7 Kale
我从一个系列开始,其中带有“[edit]”的元素表示类别,其余的是属于该类别的项的名称。我想创建两个新列,一个显示“类别”(即水果或蔬菜),另一个列标题为“名称”,显示属于该类别的项目。你知道吗
最终结果应该是这样的:
Category Name
0 Fruit Apple
1 Fruit Orange
2 Fruit Banana
3 Vegetable Celery
4 Vegetable Beans
5 Vegetable Kale
当我们继续这个系列时,我希望代码识别一个新的类别(即以“[edit]”结尾的元素),并将其存储为项目的更新类别,直到到达一个新的类别。你知道吗
这可能很难看,但工作:
你可以用结构提取物要根据关键字的存在提取组
用途:
相关问题 更多 >
编程相关推荐