根据在其他两列中定义的开始索引和停止索引位置，在dataframe中提取子字符串

1条回答

网友

1楼 · 发布于 2024-04-26 06:21:38

使用.apply对每行应用切片，格式为：string[start:stop]

df.apply(lambda x: x['Seq'][x['start']:x['stop']], axis=1)

0      aaabbbbbbbb
1    sssssssssssss
dtype: object

如果要定义函数：

def slice_str(string, start, stop):
    return string[start:stop]

df.apply(lambda x: slice_str(x['Seq'], x['start'], x['stop']), axis=1)

或者将zip与list comprehension一起使用：

slices = [string[start:stop] for string, start, stop
          in zip(df['Seq'], df['start'], df['stop'])]

['aaabbbbbbbb', 'sssssssssssss']

使用的输入数据帧：

   start  stop                                        Seq
0     10    21  aaaaaaaaaaaaabbbbbbbbbbbbccccccccccdddddd
1     12    25  aaaaahhhhhhhsssssssssssssscccccccccdddddd

编程相关推荐

java如何在创建对话框时设置模糊背景
java支持clojure中的xml和json REST响应
java在Android中通过多个JSON对象循环
java如何创建T类型的新对象
Java应用程序的设计
java使用GridView、适配器和毕加索制作流行电影应用程序
java在映射中交换值
java在同一活动/布局中多次使用同一片段
使用FixedLengthTokenizer使用java Spring FlatFileItemReader
javajavax。xml。ws。WebServiceException:javax。xml。肥皂SOAPException:错误代码QName必须是命名空间限定的！在weblogic server 12c中部署时

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据在其他两列中定义的开始索引和停止索引位置，在dataframe中提取子字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >