如何仅从列中的字符串中删除数字

3条回答

网友

1楼 · 编辑于 2024-05-14 07:11:29

假设您的数据帧被称为df，那么这样就可以了

import numpy as np
nan_condition = df[~df["Total_dl"].str.contains(">")]
df.loc[nan_condition,"Total_dl"] = np.nan

网友

2楼 · 编辑于 2024-05-14 07:11:29

一种方法。不确定这是一个多么好的解决方案：

df['Total_dl'] = df['Total_dl'].apply(lambda o: o if '<' in str(o) else np.nan)

改为使用执行相同操作的函数：

>>> df
   SampleID Total_dl
0    A-1-0'      2.5
1  A-1-0.5'   <0.021
>>> df.dtypes
SampleID    object
Total_dl    object
dtype: object
>>> def foo(o):
...     if '<' in str(o):
...         return o
...     else:
...         return np.nan
...         
>>> df['Total_dl'] = df['Total_dl'].apply(foo)
>>> df
   SampleID Total_dl
0    A-1-0'      NaN
1  A-1-0.5'   <0.021
>>>

网友

3楼 · 编辑于 2024-05-14 07:11:29

下面应该可以做到这一点：

import numpy as np


mask = df.Total_dll < 1.
df.loc[mask, 'Total_dll'] = np.nan

如果Total_dll属于string类型，您可以尝试以下操作：

import numpy as np


df.str.startswith('<')
df.loc[df.Total_dll.str.startswith('<'), np.nan]

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何仅从列中的字符串中删除数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >