python中的正则表达式模式连接

76.39 1.23 81.06 12.02 16.59 81.61 45 24.812 51.35 88.22 0 000 21 .85 100 67.08 70.98 pattern1= r'(\d+\.\d+%)' df['var']=df['var'].astype(str).str.extract(pattern1)[0] pattern2 = r'^(?:0{0,})((?:[1-9]{1,2}|100)?(?:\.\d+)?)%?$' df['var']=df['var'].astype(str).str.extract(pattern2)[0]

1条回答

网友

1楼 · 发布于 2024-05-31 23:55:14

您只能使用正则表达式在%或空格上拆分，然后将float应用于第一项：

import pandas as pd
import numpy as np
import string

data ='''76.39% (based on 206 issue)
1.23% (based on 197)
81.06% based on 206,390,020 fully  issue
12.02
16.59
81.61%
45
24.812
51.35
19348952
88.22
0
000
021
.85%
100'''

df = pd.DataFrame(data.splitlines(), columns=['text'])
df['var'] = df['text'].str.strip(string.punctuation + string.ascii_letters).str.split(r'%|\s').str[0].astype(float).apply(lambda x: x if x <= 100.0 else np.nan)

输出：

^{tb1}$

编程相关推荐

jsf-java。安全NoSuchAlgorithmException:在jboss上部署时AES密钥生成器不可用
使用servlet与持久化java应用程序对话
java SPNEGO获取用户详细信息
如何向数组中的每个元素添加特定的数字？JAVA
佛教日历中的java JSpinner日期编辑器
tomcat6如何使用ip地址从另一台机器运行java动态web项目
向数据模型添加行时发生java ArrayIndexOutOfBoundsException
java奇怪的线程行为
java为什么程序没有显示任何输出？
具有弱值的java HashMap

相关问题更多 >

编程相关推荐

热门问题

热门文章

python中的正则表达式模式连接

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >