提取日期并删除不需要的字符

Text "«A mio avviso, e credo non solo mio, (17-11-2020 12:42:05)" "Roma, 17 nov – Dalle elezioni, non è facile (…)\n (17-11-2020 12:42:04)" 'Decine di avvocati del libero foro di tutte le regioni ... (17-11-2020 12:41:08)' "Ci sono riusciti: vi stanno facendo odiare l'un l'altro (17-11-2020 12:41:01)" 'Luciano ,\xa0 coreografo, esprime la sua opinione e il mondo de... (17-11-2020 12:40:01)'

0 17-11-2020 12:42:05 1 17-11-2020 12:42:04 2 17-11-2020 12:41:08 3 video) (17-11-2020 12:41:01 # <- here the wrong extraction 4 17-11-2020 12:40:01 ... 20084 07-02-2020 12:47:11

3条回答

网友

1楼 · 编辑于 2024-06-11 02:25:04

试着跑两遍。提取并替换

df['Date'] = df['Text'].str.extract('(?<=\()(.*?)(?=\)$)').replace(regex='[a-z]+\)\s\(',value='')

网友

2楼 · 编辑于 2024-06-11 02:25:04

尝试：

df['Date'] = df['Text'].str.extract('\(([^()]*)\)$')

网友

3楼 · 编辑于 2024-06-11 02:25:04

使用-

df['Text'].str.extract(r'(?:(\()(?!.*\1))(.*)(?:(\))(?!.*\1))').iloc[:,1]

输出

0    17-11-2020 12:42:05
1    17-11-2020 12:42:04
2    17-11-2020 12:41:08
3    17-11-2020 12:41:01
4    17-11-2020 12:40:01
Name: 1, dtype: object

相关问题更多 >

编程相关推荐

热门问题

热门文章