我想找出一个单词是否包含数字和字符,如果是这样,就把数字部分和字符部分分开。我想检查泰米尔语单词,例如:ரூ.100
或ரூ100
。我想把ரூ.
和100
,以及ரூ
和100
分开。如何在python中实现它。我试着这样:
for word in f.read().strip().split():
for word1, word2, word3 in zip(word,word[1:],word[2:]):
if word1 == "ர" and word2 == "ூ " and word3.isdigit():
print word1
print word2
if word1.decode('utf-8') == unichr(0xbb0) and word2.decode('utf-8') == unichr(0xbc2):
print word1 print word2
使用unicode属性:
\pL
代表任何语言的字母\pN
代表任何语言中的数字。你知道吗在你的情况下可能是:
您可以使用
(.*?)(\d+)(.*)
正则表达式,它将保存3个组:数字前的所有内容、数字和数字后的所有内容:或者,您可以将匹配的组解压为变量,如下所示:
希望有帮助。你知道吗
相关问题 更多 >
编程相关推荐