擅长:python、mysql、java
<p>您正在获取一个已经是unicode的字符串并将其编码为unicode
如果省略编码部分,将得到:</p>
<pre><code>line = u"Привет, как дела?"
words = re.findall(r'[\w]+',line ,re.U)
# words = [u'\u041f\u0440\u0438\u0432\u0435\u0442', u'\u043a\u0430\u043a', u'\u0434\u0435\u043b\u0430']
print words[0]
# prints Привет
</code></pre>