对天城文文本使用urlencode
以下代码:
import simplejson,urllib,urllib2
query=[u'नेपाल']
urlbase="http://search.twitter.com/search.json"
values={'q':query[0]}
data=urllib.urlencode(values)
req=urllib2.Request(urlbase,data)
response=urllib2.urlopen(req)
json=simplejson.load(response)
print json
会抛出一个异常:
SyntaxError: Non-ASCII character '\xe0' in file ques.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
如果query
里包含标准的ASCII字符,这段代码就能正常工作。我试着查看了推荐的链接,但还是搞不清楚怎么为德瓦那加里字符指定编码。
1 个回答
2
你需要在文件中添加UTF-8的头部信息,这样Python解释器就知道里面有Unicode字符了。同时,你还得把参数编码成UTF-8格式。下面是一个可以正常工作的版本:
# -*- coding: utf-8 -*-
import simplejson,urllib,urllib2
query=[u'नेपाल']
urlbase="http://search.twitter.com/search.json"
values={'q':query[0].encode('utf-8')}
data=urllib.urlencode(values)
req=urllib2.Request(urlbase,data)
response=urllib2.urlopen(req)
json=simplejson.load(response)
print json