对天城文文本使用urlencode

1 投票
1 回答
846 浏览
提问于 2025-04-17 09:13

以下代码:

import simplejson,urllib,urllib2  

query=[u'नेपाल']
urlbase="http://search.twitter.com/search.json"
values={'q':query[0]}
data=urllib.urlencode(values)
req=urllib2.Request(urlbase,data)
response=urllib2.urlopen(req)
json=simplejson.load(response)
print json

会抛出一个异常:

SyntaxError: Non-ASCII character '\xe0' in file ques.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

如果query里包含标准的ASCII字符,这段代码就能正常工作。我试着查看了推荐的链接,但还是搞不清楚怎么为德瓦那加里字符指定编码。

1 个回答

2

你需要在文件中添加UTF-8的头部信息,这样Python解释器就知道里面有Unicode字符了。同时,你还得把参数编码成UTF-8格式。下面是一个可以正常工作的版本:

# -*- coding: utf-8 -*-
import simplejson,urllib,urllib2  

query=[u'नेपाल']
urlbase="http://search.twitter.com/search.json"
values={'q':query[0].encode('utf-8')}
data=urllib.urlencode(values)
req=urllib2.Request(urlbase,data)
response=urllib2.urlopen(req)
json=simplejson.load(response)
print json

撰写回答