python中的瑞典语Unicode问题

threadcode=opener.open(threadurl).read() threadcode2=threadcode.decode("ISO-8859-1") post=re.findall(r'<div class="fl icon-post-old"></div>(.*?)<a',str(threadcode2)) post2=re.findall(r'<div class="fl icon-post-old"></div>(.*?)<a',str(threadcode)) print (post) #this is blank print (post2) #this works fine

2条回答

网友

1楼 · 编辑于 2024-04-27 01:07:16

跟瑞典语没关系。我认为re是在多行上。如果你这样做：

post=re.findall(
  r'<div class="fl icon-post-old"></div>(.*?)<a',
  threadcode2.replace('\n','')
)

你会得到你期望的结果。你知道吗

网友

2楼 · 编辑于 2024-04-27 01:07:16

将unicode字符串传递到^{}时，应传递^{}标志：

post=re.findall(r'<div class="fl icon-post-old"></div>(.*?)<a',threadcode2, flags=re.UNICODE)

编程相关推荐

java Midlet即使按下设备的“剪切”按钮也不能关闭
JavaSpring环境。getProperty未解析
用Hibernate在Java中实现序列
具有重复键和文件写入的java映射
java显示控制台输出到JavaFXML应用程序中的TextArea
java Cucumber在编译为时无法在类路径上找到功能文件。战争
java过滤器中的servlet问题
安卓中消息和字符串之间的java转换？
java Apache POI读取单元（下午12:35:00）时间值返回1899年12月31日
Java游戏中的碰撞检测？

相关问题更多 >

编程相关推荐

热门问题

热门文章

python中的瑞典语Unicode问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >