beatifulsoup中文编码的问题

items =soup.find_all(\u0026#39;div\u0026#39;,class_=\u0026#39;content\u0026#39;) 返回的是一个list当list中的item元素是unicode编码时,直接print list是不解码的,但是如果你遍历list,单独print每个item,就可以看到正常的解码了。list = print listfor item in list: print item,中 文
■网友
从 urllib2 的导入来看你使用的应该是 Python2,你尝试一下以下的建议能否解决你的问题。mypage = response.read() 默认返回的是 python 的 bytes 字符串类型,使用 decode 方法将其编码为 unicode 的 str 类型。mypage = response.read().decode()。当然这是 python3 的解决方案,python3 统一了 unicode 字符串和 str字符串类型。不知道该方法在 py2 下能否使用。另外如果你是初学 pytho,无特殊需求的话建议使用 python3 进行学习,会避免很多坑。爬虫方面推荐我写的一个小小练习项目:Python 福利小爬虫,爬取今日头条街拍美女图,内用详细的教程。
■网友
输出遍历列表每个元素。新手还是python3起步吧
■网友
用requests库吧
■网友
换python3


    推荐阅读