beatifulsoup中文编码的问题
items =soup.find_all(\u0026#39;div\u0026#39;,class_=\u0026#39;content\u0026#39;) 返回的是一个list当list中的item元素是unicode编码时,直接print list是不解码的,但是如果你遍历list,单独print每个item,就可以看到正常的解码了。list = print listfor item in list: print item,中 文
■网友
从 urllib2 的导入来看你使用的应该是 Python2,你尝试一下以下的建议能否解决你的问题。mypage = response.read() 默认返回的是 python 的 bytes 字符串类型,使用 decode 方法将其编码为 unicode 的 str 类型。mypage = response.read().decode()。当然这是 python3 的解决方案,python3 统一了 unicode 字符串和 str字符串类型。不知道该方法在 py2 下能否使用。另外如果你是初学 pytho,无特殊需求的话建议使用 python3 进行学习,会避免很多坑。爬虫方面推荐我写的一个小小练习项目:Python 福利小爬虫,爬取今日头条街拍美女图,内用详细的教程。
■网友
输出遍历列表每个元素。新手还是python3起步吧
■网友
用requests库吧
■网友
换python3
推荐阅读
- 【编码】提醒:购买时注意外观和这俩编码 南京电动自行车超标车临牌更换只剩20天
- |“一米线”成为 市民心中文明线
- 怎样简洁到位地让外国人理解中文互联网文化中的「屌丝」、「喷子」、「五毛」、「水军」、「公知」等词
- 写小说赚银子,在不考虑其他因素的情况下···那个网站贴小说的福利和待遇最好是创世中文吗
- Amplifier(音乐设备) 的正确的中文翻译是啥
- Windows中文件名最大字符数
- 怎样看待起点中文网把个人中心全换成php了
- json下面代码字符编码的规则是啥
- 中文自然语言问答当前有哪些学术资源与成果
- 怎样在Google简体中文界面下关闭安全搜索