python3中htmlparser在解析页面遇到特殊字符报错的问题该怎样解决

不要用 GBK 编码,因为它里边没有 NBSP。如果需要用 GB 系列编码,请使用 GB18030,否则请使用 UTF-8。我没有看到你是在哪里指定编码的(也许是你的环境指定的;你的描述太简略)。完整的代码,及运行的环境(cmd.exe?IDLE?其它 IDE?Python 版本?系统版本?)
■网友
你的代码(未修改前)我在windows7下使用python3.4.3执行,是可以成功的。廖老师的博客中的代码我也执行过,都可以输出\u0026amp;nbsp; 。 唯一的不同是,#!/usr/bin/env python3# -*- coding: utf-8 -*-这两句你没有加。同时廖老师的博客中有提到Notepad,需要: 【python3中htmlparser在解析页面遇到特殊字符报错的问题该怎样解决】 第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。
申明了UTF-8编码并不意味着你的.py文件就是UTF-8编码的,必须并且要确保文本编辑器正在使用UTF-8 without BOM编码:
来自 字符串和编码
可能是这个问题,请查看一下。


    推荐阅读