" id="b1img" alt="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" title="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO">
  • " alt="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" title="米课”N+1“思维建站-非官方免费技术支持,Wordpress/Zencart/Opencart建站、SEO" />
  • " alt="Windows/Linux服务器运维技术支持 环境搭建、应用发布、服务器管理、虚拟化、云计算" title="Windows/Linux服务器运维技术支持 环境搭建、应用发布、服务器管理、虚拟化、云计算" />
  • " alt="高校/小型企业网络运维与建设免费技术支持,网络规划、网络优化、故障排除、网络管理" title="高校/小型企业网络运维与建设免费技术支持,网络规划、网络优化、故障排除、网络管理" />

python UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\xa9′ in position 29077: illegal multibyte sequence

程序设计2017-11-13 itlogger阅读(529) 评论(0)

【问题描述】python 抓取网页,提示“UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\xa9′ in position 29077: illegal multibyte sequence”
【问题分析】
python抓取网页涉及三个编码
1.网页编码
2.python编码 默认asicci,查看方法:
import sys
import sys.getdefaultencoding()
3.windows编码 默认GBK(如果是在cmd下运行python,要解码成gbk)
【问题解决】
1.选择正确的解码格式
2.本例错误是字符串中有非法字符,可添加ignore参数,忽略无法无法编码的字符
import requests
r=reuqests.get(“http://www.itlogger.com”)
print (r.text).encode(‘gbk’,’ignore’)

转载请注明 :IT樵客
文章地址:http://www.itlogger.com/program/2388.html
标签:
相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注