python utf-8报错_python处理一些乱码的中文文本时decode('utf-8')报错的处理_weixin_39801158的博客-程序员秘密

技术标签: python utf-8报错  

用python写脚本时,遇到处理中文(乱码的中文)时,用decode('utf-8')会发现始终会报错

>>> txt_from = open('/home/love/ex130705.log')

>>> txt_from_iter= iter(txt_from)

>>> txt_proc = txt_from_iter.next().decode('utf-8', 'ignore')

Traceback (most recent call last):

File "/tmp/py4049kjX", line 41, in

txt_proc = txt_from_iter.next().decode('utf-8')

File "/usr/lib/python2.7/encodings/utf_8.py", line 16, in decode

return codecs.utf_8_decode(input, errors, True)

UnicodeDecodeError: 'utf8' codec can't decode bytes in position 84-85: invalid continuation byte

欲处理的原文件中部分显示为乱码:

2013-07-05 04:20:10 192.168.1.5 GET /Portals/0/鏁欒偛淇℃伅鏂囦欢澶 校园 80 - 25.XXX.10.99 Mozilla/4.0+(compatible;+MSIE+8.0;+Windows+NT+5.1;+Trident/4.0;+Alexa+Toolbar)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_39801158/article/details/110696370

智能推荐

关于pv操作的理解_pv操作中p和v各代表什么_qq_40108183的博客-程序员秘密

在软考考试中,关于操作系统的知识有一个考点是pv操作,同时也是一个考点,现在我给大家略微谈一下我对这个的理解吧首先先弄清楚pv操作的含义,pv操作是实现进程同步和互斥的常用方法,pv操作是低级通信原语,在执行期间不可分割,其中,p操作表示申请一个资源、v操作表示释放一个资源p操作定义:s:=s-1,若s>=0,则执行p操作的进程继续执行;否则,若sv操作定义:s:=s-1,若s>0,则

二叉树的三种遍历方式解析_遍历二叉树csdn_Happme1的博客-程序员秘密

小白一枚,初看数据结构,一直不是非常理解树的三种遍历方式,直到看了这篇大佬的总结,非常清晰易懂博客链接:https://blog.csdn.net/soundwave_/article/details/53120766二叉树的遍历分为以下三种:先序遍历:遍历顺序规则为【根左右】中序遍历:遍历顺序规则为【左根右】后序遍历:遍历顺序规则为【左右根】什么是【根左右】?就是先遍...

hadoop生态圈_embarrassingly parallel large-scale_武晓兵的博客-程序员秘密

https://blog.csdn.net/kisssun0608/article/details/45338655版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010113156/article/details/45338655根据Hadoop官网的相关介绍和实际使用中的软件集,将Hadoop生态圈的主要软件工具简单介绍下,拓展对整个...

终于发现struts2 Annotation的用处了——验证_catstiger的博客-程序员秘密

struts2提供了annotation来代替配置文件,并且说:"It is great start."。我试用了Annoation风格的Action配置,感觉并不是很好用,尤其在比较复杂的Action中,反而不如XML直观明了。甚至,我不喜欢使用带有{}的简化配置,还是传统的方式更加一目了然。尤其是配置配置Action的时候需要在web.xml中注明packages,简直是...今天终于找到...

StructuredStreaming: A Declarative API for Real-Time_weixin_38440581的博客-程序员秘密

AbstractWith the ubiquity of real-time data,organizations need streaming systems that are scalable, easy to use, and easyto integrate into business applications. Structured Streaming is a newhigh-leve...

乘积尾零 因式分解【蓝桥杯真题】(c++实现)_利用c++编写乘积尾零_河南-殷志强的博客-程序员秘密

上文链接:第几天修改版【蓝桥杯真题】(c++实现)乘积尾零如下的10行数据,每行有10个整数,请你求出它们的乘积的末尾有多少个零?5650 4542 3554 473 946 4114 3871 9073 90 43292758 7949 6113 5659 5245 7432 3051 4434 6704 35949937 1173 6866 3397 4759 7557 3070 ...

随便推点

JasperReports使用指南---报表区域_jasperreport打印区域_redbeans的博客-程序员秘密

一个最小的报表可以根本不包括报表区域,因为它们每一个都是可选的。但象这样的最小报表设计将不会产生有意义的文档。XML Syntax background (band?)> title (band?)> pageHeader (band?)> columnHeader (band?)> detail

LCS(Needleman_Wunsch算法)算法 (python实现)_BHHANt的博客-程序员秘密

最长公共子序列(longest common subsequence,LCS)# -*- coding: utf-8 -*-"""Created on Tue Nov 26 19:55:48 [email protected]: HTING"""import numpy as npdef LCS(str1,str2): s = 0 l = np.zeros([len(st...

linux matlab 后台,linux(unix服务器)下后台运行matlab_wlj509的博客-程序员秘密

http://hi.baidu.com/imheaventian/blog/item/c238604f7d3551c6d1c86a0e.html(cited from:http://hi.baidu.com/yilinghl/blog/item/c9a9be34a459b2bfd1a2d3b5.html)后台运行matlab脚本文件的方法:nohup实现功能:1. 字符环境下运行matlab.2....

QT中QMainWindow、QWidget、QDialog_dinaoju5134的博客-程序员秘密

QT中QMainWindow、QWidget、QDialog简述在分享所有基础知识之前,很有必要在这里介绍下常用的窗口-QWidget、QDialog、QMainWindow。熟悉Qt的同学都应该知道,在新建Qt Widgets项目进行类信息选择时会碰到它们,没错,很巧,每次都能碰到。所以,在以后的Qt开发中,我们会经常和它们打交道。常言道,知己知彼,百战不殆。只有了解它们、...

关于Win32窗口程序中 窗口类的WinProc自定义方法_sunger7的博客-程序员秘密

最近脑抽,用win32 API写了一个数据处理平台,将各个窗口定义为Class进行自管理,但是由于类常规成员函数不能作为窗口函数,只能将窗口函数定义为静态函数,这样写则后续在窗口函数中引用的函数都要定义为静态函数,且不能引用类中的成员变量,非常麻烦,通过调研(竟然在20年前的贴子中找到了一个方法,但只是思路,无法直接使用)可以在createstruct中将成员函数传递给窗口,实现如下,包含一个窗口...

推荐文章

热门文章

相关标签