您的位置:首页技术文章
文章详情页

python去除删除数据中u0000u0001等unicode字符串的代码

浏览:6日期:2022-08-03 13:49:22

py文件为utf-8格式

#!/usr/bin/env python# -*- coding:utf-8 -*- a = 'systemu0000' b = re.sub(u’u0000’, '', a) print(b) ## b='system'

补充知识:Python中,如何将反斜杠u类型(uXXXX)的字符串,转换为对应的unicode的字符

【背景】

类似于:

u3232u6674 的字符串,转换为对应的unicode字符。

【解决过程】

对应的,可以通过Python的decode函数去解码,其中自定原始字符串位unicode-ecape,就可以了。

完整的python代码演示为:

#!/usr/bin/python #coding: utf-8slashUStr = 'u0063u0072u0069u0066u0061u006Eu0020u5728u8DEFu4E0A'; #crifan 在路上 decodedUniChars = slashUStr.decode('unicode-escape') print 'decodedUniChars=',decodedUniChars; #decodedUniChars= crifan 在路上

以上这篇python去除删除数据中u0000u0001等unicode字符串的代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持好吧啦网。

标签: Python 编程
相关文章: