Python的Big5与UTF-8文件编码转换程序教程

介绍如何使用简单的 Python 程序处理 Big5 与 UTF-8 文件的编码转换问题。

Big5 与 UTF-8 的编码转换是在中文数据处理上常见的问题之一,以下介绍如何使用 Python 来处理 Big5 与 UTF-8 编码的互转。

Big5 转 UTF-8

Python 的读取与写入文件函数本身就有支持各种编码,所以只要在打开文件时,正确指定文件的编码,就可以让 Python 自动处理编码转换问题,以下是 Big5 文件转成 UTF-8 文件的范例。

# 打开 Big5 输入文件
inFile = open("big5_input.txt", "r", encoding = "Big5")

# 打开 UTF-8 输出文件
outFile = open("utf8_output.txt", "w", encoding = "UTF-8")

# 以 Big5 编码读取文件
content = inFile.read()

# 以 UTF-8 编码写入文件
outFile.write(content)

# 关闭文件
inFile.close()
outFile.close()

文件转换编码之后,结果会像这样,编码改变而内容维持不变。

Big5 转 UTF-8Big5 转 UTF-8

这是使用 with 的写法,跟上面那段代码比较起来,作用完全相同,只不过写法比较简洁。

# 使用 with 的写法
with open("big5_input.txt", "r", encoding = "Big5") as inFile, open("utf8_output.txt", "w", encoding = "UTF-8") as outFile:
    outFile.write(inFile.read())

UTF-8 转 Big5

UTF-8 转 Big5 的程序撰写方式也是一样,只是将编码调换而已,以下是一个简单的范例。

# 打开 UTF-8 输入文件
inFile = open("utf8_input.txt", "r", encoding = "UTF-8")

# 打开 Big5 输出文件
outFile = open("big5_output.txt", "w", encoding = "Big5")

# 以 UTF-8 编码读取文件
content = inFile.read()

# 以 Big5 编码写入文件
outFile.write(content)

# 关闭文件
inFile.close()
outFile.close()

UTF-8 转 Big5UTF-8 转 Big5

参考数据:OpenHome.cc

技术教程

Python字串格式化教程与范例

2022-6-23 13:03:22

技术教程

Python写入文件教程与范例

2022-6-24 15:28:27

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 yp10086@vip.qq.com 举报,一经查实,本站将立刻删除。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索