news 2026/5/23 20:34:56

UnicodeDecodeError: ‘charmap‘ codec can‘t decode byte 0x81 in position 17: character maps to <undefi

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
UnicodeDecodeError: ‘charmap‘ codec can‘t decode byte 0x81 in position 17: character maps to <undefi

目录

    • 问题
    • 原因分析
      • 1. **编码不匹配**
      • 2. **常见场景**
    • 解决方案
      • **方案1:设置正确的字符集连接MySQL**
      • **方案2:Python脚本中的解决方案**
      • **方案3:检查并设置系统环境编码**
      • **方案4:MySQL服务器端配置检查**
      • **方案5:在代码中明确处理编码**
    • 预防措施
    • 调试步骤

问题

连接MySQL服务,查询到结果后,本地解析报错
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 17: character maps to <undefined>

这个错误通常是由于字符编码不一致导致的。

原因分析

1.编码不匹配

  • MySQL服务器使用的字符集(如UTF-8)与本地解码时使用的字符集(如Windows的cp1252、gbk等)不一致
  • 特别是当数据中包含非ASCII字符(如中文、特殊符号)时容易出现

2.常见场景

  • 在Windows系统或某些终端环境中运行Linux命令/脚本
  • MySQL数据包含中文或其他多字节字符
  • 默认编码设置不正确

解决方案

方案1:设置正确的字符集连接MySQL

# 在连接时指定字符集mysql -hhostname-u username -p --default-character-set=utf8mb4 database_name# 或者在查询前设置mysql -hhostname-u username -p mysql>SET NAMES'utf8mb4';mysql>SELECT * FROM table;

方案2:Python脚本中的解决方案

如果使用Python连接MySQL:

importpymysql# 正确设置连接字符集connection=pymysql.connect(host='localhost',user='username',password='password',database='dbname',charset='utf8mb4',cursorclass=pymysql.cursors.DictCursor)# 或者使用mysql-connectorimportmysql.connector conn=mysql.connector.connect(charset='utf8mb4',use_unicode=True,# ... 其他参数)

方案3:检查并设置系统环境编码

# 查看当前系统编码echo$LANGlocale# 设置正确的编码(添加到~/.bashrc或~/.profile)exportLANG=en_US.UTF-8exportLC_ALL=en_US.UTF-8# 临时设置exportPYTHONIOENCODING=utf-8

方案4:MySQL服务器端配置检查

-- 查看当前字符集设置SHOWVARIABLESLIKE'character_set%';SHOWVARIABLESLIKE'collation%';-- 修改表的字符集(如果需要)ALTERTABLEyour_tableCONVERTTOCHARACTERSETutf8mb4COLLATEutf8mb4_unicode_ci;

方案5:在代码中明确处理编码

对于Python脚本:

# 方法1:指定编码打开文件withopen('output.txt','w',encoding='utf-8')asf:f.write(data)# 方法2:手动解码decoded_string=byte_data.decode('utf-8',errors='ignore')# 或 errors='replace'# 方法3:使用编解码器模块importcodecswithcodecs.open('file.txt','r',encoding='utf-8')asf:content=f.read()

预防措施

  1. 统一使用UTF-8/UTF8MB4

    • MySQL连接、表字段、应用程序统一使用utf8mb4
    • 这是最推荐的做法
  2. 检查MySQL配置

    -- 永久修改配置(在my.cnf中)[client]default-character-set=utf8mb4[mysql]default-character-set=utf8mb4[mysqld]character-set-server=utf8mb4 collation-server=utf8mb4_unicode_ci
  3. Python环境设置

    # 在脚本开头添加importsysimportio sys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')

调试步骤

  1. 首先确认MySQL数据的实际编码
  2. 检查连接时的字符集设置
  3. 验证本地环境的编码配置
  4. 逐步测试每个环节的编码转换

建议使用UTF-8系列编码(特别是utf8mb4)作为标准,可以避免大部分字符编码问题。

最后排查下来,上面报错问题原因是连接MySQL 8时,连接参数中字符集使用了’utf-8’ 导致的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/5 19:26:18

如何系统化的学习金融,投资,理财?

系统化学习金融、投资、理财&#xff0c;需要遵循 “搭建知识框架→夯实理论基础→实践验证迭代→优化思维体系” 的逻辑路径&#xff0c;三者环环相扣&#xff0c;缺一不可。以下是分阶段的详细学习方案&#xff0c;兼顾理论深度与实操性&#xff1a;一、 第一阶段&#xff1a…

作者头像 李华
网站建设 2026/5/12 20:48:48

传统ChatBot四大瓶颈与AgenticRAG完整认知闭环:工业级开发实践

传统ChatBot因架构认知局限难以实现生产级可靠性。AgenticRAG通过理解推理验证实现完整认知闭环&#xff0c;Agent作为AI应用层操作系统决定应用可靠性与复杂度上限。深蓝学院开设工业级RAG系统与Agent应用开发实战课程&#xff0c;由商汤科技专家授课&#xff0c;帮助学员从Pr…

作者头像 李华
网站建设 2026/5/23 7:35:41

【柔性作业车间调度问题FJSP】基于部落竞争与成员合作算法CTCM求解柔性作业车间调度问题(FJSP)研究附Matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。&#x1f34e; 往期回顾关注个人主页&#xff1a;Matlab科研工作室&#x1f34a;个人信条&#xff1a;格物致知,完整Matlab代码及仿真咨询…

作者头像 李华
网站建设 2026/5/21 15:00:16

SpringBoot - yml配置文件

SpringBoot使用一个全局配置文件&#xff0c;配置文件名固定&#xff1a; application.propertiesapplication.yml application.properties端口设置8081&#xff0c;application.yml端口设置8082&#xff0c;运行启动类&#xff0c;优先走8081。 两个配置文件互补&#xff0c;a…

作者头像 李华