当前位置: 首页 > news >正文

中文编码,GB系列,UTF

在这里插入图片描述

图片来源:https://zhuanlan.zhihu.com/p/701690894

文章目录

    • ASCII
    • GB系列编码
    • UTF编码

ASCII

American Standard Code for Information Interchange

一个字节,但其实只用了一半: 128个字符

在这里插入图片描述

GB系列编码

“国标”

和ASCII是兼容的。

  • GB2312:早期标准,包含简体中文常用汉字约6700个。它是为简体中文用户设计的。每个字符 2 byte (2^16 = FFFF = 65536)
  • GBK:扩展了GB2312,包含了繁体字、更多的汉字和符号,基本上覆盖了所有常用汉字。 2 byte
  • GB18030:国家强制标准,是对GBK的进一步扩展,能完整表示Unicode中的所有字符,支持中日韩等东亚文字,是目前中文Windows系统默认编码之一。

兼容性:

在这里插入图片描述

UTF编码

Unicode Transformation Format

  • UTF-8:全球使用最广泛的编码方式,支持所有语言字符,兼容ASCII。中文在UTF-8中通常用3个字节表示一个汉字。
    最高位起始连续1决定该字是几字节编码:
    在这里插入图片描述

  • UTF-16:每个字符使用2个字节(或者4个字节)表示,空间效率高但不兼容ASCII。

  • UTF-32:每个字符固定使用4个字节,使用简单但空间占用大。

相关文章:

  • 正则表达式使用知识(日常翻阅)
  • 基于频率约束条件的最小惯量需求评估,包括频率变化率ROCOF约束和频率最低点约束matlab/simulink
  • 探索 Rust 语言:高效、安全与并发的完美融合
  • hashcode() equals()
  • 如何使用阿里云邮件推送免费群发邮件
  • 基本命令题与答案
  • 3 VS Code 配置优化与实用插件推荐:settings.json 详解、CodeGeeX 智能编程助手及插件离线安装方法
  • 企业经营决策风险
  • 在人工智能与计算机技术融合的框架下探索高中教育数字化教学模式的创新路径
  • 系统的安全及应用
  • 【数字电路】第四章 组合逻辑电路
  • 门极驱动器DRV8353M设计(二)
  • 问题 | 针对SSM(Spring + Spring MVC + MyBatis)框架的去Spring MVC强化版学习路线
  • 本地缓存方案Guava Cache
  • 《MySQL是怎样运行的》总结笔记
  • vue入门:template 和 JSX
  • jupyter4.4安装使用
  • 器件封装-2025.4.13
  • 【李宏毅深度学习——回归模型的PyTorch架构】Homework 1:COVID-19 Cases Prediction (Regression)
  • 【深拷贝、浅拷贝】golang函数参数传递,变量复制后,操作变量参数,是否影响原有数据?全面解析
  • 美国长滩港货运量因关税暴跌三成,港口负责人:货架要空了
  • 第四轮伊美核谈判将于11日在阿曼举行
  • 习近平会见古巴国家主席迪亚斯-卡内尔
  • 教育部、国家发改委联合启动实施教师教育能力提升工程
  • 司法部谈民营经济促进法:对违规异地执法问题作出禁止性规定
  • 媒体起底“速成洋文凭”灰产链,专家:我们要给学历“祛魅”