当前位置: 首页 > news >正文

unicode减肥计划

程序员小王发现,unicode 16.0 有接近16万个符号,这太多了。如果想减少符号数量,就要拆分汉字。同理,韩语字符如果拆分了,就不会有一万多个,只有几十个。
对“逛”这个字进行拆分:
逛→犬字旁(在左) + 王 + 走之底(在下)
需要一个栈,犬字旁、王、走之底,依次入栈。
首先是犬字旁,它后边期待一个项目。
然后王出现,刚好是一个项目,它和犬字旁结合。
之后走之底入栈,它期待左边有一个项目,此时,栈内的信息是“狂”,是由两个项目组合而成的,狂和走之底结合,生成“逛”。
实际上,栈内元素是一棵棵树。抓住树的根节点,进行栈操作,即可完成用字根组成汉字的任务。
知道上述规律之后,小王继续努力,终于完成了新版unicode的制定,符号数降至4万多。
这就是“unicode减肥计划”。
然后出现了意外,遇到一个字:左边一个单人旁,右边一个“达”字。在栈上,无法正确表达这个字!
出现问题就要解决问题。上述问题的根源在于,单人旁是个前缀,它右边的内容放在栈的后边;走之底是个后缀,它包含的内容放在栈的前边。前缀和后缀混合出现,导致了混乱。
把走之底也变成前缀即可。
栈上的内容:单人旁 走之底 大
单人旁期待右边有一个项目,一看是走之底,走之底也期待右边有一个项目,是“大”。至此,这个汉字表示完毕。
用变成前缀的走之底重新编码“逛”字:
逛→走之底 + 犬字旁 + 王
入栈的顺序与汉字的书写笔画不同了,没办法,只能这样。

相关文章:

  • Cohen–Grossberg神经网络
  • 提升集装箱及金属包装容器制造交付效率:数字化项目管理系统的核心优势
  • 中国北方GNSS业务站网积雪深度数据集(GSnow-CHINA v1.0, 12h/24h, 2013-2...
  • 【数据结构】 优先级队列 —— 堆
  • 【MySQL进阶】MySQL程序
  • TrOCR模型微调
  • LDStega论文阅读笔记
  • 阿里云可观测 2025 年 5 月产品动态
  • 【每日likou】704. 二分查找 27. 移除元素 977.有序数组的平方
  • docker-compose搭建eureka-server和zipkin
  • asio之静态互斥量
  • ubuntu22 arm 编译安装input leap
  • 20250611让NanoPi NEO core开发板在Ubuntu core16.04系统下开机自启动的时候拉高GPIOG8
  • NumPy 2.x 完全指南【二十五】记录数组
  • 建站新手:我与SiteServerCMS的爱恨情仇(三)
  • 【c++八股文】Day2:虚函数表和虚函数表指针
  • RPC启动机制及注解实现
  • day 50
  • 0:0 error Parsing error: Cannot read properties of undefined (reading ‘map‘)
  • Rust 学习笔记:通过异步实现并发
  • 上海加盟网网站建设/模板建站平台
  • 做任务网站/seo推广费用
  • 游戏类企业网站模板/软件关键词排名
  • 深圳网站建设联系方式/关键词如何确定
  • 东莞电商建站/详细的营销推广方案
  • 遵化建行网站/俄罗斯搜索引擎yandex