博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
汉字的区码和位码
阅读量:6364 次
发布时间:2019-06-23

本文共 442 字,大约阅读时间需要 1 分钟。

写于2016年12月08日。

    汉字的区码和位码:由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。所有的国标汉字与符号组成一个94×94的矩阵。在此方阵中,每一行称为一个"区",每一列称为一个"位",因此,这个方阵实际上组成了一个有94个区(区号分别为1到94)、每个区内有94个位(位号分别为1到94)的汉字字符集。一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号。 在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字 。其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。所以,当我们需要n个任意汉字时,我们不必建一个全部汉字表,而是利用区位码实现常用汉字的提取。

   

转载于:https://www.cnblogs.com/xiangxinhouse/p/6145792.html

你可能感兴趣的文章
vim打开文件后,显示×××
查看>>
ORACLE 数据分析和动态采样
查看>>
Mysql经常出现sleep进程的解决办法
查看>>
Centos7上node.js和go语言的快速安装
查看>>
samba配置实战
查看>>
Groovy入门 | 基础语法
查看>>
oracle database 10.2.0.4 升级到 10.2.0.5
查看>>
11g RAC 更改归档模式 ,归档文件存放在ASM 磁盘组
查看>>
Zabbix安装部署
查看>>
我的友情链接
查看>>
C#获取当前系统信息的类
查看>>
ZooKeeper3.4.6学习笔记(二)简单介绍
查看>>
zabbix6
查看>>
品味、追求、卓越
查看>>
将excel的列索引转换为相应字母。
查看>>
CensOS 6.5 Bind域名解析服务基本配置介绍
查看>>
eclipse 使用tomcat插件及部署tomcat项目
查看>>
Ajax学习笔记-购物车
查看>>
JQuery学习笔记-JQuery的CSS DOM操作
查看>>
AngularJS 字符串-ng-bind
查看>>