1、区位码编码
1980年,为了使每个汉字有一个全国统一的代码,我国颁布了第一个汉字编码 的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内全部汉字系统的统一标准。
国标码是一个四位十六进制数,区位码是一个四位的十进制数,每一个国标码或区位码都对应着一个惟一的汉字或符号,但由于十六进制数咱们不多用到,因此你们经常使用的是区位码,它的前两位叫作区码,后两位叫作位码。
汉字库分布状况以下:
一级汉字 16-55区
二级汉字 56-87区
三级汉字 1-9区
空闲未用 10-15区
一般,在DOS下的各汉字系统中,同时按Alt键和F1键便可调用区位码输入方法。而在Windows中经常使用Ctrl+空格键和Ctrl+Shift键调出区位码。如“2901”表明“健”字,“4582”表明“万”字,“8150”表明“楮”字,这些都是汉字,用区位码还能够很轻松地输入特殊符号,好比,“0189”表明“※”(符号),“0528”表明“ゼ”(日本语),“0711”表明“Й”(俄文),“0949”表明“┭”(制表符)。
在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最经常使用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列), 在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住所有区位码是至关困难的,常使用于录入特殊符号,如制表符、希腊字母等,这里简单介绍几个区。
spa
区号:01 【各种符号】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0100 、 。 · ˉ ˇ ¨ 〃 々 - ~ ‖ … ' ' " " 〔 〕
0120 〈 〉 《 》 「 」『 』 〖 〗 【 】 ± × ÷ ∶ ∧ ∨ ∑ ∏
0140 ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠ ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯
0160 ≤ ≥ ∞ ∵ ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★
0180 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓
区号:02 【各种数字】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0200 ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ ⒈ ⒉ ⒊
0220 ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖ ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶
0240 ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾ ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③
0260 ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩ 一 二 三 四 五 六 七 八 九 十
0280 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ
区号:03 【符号、字母】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0300 ! " # ¥ % & '( ) * + , - . / 0 1 2 3
0320 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G
0340 H I J K L M N O P Q R S T U V W X Y Z [
0360 \ ] ^ _ ` a b c d e f g h i j k l m n o
0380 p q r s t u v w x y z { | }  ̄
区号:06 【罗马字母】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0600 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ
0620Υ Φ Χ Ψ Ω α β γ δ ε ζ η
0640θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω
0660 0680
区号:08 【汉语拼音】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0800 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ ò ū ú ǔ
0820 ù ǖ ǘ ǚ ǜ ü ê ㄅ ㄆ ㄇ
0840 ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ
0860 ㄜ ㄝ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ ㄧ ㄨ ㄩ
0880
区号:09 【制表字符】
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0900 ─ ━ │ ┃ ┄ ┅ ┆ ┈ ┉ ┉ ┊ ┋ ┌ ┍ ┎ ┏
0920 ┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ ┚ ┛ ├ ┝ ┞ ┟ ┠ ┡ ┢ ┣
0940 ┤ ┥ ┦ ┧ ┨ ┩ ┪ ┫ ┬ ┭ ┮ ┯ ┰ ┱ ┲ ┳ ┴ ┵ ┶ ┷
0960 ┸ ┹ ┺ ┻ ┼ ┽ ┾ ┿ ╀ ╁ ┃ ╃ ╄ ╅ ╆ ╇ ╈ ╉ ╊ ╋
0980htm
2、机外码get
机外码 目前经常使用的机外码主要有区位码,国标码,首尾码,拼音码,五笔字型等it
3、国标码基础
中国国家标准汉字信息交换码file
2、区位码、国标码、机内码方法
汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操做系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,无论是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各类处理。技术
汉字在计算机内部其内码是惟一的。由于汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。
GB码的机内码为二字节长的代码,它是在相应GB码的每一个字节最高位上加“1”,即
汉字机内码=汉字国标码+8080H
例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。
汉字机内码的基础是汉字国标码。
机内码:为了不ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每一个字节高位置1做为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具备极简单的对应关系。
汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20H获得对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H获得对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H获得对应的机内码。
举例:机内码位BEDF,求区位码?
有两种解法:1.BEDFH-A0A0H=1E3FH=7743D;
2.BEDFH-8080H=3E5FH(国标码),3E5FH-2020H=1E3FH=7743D