字符编码

字符编码讲解文章:


前端历史课:那些来自洪荒时代的编码知识
JavaScript 有个 Unicode 的天坑


ASCII

编码 缩写 说明 编码 字符 编码 字符 编码 字符
0 NUL(null) 空字符 33 ! 65 A 97 a
1 SOH(start of headline) 标题开始 34 " 66 B 98 b
2 STX (start of text) 正文开始 35 # 67 C 99 c
3 ETX (end of text) 正文结束 36 $ 68 D 100 d
4 EOT (end of transmission) 传输结束 37 % 69 E 101 e
5 ENQ (enquiry) 请求 38 & 70 F 102 f
6 ACK (acknowledge) 收到通知 39 ' 71 G 103 g
7 BEL (bell) 响铃 40 ( 72 H 104 h
8 BS (backspace) 退格 41 ) 73 I 105 i
9 HT (horizontal tab) 水平制表符 42 * 74 J 106 j
10 LF (NL line feed, new line) 换行键 43 + 75 K 107 k
11 VT (vertical tab) 垂直制表符 44 , 76 L 108 l
12 FF (NP form feed, new page) 换页键 45 - 77 M 109 m
13 CR (carriage return) 回车键 46 . 78 N 110 n
14 SO (shift out) 不用切换 47 / 79 O 111 o
15 SI (shift in) 启用切换 48 0 80 P 112 p
16 DLE (data link escape) 数据链路转义 49 1 81 Q 113 q
17 DC1 (device control 1) 设备控制1 50 2 82 R 114 r
18 DC2 (device control 2) 设备控制2 51 3 83 S 115 s
19 DC3 (device control 3) 设备控制3 52 4 84 T 116 t
20 DC4 (device control 4) 设备控制4 53 5 85 U 117 u
21 NAK (negative acknowledge) 拒绝接收 54 6 86 V 118 v
22 SYN (synchronous idle) 同步空闲 55 7 87 W 119 w
23 ETB (end of trans. block) 结束传输块 56 8 88 X 120 x
24 CAN (cancel) 取消 57 9 89 Y 121 y
25 EM (end of medium) 媒介结束 58 : 90 Z 122 z
26 SUB (substitute) 代替 59 ; 91 [ 123 {
27 ESC (escape) 换码(溢出) 60 < 92 \ 124 |
28 FS (file separator) 文件分隔符 61 = 93 ] 125 }
29 GS (group separator) 分组符 62 > 94 ^ 126 ~
30 RS (record separator) 记录分隔符 63 ? 95 _
31 US (unit separator) 单元分隔符 64 @ 96 `
32 (space) 空格

GB2312

高位字节范围 0xA1-0xF7 161-247 87
低位字节范围 0xA1-0xFE 161-254 94
8178

GBK

高位字节扩展到了 0×81-0xFE 129-254
低位字节扩展到了 0x40-0xFE(不包含0x7F) 64-254
23940

GB18030

  • 字节的值范围: 0 到 0x7F,与 ASCII 兼容。
  • 字节的值范围: 高位 0x81 到 0xFE。 低位 0x40 到 0xFE 与 GBK 标准兼容。
  • 字节的值范围: 一字节 0x81 到 0xFE,二字节 0x30 到 0x39,三字节 0x81 到 0xFE,四字节从 0x30 到 0x39

emoji

\uE000 - \uEFFF

您的赞助将会支持作者创作及本站运维

发表评论


TOP