字符编码讲解文章:
前端历史课:那些来自洪荒时代的编码知识
JavaScript 有个 Unicode 的天坑
ASCII
编码 | 缩写 | 说明 | 编码 | 字符 | 编码 | 字符 | 编码 | 字符 |
---|---|---|---|---|---|---|---|---|
0 | NUL(null) | 空字符 | 33 | ! | 65 | A | 97 | a |
1 | SOH(start of headline) | 标题开始 | 34 | " | 66 | B | 98 | b |
2 | STX (start of text) | 正文开始 | 35 | # | 67 | C | 99 | c |
3 | ETX (end of text) | 正文结束 | 36 | $ | 68 | D | 100 | d |
4 | EOT (end of transmission) | 传输结束 | 37 | % | 69 | E | 101 | e |
5 | ENQ (enquiry) | 请求 | 38 | & | 70 | F | 102 | f |
6 | ACK (acknowledge) | 收到通知 | 39 | ' | 71 | G | 103 | g |
7 | BEL (bell) | 响铃 | 40 | ( | 72 | H | 104 | h |
8 | BS (backspace) | 退格 | 41 | ) | 73 | I | 105 | i |
9 | HT (horizontal tab) | 水平制表符 | 42 | * | 74 | J | 106 | j |
10 | LF (NL line feed, new line) | 换行键 | 43 | + | 75 | K | 107 | k |
11 | VT (vertical tab) | 垂直制表符 | 44 | , | 76 | L | 108 | l |
12 | FF (NP form feed, new page) | 换页键 | 45 | - | 77 | M | 109 | m |
13 | CR (carriage return) | 回车键 | 46 | . | 78 | N | 110 | n |
14 | SO (shift out) | 不用切换 | 47 | / | 79 | O | 111 | o |
15 | SI (shift in) | 启用切换 | 48 | 0 | 80 | P | 112 | p |
16 | DLE (data link escape) | 数据链路转义 | 49 | 1 | 81 | Q | 113 | q |
17 | DC1 (device control 1) | 设备控制1 | 50 | 2 | 82 | R | 114 | r |
18 | DC2 (device control 2) | 设备控制2 | 51 | 3 | 83 | S | 115 | s |
19 | DC3 (device control 3) | 设备控制3 | 52 | 4 | 84 | T | 116 | t |
20 | DC4 (device control 4) | 设备控制4 | 53 | 5 | 85 | U | 117 | u |
21 | NAK (negative acknowledge) | 拒绝接收 | 54 | 6 | 86 | V | 118 | v |
22 | SYN (synchronous idle) | 同步空闲 | 55 | 7 | 87 | W | 119 | w |
23 | ETB (end of trans. block) | 结束传输块 | 56 | 8 | 88 | X | 120 | x |
24 | CAN (cancel) | 取消 | 57 | 9 | 89 | Y | 121 | y |
25 | EM (end of medium) | 媒介结束 | 58 | : | 90 | Z | 122 | z |
26 | SUB (substitute) | 代替 | 59 | ; | 91 | [ | 123 | { |
27 | ESC (escape) | 换码(溢出) | 60 | < | 92 | \ | 124 | | |
28 | FS (file separator) | 文件分隔符 | 61 | = | 93 | ] | 125 | } |
29 | GS (group separator) | 分组符 | 62 | > | 94 | ^ | 126 | ~ |
30 | RS (record separator) | 记录分隔符 | 63 | ? | 95 | _ | ||
31 | US (unit separator) | 单元分隔符 | 64 | @ | 96 | ` | ||
32 | (space) | 空格 |
GB2312
高位字节范围 0xA1-0xF7 161-247 87
低位字节范围 0xA1-0xFE 161-254 94
8178
GBK
高位字节扩展到了 0×81-0xFE 129-254
低位字节扩展到了 0x40-0xFE(不包含0x7F) 64-254
23940
GB18030
- 字节的值范围: 0 到 0x7F,与 ASCII 兼容。
- 字节的值范围: 高位 0x81 到 0xFE。 低位 0x40 到 0xFE 与 GBK 标准兼容。
- 字节的值范围: 一字节 0x81 到 0xFE,二字节 0x30 到 0x39,三字节 0x81 到 0xFE,四字节从 0x30 到 0x39
emoji
\uE000 - \uEFFF
您的赞助将会支持作者创作及本站运维
发表评论