一些常用需要记忆的数字
郝伟 2022/08/14 10:19:19 Sunday
\b\t\n\v\f\r:; 连续空格转义:
\+数字 为8进制,如 \040 为32,表示空格
\x+数字 为16进制,如 \x30 为48 表示 0.
\u+4位数字 为ANSI码,如 \u90dd 为 郝。
Unicode & Character Encodings in Python: A Painless Guide
文章介绍了在Python中的编码情况,如:
# From lib/python3.7/string.py whitespace = ' \t\n\r\v\f' ascii_lowercase = 'abcdefghijklmnopqrstuvwxyz' ascii_uppercase = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ' ascii_letters = ascii_lowercase + ascii_uppercase digits = '0123456789' hexdigits = digits + 'abcdef' + 'ABCDEF' octdigits = '01234567' punctuation = r"""!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~""" printable = digits + ascii_letters + punctuation + whitespace
UTF-8, UTF-16, UTF-32 & BOM
文章回答了一系列关于三种编码和BOM的问题,非常值得一读。
Latin1
Latin1是ISO-8859-1的别名,也写作Latin-1。ISO-8859-1编码是单字节编码,是ASCII的扩展,其编码范围是0x00-0xFF,其中 0x00-0x7F兼容ASCII(内容完全一致),0x80-0x9F是控制字符,0xA0-0xFF之间是文字符号。
| 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | |
|---|---|---|---|---|---|---|---|---|---|---|
| 10 | 100 | . | . | . | . | . | . | . | . | . |
| 11 | 110 | 121 | . | . | . | . | . | . | . | . |
| 12 | 120 | 132 | 144 | . | . | . | . | . | . | . |
| 13 | 130 | 143 | 156 | 169 | . | . | . | . | . | . |
| 14 | 140 | 154 | 168 | 182 | 196 | . | . | . | . | . |
| 15 | 150 | 165 | 180 | 195 | 210 | 225 | . | . | . | . |
| 16 | 160 | 176 | 192 | 208 | 224 | 240 | 256 | . | . | . |
| 17 | 170 | 187 | 204 | 221 | 238 | 255 | 272 | 289 | . | . |
| 18 | 180 | 198 | 216 | 234 | 252 | 270 | 288 | 306 | 324 | . |
| 19 | 190 | 209 | 228 | 247 | 266 | 285 | 304 | 323 | 342 | 361 |
(10x + 5)^2 = 100x^2 + 100x + 25 = 100x(x+1) + 25
中文编码信息
起止编码:0x4E00 - 0x9FD5
总汉字数:20950个
开始汉字:一
结尾汉字:鿕 (五笔: qgyg)
数值分布在 中的概率为 0.6826, 68.26%.
数值分布在 中的概率为 0.9545, 95.45%.
数值分布在 中的概率为 0.9973, 99.73%.
: 68.26%, : 95.45%, : 99.73%.
| 1 | 2 | 3 | 4 | 5 | . | 6 | 7 | 8 | 9 | 0 | |
|---|---|---|---|---|---|---|---|---|---|---|---|
| - | A | B | C | D | E | . | F | G | H | I | J |
| 00 | 1 | 2 | 3 | 4 | 5 | . | 6 | 7 | 8 | 9 | 0 |
| - | K | L | M | N | O | . | P | Q | R | S | T |
| 10 | 11 | 12 | 13 | 14 | 15 | . | 16 | 17 | 18 | 19 | 20 |
| - | U | V | W | X | Y | . | Z | - | - | - | - |
| 20 | 21 | 22 | 23 | 24 | 25 | . | 26 | - | - | - | - |
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 1 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 2 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 3 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 4 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 5 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 6 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 7 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 8 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| 9 | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| A | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| B | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| C | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| D | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| E | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
| F | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |