Cyrillic Codepages
Crosstable
Сводная таблица символов
в популярных кириллических кодировках
Символ |
DOS |
KOI |
WIN |
MAC |
ISO |
Unicode |
Unicode 2.0 Name |
Русские буквы |
|||||||
А |
80 |
E1 |
C0 |
80 |
B0 |
U+0410 |
Capital Letter A |
Б |
81 |
E2 |
C1 |
81 |
B1 |
U+0411 |
Capital Letter Be |
В |
82 |
F7 |
C2 |
82 |
B2 |
U+0412 |
Capital Letter Ve |
Г |
83 |
E7 |
C3 |
83 |
B3 |
U+0413 |
Capital Letter Ghe |
Д |
84 |
E4 |
C4 |
84 |
B4 |
U+0414 |
Capital Letter De |
Е |
85 |
E5 |
C5 |
85 |
B5 |
U+0415 |
Capital Letter Ie |
Ж |
86 |
F6 |
C6 |
86 |
B6 |
U+0416 |
Capital Letter Zhe |
З |
87 |
FA |
C7 |
87 |
B7 |
U+0417 |
Capital Letter Ze |
И |
88 |
E9 |
C8 |
88 |
B8 |
U+0418 |
Capital Letter I |
Й |
89 |
EA |
C9 |
89 |
B9 |
U+0419 |
Capital Letter Short I |
К |
8A |
EB |
CA |
8A |
BA |
U+041A |
Capital Letter Ka |
Л |
8B |
EC |
CB |
8B |
BB |
U+041B |
Capital Letter El |
М |
8C |
ED |
CC |
8C |
BC |
U+041C |
Capital Letter Em |
Н |
8D |
EE |
CD |
8D |
BD |
U+041D |
Capital Letter En |
О |
8E |
EF |
CE |
8E |
BE |
U+041E |
Capital Letter O |
П |
8F |
F0 |
CF |
8F |
BF |
U+041F |
Capital Letter Pe |
Р |
90 |
F2 |
D0 |
90 |
C0 |
U+0420 |
Capital Letter Er |
С |
91 |
F3 |
D1 |
91 |
C1 |
U+0421 |
Capital Letter Es |
Т |
92 |
F4 |
D2 |
92 |
C2 |
U+0422 |
Capital Letter Te |
У |
93 |
F5 |
D3 |
93 |
C3 |
U+0423 |
Capital Letter U |
Ф |
94 |
E6 |
D4 |
94 |
C4 |
U+0424 |
Capital Letter Ef |
Х |
95 |
E8 |
D5 |
95 |
C5 |
U+0425 |
Capital Letter Ha |
Ц |
96 |
E3 |
D6 |
96 |
C6 |
U+0426 |
Capital Letter Tse |
Ч |
97 |
FE |
D7 |
97 |
C7 |
U+0427 |
Capital Letter Che |
Ш |
98 |
FB |
D8 |
98 |
C8 |
U+0428 |
Capital Letter Sha |
Щ |
99 |
FD |
D9 |
99 |
C9 |
U+0429 |
Capital Letter Shcha |
Ъ |
9A |
FF |
DA |
9A |
CA |
U+042A |
Capital Letter Hard Sign |
Ы |
9B |
F9 |
DB |
9B |
CB |
U+042B |
Capital Letter Yeru |
Ь |
9C |
F8 |
DC |
9C |
CC |
U+042C |
Capital Letter Soft Sign |
Э |
9D |
FC |
DD |
9D |
CD |
U+042D |
Capital Letter E |
Ю |
9E |
E0 |
DE |
9E |
CE |
U+042E |
Capital Letter Yu |
Я |
9F |
F1 |
DF |
9F |
CF |
U+042F |
Capital Letter Ya |
а |
A0 |
C1 |
E0 |
E0 |
D0 |
U+0430 |
Small Letter A |
б |
A1 |
E2 |
E1 |
E1 |
D1 |
U+0431 |
Small Letter Be |
в |
A2 |
F7 |
E2 |
E2 |
D2 |
U+0432 |
Small Letter Ve |
г |
A3 |
E7 |
E3 |
E3 |
D3 |
U+0433 |
Small Letter Ghe |
д |
A4 |
E4 |
E4 |
E4 |
D4 |
U+0434 |
Small Letter De |
е |
A5 |
E5 |
E5 |
E5 |
D5 |
U+0435 |
Small Letter Ie |
ж |
A6 |
F6 |
E6 |
E6 |
D6 |
U+0436 |
Small Letter Zhe |
з |
A7 |
FA |
E7 |
E7 |
D7 |
U+0437 |
Small Letter Ze |
и |
A8 |
E9 |
E8 |
E8 |
D8 |
U+0438 |
Small Letter I |
й |
A9 |
EA |
E9 |
E9 |
D9 |
U+0439 |
Small Letter Short I |
к |
AA |
EB |
EA |
EA |
DA |
U+043A |
Small Letter Ka |
л |
AB |
EC |
EB |
EB |
DB |
U+043B |
Small Letter El |
м |
AC |
ED |
EC |
EC |
DC |
U+043C |
Small Letter Em |
н |
AD |
EE |
ED |
ED |
DD |
U+043D |
Small Letter En |
о |
AE |
EF |
EE |
EE |
DE |
U+043E |
Small Letter O |
п |
AF |
F0 |
EF |
EF |
DF |
U+043F |
Small Letter Pe |
р |
E0 |
F2 |
F0 |
F0 |
E0 |
U+0440 |
Small Letter Er |
с |
E1 |
F3 |
F1 |
F1 |
E1 |
U+0441 |
Small Letter Es |
т |
E2 |
F4 |
F2 |
F2 |
E2 |
U+0442 |
Small Letter Te |
у |
E3 |
F5 |
F3 |
F3 |
E3 |
U+0443 |
Small Letter U |
ф |
E4 |
E6 |
F4 |
F4 |
E4 |
U+0444 |
Small Letter Ef |
х |
E5 |
E8 |
F5 |
F5 |
E5 |
U+0445 |
Small Letter Ha |
ц |
E6 |
E3 |
F6 |
F6 |
E6 |
U+0446 |
Small Letter Tse |
ч |
E7 |
FE |
F7 |
F7 |
E7 |
U+0447 |
Small Letter Che |
ш |
E8 |
FB |
F8 |
F8 |
E8 |
U+0448 |
Small Letter Sha |
щ |
E9 |
FD |
F9 |
F9 |
E9 |
U+0449 |
Small Letter Shcha |
ъ |
EA |
FF |
FA |
FA |
EA |
U+044A |
Small Letter Hard Sign |
ы |
EB |
F9 |
FB |
FB |
EB |
U+044B |
Small Letter Yeru |
ь |
EC |
F8 |
FC |
FC |
EC |
U+044C |
Small Letter Soft Sign |
э |
ED |
FC |
FD |
FD |
ED |
U+044D |
Small Letter E |
ю |
EE |
E0 |
FE |
FE |
EE |
U+044E |
Small Letter Yu |
я |
EF |
F1 |
FF |
DF |
EF |
U+044F |
Small Letter Ya |
Ё |
F0 |
B3 |
A8 |
DD |
F1 |
U+0401 |
Capital Io |
ё |
F1 |
A3 |
B8 |
DE |
F1 |
U+0451 |
Small Io |
Кириллица из нерусских славянских языков |
|||||||
Ђ |
— |
— |
80 |
AB |
A2 |
U+0402 |
Capital Dje |
Ѓ |
*83 Г |
*E7 Г |
81 |
AE |
A3 |
U+0403 |
Capital Gje |
Є |
F2 |
— |
AA |
B8 |
A4 |
U+0404 |
Capital Ukrainian Ie |
Ѕ |
*53 S |
*53 S |
BD |
C1 |
A5 |
U+0405 |
Capital Dze |
І |
*49 I |
*49 I |
B2 |
A7 |
A6 |
U+0406 |
Capital Byelorussian-Ukrainian I |
Ї |
F4 |
— |
AF |
BA |
A7 |
U+0407 |
Capital Yi |
Ј |
*4A J |
*4A J |
A3 |
B7 |
A8 |
U+0408 |
Serbian Capital Je |
Љ |
— |
— |
8A |
BC |
A9 |
U+0409 |
Serbian Capital Lje |
Њ |
— |
— |
8C |
BE |
AA |
U+040A |
Serbian Capital Nje |
Ћ |
— |
— |
8E |
CB |
AB |
U+040B |
Serbian Capital Tshe |
Ќ |
*8A К |
*EB К |
8D |
CD |
AC |
U+040C |
Capital Kje |
Ў |
F6 |
— |
A1 |
D8 |
AE |
U+040E |
Capital Short U |
Џ |
— |
— |
8F |
DA |
AF |
U+040F |
Serbian Capital Dzhe |
ђ |
— |
— |
90 |
AC |
F2 |
U+0452 |
Serbian Small Dje |
ѓ |
*A3 г |
*C7 г |
83 |
AF |
F3 |
U+0453 |
Small Gje |
є |
F3 |
— |
BA |
B9 |
F4 |
U+0454 |
Small Ukrainian Ie |
ѕ |
*73 s |
*73 s |
BE |
CF |
F5 |
U+0455 |
Small Dze |
і |
*69 i |
*69 i |
B3 |
B4 |
F6 |
U+0456 |
Small Byelorussian-Ukrainian I |
ї |
F5 |
— |
BF |
BB |
F7 |
U+0457 |
Small Yi |
ј |
*6A j |
*6A j |
BC |
C0 |
F8 |
U+0458 |
Serbian Small Je |
љ |
— |
— |
9A |
BD |
F9 |
U+0459 |
Serbian Small Lje |
|
— |
— |
9C |
BF |
FA |
U+045A |
Serbian Small Nje |
ћ |
— |
— |
9E |
CC |
FB |
U+045B |
Serbian Small Tshe |
ќ |
*AA К |
*CB К |
9D |
CE |
FC |
U+045C |
Small Kje |
ў |
F7 |
— |
A2 |
D9 |
FE |
U+045E |
Small Short U |
џ |
— |
|
9F |
DB |
FF |
U+045F |
Serbian Small Dzhe |
Ґ |
*83 Г |
*E7 Г |
A5 |
A2 |
*B3 Г |
U+0490 |
Capital Ghe With Upturn |
ґ |
*A3 г |
*C7 г |
B4 |
B6 |
*D3 г |
U+0491 |
Small Ghe With Upturn |
Знаки (преимущественно Windows/Mac) |
|||||||
(No-Break Space) |
*FF |
9A |
A0 |
CA |
A0 |
U+00A0 |
No-Break Space |
|
*20 Sp |
*20 Sp |
AD |
*20 Sp |
AE |
U+00AD |
Soft Hyphen |
¤ |
FD |
— |
A4 |
FF ? |
— |
U+00A4 |
Currency Sign |
¦ |
*B3 ³ |
*83 ³ |
A6 |
— |
— |
U+00A6 |
Broken Bar |
§ |
*15 § |
*15 § |
A7 |
A4 |
FD |
U+00A7 |
Section Sign |
© |
FC |
BF |
A9 |
A9 |
*43 C |
U+00A9 |
Copyright Sign |
« |
*3C < |
*3C < |
AB |
C7 |
*3C < |
U+00AB |
Left-Pointing Double Angle Quotation Mark |
¬ |
*2D - |
*2D - |
AC |
C2 |
*2D - |
U+00AC |
Not Sign |
® |
*52 R |
*52 R |
AE |
A8 |
*52 R |
U+00AE |
Registered Sign |
° |
F8 |
9C |
B0 |
A1 |
— |
U+00B0 |
Degree Sign |
± |
*2B + |
*2B + |
B1 |
B1 |
*2B + |
U+00B1 |
Plus-Minus Sign |
ý |
FD |
9D |
— |
— |
— |
U+00B2 |
Superscript Two |
µ |
*E7 ч |
*DE ч |
B5 |
B5 |
*E7 ч |
U+00B5 |
Micro Sign |
¶ |
— |
— |
B6 |
A6 |
— |
U+00B6 |
Pilcrow Sign |
· |
FA |
9E |
B7 |
*2E . |
*2E . |
U+00B7 or 2219 |
Middle Dot or Bullet Operator |
» |
*3E > |
*3E > |
BB |
C8 |
*3E > |
U+00BB |
Right-Pointing Double Angle Quotation Mark |
ö |
F6 |
9F |
— |
D6 |
— |
U+00F7 |
Division Sign |
– |
*2D - |
*2D - |
96 |
D0 |
*2D - |
U+2013 |
En Dash |
— |
*2D - |
*2D - |
97 |
D1 |
*2D - |
U+2014 |
Em Dash |
‘ |
*27 ' |
*27 ' |
91 |
D4 |
*27 ' |
U+2018 |
Left Single Quotation Mark |
’ |
*27 ' |
*27 ' |
92 |
D5 |
*27 ' |
U+2019 |
Right Single Quotation Mark |
‚ |
*27 ' |
*27 ' |
82 |
*27 ' |
*27 ' |
U+201A |
Single Low-9 Quotation Mark |
“ |
*22 " |
*22 " |
93 |
D2 |
*22 " |
U+201C |
Left Double Quotation Mark |
” |
*22 " |
*22 " |
94 |
D3 |
*22 " |
U+201D |
Right Double Quotation Mark |
„ |
*22 " |
*22 " |
84 |
D7 |
*22 " |
U+201E |
Double Low-9 Quotation Mark |
† |
*C5 Å |
*8A Å |
86 |
A0 |
— |
U+2020 |
Dagger |
‡ |
*D8 Ø |
*BC Ø |
87 |
— |
— |
U+2021 |
Double Dagger |
• |
F9 |
95 |
95 |
A5 |
— |
U+2022 or 2219 |
Bullet or Bullet Operator |
… |
*3A : |
*3A : |
85 |
C9 |
— |
U+2026 |
Horizontal Ellipsis |
‰ |
*25 % |
*25 % |
89 |
*25 % |
*25 % |
U+2030 |
Per Mille Sign |
‹ |
*3C < |
*3C < |
8B |
*3C < |
*3C < |
U+2039 |
Single Left-Pointing Angle Quotation Mark |
|
*3E > |
*3E > |
9B |
*3E > |
*3E > |
U+203A |
Single Right-Pointing Angle Quotation Mark |
№ |
FC |
— |
B9 |
DC |
F0 |
U+2116 |
Numero Sign |
™ |
*54 T |
*54 T |
99 |
AA |
*54 T |
U+2122 |
Trade Mark Sign |
Знаки, специфичные для DOS/KOI8-R |
|||||||
û |
FB |
96 |
*76 v |
C3 |
*76 v |
U+221A |
Square Root |
÷ |
F7 |
97 |
— |
C5 |
— |
U+2248 |
Almost Equal To |
ó |
F3 |
98 |
— |
B2 |
— |
U+2264 |
Less-Than Or Equal To |
ò |
F2 |
99 |
— |
B3 |
— |
U+2265 |
Greater-Than Or Equal To |
ô |
F4 |
93 |
— |
— |
— |
U+2320 |
Top Half Integral |
õ |
F5 |
9B |
— |
— |
— |
U+2321 |
Bottom Half Integral |
þ |
FE |
94 |
— |
CA ? |
— |
U+25A0 |
Black Square |
Знаки, специфичные для Mac |
|||||||
£ |
*4C L |
*4C L |
*4C L |
A3 |
*4C L |
U+00A3 |
Pound Sign |
¦ |
*66 f |
*66 f |
*66 f |
C4 |
*66 f |
U+0192 |
Latin Small Letter F With Hook |
D |
— |
— |
— |
C6 |
— |
U+2206 |
Increment |
¥ |
— |
— |
— |
B0 |
— |
U+221E |
Infinity |
¹ |
*23 # |
*23 # |
*23 # |
AD |
*23 # |
U+2260 |
Not Equal To |
Псевдографика (DOS/KOI8-R/ГОСТ) |
|||||||
° |
B0 |
90 |
*20 Sp or *2D - |
*20 Sp or *2D - |
9B |
U+2591 |
Light Shade |
± |
B1 |
91 |
*20 Sp or *2D - |
*20 Sp or *2D - |
9C |
U+2592 |
Medium Shade |
² |
B2 |
92 |
*20 Sp or *2D - |
*20 Sp or *2D - |
9D |
U+2593 |
Dark Shade |
³ |
B3 |
81 |
*A6 ¦ |
*7C | |
A5 |
U+2502 |
Box Drawings Light Vertical |
´ |
B4 |
87 |
*A6 ¦ |
*7C | |
A7 |
U+2524 |
Box Drawings Light Vertical And Left |
µ |
B5 |
B2 |
*A6 ¦ |
*7C | |
83 |
U+2561 |
Box Drawings Vertical Single And Left Double |
¶ |
B6 |
B4 |
*A6 ¦ |
*7C | |
84 |
U+2562 |
Box Drawings Vertical Double And Left Single |
· |
B7 |
A7 |
*2B + or *AC ¬ |
*2B + or *C2 ¬ |
85 |
U+2556 |
Box Drawings Down Double And Left Single |
¸ |
B8 |
A6 |
*2B + or AC ¬ |
*2B + or *C2 ¬ |
86 |
U+2555 |
Box Drawings Down Single And Left Double |
¹ |
B9 |
B5 |
*A6 ¦ |
*7C | |
97 |
U+2563 |
Box Drawings Double Vertical And Left |
º |
BA |
A1 |
*A6 ¦ |
*7C | |
95 |
U+2551 |
Box Drawings Double Vertical |
» |
BB |
A8 |
*2B + or *AC ¬ |
*2B + or *C2 ¬ |
91 |
U+2557 |
Box Drawings Double Down And Left |
¼ |
BC |
AE |
*2B + |
*2B + |
92 |
U+255D |
Box Drawings Double Up And Left |
½ |
BD |
AD |
*2B + |
*2B + |
8B |
U+255C |
Box Drawings Up Double And Left Single |
¾ |
BE |
AC |
*2B + |
*2B + |
8C |
U+255B |
Box Drawings Up Single And Left Double |
¿ |
BF |
83 |
*2B + or *AC ¬ |
*2B + or *C2 ¬ |
A1 |
U+2510 |
Box Drawings Light Down And Left |
À |
C0 |
84 |
*2B + or *4C L |
*2B + or *4C L |
A3 |
U+2514 |
Box Drawings Light Up And Right |
Á |
C1 |
89 |
*2D - |
*2D - |
A8 |
U+2534 |
Box Drawings Light Up And Horizontal |
 |
C2 |
88 |
*2D - or *54 T |
*2D - or *54 T |
A6 |
U+252C |
Box Drawings Light Down And Horizontal |
à |
C3 |
86 |
*2B + |
*2B + |
A9 |
U+251C |
Box Drawings Light Vertical And Right |
Ä |
C4 |
80 |
*2D - |
*2D - |
A4 |
U+2500 |
Box Drawings Light Horizontal |
Å |
C5 |
8A |
*2B + |
*2B + |
AA |
U+253C |
Box Drawings Light Vertical And Horizontal |
Æ |
C6 |
AF |
*A6 ¦ |
*7C | |
8D |
U+255E |
Box Drawings Vertical Single And Right Double |
Ç |
C7 |
B0 |
*A6 ¦ |
*7C | |
8E |
U+255F |
Box Drawings Vertical Double And Right Single |
È |
C8 |
AB |
*2B + or *4C L |
*2B + or *4C L |
93 |
U+255A |
Box Drawings Double Up And Right |
É |
C9 |
A5 |
*2B + or *E3 г |
*2B + or *E3 г |
90 |
U+2554 |
Box Drawings Double Down And Right |
Ê |
CA |
BB |
*2D - |
*2D - |
98 |
U+2569 |
Box Drawings Double Up And Horizontal |
Ë |
CB |
B8 |
*2D - or *54 T |
*2D - or *54 T |
96 |
U+2566 |
Box Drawings Double Down And Horizontal |
Ì |
CC |
B1 |
*A6 ¦ |
*7C | |
99 |
U+2560 |
Box Drawings Double Vertical And Right |
Í |
CD |
A0 |
*2D - or *3D = |
*2D - or *3D = |
94 |
U+2550 |
Box Drawings Double Horizontal |
Î |
CE |
BE |
*2B + |
*2B + |
9A |
U+256C |
Box Drawings Double Vertical And Horizontal |
Ï |
CF |
B9 |
*2D - |
*2D - |
80 |
U+2567 |
Box Drawings Up Single And Horizontal Double |
Ð |
D0 |
BA |
*2D - |
*2D - |
81 |
U+2568 |
Box Drawings Up Double And Horizontal Single |
Ñ |
D1 |
B6 |
*2D - or *54 T |
*2D - or *54 T |
82 |
U+2564 |
Box Drawings Down Single And Horizontal Double |
Ò |
D2 |
B7 |
*2D - or *54 T |
*2D - or *54 T |
87 |
U+2565 |
Box Drawings Down Double And Horizontal Single |
Ó |
D3 |
AA |
*2B + or *4C L |
*2B + or *4C L |
88 |
U+2559 |
Box Drawings Up Double And Right Single |
Ô |
D4 |
A9 |
*2B + or *4C L |
*2B + or *4C L |
89 |
U+2558 |
Box Drawings Up Single And Right Double |
Õ |
D5 |
A2 |
*2B + |
*2B + |
8A |
U+2552 |
Box Drawings Down Single And Right Double |
Ö |
D6 |
A4 |
*2B +or *E3 г |
*2B + or *E3 г |
8F |
U+2553 |
Box Drawings Down Double And Right Single |
× |
D7 |
BD |
*2B + |
*2B + |
9E |
U+256B |
Box Drawings Vertical Double And Horizontal Single |
Ø |
D8 |
BC |
*2B + |
*2B + |
9F |
U+256A |
Box Drawings Vertical Single And Horizontal Double |
Ù |
D9 |
85 |
*2B + |
*2B + |
A2 |
U+2518 |
Box Drawings Light Up And Left |
Ú |
DA |
82 |
*2B + |
*2B + |
A0 |
U+250C |
Box Drawings Light Down And Right |
Û |
DB |
8D |
*5F _ |
*5F _ |
AB |
U+2588 |
Full Block |
Ü |
DC |
8C |
*5F _ |
*5F _ |
AC |
U+2584 |
Lower Half Block |
Ý |
DD |
8E |
*5F _ |
*5F _ |
AD |
U+258C |
Left Half Block |
Þ |
DE |
8F |
*5F _ |
*5F _ |
AE |
U+2590 |
Right Half Block |
ß |
DF |
8B |
*5F _ |
*5F _ |
AF |
U+2580 |
Upper Half Block |
Примечания.
1) Все числовые значения кодов шестнадцатеричные.
2) Если в данной кодировке точное соответствие символа отсутствует, а приводится похожий символ, то его код отмечается звездочкой (*) и приводится сам заменяющий символ. Для DOS/Windows кодировок по возможности указываются стандартные для Windows соответствия, определяемые файлом xlat866.bin, однако в 32-битных программах Windows’95 этот файл не используется и соответствия отчасти другие (указываемые через союз or). Впрочем, от некоторых отступлений, учитывая реальное отсутствие нормативности, я все равно не удержался.
3) Вопросительным знаком отмечены соответствия, сомнительные в отношении их стандартности.
4) Имена символов в Unicode в стандарте написаны полностью большими буквами. В большинстве из них содержится убранное мной определение CYRILLIC, в то же время для специфически сербских букв мной добавлено определение Serbian.
5) Псевдографические символы последней части таблицы содержатся в кодировке ГОСТ (“основной”), но не содержатся в ISO-8859-5, в свою очередь буквы нерусских славянских языков содержатся кодировке ISO-8859-5, но не содержатся в кодировке ГОСТ. (Исправлены опечатки версии 03-Ноя-97.)
6) Указанные 2 значения UNICODE для двух “буллетов” связаны с фактической эквивалентностью middot и bullet operator (U+00B7 и U+2219), представляющих собой маленькую точку в центре позиции буквы, и с неоднозначностью трактовки и перекодировки “толстой точки” с кодом F9 в CP866. По смыслу это должен быть “буллет” (U+2022), но в определении KOI8-R в RFC-1489 стоит U+2219 (“маленькая точка").
7) Unicode Names не совпадают с Postscript Names, содержащимися в шрифтах TrueType. Postscript Names русских букв имеют вид “afii10xx”.
21-Mar-98 Костя Каз. ([email protected])