T.50
T.50 je doporučení Mezinárodní telekomunikační unie (nyní CCITT), které definuje Mezinárodní referenční abecedu (anglicky International Reference Alphabet, IRA), před verzí z roku 1992 nazývanou Mezinárodní abeceda č. 5, (anglicky International Alphabet No. 5, IA5). Jedná se o sedmibitové kódování znaků odvozené z kódu ASCII s možností vytvářet národní varianty.
Kódování má Mezinárodní referenční verzi (anglicky International Reference Version, IRV), která je v poslední verzi T.50 z roku 1992 identická s kódováním ASCII z roku 1967.
Prakticky stejné kódování jako T.50 definují normy Mezinárodní organizace pro normalizaci ISO/IEC 646 a Ecma International ECMA-6.[1]
Historie
Pětibitová Mezinárodní telegrafní abeceda č. 2 (MTA-2, anglicky International Telegraph Alphabet No. 2, ITA-2) podle doporučení CCITT S.1 přestávala okolo roku 1960 stačit vývoji telekomunikačních potřeb a počítačů. Pro aplikace, pro které MTA-2 nevyhovovala, byl navržen nový standard používající sedmibitové kódy vycházející z kódu ASCII. Standard umožňoval vytváření národních a aplikačních variant kódování, zároveň však stanovil, které znaky musí být v kódování nezměněné. Na základě doporučení V.3, T.50, standardu ECMA-6, případně ISO/IEC 646 byly vytvořeny asi dvě desítky národních standardů sedmibitových kódování. V 80. let dvacátého století začalo převažovat použití osmibitových kódování, která zpravidla měla kódy 0-127 identické s ASCII. Od roku 1987 je vyvíjeno univerzální kódování Unicode/ISO 10646, které používalo zpočátku 16 příp. 31bitové, po sjednocení 21bitové kódy, a jehož prvních 128 znaků je opět identických s kódem ASCII. Původní mezinárodní referenční verze (IRV) definovaná v doporučení T.50 (resp. V.3) se lišila od kódování ASCII v kódech 36 a 126; na místě znaku dolar byl znak měny a na místě znaku vlnovka (tilda) znak nadtržítko. V poslední verzi T.50 z roku 1992 a ISO/IEC 646 z roku 1991 byla mezinárodní referenční verze změněna, aby byla také identická s ASCII.
Platí následující korespondence mezi standardy:
Starší verze | Nová verze |
---|---|
T.50 1988 | T.50 1992 |
ISO/IEC 646:1988 | ISO/IEC 646:1991 |
ECMA-6 1983 | ECMA-6 1991 |
Verze standardu
Standardy definující Mezinárodní referenční abecedu (IRA), resp. Mezinárodní abecedu č. 5 (IA5):
- CCITT V.3 (10/1976), International Alphabet No. 5, IA5 nahrazený (anglicky superseded) novější verzí
- CCITT V.3 (11/1980), nahrazený novější verzí
- CCITT T.50 (10/1984), nahrazený novější verzí
- CCITT T.50 (11/1988), nahrazený novější verzí, definuje kódování identické (anglicky twinned) s ISO/IEC 646:1988.
- ITU-T T.50 (09/1992), International Reference Alphabet, aktuálně platný, definuje kódování identické s ISO/IEC 646:1991.
Terminologie a značení
Doporučení T.50 používá pro jednotlivé bity kódů označení b7 (nejvýznamnější bit s váhou 64) až b1 (nejméně významný bit s váhou 1) a pro kódy znaků zápis x/y, kde x je hodnota bitů b7 až b5 a y hodnota bitů b4 až b1; při obvyklém číslování má tedy znak označovaný x/y kód 16 . x + y.
Znaková sada je rozdělena na:
- Oblast řídicích znaků C0 (anglicky C0 control character set) s kódy 0-31, resp. 0/0 až 1/15
- Znak mezera (anglicky SPACE graphic character, SP) s kódem 32, resp. 2/0
- Oblast tisknutelných znaků G0 (anglicky G0 graphic character set) s kódy 33-126, resp. 2/1 až 7/14
- Znak delete (anglicky DELETE character, DEL) s kódem 127, resp. 7/15
Prostor G0 je dále rozdělen takto:
- Znaky s kódy 33, 34, 37-63, 90, 105 a 97-122 (podle standardu 2/1, 2/2, 2/5 až 3/15, 4/1 až 5/10, 5/15 a 6/1 až 7/10) jsou neměnné (anglicky unique graphic characters).
- Znaku s kódem 35, resp. 2/3 může být přiřazen symbol libry (anglicky pound sign) nebo čísla (anglicky number sign), znaku s kódem 36, resp. 2/4 symbol dolar (anglicky dollar sign) nebo znak měny (anglicky currency sign) – jedná se o alternativní znaky (anglicky alternative graphic characters).
- Zbývajících 10 kódů nemá přiřazeny konkrétní grafické znaky a jsou určeny pro národní nebo aplikační použití.
Standard připouští vytváření složených znaků (anglicky composite graphic characters) pomocí přetisku, kterého se dosáhne použitím BACKSPACE nebo CARRIAGE RETURN a uvádí příklady vytvoření symbolu „není rovno“ přetiskem lomítka a znaku rovná se a vytváření akcentovaných znaků pomocí posloupnosti znak, BACKSPACE a jeden ze symbolů "
'
a ,
.
IRV je v posledním vydání z roku 1992 shodná s ASCII, ve vydání z roku 1988 je kódu 2/4 přiřazen znak měny (anglicky currency sign) (místo znaku dolar) a kód 7/14 má popis tilde, overline s obrázkem znaku nadtržítko (místo znaku vlnovka – anglicky tilde).
Základní tabulka
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0/_ |
NUL 0000 0 |
SOH 0001 1 |
STX 0002 2 |
ETX 0003 3 |
EOT 0004 4 |
ENQ 0005 5 |
ACK 0006 6 |
BEL 0007 7 |
BS 0008 8 |
HT 0009 9 |
LF 000A 10 |
VT 000B 11 |
FF 000C 12 |
CR 000D 13 |
SO 000E 14 |
SI 000F 15 |
1/_ |
DLE 0010 16 |
DC1 0011 17 |
DC2 0012 18 |
DC3 0013 19 |
DC4 0014 20 |
NAK 0015 21 |
SYN 0016 22 |
ETB 0017 23 |
CAN 0018 24 |
EM 0019 25 |
SUB 001A 26 |
ESC 001B 27 |
FS 001C 28 |
GS 001D 29 |
RS 001E 30 |
US 001F 31 |
2/_ |
SP 0020 32 |
! 0021 33 |
" 0022 34 |
35 |
36 |
% 0025 37 |
& 0026 38 |
' 0027 39 |
( 0028 40 |
) 0029 41 |
* 002A 42 |
+ 002B 43 |
, 002C 44 |
- 002D 45 |
. 002E 46 |
/ 002F 47 |
3/_ |
0 0030 48 |
1 0031 49 |
2 0032 50 |
3 0033 51 |
4 0034 52 |
5 0035 53 |
6 0036 54 |
7 0037 55 |
8 0038 56 |
9 0039 57 |
|
|
< 003C 60 |
61 003D 075 |
> 003E 62 |
? 003F 63 |
4/_ |
64 |
A 0041 65 |
B 0042 66 |
C 0043 67 |
D 0044 68 |
E 0045 69 |
F 0046 70 |
G 0047 71 |
H 0048 72 |
I 0049 73 |
J 004A 74 |
K 004B 75 |
L 004C 76 |
M 004D 77 |
N 004E 78 |
O 004F 79 |
5/_ |
P 0050 80 |
Q 0051 81 |
R 0052 82 |
S 0053 83 |
T 0054 84 |
U 0055 85 |
V 0056 86 |
W 0057 87 |
X 0058 88 |
Y 0059 89 |
Z 005A 90 |
91 |
92 |
93 |
94 |
_ 005F 95 |
6/_ |
96 |
a 0061 97 |
b 0062 98 |
c 0063 99 |
d 0064 100 |
e 0065 101 |
f 0066 102 |
g 0067 103 |
h 0068 104 |
i 0069 105 |
j 006A 106 |
k 006B 107 |
l 006C 108 |
m 006D 109 |
n 006E 110 |
o 006F 111 |
7/_ |
p 0070 112 |
q 0071 113 |
r 0072 114 |
s 0073 115 |
t 0074 116 |
u 0075 117 |
v 0076 118 |
w 0077 119 |
x 0078 120 |
y 0079 121 |
z 007A 122 |
123 |
124 |
125 |
126 |
DEL 007F 127 |
Národní varianty
Následující tabulka shrnuje rozdíly mezi IRV z roku 1992 a staršími verzemi IRV, ASCII a dalšími národními variantami IRA:
Kód desítkově | 35 | 36 | 64 | 91 | 92 | 93 | 94 | 96 | 123 | 124 | 125 | 126 | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Kód šestnáctkově | 0x23 | 0x24 | 0x40 | 0x5B | 0x5C | 0x5D | 0x5E | 0x60 | 0x7B | 0x7C | 0x7D | 0x7E | ||
Země | Norma | .la | 2/3 | 2/4 | 4/0 | 5/11 | 5/12 | 5/13 | 5/14 | 6/0 | 7/11 | 7/12 | 7/13 | 7/14 |
mezinárodní | ISO 646:1991 IRV | ISO | # | $ | @ | [ | \ | ] | ˆ | ` | { | ¦ | } | ˜ |
mezinárodní | ISO 646:1988 IRV | ISO | # | ¤ | @ | [ | \ | ] | ˆ | ` | { | ¦ | } | ¯ |
USA | X3.4-1968 | US | # | $ | @ | [ | \ | ] | ˆ | ` | { | ¦ | } | ˜ |
Británie | BS 4730 | GB | £ | $ | @ | [ | \ | ] | ˆ | ` | { | ¦ | } | ¯ |
Japonsko | JIS C 6229 | JP | # | $ | @ | [ | ¥ | ] | ˆ | ` | { | ¦ | } | ¯ |
Čína | GB 1988-80 | CN | # | ¥ | @ | [ | \ | ] | ˆ | ` | { | ¦ | } | ¯ |
Dánsko | DS 2089 | DK | # | $ | @ | Æ | Ø | Å | ˆ | ` | æ | ø | å | ˜ |
Norsko | NS 4551-1 | NO | # | $ | @ | Æ | Ø | Å | ˆ | ` | æ | ø | å | ¯ |
Norsko | NS 4551-2 | NO2 | § | $ | @ | Æ | Ø | Å | ˆ | ` | æ | ø | å | ¦ |
Finsko | FI | # | $ | @ | Ä | Ö | Å | ˆ | ` | ä | ö | å | ˜ | |
Švédsko | SEN 850200 B | SE | # | ¤ | @ | Ä | Ö | Å | Ü | ` | ä | ö | å | ¯ |
Švédsko | SEN 850200 C | SE2 | # | ¤ | É | Ä | Ö | Å | Ü | é | ä | ö | å | ü |
Německo | DIN 66 003 | DE | # | $ | § | Ä | Ö | Ü | ˆ | ` | ä | ö | ü | ß |
Maďarsko | MSZ 7795/3 | HU | # | ¤ | Á | É | Ö | Ü | ˆ | á | é | ö | ü | ˝ |
Francie | NF Z 62-010 | FR | £ | $ | à | ° | ç | § | ˆ | µ | é | ù | è | ¨ |
Itálie | IT | £ | $ | § | ° | ç | é | ˆ | ù | à | ò | è | ì | |
Španělsko | ES | £ | $ | § | ¡ | Ñ | ¿ | ˆ | ` | ° | ñ | ç | ˜ | |
Španělsko | ES2 | # | $ | • | ¡ | Ñ | Ç | ¿ | ` | ´ | ñ | ç | ¨ | |
Portugalsko | PT | # | $ | § | Ã | Ç | Õ | ˆ | ` | ã | ç | õ | ° | |
Portugalsko | PT2 | # | $ | ´ | Ã | Ç | Õ | ˆ | ` | ã | ç | õ | ˜ |
Použití
Označení IRA/IA5 se používá v telekomunikacích pro 7bitové národní abecedy odvozené z kódu ASCII, případně pouze jako synonymum kódu ASCII; na IRA/IA5 se odkazují jiné standardy jako například RFC3966[2] a RFC 3939[3]. Kódování také používají některé analogové modemy například firmy Cisco[4].
Odkazy
Reference
V tomto článku byl použit překlad textu z článku ITU T.50 na anglické Wikipedii.
- Standard ECMA-6, 7-bit Coded Character Set [online]. December 1991 [cit. 2015-10-01]. Dostupné online.
- The tel URI for Telephone Numbers [online]. [cit. 2012-10-03]. Dostupné online.
- Calling Line Identification for Voice Mail Messages [online]. [cit. 2012-10-03]. Dostupné online.
- AT Command Set and Register Summary for NM-8AM-V2, NM-16AM-V2, WIC-1AM, and WIC-2AM Analog Modem WAN Interface Cards – 2: Syntax and Procedures [Cisco 3600 Series Multiservice Platforms] – Cisco Systems [online]. Cisco.com [cit. 2012-10-03]. Dostupné v archivu pořízeném dne 2011-09-07.