Shift-JIS

Shift-JIS (SJIS) est un codage de caractères pour la langue japonaise. Comme son nom l'indique, il est basé sur l'encodage ISO-2022-JP (JIS), mais avec un nombre plus importants d'octets permettant l'utilisation de 64 katakana entre les codes hexadécimaux 0xA0 et 0xDF.

Au contraire de JIS, Shift-JIS nécessite un médium de 8 bits pour la transmission. Cependant, face au format 8 bits EUC, Shift-JIS garantit uniquement que le premier octet sera dans la plage [0x80,0xFF] ; la valeur du second octet peut alors être quelconque. Ceci rend difficile une détection sûre de ce codage.

Pour un code JIS de deux octets j 1 j 2 {\displaystyle j_{1}j_{2}} , la transformation vers le code Shift-JIS correspondants s 1 s 2 {\displaystyle s_{1}s_{2}} est :

33 j 1 96 s 1 = j 1 + 1 2 + 112 {\displaystyle 33\leq j_{1}\leq 96\Rightarrow s_{1}={\frac {j_{1}+1}{2}}+112}
97 j 1 126 s 1 = j 1 + 1 2 + 176 {\displaystyle 97\leq j_{1}\leq 126\Rightarrow s_{1}={\frac {j_{1}+1}{2}}+176}
j 1  est impair  s 2 = j 2 + 31 + trunc ( j 2 95 ) {\displaystyle j_{1}{\mbox{ est impair }}\Rightarrow s_{2}=j_{2}+31+\operatorname {trunc} \left({\frac {j_{2}}{95}}\right)}
j 1  est pair s 2 = j 2 + 126 {\displaystyle j_{1}{\mbox{ est pair}}\Rightarrow s_{2}=j_{2}+126}

Shift-JIS est utilisé essentiellement dans les pages Web japonaises.

Voir aussi

Liens internes

  • ISO 646, ASCII

Liens externes

  • Ping : Codage de textes Japonais (en)
v · m
Jeux de caractères codés
Multi-octets
Unicode
Asiatiques
Ancienne encodeuse de texte sur ruban perforé
8 bits
ISO/CEI 8859
  • -1 (Latin-1)
  • -2 (Latin-2)
  • -3 (Latin-3)
  • -4 (Latin-4)
  • -5 (Cyrillique)
  • -6 (Arabe)
  • -7 (Grec)
  • -8 (Hébreu)
  • -9 (Latin-5)
  • -10 (Latin-6)
  • -11 (Thaï)
  • -12 (Devanagari)
  • -13 (Latin-7)
  • -14 (Latin-8)
  • -15 (Latin-9)
  • -16 (Latin-10)
Pages de code Windows
Pages de code Mac OS MacRoman
Pages de code DOS
  • 437
  • 720
  • 737
  • 775
  • 850
  • 852
  • 855
  • 857
  • 858
  • 860
  • 861
  • 862
  • 863
  • 864
  • 865
  • 866
  • 869
  • Kamenický
  • Mazovia
  • MIK
  • Iran System
Pages de code diverses
  • ANSEL
  • DEC-MCS
  • KOI8-R (russe)
  • KOI8-U (ukrainien)
  • StandardEncoding (PostScript)
  • Page de code vidéotex
  • Page de code ZX Spectrum
  • Page de code Amstrad CPC
  • Page de code Atari ST
  • Page de code Amiga
Non basés sur ISO/IEC 646
7 bits
Moins de 7 bits
  • icône décorative Portail de l’informatique
  • icône décorative Portail de l’écriture