Windows 1251 kódolás

A 90-es évek elején, amikor a Szovjetunió összeomlott és Oroszország határait megnyitották, nyugati gyártású szoftvertermékeket kaptunk. Természetesen mind angolul beszéltek. Ugyanakkor az Internet is fejlődik. Az erőforrások és programok elöregedésének problémája egyre jelentősebbé vált. Ezután feltalálták a Windows 1251 orosz kódolását, amely lehetővé teszi a szláv ábécé betűinek megfelelő megjelenítését:

  • orosz;
  • ukrán;
  • Fehéroroszországban;
  • szerb;
  • bolgár;
  • macedóniai.

A fejlesztést a Microsoft orosz képviselete végezte, a "Dialogue" és a "Article" cégekkel együtt. Az alapot a saját készítésű fejlesztésekre készítették, amelyek 1990–1991-ben az oroszországi néhány informatikai ideológus körében forgalomban voltak.

A mai napig fejlesztették ki a karakterek kódolásának univerzálisabb módját - az UTF-8 (Unicode). Ez az összes szoftver és webes erőforrás közel 90% -át képviseli. A Windows 1251-et az esetek 1,6% -ában használják. (Webes technológiai felmérések kutatási információi)

Utf 8 vagy Windows 1251 kódolás?

A kérdés megválaszolásához kissé meg kell értenie, mi a kódolás és hogyan különböznek egymástól. A szöveges információkat, valamint minden más, a számítógépen kódolt formában tárolják. Könnyebb számunkra ábrázolni. Minden karakter elfoglalhat egy vagy több bájtot. A Windows 1251 egybájtos kódolású, az UTF-8 nyolcbájtos. Ez azt jelenti, hogy a Windows 1251 rendszerben csak 256 karakter kódolható..
Mivel az egész a bináris rendszerre vonatkozik, és a bájt 8 bit (0 és 1), a kombinációk maximális száma 28 = 256. Az Unicode lehetővé teszi, hogy sokkal nagyobb karaktert képviseljen, és mindegyikhez nagyobb méret rendelhető..

Innentől kezdve a Unicode előnyei következnek:

  1. A weboldal fejlécében fel kell tüntetni a használt kódolást. Ellenkező esetben a karakterek helyett a "krokodilok" jelennek meg. És a Unicode alapértelmezés szerint minden böngészőben megtalálható - menet közben elkapják.
  2. A webhely szimbólumai változatlanok maradnak, függetlenül attól, hogy melyik országba töltik be az erőforrást. Ez nem a kiszolgálók földrajzi helyzetétől függ, hanem az ügyfél munkaállomásainak szoftver nyelvétől. Egy portugáliai lakos nyilvánvalóan billentyűzetet és minden szoftvert használ, beleértve az operációs rendszert, anyanyelvén. Valószínűleg nincs számítógépén a Windows 1251. És ha igen, akkor az orosz oldalak nem nyílnak meg megfelelően. A Unicode viszont bármilyen operációs rendszerhez bármilyen nyelven "csatlakoztatva van".
  3. Az UTF-8 lehetővé teszi további karakterek kódolását. Jelenleg a nyolc bájt 6-ból van használatban, és az orosz karaktereket két bájt kódolja.
    Ezért inkább inkább univerzális kódolást kell használni, mint magasan specializált, amelyet csak a szláv országokban használnak.

Windows 1251 kódolási táblázat

A programozók és a weboldal fejlesztõi számára szükséges lehet a karakterek számának ismerete. Ehhez speciális kódolótáblákat használunk. Az alábbiakban egy táblázatot találunk a Windows 1251 rendszerhez.

Mi a teendő, ha a parancssori kódolás elindult??

Időnként előfordulhat, hogy az oroszok helyett érthetetlen karakterek jelennek meg a parancssorban. Ez azt jelenti, hogy probléma van a Windows 7 parancssori kódolásával. Mivel a nyolcadik verziótól kezdve az UTF-8, és a hét Windows 1251 verzióban van használatban.
A chcp 866 parancs egyidejűleg segíthet a probléma megoldásában.A jelenlegi munkamenet megfelelően fog működni. A hiba drasztikus javításához azonban regisztrációra van szüksége.

  1. Nyomja meg a Win + R billentyűt, és írja be a regedit parancsot. Ez lehetővé teszi a regisztrációs szerkesztőbe való bejutást..
  2. Lépjen a HKEY_CURRENT_USER \ Console ágba, és nézze meg, hogy a CodePage értéke miként egyenlő. Valószínűleg a 866-n kívül más is fog látni (a helyes lehetőség).
  3. Helyesbítse a tizedesjel 866-os pontján.
  4. Zárja be és nyissa meg újra a parancssort. A helyzetet ki kell javítani.

Remek napot!