A 90-es évek elején, amikor a Szovjetunió összeomlott és Oroszország határait megnyitották, nyugati gyártású szoftvertermékeket kaptunk. Természetesen mind angolul beszéltek. Ugyanakkor az Internet is fejlődik. Az erőforrások és programok elöregedésének problémája egyre jelentősebbé vált. Ezután feltalálták a Windows 1251 orosz kódolását, amely lehetővé teszi a szláv ábécé betűinek megfelelő megjelenítését:
- orosz;
- ukrán;
- Fehéroroszországban;
- szerb;
- bolgár;
- macedóniai.
A fejlesztést a Microsoft orosz képviselete végezte, a "Dialogue" és a "Article" cégekkel együtt. Az alapot a saját készítésű fejlesztésekre készítették, amelyek 1990–1991-ben az oroszországi néhány informatikai ideológus körében forgalomban voltak.
A mai napig fejlesztették ki a karakterek kódolásának univerzálisabb módját - az UTF-8 (Unicode). Ez az összes szoftver és webes erőforrás közel 90% -át képviseli. A Windows 1251-et az esetek 1,6% -ában használják. (Webes technológiai felmérések kutatási információi)
Utf 8 vagy Windows 1251 kódolás?
A kérdés megválaszolásához kissé meg kell értenie, mi a kódolás és hogyan különböznek egymástól. A szöveges információkat, valamint minden más, a számítógépen kódolt formában tárolják. Könnyebb számunkra ábrázolni. Minden karakter elfoglalhat egy vagy több bájtot. A Windows 1251 egybájtos kódolású, az UTF-8 nyolcbájtos. Ez azt jelenti, hogy a Windows 1251 rendszerben csak 256 karakter kódolható..
Mivel az egész a bináris rendszerre vonatkozik, és a bájt 8 bit (0 és 1), a kombinációk maximális száma 28 = 256. Az Unicode lehetővé teszi, hogy sokkal nagyobb karaktert képviseljen, és mindegyikhez nagyobb méret rendelhető..
Innentől kezdve a Unicode előnyei következnek:
- A weboldal fejlécében fel kell tüntetni a használt kódolást. Ellenkező esetben a karakterek helyett a "krokodilok" jelennek meg. És a Unicode alapértelmezés szerint minden böngészőben megtalálható - menet közben elkapják.
- A webhely szimbólumai változatlanok maradnak, függetlenül attól, hogy melyik országba töltik be az erőforrást. Ez nem a kiszolgálók földrajzi helyzetétől függ, hanem az ügyfél munkaállomásainak szoftver nyelvétől. Egy portugáliai lakos nyilvánvalóan billentyűzetet és minden szoftvert használ, beleértve az operációs rendszert, anyanyelvén. Valószínűleg nincs számítógépén a Windows 1251. És ha igen, akkor az orosz oldalak nem nyílnak meg megfelelően. A Unicode viszont bármilyen operációs rendszerhez bármilyen nyelven "csatlakoztatva van".
- Az UTF-8 lehetővé teszi további karakterek kódolását. Jelenleg a nyolc bájt 6-ból van használatban, és az orosz karaktereket két bájt kódolja.
Ezért inkább inkább univerzális kódolást kell használni, mint magasan specializált, amelyet csak a szláv országokban használnak.
Windows 1251 kódolási táblázat
A programozók és a weboldal fejlesztõi számára szükséges lehet a karakterek számának ismerete. Ehhez speciális kódolótáblákat használunk. Az alábbiakban egy táblázatot találunk a Windows 1251 rendszerhez.
Mi a teendő, ha a parancssori kódolás elindult??
Időnként előfordulhat, hogy az oroszok helyett érthetetlen karakterek jelennek meg a parancssorban. Ez azt jelenti, hogy probléma van a Windows 7 parancssori kódolásával. Mivel a nyolcadik verziótól kezdve az UTF-8, és a hét Windows 1251 verzióban van használatban.
A chcp 866 parancs egyidejűleg segíthet a probléma megoldásában.A jelenlegi munkamenet megfelelően fog működni. A hiba drasztikus javításához azonban regisztrációra van szüksége.
- Nyomja meg a Win + R billentyűt, és írja be a regedit parancsot. Ez lehetővé teszi a regisztrációs szerkesztőbe való bejutást..
- Lépjen a HKEY_CURRENT_USER \ Console ágba, és nézze meg, hogy a CodePage értéke miként egyenlő. Valószínűleg a 866-n kívül más is fog látni (a helyes lehetőség).
- Helyesbítse a tizedesjel 866-os pontján.
- Zárja be és nyissa meg újra a parancssort. A helyzetet ki kell javítani.
Remek napot!