Specificați codificarea la citirea conținutului unui fișier. Ie pentru citire ("transcodare" la citire) de la 866, trebuie doar să specificați codificarea:
Dacă aveți un caz specific, de exemplu, ați primit deja textul deteriorat ca un șir de caractere - este suficient să-l salvați doar înapoi la bytes care specifică codificarea greșită, și a citit cu indicarea dreptului:
Adevărat, acest lucru va funcționa numai dacă octeții de citire codificați greșit (cu o coincidență fericită!) Se pare că este reversibil. Mai jos este un exemplu atunci când nu este.
În ceea ce privește "recodarea":
Încercați să remediați consecințele, nu problema în sine.
Cum apare această problemă:
Soluția pe care încercați să o aplicați este "convertiți șirul". Ie sperați că următorul cod va funcționa:
Dacă nu ghiciți codarea fișierului atunci când îl citiți, acesta nu poate fi scris înapoi.
Deodată, acest cod produce două fișiere diferite, deși nu a existat nicio "recodificare".
Există o linie "ЇаЁўҐв". Cum de citit?
"Salut". 1251 și 866 octet două, chirilică și gama de cod de acoperire, fără pierderi în timpul interpretați greșit (866-1251, 1251-866).
Dacă trebuie doar să citiți, atunci nu este nevoie să convertiți nimic. Este suficient pentru a selecta pagina de cod corectă pentru a interpreta textul (ca și omologii menționat mai devreme - ai cp866) și întrebați-i când citesc o matrice octet sau flux.
Opțiunile sunt enumerate mai sus. Asta nu e doar Сонверт. și apoi obțineți același lucru, deoarece Convert face o cartografiere, nu un înlocuitor pentru caractere.