Sartsna - l

line distorsionata «smwm»

CAPTCHA este cel mai des utilizat, dacă este necesar pentru a preveni utilizarea serviciilor de Internet roboții. în special, pentru a preveni mesaje automate, expedieri de bunuri de înregistrare, descărcarea fișierelor, trimiterea prin poștă în masă (a se vedea. spam) și așa mai departe. n.

materializări

  • Cea mai răspândită variantă CAPTCHA, utilizatorul trebuie să introducă caracterele sunt de obicei prezentate în Figura a propus într-o formă deformată, uneori cu adaos de zgomot sau transluciditatea.
  • Mai puțin frecvent utilizate CAPTCHA, bazat pe recunoașterea vorbirii (practic - ca o alternativă pentru persoanele cu deficiențe de vedere).
  • Pot fi utilizate și alte sarcini algoritmice rele, cum ar fi: să știe ce este în imagine, rețineți toate imaginile cu pisicile sau răspunde la o întrebare legată de cunoștințele sau mentalitatea oamenilor (de exemplu, „atârnă o pară, nu poți mânca“).
  • Există CAPTCHA, care se solicită răspunsuri la operație aritmetică simplă.

Metode de contracarării

protejarea categoriilor vulnerabile ale

EXEMPLU CAPTCHA protejarea unui vulnerabil

Să presupunem că o imagine cu numerele de „1234“, numite de cod

În loc de a trece CAPTCHA, bot citește URL-ul și intră într-un răspuns în 1234.

Cu lipsa de calificare a bot de web programator poate merge CAPTCHA, nu recunoaște caracterele descrise. Există trei moduri de a face acest lucru.

  1. Reutiliza ID-ul sesiunii. În acest caz, persoana trece manual CAPTCHA. identificatorul de sesiune și bot transmis răspuns CAPTCHA și fabricates numărul mare de cereri cu același identificator (și, prin urmare, cu același răspuns la CAPTCHA). În mod ideal, id-ul de sesiune trebuie să fie un one-off și limitate ca durată.
  2. Pentru orice informații conținute pe pagina de restaurare caracterele reprezentate pe imagine.
  3. Datorită naturii generatorului de numere aleatorii pot fi emise la un număr limitat de imagini mici, pentru care le puteți crea o bază de date. În cazul în care utilizatorul trebuie să identifice imaginea sau pentru a răspunde la o întrebare, imaginea / întrebare, desigur, să fie pregătit de către administrator - și, prin urmare, pentru ei, de asemenea, poate ridica baza.

ghicitul

În cazul în care numărul de răspunsuri este mic, un computer sau un botnet poate încerca să ghicească răspunsul. De exemplu, în cazul în care sarcina - peste 10 poze remarcat animale obținute doar 2 10 = 1024 răspunsuri posibile. Deci, în medie, unul dintre cele 1024 cereri trec CAPTCHA. Asta este, chiar dacă performanța de 1 interogare pe secundă (cifra reală, de exemplu,

recunoaşterea automată

CAPTCHA Foarte slab (de exemplu,

Imaginea superioară limită este utilizat în culoare (tot ceea ce este mai închisă decât un anumit prag, ea devine negru, iar restul alb). Definit limite de caractere, și fiecare dintre ele se compară cu caracterele de bază. Pentru a analiza CAPTCHA nevoie chiar OCR. deoarece are mai multe vulnerabilități:
  • Separarea ușoară de caractere din fundal folosind tasta de culoare.
  • Separarea ușoară a caracterelor de la un altul.
  • Font fix și nedistorsionată.

După cut-off pe litere forma un model aleatoriu, astfel încât nu există nici o garanție absolută că sunt identificate toate caracterele (în acest rating CAPTCH'i PWNtcha - 99%). Dar restul de un procent absolut nu este important. Noul forum gama phpBB (3.x.x) utilizează implicit CAPTCHA avansate folosind biblioteca PWNtcha. În plus, este posibil să se comunice cu modulele programelor de recunoaștere a textului de uz general (de exemplu, FineReader. OmniPage) în dezvoltatorii de software terță parte pentru a recunoaște imaginile CAPTCHA.

În ceea ce privește recunoașterea automatizată există conceptul de „CAPTCHA slab» și «CAPTCHA robuste». Printre „punctele slabe“ - .. font fix, o poziție fixă ​​a caracterului, lipsa de denaturare, separarea caracterelor din fundal cu ajutorul unei chei de culoare sau Gaussian blur, o ușoară separare între personaje, etc. Cu toate acestea, uneori se întâmplă ca un CAPTCHA puternic este greu de recunoscut și pentru persoana. CAPTCHA Ocazional găsit, ușor de citit de calculator și cu mare dificultate - persoana (de exemplu, o imagine non-contrast).

Chiar dacă bot rulează CAPTCHA o dată din 100, acest lucru este suficient pentru a trimite 430 de mesaje pe zi (presupunând că bot de performanță - 1 interogare pentru fiecare 2 secunde, ceea ce corespunde aproximativ algoritmului neoptimizat care rulează în fundal pe puterea ta medie de PC-uri, dar cele mai multe sunt. roboții sunt instalate pe servere. a căror performanță este de sute de ori mai mare decât cea a utilizatorilor de PC-uri obișnuite).

detectare manuală

În ciuda vulnerabilității, aceasta nu înseamnă că orice priori CAPTCHA protecție lipsită de sens. Apoi, există principiul concurenței patrupede arme și de protecție (scoici și armuri). Mult mai rău, în cazul în care această protecție nu este utilizat.

OCR cuvânt, care este unul dintre multele fragmente distorsionate ale cărților scanate, în plus față de cuvintele generate de un computer. Acest serviciu permite utilizarea tehnicilor și a posibilităților de programe de digitizat cărți de text. Fiabilitate pentru același cuvânt este oferit mai mulți utilizatori la diferite site-uri. Atunci când diferiți utilizatori deopotrivă au răspuns la CAPTCHA-cerere, se presupune că au intrat cuvântul corect.