Forma - un document format din unul sau mai multe pagini și este proiectat pentru a umple o persoană cu mâna sau prin orice metodă de imprimare. Pentru ușurința de umplere și câmp de prelucrare sunt marcate pe forma câmpurilor de intrare de date sunt aranjate lângă explicarea antete.
Formulare, toate formele care au aceeași locație și numărul de câmpuri, numite forme rigide. Pentru tratamentul formelor rigide se aplică în flux sistem de documente de intrare care se execută detectarea si transmiterea acestor date către aplicații externe de date formular (baze de date, sisteme de management al documentelor, sisteme de arhivare). Recunoașterea și extragerea datelor din formulare este posibilă prin utilizarea documentelor de identificare - descrierea câmpurilor de formular care indică tipurile de date conținute în domeniile, precum și normele de verificare a rezultatelor de recunoaștere. Această descriere se aplică tuturor formelor de tip hard. Definirea documentului indică în mod clar fluxul de sistem de forme de intrare de locație și de tipul de date de formă, eliminând astfel nevoia de recuperare a datelor și erori de interpretare.
Cu toate acestea, o multitudine de documente care necesită automate de intrare, un număr mare de formulare care conțin date similare, dar care au o structură organizație non strictă a datelor în interiorul matriței.
Un exemplu frapant de forme flexibile sunt o varietate de instrumente de plată. Domenii de introducere a datelor cu privire la astfel de forme sunt menționate explicit, dar locația și dimensiunea lor nu este fixată de obicei. Și în diferitele documente pot aranjament diferit de câmpuri în raport unul cu altul. O altă caracteristică importantă a acestor forme este numărul diferit de câmpuri. De exemplu, poate exista nici o semnătură câmp de intrare, precum și alte elemente de design prezente suplimentare, cum ar fi linii, cufundări sau imagine pe document.
Datorită faptului că existența și localizarea câmpurilor pe formulare nu este cunoscută dinainte, devine imposibil de a crea un șablon. Aceasta conduce la faptul că, deși formele și pot fi recunoscute (de exemplu, convertite în format electronic, iar textul lor pot fi editate), extrage automat datele de la ei este imposibilă. de streaming sistem de livrare singur nu poate găsi informația.
ABBYY FlexiLayout Studio vă permite să creați o descriere a structurii documentelor și a stabilit algoritmul de căutare câmpuri recunoscute de forme flexibile pe baza unor informații suplimentare, cum ar fi locul câmpului în raport cu alte domenii sau pe natura datelor, care pot fi în domeniu, etc. și configurați descrierea flexibilă pe imagini reale.
Flexibil Descriere FlexiLayout, creat în programul ABBYY FlexiLayout Studio, apoi transferat la formele de intrare de sistem (ABBYY FlexiCapture), în cazul în care baza pentru o definiție a unui document. ABBYY FlexiCapture Technology oferă oportunități ample pentru formele de intrare automate de diferite tipuri. Folosind această formă de tehnologie de recunoaștere, puteți automatiza procesul de a intra practic orice documente, ambele forme standard și flexibile.