Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
alyna2408 pe Simpatie.ro
Femeie
25 ani
Botosani
cauta Barbat
26 - 60 ani
Forum Romania Inedit / Totul despre cărți - About e-books / ABBYY FineReader 12 - prime impresii Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     ABBYY FineReader 12 Professional – prime impresii



    Am făcut download, am instalat şi m-am uitat un pic prin versiunea de probă.
    Deoarece versiunea trial permite salvarea a 100 de pagini în serii de câte 3, nu am reuşit să-mi fac o idee clară despre calitatea recunoaşterii caracterelor.

    Ca şi în cazul altor softuri, Abbyy îşi schimbă şi el interfaţa.
    Deşi la o primă privire a ferestrei principale, lucrurile par să fie la fel, în realitate sunt foarte multe schimbări, astfel că bara de meniuri este schimbată complet; sunt ceva modificări şi ale meniurilor şi setărilor.



    Primele constatări ar fi următoarele:
    ■ Cea mai importantă noutate şi un mare avantaj: Abbyy 12 are funcţii şi butoane "Undo" şi "Redo".
    În imaginea următoare am marcat cu roşu grupul celor două butoane.



    Ele funcţionează şi în fereastra Edit Image, ceea ce este foarte important, pentru că aici o comandă greşită nu mai putea fi reparată. Acum, dacă îi permitem lui Abbyy să facă o prelucrare automată şi nu convine rezultatul putem să-l anulăm. Se cunoaşte foarte bine că Abbyy are nişte păreri foarte "originale" despre înclinaţia imaginilor şi uneori le înclină mai rău decât au fost iniţial. De data asta putem reveni asupra comenzii.
    Important de reţinut că programul "ţine minte" mai multe comenzi şi nu numai pe ultima, astfel că se poate reveni cu mai mulţi paşi pentru fiecare pagină.
    Este important de reţinut că softul "ţine minte", deci are butonul "Undo" activat, doar atâta timp cât ne aflăm la pagina/imaginea respectivă.
    De exemplu, dacă am schimbat rezoluţia şi înclinaţia la pag 10, butonul "Undo" este activ, dar dacă  trecem în pagina 11, butonul "Undo" este inactiv. Nu se pot anula comenzile pentru prelucrările din pagina 10 decât dacă afişăm pagina 10, pe cele din pagina 11 dacă afişăm pagina 11 şi aşa mai departe.

    Pe de altă parte, este important de ştiut că în momentul în care s-a ieşit din fereastra de editare imagini se face salvare automată şi dacă facem o nouă revenire în fereastra de editare nu mai putem reveni la comenzi pe care le-am dat înainte de închiderea precedentei sesiuni de editare imagine.
    Erată: Am reverificat: se poate reveni la ultimele comenzi şi după ieşirea din fereastra Edit Imagine, cu condiţia să afişăm pagina în care s-au făcut modificările şi, bineînţeles, să nu ieşim din program.

    ■ O schimbare destul de serioasă de interfaţă apare la opţiunile pe care le oferă Abbyy la prelucrarea imaginilor, în fereastra Edit Image.
    În realitate apare doar o funcţie nouă pe care până acum o aveam doar în ScanTailor şi Snapter Ice: este vorba despre corectarea efectului de "butoire" al imaginilor fotografiate.
    Atunci când se fotografiază o carte care este liberă [cu paginile neapăsate cu o sticlă sau alt material transparent], pagina cărţii nu este întinsă perfect, ci curbată, astfel că în imaginea fotografiată apare curbura paginii. Dacă distanţa de fotografiere este foarte mică, apare şi o distorsionare a dreptunghiului paginii, astfel că imaginea paginii nu este dreptunghiulară, ci lăţită la mijloc şi mai îngustă în partea de sus şi de jos a paginii, aşa cum arată un butoi; de aici şi numele efectului de "butoire".

    Am pus mai jos pentru comparaţie meniurile Image Edit al versiunilor Abbyy 11 şi 12.



    ■ La o primă privire nu am văzut alte schimbări foarte importante.
    Din păcate, un lucru care mă interesa foarte mult, a rămas neschimbat. Şi Abbyy 12, la fel ca şi Abbyy 11, introduce Header şi Footer [număr de pagină, eventual nume autor şi titlul cărţii] tot în Headerul, respectiv Footerul documentului, şi nu în textul documentului.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Il tot astept sa apara pe torenti. Pe moment doar versiunea OSX exista.

Dar daca nu au reparat chestia cu Header/Footer, e trist.
Si mai trist este faptul ca nu au un nenorocit de forum unde sa pui o intrebare.


pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu sunt multumit de el. O data pentru chestia cu Header/Footer. Inca o data pentru ca fereastra de verificare a textului e foarte incarcata.

Spune-mi te rog ce versiune de Abby 9 folosesti. Sau mai bine da-mi un link sa il descarc.


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Nici eu nu sunt mulţumit.
      Singurul avantaj al acestei versiuni este implementarea funcţiei "Undo". Uneori este nevoie de ea; mai ales atunci când se fac prelucrări de imagini în Abbyy.

      Am un link pentru Abbyy 9 în postarea
      Atenţie! arhiva e parolată. Dacă nu reuşeşti să descarci de acolo, astăzi după orele 18.00 încerc să găsesc un link de pe mediafire sau să urc pe mediafire o nouă arhivă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Am gasit versiunea folosita de mine pe un ftp.

E cam stupid sa fiu nevoit sa ma intorc cu 3 versiuni in urma....

A... inca o chestie care ma nemultumeste enorm la Abby: lipsa unui forum in care utilizatorii sa discute cu creatorii.

Singura chestie utila cu adevarat, de la Abby 11 incoa, e partea de prelucrare a imaginii. In rest nu am vazut nicio imbunatatire notabila.

Cu Abby 9 am corectat o carte cap-coada, cu Abby 11-12 mi s-a parut foarte greoaie corectura.
Versiunile mai noi de Abby le foloseam doar la scanare, deoarece Abby 9 nu imi arata niciodata ultima pagina scanata, ma sileste sa dau eu paginile ca sa vad ce am scanat.

Dar apelez la alt program pentru scanare


si am rezolvat si problema asta.

Modificat de utilitasetveritas (acum 10 ani)


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Abbyy 11 şi 12 au ele destule hibe.
      Chestia cu modul de redare al Header/Footer în varianta Formatted Text este una dintre ele; ce mă necăjeşte pe mine cel mai rău este că se cred mai deştepte decât trebuie şi-ţi "rezolvă" nişte înclinaţii de imagine numai de ele văzute, astfel că una scanezi şi alta vezi, pentru că Abbyy le înclină după o logică doar de el văzută.
      Nu sunt foarte sigur, dar cred că A12 are o mare problemă la salvarea în format PDF/A [PDF Searchable]. N-am făcut multe teste, dar mi-a salvat două PDF cu pagini pe jumătate albe.

      Totuşi, legat de calitatea OCR cred că eşti puţin cam dur cu ele.
      Am avut cărţi scanate la o calitate mediocră la care Abbyy 11 am scos un OCR mai bun decât Abbyy 9.
      Pe de altă parte, A11 permite nişte setări de limbă pe care A9 nu le are.
     
      Eu am instalate în computer A9, A11 şi A12, dar folosesc frecvent A11.
      Cred că şi la A9 se vede ultima pagină scanată. Am să verific cu prima ocazie.
     

      Rugămintea mea ar fi să ne spui câteva lucruri despre acest Scannito Pro.
      Eu scanez direct din Abbyy şi nu simt nevoia să schimb, dar dacă Scanitto ăsta oferă ceva avantaje, aş fi dispus să încerc.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Scanito lucreaza direct cu scanerul. Salveaza in TIFF si alte formate, accepta comprimari gen LZW sau fara comprimare pentru cei pretentiosi. Scanarea se poate intrerupe si relua, chiar si in zile diferite.
Il folosesc pentru scanari deoarece iti ofera o imagine foarte clara a ceea ce scanezi si poti vedea imediat daca sunt probleme.
Acum 1 an cand l-am folosit ultima oara, aveam probleme cu licenta. Acum sper sa nu mai fie cazul.
Nu il consider mai bun decat scanarea din Abby, il folosesc doar pentru faptul ca poti salva si necomprimat, si pentru ca iti arata ultima imagine scanata cam pe jumatate de ecran.

Si incerc sa am niste imagini cat mai apropiate de original pentru a face djvu-ul. Iar Abby 10-12 parca nu mai salvau imaginile ca simple tiff-uri, ci ca un amestec de mai multe fisiere, care necesita o reconvertire.

Uite un clip explicativ, cam pune accentul pe partea de OCR, dar poti sa ignori partea asta:





Ultima versiune e 3.1, dar inca nu am gasit-o.

Daca gasesc solutia afisarii ultimii imagini scanate la Abby 9, atunci nu mi-ar mai trebui Scanitto.

Sunt de acord cu acuratetea marita de la 11 si 12, dar cata vreme nu stiu ce anume se intampla cu textul scanat, adica Header/Footer, prefer sa nu risc inutil. La Abby 9, daca fac zonare manuala, stiu ca o sa gasesc tot textul. La celelalte trebuie sa verific pagina cu pagina si nici chiar asa nu am garantia salvarii corecte a textului. Nici macar in Plain Text nu scap de Header/Footer.

P.S.
Si nici proiectele Abby nu sunt compatibile intre ele. De la Abby 11 la 12 da, de la 12 la 11 nu. Intre 10 si 11, poate. Iar 9 este exclus complet.

P.P.S.
Cel putin pentru Istrati care il fac pagina cu pagina in Abby, singurul care ma multumeste este Abby 9.
Am incercat zilele astea toate variantele de Abby si, spre ciuda mea, am fost nevoit sa ma intorc la 9.

Modificat de utilitasetveritas (acum 10 ani)


pus acum 10 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
Scurt ghid de utilizare PaperScan.




Modificat de uciN (acum 10 ani)


pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Il bag si pe asta la ciorap, pana cand o sa ajung la o scanare de carte.


Merci 


pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Seven, dictionarele de Abby pot fi gasite si editate?
Mai exact, sa se copie lista de cuvinte in AC si trecuta pe grafia veche sau cea actuala, apoi puse la loc in Abby.


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Ştiu că în Abbyy 11 am făcut cu ceva timp în urmă următoarele lucruri:
           - creat o limbă "nouă" Romanian 2 în baza Romanian
           - editat caracterele pentru Romanian 2 [scos nişte ghilimele drepte şi câteva răgălii, adăugat ghilimele româneşti şi apostrof...
           - am creat un dicţionar pentru Language 2 [după câte îmi amintesc era la fel ca dicţionarul de tip "dic" din Word, deci cuvintele scrise unele sub altele.
           - în acel dicţionar am adăugat cuvintele scurte cu cratimă din dicţionarele AC.
           - acum nu ştiu exact cum îl cheamă pe dicţionar şi unde se găseşte, dar atunci ştiu că l-am găsit şi am tot pus în el alte şi alte cuvinte.

     Undeva pe forum am scris despre crearea unei noi limbi în baza limbii române.
     Acum nu mai ştiu detaliile, trebuie să găsesc postarea aia ca să n-o mai iau de la început.

     Părea mea - e posibil, totuşi să greşesc - este că se pot face două limbi în baza limbii române: Romanian 2 Clasic şi Romanian 3 Contemp, urmând ca la fiecare să se ataşeze dicţionarele corespunzătoare.
     În funcţie de modul în care este scrisă cartea se poate folosi una dintre cele două limbi.

     Bineînţeles, numele noilor limbi pot fi mult mai scurte; Abbyy permite să fie editat numele după dorinţă..


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
pantera75
Membru Gold

Inregistrat: acum 12 ani
@utilitasetveritas
Daca te referi la dictionarele "mama", cele care sunt incorporate in softul programului atunci cand instalezi Abbyy, ele nu se pot modifica (cel putin eu unul nu am reusit in nici un fel).
Daca te referi la "Users Dictionaries", adica acele dictionare pe care fiecare user le creeaza in momentul in care verifica in Abbyy OCR-ul rezultat prin functia "Verification" si "trimite" un cuvant in dictionar prin functia "Add to Dictionary", ele se pot edita, importa, exporta in felul urmator : Meniul TOOLS - VIEW DICTIONARIES - selectezi din lista Romanian - VIEW - apoi ai mai multe optiuni (Add, Delete, Import, Export). Acest dictionar il gasesti fizic in calculatorul tau la: Users - AppData - Roaming - ABBYY - FineReader - 12 - UserDictionaries. Eu am instalat si Abbyy 11 si 12, asa ca in functie de ce ai tu instalat s-ar putea sa difere calea dupa pasul ABBYY.


pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Dictionarele utilizatorului pot fi modificate cu usurinta.

Dar unde gasesc o ditamai lista de cuvinte pe care sa o adaug in ele?
Iar Abby accepta si dictionare de Word.


pus acum 10 ani
   
pantera75
Membru Gold

Inregistrat: acum 12 ani
Abbyy accepta si dictionare din Word, dar atentie nu accepta dictionarele "mama" ale wordului, accepta dictionarele pe care userul le creaza in Word. (custom.dic).

Abbyy 12 are o baza de cuvinte foarte buna pentru limba romana. In momentul in care detecteaza un cuvant care este scris cu vechea grafie, la Suggestions iti ofera varianta cuvantului respectic scris cu noua grafie.
Uite un alt exemplu: mi-a gasit ca nu exista in dictionar cuvantul "crr" care a fost prost citit de Abbyy si in loc de cuvantul "cer" dupa OCR Abbyy l-a citit "crr". La Suggestions programul imi ofera urmatoarele variante de inlocuire: "car"; "cer" "cir" "cor" "cri" "cur".

Daca imi permiti, am vazut ca nu esti multumit de Abbyy 12 pentru ca nu sti unde iti trimite Header/Footer. Eu fac in felul urmator:
- nu bifez la Options - Read casuta Header/Footer
- nu bifez la Options - Save casuta Header/Footer
- la Document Layout selectez Exact Copy
- cand salvez OCR-ul din Abbyy il salvez ca .rtf
- word-ul (am 2013) imi deschide fisierul .rtf respectiv cu Header/Footer, dar daca introduc acelasi fisier ,rtf rezultat din Abbyy in AC, AC-ul imi baga Header/Footer in interiorul paginii respective ca si text si nu ca Header/Footer.


pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Multumesc de lamurire.

O sa incerc si abordarea ta la Abby 12.


pus acum 10 ani
   
graddyx
Membru Puf

Inregistrat: acum 12 ani
Salut. Am de realizat un proiect care implica  transformarea unui material pdf in word. Am incercat cu Abby dar nu am obtinut rezultate prea grozave. Este vorba de o lucrare de analiza matematica si atunci cand fac transformarea, formulele, in formatul word, nu se importa cum trebuie, apar caractere straine care trebuie corectate manual. Exista vreo solutie mai buna decat abby pentru convertirea pdf-ului? Mentionez ca trebuie sa intocmesc materialul si in format word si in format pdf iar formatul pdf mi se pare dificil de prelucrat cu abby. Multumesc anticipat pt orice fel de ajutor

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Pentru asa ceva, adica pdf cu formule matematice, nu ai optiuni.

Posibil sa mearga o convertire cu suita Adobe (deci nu simplul Adobe Reader) din pdf in Word.
Oricum ar nu scapi de erori si greseli. Vezi care e varianta cea mai apropiata de original, apoi te apuci de corectat.
Formulele matematice le poti scoate si ca imagini inserate in text, ulterior urmand sa le adaugi tu ca text in baza imaginilor.


pus acum 10 ani
   
Cleo2001
VETERAN

Inregistrat: acum 13 ani
@graddyx - încearcă cu NitroPro. Mie mi-au ieșit conversii foarte bune PDF to Word, la  niște texte chiar dificile.

pus acum 10 ani
   
graddyx
Membru Puf

Inregistrat: acum 12 ani
Ok. Multumesc pentru raspunsuri.

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutări!
     S-a dovedit că prima mea impresie despre ABBYY 12 este incorectă.
     Scuzele mele stimate/ă ABBYY 12!
     Am constatat în ultimul timp că ABBYY 12 este foarte-foarte tare în zona editare imagini, doar că marea majoritate a userilor n-au simţit nevoia să apeleze la toate opţiunile lui.

     Dacă avem imagini rezultate din scanare, deci "pozate" cu scanerul, şi dacă sunt şi bine scanate, pare că Abbyy 12 nu aduce mari noutăţi.
     Dacă, în schimb, avem imagini rezultate din fotografiere şi aceste imagini au şi defecte de geometrie a imaginii... ei bine, în cazul ăsta, bag'samă că Abbyy 12 este o adevărată minune de program.

     La fotografiere, mai ales la începutul unei astfel de experienţe, imaginile rezultate pot avea o serie de defecte de geometrie a paginii şi a rândurilor.

     Exemple de defecte de geometrie a paginii:
         – pagină paralelipiped dreptunghic – marginile orizontale ale paginii [blocului de text] sunt perfecte, dar marginile "verticale", sunt paralele, dar înclinate spre stânga sau spre dreapta;
         – pagină trapezoidală – cel mai des întâlnit caz este trapezul cu laturile paralele sus şi jos, dar mai mică sus; cauza este poziţia incorectă a aparatului de fotografiat al cărui obiectiv nu este perfect perpendicular pe centrul paginii.
         – pagină butoită vertical – marginile de sus/jos sunt drepte şi paralele, dar marginile laterale sunt arcuite, fiind bombate spre exterior; cauza pare să fie distanţa prea mică dintre obiectivul aparatului şi carte;
         – pagină butoită orizontal – marginile de sus/jos sunt arcuite şi neparalele; marginile laterale pot fi de la drepte şi paralele, până la înclinate şi neparalele [forma unui butoi culcat]; cauza pare să fie distanţa prea mică dintre obiectivul aparatului şi carte, dar şi poziţia neperpendiculară a obiectivului pe carte;
         – pagină arcuită – marginile stânga/dreapta sunt drepte şi paralele, iar marginile sus/jos sunt paralele dar arcuite cu mijlocul în sus; cauza este neîntinderea perfectă a paginii cărţii, dar şi o poziţie neperpendiculară a aparatului foto faţă de carte.
     Acestea ar fi defecte de geometrie a paginii: defectele pot fi simple, sau o îmbinare de două defecte... chiar de trei defecte.

     Exemple de defecte de geometrie a rândurilor:
         – rânduri arcuite şi paralele – cel mai adesea având partea din mijloc a rândului arcuit în sus.
         – rânduri arcuite şi neparalele – rândurile de sus sunt arcuite spre în sus, iar cele de jos sunt arcuite spre în jos;
         – rânduri vălurite – rândurile au formă de valuri.

     Problema paginii butoite încă nu este rezolvată; sau, mai exact spus, rezolvarea este incompletă;
     Toate celelalte defecte sunt rezolvate rapid şi cu rezultate foarte bune; Mai mult decât atât majoritatea opţiunilor de corectare funcţionează automat, timp în care unele opţiuni funcţionează automat cu posibilităţi de corecţie manuală.

     Pentru ca toate defectele de geometrie să poată fi corectate în Abbyy ar mai fi nevoie de o opţiune; mai exact de perfecţionarea unei opţiuni.
     Este vorba de opţiunea "Split page", unde împărţirea imaginii se poate face perfect vertical sau perfect orizontal. Dacă am avea posibilitatea unui split vertical cu posibilităţi de înclinare manuală a liniei de split, ca în cazul ScanTailor, atunci problema defectelor de geometrie ar fi complet rezolvată.
     Este adevărat că avem opţiunea "Descrew", dar nu rezolvă necesitatea unui split înclinat [uneori opţiunea "Descrew" face mai mult rău decât bine].


     Şi o ultimă problemă:
     Referitor la problema Header şi Footer.
     Pentru ca Header şi Footer să fie integrate în text şi pentru a se păstra stilul fonturilor, în Abbyy 11/12 se poate salva în format RTF Exact Copy şi apoi rulat prin AutoCorect.
     Fişierul de tip RTF Exact Copy nu trebuie modificat nici măcar cu un caracter înainte de a fi rulat în AC; pur şi simplu în Ac se rulează exact forma obţinută din Abbyy.
     La rularea prin AC a unui RTF Exact Copy, toate notele de subsol, toate Headers şi Footers vor fi integrate în text şi vor fi în totalitate corectate la rularea opţiunilor.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
Într-un minighid despre Scan Tailor pe care l-am postat acum cîţiva ani, am spus că distorsiunile de tip pernă sau de tip butoi nu pot fi corectate pentru că opţiunea Dewarping din Scan Tailor nu oferă puncte de tragere şi pe părţile laterale ale imaginilor care au nevoie de corectarea geometriei.

De fapt lucrurile se pot rezolva foarte simplu:
1. Imaginea sau imaginile cu probleme de geometrie se corectează mai întîi pe laturile sus-jos, pe care avem punctele de corecţie.
2. Se răstoarnă (se rotesc cu 90ş) imaginile corectate la primul pas, se creează un nou proiect Scan Tailor cu noile imagini, apoi se corectează geometria pe laturile respective.

Toate aceste lucruri se fac manual, aşadar e nevoie de multă răbdare, dar rezultatele sînt pe măsură.

Întrebare: cine poate să-mi dea şi mie kitul de instalare A12 (cu tot cu „medicament”)?


Reeditare:
Mulţumesc tuf.

Modificat de uciN (acum 9 ani)


pus acum 9 ani
   
tuf
Vizitator




Mie imi place mult partea de preprocesare din timpul scanarii.
Am mereu activate optiunea DESKEW si STRAIGHTEN TEXT LINES.

Nu stiu daca ati observat, dar pe acele randuri uuuuuusoooor rotunjite de curbura paginii, rata de greseli e naucitoare. Dar daca indreptati randul... alta viata.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am constatat la Abbyy 12 o micuţă problemuţă... cam cât munţii Făgăraş.
         - Încărcat imagini [este adevărat, imaginile sunt ceva mai dificile.
         - Dat comanda citire întreg documentul, fără urmărirea şi corectarea suprafeţeleor de citire.
         - salvat scan-control în format PDF/A  [PDF Searshable].

     La verificarea PDF am găsit zone albe pe paginile PDF-ului, ca în următoarele exemple:
         

     Am verificat superficial în Abbyy 12 şi am constatat că în acele zone era vorba de suprafeţe-imagini.
     Am încărcat absolut aceleaşi imagini în Abbyy şi am procedat similar.
     PDF/A obţinut are paginile complete şi corecte.

     Nu vreau să spun... dar vreau să zic... atenţie la Abbyy 12...
     E posibil să fi avut eu o setare aiurea în opţiunile Abbyy 12... am să verific asta, dar deocamdată rămâne în picioare constatarea de mai sus...
     Am făcut deja modificări şi problema persistă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



De asta fac eu zonarea manuala a textului.
Uneori o mai ia si Abby razna si in loc de text iti baga imagini sau zone goale de text.

Dar nu prea are sens daca zici ca ai salvat in format pdf. Trebuia sa iti apara portiuni din pagine ca imagini, dar nu ca zone goale. Nu prea as crede ca e Abby vinovat.

Sa imi dai si mie acele imagini sa vad daca se repeta si la mine.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     În mod normal, zonarea are legătură cu OCR-ul.
     Dacă nu avem o zonare bună, asta n-ar trebui să influienţeze imaginile din PDF/A, ci doar stratul OCR din acest fişier.

     Fac o paranteză pentru cine nu ştie şi este interesat:
     PDF/A este un PDF Searshable [cu căutare].
     Un fişier Searshable este format din două straturi:
             - stratul vizibil este [ar trebui să fie] imaginea fidelă a paginii [paginilor] scanate, deci este un PDF sau DJVu din imagini;
             - stratul invizibil este un OCR brut, obţinut după realizarea citirii de către program a tuturot paginilor.
     Orice fişier Searshable, fie el PDF sau DjVu, prin folosirea opţiunii Find [căutare] permite căutarea unui cuvânt sau fragment de text, aşa cum se întâmplă în Word sau orice alt editor de text. Singura problemă este că vorbim despre OCR brut, deci căutarea este perfect valabilă doar în cazul unui scan foarte bun urmat de prelucrări de calitate.
     
     În cazul menţionat mai sus, Abbyy 12 are probleme cu stratul imagine, ceea ce nu se întâmplă în cazul Abbyy 9 - Abbyy 11.

     Am urcat imaginile iniţiale, imaginile finale şi un PDF realizat cu A11.
     Atenţie parola la dezarhivare este nickul meu exact aşa cum apare pe forum.
     Pentru a preveni eventualele probleme, adresa ţi-o transmit pe MP, atât ţie cât şi oricărui user activ pe care îl cunosc.
     În acest moment arhivele se încarcă... pot fi downloadate fără probleme peste 15-20 de minute.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Posibil ca problema este totusi de la faptul ca ABBY a gasit "imagini" pe unele pagini.
"Imagini" care apoi au aparut in PDF.
Totusi eu nu am reusit sa produc problema. In cel mai bun caz imi apare doar conturul, in alb, al zonelor imagine.
Deci e posibil sa fie o problema de setari.
Am facut si un pdf din toate imaginile, iar cu exceptia cate unui contur alb pe ici pe colo, nu am gasit probleme.






Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Bun. Totuşi, eu n-am întâlnit astfel de situaţii în cazul Abbyy 9 ÷ 11.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Cum ziceam, nu prea are sens la formatul PDF.
Dar de ce nu incerci DJVU?

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     1. Practic nu mă deranjează foarte tare problema asta la Abbyy 12. Oricum, eu am instalat atât A11 şi A12 şi folosesc de regulă A11 care semişcă ceva mai repede. Apelez la A12 doar pentru prelucrare imaginilor ci geometrie dicficilă.
     Pur şi simplu am vrut să semnalez problema pentru ca userii de pe forum să fie informaşi asupra acestui lucru şi să fie atenţi când lucrează cu A12. Problemele pot fi mai mici sau mai mari.

     2. De câtva timp [cred că de vreun an, poate mai mult, poate mai puţin] postez fişierele scan atât în format PDF, cât şi DjVu; deci salvez în Djvu, darîmi este mai comod să mă folosesc de PDF.

     3. Salvez întotdeauna un fişier PDF Gray/Color Searshable la 300 dpi, pentru că deşi este relativ mare, el păstrează absolut toate caracteristicile şi calităţile folderului [documentului] Abbyy şi oricând poate fi încărcat în Abbyy şi prelucrat ca un scan. Imaginile obţinute au absolut aceeaşi calitate ca şi imaginile iniţiale obşinute la scanare, bineînţeles, cu menţiune că sunt cropate, splituite etc...
     Fişierul DjVu [chiar dacă vorbim despre Djvu Gray/Color Searshable la 300 dpi], are rata de compresie foarte mare [dovadă mărimea lui incomparabil mai mică], şi pierde mult din calitatea imaginilor iniţiale. El poate fi folosit uşor ca scan_control, dar dintr-un Djvu nu mai pot reconstitui imaginile la calitatea iniţială.
     Asta este o problemă care ar trebui detaliată şi discutată separat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Pagini: 1  

Mergi la