Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
|
Lista Forumurilor Pe Tematici
|
Forum Romania Inedit | Reguli | Inregistrare | Login
POZE FORUM ROMANIA INEDIT
Nu sunteti logat.
|
Nou pe simpatie: Nebunatyka la Simpatie.ro
| Femeie 23 ani Bucuresti cauta Barbat 23 - 73 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Salutări!
Am constatat încă o dată că sunt un aiurit şi un necunoscător... asta ca să nu folosesc adjective mai neplăcute, dar mai aproape de adevăr. Mai întâi, că deşi folosesc ABBYY de pe vremea lui ABBYY 6, am crezut mereu că acesta este un soft american. De-abia de vreo lună am constatat şi eu că dezvoltatorii sunt ruşi şi că softul se dezvoltă la Moscova. Bravo lor! Mai apoi, că deşi mă gândeam că e timpul să apară o nouă versiune, am căutat cu Gogu pe ABBYY 13 şi nu era pe nicări. Nu mi-a trecut prin cap că oamenii au să sară peste cifra păguboasă 13 şi au să sară direct la 14. Chiar dacă sunt ei ruşi, ăsta e obicei împrumutat de la americani.
Mai acu' fo lună m-am trezit şi eu că există o nouă versiune şi că se numeşte ABBYY 14. Am descărcat versiunea trial [care e valabilă doar 15 zile] şi am fost curios să văd ce noutăţi apar. Am rămas va viţelul la poarta nouă... ce zic eu viţel?... am rămas ca ta'su după ce a suferit oarece intervenţii chirurgicale. Chiar am crezut că am descărcat alt program.
Altă dambla americană!... Ruşii de la ABBYY au schimbat complet interfaţa, da' când zic complet, înseamnă schimbată peste tot. Adicătelea, când s-a trecut de la Word 2003 la Word 2007 tot mai găseai ceva cunoscut pe ici pe colo. La ABBYY nu mai recunoşti nimic din interfaţă.
Apropo, nu numai eu sunt căscat, ci şi rumînii de la ABBYY.ro. Îi iert pentru că bănuiesc că nu sunt prea mulţi români acolo. Ăştia zic - poate chiar cred că la instalare se poate alege şi limba română... da' de unde? Nicio română.
Două scurte concluzii: - ABBYY 14 este dat dracu' de bun. Neică e bun rău şi ştie să facă o grămadă de giumbuşlucuri, la care nici că te-ai fi gândit vreodată. - din cauza modificării interfeţei este nevoie de studiu serios pentru a lucra cu el.
Apropo de "din cauza"! Eu am cam obosit să se tot spună cât este de greşită folosirea lui "din cauza" în locul lui "datorită" şi viţă-vercea. Chestia asta este doar o convenţie lingvistică şi orice rumân va înţelege ce vrei să zici, indiferent care dintre variantele "din cauza / datorită" ai folosi-o. Mi se pare ceva mai complicat ca mam'mare să priceapă chestia cu focusatu' şi alte zeci de asemenea cuvinte. Pe de altă parte, de ce "cauza" are conotaţie negativă, adică este vinovată de ceva, iar "datorită" este aşa de pozitiv de parcă ar fi "mulţumită". Există CAUZĂ şi EFECT. Cauza poate avea componentă negativă sau pozitivă. De ce să stabilim noi acum că ea este întotdeauna negativă. Mai mult decât atât, de unde până unde "datorită" e de bine?... "A fi dator" sau "datorie" e de bine? Înseamnă că dâaia nu mă mai bagă în seamă unul care-mi este dator? Îmi face un bine? Nu sunt împotriva convenţiilor lingvistice, da' mi se pare că unii [reporteraşi] exagerează împărţind lumea în somităţi şi analfabeţi în funcţie de cum fgolosesc "din cauza" şi "datorită"
Cât despre ABBYY 14, aş mai avea ceva de spus, dar sunt curios ce spun alţi colegi despre el. Am să revin cu vreo două chestii pe care le face ABBYY 14 şi care m-au impresionat.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 7 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 7 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Practic, acum programul este o suită de programe. Printre acestea, unul care-mi pare foarte interesant - nu pentru toată ziua, ci în situaţii speciale - este un Editor PDF, care editează nu numai PDF din text, ci şi PDF din imagini. Trec peste chestia cu diverse marcaje [sublinieri de text, încadrare în chenare de diverse forme], comentarii, ştergere... şi mă opresc la editare propriu-zisă:
De exemplu, avem o imagine de pagină în care pe ici, pe colo, unele litere sunt ciuntite, nu se văd bine sau aproape deloc etc... dar din context înţelegem clar despre ce e vorba şi le-am putea reconstitui. Editorul permite să te duci exact pe litera, pe secvenţa de cuvânt sau cuvântul respectiv şi pur şi simplu scrii de la tastatură litera respectivă. Editorul calculează el cam ce font şi ce mărime corespunde imaginii, dar îţi permite să şi alegi un font sau o mărime mai bună. Litera scrisă de la tastatură înlocuieşte litera din imagine.
Bineînţeles că nu e cazul să ne apucăm de editare de text în imagini, este o muncă de ocnaş, sau de chinez bătrân cum zicea în urmă cu ceva timp doamna Laura Bocancios, dar există situaţii când găsim o carte rară, iar PDF-ul din imagini ar fi foarte valoros. Uneori o astfel de muncă chiar merită efortul.
Pe de altă parte ABBYY 14 "vede" mai bine decât anterioarele versiuni. Am testat o pagină cu text mic, practic o pagină cu note de sfârşit de capitol, pe care anterioarele nu au putut s-o citească şi el a citit-o destul de repede şi a redat-o destul de corect. Undeva prin ABBYY există un ceva specific diverselor limbi; nu cred că e vorba de dicţionarele pe care le cunoaştem, ci de altceva. Ai zice că engleza este recunoscută mult mai uşor şi corect pentru că nu are diacritice, ipoteză care este de altfel corectă. Ei bine, nu este nu numai asta. Am prelucrat în urmă cu vreo două luni un PDF din imagini în limba franceză: diacritice la greu... Scanul era de toată jena, cu litere înceţoşate cu acel aspect în care literele se prelungesc în fundal etc... Una peste alta, am încercat să fac OCR fără nicio tragere de inimă; rezultatul a fost surprinzător - OCR-ul a ieşit foarte-foarte bun. Şi când zic bun, ţin cont şi de munca depusă la corectare-confruntare... şi n-am avut la îndemână un AutoCorect pentru franceză... Cu toate astea textul era aproape perfect. La aceeaşi calitate a scanului ar fi fost vorba de limba română, sunt convins că mai corectam şi astăzi. Deci, pentru ABBYY, ca şi pentru alte softuri există limbi şi limbi...
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 7 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
Il astept ca pe painea calda, daca e atat de bun pe cat zici.
Treaba cu adaugarea literelor/cuvintelor lipsa in pdf-imagine, am facut-o o singura data. Nu aveam cum sa mai fac rost de carte ulterior, iar unele pagini au iesit urat de tot. Asa ca am adaugat direct in imagine, cu un editor de imagine, ceea ce lipsea. Si, da, este munca de ocnas. A fost mai usor deoarece nu m-a interesat sa fac sa para adaugirile ca fiind parte din imagine. Am scris cu rosu :)
_______________________________________ Totul despre cărți - About e-books - Tehnici de scanare, sfaturi, proiecte etc. - Support, future projects, etc.
|
|
pus acum 7 ani |
|
gaboy74
Membru Gold
Inregistrat: acum 8 ani
|
|
Din cate inteleg nu ai folosit Abbyy 12 care personal mi se pare excelent.
Prin comparatie 14 vs 12 - cf site oficial - nu am sesizat mari diferente asa ca momentan mai astept. Poate singura cu care binenteles se lauda cu fiecare versiune este OCR-izarea mai buna - ceea ce cred ca e pana la urma obiectivul principal...la care se mai aduaga orice limba noua de recunoastere + dictionare imbunatatite care sunt de fapt legate de primul obiectiv.
Intr-adevar Abbyy recunoaste mult mai bine ceea ce am putea numi limbi de circulatie internationala. De multe ori mi s-a intamplat sa intalnesc u cu trema (umlaut) in loc de "ii" sau diacritice in cuvinte romanesti asemanatoare cu cele spaniole. Ceea ce pana la urma e normal. Cu toate acestea trebuie sa recunoastem ca OCR-izare in lb romana este foarte buna, dar totusi dependenta intr-o mai mare masura de un scan bun, decat paote pentru franceza de exemplu.
Iata ca rusii au reusit sa puna la dispozitie 2 softuri foarte importante in activitatea noastra - ScanTailor si Abbyy. E drept fondatorul Abbyy este de origine chineza - dupa mama parca - abbyy in felul lui facand intr-adevar o munca de chinez
|
|
pus acum 7 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 7 ani |
|
maxxro2007
Membru Senior
Inregistrat: acum 17 ani
|
|
|
pus acum 7 ani |
|
mindcage
Membru Puf
Inregistrat: acum 6 ani
|
|
Salut! Daca mai este cineva interesat de Abbyy 14 puteti sa-l downloadati de aici: https://repack.me/software/repacks/offi ... er-14.html Am mai folosit Abbyy pdf Transformer 12 si nici nu se compara, din pacate nici in versiunea aceasta nu au rezolvat problema cu litera ''Î''.
Modificat de mindcage (acum 6 ani)
|
|
pus acum 6 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 6 ani |
|
mindcage
Membru Puf
Inregistrat: acum 6 ani
|
|
Acesta este linkul direct de dld: https://drop.me/BxpWQz Nici eu nu vorbesc rusa. Distractie placuta cu programul!
|
|
pus acum 6 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 6 ani |
|
mindcage
Membru Puf
Inregistrat: acum 6 ani
|
|
Este singura versiune incercata la care ESET-ul nu a comentat nimic...
|
|
pus acum 6 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 6 ani |
|
mindcage
Membru Puf
Inregistrat: acum 6 ani
|
|
Ai dreptate, cele mai multe AV-uri au detectat ceva.
|
|
pus acum 6 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 6 ani |
|
maxxro2007
Membru Senior
Inregistrat: acum 17 ani
|
|
a aparut crack ABBYY FineReader Enterprise 14.0.107.212 Multilingual
|
|
pus acum 5 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 5 ani |
|
pelerinul
Membru Puf
Inregistrat: acum 7 ani
|
|
Eu l-am cumparat. Dupa atata piraterie am zis sa dau o mana de ajutor dezvoltatorilor acestui soft ca merita pentru toata munca depusa!
|
|
pus acum 5 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 5 ani |
|
pelerinul
Membru Puf
Inregistrat: acum 7 ani
|
|
Stiu si eu? Sa zicem ca scanez carti vechi de dinainte de '89 sau ai caror autori sunt morti demult. Ale cui drepturi le incalc? Fara filozofii de genul ca "al editurilor, etc." pe cand la soft e cu totul altceva. Sunt multe carti a caror copiere nu e piraterie... sau cel putin nu dpdv moral. Parerea mea! Hâc!
|
|
pus acum 5 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Pelerinule, sunt întru totul de acord cu tine. De bine de rău, antivirusul nu ţipă la o carte indiferent de calitatea ei, dar pot fi mari probleme cu un soft... Şi, se pare că de data asta, ruşii de la ABBYY şi-au luat măsuri de protecţie mult mai serioase. Pe de altă parte, deşi e posibil să fiu un pic sau mai mult paranoic, am totuşi din ce în ce mai mult senzaţia că pirateria cărţilor nu are sens unic, ci uneori funcţionează în dublu sens... că nu numai noi luăm cărţi de la edituri... Sunt câteva lucrări care au apărut în urmă cu ceva timp în traducere inedită pe forum, lucrări care au apărut de curând la o editură. Tare aş fi preferat ca editura D e x o n să le fi tradus înaintea noastră... ne scutea de-o muncă...
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 5 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 5 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Mulţumesc, @Stelevadris!
Am instalat varianta ta. Nici la mine nu zice nimic Bitdefender. Din păcate ai dreptate. Interfaţa e orice altceva decât cea la care te-ai aştepta.
Interfaţa lui A12 ajunsese destul de prietenoasă... şi hop!... la 14 dai de ceva cu aspect de relief selenar. Acum trebuie văzut dacă sunt şi performanţe şi mai ales deficienţe faţă de versiunile anterioare. Din păcate 11 şi 12 aveau şi ele cel puţin câte o hibă. La A10 la prelucrare imagini, meniul crop, Abbyy putea să "ţină minte" poziţia dreptunghiului pe imagine, astfel că la imaginea următoare de acelaşi tip [pagini pare sau impare] nu era nevoie să mai culisezi dreptunghiul de crop, astfel că cropul se putea face mult mai rapid. A11 era mai bun decât A10 dar a pierdut această chestie de la crop. La A11 dreptunghiul de crop se poziţionează întotdeauna lipit de colţul stânga sus. A12 a venit cu şi mai multe îmbunătăţiri [PDF şi DjVu mult mai mici, citire mai rapidă, mult mai multe opţiuni de prelucrare imagini..] dar are o hibă mare pe care anterioarele nu o aveau... Are o problemă cu recunoaşterea rezoluţiilor. Dacă o imagine este prelucrată, să zicem, cu PhotoScape, şi apoi încărcată în Abbyy 12, acesta [Abbyy] va recunoaşte de regulă o valoare falsă a rezoluţiei. Deschidem o astfel de imagine cu PaintNET [sau alt editor de imagine], acesta va arăta o rezoluţie de 96 dpi. Abbyy 11 vede şi el tot 96... doar că frate-su ăsta mai mic, Abbyy 12 va zice că e 144... ba mai mult decât atât s-ar putea să vadă unele imagini cu 144, altele cu altă rezoluţie. Ca să fie treaba oablă trebuie să informez că rezoluţia corectă este cea arătată de editoarele de imagini şi de Abbyy 11, iar rezoluţia arătată de A12 este eronată.
Întrebarea este: ce o fi fiind mai performant la A14? Şi mai ales: a fi având şi el o hibă? Ce bine-ar fi ca hiba să fie doar moaca asta nouă şi enervantă, demnă de Windows 3.11!?!
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 5 ani |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 5 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Cred că pentru corectare manuală a OCR [deşi eu nu prea văd motivul pentru care ai mai face aşa ceva!?!] se poate folosi şi Abbyy 14. Practic Abbyy 14 este o suită de programe. Ceea ce se numeşte "OCR Project" este ceea ce ştiam noi despre Abbyy. Celelalte sunt programe sau utilitare - să zic aşa - noi. Ei bine, Abbyy 14, în "OCR editor" are şi el 3 ecrane ca şi Abbyy 9, în partea de jos aflându-se o fereastră care se poate mări pe verticală sau reduce aproape de zero şi în care se vede porţiune de pagină-imagine mărită. Ca şi la Abbyy 9 dacă te duci în dreapta în ecranul de text şi faci click undeva în text, în fereastra de jos [imagine mărită] cursorul se duce în acelaşi loc pe imagine.
Ce-am mai constatat după câteva teste cu o singură carte? [deocamdată] Viteza de citire/recunoaştere este incomparabil mai mare decât la versiunile anterioare. Viteza de scriere a PDF/DjVu - în cazul meu - este la fel sau chiar mai mică decât la Abbyy 12. A redus numărul de PDF-uri la două variante: - 1. PDF Searchable este deci un PDF care conţine atât stratul imagine cât şi stratul OCR şi, în concluzie, se poate face căutare de cuvinte; PDF-ul are imaginea în stratul de deasupra şi OCR în stratul de dedesupt; este varianta clasică de la PDF/A din Abbyy 12. - 2. PDF Image-Only este ceea ce numeam noi în urmă cu ceva timp PDF din imagini. Acest tip de PDF conţine doar stratul imagine [deci nu are încorporat şi stratul text OCR]; el este ceva mai mic decât PDF Searchable. În cazul textului meu nu a fost o diferenţă prea mare, dat fiind că era vorba de prelucrare AN a imaginilor şi ambele PDF sunt relativ mici.
De reţinut că la setările PDF mi-am prins deja urechile. În Abbyy 12 existau nişte setări şi pentru PDF sau PDF/A existau 4 variante de setare, exprimate clar în text ce însemnau fiecare. Mai exact era vorba de numărul de straturi [imagine şi OCR-text] şi de poziţia lor; text peste imagine, imagine peste OCR-text, doar imagine sau doar OCR-text. Ei bine, în Abbyy 14 PDF/A are 8 variante: PDF/A-1a [1b], PDF/A-2a [2b, 2u] şi PDF/A-3a [3b, 3u]. Eu bănuiesc [fără probe] că acel 1, 2 sau 3 este un grad de condesare/codare, iar variantele a, b, u - ar putea fi versiunile în funcţie de numărul de straturi şi poziţia lor... Rămâne de văzut şi cercetat.
Încă n-am încercat nicio prelucrare a imaginilor, dar fereastra de editare pare destulde apropiată de fereastra predecesorului Abbyy 12.
Dekomdată, cam atât... A!... Nu numai viteza de citire/recunoaştere este clar mai mare, dar pare că şi recunoaşterea este ceva mai corectă [iar n-am probe concludente... este vorba doar de o impresie la prima vedere].
Rog colegii care folosesc deja Abbyy 14 să-şi posteze constatările lor spre a ne fi de folos şi celorlaţi care nu suntem foarte cunoscători ai computerelor.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 5 ani |
|
tzepeshgr
Membru Junior
Inregistrat: acum 5 ani
|
|
Stelevadris a scris:
Cine doreste Abby 14, poate sa il descarce de aici:
Nu mi-a creat probleme cu antivirusul. Nu imi place interfata deloc. |
Poti reposta, te rog frumos? Linkul nu mai este valabil.
Multumesc anticipat.
_______________________________________ Read sometimes for the story, Bobby. Don't be like the book-snobs who won't do that. Read sometimes for the words - the language. Don't be like the play-it-safers that won't do that. But when you find a book that has both good story and good words, treasure that book. Stephen King, Hearts in Atlantis
|
|
pus acum 5 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 5 ani |
|
constantin25
Membru Puf
Inregistrat: acum 14 ani
|
|
puteti reposta linkul pentru abbyy 14, va rog? Multumesc!!
Modificat de constantin25 (acum 5 ani)
|
|
pus acum 5 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** @constantin25 - în postarea mea de mai sus am făcut reupload pe mediafire. Acum linkul ar trebui să nu mai expire.
V-am spus mai demult că n-am constatat diferenţe clare ale calităţii OCR între Abbyy 14 şi Abbyy 12.
Vă informez că am continuat cu testarea Abbyy 14. Am prelucrat nişte imagini [cred că erau fotografiate şi nu scanate] cu multe deformaţii de geometrie a paginii. Este vorba despre cartea L.Neamtu – Orhidee pentru Marifelis scanată şi postată de @24Dec2012 pe topicul "Din sacul lui Moş Crăciun" din dec. 2013, link topic:
Ei bine, deşi scanurile aveau diverse defecţiuni de geometrie [pagină trapez, rânduri vălurite etc...] Abbyy 14 a reuşit să "scoată" nişte imagini decente chiar de la început, la preprocesarea automată. Cu o serie de alte intervenţii manuale de prelucrare a imaginii, am obţinut în Abbyy 14 un PDF şi OCR pe care se poate face o corectură aproape comodă.
Deci, DA, viteza de citire este mult mai mare, iar preprocesarea imaginii este foarte bună şi în plus nu face unele "prostioare" pe care le face Abbyy 12, precum următoarele două: - Abbyy 12 poate face recunoaştere eronată a rezoluţiei dacă imaginile sunt prelucrate cu doverse softuri de editare imagini; - Abbyy 12 face adeseori o "corectare" a imaginii acolo unde nu e nevoie din motive doar de el ştiute şi anume: unele imagini le roteşte cu câteva grade spre stânga sau spre dreapta deşi imaginea avea orientarea corectă, iar după rotire avem un unghi eronat.
Din ce am constat eu ambele probleme sunt rezolvate în Abbyy 14. Sper ca şi alţi colegi să posteze constatările lor personale pentru a cunoaşte mai bine această versiune Abbyy.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 5 ani |
|
ank60
Membru Junior
Inregistrat: acum 12 ani
|
|
Buna ziua, In primul rand vreau sa va multumesc pentru link-ul pentru Abbyy 14. Am incercat reducerea dimensiunii unui fiser PDF si rezultatul a fost destul de bun intr-un timp acceptabil. Intr-adevar, viteza de citire si preprocesarea sunt superioare celor din Abbyy 12. Dar am intampinat urmatoarea problema: la transmiterea/salvarea textului ca Plain text intr-un fisier Word (folosesc Word 2003), literele cu diacritice apar cu Times New Roman, iar restul literelor cu Arial. Cand incerc sa schimb (in Word) tot textul cu Arial sau orice alt tip de font, imi apar dreptunghiuri in locul literelor cu diacritice. Cu Abbyy 12 nu aveam aceasta problema. Va rog frumos sa ma ajutati cu un sfat. Va multumesc si va doresc un week-end placut
|
|
pus acum 5 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 5 ani |
|
ceciluta
Membru Junior
Inregistrat: acum 12 ani
|
|
|
pus acum 5 ani |
|
Gângurel
VETERAN
Inregistrat: acum 12 ani
|
|
|
pus acum 4 ani |
|
un_tractor_grăbit
Membru Puf
Inregistrat: acum 4 ani
|
|
Bună ziua! Îmi poate explica și mie „ca la proști” cum fac și eu un PDF searchable cu Abbyy 14? Eu am încercat cu click dreapta pe fișier (PDF-ul cu pricina) și convert to searchable PDF document, iar la setări am ales „Best quality”, pentru că nu vreau să altereze calitatea fișierului inițial, dar mi-a ieșit un PDF de trei ori mai mare și care are un comportament... ciudat când îl deschid în Acrobat. Adică se mișcă foarte greu, îmi cocoșează procesorul și când dau scroll o dată se vede fișierul inițial, altă dată textul/layerul OCR... Mulțumesc.
|
|
pus acum 4 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Salutare!
Tractorule, noi ăştia mai vechi folosim ceva mai rar Abbyy 14 [respectiv 15, care n-am înţeles ce aduce nou faţă de 14], pentru că la ceea ce facem noi este suficientă versiunea 12, care este şi ceva mai simplă. La ceea ce ai semnalat, aş menţiona două chestii: Softul de citire şi softul de Editare PDF.
Acrobat este mama şi tatăl PDF-urilor şi el a stabilit toate regulile de creare şi editare a acestora, aşa că are pretenţii ridicate şi la citirea lor, astfel că el nu acceptă să deschidă PDF-urile care nu respectă toate standardele stabilite de el. Eu am renunţat la Adobe Reader de vreo 5-6 ani sau chiar mai mult şi folosesc varianta gratuită PDF-XChange Viewer de la traker
Detalii amănunţite despre acest soft se găsesc pe topicul De menţionat că între timp au apărut versiuni noi PDF-XChange Viewer. Atât despre vizualizatoare PDF.
Acum să revenim la Crearea PDF cu Abbyy 14.
Deschidem Abbyy 14. Alegem pachetul "Open in OCR Editor" şi nu "Open PDF Document" "Open in OCR Editor" are mai multe opţiuni.
După deschiderea "Open in OCR Editor", încărcăm PDF cu pricina. E bine să salvăm proiectul: File > Save OCR Project. Salvarea este utilă dacă avem nevoie să refacem OCR sau PDF/DjVu etc. Accesăn iconul "Edit Image"; este primul icon din grupul din jumătatea dreaptă a ferestrei principale. Acum accesăm "Resolution" şi trebuie ca rezoluţia să fie de 300 dpi sau 600 dpi. Dacă avem rezoluţie mai mică de 300 dpi sau de maxim 450, stabilim rezoluţia 300 dpi pentru toate paginile. Ideea este să avem exact 300 dpi care este rezoluţia optimă, ori exact 600 dpi în cazul când deja avem această rezoluţie în cazul imaginilor alb-negru. Apăsăm butonul "Exit Image Editor". Accesăm opţiunea Recognize > Recognite All Pages şi aşteptăm să se facă recunoaşterea tuturor paginilor. Accesăm meniul Tools > Options > Format Settings > PDF şi la Image quality stabilim "Balance". Nu este nevoie să alegem opţiunea "Best quality" pentru că avem rezoluţia 300 dpi care este arhisuficientă şi nu se alterează calitatea PDF. Revenim în fereastra principală. Din meniul File > Save As, alegem Searchable PDF Document
Dacă paginile încărcate conţin şi imagini [poze, desene, scheme etc...], atunci la opţiunea de citire [Recognize] trebuie să verificăm ca toate imaginile să fie încadrate într-o arie de citire de tip "Picture" şi, în plus şi obligatoriu, toate ariile de tip "Picture" să aibă o formă PERFECT dreptunghiulară, adică să nu aibă sub nicio formă vreo latură zimţată, aşa cum se întâmplă adeseori la ariile de tip Text. De asemenea în interiorul ariilor de tip "picture" nu trebuie să mai existe arii de citire de alt tip. Dacă nu sunt îndeplinite toate aceste condiţii, în PDF-ul rezultat imaginile cu astfel de probleme nu vor fi redate corect sau nu vor fi redate deloc.
Sper ca cele scrise să-ţi fie de folos!
Seven
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 4 ani |
|
un_tractor_grăbit
Membru Puf
Inregistrat: acum 4 ani
|
|
Mersi frumos, Seven, pentru răspunsul tău, mi-a fost super-util. Sunt foarte mulțumit de rezultat. Mersi și pentru viewer, mi-am descărcat versiunea portabilă, se mișcă foarte bine. Sănătate! Ție și tuturor membrilor acestei minunate comunități a pasionaților de carte electronică. Spre rușinea mea, v-am descoperit cam târziu.
|
|
pus acum 4 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 4 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Cu vreo 3 zile în urmă mi s-a întâmplat şi mie să obţin cu Abbyy 14 două PDF cu exact aceleaşi probleme ca cele semnalate de @un_tractor_grăbit. Era vorba de două documente Abbyy diferite, dar caracteristicile PDF erau identice: am folosit imagini color, iar setările în Abbyy erau cele pe care le-am recomandat în postarea de mai sus. Cu toate astea, fiecare pagină PDF se deschidea mai întâi ca OCR, deci text negru pe fundal alb şi după câteva secunde se afişa în modul corect ca imagine color. Chiar dacă fişierul rămânea încărcat în PDF-XChange Viewer, la o nouă vizualizare problemele se repetau.
Am încărcat în Abbyy 12 absolut aceleaşi imagini şi folosind exact acelaşi mod de stabilire a ariilor de citire, am obţinut două PDF care se încărcau şi se vizualizau fără probleme. Ba mai mult decât atât, erau şi olecuţă mai mici... cam cu 10% faţă de cele obţinute cu Abbyy 14. E vorba de fişiere Searchable PDF/A.
Eu cred că asta este una dintre problemele lui Abbyy 14 şi, probabil, din cauza asta s-au şi grăbit să scoată Abbyy 15.
Personal acum mulţi ani am început cu Abbyy 6, am trecut relativ grăbit prin 8 şi ca mulţi colegi de pe forum am folosit mult timp Abbyy 9, apoi am trecut din nou mai grăbit prin 10 şi din nou foarte mult timp 11, aşa că am cam văzut ce a adus nou fiecare variantă. Abbyy 11 îl cam ştie toată lumea.
Abbyy 12 are o viteză de citire mai mare, opţiuni mai bune de procesare imagini, şi poate cel mai important: obţine PDF/A mai mici de 10 ori decât cele obţinute cu Abbyy 11. Totuşi, are şi el o problemă destul de mare... mă rog se zice "Software bug": nu "vede" corect rezoluţiile diferite de 300 şi 600 dpi. Deci dacă n-avem imagini cu rezoluţii standard [300 sau 600 dpi], el vede valori false ale rezoluţiilor. De exemplu, la o imagine de 96 dpi el spune orice altceva, de multe ori valori aiurea tău, adică 272 dpi sau alte aiureli din astea. Şi asta se întâmplă de fiecare dată. De aceea eu folosesc de bază Abbyy 12, dar îl am la îndemână pe 11 pentru astfel de probleme.
Abbyy 14 procesează şi mai bine imaginile, probabil are o viteză de citire mai mare decât 12 [deşi n-am făcut teste concrete în sensul ăsta], dar mi s-a părut că "ronţăie" mult mai mult timp atunci când salvează PDF şi DjVu. Este interesant că are enşpe mii de variante de PDF/A, doar că eu nu pricep care-i diferenţa dintre ele. Şi acum am descoperit şi chestia semnalată mai sus...
Habar n-am ce a mai rezolvat Abbyy 15 şi, eventual, ce bug proaspăt are şi el... şi nici nu mai sunt tentat să încarc varianta de evaluare pentru că e posibil să descopere că am versiuni vechi şi să "prăşească" ceva pe acolo.
Două chestii aş mai zice: Pentru ceea ce facem noi pe aici, cred că deocamdată, este suficient Abbyy 12 [eventual, plus 11 pentru intervenţii]. De altfel, am rămas foarte surprins că una dintre firmele româneşti partenere Abbyy, lucrează astăzi când vorbim cu Abbyy 11. Mă rog, este posibil ca aici să fie vorba şi de chestia aia numită "a te zgârci la tărâţe", că doar n-or fi cumpărat dezvoltatorii ăştia Abbyy 11 pe 100 de ani.
A doua chestie... voiam să spun că îmi place foarte tare expresia asta: "Software bug". Să mă ierte colegii şi prietenii IT-işti de pe forum şi din familie, dar expresia asta sună atât de normal în domeniul ăsta, că ţi se pare o chestie de bonton ca programele să mai aibă câte un "bug" pe ici pe colo. Mă întrebam: oare cum ar suna "chirurgical bug" sau "genistic bug"... dar asta e altă problemă.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 4 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
═══════ ABBYY FineReader 16 ═══════
În primul rând, Abbyy şi-a schimbat locaţia... acum este un soft american.
PREŢ: Aşa cum mai multe softuri americane au renunţat la licenţa all time şi oferă doar licenţe-abonament pe un an... şi ABBYY s-a spurcat la şmecheria asta. Dacă Abbyy 15 standard costa cca 850 ron pe timp nelimitat, Abbyy 16 Standard costă cu discount cu tot "doar" 440,99 ron pe an.
NOUTĂŢI:
Meniul EDIT. Aici a apărut o nouă opţiune: "Delete Blank Pages". Opţiunea este utilă în cazul scanării documentelor printate pe o singură faţă a colii, scanate cu aparate cu alimentare automată. În cazul cărţilor recomand păstrarea paginilor albe pentru ca paginile [tipărite în] PDF să fie sincronizate cu numărul de pagină afişat de vizualizatorul PDF, pentru a găsi mai ulor în PDF o anume zonă de text.
Meniul RECOGNIZE: Aici nu apar opţiuni noi, dar sunt cel puţin 3 noutăţi: – limba română [Romanian] are acum dicţionar integrat în soft. Trebuie menţionat că în Abbyy "Romanian" standard are diacritice cu virgulă. Reamintesc că AutoCorecd procesează texte exclusiv cu diacritice cu sedilă, aşa că pentru cei ce corectează direct în AutoCorect sau procesează OCR-uri de calitate slabă şi foarte slabă, ar fi nevoie de căutare în PDF pentru identificarea şi editarea erorilor. În acest caz ar fi indicat ca în Abbyy să se creeze o limbă particularizată "Romanian cu sedila" - dar trebuie reţinut că în acest caz nu mai se beneficiază de dicţionarul integrat. – citirea/recunoaşterea paginilor pare ceva mai rapidă faţă de versiunile anterioare. – citirea/recunoaşterea este ceva mai bună în cazul scanurilor cu mari probleme; am testat acelaşi text [în cazul meu am făcut teste cu un roman foileton publicat în 1928] în Abbyy 14 şi Abbyy 16. Am constatat că la Abbyy 16 numărul de tipuri de artefacte este redus aproape la jumătate faţă de Abbyy 14, dar şi numărul de aparaţii al unui artefact este mai redus. - doar o constatare fără importasnţă funcţională: culori de încadrare a ariilor de citire au fost modificate; s-a făcut o rocadă a culorilor între "Text" şi "Tabel", asfel că acum "Textul este albastru şi Tabelul este verde; Picture este şi el un pic mai mov.
Meniul TOOLS Am constatat că opţiunea OCR/"Load Patterns and Languages..." preia fişier de tip "ftb" salvat în Abbyy 14.
PRELUCRARE IMAGINI Sunt aceleaşi opţiuni, cu cel puţin două noutăţi: – în cazul unei opţiuni atipice, opţiunea REZOLUTION nu afişează opţiunea existentă, ci propune automat rezoluţia optimă. Totuşi stabilirea rezoluţiei poate fi făcută de utilizator. – Probabil cea mai importantă şi utilă noutate: aria de citire se păstrează chiar şi după folosirea unora dintre opţiunile de prelucrare a imaginii. În versiunile anterioare [trebuie să precizez că mă refer în special la versiunea 14 şi anterioare pentru că Abbyy 15 l-am folosit foarte puţin] după ce se făcea analiza sau recunoaşterea ariilor de citire şi se folosea cel puţin o opţiune de prelucrare a imaginilor, selecţia ariilor de citire dispărea automat şi trebuiea refăcută după fiecare intervenţie asupra imaginilor. În cazul Abbyy 16 se păstrează ariiile de citire după folosirea celor mai multe dintre opţiunile de prelucrare a imaginilor, exceptând printre altele rotirea şi splituirea imaginilor.
NASULIA NASULIILOR Aflându-mă în opţiunea de procesare a imaginilor cutăţam cu Erase o zonă de text cu umbre. Am reuşit să blochez programul de două ori, chestie care nu mi s-a întâmplat cu Abbyy 14. Menţionez că în cazul scanurilor la romanele foileton interbelice acest tip de prelucrare îmi consumă cel mai mult timp, altfel rezultă OCR cu text extraterestru... deci am folosit la greu opţiunea Erase în Abbyy 14.
Am văzut că programul a apărut pe repack.me, dar nu am verificat calitatea şi siguranţa softului de aici. Pentru curajoşi:
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 1 an |
|
Stelevadris
Moderator
Inregistrat: acum 19 ani
|
|
|
pus acum 1 an |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
NOI CONSTATĂRI PRIVIND FUNCŢIONAREA ABBYY 14, 15 şi 16
În ultimul an an folosit în mod special Abbyy 16 cu abonament şi Abbyy 14 aşa cum ştim noi, iar în ultimele 2-3 luni şi Abbyy 15, astfel că aş putea să-mi expun o oarecare părere personală despre aceste versiuni.
Ar fi vreo trei aspecte de discutat: - despre preţul licenţelor; - stabilirea numărului de nuclee pe care le poate folosi Abbyy pe timpul procesării; - despre performanţa şi problemele fiecărei versiuni în parte.
PREŢ LICENŢĂ: Abbyy s-a americanizat într-un fel sau altul, adică ori ruşii şi-au mutat reşedinţa în SUA, ori [mai puţin probabil] au fost cumpăraţi de o firmă americană. Cu ocazia asta au renunţat la licenţa permanentă şi au dat-o ca şi alte programe occidentale pe abonamente anuale. Ca idee, un abonament de un an La Abbyy 16 a fost la jumătate din preţul unei licenţe permanente a Abbyy 15... deci mult mai scump.
STABILIRE NUMĂR NUCLEE: În opţiunile de procesare a tuturor paginilor precum citirea sau schimbarea rezoluţiei, Abbyy forjează procesorul şi memoria la maxim. Am testat de câteva ori acest lucru şi am constatat că în Managerul de activităţi procesorul era folosit în proporţie de minim 95 până la 99%... şi parcă un pic mai puţin memoria RAM. Pentru cine nu ştie, în Abbyy se poate seta numărul maxim de nuclele ce pot fi folosite de Abbyy în procesare. Accesăm opţiunile "Tools" > "Options" > tabul 7 "Other". În "Other", a doua opţiune se numeşte "Number of processor cores to use for OCR". Dacă deschidem opţiunea vom găsi mai multe opţiuni care se referă la numărul de nuclee ce pot fi folosite pe timpul procesării, începând ci varianta "Default" apoi cifre de la 1 la un număr maxim de nuclee; numătul maxim este mai mic cu unul decât totalul nucleelor. Propunerea mea este să nu lăsaţi Abbyy în varianta "Default" pentru că se întâmplă ce am menţionat mai sus şi anume folosirea resurselor la maxim. În acelaşi timp nu trebuie să ăsaţi nici numărul maxim afişat, pentru că asta înseamnă similar cu Defalt. Recomandarea mea este să stabiliţi un număr de nuclee care reprezintă maxim 80% din capacitatea procesorului.
PERFORMANŢE ŞI PROBLEME Părerea mea este că Abbyy 14 este cel mai stabil; la Abbyy 15 şi mai ales la 16 am constatat că au apărut probleme la procesarea imaginilor, de pildă la opţiunea "Erase" şi se poate bloca programul. Poate că următoarea versiune ar putea rezolva problema, dar n-aş fi prea sigur. Apropo! Timp de un an de zile am tot încercat să văd dacă a apărut vreun update, dar nimic-nimic.
Deci la procesare de imagini 16 şi 15 sunt mai proaste decât Abbyy 14. La opţiunea de Recunoaşterea OCR text nu am constatat diferenţe clare între versiuni; e drept, am prelucrat texte interbelice şi antebelice, care nu numai că au cuvinte inexistente în dicţionarul de limba română al Abbyy, dar şi calitatea scanurilor era destul de slabă. În progrămelul de Editare PDF Abbyy 15 şi 16 au pierdut opţiunea de inserare text box.
Aşa că dekomdată aş merge pe 14.
Şi apropo! Abbyy 12 avea probleme cu recunoaşterea corecte a rezoluţiei; Abbyy 14, 15 şi 16 nu mai au problema asta.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 5 zile |
|
marius1966
Membru Junior
Inregistrat: acum 13 ani
|
|
Mulțumim Maestre. Ar fi o "mică" nelămurire legată de procesorul recomandat. Adică, mai pe românește, ce procesor recomandați care să nu fie nici "prea, prea" dar nici "foarte, foarte" și să-și faca si "datoria" într-un mod decent ? Merci, anticipat!
|
|
pus acum 5 zile |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 4 zile |
|
marius1966
Membru Junior
Inregistrat: acum 13 ani
|
|
Multumesc pentru explicatii. E clar acum! =D
|
|
pus acum 4 zile |
|