Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
Sabina pe Simpatie.ro
Femeie
22 ani
Bucuresti
cauta Barbat
22 - 60 ani
Forum Romania Inedit / Totul despre cărți - About e-books / [DISCUTII] Realizarea PDF din imagini Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

                  ═════════     [DISCUTII] Realizarea PDF din imagini    ═════════




      M-am gândit că o discuţie pe această temă e mai folositoare decât un tutorial.

      Deoarece pe forum au apărut o serie de useri, doritori de a pune umărul la dezvoltarea secţiunii Cărţi în limba română, consider că au nevoie de câteva sfaturi. Până la realizarea tutorialelor pe care le-am promis, consider a fi de utilitate câteva informaţii minimale, pe care le-am sintetizat mai jos.

      CU CE APARATURĂ SE SCANEAZĂ?
      Cu orice aparat ce reuşeşte să realizeze imagini la rezoluţia 300 dpi.
      Sunt de preferat scannerele cu senzor CCD, dar sunt foarte bune multe dintre multifuncţionale (in special cele din gama HP, dar nu numai); Se pot realiza imagini foarte bune cu camere foto, dar şi cu unele dintre telefoanele mobile.

      CARACTERISTICI TEHNICE:
      CULOARE:
      Se scanează COLOR pentru cele două coperte şi GRAYSCALE pentru paginile interioare.
      Paginile interioare se scanează color numai dacă se va realiza o carte în facsimil, adică un pdf din imagini ca versiune finală. E cazul revistelor, albumelor, cărţilor foarte vechi etc. Numai în acest caz pot fi folosite şi valori diferite ale rezoluţiei, în sensul că se pot face scanări/fotografieri cu rezoluţii mai mari
      Abbyy face recunoaşterea cea mai bună la imagini în Grayscale, aşa este el conceput.
      El face recunoaşterea cu foarte multe erori în alb-negru, fapt oentru care se va evita pe cât posibil salvarea imaginilor în alb-negru.
      Imaginile color cresc mult mărimea imaginilor dar nu ajută la recunoaşterea de către Abbyy.

      REZOLUŢIE:
      Rezoluţia optimă este 300 dpi.
      Abbyy este conceput să facă recunoaşterea optimă a semnelor la imagini cu rezoluţia de 300 dpi. O rezoluţie mai mică este insuficientă, fapt pentru care Abbyy va încerca să facă o convertire a imaginii, urcând-o la rezoluţia de 300 dpi. O rezoluţie mai mare nu se justifică, deoarece Abbyy va reface convenrtirea, de data aceasta coborând rezoluţia la 300 dpi.
      Sunt cazuri când trebuie să se folosească o rezoluţie mai mare: în cazul cărţilor la care se foloseşte o mărime mică a fontului pentru diferite citate, trimiteri, note de subsol sau note de final. Este, de regulă, cazul cărţilor de specialitate şi nu al cărţilor de beletristică. Este şi cazul unora dintre cărţile de beletristică ale clasicilor ruşi, unde personajele vorbesc în limba franceză, în original, şi traducerea este făcut în note de subsol. 
      Uneori se foloseşte 600 dpi doar pentru coperte, atunci când ele sunt transmise separat. (În cazul cartilor de gemul celor scanate pe forum, de regulă, nu e nevoie de acestă rezolutie)

      PRESIUNEA ASUPRA CĂRŢII.
      Din păcate, scanarea deteriorează cartea. Pentru o calitate corespuntătoare a imaginii scanatei, cartea trebuie să aibă întreaga suprafaţă în contact perfect cu ecranul scanerului. Pentru aceasta se forţează deschiderea cărţii, mai întâi pe o masă pentru forţarea deschiderii ei la maxim şi mai apoi pe ecranul scanerului. Presarea se face cu capacul închis al scanerului.
      Pentru o presare uniformă, trebuie ca cele două părţi ale cărţii de scanat să aibă aproximativ aceeaşi înălţime. Pentru aceasta ne vom folosi de alte 3-4 cărţi mai subţiri, de grosime variabilă, pe post de "lere". Astfel, peste jumătatea de carte mai subţire se pune o carte, astfel încât această parte formată din cartea suplimentară şi fascicolele cărţii de scanat să aibă aceeaşi înălţime cu partea mai groasă a cărţii de scanat.

      INFLUENŢA LUMINII EXTERIOARE
      Lumina ambientală influenţează în mod negativ calitatea imaginii scanate, deoarece pe lângă capacul scanerului, mai ales dacă nu este presată bine cartea va intra lumină suplimentară care va afecta senzorul scanerului.
      De aceea nu se scanează cu capacul scanerului ridicat, decât în situaţii speciale când dimensiunea cărţii nu permite altfel. Se va evita aprinderea unor lumini puternice, încercând să folosim cantitatea minimă de lumină necesară, iar această lumină să nu bată în mod direct asupra scanerului. Nu trebuie mers pe condiţiile din laboratoarele clasice foto, dar e bine să ne folosim de cât mai puţină lumină posibil.
      Update: Scanarea cu scaner prevăzut cu senzor de tip CIS sunt influenţată de lumina ambientală; în cazul scanerelor prevăzute cu senzor CCD influenţa luminii este mult mai mică; se poate scana fără probleme şi fără capac; totuşi, e bine să nu avem o lumină prea puternică nici în acest caz.

      ORIENTAREA CĂRŢII FAŢĂ DE SCANER
      Imaginile paginilor scanate trebuie să fie perfect verticale, sau mai exact, să tindă spre o verticalitate perfectă.
      Vom stabili o poziţie a cărţii pe scaner, astfel încât să ne fie comodă, iar pe de altă parte, această poziţie a cărţii trebuie să fie paralelă şi lipită de două dintre laturile apropiate ale ecranului scanerului, două dintre laturile care formează un unghi.
      Se va evita pe cât posibil aşezarea cărţii când lipită de marginea de sus a scanerului, când lipită de cea de jos, de cea dib stânga sau dreapta; Pe cât posibil cartea îşi va păstra aceeaşi poziţie faţă de scaner.
      Se va evita aşezarea "înclinată" a cărţii faţă de baza ecranului scanerului.
      Înclinarea paginilor faţă de axa de simetrie a scanerului s poate rezolva cu Scan Tailor sau Abbyy 10, dar orice modificare de geometrie a imagini, duce la pierderi de calitatea imaginii şi mai ales la apariţia unor forme noi a semnelor, pe care Abbyy s-ar putea să le recunoască cu erori.


      SALVAREA IMAGINILOR:
      CUM NU TREBUIE SALVAT?
      Nu trebuie folosită opţiunea scannerului/multifuncţionalei de salvare direct în format PDF, decât în cazul în care utilizatorul este un bun cunoscător al softului şi are o experienţă bună în salvarea în acest format. Pentru începători se întâmplă să realizeze un pdf, care are ca format de pagină A4, iar imaginea este cu mult mai mică şi ocupă o parte mică din pagină, restul paginii fiind ocupat de margini albe. În acest caz pdf va avea o valoare mare, de regulă peste 100 de Mo, dar calitatea pdf este mică, astfel că la încărcarea în Abbyy vom constatat foarte multe erori ale recunoaşterii semnelor, sau această recunoaştere nu se va realiza.

      CUM TREBUIE SALVAT?
      Se vor salva imaginile în format JPG, format ce se regăseşte la majoritatea softurilor de scanare.
      Este de menţionat că formatul JPG este uşor de încărcat în toate versiunile Abbyy.
      Deci, recapitulând, imaginea este recomandat să fie JPG - Grayscale - 300 dpi.

      PDF din IMAGINI
      Acesta se realizează în mai multe etape de prelucrare cu şi fără încărcarea în Abbyy, fapt pentru care trebuie analizat în detaliu şi separat. Pănă atunci menţionez numai câteva lucruri.

      Pdf din imagini este recomandat să îndeplinească mai multe condiţii:
         — să fie realizat din imagini la care s-a făcut SPLITUIREA imaginilor; SPLIT este prelucrarea de imagini, în care se realizează împărţirea unei imagini care conţine două pagini de carte în două imagini separate care conţin fiecare câte o singură pagină de carte;
         — să fie realizat din imagini la care s-a făcut CROPUL imaginilor. CROP este prelucrarea de imagine în care se elimină o parte din marginile nefolositoare ale imaginii; e vorba de marginile întunecate ale imaginii (în cazul în care nu s-a făcut previzualizarea imaginii cu setările necesare) şi respectiv de marginile albe ale paginii de carte, astfel încât imaginea va conţine blocul de text înconjurat pe cele 4 laturi de o bandă albă de circa 4-5 mm lăţime. Este demn de reţinut că mărimea cropului trebuie să fie identică la toate paginile, astfel încât paginile rezultate după crop să aibă aceleaşi dimensiuni ale imaginilor.
         — să fie realizat din imagini la care s-a făcut corectarea geometriei imaginilor. Sunt cazuri mai rare, în care cartea a fost aşezată în unghi faţă de marginile scannerului şi pafina de carte este înclinată faţă de imagine.
         — să fie realizat din imagini la care s-a făcut micşorarea imaginilor. De regulă, un pdf suficient de clar pentru a fi citit sau pentru a putea fi folosit ca element de comparaţie pe timpuş corecturii se va realiza din imagini care au înălţimea cuprinsă între 800 pixeli şi 1200 de pixeli. Dacă formatul cărţii este unul mai mic, imaginea va avea valoarea de 800 pixeli, iar dacă e un format mare aproape de A4 imaginea va creşte pănă la 1200 de pixeli. Aceste valori rezultă din experienţă şi nu sunt obligatorii, ele sunt doar cu scop de informare. Este de preferat să se facă mIcşorarea în grup a imaginilor şi nu pentru fiecare în parte.
         — pdf din imagini trebuie să aibă paginile SINCRONIZATE. Acest lucru se referă la sincronizarea dintre numărul de pagină al cărţii, scris pe "poza" paginii şi numărul de pagină al pdf. Pentru aceasta se vor elimina pagini (albe) în plus sau se vor insera pagini albe, de regulă la începutul cărţii, astfel că dacă prima pagină de text este numerotată în imaginea originală ca fiind pagina 5 (3 sau 7), şi în pdf, ea să ocupe poziţia paginii 5 (3 sau 7). Se va urmări păstrarea sincronizării până la sfârşitul cărţii. Acest lucru este util, în special, la confruntarea textului OCR cu pdf din imagini şi pentru orice altă verificare şi confruntare a textului cu pdf din imagini;în plus este şi un element de estetică a pdf sin imagini.

      O mare parte dintre prelucrările menţionate mai sus se pot realiza cu Scan Tailor, Abbyy şi PDF- Tools, despre care vom discuta într-o altă postare sau minitutorial.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      PRELUCRĂRI IMAGINI


     Presupunem că ne aflăm în momentul în care am terminat procesarea imaginilor cu SCAN TAILOR.

     NOTĂ: Învăţarea modului de lucru cu Scan Tailor se face în joacă. Pur şi simplu, salvăm un folder de probă cu un număr de 15-20 de imagini bipagină şi apoi ne jucăm în Scan Tailor, rulând imaginile prin fiecare etapă. În fiecare etapă încercăm să facem tot ce ne trece prin cap cu imaginile, descoperind cât mai multe din opţiunile programului. Primul tutorial nu trebuie interpretat ca un curs pentru examen... e un fel de Help, la care se poate apela atunci când e nevoie. Joaca de-a prelucratul imagini e cea mai bună metodă de învăţare.

     Dacă se impune extragerea OCR cu Abbyy, atunci vom încărca în ABBYY FineReader imaginile grayscale exact aşa cum rezultă ele după prelucrare. În Abbyy se încarcă imagini şi nu pdf. PDF-ul se încarcă mai greu decât imaginile. Imaginile se pot încărca toate o dată sau pe grupuri de 50/100 de imagini.
     Nu recomand ABBYY PDF Transformer 3.0 pentru extragerea OCR. ABBYY PDF Transformer poate rula mai repede, dar nu are posibilităţi de setare şi antrenament ca ABBYY FineReader.


      REALIZAREA PDF DIN IMAGINI
      PDF din imagini alb-negru [Black and White] se face direct cu imaginile de tip TIFF, obţinute din Scan Tailor.
      PDF din imagini Grayscale se realizează numai din imagini micşorate şi convertite în format jpg sau png.
     Un pdf realizat din imaginile Grayscale TIFF la rezoluţia ridicată obţinută cu Scan Tailor, ar ocupa un spaţiu pe disc de câteva sute de MO, poate chiar 1-2 GO. Acest este motivul pentru care imaginile trebuiesc micşorate şi convertite în jpg.
     Convertirea şi micşorarea se pot face concomitent, folosind programul free PhotoScape.
     Acesta se poate descărca de pe photoscape.org.
     Deoarece meniul este în limba română, programul este uşor de folosit.
     
     După deschiderea programului, din prima fereastră alegen opţiunea Grup ...



     Pentru salvare vom ţine cont de următoarele elemente:
        formatul imaginii = JPG
        calitatea fişierului JPG = minim 95%
        salvăm imaginile cu acelaşi nume într-un folder stabilit sprecial




     Dar, mai întâi să vedem dacă discuţia prezintă interes...

     Cu cât vor paticipa mai multe persoane la discuţie şi vor fi punctate mai multe aspecte, cu atât discuţia va fi mai eficientă.
     Monologul nu va fi decât o încercare sortită eşecului.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
calincalin
Moderator

Din: Cluj-Napoca
Inregistrat: acum 17 ani
Am si eu o intrebare. Nu e mai comod sa folosesti optiunea de scanare direct din Abbyy?

_______________________________________
"Cunoaşteţi adevărul, şi adevărul vă va face liberi." (Ioan 8.32)

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
    Pentru mine personal, răspunsul e sigur, DA.
    E mult mai comod să scanez direct din Abbyy.
    Am cumpărat de curând un scaner HP şi toate softurile pe care le-am încercat pentru scanare, începând cu cel oferit de producător m-au dezamăgit foarte tare.

    Am ajuns la concluzia că, cel puţin în cazul HP, cea mai rentabilă din punct de vedere al timpului şi calităţii este Abbyy.

    Dezavantaj: Abbyy mai pierde un pic de timp cu citirea şi recunoaşterea textului.

    Topicul a avut următoarea cauză: mulţi dintre userii mai noi şi chiar mai vechi preferă să scaneze mai repede folosind alte softuri, În plus, unii dintre ei scanează cărţi ce nu vor fi OCR-izate, ci trecute în DjVu sau care rămân în format pdf din imagini [mă refer în special la cărţile tehnice].

    Practic, mulţi useri fac decât scanarea şi urcă arhive de imagini jpg.
    Pentru ei a fost deschis topicul... dar după câte vezi, interes... nu prea.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Sau se poate folosi direct din Acdsee 7.0 optiunea de resize pe verticala la 1024 si create pdf.
Dar dupa split si restul chestiilor.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
@menssana1984

    Cred că noi doi suntem extremele pe secţiune. Eu scriu prea mult, mult mai mult decât ar trebui, iar tu scrii foarte puţin, astfel că de multe ori nu înţeleg ce întrebi.
    Dacă întrebi faptul că imaginile se pot redimensiona şi se pot face transforma în pdf din ACDSee, atunci răspunsul este DA.
    Ambele acţiuni se pot face în ACDSee. Personal o perioadă de timp am făcut pdf din imagini cu ACDSee, care făcea aceleaşi imagini într-un pdf mai mic decât cel rezultat din Adobe Acrobat.
    Personal prefer redimensionarea în PhotoScape deoarece metoda este foarte simplă, viteza de convertire este mai bună, iar programul este free, consumă puţine resurse şi mai e şi în limba română.
    Pentru pdf din imagini, prefer PDF TOOLS de la


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Daca vrei sa obtii cel mai mic pdf-scan posibil (metoda testata, 500 pagini, 3mb) fara a se pierde din claritatea textului, folosesti un program de crop/split a imaginilor, le incarci in Abby, dar doar incarcare si atat, save images as pdf, iar pdf-ul obtinut il prelucrezi cu Adobe, optiunea de optimize. Iar daca ii mai dati un optimize, poate il face si mai mic.

Legat de chestia asta, de ce Abby la crearea pdf-ului, imi face unele pagini alb-negru, iar altele gri? Scanarea e in gri facuta.

Atentie la Abby, la salvare imagini ca pdf. Fereastra are 2 casute care trebuiesc bifate:
- All.
- imediat dupa bifarea celei de sus, devine activa o alta casuta, save as multi-page file.
Aceste casute se afla sub fereastra de nume a fisierului si a tipului de fisier.
Daca aceste casute nu sunt bifate, Abby fie va salva doar pagina selectata in acel moment, ori va salva fiecare pagina a documentului intr-un pdf separat. 500 pagini, 500 pdf-uri.


Daca se doreste un pdf-scan cu vizibilitate buna, dar dupa ce se face crop-ul zonelor inutile si split-ul paginilor duble, eventual si deskew-ul lor, se face batch resize la 1024 pe verticala cu Acdsee, iar apoi se foloseste optiunea Create pdf.
Evident ca se pot folosi si alte softuri. Chiar as fi curios sa aflu daca pdf-ul de mai jos e bun pentru djvu pentru readere de 6 inch.
Un exemplu de pdf-scan facut asa:


pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
S-a facut, se poate sterge. Am justificat folosirea lui Pages per dict. Explicatii mai amanuntite se pot da pentru fiecare caz in parte, daca se vor ivi probleme pe masura ce lumea va aplica metoda.

Modificat de Aleph (acum 9 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Aleph,

    Mulţumim pentru tutorial.

    Am o propunere care o să te cam supere cumva...

    M-am gândit să ar fi bine să procedăm astfel:
      Este normal să existe întrebări şi să mai urmeze unele explicaţii. Aş ăroăune ca parte din aceste explicaţii să se regăsească şi în tutorial.
      De exemplu: "Page per dict" din ultima imagine... de ce 200 şi nu mai mult sau mai puţin? ce anume parametru de calitate influienţează aceste valori...

      Ca să poţi să faci mai uşor completările [modificările] în tutorial, aş propune să-l împarţi în mai multe postări, pentru a fi mai urşor de urmărit locul unde trebuie făsută modificarea, altfel ai şanse să păţeşti ca mine în topicul cu Catalogul Biblioteca RI...

      Cred că ar fi bine ca să foloseşti vreo 5 postări consecutive.

      Pentru că şi eu mai am ceva de adăugat, la metoda clasică, îmi voi rezerva şi eu încă două posturi, după care te-aş ruga să rezervi tu 5 sau câte consideri.
      De mutat conţinutul în noile postări, pot să mă ocup şi eu... important este să faci rezervările de posturi.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Post rezervat 2

_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Post rezervat 3

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
Cum sa obtinem pdf-uri mici si de calitate foarte buna din imaginile alb-negru produse de Scan Tailor sau ScanKromsator.

Metoda a mai fost prezentata – nu fac decat sa enumar cei cativa pasi de urmat. O carte beletristica, de cateva sute de pagini scanate, se reduce in cateva minute la un pdf de 1–4 Mb (uneori chiar mai mic), de o calitate impecabila. Dimensiunea este in cel mai rau caz jumatate din ce se poate obtine cu oricare alta metoda pe care o stiu.

Algoritmul se aplica numai pe imagini B&W. Urmariti explicatiile pe exemplul concret din arhiva Exercitiu.rar.

1. Desfaceti arhiva pe discul C:; se creeaza directorul Exercitiu care contine, printre altele, folderul out cu 10 pagini B&W 600 dpi produse de ScanKromsator, doua coperte color 200 dpi si folderul gol Lucru.

2 – Dimensionarea copertelor. Cu un program de prelucrare grafica ce permite afisarea dimensiunilor imaginilor si redimensionarea lor, deschideti una dintre paginile din folderul out si afisati latimea si inaltimea paginii, in milimetri. In Photoshop informatiile pot fi obtinute din fereastra Image Size:



Notati latimea 94,83 mm si inaltimea 167,56 mm. Deschideti copertele Cop1 si Cop4 si faceti Resample fara pastrarea proportiilor pe dimensiunile notate:



Salvati cele doua coperte.

Modificat de Aleph (acum 11 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
3 – Crearea a doua fisiere DjVu continand copertele. Lansati DjVu Small.exe din folderul DjVu Small v0.4.4, deschideti Cop1.jpg si configurati cu butonul Options aplicatia exact ca in ecranele urmatoare:

 
 
 
 


Se apasa butonul Convert si in folderul Lucru se obtine fisierul 1.djvu.
Se repeta operatia pentru Cop4.jpg, singura diferenta fiind ca la "Output DjVu-file name" se trece 3 in loc de 1.

 


In folderul Lucru se obtine fisierul 3.djvu.

Modificat de Aleph (acum 11 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
4 – Crearea unui fisier DjVu continand corpul cartii. In DjVu Small deschideti fisierele din folderul out si alegeti User BW (300 dpi) la encoding profile. Modificati optiunile de General si Encode to DjVu (2) ca mai jos (DjVu file name – 2 si Pages per dict – 1000 care asigura o rata de compresie cu pana la 20% mai buna):

 
 


Apasand Convert se obtine in folderul Lucru fisierul 2.djvu.

Modificat de Aleph (acum 13 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
5 – Asamblarea fisierelor DjVu. Lansati DjVuToy.exe din folderul DjVuToy. La tab-ul Merger alegeti Lucru ca folder de intrare si dati numele "Exercitiu.djvu" fisierului de iesire. Apasati 4. Go pentru asamblarea fisierelor 1.djvu, 2.djvu si 3.djvu din Lucru.



In folderul Exercitiu se obtine fisierul "Exercitiu.djvu".

6 – Crearea PDF-ului. In DjVuToy alegeti tab-ul To PDF si configurati aplicatia cu butonul PDF Options ca in ecranul de mai jos.



La Paper -> Size s-a ales Fixed width si la paper -> Width s-a introdus latimea masurata mai sus, 9,48, in centimetri cu doua zecimale.

Se deschide "Exercitiu.djvu" si se apasa pe Go.



S-a obtinut fisierul final "Exercitiu.pdf".

Pont: Daca la conversia djvu in pdf se obtin pagini aparent goale, iar Adobe Reader da eroare la deschiderea fisierului, inchideti DjVuToy, mergeti in Control Panel\Regional and Language Options\Regional Options şi alegeti English (United States), apoi reluati procedura de transformare DjVu în PDF. (multumesc uciN!)

Modificat de Aleph (acum 11 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
Obs. 1. Daca imaginile scanate si prelucrate sunt gri sau color la 300 dpi, in DjVu Small se foloseste encoding profile Manuscript (300 pdi) sau Clean (300 dpi), cu optiunea Pages per dict – 200 (sau mai putin de 200; mai mult de 200 produce pete blur-ate peste grupuri de litere din document).

 


Obs. 2. O carte cu cateva sute de pagini de text nu ar trebui sa iasa mai mare de 3–4 Mb. Daca depaseste aceasta limita, pdf-ul se poate micsora cu aprox. 50% (mai mult sau mai putin) daca imaginilor de intrare li se face Resample de la 600 dpi la 300 dpi. Un Blur initial si Levels 60-0-255 asigura imaginilor la 300 dpi un aspect aproape la fel de bun ca cel al imaginilor la 600 dpi.

Multumiri! Sunt recunoscator lui menssana1984 si Seven pentru colaborarea la realizarea tutorialului. O mentiune speciala pentru verbatim, caruia i se datoreaza introducerea metodei pe forum si de la care am preluat tacit o groaza de idei.

Modificat de Aleph (acum 13 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
thanas
Membru Gold

Din: parti
Inregistrat: acum 17 ani
Salut.

la conversia djvu in pdf obtin un document cu pagini goale si eroarea There was oa problemm reading this document (14).

Ceva sfaturi?


LE: Multumesc mult uciN! Acum functioneaza.

Modificat de thanas (acum 13 ani)


pus acum 13 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
Control Panel\Regional and Language Options\Regional Option şi alege English (United States).
Apoi reia procedurile de transformare DjVu în PDF.


pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
Am obtinut aceeasi eroare cand lucram cu o versiune mai veche de DjVuToy. In pachetul Exercitiu se gaseste ver. 1.15 care mi-a mers fara schimbarea de la Regional Options, atat sub XP cat si sub Win 7. thanas, pe ce regiune e setat calculatorul tau?

Oricum, multumesc uciN, am completat Pasul 5 cu indicatia ta.


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
thanas
Membru Gold

Din: parti
Inregistrat: acum 17 ani
Am folosit ver 1.15 cu setarile pe regional Romania si e OK.

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
În legătură cu pdf din DjVu...
Am făcut şi eu câteva pdf la aceeaşi carte, încercând să schimb valorile câte unui parametru şi păstrându-le pe celelalte constante.
Intenţionez să urc imaginile din out rezultat din procesarea Scan Tailor, ca să mai facă şi altcineva prelucrarea aceloraşi imagini.

ideea este: dacă este nevoie să purtăm discuţii pe această temă, ar fi bine să facem un topic special pentru experimente, care eventual să poată fi şi şters şi pentru a nu aglomera topicurile de tutoriale.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
Sigur, nici o problema. Folosesc metoda de vreo trei luni iar la inceput m-am jucat cu diversi parametri si am ajuns la concluzia ca e eficient sa se faca conversia out -> PDF exact ca mai sus. In principal optiunile de codare au ca efect modificarea aspectului paginilor din PDF; prefer ca acest lucru sa cada in sarcina lui Scan Tailor sau ScanKromsator.

Modificat de Aleph (acum 12 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
thanas
Membru Gold

Din: parti
Inregistrat: acum 17 ani
Aleph, poti expune te rog cateva informatii despre realizarea fisierelor djvu cu layer OCR?

Multumesc


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Pentru thanas de la Aleph

      Sunt mai multe metode de adaugare a unui layer OCR peste un document DjVu - eu o folosesc pe cea care apeleaza la Abbyy Finereader, fiindca da cele mai bune rezultate pentru limba romana. E nevoie de versiunea 8.0 a lui Abbyy (nu 9.0, nici 10) si de programul DjVuOCR din pachetul pus de verbatim in prima postare din topic (nu necesita instalare).

     Abbyy se seteaza cum scrie in documentul "!!!NEW_FR9_Readme.txt" din kit-ul DjVuOCR si se da "Save Batch" intr-un folder gol de pe HDD. Se deschide cu Abbyy folderul "out" generat de Scan Tailor sau ScanKromsator, din care a fost creat DjVu-ul. Daca DjVu-ul are coperti, se adauga si ele in folderul "out", denumite in asa fel incat sa fie, in ordine, primul si ultimul fisier din "out". Se marcheaza copertile ca fiind "zone de imagine" si se face recunoasterea caracterelor.

     Se lanseaza DjVuOCR.exe si se apasa butonul "Manual mode OCR manager". Se apasa "Browse" de la "FineReader Project directory" si se alege folderul in care s-a facut "Save Batch" din Abbyy. Se apasa apoi "Test project" pentru verificarea OCR-ului. Se bifeaza "Normal hyphenation" si "Test before processing" si se debifeaza "Create HTML file". Se alege fisierul DjVu in care introducem layerul OCR si se apasa "Process".

     Programul furnizeaza si un fisier text care contine rezultatul operatiei OCR din Abbyy, dar acesta nu ne foloseste, chiar ne incurca, fiindca la o a doua rulare a lui DjVuOCR obtinem un mesaj (care trebuie ignorat) ca fisierul text exista deja si ca va fi suprascris.


     Alte detalii, dacă mai ai nevoie... peste câteva zile de vacanţă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Wow.... magie curata....
Pasii:
scan brut, format jpg, 300 dpi, 160 mb > prelucrat Scantailor, cu BW, 600 dpi (asta e defaultul la iesire, nu am fost atent la el), tiff, 50 mb > prelucrat cu Djvu Small, facut djvu dupa modelul de mai sus, 1,07 mb > facut apoi pdf cu Djvutoy, 1,53 mb.

Numar total de pagini a cartii: 411.

Buna treaba.

Legat de Scantailor si BW, daca carte nu are marginile de text scanate cum trebuie, le are incetosate, e mai bine sa lasam grayscale sau BW?
Stiu ca la BW se mai pierde din litere, mai ales daca e si matura aia activata.
Nu prea am cum sa testez asta acum, am doar scanari pefecte pe hard.

O sa revin si cu un scan greyscale.

PS
Eu am sarit anumite etape pentru ca nu sunt interesat  de realizarea unui djvu ca la carte, cu coperti, cuprins, etc. Vreau doar un scan de control, atat.
Daca iei scanul si il trantesti direct in Djvusmall, iti iese un scan de control pe cinste.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



OK... uite si rezultatul de la grayscale:

Aceleasi imagini ca si mai devreme, dar facute in grayscale.

Scantailor > tif, 1991x3600, 600 dpi, 1.83 gb > DjvuSmall, djvu, 10 mb > Djvutoy, pdf, 10.9 mb.

Tot 411 pagini.
Calitatea e excelenta, evident.

Transformarea initiala din Djvusmall dureaza un pic mai mult in cazul in care se foloseste grayscale, iar cand se face din djvu > pdf, iarasi dureaza mai mult.


Si se pare ca atunci cand se scaneaza cel mai bun format e TIFF cu LZW la compresie, ii reduce marimea cam la jumate. Jpg-ul trebuie evitat deoarece e comprimat si produce artefacte, in special cand e vorba de text negru pe fond alb.


pus acum 13 ani
   
menssana1984
Vizitator



Ok... si o ultima chestie...

Sursa: pdf, imagini grayscale cu chenar alb procesate de Scantailor, 72 mb, extras tiff, 627x1024 (asa fac eu scanurile de control, cu 1024 pe verticala), marime imagini extrase: 157 mb > DjvuSmall, 3.21 mb > Djvutoy, pdf, ...

Nu mai continui pentru ca nu a iesit bine djvu-ul.


Hehehehe.... ia uitati-va voi aici:


Sau aici

Sau si mai bine mergeti pana la directorul radacina.

Se pare ca la cartile mai vechi si cu textul mai maruntel, optiunea Clean (300 dpi) cam strica textul, sau poate e din cauza calitatii sursei.
Oricum e clar ca din punct de vedere al dimensiunii, djavu-ul bate pdf-ul.
Si mai ales la capitolul calitatea textului.


Explicatie pages per dict:

"As you know the pages/dict option means how many pages are using together to create a "dictionary" page. If you use for example the value 10, then the first 10 pages are analized and an extra .djbz page is created cointaining information of common charactes of that pages, then pages 11 to 20 are analized and another .djbz extra page is created containig information of common characters of this pages, and son on, reducing the final output file size."

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
menssana1984, adresele prezentate de tine mai sus, au mai fost postate aici:
Pe atunci verbatim mai activa pe forum, de fapt el a şi iniţiat topicul.
Dar, sigur, nu strică să mai fie postate, poate că unii au „trecut pe lîngă ele.”


pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani

uciN a scris:

Se foloseşte asamblarea într-un fişier DjVu a imaginilor scanate, alegînd opţiunea Manuscript (300 dpi)


Am avut ocazia sa transform in DjVu o scanare a unei carti de 400 de pagini, dintre care 2/3 contineau desene in nuante de gri. La aceeasi calitate finala, optiunea Manuscript (300 dpi) a generat un fisier cu 25% mai mic decat Clean (300 dpi).

La fel, in ultimul timp am transformat mai multe DjVu-uri grayscale in PDF, iar PDF-urile au iesit de aceeasi dimensiune ca DjVu-urile.

Ca urmare, am modificat si completat algoritmul de pe pagina anterioara cu aceste informatii noi.


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
thanas
Membru Gold

Din: parti
Inregistrat: acum 17 ani
Intampin o problema la transformarea in djvu la o carte. Am scanat Tai-Pan, trecut prin ScanTailor si obtinut tiff B&W. Djvu small se blocheaza la ultima imagine in cazul in care selectez page per dict sau rezulta un fisier djvu de 32 MB daca nu selectez optiunea. Mi se pare ciudat ca nu e prima data cand folosesc programul.

pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
Esti sigur ca se blocheaza DjVu Small ? Daca nu da nici un mesaj de eroare, lasa-l mai mult timp, dupa ce a ajuns la 100%. Uneori dureaza o jumatate de ceas pana finalizaeza operatia, desi pare ca sta degeaba.
Daca editia pe care o ai la Tai Pan e veche si needitata pe calculator, aproape toate literele difera una de cealalta si compresia e ineficienta. Totusi, 32 Mb mi se pare mult, trebuie ca se intampla ceva...

Modificat de Aleph (acum 12 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
Am păţit acelaşi lucru cu o carte scanată şi prelucartă cu ST.
La mine părea că se opreşte prelucrarea cu DjVu, pe la jumătate.
Intru în Task Manager şi văd că DjVu Small not responding.
L-am lăsat în pace şi după vreo 2 ore a finalizat fişierul. M-am uitat
după aceea la Pages per dict şi era setat la 1000. De atunci, nu dau
un Pages per dict mai mare de 10÷20.


pus acum 13 ani
   
menssana1984
Vizitator



Si eu folosesc valoarea 1000 la pages per dict.
500 de pagini la 300 dpi, prelucrate in ScanTailor, le face djvu cam intr-un minut.


pus acum 13 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
Nici la mine nu dura aşa de mult, max 4 min. dar depinde de carte,
de calitatea tipăriturii, aşa cum spunea Aleph mai sus.


pus acum 13 ani
   
menssana1984
Vizitator



Da, asa e. Depinde de carte. S-a mai gripat si la mine. Dar si-a revenit daca l-am lasat in pace.

Pages per dict - nu are o valoare fixa, depinde de utilizator. Se refera la numarul de pagini ce vor fi indexate de program, acestea vor avea rol de dictionar, un fel de inventariere a literelor/simbolurilor din ele.
Cu cat numarul de pagini e mai mare, cu atat compresia e mai mica si durata de realizare a unui djvu creste,

Intrebare: pages per dict cu valoare de 1000 la o carte de 300 de pagini?
Are vreun sens?
Daca e sa privim lucrurile asa, atunci sa folosim ca numar de pagini de dictionar, numarul de pagini a cartii.

Anyway...

Cateva rezultate DjvuSmall:

Sursa:
- 1.63 gb, TIFF, 5100 x 5262, textul facut BW in ST, continut mare de imagini Greyscale. Din 145 de pagini cel putin 70 sunt numai cu imagini greyscale. Din acest motiv nu am avut cum sa folosesc profilul BW 300/600.


Rezultate convertire DjvuSmall:

- Photo 600 = 233 mb.
- Photo 300 = 233 mb.

Agressive 600 = 5.7 mb

Drawn 300 = 18.9 mb.

Drawn 600 = 6.78 mb.

Fine Text 300 = 24.4 mb.

Procesarea aceasta a durat cel mai mult dintre toate, cam 30 de minute pe putin.


Manuscript 600 = 10.2 mb.

Scanned 300 = 19 mb.

Scanned 600 = 6.44 mb.


Va pun la dispozitie djvu-urile rezultate in urma folositii diferitelor profile.
Din punct de vedere calitativ, eu nu am gasit nici o diferenta notabila intre ele.
Voi puteti gasi?
As vrea sa imi fac o parere pentru urmatoarea data in care nu voi mai putea folosi profilul BW.

Retrag ce am zis, cam toate afecteaza fotografiile.
Atunci cand se face zoom de 800 se baga de seama.
Dar pentru simpla lecturare la Page Width, arata ok.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
Poate ar fi bine sa purtam discutiile despre djvu-uri la topicul "DjVu & PDF jbig2", fiindca nu am mai facut demult referire la PDF.

Cu cat numarul de pagini puse la "Pages per dict" e mai mare, cu atat compresia e mai mare, nu mai mica.
Am facut probe, compresia cu PPD = "nr. de pagini B&W ale cartii" este exact ca aceea (identica pana la byte) obtinuta cu PPD = 1000 (discutam de PPD 1000 numai la B&W). Rezulta ca nu are rost sa umblam de fiecare data la parametrul PPD, il putem lasa 1000.

Rezultatele testelor sunt importante. Nu exista nici o diferenta la partea B&W de text, fiindca metodele aplicate au efect pe portiunile gri ale paginii. Pentru rezultate maxime din punct de vedere al calitatii in cartile cu fotografii sau desene, cauta DjVu Imager si documentatia lui.

Daca vorbim despre pagini cu text integral grayscale, metoda optima e deocamdata Clean 300. Am mai facut ceva probe comparative (ti le pot trimite) – Clean 300 vs Manuscript 300. Desi Manuscript 300 produce fisiere mai mici, in anumite situatii calitatea textului e vizibil mai slaba decat la Clean 300.


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutare! Am o întrebare de gâgă...
     Presupunem că am salvat în Scan Tailor o carte la două rezoluţii: BW 600 dpi şi BW 300 dpi.
     La realizarea DjVu cu DjVu Small, aleg va variantă de compresie în ambele cazuri User BW (300 dpi).
     Mi se pare logic ca rezultatul obţinut să fie identic.
     Dacă răspunsul este DA, atunci mai are rost ca Scan Tailor să mai facă prelucrarea la 600 dpi?
     ... sau, totuşi, greşesc? E mai avantajos ca mai întâi să salvăm imaginile în Scan Tailor la 600 dpi. În acest caz folosim User BW (300 dpi). Nu devine DJVu prea mare?


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
verbatim
Membru Gold

Inregistrat: acum 13 ani
Profilele UserBw din DjvuSmall nu modifica rezolutia  paginilor, spre deosebire de alte profile gen scanned, drawn etc. (asta daca nu facem alte setari speciale).
Deci indiferent daca alegem userBW300 sau userBW600 rezolutia paginii (ca numar de megapixeli, adica produsul dintre nr. pixeli pe orizontala X si nr. pixeli pe verticala) ramane aceeasi.
Astfel setarea dpi e pur formala, ea afecteaza doar zoom-ul asociat cu vederea 100% .
Cand vizualizam documentul in WinDjView, marimea reala a paginii se obtine nu atunci cand setam zoom-ul la 100%, ci la "actual size".
Aceeasi problema se intalneste si in cazul documentelor scanate pdf, nici acolo marimea paginii la 100% nu reprezinta neaparat marimea reala a paginii.

In ScanTailor lucrurile sunt un pic diferite. Daca declaram imaginile sursa ca fiind de 300 dpi iar pentru output setam 600 dpi, are loc o crestere reala a rezolutiei
(mai precis, o dublare a dpi-ului implica o marire de exact 4 ori a rezolutiei masurata in megapixeli)
Toata povestea asta cu rezolutia imaginilor inteleasa fie ca dpi, fie ca nr de megapixeli e usor confuza, recunosc.
Nu pretind ca am inteles foarte bine cum stau lucrurile, mai ales daca e vorba de setarile din djvuSmall

Strict in cazul tau,


Seven a scris:

***
     Presupunem că am salvat în Scan Tailor o carte la două rezoluţii: BW 600 dpi şi BW 300 dpi.
     La realizarea DjVu cu DjVu Small, aleg va variantă de compresie în ambele cazuri User BW (300 dpi).
     Mi se pare logic ca rezultatul obţinut să fie identic.


Rezultatul compresiei djvu nu va fi acelasi, chiar daca folosesti acelasi profil userBW, sa zicem userBW300
Te poti convinge comparand in WinDjView cele doua documente la "actual size"
In primul caz (600dpi) fisierul djvu va avea rezolutie mai mare decat in cel de al doilea (300dpi), asa cum e de asteptat
Desigur ca si marimea fisierului djvu obtinut va fi mai mare in primul caz, de multe ori merita insa, datorita plusului de calitate.
Cu cat tiparitura cartii e mai buna, cu atat diferenta intre marimile fisierelor djvu este mai mica

Modificat de verbatim (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Daca scanarea e de 300, ST-ul sa aiba outputul tot pe 300.
Prelucrati o imagine si uitati-va la marginile literei.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Mulţumesc mult, Verbatim!
      Am înţeles cum stau lucrurile. Înseamnă că merită efortul şi timpul ca rezoluţia la ieşire din Scan Tailor să fie BW 600.
      Eu credeam că indiferent de rezoluţia din output Scan Tailor, folosind în DjVu Small profilul User BW (300 dpi)... rezoluţia finală va fi în toate cazurile "redusă" [uniformizată] la 300 dpi.
      Pe de altă parte... cam neplăcut... tocmai am terminat de prelucrat cele 4 volume din Război si pace si am folosit la output doar 300 color şi 300 BW. După ce termin şi OCR-urile, am să revin să fac şi o prelucrare la BW 600 dpi.

      LE:
      Utilitasetveritas, vrei să spui că dacă scanarea este la 300 dpi şi la output ScanTailor setez 600 dpi, rezoluţia finală nu este reală? adică 600 nu este chiar 600?

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
verbatim
Membru Gold

Inregistrat: acum 13 ani
Daca tiparitura cartii e buna, fisierul djvu in versiunea 600 dpi e cam de 2 ori mai mare decat cel la 300 dpi
Literele arata insa mai bine, au margini mai "cremoase", ca sa zic asa.
In cazul tipariturilor mai proaste, versiunea de 600dpi e cam de 3-4 ori mai mare decat cea la 300dpi
In ce ma priveste, prefer in general fisierele djvu la 600dpi, chiar daca sunt mai mari
Marimea fisierului poate fi micsorata, cum spunea si Aleph mai sus, alegand un page-per-dict suficient de mare
Totusi, o valoare prea mare (gen 1000) nu cred ca e de recomandat, deoarece scroll-ul paginilor devine mai greoi
iar castigul de la 25-50 la 1000 nu e chiar atat de mare. In acelasi timp, folosirea unei valori prea mari
mareste foarte mult timpul de prelucrare atat in DjvuSmall cat, mai ales, in DjvuToy (daca dorim si o versiune pdf)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Orice marire a rezolutiei degradeaza imaginea. Poate nu suficient de vizibil, dar o face. Ii afecteaza si marimea totodata.
Daca fisierele sunt de 300 dpi, eu as zice ca output-ul ST sa fie tot de 300 dpi.
Hai ca o sa fac o proba peste o ora si revin cu imagini.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
OK.
Se pare ca un 300 facut 600 arata mai bine decat un 300 ce ramane 300.
Ma refer doar la ST nu la prelucrarea djvu-ului.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
verbatim
Membru Gold

Inregistrat: acum 13 ani
Pentru codarea djvu (text, B&W) e aproape intotdeauna avantajos ca imaginea sursa sa aiba rezolutia
dublata. Fireste ca este o marire artificiala, nu se pune problema ca imaginea initiala, prin dublarea rezolutiei
sa castige noi detalii. Problema e ca algoritmul djvu extrage mai bine detaliile (atatea cate sunt) dintr-o
imagine careia in prealabil i s-a dublat rezolutia.

Am luat la intamplare o pagina scanata, am prelucrat-o in ST obtinand doua versiuni, una la 300dpi, alta la 600dpi
Puteti descarca testul la e imaginea originala plus versiunile djvu (userBW300)
Eu zic ca se vede mai bine versiunea la 600, chiar daca nu e o diferenta ca de la cer la pamant.
Pentru comparatie, folositi in WinDjview vederea "Actual Size"


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Da, diferenţa e clară.
     Marginile literelor sunt mai corecte, mai "cremoase", cum ziceai mai sus.
     Adică, la rezoluţia mai mică lipsesc nişte puncte, nişte detalii necesare, dar există în plus nişte puncte aiurea... acolo unde nu ar fi necesare.
     Gata, eu sunt convins... cel puţin pentru o anumită calitate a imaginilor scanate, lucrurile sunt foarte clare. Output BW 600 dpi e mult mai bun decât BW 300 dpi.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 14 ani
Calitatea mai buna a output-ului la 600 dpi provine din mai buna interpolare a aliasing-ului literelor din scanarea 300 dpi Grayscale. In varianta Grayscale literele nu au conturul definit cu exactitate, marginile lor facand trecerea de la negrul literei la albul hartiei intr-un usor degradé (adica aliasing). Pentru ca in varianta B&W avem sau numai puncte albe, sau numai puncte negre, degradeul nu poate fi reprodus, insa la 600 dpi se folosesc de patru ori mai multe puncte pentru simularea lui si "rotunjirea" conturului literei.

_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 12 ani
   
StarV
Membru Senior

Inregistrat: acum 17 ani
Buna ziua,

Sunt incepatoare in ale scanatului si prelucratului. Am scanat doua carti pentru gradinita color la 600 dpi. Apoi le-am prelucrat in Adobe Photoshop pentru crop si adjustments levels, aducandu-le la 300 dpi (nu stiu daca era cazul sa le pastrez la 600 dpi). Apoi din cele 30 si ceva de imagini, folosind Adobe Acrobat Pro, le-am combinat si am obtinut un fisier pdf, cam pe la 300 Mb. Ceea ce as vrea eu este sa obtin un pdf mai mic, dar totusi sa nu pierd prea mult din calitate. Ma poate ajuta cineva cu un sfat? Am citit despre conversia in format djvu, dar nu asta caut eu. Multumesc foarte mult...


pus acum 12 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
Îţi propun să faci un test şi să scanezi direct din Adobe Acrobat Pro astfel:
Cu scanerul pornit, Create\PDF from Scaner\Custom Scan şi ajungi în fereastra următoare:

Aici o setare de 300dpi color este suficientă.

Bifează Optimize Scanned PDF.
Aici glisează cursorul de la Small Size (mărime mică PDF dar calitate mai slabă) pînă la High Quality.
Debifează Make Searchable (Run OCR) şi celelalte.
Fă nişte teste şi vezi rezultatul.
Mai poţi interveni la Optimize Scanned PDF dînd clic pe Options iar în fereastra obţinută joacă-te cu cursorul
pînă obţii un compromis acceptabil calitate/mărime PDF. Fereastra Options implicită arată cam aşa:

După cum vezi Adobe face şi Deskew (îndreptare pagini scanate înclinat).
Poţi face crop direct din Adobe atît pentru pagini pare Even Pages cît şi pentru cele impare Odd Pages.
Dacă vei face un crop identic la ambele tipuri de imagini (sus, jos, stînga, dreapta), vei obţine un PDF cu pagini perfect egale.
Apoi poţi exporta imaginile într-un folder special creat, cu Save As, de exemplu ca PNG (dispare zona din exteriorul crop-ului)
şi apoi le reasamblezi cu Adobe.

Modificat de uciN (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Pentru a veni în sprijinul lui StarV şi a altor useri ce realizează pdf din imagini, m-am gândit că ar fi bine să prezint două programe:

     ACDSee Photo Manager 2009 – cu acest program se pot face convertiri în grup a imaginilor dintr-un format în altul, precum şi redimensionări în grup a imaginilor la dimensiuni prestabilite sau prin reducere procentuală.

      PDF Tools XChange – cu acest program se pot realiza pdf din imagini de mărime decentă şi de calitate superioară.

     Pentru cine nu are programele şi doreşte să le downloadeze, acestea pot fi găsite pe următoarele adrese, astfel:

      PDF-Tools 4.0.0184 Portabil
      Arhiva de tip RAR
      Nume arhiva: PT.rar
      parola: book_romania_inedit
     

      ACDSee Photo Manager 2009
      Arhiva de tip RAR
      Nume arhiva: AC09.rar
      parola: book_romania_inedit
     

      Din motive pe care nu le mai explic, cele două fişiere vor rămâne pe host doar câteva zile, după care vor fi şterse.


      Am realizat şi două minitutoriale pentru utilizarea ACDSee Photo Manager 2009 şi respectiv a PDF Tools.

      Nume fişier: Convert&Resize cu ACDSee.pdf
      Adresa: 


      Nume fişier: Realizarea PDF cu PDF_Tools.pdf
      Adresa: 

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      În sfârşit, am terminat şi cel de-al doilea minitutorial.
      Sper să fie de folos!
      Cu stimă,
      Seven

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Sveik
Membru Gold

Din: Bucuresti
Inregistrat: acum 15 ani
Salutari!

Un program care sa faca un PDF searchable? Am incercat cu Abbyy Transformer, dar nu imi permite sa copiez nici un pic de text. Plus de asta, imi creste de aproximativ 5 ori dimensiunea fisierului. Aveti vreo idee de un program optim?

Multumesc si o zi buna!


_______________________________________
Biblioteca de artă - Editura Meridiane
Colecția Lucian Boia
Colecția Sinteze - Editura Institutul European
Colecția Mănăstiri Ortodoxe
Colecția Rodica Ojog-Brașoveanu
Colecția Editura Științifică

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Cel mai bun specialist în SSB-uri [aşa le spun eu la şerşibiloasele astea] dintre cei pe care-i cunosc eu este Blank Cd.
     Am făcut căutări în SSB-uri făcute de el şi funcţionau perfect. 

     După câte îmi amintesc erau făcute cu Adobe Acrobat şi nu cu Abbyy Transformer.
     Ia vezi dacă îţi folosesc adresele următoare.
     
   
   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
verbatim
Membru Gold

Inregistrat: acum 13 ani
In afara de Adobe Acrobat si Abby Tranformer ar mai fi PdfCompressor de la Cvision
Tin minte ca erau discutii pe library.nu pe tema asta si unii ziceau ca se obtin
rezultate mai bune decat folosind Adobe Acrobat

Ca idee, si cei de la Dacoromanica folosesc tot Cvision pdfcompressor
(cel putin asa reiese din dialogul properties al oricarui document descarcat de acolo)
iar documentele lor au ocr si sunt destul de bine optimizate

Din pacate, nu am programul ca sa pot confirma din experienta proprie acest lucru

Am incercat totusi sa fac un mic test, am descarcat un pdf oarecare B&W de acolo
(e vorba de N. Iorga - Istoria Invatamantului romanesc , o carte relativ noua, din 1971)

Ideea era sa extrag paginile, sa le recombin in Acrobat cu insertie de ocr si apoi sa compar rezultatele

In prealabil am eliminat cateva pagini cu ilustratii grayscale ca sa ramana doar imaginile text
Documentul de pornire astfel obtinut are 5,33 MB cu tot cu ocr (cam 200 de pagini de format mare)

Am extras tiff-urile, le-am combinat in Adobe Acrobat si am obtinut
un document neoptimizat cam de 8MB. Prin optimizare jbig2 la maxim in Acrobat
(dar fara micsorarea rezolutiei) se ajunge la un document fara ocr de 3MB
iar prin includerea layer-ului ocr se ajunge la un document de 5,12 MB

Deci, cel putin in cazul acesta, nu e mare diferenta intre
metoda Cvision si cea de la Adobe ( 5,33 MB vs 5,12MB)

Ca idee, daca folosim aceleasi tiff-uri pentru conversia la djvu se obtine
un document de 1,65 MB (fara ocr) cu aceeasi rezolutie
iar prin includerea layer-ului ocr (obtinut via ABBY) se ajunge la un
document cu ocr de 2,48 MB, un rezultat mult mai bun decat in cazul pdf-urilor


pus acum 12 ani
   
Sveik
Membru Gold

Din: Bucuresti
Inregistrat: acum 15 ani
Problema mea e urmatoarea:
scanat  carte la 300 dpi grayscale, format tiff. Aproximativ 480 pagini.
Prelucrat in ST - output B&W la 600 dpi si hartile (este o carte de istorie) la 600 dpi - color.
Mici prelucrari in Photoshop, pentru sters stampilele bibliotecii.
Facut format DJVU (dupa reteta Aleph) - 5,64 MB
Facut PDF din DJVU (dupa reteta Aleph) - 6.16 MB.

De aici incolo ... daca incerc sa-l fac searchable, indiferent ce incerc, mi-l face de 30, 50, 80 mb

Multumesc pentru sfaturi! Orice critica, este binevenita!


_______________________________________
Biblioteca de artă - Editura Meridiane
Colecția Lucian Boia
Colecția Sinteze - Editura Institutul European
Colecția Mănăstiri Ortodoxe
Colecția Rodica Ojog-Brașoveanu
Colecția Editura Științifică

pus acum 12 ani
   
verbatim
Membru Gold

Inregistrat: acum 13 ani
Ai folosit Adobe Acrobat pentru realizarea ocr-ului?
In cazul asta parca totusi rezultatul n-ar trebui sa fie chiar asa mare,
cel mult de 2-3 ori mai mare decat in varianta djvu+ocr, adica pana in 20MB

Din pacate Adobe nu cred ca tine seama de optimizarea deja realizata de DjvuToy
(presupun ca ai folosit acest program pentru conversia la pdf a fisierului djvu)


Ideal ar fi fost ca DjvuToy sa transfere si ocr-ul de la djvu la pdf
(asa cum o face deja in cazul bookmarks-urilor) dar din pacate versiunea actuala
nu stie acest lucru

Asa ca pana cand vine altcineva cu o idee mai buna, varianta optima este djvu cu ocr inclus, sorry


pus acum 12 ani
   
Sveik
Membru Gold

Din: Bucuresti
Inregistrat: acum 15 ani
Da, am folosit Adobe Acrobat.
Djvu-ul nu are OCR inclus. Este la fel de "neselectabil" ca PDF-ul.


_______________________________________
Biblioteca de artă - Editura Meridiane
Colecția Lucian Boia
Colecția Sinteze - Editura Institutul European
Colecția Mănăstiri Ortodoxe
Colecția Rodica Ojog-Brașoveanu
Colecția Editura Științifică

pus acum 12 ani
   
verbatim
Membru Gold

Inregistrat: acum 13 ani
Desigur ca un fisier djvu nu se creeaza implicit cu tot cu ocr
Acesta se adauga ulterior folosind Abbyy si programul djvuocr, nu e chiar asa complicat


Vezi ca a dat Aleph niste explicatii chiar pe acest topic, aici


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Salutare!
     Am o întrebare: spuneţi, vă rog, folosește cineva Snapter Ice pentru corectarea curburii paginilor?


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Pagini: 1  

Mergi la