Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Lista de useri | Cauta | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
TanyToy pe Simpatie
Femeie
23 ani
Iasi
cauta Barbat
24 - 80 ani
Forum Romania Inedit / Totul despre cărți - About e-books / Djvu & Pdf-jbig2 Moderat de Seven, Stelevadris, cuculean, uncris  
Autor
Mesaj Pagini:  1 2
verbatim
Membru Gold

Inregistrat: acum 9 ani
Cu siguranta multi dintre forumisti au intalnit ocazional fisiere cu extensia .djvu, dar fara sa le bage prea mult in seama.  Formatul djvu este insa ideal pentru  comprimarea  documentelor scanate, in primul rand a celor B&W.

        O carte in format djvu de cateva sute de pagini rareori depaseste 3-4 MB (la 300 dpi) . Calitatea textului ramane foarte buna daca se lucreaza direct cu imaginile scanate, adica nu cu versiuni deja prelucrate ale acestora. Esential este ca rezolutia imaginilor sa nu fie mai mica de 300 dpi. Din pacate multe carti scanate apar in versiuni pdf "optimizate", adica cu rezolutia micsorata mult prea mult ( 75-150dpi). Teoretic se pot extrage paginile dintr-un asemenea pdf in  vederea conversiei la djvu, dar fisierul obtinut nu are o calitate a textului prea grozava (chiar daca nu prea departe de cea a pdf-ului si la dimensiuni mult mai mici)

         In mod normal nu as fi incercat sa incep un topic despre djvu, data fiind popularitatea zero de care se bucura la noi. Partea buna e insa aceea ca odata realizat un asemenea djvu el se poate converti in cateva zeci de secunde intr-un fisier pdf doar cu putin mai mare si cu aceeasi calitate a textului (folosind compresia jbig2).

         Iar pdf-urile sunt universal raspandite si, cu putina bunavointa, se pot citi chiar in readere de gen Kindle, mai ales in vederea orizontala/landscape. Nu se compara, evident, cu un fisier pur text, bine formatat si corectat care se citeste incomparabil mai usor pe un astfel de dispozitiv. Insa volumul de munca implicat de corectare este enorm si oricum doar cartile obisnuite de literatura pot fi cat de cat usor trecute in format text, deci cartile  fara ecuatii matematice, diagrame, etc. In aceste conditii e aproape normal sa existe mii de documente necorectate, in definitiv nimeni nu e obligat sa faca aceasta munca pentru ceilalti (respect celor care totusi o fac)

         Ideea e ca cel care face scanarea initiala ar putea "lansa pe piata" odata cu ocr-ul brut si o asemenea versiune djvu/pdf de doar 3-5 MB si asta fara sa reduca semnificativ calitatea textului, rezolutia fiind practic aceeasi cu cea a scanului initial.
         Daca cineva realizeaza corectura, e foarte bine (cel mai bine). Iar daca nimeni nu se inhama la munca de corectare, in cazul acesta cel putin scanul initial are supravietuirea aproape asigurata. Un fisier djvu/pdf de 3-4 MB are mult mai mari sanse sa circule decat o versiune pdf de 20-50MB a scanului initial si chiar decat una de 10 MB


         O sa incerc acum sa fiu un pic mai concret

         Sa zicem ca cineva scaneaza o carte. Din ce am mai citit si eu pe alte forumuri, o scanare corecta se realizeaza in grayscale (nu color, nu B&W)  la minim 300 dpi. Ideal ar fi ca salvarea imaginilor sa se faca in tif, dar cred ca merge aproape la fel si in jpeg, dar la maximul de calitate permis
         Se poate folosi chiar si o camera digitala, dar e necesara o anumita ingeniozitate . Exista un forum strain specializat in aceasta problema  (diybookscanner.org)

         1) In aceasta prima etapa se poate realiza un ocr de referinta folosind abby sau stiu eu ce alt program. Cine doreste sa faca corectura poate porni de aici

         2) In urmatoarea etapa se prelucreaza scanul brut cu scantailor sau scankromsator.
Scopul principal este separarea paginilor duble, indreptarea si curatarea paginilor precum si conversia textului la B&W.  Prelucrarea poate dura destul de mult, depinde de la caz la caz. Programele au un mod automatizat de lucru, dar cel mai prudent ar fi sa se verifice manual fiecare pagina si sa se corecteze eventualele decizii gresite ale programului
         E un pic plictisitor, recunosc, dar pentru o carte scanata cu atentie se poate face doar o rasfoire rapida a paginilor, pret de 4-5 minute. Per ansamblu partea strict manuala nu cred ca depaseste un sfert de ora pentru un scan ingrijit daca nici cartea nu e foarte veche.
Partea calculatorului poate uneori dura destul de mult, chiar cateva ore. Asta, desigur, depinde de fiecare calculator in parte.
         Rezultatul final trebuie sa fie un folder cu tiff-uri B &W plus copertile color. O pagina tiff obtinuta are de regula 30-50KB. Nu e mult, dar inca e o marime inacceptabila

         3) Acum se poate face conversia tiff-urilor la djvu folosind programul djvu small
De regula copertile se prelucreaza separat alegand  un profil de tip photo, de exemplu Photo (300dpi). Imaginile text se prelucreaza de obicei cu profilul User BW (300dpi)
Se obtin in acest caz trei fisiere djvu (doua coperti plus corpul principal), pentru ansamblare se poate folosi djvu express sau djvu toy
         E o etapa foarte simpla, nu dureaza mai multe de 2-3 minute. O pagina codata in djvu are in mod normal o marime cuprinsa intre 5 si 10 KB, in sfarsit ceva rezonabil.


        4) Ultima etapa consta in realizarea pdf-ului. Se foloseste programul djvu toy ( interfata are mai multe taburi, ne intereseaza aici tabul "To PDF" ) . Totul dureaza cateva zeci de secunde. Rezultatul e un fisier pdf doar cu putin mai mare decat cel djvu.

         Gasiti o descriere a etapelor 3 si 4 de mai sus, cu cateva screenshot-uri la http://www.mediafire.com/?ut39bnw8plyn84v

          In ce privest etapa 1,  cred ca membrii forumului sunt deja specialisti
          Pentru etapa 2 ar fi bun un tutorial separat. Probabil axat pe scantailor, care e mult mai intuitiv si usor de utilizat si care are deja cativa utilizatori intre membrii forumului. Un tutorial video: http://vimeo.com/12524529 (in engleza) , si un ghid al utilizatorului http://sourceforge.net/apps/mediawiki/s ... User_Guide (tot in engleza)

          Desigur ca etapele de mai sus sunt pur orientative. O varianta mai complicata presupune realizarea unui djvu cu un layer OCR incorporat (astfel se poate selecta textul si copia exact ca si la pdf-uri). De asemenea exista si posibilitatea de a obtine un djvu dintr-un scan mai complex cu numeroase alte ilustratii in afara copertilor. Sau realizarea bookmarkurilor. Exista alte programe utile pentru aceste situatii (djvuocr, djvu imager)
         Un tablou complet al acestor programe il gasiti la http://www.djvu-soft.narod.ru/soft/   (cei care cunosc limba rusa au aici un mare avantaj). Eu am folosit google translate pentru a intelege cat de cat ce e pe acolo

          Presupun insa ca cei mai multi ar putea fi interesati doar de obtinerea pdf-ului final, fara sa-si bata capul prea mult cu fisierul djvu intermediar


          Experienta mea e limitata la tipul de conversie elementara descris mai sus. Fara ocr, si doar cateva ilustratii ocazionale. In rest totul B&W. De fapt, daca ilustratiile interioare nu sunt prea importante, le putem trata si pe ele in regim BW si astfel fisierul rezultat are marimea minima. Aici procedeaza fiecare cum crede de cuviinta

         Un exemplu de fisier pdf obtinut cu metoda de mai sus este cel de pe topicul
http://romania-inedit.3xforum.ro/post/4 ... DURCKHEIM/
         Fisierul pdf (grayscale) initial de vreo 50 MB (de o calitate buna, cam 300dpi) a putut fi redus cu aceasta metoda la unul B&W de 1 MB, fara micsorarea rezolutiei textului si fara a reduce semnificativ vizibilitatea acestuia

         Nu pretind ca aceasta e singura metoda de a comprima un pdf cu jbig2.
In linux exista de exemplu utilitare in linie de comanda care realizeaza direct conversia la pdf-jbig2, fara sa mai treaca prin etapa djvu
         Ceea ce consuma timp nu este insa realizarea propriu zisa a fisierului djvu (2-3 minute) ci etapa initiala de prelucrare a imaginilor scanate
         Am experimentat (nu mult) si un trial de adobe acrobat. Si el permite compresia cu jbig2, dar totusi rezultatul pare sa fie cam dublu in dimensiune fata de cel obtinut cu metoda djvu
         Daca cineva cunoaste o metoda mai eficienta decat cea prezentata aici, e rugat sa o comunice, sunt primul interesat de asa ceva


         O selectie de programe: http://www.mediafire.com/?dctwh25wey4cr46
Pentru vizualizarea fisierelor djvu e foarte bun programul windjview, il gasiti imediat pe internet

         Sper ca nu v-am plictisit prea tare, stiu ca e un post mult prea lung

Modificat de verbatim (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani

     Mulţumesc Verbatin,
     Excelentă ideea de a prezenta forumiştilor o zonă a cărţii electronice, foarte puţin cunoscută la noi.
     Ca să nu fii singur în acţiunea asta, intenţionez să vin în sprijin cu un tutorial pentru o anume fază a executării cărţilor.

     Folosesc de câtva timp Scan Tailor... sunt foarte mulţumit de ceea ce poate face programul şi sunt în situaţia, în care, cred că pot afirma că stăpânesc binişor programul şi chichiţele sale.
     Am prelucrat câteva cărţi, printre care cel puţin una cu mari probleme: pagini înclinate la unghiuri mari, pagini scanate din poziţie diferită: lipite la dreapta imaginii, la stânga sau centrate. După prelucrare a ieşit ceva mult mai bun decât mă aşteptam.

     Mă angajez să realizez un tutorial detaliat cu modul de folosire a programului Scan Tailor, care va fi gata imediat după sărbătorile de Paşte.

     Despre Scan Kromsator, deocamdată nu-mi pot da cu părerea, sunt de abia la început.
     L-am descoperit datorită uneia dintre postările tale şi am reuşit să găsesc şi câteva indicaţii despre folosirea lui, dar nu am avut timp să încerc să-l folosesc.

     Un lucru e cert. Ruşii sunt mult mai avansaţi în digitalizarea cărţilor şi programele lor sunt free, foarte bune şi puternice, dar au o interfaţă mai greu de înţeles.
     Am rugămintea la colegii şi prietenii noştri de pe forum, cunoscători de limba rusă să ajute la prezentarea unor astfel de programe pe forum.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
Multumesc mult K7 , e grozav daca reusesti sa faci acel tutorial
    Se pare ca sunt mai multi utilizatori de Scan Tailor aici pe forum decat ma asteptam eu.
Din cate stiu eu, acest program a aparut ca o alternativa la Scan Kromsator, acesta din urma
nefiind un program prea prietenos, un program care nici in ziua de azi nu are o documentatie oficiala. Autorul (Bolega) a promis una odata cu versiunea 6 ( actualmente a ajuns la 5.93)

    O sa incerc si eu sa realizez un tutorial la Scan Kromsator, in ideea ca fiecare program are anumite trasaturi unice, care il fac mai util intr-o situatie sau alta.

    Insa aici pe forum cred ca Scan Tailor ar trebui promovat ca "standard", este in mod evident mai intuitiv si mai usor de folosit.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
Vebatin,
   Intenţionam să postez aici arhiva cu imaginile de la Agatha Christie - Cianura scanteietoare. Am postat arhiva pe topicul Agatha Christie cu intenţia de salvare temporară a adresei şi apoi să o repostez aici, apoi am uitat.

   Practic, mă interesa dacă prelucrările pe care le-am realizat cu Scan Tailor sunt cele necesare şi suficiente, dacă ele au corespuns pentru realizarea Djvu.
   Nu se cade să postez un tutorial despre Scan Tailor fără a fi sigur că îl folosesc corespunzător.
   Nu am fost foarte atent şi nu am realizat că pdf-ul foarte mic pe care l-ai făcut tu se convertea din Djvu.
   Eu am încercat să găsesc un program care să facă direct un pdf, astfel comprimat, fapt pentru care am tot căutat pe net un astfel de creator de pdf, între timp uitând să mai refac postarea.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
Prelucrarea e foarte buna, desigur.
Asta vorbind din perspectiva compresiei djvu. Dar daca se are in vedere realizarea ocr-ului, strategia este diferita. Cel mai bun ocr se obtine (din cate stiu eu, adica mai mult din auzite) din imaginile scanate initial, inainte de a converti la pdf/djvu sau orice altceva.

Ideea acestui topic este de a oferi o metoda de compresie eficienta si care sa nu sacrifice rezolutia textului .
Practic in 4-5 ore poti scana o carte si obtine in final un pdf de 2-3 mega de calitate cel putin rezonabila. Pe un kindle normal se citeste un pic cam greu ( de regula in vederea landscape) dar fara mari probleme pe un kindle DX sau orice alt reader de dimensiuni mai mari. Iar acestea din urma se vor ieftini cu siguranta in viitorul apropiat

Normal ca nu se compara cu un text corectat vers 2.0. Insa si efortul implicat este mult mai mic
Ideea e ca cele doua abordari sunt complementare
Cel care doreste sa corecteze cartea, foloseste ocr-ul extras initial si ori de cate ori este nevoie, verifica textul cu varianta scanata djvu/pdf.
Iar daca nimeni nu doreste, din diverse motive, sa corecteze cartea, atunci cel putin ramane o versiune rezonabila ( djvu/pdf), obtinuta cu minim de efort si care are toate sansele sa circule asa cum e ea  din cauza dimensiunilor mici, de doar cativa mega.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani

     Verbatin, am o propunere:
     Să folosim acest topic pentru dezbateri şi discuţii, iar mai apoi într-un topic de tutoriale să postăm tutoriale, programe şi explicarea lor şi ceea ce rezultă din discuţiile de pe acest topic..
     Cu cât dicuţiile vor fi mai multe şi vor participa mai mulţi useri, sunt şanse ca sistemul de realizare a cărţilor să fie însuşit de mai mulţi membrii ai forumului.
     Îi rog să participe la discuţii câţi mai mulţi useri, atât pe cei care lucrează deja cu unele dintre programe şi ştiu cum se lucrează cu ele, cât şi pe cei ce nu le folosesc, dar sunt interesaţi de folosirea lor.

     Deocamdată, părerea mea este să nu renunţăm complet la sistemul vechi. Va mai dura o perioadă până când majoritatea userilor vor putea să jongleze cu Djvu.
     Până la transformarea lui Djvu în format universal pe forum, să lucrăm cu ambele variante de lucru.
     După cum ai afirmat, nimic nu se compară cu o carte format doc. la V2.0. ori, majoritatea dintre noi, de o perioadă de timp asta încercăm să facem. ca fiecare carte de beletristică să ajungă un text bine corectat.
     
     Cred că SCANAREA e un efort special; în plus, la scanare se distruge mai mult sau mai puţin şi cartea.

     Dacă tot facem acest efort, imaginile trebuie neapărat rulate şi prin Abbyy şi realizat OCR de calitate. Având OCR şi pdf din imagini, cartea poate fi oricând prelucrată până la orice versiune se va dori.
     
     În acest moment încerc să aflu cum se poate salva cu Scan Tailor atât imagini alb-negru, cât şi în nuanţe de gri. Încă lucrez cu versiunea 9.9.2. Probabil că ar trebui făcut prima dată AN, copiate imaginile într-un alt folder şi apoi redeschis Scan Tailor şi setate imagini gri pentru rulat prin Abbyy.


     Cei mai vechi useri de pe forum ştiu că o carte trebuie să fie postată pentru început în două variante:
      — o variantă text, corectată sau OCR de calitate cu sau fără precorecturi;
      — o variantă pdf pentru comparaţia cu textul, pe timpul corecturilor.
      La aceste variante să adăugăm şi
      — fişiere Djvu şi pdf foarte mic, rezultat din convertirea Djvu.

      Timpul va dovedi, dacă dintr-un fişier pdf foarte mic sau fişier Djvu se poate scoate OCR de calitate.
      Am sentimentul că ruşii au rezovat şi problema asta.

Modificat de K7 (acum 9 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
1) Fireste ca nu se pune problema ca userii sa schimbe un sistem de lucru cu altul, acum sau in viitor ( cine sunt eu sa pretind asa ceva?) Mai ales userii de aici , pe RI, care sunt implicati deja in fel de fel de proiecte si ar fi chiar pacat sa renunte la ele
Insa ideea unei compresii eficiente (fara reducerea rezolutiei) este in sine o idee demna de luat in seama
Daca ea este inteleasa si devine mai cunoscuta, sunt sanse sa fie aplicata si de o serie de useri "mai lenesi", aceia care n-au corectat si nici nu vor corecta vreodata vreo carte (ma tem ca si eu ma numar printre acestia) La noi exista perceptia ca digitalizarea unei carti e o operatie mult prea complicata, care presupune zeci de ore de munca.
Nu stiu insa cati realizeaza ca in doar 4-5-6 ore poti nu doar scana cartea ci si sa o pui rapid intr-o forma acceptabila, adica un pdf de doar cativa MB. Asta suna cu siguranta mai incurajator decat ideea de a corecta zeci de ore o carte
Repet, aici nu ma refer la userii obisnuiti cu corectura, ci la cei mai comozi care, in felul acesta, pot veni si ei pe forum cu mici contributii. Asa s-a intamplat in cazul meu, poate ca si altii vor proceda la fel

Practic singura mea intentie a fost de a semnala existenta unor metode de acest tip, deja aplicate cu succes prin alte parti. 

2) Nu toata lumea e la  fel de pretentioasa. Am pus in Kindle acel pdf de 1 MB (Agatha Christie) obtinut din arhiva de imagini pe care mi-ai dat-o astazi si chiar nu am nici o problema de lectura cu el. La fel cu pdf-ul de acelasi tip postat de Aleph putin mai tarziu. Recunosc insa la orice ora ca un mobi sau un document pur text se vad intr-adevar mai bine
Insa odata furat de lectura nu stiu daca te mai gandesti prea mult la calitatea fontului, citesti pur si simplu
Pentru mine cel mai important e ca am scapat de acea luminozitate enervanta a monitorului de calculator.

3) In procedura descrisa in acest topic etapa "djvu" este una relativ minora
90% din efort e in procesarea initiala a scanului, adica etapa "scantailor" , cea in care userul trebuie sa ia niste decizii,
sa verifice paginile etc. Prin contrast, etapa "djvu" se reduce practic la cateva click-uri la care se adauga cele 2-3 minute de procesare automata. Daca cineva stie deja sa lucreze deja cu scantailor, atunci etapa djvu chiar e un "mizilic". Acelasi lucru se poate spune si despre ultima etapa, de obtinere a pdf-ului din fisierul djvu

In ideea de a simplifica si mai mult procedura am cautat si eu alte programe care sa produca direct pdf-ul din imaginile
scantailor, folosind compresie jbig2. Probabil cel mai simplu ar fi sa se foloseasca Adobe Acrobat (am experimentat o varianta trial). In mod ciudat insa, compresia obtinuta de el este cu 25-50% mai mare sau chiar dubla fata de cea obtinuta pornind de la djvu. Cele mai bune rezultate, mai apropiate de cele obtinute cu metoda din acest topic, le-am avut cu doua programele free mult mai mici (unul se numeste pdfbeads, celalalt am uitat ). Din pacate ele lucreaza in linie de comanda si au tot felul de dependinte. Pana la urma varianta cea mai comoda imi pare tot cea bazata pe djvu, dar sunt convins ca la un moment dat se va gasi si o posibilitate de a "sari" peste djvu. Totusi castigul ar fi in acest caz unul minor, caci nu etapa djvu e cea dificila.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani

    Pentru ca cei ce nu au folosit până în prezent Scan Tailor, am urcat rezultatele unui TEST realizat cu ajutorul acestui program.
    Imaginile iniţiale au fost înnegrite şi deformate în mod special (înclinate cu diferite unghiuri spre stânga sau spre dreapta), pentru a pune în evidenţă capacitatea programului.
    Menţionez că toate operaţiunile au fost făcute automat de către program şi nu am intervenit manual.
    Acest lucru nu înseamnă că programul face totul corect în mod automat; în alte situaţii am fost nevoit să întervin la unele dintre imagini, şi mă refer în special la cărţi vechi, scanate necorespunzător.
    În realizarea testului, am plecat de la 7 imagini "JPG" dublă-pagină de circa 4,2 ÷ 4,5 MO fiecare, rezultând 14 imagini "TIF" monopagină de 65 ÷ 75 KO fiecare, din care s-a obţinut un pdf cu PDF-Tools 4, cu valoarea de 521 KO.
    Iată mai jos componentele testului şi adresele lor:
         TEST INIŢIAL - Imagini jpg [29,2 MO].rar         http://www.mediafire.com/?1gcci6455ngyh75
         TEST PRELUCRAT Scan tailor [987 KO].rar   http://www.mediafire.com/?rnb6af8os1b2glb
         [PDF] TEST PDF-Tools 4 [521 KO].pdf           http://www.mediafire.com/?f08hs42g41v36dd


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani

    Voiam doar să anunţ că nu am abandonat ideea tutorialului Scan Tailor.
    Nu ştiu dacă am pornit prea bine. Am vrut să fac un tutorial pe înţelesul tuturor, indiferent cât de începători ar fi... dar e posibil să-l fi creat prea stufos.
    Deşi am redactat 7 pagini A5, încă nu am început explicarea detaliată a etapelor, lucru care de abia acum urmează să-l fac.
    Pentru curiozitate se poate vizualiza cele 7 pagini, fără a trebui să fie descărcate, direct de aici:
                    Tutorial Scan Tailor
    Mi-ar fi de mare folos o părere, ca să ştiu dacă revizuiesc cele făcute până acum sau continui în acelaşi mod.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
Eu zic ca merge asa cum l-ai inceput, dar cei care au folosit mai des Scantailor pot avea o parere mai avizata (eu sunt mai obisnuit cu Scan Kromsator). Tutorialul incepe bine, cu o incadrare in context. In ce priveste gradul de detaliere, aici nici un tutorial nu poate multumi chiar pe toata lumea. Cei mai putin familiarizati cu calculatorul apreciaza probabil un stil mai bogat in detalii. Altii, din contra, pot aprecia un stil mai concis, mai "algoritmic". Dar, zic eu, mai bine mai multe detalii decat prea putine. Pe de alta parte nu trebuie sa fie nici prea multe pagini, altfel se poate crea impresia ca e un program cam complicat, ceea ce chiar nu e cazul.
    Eu l-am folosit prima data acum cateva saptamani, asa pur si simplu, fara nici
un tutorial. Interfata e intuitiva si te conduce pas cu pas. E drept insa ca stiam in general cam care e obiectivul unui asemenea program, fiind deja obisnuit cu Scan Kromsator. Insa cele doua programe nu au prea multe in comun in afara scopului general de procesare a paginilor scanate, adica separarea si indreptarea paginilor, eliminarea marginilor inutile si mai ales conversia textului la B&W

Ce mi-a placut la ScanTailor e modul automat de detectie a imaginilor (in modului "mixt") , lucru care lipseste la SK. O alta caracteristica interesanta e cea de corectie a deformarilor fotografice (cazul in care paginile nu sunt scanate ci fotografiate cu o camera digitala). Insa aceasta ultima facilitate e in stadiu beta si am folosit-o cu nu foarte mare succes

Multumesc ca nu ai abandonat ideea. Evident insa ca nu exista nici un termen limita, va fi gata doar atunci cand crezi tu de cuviinta, 1-2 luni sau mai mult, nu conteaza.

Modificat de verbatim (acum 9 ani)


pus acum 9 ani
   
lauvoi
Pe lista neagra

Inregistrat: acum 13 ani

verbatim a scris:

O carte in format djvu de cateva sute de pagini rareori depaseste 3-4 MB (la 300 dpi).

Cand am citit acest lucru m-am bucurat, eu in continuu in lupta cu spatiu pe HHD, in sfarsit am gasit o forma sa scap de pdf-urile mastodont (peste 10 MB).
Si cand omul nu are ce face, face teste.
Iata rezultatele:

Jules Verne - Burse de calatorie 1978(original).pdf = 17,31 MB http://www.mediafire.com/?89k1o1h2pgm6125

Jules Verne - Burse de calatorie 1978(pdf-djvu).djvu = 44,35 MB  http://www.mediafire.com/?dxy63yy83dy6373

Jules Verne - Burse de calatorie 1978(djvu-pdf).pdf = 177,6 MB http://www.mediafire.com/?4hm904y5ae39vda

Deci pornind de la un pdf de 17 MB, am ajuns la un djvu de 44 de MB, din care a rezultat un pdf de 178 MB.
Se cheama ca am facut economie de spatiu.
...Fara alte comentarii.

Bafta!


pus acum 9 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 10 ani
lauvoi, trebuie vazut cum se poate optimiza procesul de creare a djvu-ului, fiindca metoda functioneaza.

De fapt care e poanta cu djvu-ul asta? Sunt doua chestii ce asigura, impreuna, micsorarea dimensiunii fisierelor:
1 – transformarea textului scanat grayscale (in care fiecare punct care alcatuieste fotografia unei pagini este stocat pe opt biti), in text alb-negru (unde fiecare punct din poza ocupa un singur bit).
2 - algoritmul de compresie jbig2, de pana la 10 ori mai eficient in comprimarea pozelor alb-negru decat algoritmii folositi uzual (de catre Photoshop, Adobe Acrobat, etc.).

In teorie orice poza (pagina) grayscale in care albul si negrul sunt bine separate unul de celalalt se comprima exceptional de bine prin aceasta metoda. Este cazul lucrarilor care contin doar text, precum Alexis Zorba pusa pe forum de verbatim. La cartile care contin fotografii compuse din toate cele 256 de nuante de gri, aceste fotografii practic nu se pot transforma in alb-negru. Afirmatia este discutabila, pentru ca, de exemplu, in ziarele cu tipar alb-negru fotografiile se vad acceptabil de la oarecare distanta, desi din apropiere se distinge screening-ul (punctele negre din care sunt alcatuite). Cei care creeaza dvju-uri au ales o cale de mijloc: portiunile de text din lucrare sunt transformate in black&white, iar fotografiile sunt lasate nemodificate, grayscale. Este vorba, de exemplu, de metoda DjVu Imager.

— In cazul lucrarilor cu foarte multe fotografii sau imagini, rata de compresie in djvu nu este cea asteptata (de 6-10 ori mai buna);
— Crearea PDF-ului, cu tot cu OCR si bookmarks, a durat 30 de minute; crearea djvu-ului a durat 5 ore, pentru ca nu cunosteam chichitele metodei, dar probabil ca cineva care are metoda "in varful degetelor" il poate face in maximum 2 ore. Pentru o compresie de numai 1:2 se cheltuieste de 3-4 ori mai mult timp.

Ramane sa mai invatam si sa vedem cum putem accelera procesul si imbunatati rata de compresie.

In alta ordine de idei, la ScanTailor am observat asa:
— ST nu recunoaste multe dintre pozele inglobate in text, mai ales daca sunt mici si nu au, din cauza calitatii tiparului, un contur bine definit. Dar pe ansamblu face o treaba uimitor de buna in aceasta privinta.
— Cea mai lenta etapa din prelucrarea semiautomata cu ST este ultima, Output, care poate dura o ora pentru o carte de 600 de pagini, in functie de calculator. De aceea trebuie ca primele cinci etape sa fie facute perfect, cu ajustarile manuale de rigoare, si abia cand totul este in regula — split corect, orientare perfect orizontala, zonele de text selectate uneori manual, marginile si pozitionarea textului in pagina asa cum trebuie de la pagina la pagina –, se apasa pe butonul de procesare Output.
— Desi cu ST se pot extrage sau insera pagini din/in lucrare, nu se poate schimba ordinea paginilor. Cred ca e o mare buba, desi problema poate fi rezolvata ocolind-o.    E posibil si sa nu fi inteles eu bine...

Modificat de Aleph (acum 7 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
@Lauvoi

Exista doua mari probleme in prelucrarea ta
1) Pdf-ul original are rezolutie foarte mica (de aproximativ 100 dpi)
2) Modul de prelucrare. Chiar si pentru un pdf "distrus" de genul originalului postat de tine (adica deja prelucrat prin reducerea rezolutiei), se poate ajunge  la un djvu mult mai mic decat 44 MB.

O sa incerc de curiozitate sa vad ce se mai poate obtine dintr-un asemenea pdf
Daca totusi ai originalul "adevarat" (cel de minim 300 dpi) te rog mult sa-l postezi aici (macar o parte a lui, sa zicem vreo 50 de pagini, doar de dragul experimentului)

Cum zicea si Aleph, este esentiala transformarea textului din color/grayscale in pur B&W
Aici este "esenta metodei". Insa, asa cum ziceam, algoritumul djvu e conceput sa lucreze cu imagini de macar 300dpi.


EDIT
Am prelucrat originalul tau de 17 MB , rezultatul fiind urmatorul:
versiunea djvu ( 2,31MB) http://www.mediafire.com/?ur59io7i2d4ia5m
versiunea pdf ( 2,68 MB) http://www.mediafire.com/?kuug9i4x365wm4c

A iesit chiar ceva mai bine decat ma asteptam, dar rezultatul nu e optim datorita rezolutiei initiale mici

EDIT2
@Aleph Am vazut acum si versiunea ta de 3,4MB . Eu am lasat acele 10-15 imagini la rezolutie mai joasa, de aici probabil si diferenta de aproximativ 1 MB dintre cele doua versiuni.
Spre deosebire de tine, am folosit Scan Kromsator. Mie imi place mai mult felul in care SK a prelucrat textul,  are  parca un aspect mai natural. Asta este insa opinia mea, pur subiectiva. In linii mari rezultatele sunt, zic eu, perfect comparabile. Ai lucrat doar cu Scan Tailor, sau ai facut upsize preliminar al imaginilor?

Modificat de verbatim (acum 9 ani)


pus acum 9 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 10 ani
Am lucrat cu ScanTailor, care nu a acceptat TIF-urile la 72 dpi si a propus upscale la 300 dpi, operatie pe care l-am lasat sa o faca. Intr-adevar, partea grafica este si ea la 600 dpi ca si textul, de unde si diferenta de dimensiune dintre variantele de fisiere djvu.

In schimb calitatea textului obtinut de tine cu ScanKromsator este mult mai buna decat ce am putut sa scot eu din ScanTailor, desi m-am jucat nitel cu setarea Thinner de la Output. E prima data cand vad o diferenta clara intre de iese din SK si ce poate ST.

Cum ai micsorat rezolutia partii grafice? Direct din SK?

Ai un MP cu o explicatie despre fisierul-sursa.

Modificat de Aleph (acum 3 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
Daca se folosesc direct imaginile scanate, Scantailor e la fel de bun ca si Scan Kromsator, chiar cu unele avantaje
Dar daca imaginile sursa nu au o calitate prea grozava, cred ca SK e ceva mai potrivit, datorita nenumaratelor posibilitati de ajustare a imaginii, global sau doar pe anumite portiuni ale paginii.

In cazul de fata, procedura a fost mai laborioasa, (cu totul cam o ora si jumatate, manual cam 20 minute)
1) am extras imaginile din pdf cu pdfimages.exe ca fisiere ppm
2) am evaluat in xnview rezolutia imaginilor cu "metoda celor 6 randuri" , am vazut ca e vorba de aproximativ
100 dpi si apoi am folosit un batch xnview cu resize 300% ( algoritmul bspline sau biliniar) obtinand astfel un folder de fisiere tif marite artificial
3) cu acest folder m-am dus in Sk unde am folosit un profil care mi-a fost de folos si cu alte ocazii in situatii de genul acesta. Acest profil are in tabul Quality activat blur (2) sharpen (2) iar la gray enhance are bifat autolevels ( de la tabul contrast) iar la tabul illumination are bifata optiunea "correct illumination". Era un profil mai vechi, am vazut ca rezultatul e acceptabil si nu am incercat sa mai modific/imbunatatesc ceva. In principiu insa se mai pot face setari pe la tabul  gamma sau pe la binarization. Cred ca mergea un sharp/contrast chiar mai mare, s-ar mai fi recuperat niste detalii fine
Rezultatul l-am convertit normal la djvu, fara sa ma preocupe cum ies imaginile
4) Cele 10-15 imagini le-am convertit la djvu cu ajutorul unui script care foloseste documenttodjvum.exe (versiunea linie de comanda a lui djvu small, e si el in arhiva cu programe), am setat acolo o latime mica (600 pixeli) si un profil photo iar la urma de tot am intercalat aceste imagini in corpul djvu obtinut anterior, stergand versiunile vechi (djvu express).  Un pic plictisitor, tinand seama ca erau vreo 15 imagini. Totusi, nu asa trebuie procedat. In mod normal se foloseste djvuimager in combinatie cu Sk sau ST, dar nu am avut rabdare sa citesc documentatia lui cu google translate.

Daca e nevoie, mai dau si alte detalii, poate nu  chiar azi, caci  e Vinerea Mare si sunt cam multe treburi de facut prin casa.

Modificat de verbatim (acum 9 ani)


pus acum 9 ani
   
lauvoi
Pe lista neagra

Inregistrat: acum 13 ani
@verbatim

Pe mine m-ai convins. Dar trebuie convinsa si "TANARA GARDA" (nepoteii mei), nu de alta dar mai au de transformat 44 de carti (pe ei ii intereseaza pdf-ul final):

http://romania-inedit.3xforum.ro/post/2 ... completa_/

Asa ca pentru intelesul lor, ce trebuie facut (bineinteles de miercuri in colo)?
1. Se descarca progrmul .......
2. Se instaleaza programul ........
3. Se fac urmatoarele setari .......
4. Se incarca fisierul "pdf"......
5. Etc, etc.

Paste fericit si multa bafta!


pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
@Lauvoi
Multumesc de urari, Sarbatori Fericite si tie si tuturor celor de aici

Din cate stiu eu, colectia Jules Verne circula deja in format text/mobi/epub, cel putin vreo 20 de volume. Asa ca nepoteii tai  n-ar mai avea chiar asa mult de lucru. Si, de fapt,  pana termina ei de citit 20 de volume poate apar si celelalte. Procedura mai simpla descrisa la inceputul acestui topic e valabila in primul rand pentru cazul cand se lucreaza direct cu imaginile scanate. Conversia la djvu/pdf-jbig2 a unui pdf deja prelucrat  e din pacate ceva mai complicata, sunt mai multi pasi de realizat. Uneori rezultatele sunt bune, alteori mai putin bune. 

@Aleph
M-am jucat un pic cu Scan Tailor in aceasta dimineata, cred ca motivul principal pentru care
prelucrarea textului nu e la nivelul SK e acela ca in cadrul ST imaginilor nu li se face un upsize suficient de mare.
Intr-adevar, ST nu accepta imagini de rezolutie 75-100 dpi (sau mai general sub 300) si atunci e necesar sa setezi, in dialogul acela initial, rezolutia la 300 dpi. Problema e ca aceasta setare e pur formala, ST nu realizeaza in acelasi timp si un upsize al imaginilor. Practic tu declari,  pe proprie raspundere, ca imaginile au de fapt 300 dpi. Singurul moment in care ST face un upsize e acela in care dubleaza rezolutia de la "300dpi" la "600dpi", in realitate o dublare a rezolutiei reale de 100dpi la 200 dpi. Solutia este sa faci un upsize preliminar, in programe de gen xnview/irfanview/photoshop etc. Am testat lucrul acesta pe cateva pagini si rezultatele sunt , din punctul meu de vedere, mai bune.

Modificat de verbatim (acum 9 ani)


pus acum 9 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 10 ani
verbatim – exact la tinta!
Da, asta-i cauza pentru care ST nu contura bine literele.
Aici este pagina 5 din carte trecuta prin ScanTailor, in urmatoarele trei variante:
din PDF optimizat, 72 dpi
din PDF optimizat, upsampled la 300 dpi
din PDF upsampled la 300 dpi
Ultimul are ca sursa PDF-ul de la topicul Jules Verne, care e facut tot din imagini la 72 dpi. Al doilea este din PDF-ul oferit de lauvoi, care pare sa fie procesat pentru optimizare, fiindca are dimensiune de trei ori mai mica decat originalul din topicul Jules Verne.
Diferenta intre variantele 2 si 3 e practic insesizabila, pe cand prima varianta e mult mai proasta.
... era cat pe ce sa-l dezinstalez pe ST 

Modificat de Aleph (acum 9 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
Asa e, ST a fost si ramane un program foarte bun
Ca sa fiu un pic carcotas, as mai adauga ca singura problema la prelucrarea ta e aceea ca paginile au fost marite in final foarte mult ( cu aproximativ 600%) si fisierele djvu rezultate sunt astfel cam mari, de 40-50 KB. Daca rezolutia initiala ar fi fost pe bune 600dpi ar fi meritat probabil pastrata o versiune de maxima calitate la 600 dpi. In cazul de fata insa, cred ca merge lejer o reducere a paginilor cu 50% , diferenta de calitate e proape insesizabila (in definitiv rezolutia reala e de aprox 100 dpi si in acest caz nu e mare diferenta intre rezolutiile aparente 600dpi si 300dpi)

Am reprelucrat pagina ta 2-PDFoptimz300ups.djvu cu rezultatul
http://www.mediafire.com/?dn2yywmvl214y1e
deci o reducere de la 54KB la 14KB

Concret, am extras tiff-ul din pagina djvu si l-am micsorat in xnview cu 50%. Bineinteles ca s-ar putea mai simplu seta in ST rezolutia finala la 300 (in loc de 600 dpi) , trebuie experimentat pentru a vedea care varianta e cea mai buna.

Modificat de verbatim (acum 9 ani)


pus acum 9 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 11 ani
Citesc de cîtva timp acest topic şi am văzut că verbatim are intenţia de a realiza
un tutorial despre ScanKromsator.
Există deja un astfel de tutorial în format PDF (cum-să...), aici:
http://www.arhiva-ortodoxa.info/test/au ... load/Soft/
Sigur că nu este cel mai complet iar dacă verbatim va face unul mai bun, nu putem decît să-i mulţumim.
K7 am văzut că s-a apucat de crearea unui tutorial despre Scan Tailor. Începutul este foarte bun după părerea mea.
Am făcut şi eu mai demult un minitutorial Scan Tailor, însă este mult sub nivelul celui început de K7.
Din acest motiv nu-l voi posta pe forum.
Aştept continuarea şi le mulţumesc tuturor celor care se implică în această activitate.

Modificat de uciN (acum 9 ani)


pus acum 9 ani
   
verbatim
Membru Gold

Inregistrat: acum 9 ani
Multumesc mult de link, Ucin! (si autorului anonim al acestor tutoriale)
Sunt acolo trei tutoriale foarte bune (in romana) unul despre SK, iar celelalte doua despre compresia djvu
Ele imi par extrem de ingrijit concepute, cu explicatii detaliate si numeroase capturi de ecran, deci ceva numai bun pentru incepatori si nu numai (la ultimul am gasit cateva idei utile si pentru mine). Am urmarit mai atent tutorialul SK. Eu zic ca principiile de baza sunt bine prezentate si personal mi-ar fi (mult) mai comod doar sa adaug unele lucruri care lipsesc de acolo.
Cea mai importanta omisiune mi se pare cea referitoare la modul de lucru "draft kromsake", adica modul complet automat
de dispunere a "cutitelor". E drept ca versiunile anterioare lui 5.93 acest mod de lucru nu era prea bine implementat si erau cam multe erori, dar la 5.93 rezultatele imi par foarte bune. S-ar mai putea adauga de asemenea niste idei la post procesare si
la modurile "gray enhance" si alte cateva lucruri mai mult sau mai putin minore.

Ideea e ca, totusi,  Scan Tailor este per ansamblu mai usor de folosit si invatat. Eu am apucat sa ma obisnuiesc cu Scan Kromsator si probabil voi ramane mai mult sau mai putin fidel acestuia, dar pentru ceilalti membri ai forumului as recomanda totusi in primul rand Scan Tailor, urmand ca SK sa fie folosit doar in situatii speciale
Ideal ar fi ca autorul acestor tutoriale sa gaseasca acest forum si eventual sa vina cu unele idei si explicatii suplimentare.


pus acum 9 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 11 ani
Sînt de acord cu tine că ScanTailor este mult mai „comod”.
Totuși aș fi preferat să aibă mai multe opțiuni, de exemplu să poți selecta paginile pare
sau pe cele impare, toate odată și să le prelucrezi diferit.
De asemenea să poţi seta dimensiunea paginii output la un format standard, de exemplu
A4 sau A5, ceea ce se poate face cu Scan Kromsator.
Sper ca aceste lucruri să fie implementate la versiunile următoare, deşi pe site-ul
dezvoltatorului se spune că deocamdată din lipsă de fonduri, proiectul a fost oprit.
Cred că folosirea alternată a celor 2 programe, este cea mai bună soluţie.

Modificat de uciN (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
     Tutorialul Scan Tailor, în format pdf se poate downloada:
            [ST] Iniţiere în utilizarea Scan Tailor [V1.0].pdf 
            http://www.mediafire.com/?zslmpbk89bj23tz

***
    Avem deja o completare la tutorialul Iniţiere în utilizarea Scan Tailor
    Această completarea a fost editată şi îi aparţine în totalitate lui uciN.
    Tot respectul şi mulţumiri pentru uciN.

    Tutorialul, în format pdf se poate downloada de pe megaupload.

            Completare Scan Tailor.pdf 
            http://www.megaupload.com/?d=91ZSTYU0


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 10 ani
(Urmare a unei solicitari de pe forum)
Conversia djvu -> pdf e foarte usor de realizat, din cauza asta nu e nevoie ca langa un djvu sa existe o varianta in mult mai raspanditul format pdf.

Se foloseste DjVuToy (din ultimul link pus de verbatim in prima postare din topic. Setarile uzuale se gasesc in imaginea atasata.


30.7KB


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 9 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 10 ani
O propunere de clasificare a djvu-urilor dupa calitatea cartii-sursa, impreuna cu sugestii de prelucrare aplicabile cartilor de beletristica fara grafica.

Pentru toate categoriile de mai jos sunt valabile:
— Scanare text la 300 dpi grayscale.
— Scanare coperte la 200 dpi color.
— Paginile scanate au randurile drepte.
— Intreg textul este lizibil.
— Paginatia DjVu-ului respecta originalul (eventual se inlatura o pagina alba de la inceput pentru a face loc primei coperte).

                            cal. Foarte buna               cal. Buna
Hartie                  alba, fara defecte                uniforma, fara defecte
Litere                  foarte clar conturate             bine conturate, uneori cu cerneala in exces
Contrast              foarte bun                           foarte bun sau bun
Aplicatie             SK                                      SK sau ST
Output                 600 dpi B&W                       600 sau 300 dpi B&W
Setari SK*           Binarization – Low Dark        Binarization – Low Dark sau Medium Dark
Setari ST*            –                                       eventual Thinner si Despeckle mai mare
Postprocesare    stergere punctulete negre     stergere puncte sau pete de pe margini
Se citeste pe       eReader, PC, listat               eReader, PC, listat


                            cal. Medie                                                    cal. Slaba
Hartie                  neuniforma, cu defecte                                   neuniforma, cu defecte
Litere                  bine definite, de obicei cu cerneala in exces      slab conturate, cu parti lipsa
Contrast              bun sau slab                                                  slab
Aplicatie             ST                                                                 ST
Output                 300 dpi grayscale                                           300 dpi grayscale
Setari ST             White margins, Equalize Illumination                 White margins, Equalize Illumination
Se citeste pe       PC, listat                                                        PC, listat


* SK = ScanKromsator; ST = Scan Tailor

— Notarea djvu-ului obtinut:
    – DjVu & OCR & Bkm = djvu cu layer OCR si cu cuprins;
    – DjVu & OCR = djvu cu layer OCR;
    – DjVu & Bkm = djvu cu cuprins.

Orice sugestie pentru completarea sau modificarea matricei este binevenita.

Modificat de Aleph (acum 7 ani)


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 9 ani
   
Pagini:  1 2    
Mergi la