Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
Briji Profile
Femeie
24 ani
Bihor
cauta Barbat
24 - 48 ani
Forum Romania Inedit / Totul despre cărți - About e-books / Scan-control şi alte alea... Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

         PUNCTE DE VEDERE DESPRE DIVERSE FIŞIERE FOLOSITE ĪN DIGITALIZARE




     Subliniez de la īnceput că ceea ce voi scrie pe acest topic sunt puncte de vedere sau păreri personale, aşa că lucrurile nu trebuie luate ca nişte adevăruri absolute.
     
     Fiecare user cu experienţă foloseşte o metodă de lucru, s-a obişnuit cu o anume tehnică, astfel că ceea ce pentru unul este varianta optimă, pentru altul poate fi o variantă de rezervă sau una complet lipsită de importanţă.

     Ce subiecte aş vrea să abordez?
     Aş vrea să discutăm un pic despre ce īnseamnă scan_control, care sunt fişierele scan_control şi - un lucru foarte important - cum să diferenţiem un adevărat scan_control de un fals scan_control.
     şi... care este diferenţa, avantajele şi dezavantajele unui scan_control simplu şi unul Searshable.

     Cred că se poate discuta un pic şi despre OCR; aici vorbim de două noţiuni: OCR ca tehnică sau proces de prelucrare [tehnica de recunoaştere optică a caracterelor] şi fişierul OCR [un fişier text care a fost obţinut din Abbyy sau programe similare] şi poate că n-ar fi rău să amintim pe scurt posibilităţile de periere ale unui OCR īnainte de a trece la corectura propriu-zisă.


     Dat fiind că sunt īntr-o perioadă īn care īncerc să-mi odihnesc ochii şi nu mai corectez, m-am gāndit că n-ar fi rău să ajut [sau să agasez] prin postarea pe forum a unor subiecte care nu sunt foarte clare pentru toată lumea.

     Probabil că pe parcurs vor apărea şi alte subiecte interesante, aşa cum e posibil ca nimeni să nu fie interesat de subiectele de pe acest topic.

     Aş fi foarte īncāntat - dacă s-ar putea - să nu postez singur pe acest topic.
     Postānd singur ar īnsemna că nu este nimeni interesat şi că ceea ce postez este complet inutil.

     LE:
     Unii dintre termenii pe care īi voi folosi īn postări nu sunt termeni oficiali [de găsit īn DEX], ci sunt termeni dintr-un limbaj convenţional al userilor de pe forum, un fel de jargon al digitalizării.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Postare rezervă

     Termeni şi abrevieri

     SDisk - spaţiu [mărime] ocupat de un fişier pe disc.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     Fişiere SCAN_CONTROL



     Ce este un SCAN_CONTROL?
     Prin termenul de SCAN_CONTROL se īnţelege orice fişier sau arhivă de fişiere care conţin imaginea fidelă a paginilor cărţii tipărite.
     Cānd ne referim la IMAGINEA_FIDELĂ, nu īnseamnă că excludem prelucrări de imagini de genul crop, split, prelucrare contrast, salvarea din color īn grayscale sau din color/grayscale īn alb-negru  etc.
     Prin Imagine fidelă ne referim la faptul că fişierul sau arhiva se bazează pe imaginea originală a paginii cărţii şi că prelucrările imaginii au fost făcute doar cu programe de editare imagine, astfel că pagina-imagine redă toate detaliile din pagina cărţii tipărite.


     ARHIVE DE IMAGINI
     Putem avea arhive de imagini de diverse formate.
     De regulă, se folosesc imagini JPG sau PNG pentru imaginile grayscale sau color şi imagini format TIFF pentru imaginile alb-negru. Pentru imaginile gray/color formatele JPG/PNG oferă cel mai mic spaţiu pe disc [SDisk]; formatul TIFF pentru imagini gray/color va ocupa un SDisk de cāteva ori mai mare decāt aceeaşi imagine JPG/PNG.
     Dimpotrivă, īn cazul imaginilor alb-negru, formatul TIFF este cel ce va oferi cel mai mic SDisk, timp īn care celelalte formate vor da imagini mult mai mari.

     Cum obţinem imaginile?
     - Prima variantă: direct din softul folosit la scanare sau fotografiere, atunci cānd scanarea se face sub softul scanerului.
     - A doua variantă: atunci cānd facem scanarea direct din Abbyy, avem posibilitatea să salvăm imaginile cu meniul "File" --> "Save Images..." şi alegem folderul şi formatul īn care vom salva imaginile. Imaginile salvate din Abbyy au pierderi neglijabile, iar dacă scanarea s-a făcut la rezoluţia corectă de 300 dpi, aceste pierderi sunt complet nesimnificative.

     NOTĂ: Orice prelucrare a unei imagini, cu orice soft de editare imagini, va produce mărirea SDisk.
     Cel mai adesea prelucrăm copertele, care, de regulă, sunt mai uzate decāt conţinutul cărţii şi este necesară o "curăţare". De asemenea, de multe ori creăm coperte noi. Īn ambele cazuri, aceste coperte trec prin mai multe procese de prelucrare şi de fiecare dată creşte SDisk.
     Pentru revenirea la o mărime decentă este bine ca după prelucrare, imaginile să fie īncărcate īn Abbyy şi apoi salvate din nou ca imagini. Vom constata că o copertă care a ajuns la SDisk = 5-6 Mb, va reveni la o mărime cu o valoare sub 1 MB.


     PDF ŞI DjVu DIN IMAGINI
     PDF din imagini este formatul cel mai vechi [clasic] al unui scan_control.
     A nu se confunda PDF_IMG cu PDF-ul obţinut dintr-un text.

     PDF_IMG este obţinut cu diverse softuri şi practic este un fişier care conţine imagini multiple sau un fel de arhivă de imagini care se bazează pe o tehnică specială de comprimare a imaginilor.
     La o adică, diferenţa practică dintre o arhivă de imagini şi PDF_IMG este că datorită tehnologiei de comprimare PDF_IMG ocupă un SDisk mai mic faţă de o arhivă clasică de imagini şi că vizualizarea imaginilor este mai rapidă şi mai comodă.
     Un PDF_IMG, īn funcţie de rezoluţia folosită, poate avea un SDisk de cāţina zeci de MB pānă la cāteva sute MB, īn cazul imaginilor gray/color şi un maxim de 10÷20 MB īn cazul imaginilor alb-negru.

     DjVu este un format mai nou, similar PDF-ului din imagini, dar care se bazează pe altă tehnologie, iar comprimarea este mai puternică. Se foloseşte īn mod special pentru redarea imaginilor alb-negru ajungānd la un SDisk de 2-3 MB pentru o carte, dar se pot obţine īn egală măsurăşi DjVu grayscale sau color.
     Indiferent dacă este vorba despre un DjVu alb-negru sau un DjVu gray/color, fişierul DjVu va avea īntotdeauna un SDisk incomparabil cu al unui PDF la aceeaşi rezoluţie.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     Fişiere Scan_control REAL şi FALS scan_control


     Nu īntotdeauna ceea ce pare a fi un scan_control este cu adevărat un scan_control.
     Să reţinem că există PDF din imagini, dar avem posibilitatea să obţinem PDF dintr-un text... şi mai mult decāt atāt, pe net există foarte multe PDF din text necorectat, deci practic avem de-a face cu un OCR īn format PDF.

     Dacă OCR-ul este unul brut, va fi uşor de constatat şi va fi tratat ca atare.
     Ceva mai dificil de făcut o apreciere corectă este atunci cānd īntālnim un text care este periat automat, dar practic necorectat manual cap-coadă şi īn plus are evidenţieri estetce ale titlurilor etc, iar datele de indentificare ale traducerii şi ediţiei au fost şterse. Īn acest caz ne putem păcăli foarte tare, crezānd că este vorba de un text corectat, īn realitate fiind vorba de un OCR cu mai multe probleme decāt un OCR_Brut.
     La ce mă refer? Un astfel de text periat automat, la acre s-au şters pur şi simplu toate artefactele [răgăliile] are şanse foarte mari să aibă fragmente de text lipsă - este vorba de zonele de text care au conţinut multe artefacte care au fost şterse.
     Atunci cānd noi īnşine pornim de la un OCR_Brut, artefactele ne vor forţa să verificăm originalul şi să constatăm dacă este vorba de artefacte care īnlocuiesc text sau artefacte care īnlocuiesc diverse puncte false din textuta hārtiei.
     Personal cred că a corecta un text periat găsit pe net este mai dificil decāt a corecta un OCR prelucrat de noi. Am găsit astfel de texte pe net care aveau lipsă prpoziţii īntregi sau chiar fraze şi a căror lipsă nu era evidentă īn toate cazurile la simpla citire.
     Īn principiu, prin FALS scan_control nu mă refer la fişierele uşor de depistat, ci la unele mult mai asemănătoare ca aspect cu un scan_control.


     Atunci cānd noi īnşine facem scanarea, vom şti exact ce fişiere avem, deşi...
     Să reţinem un amănunt important: Dacă salvăm PDF [deci nu PDF/A] din Abbyy, atunci vom obţine un PDF care conţine OCR-ul şi nu un PDF din imagini.

     Cānd descoperim in scan_control pe net [de regulă īn format PDF] este bine să-l verificăm cu atenţie pentru a descoperi dacă este vorba despre PDF din imagini sau PDF din text, ori şi mai rău - PDF din OCR periat.

     PDF Grayscale/Color
     Dacă PDF-ul găsit pe net este Grayscale/Color putem observa defecte ale texturii hārtiei şi variaţii ale intensităţii de culoare pe pagină, astfel că stabilirea Real-Fals este relativ mai uşoară, dar nu īntotdeauna este 100% sigură.
     Atenţie! Există unii useri care folosesc īn editoarele de text fundaluri de pagină [Background] bazate pe imagini ale scanării paginilor albe.
     Īn acest caz putem avea inclusiv fundaluri grayscale sau color care par a fi textura hārtiei, dar care īn realitate sunt doar fundaluri. De regulă, omul nu se complică cu multe imagini, aşa că este uşor de stabilit dacă "textura" hārtiei este aceeaşi la multe pagini.
     De asemenea, există utilizatori care īncearcă să imite cāt mai perfect fonturile din cartea tipărită.. plus anteturi şi subsoluri identice cu cartea tipărită, ceea ce poate produce o confuzie şi mai mare.

     Īn cazul PDF-urilor AN confuzia poate fi făcută şi mai uşor.

     Pentru a stabili dacă un PDF este un scan_control real sau unul Fals sunt cāteva lucruri pe care trebuie să le avem īn vedere:
          - un PDF din imagini are valori mari SDisk, timp īn care un PDF din text are valori mai mici, chiar şi īn cazul PDF AN. Aici avem o problemă: dacă un PDF din text conţine imagini īncorporate īn text el poate avea valori mari, deşi este PDF_Text.
          - aşa cum am spus, trebuie vizualizată bine textura hārtiei; chiar şi īn cazul PDF_IMG AN există puncte sau mici pete parazite care apar pe unele dintre pagini;

     Cea mai importantă verificare este să observăm forma literelor, atunci cānd mărim foarte mult zoom-ul de vizualizare.
     Deci, deschidem PDF-ul de verificat, apoi mărim zoom-ul de vizualizare foarte mult... de pildă 1600 ÷ 2400, deci de 16÷24 de ori mărimea originală.
     Urmărim forma literelor şi observăm dacă īşi păstrează conturul iniţial, ori dacă acest contur este zdrenţuit.
     Īn cazul unui PDF_IMG, deci un scan real, conturul literelor este din ce īn ce mai zdrentuit pe măsură ce mărim zoom, ca īn imaginea următoare:



     Dimpotrivă, īn cazul unui PDF_TXT, deci un Fals scan_control, literele īşi păstrează forma, conturul literelor este continuu şi fără franjuri, chiar dacă mărim zoom foarte mult, aşa cum se vede īn următoarea imagine.



     Īn concluzie, trebuie să fim foarte atenţi şi să verificăm bine atunci cānd folosim scan_control din surse necunoscute. Avem şanse să confruntăm un text cu un OCR care arată bine, dar care este chiar mai prost decāt ceea ce corectăm.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     Fişiere scan_control Searshable [cu căutare] şi fişiere scan_control FĂRĂ căutare



     Fişierul care are calitatea maximă, care păstrează toate caracteristicile de calitate ale scanării,
este fişierul PDF Grayscale/Color Searshable la rezoluţia originală [300 dpi].


     Ce este un fişier_scan Searshable?.
     Ca să nu lungim termenii, īn loc de "fişier scan_control", vom folosi termenul "fişier-scan" sau chiar "scan".

     Un fişier PDF/DjVu din imagini [fişier_scan] Searshable, este format din două straturi:
           - stratul VIZIBIL este format din imaginile [pozele] paginilor cărţii, ca īn cazul unui PDF/DjVu obişnuit; deci chiar arată ca un PDF/DjVu clasic din imagini.
           - stratul INVIZIBIL este format din textul OCR al paginilor cărţii.

     Practic, un fişier-scan Searshable conţine atāt scanul_control format din imaginile cārţii, cāt şi textul OCR_brut al cărţii.
     Īnseamnă că īn cazul unui fişier Searshable se pot face căutări cu funcţia "Find", iar fişierul returnează unul sau mai multe rezultate, aşa cum se īntāmplă īn cazul unui editor de text.
     Mai mult decāt atāt, putem selecta fragmente de text mai mari sau mai mici pe care le putem copia ca text īntr-un editor de text.

     Īn cazul copierii de fragmente de text direct din fişierul_scan Searshable trebuie reţinute cāteva aspecte important:
          - textul obţinut este de tip OCR_Brut, deci va conţine erori OCR, spaţii multiple şi alte erori.
          - rāndurile textului vor fi redate ca īn pagina originală, fără a fi unite īn paragraf. Practic īn editor fiecare rānd va fi interpretat ca un paragraf. Īn astfel de situaţii trebuie unite rāndurile fiecărui paragraf īn parte. Din păcate, unirea rāndurilor trebuie făcută manual pentru că nu apar coduri de forţare a liniei următoare.

     Cum "vedem" dacă dacă un fişier_scan este Searshable sau unul fără căutare [ne-Searshable]?
     Pur şi simplu, īn vizualizatorul fişierului, īncercăm să selectăm o zonă de text din pagină.
     Dacă se selectează zona pe care o dorim şi la ckick dreapta apare o opţiune de tip "Copy text", avem de-a face cu un scan Searshable.
     Dacă la īncercarea de selectare se selectează toată pagina, inclusiv margilile albe din jurul textului, īnseamnă că avem de-a face cu un scan clasic din imagini.


     Dezavantaje fişiere_scan Searshable.
     Primul detavantaj este că astfel de fişiere sunt mai mari decāt fişierele_scan simple, adică cele care nu permit căutare.
     Al doilea dezavantaj este că substratul OCR este un OCR brut. Dacă vom căuta un singur cuvānt [de exemplu un nume] vor fi returnate majoritatea rezultatelor reale; dacă vom căuta un grup de cuvinte, atunci trebuie să avem o anume intuiţie la stabilirea şirului de căutat, deoarece OCR poate conţine spaţii multiple şi erori de OCR, astfel că returnarea rezultatelor poate fi mai greoaie sau să nu returneze niciun rezultat.
     Cu cāt scanarea este mai aproape de o scanare perfectă, cu atāt fişierul_scan Searshable va fi şi el mai bun.

     Avantaje fişiere_scan Searshable.
     Permite căutarea.
          - această opţiune este deosebit de importantă īn cazul oricărui tip de Dicţionar. Un dicţionar electronic de tip scan Searshable permite o căutare incomparabil mai rapidă decāt folosirea dicţionarului real tipărit pe hārtie, timp īn care avem siguranţa că dicţionarul electronic este identic cu cel tipărit.
          - presupunem că facem o corectură superioară, [V2.0] sau următoarele. Īn mod normal nu mai este nevoie [sau n-ar mai trebui să fie nevoie] să consultăm fişierul_scan. Totuşi constatăm că este neapărat necesar să consultăm scanul. Dacă avem un scan Searshable, deschidem fişierul şi dăm căutare la un şir de 2-3-4 cuvinte şi ajungem īn cāteva secunde exact la fraza cu pricina. Dacă aven un scan clasic va trebui să defilăm printr-o serie de pagini pānă găsim locul de confruntat.

     Permite copierea.
          - adeseori notele de subsol - sau diverse citate scrise cu caractere mai mici - nu sunt redate corect īn OCR, ori Abbyy pur şi simplu nu le-a citit. Deschidem scanul Searshable, găsim textul cu probleme și dăm copierea fragmentului respectiv direct īn textul de corectat ”sau folosind trecerea prin NotePad pentru pierderea formatării„.
          - dacă avem nevoie de fișe de studiu și găsim īn scanul Searshable fragmente de text care ne interesează, putem copia fragmentele necesare direct īn fişierele text de tip "fișe de studiu".

     Permite reprelucrarea īn Abbyy
     Fişierul se poate īncărca rapid īn Abbyy şi se poate face orice prelucrare de imagine şi text permisă de Abbyy, inclusiv extragerea unui nou OCR mai bine pregătit.
     Atenţie! Acest lucru este valabil doar īn cazul fişierelor Searshable la rezoluţia originală, de preferat Grayscale. Īn cazul fişierelor realizate din imagini micşorate sau fişierelor obţinute din optimizarea fişierului iniţial, rezultatele sunt micşorate sau nesatisfăcătoare.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     Calitatea PDF/DjVu din imagini


     Vom vorbi īn mod special despre PDF, dar principiile sunt valabile īn mare măsură şi pentru DjVu.
     Atunci cānd lucrurile sunt diferite, voi sublinia acest lucru.

     Un PDF se poate obţine din imagini la rezoluţia originală [300 dpi] sau din imagini micşorate.
     Un PDF de calitatea maximă se obţine din imaginile originale, calitatea [lizibilitatea] scăzānd pe mădură ce imaginile [rezoluţia] este micşorată.
     Reducerea prea puternică a imaginilor va duce la obţinerea unui PDF parţial sau total ilizibil şi care nu mai poate fi folosit.

     Īn principiu, un fişier PDF/DjVu are două scopuri:
              - de a fi folosit pentru confruntarea textului de corectat cu acest PDF/DjVu. Īn acest caz fişierele pot fi obţinute din imagini micşorate pānă la o valoare decentă, astfel īncāt toate paginile componenze să fie complet lizibile [citibile].
              - de a fi folosit pentru extrafgerea OCR şi diverse alte prelucrări. Īn acest caz e bine să avem un PDF/DjVU la rezoluţia iniţială [300 dpi]

     Fişierul care are calitatea maximă, care păstrează toate caracteristicile de calitate ale scanării, este fişierul PDF Grayscale/Color Searshable la rezoluţia originală [300 dpi].
     Acest fişier are un SDisk destul de mare, dar, aşa cum am afirmat, poate fi īncărcat oricānd īn Abbyy pentru a obţine aceleaşi rezultate de la scanare.
     Practic, a salva o carte īn format PDF Grayscale Searshable 300 dpi, echivalează cu salvarea folderului Abbyy. Calitatea este aceeaşi, doar că există diferenţe ale spaţiului ocupat pe disc.

     Pentru clarificare am să dau un exemplu şi voi lua un exemplu concret:
     Carte: carte nouă, hārtie de calitate, 528 pagini, mărime medie [12×20 cm], scanarea Grayscale 300 dpi.

     Folder Abbyy - mărime Sdisc = 1,4 GB
     Fişier PDF Grayscale Searshable 300 dpi = 119 MB
     Deci avem un fişier care păstrează toate caracteristicile, dar are un SDisc de cca 11 ori mai mic.

     Să urmărim valorile SDisc la celelalte fişiere obţinute.
     Fişier PDF AN Searshable 300 dpi = 7,7 MB

     Fişier DjVu Grayscale Searshable = 6,4 MB
     Fişier DjVu AN Searshable = 3,33 MB

     De subliniat că am scanat pe īndelete şi cu multă grijă şi că este vorba de o carte nouă [cumpărată mai demult, dar neexpusă īn bibliotecă, ci păstrată īmpachetată şi cu folia originală], tipărită pe hārtie de calitate. Din acest motiv fişierele AN [alb-negru] sunt perfect lizibile, la o notă de 9,75 din 10.
     Īn principiu, la o carte de calitate obişnuită, tipărită pe hārtie mediocră şi care se află īn bibliotecă de cel puţin 7-8 ani, fişierele AN nu pot depăşi nota 8, indiferent de atenţia depusă la scanare.
     Este motivul pentru care insist ca scanarea să se facă īntotdeauna Grayscale sau Color şi nicodată alb-negru. Bineīnţeles că mă refer la scanarea cu scanere obişnuite. Nu vorbim aici de supersanerele folosite de unele dintre marile biblioteci.

     Dacă avem o scanare Grayscale bună şi putem obţine un fişier scan_control AN de calitate, este foarte bine, dar dacă vom face o scanare direct īn AN, şi vom constata că avem pagini ilizibile nu mai este nimic de făcut. Mă rog, putem rescana acele pagini, asta dacă era vorba de o carte personală şi nu de una īmprumutată.

     Deşi computerele din ziua de azi sunt dotate cu harduri care se măsoară īn TB, avem obiceiul să căutăm şi să salvăm fişiere cāt mai mici posibil, deci vom ignora un SSG [PDF Grayscale Searshable 300 dpi] şi vom salva un DjVu AN, asta ca să avem cāt mai multe cărţi īn computer.
     Ce să facem cu foarte multe cărţi de calitate īndoielnică? Fiecare dintre noi are sau nu are īncă un răspuns.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Post Rez

_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mi-am păstrat cāteva postări de rezervă pentru ca ceea ce mi-am propus să scriu să "curgă neīntrerupt".
     Acum puteţi interveni cu observaţii, păreri, propuneri sau orice altceva.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



Ar trebui vorbit si despre djvu-urile mixte (text alb-negru cu imagini color).

Modificat de tuf (acum 8 ani)


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Da. Din păcate, le pierdusem din vedere.
     Deocamdată scriu cum īmi vine la "mānă"...
     Am făcut postări de rezervă ca să pot reorganiza postările īntr-o ordine mai uşor de urmărit, ceea ce īnseamnă că voi modifica postările....


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Pagini: 1  

Mergi la