Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
simona2000 pe Simpatie.ro
Femeie
25 ani
Galati
cauta Barbat
25 - 53 ani
Forum Romania Inedit / Totul despre cărți - About e-books / [TT] Precorectura şi corectura cărţilor electronice Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

                  ═════════     Precorectura şi corectura cărţilor electronice    ═════════


                                              ══     METODĂ PERSONALĂ    ══


     Toată discuţia se va referi la corectura pe computer şi nu la cea pe e-Reader [tabletă sau alte dispozitive].
     Partea de precorectare este un pic diferită, în sensul că pentru corectura pe e-Readere sunt necesare mai multe etape la precorectură.
     Despre pregătire OCR în vederea realizării corecturii pe e-reader, puteţi urmări mai multe informaţii pe topicul lui Aleph de la secţiunea "Totul despre cărţi" [TUTORIAL] De la OCR la v0.9 cu Word for Windows

     Subliniez că ceea ce prezint în continuare este o metodă personală pe care eu o folosesc de mai mult timp, asupra căreia am făcut modificări, îmbunătăţiri sau simplificări. Nu pot afirma că este mai bună sau mai rea decât altă metodă, ci doar că este metoda cu care m-am obişnuit.
     Prezentarea ei pe forum are un singur scop: acela de a da câteva informaţii celor care nu ştiu nimic despre corectură şi care doresc să pornească la drum. În timp, pe măsură ce vor acumula experienţă, ei vor fi cei ce vor hotărî dacă o vor folosi, o vor modifica sau, pur şi simplu, vor folosi altă metodă.

     Această metodă este una dintre variantele CONSERVATOARE.
     Metodele CONSERVATOARE sunt cele mai complexe, aplicabile pentru orice calitate a scanului şi OCR-ului cu scopul de a obţine texte de calitate superioară, pe cât posibil dintr-o singură corectură, care să corespundă oricăror exigenţe şi au următoarele caracteristici:
            - toate etapele se realizează doar pe computer;
            - cartea se lucrează, salvează şi postează într-un format universal uşor editabil [DOC sau RTF] pentru că scopul postării de carte este acela ca oricine să poată prelua cartea şi să facă o nouă corectură pentru versiune superioară sau să o convertească într-un format special după necesităţi şi după bunul gust;
            - au un număr mare de etape, ceea ce permite realizarea unei corecturi de calitate pentru orice OCR, inclusiv acele OCR cu foarte multe probleme de recunoaştere, artefacte de orice fel, cuvinte sau fragmente de text lipsă.
            - sunt eficiente pentru cărţile mai vechi, la care scanurile de control nu sunt de calitate, iar OCR au probleme de recunoaştere;
            - se păstrează numărul de pagină care va fi eliminat pe timpul corecturii [V1.0]
            - notele de subsol se realizează pe timpul corecturii [V1.0]
            - corectura pentru [V1.0] se face în mod obligatoriu cu confruntarea "cărţii originale".
            - rezultatul corecturii poate fi unul de înaltă calitate, dar este de lungă durată.


     MIC DICŢIONAR
     Mai întâi, cred că e bine să clarificăm câţiva termeni şi noţiuni folosite frecvent pe forum, în legătură cu digitalizarea cărţilor:

     – Cartea originală, "originalul" poate fi: cartea tipărită pe hârtie [cunoscută pe forum sub numele de "cartea pe hârtie"], imagini scanate, pdf din imagini sau DjVu din imagini scanate [numit pe forum "scan de control"].

     – OCR – este textul rezultat prin procesarea imaginilor scanate de către un program de tip "Recognito", cum ar fi ABBYY FineReader 9, 10 sau 11, ABBYY PDF Transformer 3.0, Nuance OmniPage Pro 18, Readiris Pro 12 etc.

     – OCR BRUT este OCR-ul aşa cum rezultă el din program asupra căruia nu s-au făcut niciun fel de corecturi.

     – Precorectura – toate înlocuirile multiple, corecturi automate şi semiautomate, corecturi manuale şi formatări de text ce se fac înainte de corectura prin citire cap-coadă a textului.

     – Corectura – se face prin citirea cap-coadă a textului cărţii cu sau fără confruntarea textului cu cartea originală.

     Conform DEX, corectura este:
            Operaţie de înlăturare a greşelilor tipografice dintr-un text sau dintr-o formă de tipar;
            Confruntare a imprimatului tipografic cu textul original în vederea înlăturării greşelilor de tipar;
            Îndreptare a greşelilor care se ivesc în cursul imprimării unui text.


     Folosim noţiunea de corectură, deoarece prin activitatea desfăşurată nu aducem modificări de conţinut al textului, deci nu facem o corectare, ci desfăşurăm exact activitatea similară cu corectura cărţii tipărite, cu diferenţa că noi nu eliminăm greşeli de tipar, ci erori de recunoaştere a textului de către Abbyy [erori de OCR].


     EXPLICAŢII SUPLIMENTARE

     – Format fişier OCR la extragerea din Abbyy Detalii suplimentare în postarea nr.1 de pe topicul Anexa1 metoda corectura
     Recomandare personală:
     Din Abbyy 9  OCR-ul se salvează în format RTF - Formatted text sau RTF - Plain text
     Din Abbyy 10 OCR-ul se salvează numai în format RTF - Plain text
     Din Abbyy 11 OCR-ul se salvează numai în format RTF - Plain text

     – Format fişier la sfârşitul corecturii Formatul de fişier folosit este DOC, deoarece poate fi editat în orice versiune de Word, începând cu Word 2003, precum şi în alte editoare de text [OpenOffice, LibreOffice] şi poate fi preluat pentru versiunea următoare în oricare dintre aceste editoare, folosind orice sistem de operare.
     De aceea toate tutorialele şi exemplele se vor referi la Word 2003.

     – Tip diacritice = diacritice cu sedila
     Din motive de afişare a diacriticelor, asupra cărora nu mai revin, pentru corectură  folosesc Windows XP SP3 [sau Win7 cu tastatura Romanian Layout], care afişează literele <Ţ, ţ> şi <Ş, ş> cu sedilla.
     Detalii despre dicriticele cu sedilă şi diacriticele cu virguliţă, postarea nr.2 de pe topicul Anexa1 metoda corectura

     – Limbaj = Contemporan
     Limbajul contemporan foloseşte scrierea cu â din a în interiorul cuvintelor şi formele sunt, suntem, sunteţi ale verbului a fi.
     Motiv: limba română se bazează pe reguli şi convenţii şi există o regulă a Academiei Române în acest sens care are o vechime de aproape 20 de ani, faţă de care orice comentariu este de prisos. Detalii suplimentare în postarea nr.3 de pe topicul Anexa1 metoda corectura

     – Programe folosite Word 2003, AutoCorect OCR Plus şi facultativ WordPad şi/sau NotePad.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Structura etapelor şi fazelor de precorectură



   ■ MICA PERIERE ÎN WORD [fişier format RTF] – rezultă [V0.1]
        ● conversia linie de dialog de tip bullets la linia de dialog tip text
        ● eliminarea nume autor şi titlu carte din antet
        ● eliminarea trecerii forţate la pagina următoare
        ● formatare la font şi mărime unică


   ■ RULAREA AUTOMATĂ ÎN AC OCR PLUS [fişier format RTF] – rezultă [V0.2]


   ■ MAREA PERIERE ÎN WORD [fişier format RTF] – rezultă [V0.3] – [V0.4]
        ● Crearea şi editarea unor fişiere suplimentare de lucru:
              – Indexul de nume locuri şi persoane
              – Dicţionar Word suplimentar de tip „DIC”
              – Dicţionar temporar de Înlocuiri Multiple pentru AC
        ● Rularea suplimentară a dicţionarului temporar de Înlocuiri Multiple
        ● Verificări [corectări] suplimentare cu Fiind&Replace:
              – litera I în loc de Î la început de paragraf [dialog, frază];
              – paragrafe care se termină fără semne de punctuaţie;
              – găsirea începuturilor de capitole;
              – cifrele 0 şi 1 aflate în text în locul unor litere;
              – cuvinte care au fost rupte la capăt de rând în succesiunea „secvenţă_de_cuvânt” —„cratimă” —„spaţiu” —„secvenţă_de_cuvânt” sau altă succesiune uşor de urmărit;
        ● Corectare pe diagonală:
              – se corectează numai cuvintele subliniate ca greşite şi numai dacă se poate face corectura fără verificarea originalului;
              – scoaterea în evidenţă a numelor (numerelor) capitolelor;
              – eliminarea unor grupuri de artefacte: grupuri de caractere artefact la sfârşit de paragraf, la început de paragraf sau între paragraf; imagini parazite reprezentând pete pe hârtia tipărită, imagini reprezentând bucăţi de text neocerizat ….


   ■ (ÎNLOCUIRI MULTIPLE SUPLIMENTARE ÎN AC) [fişier format RTF]
      Pe măsură ce se înregistrează noi cuvinte în Dicţionarul temporar de Înlocuiri Multiple se face salvare şi ieşire din Word apoi se încarcă fişierul AC OCR Plus unde se face doar rularea dicţionarului temporar, apoi salvare şi revenire în Word.
      Această acţiune se repetă de un număr de ori care depinde de lungimea textului şi de frecvenţa cuvintelor greşite ce se adaugă la dicţionarul de Înlocuiri Multiple.


   ■ FORMATĂRI ÎN WORD [fişier format DOC] – rezultă [V0.5]
              – formatarea textului pe stiluri minimale
              – înlocuire spaţiu de după linia de dialog cu spaţiu neseparabil
              – alte formatări


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 1 – MICA PERIERE ÎN WORD



     Tip fişier: RTF
     Program: Word
     Versiune la sfârşitul etapei: [V0.1]



      ● conversia linie de dialog de tip bullets la linia de dialog tip text [faza este FACULTATIVĂ]

      Această etapă poate fi executată în totalitate, parţial sau deloc, în funcţie de setările de salvare din Abbyy şi dacă fişierul va fi trecut prin AutoCorect sau nu.
      Pentru utilizatorii de Word avansaţi recomand să se execute cât mai multe faze din această etapă pentru a uşura rularea în AutoCorect.

      Presupunem că începem prelucrarea unui OCR BRUT.
      Primul lucru pe care îl avem la îndemână şi e bine/trebuie să îl facem este să convertim liniile de dialog de tip Bullets în linii de dialog de tip text. Cum ştim dacă avem linii de dialog de tip Bullets? E simplu. Dacă selectăm un text care conţine astfel de linii de dialog de tip Bullets, acestea rămân în afara zonei de selecţie, timp în care liniile de dialog de tip text se selectează ca oricare dintre caracterele text.
      Dacă vom rula fişierul prin AutoCorect, atunci nu ne vom mai ocupa de rezolvarea liniiilor de dialog de tip Bullets, deoarece vor fi convertite de către AC chiar la prima opţiune [1.1].

      Dacă nu vom rula fişierul prin AutoCorect, atunci în Word edităm un macro, astfel:
         Tools –> Macro şi ajungem în fereastra "Macros"
      La "Macro name:" punem un nume scurt; să zicem "m1" ori "macro1" sau "dialog", apoi acţionăm butonul "Create" şi în mod automat vom fi duşi în fereastra de editare a macroului din editorul "Microsoft Vizual Basic" unde vom găsi editată macrocomanda în următoarea formă:

     Sub m1()
     '
     ' m1 Macro
     ' Macro created 17.12.2012 by Abc
     '

     End Sub 


      Pe rândul liber de deasupra ultimei linii "End Sub" vom copia următoarea linie:
      ActiveDocument.ConvertNumbersToText

      În acest fel macrocomanda va avea următoarea formă:

     Sub m1()
     '
     ' m1 Macro
     ' Macro created 17.12.2012 by Abc
     '
      ActiveDocument.ConvertNumbersToText
      End Sub


      Salvăm macrocomanda şi ieşim din editor, pentru a reveni la document.
      Pentru realizarea convertirii liniilor de dialog de tip bullets în linii de dialog de tip text rulăm macrocomanda astfel:
         Tools –> Macro [selectăm m1 - în mod normal este deja selectată] şi acţionăm butonul "Run"

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 1 – MICA PERIERE ÎN WORD - continuare


      ● eliminarea nume autor şi titlu carte din antet
      ● eliminarea trecerii forţate la pagina următoare

      Aceste două înlocuiri vor fi tratate împreună deoarece în majoritatea cazurilor vom face ambele înlocuiri cu aceeaşi comandă. Este una dintre fazele cele mai plictisitoare şi care pot consuma mult timp, dacă scanul este de slabă şi cartea scanată a fost una mai veche, cu hârtie îngălbenită şi tiparul [literele tipărite] este slab calitativ.
      Câteva explicaţii scurte:
            – trecerea la pagina următoare în Abbyy 9 este făcută cu „Section Break” – cod Word: ^b
            – trecerea la pagina următoare în Abbyy 10,11 este făcută cu „Manual Page Break” – cod Word: ^m
            – codul Word pentru paragraf nou, adică „Paragraph Mark” – cod: ^p

      La salvarea în Abbyy există posibilitatea ca în fereastra Options -> Save să activăm sau să nu activăm opţiunile:  "Keep headers and footers" şi/sau "Keep page breaks"
      Personal activez ambele opţiuni din următoarele motive:
            – "Keep headers and footers" pentru ca în OCR să apară numărul de pagină; pentru mine numerele de pagină în OCR constituie un fel de coordonate pentru a găsi foarte uşor pagina în PDF pentru confruntarea textului la corectura [V1.0].
            – "Keep page breaks" va face trecerea la o nouă pagină; o convertesc în paragraf [rând] gol pentru a vedea mai bine paginile cărţii în text. Convertirea durează câteva secunde.

      Presupunem că avem OCR-ul cărţii „Balzac – Béatrix”. Paginile cărţii tipărite pot avea mai multe forme:
            ■ a. numele autorului, respectiv titlul cărţii nu apare în antetul paginii, iar numărul de pagină este tipărit singur în partea de sus sau de jos a paginii. Este varianta cea mai comodă de lucrat; Vom avea o singură înlocuire de făcut şi anume: „Section Break” >> „Paragraph Mark” la OCR obţinut cu Abbyy 9 sau „Manual Page Break” >> „Paragraph Mark” la OCR obţinut cu Abbyy 10 şi 11.
     Formula de înlocuire va fi:
                   ^b >> ^p – pentru OCR Abbyy 9
                   ^m >> ^p – pentru OCR Abbyy 10 şi 11

            ■ b. numele autorului, respectiv titlul cărţii apare în antetul paginii, iar numărul de pagină este tipărit singur de jos a paginii. Aici înlocuirea este ceva mai complexă: mai întâi vom înlocui titlul cărţii la început de pagină, pe care-l vom înlocui cu „Paragraph Mark”.
     Formula de înlocuire va fi:
                   ^bBéatrix >> ^p – pentru OCR Abbyy 9
                   ^mBéatrix >> ^p – pentru OCR Abbyy 10 şi 11
     În continuare, pentru simplificarea explicaţiilor, vom folosi doar prima formulă, valabilă pentru Abbyy 9, fiecare utilizator aplicând formula care-l interesează.
     Înlocuirea nu se va face automat, ci cu confirmarea fiecărei poziţii pentru a putea urmări ca ştergerea cuvântului „Béatrix” să nu se facă şi în situaţii în care cuvântul respectiv să trebuiască să rămână în text. Există posibilitatea ca antetul să nu fie recunoscut în orice pagină, iar numele personajului „Béatrix” să fie un cuvânt din text care apare din întâmplare chiar la început de pagină.
     Se procedează similar cu numele autorului după formula:
                   ^bBalzac >> ^p

     ATENŢIE!  Abbyy nu va recunoaşte corect aceste cuvinte în toate anteturile, numele „Balzac” putând apărea şi în forma „Bal/ac”, „Balzae”, „Bolzac”… astfel că, nu toate anteturile, respectiv trecerea la pagina următoare au fost transformate în „Paragraph Mark”. Acelaşi lucru este valabil şi la titlul cărţii.
      Verificarea este simplă: scriem înlocuirea ^b >> ^p  [^m >> ^p], căutăm prima situaţie, găsind de exemplu „Bal/ac”. Vom căuta acum „Bal/ac” la început de pagină, similar cu prima căutare, înlocuind din nou fiecare situaţie.
                   ^bBa/zac >> ^p

      Facem o nouă verificare şi căutăm situaţia următoare, executând modificările.
      În momentul în care la verificarea ^b >> ^p  [^m >> ^p] nu va mai fi găsită nico situaţie, înseamnă că această fază este încheiată.

            ■ c. numele autorului, respectiv titlul cărţii apare în antetul paginii, iar numărul de pagină este tipărit în faţa sau după numele autorului, respectiv titlul cărţii; practic numărul de pagină se află în antet, pe acelaşi rând cu numele autorului [titlul cărţii].
      Înlocuirea se face ca în situaţia expusă la punctul ■ b., doar că trebuie să fim atenţi să păstrăm, deci să nu ştergem numerele de pagină.
      Operaţiunea va fi un pic mai dificilă dar, cu timpul, experienţa va dovedi că ceea ce la început pare greu, pe măsura trecerii timpului va deveni din ce în ce mai simplu.


      ● formatare la font şi mărime unică  [faza este FACULTATIVĂ]

      Această fază este facultativă; este recomandată celor care stăpânesc bine lucrul în editoarele de text şi care ştiu să facă o astfel de formatare într-un timp scurt; formatarea la font şi mărime unică va fi făcută oricum de AutoCorect; scopul executării unei minime formatări în această fază este doar de a scurta timpul de rulare din AutoCorect.
      Ea nu e necesară deloc dacă OCR a fost salvat în Abbyy ca RTF - Plain text, ci doar în situaţiile în care OCR a fost salvat ca RTF - Formatted text.

      Formatarea se poate face şi în Word, dar este mai bine să fie făcută în editorul WordPad sau un alt editor simplu de RTF, deoarece se vor elimina şi o serie de formătari parazite care rezistă în Word, dar care sunt eliminate în Wordpad; fişierul va fi în continuare de tip RTF.

      După executarea acestei etape, pentru adepţii versionării, documentul se poate nota [V0.1]


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 2 – RULAREA AUTOMATĂ ÎN AC OCR Plus



      Tip fişier: RTF
      Program: AutoCorect OCR Plus
      Versiune la sfârşitul etapei: [V0.2]


      La această etapă nu sunt multe lucruri de spus.
      Detalii amănunţite despre AutoCorect OCR Plus şi despre rularea automată, se găsesc pe topicul:
           [AC] AutoCorect OCR Plus - Instructiuni de folosire
      Menţionez că faţă de informaţiile de pe acest topic, între timp au apărut în AutoCorect OCR Plus câteva modificări, în sensul că două pachete mai dificile de opţiuni au fost scoase din rularea automată.

      Mare, mare, mare atenţie la Setarea Punctuaţiei pentru OCR Plus.
      De asemeni este bine de ştiut exact care sunt opţiunile la care userul trebuie să se gândească de două-trei ori înainte de a hotărî dacă le va activa sau nu.

      De reţinut că AutoCorect salvează şi păstrează toate setările până la modificarea voită făcută de către user, ori până la ştergerea programului din computer, accidentat sau voit.
      Asta înseamnă că prima setare se va face pe îndele, fără grabă şi în cunoştinţă de cauză.

      După executarea acestei etape, pentru adepţii versionării, documentul se poate nota [V0.2]


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 3 – MAREA PERIERE ÎN WORD
- prima parte


      Tip fişier: RTF
      Program: Word 2003
      Versiune la sfârşitul etapei: [V0.3] – [V0.4]


     ******************************************************

      STRUCTURA ETAPEI
        ● Crearea şi editarea unor fişiere suplimentare de lucru:
              – Indexul de nume locuri şi persoane
              – Dicţionar Word suplimentar de tip „DIC”
              – Dicţionar temporar de Înlocuiri Multiple pentru AC
        ● Rularea suplimentară a dicţionarului temporar de Înlocuiri Multiple
        ● Verificări [corectări] suplimentare cu Fiind&Replace:
              – litera I în loc de Î la început de paragraf [dialog, frază];
              – paragrafe care se termină fără semne de punctuaţie;
              – găsirea începuturilor de capitole;
              – cifrele 0 şi 1 aflate în text în locul unor litere;
              – cuvinte care au fost rupte la capăt de rând în succesiunea „secvenţă_de_cuvânt” —„cratimă” —„spaţiu” —„secvenţă_de_cuvânt” sau altă succesiune uşor de urmărit;
        ● Corectare pe diagonală:
              – se corectează numai cuvintele subliniate ca greşite şi numai dacă se poate face corectura fără verificarea originalului;
              – scoaterea în evidenţă a numelor (numerelor) capitolelor;
              – eliminarea unor grupuri de artefacte: grupuri de caractere artefact la sfârşit de paragraf, la început de paragraf sau între paragraf; imagini parazite reprezentând pete pe hârtia tipărită, imagini reprezentând bucăţi de text neocerizat….


     ******************************************************

     Fazele acestei etape nu se execută una după alta, ci aproape toate se execută în acelaşi timp.
     În mod practic utilizatorul defilează uşor prin tot documentul, vizualizează (relativ superficial) fiecare pagină şi rezolvă o parte cât mai mare dintre problemele care apar pe pagina respectivă. Aceste probleme se rezolvă la o singură trecere prin text.

     Să subliniem că avem în continuare un document RTF şi ne aflăm în editorul Word.
     Este activat în mod obligatoriu corectorul de limbă pentru limba română, astfel că în text vor fi subliniate o serie de cuvinte, astfel:
           - cuvintele scrise greşit (inclusiv cuvinte corecte care au fost despărţite la capăt de rând şi care acum păstrează cratima deşi se află în interiorul rândurilor, devenind astfel cuvinte greşite);
           - cuvinte corecte, dar necunoscute de Word: nume de locuri şi nume de persoane, arhaisme,regionalisme, limbaj de argou sau jargon, alte cuvinte pe care Word nu le recunoaşte deşi sunt corecte, aşa cum ar fi: niciunui, într-însul, verişoară, tremurândă…

     Pentru ca să putem înţelege mai uşor fiecare acţiune le vom trata separat, dar vom încerca să le aplicăm împreună.

     ******************************************************


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 3 – MAREA PERIERE ÎN WORD
- partea a doua


     ******************************************************
        ● Crearea şi editarea unor fişiere suplimentare de lucru:
              – Indexul de nume locuri, nume persoane şi cuvinte rare
              – Dicţionar Word suplimentar de tip „DIC”

     ******************************************************

     Ce este Indexul de nume locuri şi persoane şi cuvinte rare?
     Este o simplă listă de cuvinte nerecunoscute de către Word şi pe care editorul le subliniază ca „greşite”.
     În această listă sunt trecute numele corecte ale persoanelor [antroponime] şi al locurilor [toponime] care apar în carte.
     În listă se trec şi cuvinte rare, nerecunoscute de Word. Cuvintele rare pot fi cuvinte specifice unei civilizaţii [tomahawk, mingo, delawar, mocassin – pentru pieile roşii; béarnez, gascon, messire, ecuyer, spenţer – pentru romane clasice franceze], specifice unui domeniu de activitate, ori pur şi simplu cuvinte corecte necunoscute de Word.
     Lista este foarte importantă în cazul numelor străine, dacă e vorba de nume ce conţin caractere cu grafie specială  din limbile franceză, germană, spaniolă, nordică, poloneză, cehă etc [franceze: Alençon, Médicis, René, Timolčon, Prętres; suedeze: Dalälv, Härjedalen, Hjälmar, Närke, Östergötland, Västerbötten, Växjö; poloneze: Łódź, Wrocław, Gdańsk, Szczecin, Bydgoszcz, Wałbrzych, Włocławek…]
     
     Să ne uităm la numele provinciei suedeze Härjedalen; dacă în text va apărea sub formele Härjedalen, Härjadelen, Härjedelan, Härjedalin… va fi suficient să ţinem minte numele corect şi să corectăm toate formele? Ori, ar fi mai simplu ca acest cuvânt să fie adăugat în dicţionarul Word şi să-l sublinieze doar atunci când este scris greşit?

     Şi dacă în locul numelui unei provincii care apare mai rar, într-o carte avem nume de persoane, ca de exemplu Sjöström şi Kjellbjörn, care pot apărea în medie de 4-5 ori pe pagină? Încercăm să le ţinem minte şi să le corectăm după cum credem?
     Probabil că ar fi posibil, dar ar fi mult prea greu... şi, în plus, în mod sigur vor rămâne nume greşite, indiferent cât de atenţi vom fi la corectură.

     Iată un exemplu concret de Index: este vorba de Indexul rezultat la sfârşitul volumului 3 din "Ponson du Terrail - Juneţea regelui Henric"; el conţine numele şi cuvintele folosite în vol.3 şi principalele nume din vol.1 şi vol.2 [aprox. 1600 pagini format mediu]
     Viev Mediafire  sau   Viev GoogleDoc   ori  Viev Ge.TT

     Acesta este probabil cel mai complex [stufos] index pe care l-am realizat; l-am afişat tocmai pe acesta pentru că dintr-un lucru complex se poate reţine atât cât ne interesează. Am avut nevoie de ceva atât de complicat pentru că ciclul "Juneţea" este un ciclu destul de mare [el conţine 6 părţi, la aproape 3000 pagini format mediu] numele redate în ediţiile 1879-1880 erau tipărite în diverse forme de la volum la volum şi chiar în cadrul aceluiaşi volum, pentru că lucrul la acest ciclu implică vreo 5 persoane, fiecare dintre ele putând beneficia de indexul făcut la precorectură şi dezvoltat pe parcursul primei corecturi.

     Nu cred că e cazul să mai insist dacă un astfel de Index este important sau/şi oportun; fiecare va hotărî după cum va crede de cuviinţă.
     Să ne uităm un pic la elementele tehnice:
           - fiecare înregistrare de nume are în faţă un punct urmat de spaţiu, dintr-un motiv simplu: cuvântul va rămâne scris aşa cum dorim, cu iniţială minusculă sau majusculă; dacă înregistrarea ar începe direct, Word îi va pune automat iniţială majusculă, deoarece fiecare înregistrare este practic un nou paragraf.
           - numele şi cuvintele sunt grupate pe caracteristici comune, după cum este mai comod pentru fiecare utilizator; cred că e bine ca numele de persoane să nu fie amestecate cu numele de locuri, respectiv cu alte tipuri de cuvinte; important este să ne facem o structură care să ne permită să urmărim uşor cuvintele înregistrate.

     Ar mai trebui să spunem că Indexul este început pe timpul precorecturii, dar el poate şi va trebui să fie completat şi îmbunătăţit pe timpul primei corecturi.

     Bun! Am făcut Indexul. Ce facem cu el? la ce ne foloseşte?

     Am reuşit să actualizez un minitutorial care tratează realizarea şi îmbunătăţirea Indexului de nume şi a Dicţionarului Word Suplimentar.
     Nume fişier: [A5] Index şi Dicţionar Word Suplimentar.pdf
     Adrese vizualizare: Viev Mediafire  sau   Viev GoogleDoc   ori  Viev Ge.TT

     ******************************************************

     Ca să scurtăm un pic lungimea postării, să trecem peste detalii. Cine doreşte poate găsi detalii în tutorialul postat mai sus.
     Dicţionarele de tip „DIC”  pentru Word se găsesc în subfolderul „Proof”.
           - Calea de căutare în Windows XP SP3:
           C:\Documents and Settings\NUME*\Application Data\Microsoft\Proof.
           - Calea de căutare în Windows 7:
           C:\Users\NUME*\AppData\Roaming\Microsoft\Proof

     Crearea dicţionarului suplimentar Word:
           - programul Word trebuie să fie închis.
           - deschidem subfolderul „Proof”, unde vom găsi dicţionarul „Custom.dic”
           - deschidem dicţionarul „Custom.dic”, apoi îl salvăm cu un alt nume, reţinând aspectul că pentru codificare alegem varianta „Unicode”;
           - în acest mod am creat un nou dicţionar, care la acest moment este gol. Dacă dicţionarul conţine înregistrări, atunci ele vor fi şterse, păstrând doar cuvinte valabile în orice dicţionar, cum ar fi: nicio, niciun etc. Numele dicţionarului trebuie să fie sugestiv, să aibă legătură cu titlul cărţii la care lucrăm.
           - ieşim din subfolderul „Proof”.

     Activarea dicţionarului suplimentar Word:
           - deschidem programul Word.
           - accesăm opţiunea: Tools –> Options –> Spelling&Grammar –> Custom Dictionaries şi ajungem în fereastra  Custom Dictionaries;
           - în fereastra Custom Dictionaries, dezactivăm dicţionarul „Custom.dic” şi activăm noul dicţionar. Atenţie: trebuie să avem activ un singur dicţionar.

     Adăugarea de cuvinte în dicţionarul suplimentar Word se face cu opţiunea:
           Tools –> Options –> Spelling and Grammar

     ******************************************************

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 3 – MAREA PERIERE ÎN WORD
- partea a treia


     ******************************************************

        ● Rularea suplimentară a dicţionarului temporar de Înlocuiri Multiple
              – Dicţionar temporar de Înlocuiri Multiple pentru AC

     ******************************************************


     Înainte de a discuta despre dicţionarul temporar de Înlocuiri Multiple pentru AC, trebuie să stabilim un aspect:
     Câte volume de acelaşi tip corectăm?

     NOTĂ: Indiferent câte volume avem în vedere pentru a fi corectate, este bine ca acele cuvinte care au o frecvenţă mai mare în limba română să fie notate într-un dicţionar temporar şi postat pe forum în topicul [AC] Dictionare Inlocuire Multipla  pentru a fi preluate şi completate, după caz, în dicţionarele OCR_DIC sau Dicţionarele Uzuale.
     Echipa AutoCorect ar fi încântată să primească astfel de ajutoare.

     Dacă vom avea la dispoziţie un singur volum, putem face corecturi direct cu ajutorul opţiunii Fiind&Replace din Word.
     Dacă vom corecta mai multe volume care au aceleaşi caracteristici [fac parte dintr-o serie sau ciclu, au aceleaşi caracteristici de tipar, au fost scanate în aceleaşi condiţii, iar recunoaşterea s-a făcut în Abbyy cu acelaşi dicţionar Pattern], atunci este foarte bine să înregistrăm într-un dicţionar AC cuvintele care apar frecvent cu aceeaşi eroare. Vom munci un pic mai mult la primul volum pentru realizarea unui astfel de dicţionar, dar el ne va fi de un real folos la celelalte volume.

     Verificarea frecvenţei în text a unei erori:
     Dacă un anume cuvânt recunoscut eronat se repetă în text, e semn clar că în Dicţionarele AC nu există o înregistrare care să corecteze eroarea cuvântului respectiv.
     Putem verifica ce număr de apariţii are această eroare în text astfel:
     În Fiind&Replace punem atât în fereastra de căutare, cât şi în cea de înlocuire acelaşi cuvânt eronat şi apăsăm butonul „Replace All”.
     ATENŢIE: cuvântul trebuie să fie SCRIS IDENTIC în ambele ferestre pentru a nu produce o înlocuire reală, ci doar o înlocuire a erorii prin ea însăşi. Programul va afişa numărul de înlocuiri făcute în text. Dacă în text există două-trei înlocuiri, atunci cuvântul nu are o frecvenţă mare şi nu prezintă interes pentru AC; corecţia va fi făcută cu Fiind&Replace.
     Dacă numărul de înlocuiri este un număr de câteva zeci sau mai mare, atunci acest cuvânt este unul cu frecvenţă mare care trebuie trecut în dicţionarul AC.

     Utilizatorii avansaţi de AC, vor proceda cum vor dori. Pentru a nu ne complica foarte mult, pentru userii începători, înlocuirile vor fi de tip „Cuvânt întreg”, cu sau fără confirmare.
     
     Dacă este vorba de un substantiv propriu, atunci condiţiile vor fi „Cuvânt întreg” + „Potrivire perfectă”, ex:
          Medicis >> Médicis  Ci Pp
          Médieis >> Médicis  Ci Pp

     Dacă este vorba de un cuvânt obişnuit care se scrie cu iniţială minusculă, atunci condiţiile vor fi „Cuvânt întreg” + „Păstrează capitalizarea”, ceea ce înseamnă că va fi înlocuit doar cuvântul respectiv şi nu şi alte cuvinte cu aceeaşi rădăcină, dar va fi înlocuit atât în situaţia când se află la mijlocul frazei şi este scris cu literă mică, dar va fi înlocuit şi la început de frază când este scris cu iniţială majusculă, ex:
          batrân >> bătrân Ci Pc
          batrânul >> bătrânul Ci Pc

     Recomand ca programul AutoCorect OCR Plus să fie deschis în fundal, având o fereastră de Înlocuiri Multiple deschisă, pentru ca înregistrările să se facă în timp scurt. Pe măsură ce în textul din Word descoperim un cuvânt care trebuie trecute în AC, trecem în prim plan fereastra AC şi vom face înregistrarea, apoi lăsăm fereastra Ac din nou în fundal, continuând defilarea prin textul din Word.
     Este bine ca din când în când [perioada o stabileşte fiecare user în parte, la un timp pe care în consideră comod] să salvăm documentul în Word, închidem fişierul, apoi îl încărcăm în AC unde executăm o singură opţiune, rularea dicţionarului temporar, salvăm fişierul şi revenim în Word.
      Procedând astfel, vom avea în text din ce în ce mai puţine cuvinte subliniate ca „necunoscute” sau „greşite”, ceea ce va uşura descoperirea următoarelor probleme de rezolvat.

     ******************************************************


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 3 – MAREA PERIERE ÎN WORD
- partea a patra


     ******************************************************

        ● Verificări [corectări] suplimentare cu Fiind&Replace:
              – litera I în loc de Î la început de paragraf [dialog, frază];
              – paragrafe care se termină fără semne de punctuaţie;
              – găsirea începuturilor de capitole;
              – cifrele 0 şi 1 aflate în text în locul unor litere;
              – cuvinte care au fost rupte la capăt de rând în succesiunea „secvenţă_de_cuvânt” —„cratimă” —„spaţiu” —„secvenţă_de_cuvânt” sau altă succesiune uşor de urmărit;

     ******************************************************

      Probabil că ar fi necesare ceva mai multe explicaţii în legătură cu opţiunile din pachetele „Format” şi „Special”, dar acest lucru ar necesita mult timp şi ar ocupa mult spaţiu.
      Încerc să realizez un minitutorial doc în acest sens, dar asta nu se va întâmpla foarte repede.
      Redau mai jos corespondenţa engleză-română a setărilor de căutare/înlocuire din fereastra de bază desfăşurată a funcţiei Fiind&Replace. Frecvent se folosesc doar primele două setări.



      Multe înlocuiri, dintre cele menţionate la această etapă, se fac accesând opţiunile din pachetul „Special”.
      Pentru o mai bună edificare, în imaginea de mai jos se află corespondenţa dintre ferestrele "Special" în limba engleză şi limba română.



      Cel mai mult vom folosi [Paragraph Mark] în combinaţie cu alte caractere.
      Ce marchează [Paragraph Mark]?
      [Paragraph Mark] marchează un sfârşit de paragraf şi are codul ^p.

      Rezultă că dacă punem un şir de caracter şi/sau coduri înaintea lui [Paragraph Mark], căutarea, respectiv înlocuirea se referă la ceea ce se află imediat înainte de sfârşitul paragrafului, iar orice şir de caractere şi/sau coduri care se află după [Paragraph Mark] va fi căutat [înlocuit] la începutul paragrafului următor.

      Exemplul 1: căutarea ^$^p  - unde ^$ este codul pentru orice literă, va căuta paragrafe care se termină cu o literă; înseamnă că vom căuta un paragraf care nu are semnul de punctuaţie de sfârşit de paragraf, care poate fi   . : ? !  şi uneori ;
      Exemplul 2: căutarea ,^p  - adică virgulă înainte de [Paragraph Mark], va căuta paragrafe care se termină cu virgulă, deci paragrafe care nu au un semn de punctuaţie corect.
      Exemplul 3: căutarea ^p—  sau ^p^+ [unde ^+ este codul Word pentru EmDash] va căuta paragrafe care încep cu liniuţa EmDash, deci va căuta paragrafele care încep cu linie de dialog.

      Cum ajungem la opţiunea [Paragraph Mark]?
              – accesăm Fiind&Replace şi se va deschide fereastra cu acelaşi nume, în varianta redusă.
              – accesăm butonul „More” şi fereastra se va desfăşura pe verticală.
              – ducem cursorul în fereastra „Find what”, apoi acţionăm butonul „Special” şi se va deschide fereastra cu opţiunile din acest pachet.
              – [Paragraph Mark] se află în prima poziţie de sus în jos în fereastră şi are codul ^p. Facem click pe [Paragraph Mark] şi în fereastra Find sau Replace va fi afişat codul ^p.
              – În fereastra Find sau Replace ducem cursorul în faţa sau după codul ^p şi edităm şirul de caractere de căutat/înlocuit.

      Atenţie! Codurile Word nu sunt aceleaşi cu cele din AutoCorect, chiar dacă unele dintre ele sunt aceleaşi în ambele programe.
      În principiu, înlocuirile de la această fază se fac prin confirmarea fiecărei situaţii în parte, sau căutare, editare manuală în text şi continuarea căutării, folosind butonul "Find Next".

     ******************************************************


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
      [PARANTEZĂ] 

     Înainte de a trece la descrierea modului de executare a corecturii pe diagonală, să clarificăm câteva aspecte:

     Dimensiunile paginii:
     Recomandare: pagină A5 cu marginile următoare [în inches]:

              – sus = jos = 0,4” ÷ 0,5”                [10,2mm ÷ 12,7mm]
              – stânga = dreapta = 0,3”÷ 0,5”      [7,6mm ÷ 12,7mm]
              – header = footer = 0,15” ÷ 0,2”     [3,8mm ÷ 5,1mm]

     Corespondenţa în mm:
              0,1" = 2,54mm; 0,15" = 3,8mm; 0,2" = 5,1mm
              0,3" = 7,6mm; 0,4" = 10,2mm; 0,5" = 12,7mm


     Atenţie: în orice document, editat în orice editor, valorile pentru header şi footer trebuie să fie în mod obligatoriu mai mici decât valorile stabilite pentru marginile de sus [jos], altfel antetul [headerul] vor fi suprascrise peste pagină.
     Formatul de pagină de mai sus nu este un format printabil, ci doar un format pentru lucrul pe computer sau care poate fi convertit în pdf.
     Pentru printarea la imprimantă, marginile se stabilesc în funcţie de caracteristicile imprimantei; de obicei nu se va seta o pagină A5 ca mai sus, ci un format A4 - Landscape, Book fold.


     Fontul cărţii electronice: Bookman Old Style, Droid Serif
     Cel mai folosit font în la realizarea cărţilor electronice este Bookman Old Style, care datorită formei sale suficient de late permite citirea cu uşurinţă pe toate dispozitivele.
     Pentru un text scris în Bookman Old Style sau Times New Roman se pot folosi titluri scrise în Benguiat; de reţinut că Benguiat nu are diacritice româneşti.
     Un alt font care se vede bine pe diverse dispozitive este fontul Droid Serif, realizat special pentru eReadere.

     Într-un text se va folosi un singur font pentru toate tipurile de text sau un font pentru textul de bază şi un alt font pentru titluri; în mod cu totul excepţional se pot admite 3 tipuri de fonturi cu caracteristici asemănătoare.
     Nu se vor amesteca fonturi Serif cu fonturi Sans Serif ori cu fonturi Artistice de tip  Old [scriere veche engleză, gotică, românească etc].
     Nu se vor folosi mai multe fonturi pentru că o carte electronică nu trebuie transformată într-o sorcovă. Graniţa dintre Artă şi Kitsch este foarte uşor de trecut şi adeseori prea multă aplecare asupra formei unei cărţi electronice, neglijează calitatea conţinutului.


     Evidenţierea numărului [numelor] capitolelor.
     Nu recomand ca un capitol să înceapă pe pagină nouă, decât în cazurile în care o carte de mărime medie [circa 300 de pagini] are un număr mic de capitole [10 – 15 capitole], iar numărul capitolului este însoţit de un titlu [un nume] al capitolului.
     Dacă o carte de dimensiune medie are un număr mare de capitole [de exemplu 50],  iar capitolele sunt marcate doar cu număr format din cifre arabe sau cifre romane, însoţit sau nu de cuvântul „Capitolul” atunci capitolul nou va continua pe aceeaşi pagină în care s-a terminat capitolul precedent.
     Între sfârşitul unui capitolul şi numărul [numele] capitolului următor vor exista două rânduri goale. Două rânduri goale sunt suficiente pentru scoaterea în evidenţă a trecerii la capitolul următor. Un număr mai mare de rânduri lungeşte în mod nejustificat textul.
     Între numărul [numele] unui nou capitol şi primul rând al textului său nu recomand rânduri goale. Dacă totuşi utilizatorul doreşte să facă o demarcare specială, poate exista un rând gol, dar nu mai mult.
     În principiu, numărul [numele] capitolului este scris bold cu acelaşi font şi la aceeaşi mărime cu fontul folosit pentru scrierea textului de bază.

     Dacă vom lucra cu stiluri atunci este bine ca numele capitolului să fie evidenţiat cu font color [e vorba de font color şi nu de fundal color] pentru a fi mai uşor de selectat, atunci când se va face formatarea pe stiluri.
     Eventualele rulări ale dicţionarului temporar din AutoCorect nu va afecta culoarea fontului.
     Este de preferat să folosim altă culoare decât roşu şi albastru, deoarece cu roşu putem marca locul în text până la care s-a ajuns cu precorectura sau corectura, iar cu albastru se pot evidenţia cuvintele scrise italic.
     Personal folosesc culoarea aqua cu tonuri mai închise pentru a scoate în evidenţă numele/numărul capitolelor.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 3 – MAREA PERIERE ÎN WORD
- partea a cincea


     ******************************************************

        ● Corectare pe diagonală:
              – se corectează numai cuvintele subliniate ca greşite şi numai dacă se poate face corectura fără verificarea originalului;
              – scoaterea în evidenţă a numelor (numerelor) capitolelor;
              – eliminarea unor grupuri de artefacte: grupuri de caractere artefact la sfârşit de paragraf, la început de paragraf sau între paragraf; imagini parazite reprezentând pete pe hârtia tipărită, imagini reprezentând bucăţi de text neocerizat….

     ******************************************************

     Să reamintim că fazele acestei etape nu se execută separat, ci împreună la o singură trecere [defilare] prin paginile documentului.

     Cronologic, toată această etapă poate fi împărţită în maxim 3 momente:
              – primul moment: crearea dicţionarului suplimentar Word şi activarea sa; crearea documentului Index nume persoane şi locuri; facultativ: crearea unui dicţionar AutoCorect temporar.
              – momentul al doilea: Verificări [corectări] suplimentare cu Fiind&Replace, faza care tocmai a fost explicată;
              – momentul al treilea: corectura pe diagonală cu executarea tuturor corecţiilor ce sunt constatate pe timpul vizualizării textului.
     Ultimele două momente pot fi executate separat, dar şi împreună, în funcţie de experienţa acumulată de utilizator.

     Ce înseamnă corectură pe diagonală?
     Aşa cum am mai menţionat, corectura pe diagonală cuprinde totalitatea corecturilor simple, care se pot face repede, fără consultarea cărţii originale şi fără citirea textului.

     ******************************************************

     Modul de executare a corecţiei pe diagonală.
     Începem cu prima pagină şi evidenţiem numele primului capitol, prin colorarea fontului şi asigurarea a două rânduri goale înainte de numele capitolului [eventual un rând gol după numele capitolului, dacă am hotărât că trebuie să facem o astfel de evidenţiere].

     Ce mai constatăm la prima pagină din text? Sunt 8 cuvinte subliniate de Word ca fiind greşite; în 3 dintre situaţii este vorba de un nume [Francois], 3 sunt cuvinte fără diacritice, un cuvânt are litera I în loc de L mic [„Iucrează” în loc de „lucrează”], iar unul dintre cuvinte este scris sub forma „spri]mincl”
     Cele 3 cuvinte fără diacritice sunt uşor de corectat deoarece este de vorba de „cazut”, „dimb” şi „tăran” care se corectează în „căzut”, „dâmb” şi „ţăran” – fapt pentru care le şi corectez.
     Cuvântul „Iucrează” este uşor de constatat că nu poate fi altul decât „lucrează” şi, de asemenea îl corectez.
     Cuvântul „spri]mincl” poate fi în realitate „sprijinind”, dar nu sunt sigur şi ar trebui să verific în textul original. N-am timp de pierdut cu o astfel de verificare, fapt pentru care trec peste acest cuvânt, lăsându-l în forma sa incorectă.

     Pentru că „Francois” este un nume care va apărea de multe ori în text, trebuie să-i acord mai multă atenţie, astfel: verific în textul original [PDF, DjVu] forma corectă de scriere a numelui; dacă am cartea originală, în cazul nostru în franceză, verific forma de scriere şi în original, eventual pe net dacă ar fi vorba de un nume geografic. Pronanil că numele corect este „François” şi nu „Francois”.
     Am verificat în PDF: din păcate numele apare scris atât în forma „François” cât şi în forma „Francois”. Verific într-un PDF în limba franceză şi constat că nu mele corect este „François”.
     Trec numele „François” în Indexul de nume, apoi îl adaug în dicţionarul Word suplimentar cu ajutorul opţiunii „Tools –> Options –> Spelling and Grammar”

     În acest moment în textul de corectat cele trei nume „Francois” rămân în continuare subliniate ca fiind greşite. În mod sigur pe parcursul textului vor fi multe alte situaţii în care numele şi alte nume François vor apărea în forma „Francois”. Ne putem folosi de funcţia Find&Replace şi facem corectura de rigoare în mod automat pentru toate situaţiile, având bifate opţiunile March case [Potrivire litere mari şi mici] şi Find whole words only [Numai cuvinte complete].
     Recomand ca această înlocuire să fie trecută şi în dicţionarul temporar AutoCorect cu condiţiile „Cuvânt întreg” plus „Potrivire perfectă”
     După ce am făcut înlocuirea cu Find&Replace textul de corectat a rămas cu un singur cuvânt subliniat în prima pagină: este vorba despre acel spri]mincl” peste care trecem, urmând ca el să fie corectat la corectura manuală prin citire cap-coadă a textului.
     Păstrăm numărul de pagină care este „5” în cazul nostru, urmând ca el să fie şters la corectura manuală şi vizualizăm pagina 2, unde nu avem decât un cuvânt subliniat,uşor de corectat; îl corectăm şi mergem mai departe.

     În a treia pagină de text [care practic este pagina 7 a cărţii tipărite], apar două nume noi  subliniate: Bearn, care pare să fie numele unei localităţi şi Onesime,un nou personaj. Mai apar două cuvinte subliniate la care este greu de stabilit forma corectă la prima vedere.
    Verificăm în PDF şi în varianta franceză cum se scriu corect aceste două nume: Bearn şi Onesime. Din verificări rezultă că scrierea corectă a numelor este Béarn şi Onésime.
     Procedăm exact ca la numele Francois >> François.

     În următoarea pagină apare ceva interesant: cuvintele Bearnez şi Bearnezul – acestea sunt scrise cu majuscule şi înseamnă locuitor al oraşului Béarn. Sunt necesare două corecturi: în limba română numele locuitorilor unei ţări, unui oraş etc,. se scrie cu iniţială minusculă şi nu cu iniţială majusculă, apoi dacă forma corectă a oraşului este Béarn, scris cu „e”, înseamnă că şi numele locuitorilor acestui oraş trebuie scris cu litera „é”, deci béarnez şi béarnezul. Trebuie să reţinem că numele locuitorilor acestui oraş pot apărea scrise în multe forme, articulat-nearticulat, masculin-feminin, singular-plural, astfel că pot exista cuvinte multe în text, precum: béarnez, béarnezul, béarnezului, béarnezi, béarnezii… béarneza, béarnezele…

      Va trebui să trecem toate aceste forme în index, dar vom adăuga în dicţionarul Word suplimentar doar acele forme care apar în text şi doar atunci când va apărea o formă nouă.
      Trebuie să facem înlocuirile în text; constatăm că sunt cam multe, dacă vom folosi setarea „cuvânt întreg”
      Aceasta este o situaţie care s-ar rezolva mult mai simplu în AutoCorect prin rularea dicţionarului temporar după ce în acest dicţionar vom înregistra cu grijă modificările ce trebuie făcute. Deşi se poate face şi o înregistrare de genul:
           Bearnez >> béarnez, cu condiţia „Cuvânt întreg la început” plus „Potrivire perfectă”
aş prefera să se facă mai multe înregistrări cu condiţia clasică „cuvânt întreg”, adică întreg la ambele capete, plus condiţia „potrivire perfectă”, deci înregistrările vor fi sub forma:
           Bearnez >> béarnez   Ci Pp
           Bearnezul >> béarnezul   Ci Pp
           Bearnezului >> béarnezului   Ci Pp
           Bearneza >> béarneza   Ci Pp ……….
      După editarea şi salvarea înregistrărilor, salvăm fişierul în Word şi ieşim, apoi încărcăm fişierul în AC, rulăm doar dicţionarul temporar, salvăm, închidem fişierul şi revenind în Word la pagina la care am rămas.

      În acest moment, toate cuvintele ce ţin de rădăcina „béarnez” au fost corectate; dacă ele apar subliniate înseamnă că nu au fost încă adăugate în dicţionarul Word suplimentar şi procedăm ca atare.

      Trecem la pagina următoare,unde nu apare nimic interesant, aşa cum nu apare nimic nici la următoarele două.

      Trecând la o nouă pagină, întâlnim numărul capitolului 2, scris sub forma cu cifre romane „II”. Avem grijă să asigurăm două rânduri goale între sfârşitul primului capitol şi numărul/numele celui de-al doilea [eu l-aş marca cu font verde pentru a putea să-l selectez mai uşor la momentul în care voi face formatarea pe stiluri.

      Parcurgem în continuare pagină cu pagină, corectând cuvintele ce se pot corecta foarte uşor, trecând peste cele cu erori mai dificile şi rezolvând problema numelor de locuri şi persoane.

      Într-o pagină întâlnim o situaţie nouă: cuvântul „următoarea” este scris sub forma „urmă- toarea”. Cuvântul a fost despărţit în cartea tipărită la capăt de rând şi Abbyy a păstrat cratima de despărţire la capăt de rând ca şi când ar fi o cratimă normală.
      Este posibil ca şi alte cuvinte să fie despărţite în acest mod în text.
      Este necesară o verificare, eventual o corectură.

      Ne folosim de funcţia cu Find&Replace, şi în fereastra „Find…” punem cratimă urmată de spaţiu, iar în fereastra „Replace…”  nu punem nimic; altfel spus vom şterge dratima urmată de spaţiu. Înlocuirea se va face în mod obligatoriu cu confirmarea fiecărei situaţii în parte, pentru a nu şterge o cratimă corectă la care eroare este spaţiul de după cratimă, cum ar fi de exemplu cuvântul „într-un”, scris eronat sub forma „într- un”.

      Pentru cuvinte care se scriu în mod corect cu cratimă, dar la care a a părut un spaţiu după cratimă, ca în cazul lui „într- un”, se poate face o altă înlocuire cu confirmarea fiecărui caz în parte; în fereastra „Find…” punem cratimă urmată de spaţiu, iar în fereastra „Replace…”  punem doar cratima; În acest mod se va şterge doar acel spaţiu parazit care a apărut după cratima corectă.

     ******************************************************

      Respectând regula, „corectăm cât mai multe dintre erorile ce se pot corecta foarte uşor, trecând peste erorile mai dificile” facem vizualizarea întregului document. Important este să nu se piardă timpul cu mărunţişuri care cer mai mult timp, dar, în acelaşi timp, să se corecteze cât mai multe erori, astfel încât corectura manuală prin citire cap-coadă a textului să se poată face cât mai comod.
       
      Pe timpul vizualizării textului se pot face şi alte corecţii şi perieri în plus faţă de cele descrise mai sus. Fiecare utilizator va corecta acele erori pe care le consideră necesare.
      Se mai pot elimina grupuri de artefacte [şiruri de caractere de genul: ■ ^ •  < >  ► □ ▪ ▫ ● ▼ ◄ ▲ ◊ ○ ◘  ◙ ◦  ¦  @ # $ Ł % + =  § ♦ ], care pot apărea în mod eronat grupate la sfârşitul unor paragrafe sau în zone ale paginii unde în mod normal este spaţiu liber, adică nu există text.
      Astfel de caractere de tip artefact sau „răgălii” cum mai sunt numite în digitalizare, apar atunci când cartea tipărită era mai veche, hârtia avea o textură neuniformă cu aspect pătat, marmorat sau mozaicat, urme de pete etc. Abbyy interpretează că aceste pete de pe zona albă a paginii ar fi text, fapt pentru care face o „recunoaştere” complet neinspirată sub forma unor siruri mai lungi sau mai scurte de astfel de caractere.

     ******************************************************

      După executarea acestei etape, pentru adepţii versionării, documentul se poate nota [V0.3] sau [V4.0] în funcţie de numărul de corecţii realizate. 


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      Etapa 4 – FORMATĂRI ÎN WORD



     Tip fişier: RTF >> DOC
     Program: Word
     Versiune la sfârşitul etapei: [V0.5]


     Fazele etapei 4:
              – formatarea textului pe stiluri minimale
              – înlocuire spaţiu de după linia de dialog cu spaţiu neseparabil
              – alte formatări



     Primul lucru în această etapă este conversia de la formatul RTF la format DOC.
     De ce trebuie să facem această conversie? Deoarece o serie de „lucruri” se pot face uşor într-un document DOC, dar mai greu într-un document RTF; în plus, în momentul în care facem formatareape stiluri, ele se păstrează în format DOC, dar se pot pierde în format RTF.
     Mai reţinem că din acest moment se interzice cu desăvârşire rularea automată în AutoCorect; se poate face doar rularea unor dicţionare temporare, cu confirmare, în cazuri cu totul şi cu totul excepţionale, urmând ca apoi să refacem formatările în Word.

     Etapa se adresează în special adepţilor formatărilor pe stiluri.
     Pentru cei ce nu folosesc stilurile este necesar să fie făcute câteva formatări minime.
     Despre stiluri în Word este necesară o discuţie mai amplă într-un alt topic pentru a nu lungi foarte mult acest topic.

     Este foarte important de reţinut că trebuie să facem o formatare MINIMĂ, care să cuprindă doar atât cât ne este necesar, şi să folosim cât mai puţine coduri Word, deoarece aceste coduri nu sunt recunoscute de alte editoare.
     De foarte multe ori, un text formatat complex, deschis în editoare de acelaşi tip dar mai vechi cronologic sau deschise în alte tipuri de editoare, ne va da mari dureri de cap, deoarece vor trebui eliminate, modificate sau convertite o serie de formatări.


     Ce formatări SE POT FACE în această etapă?


          – înlocuire spaţiu de după linia de dialog cu spaţiu neseparabil;
     Este o înlocuire care s-a făcut deja la rularea prin AutoCorect; este bine să fie refăcută şi acum, dar, cel mai important, trebuie refăcută neapărat la terminarea fiecărei corecturi pentru o nouă versiune, deoarece pe parcursul corecturii pot să apară dialoguri noi;
     Înlocuirea se poate face foarte uşor cu funcţia Find&Replace, astfel:
             în fereastra Find: ^p—^w  adică, Paragraph Mark, linie de dialog urmată de spaţiu obişnuit;
             în fereastra Replace: ^p^+^s  adică, Paragraph Mark, linie EmDash urmată de spaţiu neseparabil.

          – formatarea paginii
     Se verifică şi/sau se face formatarea paginii ţinând cont de lucrurile discutate despre raportul dintre margini;

          – stabilirea tipului de font şi a mărimii lui pentru textul de bază al cărţii;
     Presupunem că nu ştim nimic despre stiluri şi nici nu ne interesează lucruri cu stiluri.
     Cu toate acestea, chiar dacă nu ne interesează stilurile, trebuie să ştim că întotdeauna documentul are deja setate nişte stiluri implicite pe care le vom folosi chiar fără voinţa noastră, aşa cum au fost ele setate sau aplicând modificările noastre, pe care habar nu avem că le-am aplicat.

     Când nu folosim stiluri, constatăm adeseori că editorul începe să scrie cu un alt font sau o altă mărime decât cele pe care ni le dorim. Pentru a evita astfel de lucruri şi pentru a lucra mai uşor, trebuie făcută o modificare de stil.

     Trebuie să acceptăm că fiecare dintre noi preferă un număr mai mare sau mic de fonturi, timp în care nu ne plac altele.
     Ne-am obişnuit deja să scriem cu un font anume şi la o mărime anume; să presupunem că folosim arhicunoscutul Bookman Old Style la mărimea 11…
     Ne place ca un între rânduri să existe un spaţiu decent… sau poate un spaţiu mai mare… să presupunem, totuşi, că preferăm ca textul să fie spaţiat „la un rând” şi nu mai mult, adică nu dorim ca textul să fie mai „aerisit”
     Este corect ca paragraful nou să înceapă mai din interior; arată mai elegant.
     Ne place ca rândurile unui text să fie aliniate atât la stânga cât şi la dreapta, aliniere numită „Justify”… sau poate preferăm alinierea la stânga.
     Pentru aceste câteva caracteristici avem deja câte o preferinţă, chiar dacă nu ne-am dat seama.
     Ei bine, toate aceste caracteristici formează un pachet ce se mai numeşte şi stil.
     Iată că fiecare dintre noi preferă un anume stil.

     Deci, pentru un text scris în mod obişnuit, adică în mod „normal” preferăm un pachet de caracteristici, deci un stil, pe care am putea să-l numim „Stilul Obişnuit”  sau „Stilul Normal”.

     Word a ales să numească „Normal” acest stil şi el există în orice document Word. Stilul „Normal” este stilul de bază într-un document; stilul „Normal” este un fel de matcă a unui roi de insecte, este modelul principal. În acelaşi timp este şi şeful stilurilor, pentru toate celelalte stiluri; indiferent cât de multe stiluri am crea, toate acestea pleacă de la caracteristicile textului normal la care se aplică mai multe sau mai puţine modificări.

     Stilurile sunt organizate pe principiul militar, unde stilul „normal” este şeful suprem, pentru că toate celelalte stiluri i se subordonează direct sau indirect şi depind de el.

     Dacă stilul „Normal” are setat fontul Arial de mărime 10 şi noi îl vom modifica în fontul Courier New 11, se vor modifica în mod automat toate stilurile documentului care se bazau pe fontul Arial 10. Aceste stiluri vor avea acum ca font implicit Courier New 11.
     Acesta este motivul pentru care un document formatat pe stiluri va putea fi modificat în câteva minute, astfel încât să aibă alte fonturi, alte mărimi, alte alinieri etc… Practic, lucrând cu stiluri putem schimba aspectul unui text într-un timp de câteva zeci de secunde la câteva minute, din orice în orice, inclusiv să-i eliminăm stilurile.

     Munca în sens invers, adică trecerea de la un text fără stiluri, la un text bazat pe stiluri poate dura foarte mult, uneori ne sunt necesare ore întregi, mergând până acolo încât să fim nevoiţi să formatăm paragraf cu paragraf.
     Să încheiem această lungă paranteză despre stiluri şi să reţinem că orice document are un stil numit „Normal” pe care ar trebui să-l modificăm conform dorinţelor noastre, chiar dacă nu lucrăm cu stiluri, deoarece în realitate lucrăm dar nu ştim asta.

     Cum putem modifica stilul „Normal”?
     În Word 2003: activăm opţiunea Format –> Styles and Formatting şi se va afişa în dreapta ecranului fereastra de stiluri numită Styles and Formatting.

     În Word 2007 (2010) în tabul „Home”, în partea dreaptă-jos a grupului „Styles” se află săgeţica expand. Click pe săgeată şi în dreapta ecranului va fi afişată fereastra „Styles”. Bifăm căsuţa „Show Preview” pentru ca în fereastră să se afişeze numele stilurilor în varianta formatată.

     Acum să modificăm stilul „Normal”.
     Deplasăm cursorul mausului pe stilul „Normal”, iar semnul ¶ [paragraf] din dreapta se transformă în ▼ [triunghi cu vârful în jos]. Click pe triunghi şi se deshide o mică fereastră de opţiuni unde accesăm opţiunea „Modify”.
     Se va deschide fereastra de setare a stilurilor.
     Click butonul „Format” din stânga jos, apoi accesăm „Font…” şi stabilim tipul fontului şi mărimea, apoi click butonul „OK” şi revenim în fereastra de setare a stilurilor.
     Click din nou pe butonul „Format” şi accesăm „Paragraph…” unde setăm tipul alinierii şi celelalte setări din pachetul „Paragraph”.
     E bine să facem şi setarea limbii române cu afişarea greşelilor ortografice [click „Format”, apoi „Language…”].
     Cam acest lucru implică modificarea stilului „Normal”.

     Dacă lucrăm cu stiluri, atunci vom face setările de rigoare şi la celelalte stiluri, după care procedăm la formatarea pe stiluri a întregului text.
     Despre formatarea textului pe stiluri nu are sens să mai discutăm acum, deoarece utilizatorii care lucrează cu stiluri ştiu să facă această formatare, iar cei ce nu ştiu să lucreze cu stiluri au nevoie de explicaţii foarte detaliate, şi nu este locul şi momentul aici şi acum.

     
     ******************************************************


     Ce formatări
NU SE FAC la cartea digitală?

     Înainte de a sublinia ce formatări nu trebuie să facem, ar fi bine să subliniem că există 3 motive [scopuri] pentru care precorectăm şi/sau corectăm cărţi:
              §1. pentru uz exclusiv personal: în acest caz orice fel de formatare este permisă.
              §2. pentru a realiza un PDF ce va fi oferit şi altor persoane: aici se admit unele lucruri, precum despărţirea automată sau manuală a cuvintelor la capăt de rând, condensarea fontului pentru unele fraze; se admite cu măsură, adăugarea de ornamente topografice, fundaluri, imagini etc. PDF se postează alături de formatul DOC şi nicidecum nu-l înlocuieşte pe acesta.
              §3. fişier text ce va fi oferit „la vedere” pentru a fi citit de oricine sau spre a fi corectat pentru o versiune superioară. În acest caz formatările vor fi minime, astfel încât orice utilizator să poată continua corectura în orice editor de text, sub orice sistem de operare, fără a fi nevoit ca mai înainte să facă o reformatare care ar putea să-i ia mult timp şi să-l determine să renunţe la o nouă corectură.

     Vom enumera câteva lucruri care nu se fac, ori se pot face pentru o variantă, dar nu se  fac pentru altă variantă.

              ♦ despărţirea cuvintelor la capăt de rând;
     – este admisă pentru §1 şi §2;
     – este interzisă cu desărvârşire atât despărţirea manuală, cât şi cea automată pentru §3; este important de reţinut că în Linux liniuţa de despărţire de la capăt de rând fie ea automată sau manuală se transformă în cratimă clasică, iar cuvintele despărţite la capăt de rând vor apărea cu cratimă la mijlocul rândului; acest lucru se întâmplă chiar dacă păstrăm absolut aceleaşi setări ale paginii.
       
              ♦ expandarea sau condensarea textului pentru anumite paragrafe
     – este admisă pentru §1 şi §2;
     – este interzisă pentru §3; utilizatorul care va face download cărţii va păstra sau nu va păstra formatul de pagină; în momentul în care va modifica formatul paginii, toate condensările de text îşi vor pierde sensul.

              ♦ aplicarea de fundaluri de pagină
     – este admisă pentru §1 şi în anumite limite pentru §2; la §2 se va avea grijă ca fundalul să nu aibă o textură agresivă şi culori care să deranjeze la ochi pe timpul cititului cărţii; recomand fundaluri de nuanţe pale şi nestrălucitoare; dacă utilizatorul ţine neapărat să stabilească un fundal, atunci acesta trebuie mai mult să se simtă decât să se vadă, el va trebui să ajute ochii la citit şi nu să-i obosească.
     – este interzisă pentru §3.

              ♦ adăugarea de ornamente topografice şi imagini
     – este admisă pentru §1; se admite cu mare atenţie pentru §2;
     – este interzisă pentru §3. La §3 copertele se pot adăuga lângă fişierul doc ca fişiere de tip imagine şi nu este obligatoriu să fie inserate în document.

              ♦ inserarea sau editarea unui cuprins
     – este indicat pentru §1 şi §2;
     – la §3 se poate insera un cuprins cu ajutorul opţiunii „Insert –> Reference –> Index and Tables –> Table of Contents” pentru verificarea corectitudinii numerotării capitolelor, dar cuprinsul nu se justifică deoarece la o reformatare a paginii cuprinsul trebuie refăcut.


     Aşa cum am mai spus, ne vom feri să transformăm o carte electronică într-o sorcovă.
     În primul rând ceea ce este foarte colorat şi încărcat nu este neapărat şi estetic, deci ar putea să nu placă, pentru că în loc de o realizare de înaltă ţinută poate rezulta un kitsch.
     În al doilea rând, foarte multe cărţi de pe forum care sunt „ornate” au mari deficienţe de corectură, deoarece userul s-a preocupat mai mult de partea grafică decât de corectură.
     În al treilea rând, o carte gen „Pro Arte” este în primul rând o realizare artistică pe care o răsfoieşti cu plăcere şi nu o carte de citit; cititul unui număr mai mare a unor astfel de volume oboseşte ochii mai mult decât un text obişnuit; a astfel de carte trebuie să fie o realizare de excepţie şi nu ceva de zi cu zi, pe care o poate realiza de oricine şi oriunde.
     În al patrulea rând trebuie să ţinem minte permanent că din ce în ce mai mulţi useri vor lua cărţile noastre pentru a le converti în formate speciale pentru cititul pe eReader.

     ******************************************************

      După executarea acestei etape, pentru adepţii versionării, documentul se poate nota [V0.5].


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cam acestea ar fi principalele etape şi faze pe care le execut pentru pregătirea textului în vederea trecerii la corectura manuală prin citire cap-coadă a textului şi confruntarea cu originalul, cunoscută şi sub numele de corectura pentru versiunea [V1.0].

      Probabil că pare destul de complicat, dar obişnuiesc să-mi pregătesc singur OCR-urile înainte de corectare, astfel că acord mare importanţă precorecturii pentru a avea o muncă mai uşoară la corectura propriu-zisă.

      Deocamdată mă opresc cu explicaţiile aici şi aştept eventualele întrebări pentru a corecta posibilele erori sau pentru a dezvolta explicaţiile insuficiente, urmând ca după 4-5 ianuarie să scriu câteva lucruri despre corectura pentru versiunea [v1.0] şi despre cea pentru [V2.0].

      Sărbători fericite!

       

[img] [/img]


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Complet de acord cu ce este scris aici.

O singura observatie. OCR+ ar trebui rulat fara optiunea de adaugare a spatiului neseparator. (in cazul unui ocr adica)
Liniile de dialog pot aparea si in locuri in care nu au ce cauta, adaugarea unui spatiu neseparator poate crea probleme ulterioare.
In cazul in care OCR+ adauga un EmDash in interiorul textului sau il gaseste acolo, in mod sigur va rupe si randul si va pune majuscula, astfel aparand un paragraf cu spatiu neseparator.
Se intampla destul de des in cazul liniutelor de pauza din ocr-uri.

Recomand adaugarea spatiului neseparator abia dupa ce se ajunge la 0.9 sau la 1.0.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ai dreptate, utilitasetveritas. 
      Trebuie să revizuiesc şi tutorialul despre AutoCorect, dar nu stau prea bine cu timpul la dispoziţie.


      Am hotărât să mut acest topic pentru 24 de ore pe secţiunea de cărţi în limba română pentru ca să fie văzut şi de userii mai noi care nu accesează în mod obişnuit secţiunea "Totul despre cărți - About e-books".
     
      După sărbători am să continui şi cu principalele activităţile pe care le desfăşor pentru corectura [V1.0], respectiv pentru versiuni superioare.

      Dacă subiectul va prezenta interes, la final, am să încerc să realizez minitutorialul sub formă de fişiere PDF şi DOC. Pentru varianta doc mă gândesc la pagină A4 Landscape - Book fold, pentru a fi uşor de imprimat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
cloredana
Membru Gold

Din: -
Inregistrat: acum 11 ani
Topicul e bun si parerea mea este ca ar trebui sa il lasi aici mai mult de 24 de ore, nu de alta dar suntem in perioada sarbatorilor si nu cred ca sunt multi utilizatori prin preajma in aceste zile.

Modificat de cloredana (acum 11 ani)


_______________________________________
Inteligenţa este capacitatea cu ajutorul căreia vom înţelege, până la urmă, că totul este de neînţeles.

pus acum 11 ani
   
petrut.marian08
Pe lista neagra

Inregistrat: acum 14 ani
schimbă dimensiunile marginilor și header-footer (paranteza de la etapa 3)

pagina A5 are dimensiunile de 148 x 210 mm. tu ai indicat

– sus = jos = 4” ÷ 5”
– stânga = dreapta = 3”÷ 5”

adică ai uitat să pui un 0,
în fața unităților din sistemul imperial. altcumva echivalările pe care le-ai adăugat pe urmă ar trebuie să fie în cm nu mm.

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

petrut.marian08 a scris:

schimbă dimensiunile marginilor și header-footer (paranteza de la etapa 3)

     Am făcut o modificare a postării şi am pus în paranteză valorile în mm.
     Nu ştiu dacă era vorba despre această modificare. Dacă e vorba despre altceva, atunci aştept mai multe detalii.

     LE:     
     Sărut mâna! Am corectat.
     Mulţumesc frumos! Nu cred că mi-aş fi dat seama mult timp ce aiureală am scris.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Deşi se pare că topicul nu prezintă niciun interes, îmi respect promisiunea şi voi continua cu prezentarea modului în care eu fac corectura de fond [corectura pentru versiunea V1.0].


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
raganar
MEMBRU VIP

Din: Codlea
Inregistrat: acum 16 ani
"Deşi se pare că topicul nu prezintă niciun interes" asta poti s-o crezi tu. Din punctul meu de vedere este cel mai complet si bine explicat tutorial despre realizarea cartilor virtuale.

_______________________________________
Nu lasa pe maine ce poti face astazi, lasa pe poimaine ca poate nu mai e nevoie sa-l faci.
Micul fara mustar e ca barbatul fara femeie.

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mulţumesc raganar.
     Aprecierea ta este cu atât mai importantă pentru mine, cu cât, trebuie să recunoaştem, eşti unul dintre marii "zgârciţi" în aprecieri şi, sunt convins, că nu ai face niciodată o laudă gratuită.
     


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu prea e loc de discutii pe un astfel de topic.
Doar de critici si de aprecieri.
Lumea vine, citeste si pleaca.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ai dreptate utilitasetveritas, doar că în astfel de situaţii cel ce expune tutorialul este bine să ştie din când în când dacă ceea ce face este expus suficient de clar, ori poate prea stufos sau prezintă lucruri considerate arhicunoscute etc...

      Ştii cum e: din când în când alergătorul singuratic simte nevoia să ştie dacă mai este pe drumul cel bun, ori dacă mai este cineva prin tribune...

      Iniţial m-am gândit să scot postările cu discuţii atunci când ele au clarificat o problemă, apoi mi-am dat seama că un topic ce conţine numai postări lungi cu caracter informaţional este mai greu de urmărit decât unul care este împănat din când în când cu câteva postări mai scurte care permit un fel de respiro.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Mda, tacerea nu spune prea multe.
Ai ramas pe drumul cel bun, totusi.

Cam toata lumea de pe aici a trecut de etapa asta de corectare si s-a obisnuit cu ea.
Si nu uita ca ti-ai batut singur cuie in talpa cu Autocorectul si OCR+
Un click si gata corectura bruta   
E si asta un motiv pentru care noii forumisti nu prea apar pe subiecte ca acesta.

Sau poate am devenit cu totii asi in corectura 


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

utilitasetveritas a scris:

[...]Si nu uita ca ti-ai batut singur cuie in talpa cu Autocorectul si OCR+
Un click si gata corectura bruta    [...]


     AutoCorect a fost marea mea dragoste timp de mulţi ani.
     L-am folosit la procorectură de pe vremea copilăriei sale, pe când se numea AutoCorect 2.3.
     Faptul că mi s-a oferit posibilitatea să contribui cu ceva la dezvoltarea acestui program a fost pentru mine cea mai mare onoare.
     E posibil ca acele puţine cărţi pe care le-am lucrat pe forum să rămână undeva prin HDD-urile celor ce le-au downloadat şi apreciate ca slăbuţe să rămână necitite, deci să fi pierdut timpul degeaba cu prelucrarea lor.
     Un lucru e sigur: AutoCorect va fi folosit din ce în ce de mai mulţi utilizatori şi asta înseamnă că munca depusă, mai mare sau mai mică, a fost cu folos.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani



      CORECTURA DE FOND [1] GENERALITĂŢI



      Trebuie să menţionăm din start că textul versiune [V1.0] trebuie să fie un text universal, care are caracteristici simple, trebuie să fie uşor de convertit şi, mai ales, să poată fi preluat de către oricine pentru a realiza o corectură de versiune superioară.
      Prin text universal se înţelege text în format DOC sau RTF, care permit convertirea uşoară în orice format şi, de asemenea, pot fi deschise şi prelucrate de multe editoare instalate sub diverse sisteme de operare.
      Fişierul unui [V1.0] trebuie să DOC sau RTF, care poate fi însoţit de fişiere în formate speciale, dar niciodată nu se vor posta fişierele speciale fără a prezenta şi un fişier universal.
      Din acest motiv se vor evita setările personale complexe. Multe dintre setările specifice Wordului nu sunt văzute corect în alte editoare; un singur exemplu: despărţirea automată la capăt de rând în Word va fi văzută ca despărţire manuală în OpenOffice şi nu numai, iar iar liniuţa se transformă într-o cratimă normală care nu poate fi eliminată decât manual, bucată cu bucată.
      Un text [V1.0] nu trebuie să fie o lucrare de artă, ci un text foarte bine corectat. Elementele care ne pun în valoare calităţile artistice trebuie să apară mult mai târziu.

      Sunt de evidenţiat cărţile postate de Bronto şi _Cosimo_, care pe lângă formatele Mobi, ePub, PDF etc., au în folderul „Sursă” versiuni DOC sau/şi RTF şi, de asemenea, imagini pentru coperte, astfel ca fiecare user să-şi salveze formatul/formatele după dorinţă.


        ● Format pagină text de corectat:
      Am spus deja că cel mai practic format este A5. Formatul A5 a devenit un format universal, dar nu este obligatoriu; în funcţie de diagonala şi rezoluţia monitorului, de claritatea fişierului de control PDF [DjVu] şi de alte elemente, se poate folosi un format custom în care lăţimea poate varia între 5” ÷ 7”, iar lungimea poate fi a unei pagini A4.
      Important este ca pagina de text, ca şi pagina scanului de control să fie văzută pe toată lăţimea ei. Pe timpul acestei corecturi se pot micşora marginile stânga-dreapta până la 0,1”, circa 2,5mm, pentru a nu avea margini mari şi nefolositoare; pe ecran trebuie să avem cât mai mult text.

        ● Font text de bază:
      Cel mai mult în digitalizare este folosit fontul „Bookman Old Style”.
      Acest font conţine toate caracterele necesare în limba română [deci şi diacriticele româneşti].
      Este un font ale cărui caractere sunt suficient de spaţiate [caracterele au o lăţime mai mare decât majoritatea fonturilor], ceea ce permite o vizualizare bună a fiecărei litere.
      Folosind „Bookman Old Style” este mult mai uşor de constatat că în text există grupul cl în loc de d, ori rn în locul lui m şi alte erori de acest gen.
      Literele au forme clare şi fontul nu permite confuzia datorată asemănării grafice a semnelor. Există o excepţie: asemănarea perfectă între litera L mic şi cifra 1, dar în acest moment AutoCorect ne permite să eliminăm complet situaţiile în care cifra 1 apare în text în locul literei L mic.
      Desigur că „Bookman Old Style” nu este un font foarte elegant, dar este foarte practic şi util pe timpul corecturii.

        ● Mărime font text de bază:
      În cazul fontului „Bookman Old Style” mărimile uzitate sunt 10 ÷ 12.
      O mărime mai mică de 10 puncte a fontului produce o dificultate a citirii, deoarece literele sunt prea mici; o mărime mai mare de 12 puncte nu se justifică, deoarece duce la un text un număr mare de pagini.
      Personal folosesc mărimea 11 pentru textul de bază.
      Celelalte mărimi de font [nume capitol, note de subsol, număr de pagină, header] trebuie să fie în concordanţă cu mărimea fontului de bază.
      Astfel, dacă pentru textul de bază folosesc „Bookman Old Style 11”, pentru numele capitolelor folosesc acelaşi font şi mărime dar cu font Bold; în cel mai rău caz numele de capitole pot fi mai mari cu un punct, ajungând la „Bookman Old Style 12”.
      Notele de subsol trebuie să fie un pic mai mic decât textul de bază, astfel că folosesc „Bookman Old Style 10”. Uneori pentru antet şi numere de pagină folosesc „Bookman Old Style 9”, dar niciodată un font mai mic.
      Titlurile mari, cele folosite pentru „Partea a…”, „Cartea a…” sau titluri pentru povestiri, atunci când volumul este unul de povestiri poate fi de 18 puncte, maxim 20 de puncte.

      Fonturile folosite pentru realizarea copertelor, mărimea, culoarea şi efectele speciale sunt la dispoziţia fiecăruia, funcţie de imaginaţie şi înclinaţiile sale artistice. Regulile de mai sus sunt recomandate pentru textul cărţii şi nu pentru coperte.


        ● Setări Paragraph: Identation: Left=Right=0
      Se pot folosi valori mai mari de Left=Right=0, doar în cazuri cu totul şi cu totul speciale, ca de exemplu:
              - în cazul lucrărilor ştiinţifice în care apar frecvent citate, pentru a evidenţia aceste citate în comparaţie cu textul de bază.
              - în cazul titlurilor lungi pe care dorim să le setăm să fie afişate pe două rânduri.
              - în alte situaţii speciale care apar în cazul altor cărţi decât cele de beletristică.

        ● Setări Paragraph: Identation –> Special: First Line, By = 0,2"
      Pentru a evidenţia faptul că primul rând al paragrafului începe mai din interior, nu se va face acest lucru prin adăugarea de spaţii înaintea primului caracter şi nici prin adăugarea unuia sau mai multor taburi.
      Prima linie a paragrafului se aliniază exclusiv prin setarea paragrafului ca având prima linie identată cu 0,2” [5,1mm] maxim 0,3” [7,6mm].
      O identare mai mare de 0,3” [7,6mm] este inestetică şi nejustificată.
      Identarea la 0,5” este estetică la documentele oficiale pe format A4, dar este total nejustificată într-o carte electronică, ce poate fi formatată la pagină A5 sau, chiar, formate apropiate de A6.


        ● Setări Paragraph: Spacing: Before/After = 0
      Dacă este nevoie ca un titlu, un grup de cuvinte sau un şir caractere şi/sau elemente tipografice etc., să fie afişate la o anume distanţă de text, deci să nu fie lipite de textul de deasupra sau de după, se va folosi varianta adăugării unui rând gol [maxim două rânduri goale] înainte sau după titlul sau şirul de caractere respectiv.
      Nu se recomandă setarea cu adăugarea de puncte înainte sau după [Spacing: Before/After], deoarece în alte editoare această setare se pierde, astfel că titlul setat în acest mod va apărea afişat lipit de textul din faţa sau de după el.

        ● Setări Paragraph: Line spacing = Single
      Întregul text al cărţii, text de bază, titluri, note de subsol etc., vor fi scrise la un rând.
      Setările "1.5 Lines, Double, Exactly, Multiple..." nu au nicio justificare în cazul cărţii electronice. [Aşa ceva se mai poate folosi doar cu sens de păcăleală, atunci când vrem ca o lucrare personală să se „întindă” pe un anume număr de pagini… şi textul la dispoziţie este unul cam scurtuţ… ]

        ● Cartea digitală este o copie fidelă a cărţii tipărite?
      Dacă ne referim la conţinutul cărţii, răspunsul este DA.
      Dacă ne referim la formă, răspunsul este, mai degrabă, NU.
      Nu recomand copierea în cartea digitală a elementelor de identitate a cărţii, precum notiţele privind drepturile de autor, descrierea CIP, codul ISBN şi alte elemente de identificare.
      Este de-a dreptul tragi-comic să găseşti într-un text corectat menţiunea „Toate drepturile acestei ediţii sunt aparţin editurii ZZZZ. Copierea, multiplicarea acestei ediţii constituie infracţ…… şi se pedepseşte conform….” Se pune întrebarea: cel ce a făcut corectura a citit ceea ce a scris/corectat? Şi dacă a citit, oare, nu a înţeles ceea ce scrie acolo? Este cu atât mai grav când asta se întâmplă cu cărţi de la edituri care deja ne-au creat probleme.
      Întâlnim frecvent în cărţi cele 3 steluţe care separă fragmente diferite de text în cadrul aceluiaşi capitol. În cartea digitală nu este neapărat nevoie ca cele trei steluţe să fie sub formă de triunghi [pe două rânduri; una pe primul rând şi două pe rândul doi] şi se foloseşte frecvent scrierea lor în linie, sub forma * * *

      Unii dintre noi se chinuie să reproducă în mod fidel fonturi speciale cu care a fost tipărită cartea sau să reconstituie unele elemente grafice folosite în locul celor 3 steluţe/asterisc sau alte elemente caracteristice cărţii tipărite. Toate acestea f pot fi folosite la o versiune finală realizată artistic, dar este un efort suplimentar nejustificat în prima fază a corecturii.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      CORECTURA DE FOND [2] GENERALITĂŢI



      Notă: Informaţiile de mai jos nu privesc direct corectura cărţilor, dar sunt legate de cartea electronică.
      Probabil că aceste note ar fi fost mai bine să fie postate pe un alt topic.
      Deocamdată am considerat ca e bine să fie postate acum şi aici.
      Dacă voi avea timpul necesar e posibil să fie dezvoltate pe un alt topic.


        ● PDF [DjVu] cu pagini sincronizate:

      Prin PDF sau DjVu cu pagini sicronizate, înţeleg acel PDF [DjVu] căruia i se adaugă una sau mai multe pagini goale sau i se scot un număr de pagini goale sau fără importanţă pentru conţinut, astfel încât numărul paginii pe care-l afişează vizualizatorul de PDF [DjVu] să corespundă cu numărul tipărit pe pagina-imagine a cărţii.
      Astfel când în PDF-XChange Viewer sau Adobe Reader vom căuta pagina 77 prin inserarea ei de la tastatură, se va afişa imaginea paginii pe care este tipărit numărul de pagină 77.
      Multe persoane elimină paginile goale atunci când realizează un PDF, astfel că dacă vom căuta pagina 607 a cărţii, aceasta ar putea să se afle la pagina 593 a PDF-ului.
      Sincronizarea paginilor PDF [DjVu] este foarte importantă pe timpul corecturii, pentru a nu pierde timpul cu căutarea unei anumite pagini. Cu cât cartea originală va avea mai multe pagini, cu atât mai grea va fi căutarea în cazul unui PDF nesincronozat.
     
      Iată un exemplu de PDF cu pagini sincronizate în imaginea de mai jos.
      Se poate observa că la pagina 379 a PDF se află pagina 379 a cărţii tipărite.



      Şi, iată încă două imagini care conţin PDF-uri cu paginile nesincronizate:



      În imaginea 2, la pagina 300 a PDF este afişată pagina 286 a cărţii. Pentru sincronizarea paginilor, în acest caz trebuiau eliminate nişte pagini goale sau cu conţinut fără importanţă.



      În imaginea 3, la pagina 312 a PDF este afişată pagina 243 a cărţii. Acesta este un caz special. Diferenţa foarte mare dintre cele două numere este dată de faptul că volumul are o prefaţă numerotată cu cifre romane, iar numerotarea cu cifre arabe apare doar după finalul prefeţei.



        ● Scanul de control IDEAL pentru corectură:

      Scanul de control sub  forma de imagini separate este deja de mult timp depăşit şi nu mai este folosit.
      Cele mai folosite variante ale Scanului de control sunt fişiere de tip PDF clasic, PDF Searchable şi DjVu.
      Fiecare dintre aceste tipuri de documente pot fi în variantă alb-negru [AN], Grayscale sau color.
      Recomand ca scan-control: PDF Grayscale şi DjVu Grayscale.

      Culoarea ideală este Grayscale.
      Variantele Color sunt folosite în cazul revistelor şi albumelor, ori a unor cărţi vechi, caz în care PDF este cunoscut drept „PDF pentru colecţie”.
      Pentru a fi folosit ca scan-control nu se justifică un PDF sau DjVu Color, deoarece el are dezavantajul că va ocupa un spaţiu mare pe disc şi nu va folosi în plus celui ce execută corectura.
      Un scan-control AN poate prezenta o serie de deficienţe de lizibilitate.
      Sunt mai mulţi useri, specialişti în realizarea de PDF/DjVu AN; de regulă, aceştia sunt cei care îşi scanează şi îşi prelucrează singuri cărţile şi, bineînţeles sunt profesionişti în aceste activităţi.
      Din păcate, există pe forum multe, chiar prea multe, DjVu şi PDF AN cu mari probleme de lizibilitate, care prezintă pagini întregi cu zone imposibil de citit, de regulă „fâşii” verticale de text, mai late sau mai înguste, situate în zona cotorului cărţii.
      Astfel de probleme au drept cauză principală o scanare necorespunzătoare şi foarte rar calitatea necorespunzătoare este dată de prelucrarea defectuoasă.
      Dintr-o scanare de slabă calitate poate rezulta un PDF/DjVu alb-negru complet nefolositor, dar de cele mai multe ori poate rezulta un PDF/DjVu Grayscale folositor.
      În concluzie, cei ce ştiu şi ştiu că ştiu să realizeze scan-control AN să facă astfel de fişiere, iar cei ce au anumite neajunsuri e bine să se ferească de aşa ceva, ori să realizeze atât variante An, cât şi variante Grayscale.

      Despre CĂUTARE FRAGMENT DE TEXT în Scanul-control.
      Putem căuta un fragment de text prin opţiunea „Search” sau „Find” într-un fişier de tip DjVu şi într-un PDF Searchable [SSB].
      În ABBYY 11 se pot salva ambele tipuri de fişiere.
      Se pot salva fişiere PDF Searchable [numite PDF/A în Abbyy]; PDF Searchable obţinut astfel este unul deosebit de valoros, deoarece păstrează toate informaţiile necesare Abbyy, inclusiv rezoluţie, poate fi reîncărcat foarte uşor în Abbyy pentru obţinerea unui OCR la aceeaşi calitate cu OCR obţinut la scanarea originală. Singurul dezavantaj, dar destul de important, este faptul că fişierul este destul de mare.

      Fişierele DjVu Grayscale obţinut cu Abbyy are calităţi foarte bune şi o mărime decentă, care în situaţii cu totul excepţionale poate ajunge la 10 MO. Ele sunt foarte bune pentru a fi folosite ca fişiere scan-control.
      Calităţile de rezoluţie nu se ridică la nivelul PDF-ului Searchable, dar şi acestea pot fi încărcate cu uşurinţă în Abbyy şi se obţine un OCR decent, dar nu de aceeaşi valoare ca cel obţinut din  PDF-ului Searchable.
      Ambele tipuri de fişiere sunt foarte importante pentru persoanele care fac muncă de documentare în vederea realizării unei lucrări.
      De asemenea, aceste tipuri de fişiere sunt excelente în cazul cărţilor în limba originală  de pe care dorim să facem traduceri în limba română.

      Personal cred că atunci când nu avem timpul la dispoziţie pentru prelucrarea de calitate şi finalizarea unei cărţi şi nici spaţiu suficient pentru păstrarea folderului Abbyy, e bine, util şi practic să salvăm cartea în ambele formate menţionate, adică un PDF Searchable Grayscale pentru eventuala reîncărcare în Abbyy şi un DjVu Grayscale pentru a fi folosit cel puţin în rolul de scan-control.
      Aceasta este o salvare mult mai bună, mai practică şi mai sigură decât varianta în care am păstra doar un OCR realizat la repezeală şi eventual un PDF micşorat sau un DjVu alb-negru. Vom avea avantajul că vom păstra nişte fişiere de circa 10 ori mai mici faţă de un folder Abbyy, iar informaţiile din aceste fişiere au aproximativ aceeaşi valoare cu cele dintr-un folder Abbyy.


        ● ROCADA zonelor de text în ABBYY

      Termenul de „Rocadă în Abbyy” a apărut pe forum atunci când unii dintre useri au constatat că în cazul imaginilor de tip dublă pagină [adică acele imagini la care nu s-a făcut splituirea] existau situaţii în care Abbyy, în loc să citească mai întâi pagina din stânga şi apoi pe cea din dreapta, în mod eronat făcea mai întâi citirea paginii din dreapta şi după aceea realiza citirea paginii din stânga; practic, Abbyy făcea o rocadă între cele două pagini.

      Între timp s-a constatat că schimbarea ordinii de citire se putea realiza şi în cadrul aceleaşi pagini, mai ales atunci când pe pagină începea un capitol nou, situaţie în care zonele de text erau în număr de cel puţin 3: prima zonă cuprindea sfârşitul de capitol, a doua zonă era cea care cuprindea numele capitolului şi o a treia zonă era textul de la începutul noului capitol; putea să mai apară zona numărului de pagină, zona antetului şi zona unui moto imediat după numele capitolului.
      Deşi nu mai era o simplă rocadă, acest termen s-a păstrat, primind un sens mai larg şi anume acela de citire într-o ordine incorectă a zonelor de text.

      Este foarte adevărat că astfel de situaţii apar frecvent în Abbyy 9; personal nu ştiu dacă Abbyy 11 a rezolvat această situaţie.
      Este la fel de adevărat că aceste zone se pot corecta în Abbyy atunci când utilizatorul ştie să facă acest lucru; deoarece mulţi utilizatori nu ştiu să refacă zonarea şi reordonarea zonelor de text, cred că este important să discutăm despre acest lucru.

      Să aruncăm o privire asupra imaginii următoare:



      În partea stângă a imaginii, pe pagina deschisă în Abbyy, se pot observa 5 zone de text: 1 – text sfârşit de capitol; 2 – numele capitolului; 3 – moto, aflat imediat sub numele capitolului; 4 – text început de capitol nou; 5 – număr pagină.
      Abbyy 9 poate face erori de citire, de la rocada între două zone de text până la o ordine complet aleatorie. În partea din stânga imaginii sunt prezentate diverse variante de citire eronată. Exemplele nu se bazează neapărat pe o testare în Abbyy, ci sunt alese doar spre exemplificare.
      Am considerat că este necesară prezentarea problemei „Rocadei în Abbyy”, deoarece pe timpul corecturii este una din problemele ce trebuie urmărite şi corectate.

     ******************************************************


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      CORECTURA DE FOND [3]




        ● Scopul primei corecturi:
     
      La prima corectură, numită şi corectura de fond sau corectura pentru versiunea [V1.0], principalul scop este acela de a face ca textul corectat să aibă conţinutul identic cu cel al originalului, adică să fim siguri că nu există cuvinte sau fragmente de text lipsă, că nu avem rocade în poziţia textului de text, că nu avem cuvinte asemănătoare ca formă dar cu sens complet diferit în text.

      În principiu, această corectură nu urmăreşte în special respectarea strictă a rigorilor limbii române [acest lucru este urmărit în principal la corectura pentru următoarele versiuni], ci în primul rând respectarea autenticităţii textului.
      Ca o paranteză, dau un exemplu de astfel de cuvinte: convingere – constrângere.
      Dacă un astfel de cuvânt în textul original era despărţit la capăt de rând, iar cartea nu a fost suficient presată la scanare, este posibil ca un cumul de factori care ţin de recunoaşterea eronată a Abbyy, de înlocuiri de secvenţe de cuvinte în AC etc., să facă posibilă ca la corectură să avem unul dintre cele două cuvinte în locul celuilalt. O astfel de înlocuire schimbă complet sensul frazei şi al acţiunii. O astfel de schimbare de cuvinte face diferenţa dintre dragoste şi viol, ori dintre însoţitor din plăcere şi ostatic etc.

      Faptul că după prima corectură vor exista nişte greşeli uşor corectabile, că vom avea un număr mai mic sau mai mare de cuvinte scrise fără cratimă acolo unde cratima trebuia să existe ori invers, cuvinte scrise despărţit acolo unde ele trebuiau scrise împreunat ori invers, cuvinte cu câte o literă în plus sau minus care nu schimbă sensul frazei, cuvinte fără o diacritică sau cu diacritice în plus, toate acestea nu trebuie să fie considerate mari greşeli de corectură, deşi ideal ar fi ca ele să fie cât mai puţine.

      Dacă după prima corectură vom găsi fraze al căror sens nu îl putem înţelege de niciun fel deoarece lipsesc unul, două sau mai multe cuvinte, dacă vom constata că lipsesc fragmente mai mici sau mai mari de text, aceste situaţii sunt mari greşeli ale primei corecturi.

      În concluzie, cine face prima corectură, avizează,  îşi asumă un fel de răspundere că textul corectat este complet, are acelaşi conţinut şi acelaşi sens cu originalul. Trebuie să reţinem că următoarele corecturi se fac fără confruntarea scanului de control şi că următorii corectori se bazează pe seriozitatea, consecvenţa, corectitudinea şi responsabilitatea primului corector şi că dacă prima corectură se va face superficial şi va permite denaturarea sensului frazei sau lipsă de text, atunci indiferent cât de bine şi-ar face treaba următorii corectori, la final va rezulta un text perfect din punct de vedere gramatical şi ortografic, dat o carte incompletă sau cu sens schimbat.


        ● Organizarea pentru prima corectură:

      La corectura prin citire se procedează astfel:

            1. Se deschide documentul în Word şi se redimensionează fereastra astfel încât să ocupe jumătate sau ceva mai mult de jumătate din ecran şi se trece, de regulă, această fereastră în partea dreaptă a ecranului; partea stângă sau dreaptă o stabileşte fiecare utilizator în funcţie de obişnuinţă. Wordul va avea activat corectorul de limba română şi va avea încărcat şi activat dicţionarul suplimentar despre care am discutat la capitolul despre precorectură.

            2. Se deschide PDF din imagini, DjVu sau alte fişiere care conţin imaginile de la scanare, se redimensionează şi această fereastră şi se pune în stânga ecranului.
      Cele două ferestre [fereastra Word şi fereastra PDF] aşezate una lângă alta vor ocupa toată lăţimea monitorului.

            3. Se deschide şi fişierul doc "Index", dar rămâne în bară [în fundal] şi apelăm la el numai dacă este nevoie, spre exemplu: un nume dintre cele trecute în Index, respectiv în dicţionarul suplimentar apare subliniat; asta înseamnă că respectivul nume nu este scris corect; dacă nu ne mai amintim de forma lui corectă, atunci apelăm la Index şi ne uităm să vedem care este forma corectă.
      Acelaşi lucru este valabil şi pentru alte cuvinte, ori cuvinte noi... adică nume sau cuvinte necunoscute care nu au fost trecute în index, dar pe care le vom trece acum, dacă ele apar de mai multe ori.

            4. Atunci când simţim nevoia unei confruntări cu originalul cărţii, mă refer la o ediţie electronică în limba de origine, pentru verificarea corectitudinii unor nume etc., e bine să avem la îndemână şi un astfel de fişier, care nu trebuie să fie neapărat deschis, dar care poate fi găsit cu uşurinţă.

            5. Dacă permit condiţiile tehnice, vom avea deschisă ori la îndemână pagina web dexonline.ro şi eventual un dicţionar sau îndrumător ortografic în format pe hârtie. E posibil să nu avem nevoie de ele, dar paza bună trece primejdia rea.
       [Mulţi useri nu au nevoie de astfel de instrumente deoarece meseria lor este legată de cuvinte, ori au o vârstă apropiată de perioada şcolii; sunt însă mulţi useri care şi-au câştigat pâinea din meserii diverse care nu au legătură cu arta cuvântului, ori îşi câştigă pâinea într-o ţară în care se vorbeşte altă limbă, fapt pentru care este foarte normal să nu [mai] fie puşi la punct cu rigorile actuale ale limbii române].

            6. Subliniez că la acest moment eu personal am textul de corectat formatat pe stiluri. Este vorba de un număr de 4 stiluri, deci un număr foarte mic, şi anume: un stil pentru textul de bază [N2], unul pentru cuvintele scrise italic în textul de bază [N2_I], unul pentru cuvintele din textul obişnuit care sunt aliniate la centru [N_C] şi un al patrulea stil pentru numele/numărul capitolelor [Heading 3].
       O discuţie despre stiluri trebuie dezvoltată pe larg pe un alt topic, deoarece este un subiect un pic mai dificil, faţă de care există un înalt grad de respingere din partea multor useri.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      CORECTURA DE FOND [4]



        ● Confruntarea cu scanul de control:

     NOTĂ:
     Pentru a putea folosi o exprimare mai simplă în cadrul tutorialului vom folosi în continuarea termenul „OCR” atunci când vom vorbi despre textul de corectat, deşi acest text a depăşit de mult caracteristicile unui simplu OCR.
     Din acelaşi motiv, pentru scanul de control, fie el sub formă de imagini ale fiecărei pagini, PDF clasic din imagini, PDF Searchable, DjVu sau chiar cartea pe hârtie, vom folosi doar termenul „PDF”, prin care se va putea înţelege orice variantă de scan-control, fie el prelucrat sau nu.

     Pe timpul corecturii de fond, numită corectura pentru versiunea [V1.0], vom face permanent CONFRUNTAREA conţinutului OCR cu cel al PDF.
     În timp ce citim FOARTE RAR textul de corectat, vom trage cu coada ochiului la conţinutul PDF.
     Pentru aceasta monitorul computerului nostru va avea un aspect asemănător cu cel din imaginea următoare:
   


     Se observă că în acelaşi timp sunt afişate pe monitor atât textul pe care îl corectăm [în dreapta], cât şi scanul de control [în stânga].


     Cât de des se va face această „tragere cu coada ochiului”?
     Răspunsul depinde de 3 factori:
              — experienţa în corectură a corectorului; un corector cu puţină experienţă va privi mai des decât este necesar la PDF, deoarece are un mic sentiment de frică să nu „scape” ceva. Pe măsura acumulării de experienţă. Adică după dou-trei cărţi corectate, corectorul va face confruntarea doar atunci când este necesar.
              — gradul de cunoaştere al stilului autorului de către corector; dacă vom avea mai multe volume de corectat ale aceluiaşi autor, cu timpul îi vom „simţi” stilul şi ne vom da seama doar din citirea OCR dacă există o problemă sau nu, deoarece exprimare pare altfel decât stilul său literar cu care ne-am obişnuit.
              — calitatea OCR; putem avea un text care „curge” perfect şi unde doar din când în când este nevoie de intervenţia corectorului şi putem avea OCR unde corectorul va face zeci de intervenţii pe o singură pagină sau va reedita fragmente întregi de text..
     Calitatea unui OCR nu depinde neapărat de modul de prelucrare a OCR sau de calitatea scanării, ci, în primul rând, de calitatea şi vechimea cărţii scanate.
     Dacă vom corecta o carte tipărită după 1990 pe hârtie velină de calitate, în condiţii de tipar moderne, chiar o scanare mai slăbuţă va conduce la realizarea unui OCR foarte bun.
     Dacă vom lucra o „carte rară”, adică o carte care nu se mai găseşte de foarte mulţi ani pe piaţă, iar aceasta a fost tipărită pe hârtie de ziar de slabă calitate, cu cerneală în strat neuniform şi a cărei culoarea virează destul de repede în timp, o carte tipărită prin procedeul clasic bazat pe culegerea literelor de plumb etc… etc… indiferent cât de profesionişti am fi în scanare şi prelucrarea cărţii, OCR-ul va avea multe probleme de rezolvat.
     Dacă luăm în calcul că mulţi dintre useri şi-au propus o readucere la viaţă a unora dintre aceste cărţi rare şi că se ocupă de digitalizarea unor astfel de cărţi cu probleme, atunci este de înţeles de ce unele dintre lucrurile spuse aici par interesante doar pentru unii useri, şi complet în plus şi lipsite de importanţă pentru alţii.
     Fără supărare şi fără intenţia de a aduce atingere cuiva, una-i activitatea de digitalizare a unei cărţi apărute pe piaţă în urmă cu doi-trei ani în care corectura este mai mult plăcere decât muncă şi cu totul altceva este să lucrezi o carte apărută în perioada interbelică sau chiar din anii 1960 ÷ 1970, în care este vorba de foarte multă muncă.
     Atunci când vom duce la bun sfârşit o carte tipărită pe la 1920 ÷ 1930, mai veche, ori un picuţ mai nouă, vom pricepe de ce unii dintre noi lucrează la câte un volum timp de luni de zile, deşi noi personal am făcut corectura unor volume doar în câteva zile. 


     Vorba multă, sărăcia omului!...

     Şi, totuşi, cât de des se face confruntarea cu PDF-ul.
     Pentru început vom face o confruntare a fiecărei pagini în parte.

     Când ajungem la o pagină nouă verificăm cu PDF următoarele aspecte:
              — dacă textul de la începutul paginii este chiar cel de pe pagina originală ori, dintr-un motiv sau altul, a avut loc o „rocadă Abbyy”.
              — dacă textul de sfârşitul paginii este acelaşi sau domnu’ Abbyy a „sărit” peste vreo notă de subsol fiindcă era scrisă cu litere prea mici şi el nu l-a putut citi.
              — dacă în pagină avem text scris cu caractere italice, text pe care trebuie să-l evidenţiem în acelaşi mod.
     Dacă în legătură cu aceste aspecte nu există nicio problemă purcedem la citirea în mod foarte rar a textului şi „tragem cu coada ochiului” doar dacă „simţim” o incertitudine legată de un cuvânt, de un semn de punctuaţie etc.


        ● Viteza de citire pe timpul corecturii:

     Practic, corectura se face prin citirea rară sau foarte rară, cu viteză mai mică decât citim în mod obişnuit, astfel încât să putem vedea cuvintele scrise greşit care nu sunt subliniate. De exemplu, dacă avem cuvântul „si” în loc de „şi”, ori „clar” în loc de „rar” etc. etc., corectorul nu subliniază cuvântul respectiv deoarece cuvântul există în limba română doar că nu este locul lui acolo în text, ci se află în locul unui alt cuvânt cu care seamănă.

     Repet, citirea se face mai rar decât de obicei, deoarece se cunoaşte că la o citire normală, în mod practic ochiul nu parcurge textul literă cu literă ci citeşte cuvinte întregi.
     Dacă un cuvânt nu este scris corect, de regulă ochiul şi creierul "citeşte" ceea ce ar trebui să scrie şi nu neapărat aşa cum este scris.

     Iată un exemplu:
     Propun să citim cu viteză mare următorul text:

     "Dacă un cuvâtn nu este srcis corcet, de regulă ochuil şi creireul "citşete" ceea ce ar trbeui să srcie şi nu neaprăat aşa cum este srcis."

     Acum să citim acelaşi text mult mai rar pentru a consta câte greşeli se găsesc în el.
     Mă rog exemplul este exagerat, dar acesta este fenomenul.
     De aceea trebuie ca cititul să fie mai rar... la început va trebui să fie foarte rar până se câştigă experienţă la corectat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      CORECTURA DE FOND [5]


     ******************************************************

materiale ajutătoare:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
Online
MEMBRU VIP

Inregistrat: acum 12 ani

Seven a scris:


      CORECTURA DE FOND [3]


        ● Scopul primei corecturi:
     
      Trebuie să reţinem că următoarele corecturi se fac fără confruntarea scanului de control ...


Imi pare rau sa te contrazic, dar daca descarci versiuni v.1.0 de pe RI ai o neplacuta surpriza.
Sa nu mai spun de versiuni 2.0 care sunt ocr-uri brute.

Scanul de control trebuie sa insotesca fisierul corectat pina la cel putin v.3.0.
Iar v.3.0 sa fie un adevarat v.3.0.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      De fapt, nu este chiar o contrazicere... pentru că eu încerc să spun ceea ce ar trebui să se facă şi nu ceea ce, uneori, din păcate, se face pe forum.

      Îţi dai seama că vorbind despre versiunea de fond, nu aş putea afirma ceva de genul: "...lucraţi superficial, nu e cazul să vă stresaţi prea mult cu corectura, pentru că vin fraierii şi vor rezolva ei problemele rămase..."
      Mi se pare că aşa cum am scris s-ar traduce cam la modul: "... ochii mari, viteză mică, pentru că nu vine altcineva după voi să vă facă curat..."

      Adevărul este că pe forum există o mare grabă de a avea cât mai multe cărţi postate şi la un moment dat ajungem cam în situaţia unui grup de oameni care au dat multe pahare peste cap, când toţi vorbesc şi nimeni nu mai ascultă.

      Noi suntem cumva în faza când toată lumea face cărţi şi aproape nimeni dintre cei ce lucrează nu mai citeşte, pentru că nu mai are timp.
      Există cei ce citesc şi nu lucrează, dar printre ei sunt prea mulţi dintre cei ce vor ca "posmagii să fie înmuieţi". Adică, de ce să se complice ei cu convertirea din DOC în formatele pe care le suportă dispozitivul lor şi să nu le dăm noi mură-n-gură, frumos ornată şi servită la tavă?

      Rugăminţi şi cereri de genul, "...plz!... plz"... caut de mult cartea X şi acum am găsit-o pe forumul vostru, dar este doar în format doc... plz, plz, să o posteze cineva în format XYZ, pentru că eReaderul meu nu citeşte Doc..." mi se par chestii de culmea nesimţirii.
      Închei aici pentru că nu aş vrea să-mi pun colegii moderatori în postura să fie obligaţi să mă bănneze pentru limbaj indecent, dar mi s-a cam făcut într-un anume fel de cei ce totdeuna cer, dar pentru care munca are un puternic miros neplăcut.
      A face muncă de voluntariat, nu înseamnă aşa cum sunt tentaţi să creadă unii, a fi sluga unor umanoizi comozi şi veşnic nemulţumiţi.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
[PARANTEZĂ]

     Deşi nu am ajuns la această fază a tutorialului, fac o mică paranteză şi prezint câteva lucruri despre înfrumuseţarea cărţilor cu Imagini şi Ornamente Tipografice



        ● Despre „înfrumuseţarea” cărţilor:

     
     Important de reţinut: Un fişier text care conţine imagini este întotdeauna mai mare în format RTF decât acelaşi document salvat în format DOC.
     Din această cauză, chiar dacă din motive obiective [legate de conversia din RTF în diferite formate speciale] avem un fişier RTF, pentru a fi „transportat” [urcat pe host în vederea downloadării] vom folosi totdeauna formatul DOC.
     Dacă cineva va avea nevoie să revină la format RTF o va face foarte uşor deschizând fişierul în Word sau alte editoare care citesc DOC şi salvând în format RTF.
     Spre exemplificare, un fişier DOC ce conţine imagini şi care are aproximativ 5 ÷ 6 MO, va avea în format RTF circa 30 MO.

     Despre mărimea imaginilor de inserat.
     Imaginile nu trebuie să aibă dimensiuni mai mari decât dimensiunile pe care le va ocupa în text.
     În Word vom face clik dreapta pe imagine şi alegem opţiunea „Format picture”, apoi tabul „Size”. Dacă la eticheta „Scale” avem valori mai mici de 100% înseamnă că imaginea este prea mare. „Scale va trebui să aibă totdeauna valori mai mari de 100%,deci imaginea să fie mai „întinsă” decât în realitate şi nu mai „strânsă”
     O imagine color care se inserează pe o pagină trebuie să fie prelucrată astfel încât să aibă maxim 0,5 ÷ 0,7 MO. Dacă este mai mare de 1 MO nu este o imagine bună.

     Despre formatele TIF, JPG, PNG…
     Atenţie! Formatul TIF pentru imagini Color sau Grayscale va ocupa spaţiu mare pe disc faţă de alte formate, dar o imagine TIF alb-negru va fi totdeauna mai mică decât în orice alt format.
     În concluzie, folosiţi format JPG, PNG pentru imagini Grayscale şi Color şi folosiţi format TIF pentru imagini alb-negru.

     Despre Ornamente Tipografice
     Ornamentele Tipografice sunt acele imagini alb-negru folosite pentru ornarea unora dintre paginile cărţilor.
     În tipografiile timpului au fost folosite pentru ornarea începuturilor volum, începuturilor de părţi principale sau începutul de capitol [cap-capitol], ori pentru sfârşit capitol, sfârşit părţi principale, sfârşit volum. Ornamente mici au fost folosite şi pentru ornarea părţii de sus şi/sau jos a fiecărei pagini.

     Ele pot fi sub formă de imagini de colţ, imagini sub formă de bandă orizontală sau verticală, imagini centrate orizontal etc… cu motive florale, geometrice etc. etc.

     Recomand folosirea unui număr foarte mic a unor astfel de ornamente.
     Un număr mare de ornamente riscă să nu înfrumuseţeze o carte ci să o transforme într-o carte de tip sorcovă.

     Pentru iubitorii de ornamente tipografice am urcat câteva colecţii de astfel de ornamente:
          „1500 Decorative Ornaments from Dover” cuprinde in număr de 1500 de ornamente în format TIF [sunt cele din arhiva DOD1500T.rar] şi aceleaşi ornamente în format JPG [arhiva DOD1500J.rar]
           „Dover Typographic Ornaments” este o colecţie de 660 de ornamente la care am mai adăugat câteva versiuni ale unora dintre imagini [arhiva DTO670.rar]
cuprinde un număr
           „Old Fashioned Floral Designs – 636” este la origine un CD cu o colecţie de 636 ornamente florale [arhiva OFFD636.rar]

     Nume arhivă: DOD1500T.rar
         
         

     DOD1500J.rar
         
         

     DTO670.rar
         
         

     OFFD636.rar
         
         


     EDIT:
          În timp încerc să urc şi o colecţie de pagini goale [pagini goale, uşor colorate care se pot folosi ca fundaluri pentru text], câteva fişiere cu fundaluri colorate şi texturate ce se pot folosi pentru realizarea copertelor şi, cred că mai am un mic pachet cu coperte de tip vechi folosite la cărţile franţuzeşti ale lui Jules Verne.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       Am mutat pentru câteva zile acest topic pe secţiunea principală. Este posibil ca unii useri să fie interesaţi de ceea ce conţine, dar să nu-l fi descoperit încă.
       Sfârşitul de săptămână poate fi o bună ocazie...
       Menţionez că topicul, ca şi altele care conţin sfaturi despre digitalizare, se păstrează pe secţiunea "Totul despre cărți - About e-books".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Pentru a putea continua tutorialul despre prima corectură, am ajuns la concluzia că ar trebui să ştim câteva lucruri despre Stiluri.
     În timpul primei corecturi, chiar la începutul ei, ar trebui ca textul să fie formatat pe Stiluri.
     Pe timpul primei corecturi vor apărea multe situaţii [cuvinte scrise cursiv, numele/numerele capitolelor etc.] când am putea recurge la formatarea respectivelor situaţii pe Stiluri.
     E greu să vorbim despre ceva ce nu ştim ce este, aşa că am cugetat şi am ajuns la concluzia că ar trebui să discutăm mai întâi despre Stiluri.

     De aceea am deschis un topic pe această temă, la adresa:
   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 16 ani
@Seven, am o nelamurire: se gasesc pe net si chiar pe RI multe carti versionate 1.0 fara a fi disponibil scanul de ctrl.
desi banuiesc raspunsul tau te intreb totusi: cum vor fi versionate aceste carti care, dupa ce trec pe la mai multi cititori, ajung la un nivel superior de corectitudine a textului?
am spus ca banuiesc raspunsul tau - "OCR fara scan de ctrl" (gresesc?) - dar nu mi se pare ok. am citit carti in care am identificat foarte putine greseli in text pentru care nu era disponibil scanul de ctrl. apoi am gasit si carti cu "scan de ctrl" care de fapt era o conversie in pdf a unui doc.


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am avut ceva probleme cu logarea aproape o săptămână.
     
     Problema cu versiunile este una mai complexă şi destul de controversată.
     Cred că ar merita reluată discuţia versionării, şi cred că acum este un moment potrivit, aşa că în următoarele două-trei zile voi deschide un topic special pe tema asta.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Pagini: 1  

Mergi la