Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
ag30rox
Femeie
25 ani
Arges
cauta Barbat
32 - 46 ani
Forum Romania Inedit / Totul despre cărți - About e-books / [AC] AutoCorect OCR_Plus - Instructiuni de folosire Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani



     Din corespondenta personală rezultă că o parte dintre useri ar dori câteva explicaţii despre cum poate fi folosit AutoCorect OCR_Plus pentru curăţarea OCR-urilor.

     Încerc să realizez niste tutoriale pe care să le pun pe acest topic.
     Până voi reuşi să realizez aceste tutoriale, am să încerc să prezint direct pe forum câteva lucruri despre:
          - rularea automată în meniul OCR_Plus şi setări ce se pot face înainte de rulare;
          - modul de setare al Punctuaţiei, fereastra pentru OCR_Plus
          - modul de realizare a dicţionarelor personale de Înlocuiri multiple.


      Deocamdată am făcut un foarte mic tutorial despre instalarea AutoCorect şi a dicţionarelor ce rulează în AutoCorect OCR_Plus.

      Nume Tutorial: [AC1] Instalare si reactualizare AutoCorect OCR_Plus.pdf

      Nume folder:    Tutoriale AC OCR_Plus
      Adresa folder: 


      Update:
      Dicţionare şi documentaţie AutoCorect OCR Plus:  [varianta finală – aprilie 2012]
      pe folderul deschis "Versiune finală - aprilie 2012"
      la adresa: Mediafire
      Fişierele sunt organizate în subfoldere cu acces direct de la adresa mediafire de mai sus.



      Foarte important



      Să stabilim care este asemănarea şi diferenţa dintre programul AutoCorect STANDARD şi AutoCorect OCR Plus.
      AutoCorect OCR Plus este practic programul AutoCorect STANDARD la care s-au adăugat următoarele 3 elemente:
          ■  un meniu în plus, numit "OCR Plus";
meniul OCR Plus a fost inserat între meniul "Inserare" şi meniul "Instrumente, astfel că în acest moment ocupă poziţia a patra de la stânga la dreapta.
          ■  o fereastră nouă pentru Setări - Punctuaţie - OCR Plus.
Alături de ferestrele  "Configurare - Punctuaţie - Document" şi "Configurare - Punctuaţie - Subtitrări" care sunt implementate în AC Standard, a fost creată o nouă fereastră pentru setarea punctuaţiei care rulează în meniul OCR Plus.
          ■  o comandă rapidă [scurtătură] în coloana de comenzi rapide din stânga ferestrei principale a programului.
Este vorba de ultima comandă rapidă, numită "OCR", aflată pe poziţia 5.

      Foarte important: primele patru comenzi rapide din coloana din stânga ferestrei principale nu trebuie folosite pentru corectarea OCR-urilor.
      Ele sunt comenzi rapide pentru corectarea documentelor standard şi nu a OCR.


      Dacă la programul AutoCorect OCR Plus ignorăm existenţa meniului OCR Plus, atunci înseamnă că avem programul AutoCorect STANDARD.

      Opţiunile speciale implementate pentru corectarea fişierelor OCR se pot rula numai din meniul OCR Plus. O rulare automată a meniului OCR Plus se poate face şi acţionând asupra ultimei comenzi rapide, aşa cum se vede în imaginea de mai sus.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

                  ═════════     CONFIGURARE PUNCTUAŢIE OCR_Plus    ═════════



     Înainte de a face prelucrări în AutoCorect este necesar să stabilim setările Punctuaţiei. Acest lucru se poate face înainte de a încărca un document în AutoCorect, dar se poate realiza şi cu un document încărcat, fără să afecteze aceste setări.

     Este important de reţinut că setările punctuaţiei [ca de altfel şi setările din meniul OCR_Plus] sunt salvate şi păstrate de către AutoCorect şi după închiderea programului, până la o nouă modificare a setărilor sau la o nouă instalare a AutoCorect.
     În concluzie aceste setări sunt valabile oricând vom folosi AutoCorect; ele se fac o singură dată şi nu la fiecare deschidere a programului.


     Cum procedăm?
     După deschiderea programului AutoCorect, din meniul principal, accesăm opţiunea „Instrumente” — > „Configurare” – ca în prima imagine – şi se va deschide fereastra „Configurare – General”.
     Accesăm tabul-icon „Punctuaţie”, apoi tabul „OCR Plus”.
     Fereastra „Configurare – Punctuaţie – OCR Plus” are în acest moment 5 taburi componente:
           ■ Conversii
           ■ Punctuaţia de bază
           ■ Majusculă
           ■ Diverse
           ■ Sugestii

     Să le discutăm pe rând.


          ■ Conversii
     Aici nu este mult de discutat. Fereastra de setare este mai mult decât sugestivă.
     Opţiunea va face conversiile menţionate în fereastră.
     Ea trebuie activată în mod obligatoriu de către toţi utilizatorii.



          ■ Punctuaţia de bază
     Aici sunt două setări: prima este obligatorie şi cea de-a doua se activează în funcţie de preferinţele utilizatorului.
      „Aplică principiile de bază ale punctuaţiei” trebuie activată în mod obligatoriu.
     Ca şi la tabul precedent şi aici sunt menţionate toate modificările pe care le va face opţiunea.
     Practic opţiunea nu face altceva decât să aplice regulile de scriere a semnelor de punctuaţie şi să adauge sau să şteargă spaţii în faţa sau după fiecare semn de punctuaţie, aşa cum cer regulile ortografice ale limbii române.
      „Crează listă de sugestii”
     Dacă vom activa această setare, pe timpul rulării Punctuaţiei, programul va crea o listă cu propuneri de corectare a punctuaţiei; această listă cuprinde propuneri ale programului, dar a căror rezolvare depinde de utilizator; utilizatorul va putea să verifice fiecare propunere şi să accepte sau nu modificarea propusă de program.
     Dacă utilizatorul va dori să facă doar o curăţare automată a OCR-ului, fără alte corecturi, atunci nu trebuie activată această setare.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
CONFIGURARE PUNCTUAŢIE OCR_Plus - continuare - P2   


          ■ Majusculă
     Aici este mai mult de discutat. Sunt trei situaţii în care se face majuscularea:
           La început de dialog
           La început de paragraf
           La început de frază

     Prima setare „Majusculă la început de dialog [inclusiv dialog cu ghilimele]” trebuie activată în mod obligatoriu.
     Rularea opţiunii va corecta toate literele mici la început de dialog fie el cu ghilimele sau nu.
     Rularea opţiunii nu produce modificări nedorite.

     Al doilea pachet de opţiuni se referă la corectarea majusculelor la început de paragraf şi necesită câteva explicaţii în plus.
     Mai întâi să definim paragraful:
     Iată o definiţie scurtă din dicţionare: paragraful este „Pasaj al unei lucrări despărțit de restul textului printr-un aliniat nou (şi printr-un semn grafic special); fragment (unitar) dintr-un text care cuprinde o anumită idee. Fragment mic al unui capitol, al unui discurs, al unui articol de lege etc. cuprins într-un alineat.”
     Pentru computer, pentru editoarele de text, paragraful este ceva mai mult de atât.
     Din punct de vedere al logicii editoarelor, paragraful cuprinde orice text/nontext cuprins între două comenzi „Enter”. Pe editor nu-l interesează dacă între cele două comenzi Enter se află un paragraf care are înţeles, dacă sunt una sau mai multe cifre, ori răgălii sau dacă între două Enter nu se află nimic, nici măcar un spaţiu. Editorul va considera că acela este un paragraf.
   
     Acestea fiind spuse, să încercăm să analizăm imaginea următoare şi să privim atent paragraful care începe la sfârşitul paginii 58 şi se termină la începutul paginii 59.
     Acest paragraf ar fi corect în forma următoare:
      — Lemn umed – răspunse războinicul, tot atât de calm ca un pedagog care-i face o demonstraţie aritmetică elevului său încurcat. Prea mult umezeală, prea mult fum; prea mult apă… fum negru.
 

     Ce constatăm?
     Paragraful real din punct de vedere literar şi a logicii limbajului, începe la sfârşit de pagină şi nu încape în totalitate pe pagina respectivă, ci se continuă pe pagina 59. Atenţie la ultimul cuvânt scris pe pagina 58: cuvântul elevu-, este de fapt cuvântul elevului, despărţit la capăt [sfârşit] de rând, sfârşit de rând care, în acest caz, corespunde şi cu sfârşit de pagină. Primul cuvânt de pe pagina 59 lui nici nu este un cuvânt real, ci este secvenţa finală a cuvântul elevului.

     Să privim mai departe: cele două părţi ale paragrafului real sunt despărţite de 4 „paragrafe digitale”:
          – paragraf 1 – nota de subsol „1 Colibă de piei-roşii” – cu font roşu în imagine;
          – paragraf 2 – nota de subsol „2 Oameni albi” – cu font roşu în imagine;
          – paragraf 3 – număr de pagină – numărul 58 – pe fundal bleu
          – paragraf 4 – paragraf [rând] gol, marcat cu |
     Din păcate, calculatorul a majusculat secvenţa de cuvânt lui cu care începe pagina, transformând-o în cuvântul Lui, calculatorul considerând că e vorba de un paragraf nou.

     Acum să încercăm să definim „Paragraful Întreg” şi „Paragraful Întrerupt” în sensul folosit la aceste setări.
     „Paragraful Întreg” este un paragraf normal, un paragraf obişnuit, aşa cum este definit în dicţionare, care urmează după un paragraf format din caractere de tip literă, mai lung de 7 caractere şi care se termină cu semne de punctuaţie corecte.
     „Paragraful Întrerupt” este acel paragraf care urmează după un paragraf gol [deci un rând gol] sau după un paragraf care conţine numai cifre [cum ar fi cazul numerelor de pagină].

     În sfârşit, acum revenim la setările privind majuscularea paragrafelor.
     Subliniez că din cele 3 setări posibile ale majusculării paragrafului se poate activa doar UNA SINGURĂ, la alegere.
     Să le analizăm pe rând:

      „Majusculă la început de paragraf – [orice literă – orice paragraf]”
     Această opţiune va majuscula orice literă la toate paragrafele, indiferent dacă ele urmează după un paragraf normal, ori după unul gol sau după unul format din cifre, dacă este un „Paragraf Întreg” sau un „Paragraf Întrerupt”

     Atenţie! Activând această opţiune se vor majuscula şi paragrafele care încep la sfârşit de pagină şi se continuă la începutul paginii următoare, fiind întrerupt de rândul gol dintre pagini sau de numărul de pagină, aşa cum s-a întâmplat în exemplul din imaginea de mai sus.

     Recomand ca această opţiune să fie activată doar în cazurile în care utilizatorul nu a păstrat [sau a şters] numerele de pagină şi nici nu are marcată trecerea de la o pagină la alta cu rând gol şi, de asemenea, a corectat despărţirea paragrafelor cu opţiunea „1.5 Repararea rândurilor rupte”.

      „Majusculă la început de paragraf [numai paragraf întreg]”
     Această setare va permite ca majuscularea să se facă la toate literele cu care încep paragrafele, dar doar la paragrafele care „curg” unul după altul, la paragrafele întregi. Efectul secundar al opţiunii este acela că dacă între titlul capitolului şi primul paragraf aven un rând gol, programul nu va majuscula acest paragraf.
     Recomand activarea acestei opţiuni.

      „Majusculă la început de paragraf [numai litera Î paragraf întreg]”
     Această setare va permite doar majuscularea literei î — > Î şi numai în cazul paragrafelor întregi. Practic aceasta seamănă cu setarea a doua, doar că nu caută toate literele mici la început de paragraf întreg, ci doar litera î.

     Notă: în general, Abbyy face puţine confuzii între literele mici şi literele mari, fapt pentru care nu sunt multe cazuri de început de paragraf care vor fi scrise cu litere mici, mai ales dacă s-a făcut un antrenament suficient al Abbyy cu caracterele [adică minim 5-6 pagini].
     Singura problemă majoră a lui Abbyy este aceea că nu recunoaşte niciodată pentru limba română litera Î [Î majusculă], ci o va scrie totdeauna cu î [î minusculă]. Practic aceasta, problema lui î, este principala problemă de rezolvat la majusculare.

     Avantajul setării acesteia faţă de setarea a doua este că majuscularea va rula mai repede, având mai puţine căutări de realizat; dezavantajul este că pot exista şi alte litere scrise cu minusculă la început de paragraf, pe care programul nu le va corecta. În funcţie de aspectul textului, utilizatorul ca avea posibilitatea să aleagă între setarea 2 sau 3, ori chiar setarea 1.

     Tot la tabul "Majusculă", mai sunt de discutat setările care se referă la "Majusculă la început de frază."
     Redau în imaginea de mai jos un fragment din fereastra se setare, spre a reaminti cum arată aceste setări.


     Prima setare, „Majusculă la început de frază – doar după punct urmat de spaţiu”, este setarea pe care o recomand. Rularea opţiunii de majusculare astfel setată nu va face erori de majusculare [nu va majuscula şi acolo unde nu trebuie] decât în situaţia în care Abbyy a pus în mod eronat un punct în locul unei virgule. Subliniez că punctele de suspensie, în acest moment, sunt deja convertite în Elipsis, astfel că opţiunea nu va majuscula propoziţiile care încep după puncte de suspensie.
     Avantaje şi dezavantaje ale setării. Rularea punctuaţiei astfel setate nu va produce erori de majusculare în plus, adică nu va majuscula situaţii în care trebuie păstrată minuscula. Dezavantajul este că pot rămâne începuturi de frază care urmează după ? ! şi elipsis, ce vor trebui corectate manual.

     Cea de-a doua setare, „Majusculă la început de frază – după ! şi ? urmat de spaţiu”, are dezavantajul că poate face majusculări în plus faţă de situaţiile corecte. Această opţiune va face majuscularea cazurilor de dialog francez, astfel că dacă va fi activată, în mod obligatoriu este necesară şi cea de-a treia opţiune de la tabul „Sugestii” sau opţiunea specială din meniul OCR_Plus „4.5. Convertire majusculă în minusculă în dialog francez”.

     Niciuna dintre cele două setări nu este perfectă, fiecare dintre ele are avantaje şi dezavantaje.
     Personal prefer prima opţiune, pentru simplul motiv că aşa m-am obişnuit să lucrez.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
CONFIGURARE PUNCTUAŢIE OCR_Plus - continuare - P3   


          ■ Diverse
     Cred că numele acestor setări sunt suficient de sugestive şi nu mai necesită explicaţii.
     Recomand activarea tuturor setărilor.



          ■ Sugestii

     Pentru că personal nu am folosit aceste sugestii, am nevoie de un pic de timp pentru documentarea privind setarea Sugerează tipul corect de liniuţă.
     Setarea a doua nu cred că necesită explicaţii, fiind suficient de sugestivă.
     Cea de-a treia setare, privind dialogul francez, se activează după cum am mai spus, doar dacă se activează opţiunea „Majusculă la început de frază – după ! şi ? urmat de spaţiu”.
     Aceste două setări şi opţiuni funcţionează în pereche: ori activate ambele, ori dezactivate.

     Cred că cele de mai sus sunt suficient de detaliate ori, poate, enervant de detaliate.
     Dacă a fost mai greu la citit... îmi cer scuze!... dar să ştiţi că nici la scris n-a fost foarte uşor. 

     Stimă şi Respect!
     Seven     

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

                  ═════════     Probleme constatate de useri la rularea Meniului OCR_Plus    ═════════


 
      "cind rules functiile de la OCR plus imi spune ca "nu poate deschide" urmatoarele dictionare CO_DE, L1, S1, Midp, Dlp, Df. Am verificat si dictionarele sint la locul lor."

      Mai întâi trebuie stabilit dacă rulează vreunul dintre dicţionare; dacă nu rulează niciunul atunci pot fi următoarele cauze:
            - dicţionarele nu au fost instalate în folderul corect;
            - dicţionarele nu au numele reactualizate şi rulează dicţionare cu nume vechi. Dicţionarelor iniţiale au fost redenumite, adăugându-se la toate dicţionarele particula CO_ pentru AutoCorect Contemporan sau CL_ pentru AutoCorect Clasic. E bine de verificat pe baza anexelor Tutorialului din prima postare.

                  ═══════════════════════════

      Părerea mea este că e posibil să avem o problemă cu calea de căutare a dicţionarelor.

      Foarte important: Există în computer două foldere numite "Dictionare" Nu trebuie făcută confuzie între ele.

      Unul dintre ele se găseşte în Program Files, unde AutoCorect se instalează:
           „C:\Program Files\AutoCorect\ Dictionare”
      În acest folder "Dictionare" AutoCorect îşi instalează dictionarele sale de limba română, necesare funcţionării. Aceste dicţionare n-au nicio legătură cu cele ce rulează în Meniul OCR_Plus.

      Mai există un folder "Dictionare" si este cel care ne interesează si pe care Autoorect îl crează la prima lui rulare.
      Acest al doilea folder, cel ce ne interesează, are următoarea locaţie:
                 
        ■ în Windows XP:
     „C:\Documents and Settings\NUME_USER\Application Data\AutoCorect Clasic\ Dictionare” – pentru versiunea AutoCorect Clasic.
sau
     „C:\Documents and Settings\NUME_USER\Application Data\AutoCorect Contemporan\ Dictionare” – pt. versiunea AutoCorect Contemporan.


        ■ în Windows 7, Windows Vista:
     „C:\Users\NUME_USER\AppData\Roaming\AutoCorect Clasic \Dictionare” – pentru versiunea AutoCorect Clasic.
sau
     „C:\Users\NUME_USER\AppData\Roaming\AutoCorect Contemporan\ Dictionare” – pentru versiunea AutoCorect Contemporan.

      În aceste foldere numite "Dictionare" se crează folderul "OCR_DIC" şi aici se copiază dicţionarele ce rulează cu Meniul OCR_Plus.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
AutoCorect
Membru Puf

Inregistrat: acum 13 ani
2002 - 2012 = 10 ani.

10 ani din viaţa mea pentru AutoCorect, pentru a fi ce este acum, pentru un start, un colac de salvare ce va salva pe ici pe colo pe unu şi pe altul...

Acum, eu renunţ complet la ce înseamnă AutoCorect, las moştenire tot ce înseamnă AutoCorect colaboratorului şi prietenului meu Cosmin Ciuperca cu care am petrecut momente deosebite dezvoltând aplicaţia mai sus menţionată, chiar dacă nu ne-am întâlnit niciodată face-to-face.

Doresc şi voi trece în uitare aşa cum am început dezvoltarea AC, în linişte, fără susţinători.

Succes în continuare Cosmin, de acum tot greul va fi pe umerii tăi.
Sună ciudat, dar îmi este inima grea, simt că mă despart de ceva drag... cu bine..., tuturor.

Daniel Morlova.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
   Dragă Daniel,
 
   Nu ştiu exact când am descoperit AutoCorect, dar ştiu sigur că din vara anului 2009 am început să-i folosesc frecvent opţiunea de înlocuri multiple. Cred că era vorba de AutoCorect 2.3.
     E adevărat că se putea rula doar dicţionarul „implicit.dic”, dar am făcut mai multe dicţionare în Notepad, le-am ordonat înregistrările în ordine alfabetică şi le rulam prin redenumire şi copiere în folderul principal. Atunci am realizat cât de important era programul în corectura preliminară a OCR-urilor.

     Mai târziu, când a apărut AutoCorect 3.3 am fost un pic descumpănit. Dicţionarele primiseră extensia „imd” şi nu mai puteam să le editez în Notepad, ci doar în AutoCorect, ceea ce era un pic mai dificil, dar am descoperit că acum se puteau salva un număr infinit de dicţionare, iar rularea lor era mult mai uşoară. Programul era deja foarte puternic.

     Pe această secţiune a fost creat un topic special dedicat cunoaşterii şi folosirii AutoCorect, topic ce a făcut cunoscut programul şi altor useri ce se ocupau cu digitalizarea cărţilor.

     Deşi nu-i văzusem niciodată în viaţa mea şi nu credeam că aş putea vreodată schimba un singur cuvânt, ştiam exact cine sunt Daniel Morlova şi Cosmin Ciupercă. Erau doi oameni care-şi foloseau cunoştinţele şi timpul lor pentru a oferi altora un instrument foarte util. Şi mai ales, într-o ţară în care se vinde sau se fură orice, ei ofereau totul fără să primească nimic. Poate din când în când câte o mulţumire. Da, cred că la momentul în care am început eu să folosesc AutoCorect, e posibil să fi funcţionat şi forumul de pe Softset… Sunt aproape sigur că undeva am văzut nişte mulţumiri ale utilizatorilor de AutoCorect.
     Poate că există, mai mult ca sigur că există, mai multe programe româneşti free şi mulţi programatori demni de respect. Eu nu am avut onoarea să-i cunosc pe aceea, dar îi „ştiam” sigur pe cei doi care făcuseră AutoCorect şi nu numai AutoCorect. Şi atunci ca şi acum mi s-a părut a fi cel mai important lucru să oferi ceva necunoscuţilor din jurul tău fără să ceri ceva în schimb.

     Când aţi apărut pe forum, pe această secţiune mai puţin cunoscută de către useri [pentru că e o secţiune pe care o vizitează oamenii doar atunci când caută o lămurire, iar cei mai mulţi nici nu ştiu că există] am fost pur şi simplu emoţionat. Nu m-am gândit niciodată că AutoCorect ar putea să ajungă ceea ce este astăzi AutoCorect OCR_Plus.
     M-am gândit că se mai pot face ceva îmbunătăţiri, mi se părea că Menssana vă cere prea mult şi, la început m-am şi opus la prea multe schimbări, dar mai apoi când aţi implementat noul meniu „OCR_Plus” am încercat să ajut cât pot…
     Ideea este că nu mă pricep la prea multe [habar n-am de programare sau limba engleză şi sunt la vârsta la care oamenii uită din ce în ce mai mult din ceea ce odată au ştiut, aşa că nu prea mai am timp să mă apuc de învăţat]; deci nepricepându-mă la altceva, am făcut ceea ce face tot românul: mi-am dat cu părerea, am chibiţat pe lângă… şi, e adevărat… am bibilit câteva dicţionare.

     În acest moment eram foarte mulţumit. Un timp mă ofticaseră ruşii şi chinezii, dar nu numai ei, că realizaseră programe speciale pentru digitalizarea cărţilor…
     Dacă ruşii au Scan Tailor sau ScanKromsator, dacă chinezii au DjVuToy… acum pot spune cu mândrie că şi noi, românii, avem un program special pentru digitalizare: AutoCorect OCR_Plus, şi asta e opera voastră, Daniel Morlova şi Cosmin Ciupercă.

     Mie mi-au trebui şapte ani să descopăr AutoCorect… Nu ştiu cât timp va trece până ce foarte mulţi utilizatori vor privi AutoCorect ca pe un instrument indispensabil pentru digitalizare, dar sigur este că va veni momentul când oamenii vor reuşi să aprecieze la valoarea sa reală AutoCorect OCR_Plus.

     Şi că vrem… sau că nu vrem, AutoCorect înseamnă Daniel Morlova şi Cosmin Ciupercă şi aşa va fi totdeauna.
     
     Am fost onorat să chibiţez pe lângă o asemenea echipă şi vă mulţumesc pentru toată munca voastră.
   
     Cu stimă şi respect,
     Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
O, da.... cat timp l-am batut pe Cosmin la cap sa vina aici )

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Multumesc, Seven.

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

                  ═════════     RULAREA AUTOMATĂ A MENIULUI OCR_Plus    ═════════




          ■ GENERALITĂŢI



      Îmi cer scuze dacă vor fi prea multe postări!
      Deoarece este foarte dificilă editarea şi reeditarea în postări lungi am ales varianta ca fiecare pachet de opţiuni să fie tratat în câte o postare separată.
      Va dura o perioadă până ce toate postările vor fi complete. Mai întâi voi insera imaginile necesare şi apoi vor fi adăugate explicaţii, astfel că la un moment dat vor fi editate mai multe postări, dar făcă ca vreuna dintre ele să fie completă.

                  ════════════════════════════════════


     Meniul este destul de complex şi o discuţie despre rularea lui este dificil de abordat. Am ales varianta în care să prezentăm mai întâi fiecare pachet de opţiuni în parte, deoarece rularea cronologică mi se pare mai dificil de explicat.

     Mai întâi să stabilim câteva aspecte:
     ■ a. Programul AutoCorect OCR_Plus poate fi folosit în cel puţin două variante:
          – CORECTURA sau varianta LUNGĂ – este varianta de lucru care permite o corectură completă, în care se rulează atât opţiunile din meniul OCR_Plus cât şi alte opţiuni cum ar fi Ortografie şi editări care permit o corectură complexă, inclusiv corectura cap-coadă prin citire.
          – CURĂŢAREA sau varianta SCURTĂ – se foloseşte pentru o curăţare rapidă a OCR-ului, după care utilizatorul va continua corectura prin citire-cap coadă în alt editor de text. Aceasta este varianta pe care o vom discuta în continuare.

     ■ b. Timpul de rulare a meniului OCR_Plus.
     Timpul depinde de mărimea documentului de corectat, ceea ce este normal, dar trebuie menţionat că dacă avem un document de 200 de pagini şi unul de 2 × 200 = 400 pagini, timpul necesar pentru documentul mai mare nu este numai de 2 ori mai mare, ci de aproximativ 2 × 2, adică de vreo patru ori.
      Dacă avem cărţi mari de curăţat este bine să le împărţim în câte două sau trei părţi de circa 200 de pagini. Din teste, rezultă că mărimea optimă este în jurul a 200 de pagini.
      Programul păstrează setările, astfel că toate părţile vor fi curăţate în acelaşi mod.

     ■ c. Aşa cum am menţionat şi altădată, programul AC nu face totul… şi nici nu e necesar să facă totul. Practic el este un instrument care ne ajută să curăţăm grosul greşelilor. Adevărata curăţenie… adevărata corectură o face omul. Utilizatorul poate stabili ce anume opţiuni rulează şi ce nu rulează, alegând opţiunile care-l avantajează… şi, de asemenea, el va putea îmbunătăţi programul prin adăugarea de noi dicţionare cu înregistrări specifice cărţilor pe care le corectează. Aceste dicţionare suplimentare le va putea adăuga, după cum vom vedea, la opţiunea 11.







     Din meniul principal, alegem „OCR_Plus” — > „Rulează toate opţiunile”, ca în prima imagine.
     Programul va deschide fereastra cu lista de opţiuni, aşa cum se vede în cea de-a doua imagine.
     În această fereastră vom bifa [activa] opţiunile pe care vrem să le rulăm.
     La opţiunile care sunt prevăzute cu Opţiuni de setare va trebui să verificăm dacă setările default sunt cele care ne convin sau le vom modifica după dorinţă.
     Este important de reţinut că aceste setări şi activarea/nonactivarea opţiunilor se păstrează până la o eventuală modificare sau o nouă instalare de executabil. În concluzie, setările se fac o singiră dată pentru mai multe utilizări ale programului.
     După stabilirea tuturor setărilor se apasă butonul „Rulează”.

     Menţionaz că ordinea de rulare a opţiunilor a fost stabilită după mai multe testări şi cea default este considerată optimă. Cu toate acestea, opţiunile pot fi mutate în sus şi în jos, astfel că ordinea lor se poate schimba, dacă utilizatorul va voi să schimbe o anumită ordine de rulare a opţiunilor.

     Pentru a putea hotărî care dintre opţiuni să fie activate şi care nu, precum şi care sunt setările necesare, vom proceda la explicarea în detaliu a fiecărei opţiuni.
     Pentru ca unii utilizatori să nu fie tentaţi să renunţe la unele opţiuni, fără a cunoaşte foarte bine ce anume modificări fac acele opţiuni, voi explica avantajele folosirii fiecăreia în parte, dar voi insista suficient şi pe eventualele dezavantaje ale rulării opţiunii.


     Legea nr.1: AutoCorect PCR_Plus face o precorectură şi nu o corectură textului. După rularea AutoCorect OCR_Plus ESTE OBLIGATORIE executarea corecturii manuale prin citire cap-coadă a textului.

     Dicţionarele pe care programul le rulează pentru executarea modificărilor realizează foarte multe înlocuiri corecte, dar nu este exclus ca în text să facă şi înlocuiri eronate, chiar dacă acestea sunt în număr mic până la extrem de mic.
     La editarea dicţionarelor s-a mers pe principiul ca un dicţionar să ajute cât mai mult pe cel ce corectează manual; cu alte cuvinte, dacă o înregistrare face foarte multe înlocuiri corecte, dar din când în când produce şi modificări incorecte, această înregistrare a fost făcută. Practic s-a avut în vederea frecvenţa apariţiei într-un text a unui anumit cuvânt într-o anumită formă.
    Exemplu: există în limba română, atât cuvântul < în > cu o frecvenţă foarte-foarte mare în orice text, dar există şi cuvântul < in > ce are o frecvenţă foarte mică. Am ales să facem modificarea in >> în, iar când corectorul găseşte în text că este vorba de cuvântul < in = plantă tehnică> - atunci corectorul face modificarea manuală. Sunt multe alte exemple.

     Legea nr.2: vom activa TOATE acele opţiuni pe care le considerăm necesare.
     Nu este indicat să facem corecturi manuale dacă ele se pot face automat şi mult mai rapid în AutoCorect.

     Legea nr.3: vom activa DOAR acele opţiuni pe care le considerăm necesare.
     Nu este indicat să aglomerăm programul cu sarcini pe care nu le considerăm utile.
     
     Legea nr.4: Legea 1 este OBLIGATORIE TOTDEAUNA, ORIUNDE şi pentru ORICE TEXT; Cine procedează altfel, are şanse sigure SĂ STRICE un text deja corectat. Din păcate sunt câţiva "isteţi" care au procedat astfel, realizând o versiune "superioară" la o calitate "inferioară".
     Legile 2 şi 3 pot fi complet ignorate, da' e păcat.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 1. CONVERTIRI PRELIMINARE


       1.1. Conversie dialog bullets în dialog text
       1.2. Setare text la font şi mărime unică
       1.3. Eliminare tab şi spaţii multiple
       1.4. Eliminare spaţii la început de paragraf
       1.5. Repararea rândurilor rupte
       1.6. Rupere rânduri care încep cu dialog aflate în interiorul paragrafului.




       1.1. Conversie dialog bullets în dialog text
     Opţiunea, aşa cum sugerează şi numele, transformă liniile de dialog de tip bullets în linii de dialog de tip text.
     Păstrarea într-un text a liniilor de dialog de tip buletts poate duce la pierderea liniilor de dialog, din neatenţie sau dacă utilizatorul doreşte să facă reformatarea textului.
     Opţiunea nu necesită multe explicaţii. Va fi ACTIVATĂ obligatoriu. Nu produce efecte secundare nedorite.
     Recomand ca această opţiune să fie rulată separat si la terminarea corecturii, deoarece pe timpul corecturii pot să mai apară în mod accidental situaţii în care linii noi de dialog apar ca buletts.


       1.2. Setare text la font şi mărime unică
     Un OCR poate fi salvat de Abbyy în diferite formate: doc, rtf, pdf, htm, lit etc...
     Recomand o singură variantă şi anume: RTF.
     La rândul lui şi RTF-ul poate fi salvat în mai multe variante de formatare:
                  – RTF – Exact copy
                  – RTF – Editable copy
                  – RTF – Formatted text
                  – RTF – Plain text
     Primele două ["RTF – Exact copy" şi "RTF – Editable copy"] pot fi acceptate doar dacă OCR-ul extras va fi printat sau citit fără a fi corectat. Corectura unor astfel de formatări necesită eforturi suplimentare mari şi nejustificate, deoarece la aceste formatări apar zone de Text Box şi în principiu tot textul este inserat în Frame-uri, câte un Frame pentru fiecare suprafaţă de text Abbyy [de reamintit că pe o pagină de carte sunt mai multe suprafeţe de recunoaştere a Abbyy, deci fiecare pagină va avea cel puţin două-trei Frame]. Pentru a realiza corectura va trebui ca mai întâi să fie şterse aceste Frame şi încadrări de la Text Box.

     Dacă la o carte nu ne interesează păstrarea formatării italice [cursive] a zonelor scrise în acest mod sau, pur şi simplu cartea este scrisă doar cu font drept [regular], atunci putem salva în varianta cea mai simplă, "RTF – Plain text" şi vom avea text cu acelaşi font şi la aceeaşi mărime.

     În principiu, varianta optimă de salvare a unui text OCR în Abbyy este RTF - Formatted text.
     Această variantă salvează toate formatările de text, dar fără încadrări de tip Box Text sau Frame. Dezavantajul este că Abbyy va folosi mai multe tipuri de fonturi, o mulţime de valori pentru mărimea textului, de la 4-5 puncte tipografice până la valori foarte mari [chiar şi 150 puncte pentru câte un caracter singular, recunoscut eronat], precum şi o serie de formatări false ale textului. Din acest motiv este necesară o formatare a textului la font şi mărime unică.

     Această opţiune este una dintre cele mai complexe pe care le conţine meniul OCR_Plus. Setările sunt de asemenea complexe, astfel că vom insista mai mult pe fiecare grup de setări.



     ■ Setare font
     Deşi fereastra de setare este suficient de sugestivă, sunt necesare câteva explicaţii.
          – Nume font şi Mărime font. Vom stabili fontul şi mărimea ca în orice editor. Personal folosesc "Bookman Old Style" la mărimea 11, dar pot fi folosite şi alte fonturi şi mărimi, conform obişnuinţei. Recomand fontul "Droid Serif"; este un font foarte uşor de citit, în special pe Readere.
          – culoare – setarea poate rămâne inactivă; opţional se poate activa şi stabili culoarea [în principiu la cărţi se foloseşte culoarea Black şi nu Automatic]. Recomandare personală: setare inactivă.
          – "B + I = I" – această setare va înlocui toate bucăţile de text formatate bold+italic în font italic simplu, neboldat.
     De regulă, în cărţile de beletristică nu este folosită formatarea Bold+Italic, astfel că zonele de text formatate astfel sunt de cele mai multe ori nicşte simple erori Abbyy. Recomandare personală: setare ACTIVĂ.
          – "B >> N" – această setare va înlocui toate bucăţile de text formatate cu  Bold simplu în font drept simplu, neboldat. La cărţile de beletristică este folosită formatarea Bold doar pentru numele capitolelor, dar Abbyy va marca astfel toate zonele de text pe care nu este sigur că le-a recunoscut corect, în special cuvintele care conţin litera O şi L mic lângă cratimă, deoarece nu va şti sigur dacă acolo se află literele O sau L mic, ori cifrele 0  sau 1.  Recomandare personală: setare ACTIVĂ.
          – Resetare zoom 100% – la alegerea utilizatorului. Recomandare personală: setare inactivă.



     ■ Setare paragraf
     Aceste setări nu implică prea multe discuţii. Se pot alege orice valori, dar le recomand pe următoarele:
          – Alineatul: are valori zero în marginea stângă şi dreaptă a paginii, iar primul rând începe mai din interior cu 0,5 cm [0,2 inches]
          – Spaţiere rânduri = 1; textul este scris "la un rând".
          – Spaţiere caractere = 0. Spaţiu dintre două litere este un spaţiu normal, adică nu este nici condensat, nici expandat.
          – Spaţiu paragraf: Înainte = 0. După = 0. Spaţiul dintre paragrafe este unul normal, ca şi cel dintre rânduri, adică distanţa dintre două paragrafe este aceaşi cu cea dintre două rânduri ale aceluiaşi paragraf, deci tot "la un rând"
          – Aliniere paragraf = stânga-dreapta sau, ceea ce cunoaştem ca "Justify".



     ■ Setare pagină
     La setarea paginii lucrurile sunt foarte simple şi se procedează ca la setarea paginii în orice editor. Recomand folosirea valorilor din imagine: pagina format A5 cu marginile de 1 cm, iar Antetul şi Subsolul de 0,5 cm.
     Menţionez că: 0,5 cm ≈ 0,2 inches, iar 1 cm ≈ 0,39 inches

      Sunt foarte importante setările de font şi cele de paragraf, dar poate rămâne neactivată opţiunea de setare a paginii. Setarea paginii se poate face atunci când începe corectarea propriu-zisă prin citire-cap coadă a textului.

     După ce am definitivat setările de font, paragraf şi pagină, acţionăm butonul "Setează" pentru a salva setările şi a ieşi din fereastra de setare.


       1.3. Eliminare tab şi spaţii multiple
     Opţiunea converteşte toate taburile în spaţii simple şi, de asemenea converteşte toate spaţiile multiple într-un singur spaţiu, astfel că între cuvinte va exista în tot textul câte un singur spaţiu. Recomandare personală: setare ACTIVĂ.


       1.4. Eliminare spaţii la început de paragraf
     Opţiunea elimină spaţiile existente la început de paragraf.
     Este necesară eliminarea spaţiilor aflate la început de paragraf, deoarece opţiunile de corectare care rulează la pachetele următoare nu pot funcţiona corect sau nu pot funcţiona deloc dacă există astfel de spaţii la început de paragraf.
     Utilizatorul de Word sau alte editoare de text, care se respectă, nu va alinia începutul de paragtaf prin adăugare de spaţii sau taburi în faţa primului rând ci va seta paragraful astfel încât prima linie să fie scrisă mai din interior. Recomandare personală: setare ACTIVĂ.


       1.5. Reparare rânduri rupte
     S-a ales formularea "rânduri rupte", ca fiind mai sugestivă, dar opţiunea poate fi numită şi "repararea paragrafelor rupte".
     Într-un OCR pot apărea situaţii în care unele dintre paragrafe sunt "rupte".
     Cauzele apariţiei paragrafelor rupte sunt mai multe, printre care:
           - o simplă eroare de interpretare a Abbyy, deşi setările au fost făcute corect.
           - setare greşită în Abbyy [a fost activată opţiunea "Keep line breaks" din Tools -> Options -> 3. Save -> Text settings].
           - copiere directă cu Copy&Paste dintr-un fişier de alt tip: pdf, htm etc...

      Iată un exemplu de pagină rezultată din Abbyy care a avut setarea "Keep line breaks" activă - Vezi Img.1.
      Se observă că toate rândurile au devenit "un fel de" paragrafe.
      În a doua imagine se văd şi codurile de sfârşit de rând [semnul sub formă de săgeată orientată în jos] şi codurile de sfârşit de paragraf [cel sub formă de P întors] - Vezi Img.2.
      În cazul în care "ruperea paragrafelor ar fi avut un alt motiv decât setarea din Abbyy, la sfârşitul rândurilor ar fi putut apărea semnul sfârşit de paragraf în locul semnului sfârşit de rând.
      Iată cum apare pagina după rularea opţiunii 1.5. Reparare rânduri rupte - Vezi Img.3.

      Este important de menţionat că opţiunea are implementate opţiuni de setare, aşa cum se vede în imaginea de mai jos.


      Recomandări privind setările opţiunii:
      Din experienţa personală rezultă că se pot activa toate variantele fără probleme la cărţile de beletristică. În cazul cărţilor de specialitate [drept, economie, medicină, tehnică  etc.] se va evita activarea opţiunilor nr. 5 şi 10 sau se vor folosi cu mare atenţie. În cazul unor astfel de cărţi este normal să existe paragraf corect după punct şi virgulă, în cazul în care este vorba despre o enumerare.
     
      Comentarii despre opţiune.
      Opţiunea rezolvă un număr relativ de erori în cazul unui OCR rezultat dintr-o extragere Abbyy cu setări corecte. Efectele negative ale opţiunii sunt limitate sau inexistente. Singura menţiunea este cea privind setările 5 şi 10 în cazul unor cărţi cu structură diferită de literatura beletristică. În cazul textului obţinut cu Copy&Paste din formate speciale [pdf, htm etc] opţiunea va scurta timpul şi efortul corecţiei manuale de la câteva ore la unul-două minute. Recomandare opţiune: setare ACTIVĂ.


       1.6. Rupere rânduri care încep cu dialog aflate în interiorul paragrafului
      Sunt cazuri în care Abbyy "lipeşte" în mod eronat două paragrafe sau mai multe paragrafe. Cazurile sunt mai dese în cazul paragrafelor obişnuite, dar există şi cazuri în care un paragraf care începe cu linie de dialog a fost lipit la sfârşitul paragrafului din faţa sa.
      Opţiunea încearcă să repare această ultimă eroare şi "rupe" paragraful atunci când găseşte o liniuţă care îndeplineşte condiţiile unei linii de dialog. Astfel, liniuţa trebuie să aibă spaţiu înainte şi după, are o frază care se termină corect înaintea spaţiului din faţă şi are o frază care începe cu literă mare după spaţiu de după liniuţă.
      Sunt cazuri de beletristică în care toate condiţiile de mai sus apar şi în cazul unei linii de pauză. Situaţiile sunt destul de rare, dar există. Mai mult decât atât, aceste situaţii apar, de regulă, în cazul dialogurilor, iar liniile de pauză separă ceea ce spune personajul de ceea ce comentează autorul; deci confuzia poate fi mare, dacă se face o rupere eronată.
      Rularea opţiunii poate produce erori în cazul unui anumit autor sau traducător; dacă marcarea comentariilor autorului în dialoguri se face cu linii de pauză, erorile pot avea o frecvenţă mai mare; dacă aceste comentarii sunt marcate prin virgule, erorile sunt minime sau inexistente. Opţiunea trebuie folosită cu atenţie, după o vizualizare cât de sumară a textului, pentru stabilirea modului în care s-a făcut demarcarea comentariilor autorului de de ceea ce spun personajele într-un dialog.
      Iată două moduri corecte de marcare a comentariilor autorului într-un dialog.
            — Nu sunt credincios – zise el – dar am să spun Tatăl Nostru de zece ori, ca să prind peştele.
            — Nu sunt credincios, zise el, dar am să spun Tatăl Nostru de zece ori, ca să prind peştele.
      În cazul în care în carte se foloseşte metoda liniilor explicative ca în primul exemplu, activarea opţiunii ar putea produse erori; În cel de-al doilea caz, erorile sunt aproape excluse.
      Recomandare personală: utilizatori începători = setare inactivă şi utilizatori avansaţi = setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 2. PUNCTUAŢIE


       2.1. Eliminare artefact-paragraf
       2.2. Corectare linii de pauză şi linii de dialog
       2.3. Funcţii obişnuite
       2.4. Corectare suplimentară elipsis
       2.5. Conversie combinaţii ? ! şi . ,



       2.1. Eliminare artefact-paragraf
     Paragraf-artefact sau artefact-paragraf în cazul de faţă este un paragraf care nu conţine text, cu doar un caracter sau combinaţi de două sau trei caractere eronat recunoscute [ceea ce am numit cu termenul general de "răgălie"].
     Opţiunea caută şi modifică un astfel de paragraf şi şterge "răgăliile", transformând paragraful în unul gol, fără conţinut.
     Această opţiune funcţionează prin rularea dicţionarului CO_Artef.imd, respectiv CL_DArtef.imd.
     Exemplu de caractere-răgălii înregistrate la acest moment: ■ ♦ • ^ < > | ► □ ▫ ● ▼ ◄ ▲ ◊ ○ ◘ ◙ ◦ │ ¦ _ @ # $ Ł % + = { } [ ] · §
     Este important de reţinut că dicţionarul poate fi completat de fiecare utilizator cu cazuri noi descoperite în OCR.
     Menţionez că la editarea dicţionarului trebuie să se ţină cont de faptul că toate înregistrările au în mod obligatoriu condiţiile "Început de paragraf" Pi şi "Sfârşit de paragraf" Ps, la care se adaugă "Potrivire perfectă" Pp.
     În ultima coloană a dicţionarului trebuie să apară condiţiile Pp Pi Ps
     Dacă una dintre cele două condiţii Pi sau Ps lipseşte, programul va căuta astfel de situaţii şi la începutul sau sfârşitul unor paragrafe care conţin text, ceea ce poate afecta corectitudinea textului, deoarece pe lângă răgălii au fost înregistrate sau se pot înregistra şi semne de punctuaţie solitare sau chiar litere solitare.
     Aşa cum este editat dicţionarul la momentul actual, nu există efecte secundare nedorite.
     Recomandare personală: setare ACTIVĂ


       2.2. Corectare linii de pauză şi linii de dialog
     Opţiunea este implementată pe bază de cod şi rularea automată a două dicţionare: CO_LinP.imd şi CO_LinD.imd [CL_LinP.imd şi CL_LinD.imd]
     CO_LinP.imd ia în calcul liniile de pauză, deci linii indiferent unde s-ar afla în text şi rulează primul, iar CO_LinD.imd se ocupă doar de curăţarea liniilor de dialog, deci are condiţia onligatorie "Început de paragraf" Pi.
     La rularea acestei opţiuni, sunt "curăţate" de răgălii liniile de pauză şi liniile de dialog; altfel spus, se elimină din jurul liniilor de dialog şi liniilor de pauză, diferite caractere recunoscute eronat, indifernt dacă acestea sunt lipite de linii în faţa lor sau după ele sau dacă între linii şi răgălii există spaţiu. Nu se fac modificări acolo unde liniile sunt de tip cratimă şi lipite de litere.
     Efectele negative ale opţiunii sunt minime, de circa două-trei procente.
     Folosirea opţiunii scurtează în foarte-foarte măsură timpul necesar la corectura manuală.
     Cele două dicţionare pot fi îmbunătăţite; se vor urmări cu atebţie condiţiile ce trebuie puse înregistrărilor.
     Recomandare personală: setare ACTIVĂ
     

       2.3. Funcţii obişnuite
     Opţiunea pune în aplicare toate setările care s-au făcut la "Configurare - Punctuaţie - OCR_Plus"
     Problemele au fost tratate detaliat în postarea privind "Configurare - Punctuaţie - OCR_Plus", aşa că nu mai reluăm explicaţiile.
     Recomandare personală: setare ACTIVĂ

       2.4. Corectare suplimentară elipsis
     Elipsis este caracterul asemănător cu trei puncte color=#7FFFD4]…Pi[/color] doar că este un singur caracter şi nu o succesiune de 3 caractere. Este foarte important ca în locul punctelor de suspensie să fie folosit caracterul Elipsis, deoarece în interpretarea unor opţiuni se poate face confuzie între caracterul "punct" şi unul dintre punctele componente de la punctele de suspensie. Discuția s-a purtat pe forum, fapt pentru care nu insist asupra importanţei caracterului Elipsis.
     La opţiunea "2.3. Funcţii obişnuite" se face conversia succesiunii de 3 sau mai multe puncte în Elipsis.
     Această opţiune adaugă în plus alte câteva situaţii, în care succesiunea este compusă din puncte şi virgule în diferite combinaţii, aşa ca în exemplele următoare:
     ,..  .,.  ..,  ,,.  ,.,  .,,  ....  ,...  ,…  .,..  ..,.  ...,  …,  ,,..  ,.,.  ,..,  .,,.  .,.,  ..,,
     Toate aceste combinaţii sunt transformate într-un singur caracter Elipsis.
     Recomandare personală: setare ACTIVĂ


       2.5. Conversie combinaţii ? ! şi . ,
     Există situaţii în care caracterul ? este însoţit în mod eronat de un caracter punct sau de un caracter virgulă.
     Punctul sau virgula sunt lipite de caracterul ? înainte sau după el, astfel: .?  ,?  ?.  ?,
     Acelaşi lucru este posibil şi cu caracterul !. Exemplu: .!  ,!  !.  !,
     Punctul sau virgula din aceste situaţii sunt la origine mici pete de imagini determinate de vechimea hârtie sau textura de slabă calitate a hârtiei, ori din alte morive. Practic aceste puncte sau virgule nu există în textul original şi ar trebui eliminate.
     În principiu, la rularea acestei opţiuni, punctul sau virgula lipită de ? sau de ! sunt eliminate, astfel că:
        .?  ,?  ?.  ?,     se transformă în      ?
        .!  ,!  !.  !,       se transformă în      !
     Opţiunea are o fereastră de setare a combinaţiilor.
     Aceasză opţiune este implementată în ultima perioadă, astfel că nu au fost făcute foarte multe teste.
     Recomandare personală: setare ACTIVĂ cu activarea tuturor situaţiilor din setare, dar şi urmărirea pe cât posibil a efectelor opţiunii asupra textului.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 3. CONVERSIE TEXT CLASIC ÎN TEXT CONTEMPORAN


     Aceasta opţiune este implementată în AutoCorect oficial încă de la apariţia primelor versiuni şi se află ca opţiune independentă în meniu la Editare --> Conversie text clasic în text contemporan.
     Deoarece opţiunea este folosită frecvent în curăţarea OCR, s-a convenit ca ea să fie accesată şi din acest meniu şi să poată fi rulată automat în cadrul meniului OCR_Plus.
     Practic, opţiunea înlocuieşte formele < sînt, sîntem, sînteţi > cu < sunt, suntem, sunteţi > şi înlocuieşte litera < î > din interiorul cuvintelor cu litera < â >.
     Opţiunea funcţionează astfel încât să nu afecteze scrierea cu < î > în interiorul cuvintelor compuse, astfel că nu face înlocuirea lui < î > în cazul cuvintelor compuse cu prefixele din imaginea următoare: Vezi imagine
     Înlocuirea NU FACE şi o corectare a cuvintelor, ci doar conversia literei  î >> â şi a celor trei forme sînt.
     Există o singură excepţie: la rularea opţiunii cuvintele < nici o > şi < nici un > se transformă în < nicio > şi < niciun >.
     Pentru repararea unor efecte suplimentare nedorite ale acestei corecţii, au fost făcute câteva înregistrări de forma: nicio singură >> nici o singură; niciunei singure >> nici unei singure; niciun singur >> nici un singur; niciunui singur >> nici unui singur.

     Foarte important!
     Sunt împărţite părerile userilor cu privire la păstrarea textului cu grafia clasică sau convertirea la grafia contemporană.
     Nu încerc să susţin o variantă sau alta, chiar dacă nu mi se pare corect să scriem astăzi aşa cum se scria în urmă cu aproape 20 de ani, dar trebuie avut în vedere că: TOATE DICŢIONARELE CARE RULEAZĂ AUTOMAT ÎN MENIUL OCR_PLUS AU FOST CREATE PENTRU ERORI CARE APAR LA TEXTE ÎN LIMBA ROMÂNĂ CONTEMPORANĂ.
     Aceste dicţionare au fost gândite şi au o anumită logică pentru erori ce apar la texte în varianta Contemporană. Pentru varianta Clasic s-a făcut doar o înlocuire simplă a literei < â > cu < î > în înregistrări. Este posibil ca unele înregistrări în varianta Clasic să nu producă efecte.

     În concluzie, cine doreşte să beneficieze de toate facilităţile meniului OCR_Plus trebuie să activeze această opţiune.
     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 4. CORECTARE CARACTERE REPRODUSE ERONAT


       4.1. Corectarea majusculelor încorporate
       4.2. Corectarea literelor l, d şi m reproduse eronat
       4.3. Corectare cuvinte foarte scurte
       4.4. Corectarea minuscule la început de paragraf
       4.5. Convertire majusculă în minusculă în dialog francez
       4.6. Înlocuire secvenţe cuvinte




     Când spunem erori de OCR, cel mai adesea ne referim la erori de recunoaştere a caracterelor.
     Există caractere asemănătoare ca formă, precum cifra 1 sau semnul de punctuaţie ! şi litera L mic, cifra 0 şi litera O, grupul c+l şi litera d, grupul r+n şi litera m, caracterele $ sau § şi litera Ş, confuzii între literele e şi c...
     Erori de OCR sunt şi rocade de două litere alăturate, astfel că grupul et poate fi reprodus ca te... şi multe alte erori în care în locul unui caracter, Abbyy "recunoaşte" un alt caracter.
     Unele erori sunt date de insuficienţa înregistrărilor în dicţionarul de limba română la care Abbyy are acces.
     Acest pachet de opţiuni încearcă să rezolve o parte din aceste erori.
     Pachetul se bazează în principal pe rularea automată a unui număr mare de dicţionare de tip OCR_Plus.
     În acest moment pachetul în totalitatea lui rulează 12 dicţionare cu peste 4600 de înregistrări. Mai sunt în lucru alte câteva dicţionare de secvenţe care nu au fost definitivate şi implementate.
     Este posibil ca în perioada următoare pachetul să mai fie îmbunătăţit şi cu alte opţiuni, dar acest lucru nu va complica modul de lucru al utilizatorului, deoarece opţiunile au un element comun - rularea automată de dicţionare care fac înlocuiri de cuvinte sau secvenţe de cuvinte.
     Practic toate opţiunile din pachet ar putea fi comprimate în una singură, numită "Corectare caractere reproduse eronat". A fost aleasă varianta divizării în mai multe opţiuni pentru ca numele acestora să sugereze şi categoriile de înlocuiri pe care o anume opţiune le face.
     O caracteristică un pic aparte o are opţiunea 4.5. Convertire majusculă în minusculă în dialog francez, pe care o vom sublinia la momentul respectiv.

     Pentru ca utilizatorul să fie convins de necesitatea rulării acestor opţiuni şi să nu aibă reţineri la activarea lor, pe motiv că ele ar produce efecte secundare nedorite, vom descrie în detaliu fiecare opţiune în parte.

     E posibil ca explicaţiile să fie ceva mai lungi decât la alte opţiuni, astfel că am ales varianta ca unele dintre opţiuni să fie tratate în câte o postare separată. Este mai uşor de urmărit o postare care nu este foarte lungă şi este mult mai uşor de editat şi modificat.


       4.1. Corectarea majusculelor încorporate

     Termenul de majusculă încorporată se referă [în acest caz] la scrierea eronată cu una sau mai multe litere majuscule în interiorul unor cuvinte ce trebuie să conţină doar litere minuscule.
     Există câteva litere care au aceeaşi formă, atât în forma majusculă, cât şi în forma minusculă.
     Este vorba despre literele C, J, O, P, S, Ş, U, V, W,  Z, care seamănă până la identificare cu forma lor minusculă: c, j, o, p, s, ş, u, v, w, z.
     În cazul acestor litere, între majusculă şi minusculă există doar diferenţă de mărime.
     Din acest motiv Abbyy poate face confuzii între minuscula şi majuscula unei litere, fapt pentru care pot rezulta OCR, care au litere majuscule în interiorul cuvintelor scrise cu minuscule.

     Iată ultima frază scrisă în acest mod:
     Din aCeSt mOtiv Abbyy pOate faCe cOnfUzii între minUSCUla şi majUSCUla unei litere, fapt pentrU care pOt rezUlta OCR, care aU litere majUSCUle în interiOrUl CUvintelOr SCriSe CU minUSCUle.

     Opţiunea rulează pe bază de cod şi rezolvă situaţii din cele menţionate mai sus.
     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
       4.2. Corectarea literelor l, d şi m reproduse eronat

     Opţiunea rulează automat următoarele 5 dicţionare:
           – CO_L1.imd, CO_L2.imd şi CO_L3.imd – pentru corecţiile: cifra 1 >> L mic, ! >> L mic şi cifra 0 >> litera O.
           – CO_Gcl.imd – pentru corectarea: grupul c+l >> litera d.
           – CO_Grn.imd – pentru corectarea: grupul r+n >> litera m.

     Să analizăm pe rând fiecare grupă de erori.

     Cifra 1 în locul literei l [L mic]
     La marea majoritate a fonturilor de tip serif, cifra 1 şi litera L mic sunt foarte asemănătoare. Fontul Bookman Old Style le reproduce identic, iar în Times New Roman [font folosit frecvent la tipărirea cărţilor] sunt foarte asemănătoare; pentru detalii despre fonturi serif şi sans serif, vezi imagine aici şi detalii suplimentare aici.
     Abbyy face frecvent această confuzie şi scrie cifra 1 în loc de litera l [L mic] în situaţiile în care litera L mic este lipită de cratimă, indiferent dacă este vorba de cratimă înaintea literei sau cratimă după litera L mic. Abbyy crede că respectiva cratimă este semnul "minus" din matematică, iar litera L mic este cifra 1; în concluzie, cratimă lipită de litera L este considerat a fi "unu minus..." sau "minus unu".
     Există un număr mic de useri începători care fac corectura cap-coadă a unui text şi nici nu realizează că textul lor conţine un mare număr de caractere "cifra 1" acolo unde trebuia să fie L mic.
     Cifra 0 în locul literei O [mic sau mare]
     Cauzele apariţiei unor astfel de situaţii sunt similare celor de la cifra 1 >> litera L mic. Subliniiez că cifra 0 neînspţită de alte semne este corectată ca fiind litera O mare, iar cifra 0 lipită de liniuţe este modificată ca fiind litera O mic din compunerea unui cuvânt cu cratimă.
     Semnul exclamării în locul literei l [L mic]
     Semnul exclamării poate fi reprodus de Abbyy în locul literei L mic, atunci când baza literei L mic nu este clar reprodusă în carte, ca urmare a unui tipar defectuos sau uzura în timp [ştergerea merginilor literei, "găurirea" literei. Pentru corectarea ! >> l nu au fost luate în calcul situaţiile în care litera L mic ocupă poziţia finală în cuvânt, ci doar dacă după semnul ! urmează cel puţin o literă mică.

     Toate aceste situaţii sunt corectate prin rularea dicţionarelor CO_L1.imd, CO_L2.imd şi CO_L3.imd, respectiv CL_L1.imd, CL_L2.imd şi CL_L3.imd pentru AC Clasic.
     În principiu, la acest moment, dicţionarele sunt structurate astfel: L1 cuprinde cuvinte întregi, L2 cuprinde secvenţe de sfârşit de cuvânt şi L3 cuprinde secvenţe de început de cuvânt. Faţă de această structură există şi înregistrări care fac excepţie: este vorba de înregistrările care converteşte semnul ! în L mic, şi care deşi nu sunt cuvinte întregi, ci secvenţe de două caractere, au fost înregistrate în primul dicţionar.
     Variante de dicţionare cu acest rol au început să fie editate şi rulate în AutoCorect în urmă cu peste doi ani. Actualele dicţionare au la bază acele dicţionare care au fost îmbogăţite şi perfecţionate de-a lungul timpului. Erorile constatate sau reclamate de diverşi useri de-a lungul timpului au fost eliminate sau corectate.
     În mod sigur dicţionarele nu sunt perfecte şi necesită îmbunătăţire permanentă, dar în ultima perioadă nu au fost constatate sau raportate efecte secundare importante.
     Menţionez că în acest moment există în dicţionarul CO_L3.imd câteva înregistrări care necesită confirmare la rulare. Acest lucru este neplăcut pentru utilizator deoarece rularea automată a meniului poate fi întreruptă şi programul [dacă găseşte astfel de situaţii în textul de corectat] să aştepte confirmarea pentru a rula mai departe.
     Viitoarea versiune de dicţionare, aflată acum în lucru, încearcă să elimine la maxim condiţia de confirmare; la dicţionarele care vor rula la această opţiune va fi eliminată complet condiţia de confirmare a înlocuirilor.

     Succesiunea de litere c l în locul literei d şi succesiunea de litere r n în locul literei m
     Litera d [D mic] poate fi confundată de Abbyy cu succesiunea de litere c+l < cl >; uneori confuzia se poate face şi în sens invers.
     Astfel de confuzii se pot face şi între litera m [M mic] şi succesiunea de litere r+n < rn >.
     Se poate urmări asemănarea dintre succesiunile şi literele menţionate în imaginea cl=d şi rn=m
     Dicţionarul CO_Gcl.imd realizează o serie de corecţii ale succesiunii cl >> d pentru cuvinte cu frecvenţă mai mare în limba română.
     Dicţionarul CO_Grn.imd realizează corecţii ale succesiunii rn >> m.

     Din testări rezultă că astfel de confuzii se produc mai mult în cazul cuvintelor scurte şi mai rar în cazul cuvintelor lungi.
     Există şi câteva cuvinte la care nu se pot face modificări automate, deoarece sunt valabile în limba română atât cuvintele care conţin litera d, dar şi succesiunea cl, cum ar fi cele din exemplul următor:
          clacă - dacă; clar - dar; clin - din; clădea - dădea.
     Astfel de cuvinte au fost trecute în dicţionarele cu variante şi confirmare care rulează la opţiunea 12.2
     Pentru succesiunea rn >> m există noi înregistrări care vor fi cuprinse în noua versiune de dicţionare.

     Menţionez că dicţionarele pot fi şi trebuie să fie îmbunătăţite cu alte înregistrări; la acest moment ele pot rezolva majoritate confuziilor de tip cl >> d   şi   rn >> m.
     La rularea dicţionarelor nu am constatat efecte secundare nedorite.
     În principiu, dicţionarele de la întregul pachet de opţiuni sunt gândite să realizeze cât mai multe corecturi, fără a face modificări nedorite. Atunci când o anume înregistrare ar fi putut produce efecte secundare nedorite, am preferat să nu fac înregistrarea respectuvă în dicţionar.

     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
       4.3. Corectare cuvinte foarte scurte

     Opţiunea rulează automat următoarele 4 dicţionare: CO_Sc1.imd, CO_Sc2.imd, CO_Sc3.imd şi CO_Sc4.imd
     Dicţionarele corectează erori de recunoaştere care apar la cuvinte foarte scurte, de până la 4 litere inclusiv.
     Există ca excepţie şi un număr foarte-foarte mic de înregistrări care se referă la cuvinte formate din cinci litere.
     Pentru dezvoltatori, menţionez că structura dicţionarelor nu este respectată ferm, dar în principiu se poate menţiona că dicţionarul CO_Sc1.imd face corecţii atât pentru cuvinte întregi formate din două litere, dar şi pentru câteva secvenţe de câte două litere aflate la început sau la sfârşit de cuvinte; dicţionarul cuprinde şi situaţii foarte rare, dar posibile, în care litera "Ş" este recunoscută ca "$" sau "§", iar litera "E" este recunoscută ca "Ł".
     Dicționarele CO_Sc2.imd, CO_Sc3.imd şi CO_Sc4.imd corectează numai cuvinte întregi formate din 3 sau 4 litere.
     Toate cele 4 dicţionare cuprind înregistrări de cuvinte cu şi fără cratimă.
     Posibilitatea de realizare a unor înlocuiri nedorite este teoretic imposibilă.

     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
       4.4. Corectarea minuscule la început de paragraf

     Opţiunea rulează automat dicţionarul CO_Midp.imd [CL_Midp.imd], care cuprinde aproape 2000 de înregistrări.
     Practic, opţiunea realizează majusculări şi corecturi suplimentare faţă de cele realizate la opţiunea 2.3 Punctuaţie >> Funcţii obişnuite.
     Efectul este maxim dacă la setarea punctuaţiei se activează opţiunile ca în imaginea următoare de mai jos.
     Activarea mai multor opţiuni de setare faţă de cele activate în imagine nu este recomandată, deoarece se vor realiza majusculări în plus în poziţii de text în care majuscularea este incorectă.



     Dicţionarul execută două categorii de înlocuiri:
          – Majuscularea unor litere care au atât în varianta majusculă cât şi în cea minusculă formă identică. Următoarele litere  c-C;  î-Î;  j-J;  o-O;  p-P;  s-S;  ş-Ş;  u-U;  v-V;  x-X;  y-Y;  z-Z   se majusculează doar dacă ele apar ca prima literă după linia de dialog.
     Nu recomand dezvoltarea dicţionarului cu înregistrări care să realizeze majuscularea acestor litere în alte situaţii.

          – Un număr de circa 650 de cuvinte care încep cu litera Î şi sunt recunoscute în mod eronat ca începând cu litera I, se corectează în următoarele 3 situaţii: la început de paragraf, la început de dialog şi la începutul unei fraze [care începe după frază terminată cu PUNCT],  aflată în interiorul paragrafului.

     La editarea dicţionarelor s-a urmărit evitarea înregistrării paronimelor [cuvinte care au atât varianta corectă care începe cu Î, cât şi variantă corectă care începe cu I, ca de exemplu Între - Intre].
     Posibilitatea de realizare a unor înlocuiri nedorite, în forma actuală a dicţionarului, este teoretic imposibilă.

     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
       4.5. Înlocuire secvenţe cuvinte


     Opţiunea rulează automat următoarele 6 dicţionare:
     CO_SInc1.imd – CO_SInc2.imd – corectează secvenţe de început de cuvânt;
     CO_SMed1.imd – CO_SMed2.imd – corectează secvenţe de la mijlocul cuvântului [medii];
     CO_STer1.imd – CO_STer2.imd – corectează secvenţe de sfârşit de cuvânt [terminale].

     Prin noţiunea de "secvenţă de cuvânt", în sensul prezentei opţiuni, se înţelege o succesiune de litere aflate la începutul, la mijlocul sau la sfârşitul cuvântului.
     
     S-a notat cu "SInc" - secvenţele aflate la începutul cuvintelor, cu "SMed" - secvenţele aflate în interiorul cuvântului [SMed = secvenţe mediane] şi cu "STer" - secvenţele aflate la sfârşitul cuvintelor [STer = secvenţe terminale]. Numele nu sunt, probabil, cele mai inspirate, dar au fost alese astfel pentru a păstra o ordine alfabetică a lor.

     Pentru a înţelege mai bine rolul acestei opţiuni, e bine să discutăm câteva exemple de secvențe:
     Secvențe de început: aplee >> aplec. Există circa 90 de cuvinte care încep cu secvenţa aplec, printre care: aplec, apleca, aplecai, aplecam, aplecară, aplecarăm, aplecarăţi, aplecare, aplecarea… aplecător, aplecători, aplecătorii, aplecătorilor, aplecătorul... aplecuşurilor, dar nu există niciun cuvânt care să înceapă cu secvenţa aplee.
     Secvențe mediane: bcg >> beg. Există peste 300 de cuvinte care conţin secvenţa [succesiunea] beg, dar nu există niciun cuvânt care să conţină secvenţa bcg. Dicţionarele conţin foarte multe înregistrări care modifică litera c aflată între consoane cu litera e între consoane; de asemenea multe situaţii în care litera L mic aflată între consoane a fost modificată cu litera i între două consoane.
     Fiecare secvenţă, înainte de a fi înregistrată, a fost verificată dacă există sau nu în componenţa cuvintelor aflate în dicţionarele limbii române pe care le încarcă AutoCorect în folderul de instalare.
      Secvențe de sfârşit: lulul >> lului. Există peste 5100 de cuvinte care se termină cu secvenţa [succesiunea] lului, dar nu există niciun cuvânt care să se sfârşească cu secvenţa lulul. Şi la editarea acestor dicţionare, ca de altfel la marea majoritate a înregistrărilor, fiecare secvenţă, înainte de a fi înregistrată, a fost verificată dacă există sau nu în componenţa cuvintelor aflate în dicţionarele limbii române pe care le încarcă AutoCorect.

     Foarte important:
     Opţiunea este relativ de curând implementată, fapt pentru care unele dintre dicţionare sunt la început de drum. Dicţionarele SMed1 şi SMed2 sunt relativ complete, dar pot fi dezvoltate cu mare atenţie, astfel ca secvenţele propuse modificării să nu provoace înlocuiri nedorite.
     Dicţionarele care fac înlocuiri ale secvenţelor de început [SInc1 şi SInc2] şi cele care fac înlocuiri ale secvenţelor de sfârşit [STer1 şi STer2] conţin foarte puţine înregistrări şi este necesară îmbogăţirea și perfecționarea lor. 


     Comentariu:
     În legătură cu modificările care se realizează la această opţiune şi la opţiunea următoarea, se cuvine să facem un scurt comentariu:

     Înlocuirile de cuvinte întregi au avantajul că au o corectitudine maximă, iar efectele secundare sunt practic imposibile.
     Dezavantajul în cazul înlocuirii cuvintelor întregi este faptul că probabilitatea existenţei în text a erorilor de acest gen este relativ mică.
     De exemplu, în cazul înlocuirii imponderabilitatc >> imponderabilitate corectitudinea este de 100%, iar efectele secundare sunt zero. Probabilitatea ca acest cuvânt să existe în text în această formă este foarte mică.

     Înlocuirile de secvenţe de cuvinte au dezavantajul că pot produce uneori efecte secundare nedorite, dar au avantajul că frecvenţa lor în text este mult mai mare şi se vor face mult mai multe înlocuiri.
     De exemplu, secvenţa finală oarc >> oare poate fi valabilă pentru circa 3787 de cuvinte din limba română. Partea neplăcută este că uneori şi secvenţa finală carc poate fi recunoscută în mod eronat în forma oarc, deci înlocuirea de mai sus nu prezintă corectitudinea de 100%.

     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
       4.6. Corectare cuvinte întregi şi expresii

     Opţiunea rulează automat următoarele 5 dicţionare:
     CO_CImf1.imd – CO_CImf3.imd – corectează cuvinte întregi;
     CO_Expr1.imd – CO_Expr2.imd – corectează grupuri de cuvinte [expresii].

     Această opţiune, ca şi cea anterioară este implementată în ultima perioadă, fapt pentru care dicţionarele cuprind un număr relativ mic de înregistrări, faţă de posibilităţile reale. De aceea este necesară îmbunătăţirea în continuare a acestor dicţionare.
     Pentru dezvoltatori este relativ simplu de adăugat cuvinte în dicţionarele CO_CImf1.imd – CO_CImf3.imd, dar trebuie să acorde atenţie sporită la dezvoltarea dicţionarelor care conţin grupuri de cuvinte [CO_Expr1.imd – CO_Expr1.imd].

      De ce este necesară o opţiune specială pentru înlocuiri de cuvinte întregi şi expresii?
      Practic, această opţiune face o dezvoltare, o lărgire, a opţiunii 4.3. Corectare cuvinte foarte scurte. La acest moment nu pare să existe o diferenţă foarte clară între tipurile de înlocuiri ale cuvintelor întregi ale celor două opţiuni, dar în timp ce opţiunea 4.3. face corectări ale cuvintelor scurte, de maxim 4 litere, această opţiune, prin dicţionarele sale  CO_CImf1.imd – CO_CImf3.imd, trebuie să realizeze corectări ale cuvintelor mai lungi.

      Dicţionarele care corectează grupuri de cuvinte reprezintă mai mult decât o lărgire a înlocuirilor de cuvinte întregi. Deşi înregistrările fac înlocuiri de grupuri de cuvinte, practic modificarea se face doar asupra unui singur cuvânt din grup, celelalte cuvinte având rolul de coordonate în căutarea cu precizie a cuvântului de înlocuit.
      Cuvintele ce sunt corectate se pot modifica prin varianta înlocuire cu confirmare, dar această metodă solicită mai mult timp pentru rezolvare, precum şi intervenţia utilizatorului la fiecare cuvânt găsit.

      Există câteva paronime întâlnite frecvent în OCR-uri care necesită corectare, aşa cum ar fi de exemplu: sting-stâng, stingi-stângi, stingă-stângă, lingă-lângă, intre-între.
      Abbyy recunoaşte ambele variante de cuvinte în forma scrisă cu litera "i", deci: sting, stingi, stingă, lingă, intre; menţionez că în text au frecvenţă mai mare exact celelalte cuvinte, adică: stâng, stângi, stângă, lângă, între.
      Dacă s-ar face înregistrarea sting >> stâng, înlocuirea cuvântului "sting" cu cuvântul "stâng" ar trebui confirmată sau respinsă pentru fiecare înlocuire în parte. Făcând înregistrări de grupuri de cuvinte de forma: picior/piciorul/piciorului sting >> picior/piciorul/piciorului stâng, umăr sting >> umăr stâng... atunci înlocuirea se poate face automat, fără confirmare. Pentru cuvintele lingă-lângă şi intre-între, mai întâi s-au făcut înlocuirile lingă >> lângă şi intre >> între, după care au fost făcute înlocuiri în expresii de două până la cinci cuvinte, astfel încât înlocuirile să se facă fără confirmare şi cât mai sigur.

     În afara acestor paronime, Abbyy face uneori confuzii de recunoaştere între cuvintele "ele" şi "de". În cazul acestor cuvinte confuzia poate exista sau nu, iar atunci când există, este frecventă folosirea cuvântului "ele" în locul lui "de".
     Prin folosirea înregistrărilor de tipul: faţă ele >> faţă de; faţă ele >> faţă de; formă ele >> formă de; la un pas ele >> la un pas de, numărul de situaţii ce trebuie corectate manual se reduce foarte mult.

     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
       4.7. Convertire majusculă în minusculă în dialog francez

     Opţiunea se bazează pe rularea automată a dicţionarului CO_DFr.imd.
     Această opţiune funcţionează la pachet cu o setarea din Configurarea Punctuaţiei OCR Plus. Este vorba despre setarea din imaginea următoare:



     Dacă se activează setarea "Majusculă la început de frază – după ! şi ? urmat de spaţiu", se vor majuscula toate cuvintele care încep după semnele "!" şi "?", inclusiv în poziţiile din text în care majuscularea este incorectă [poziţiile cunoscute ca fiind dialog francez].
     Din acest motiv [pentru că se majusculează şi situaţiile în care textul trebuie scris cu minusculă] este obligatorie activarea aceastei opţiuni "4.7. Convertire majusculă în minusculă în dialog francez", care va rula dicţionarul CO_DFr.imd.

     Dicţionarul face corecţii de genul:
          ! Îi spuse >> ! îi spuse;  ! Îi strigă >> ! îi strigă;  ! Îi şopti >> ! îi şopti;  ! Îi vorbi >> ! îi vorbi;  ! Îi zise >> ! îi zise.
          ? Îi spuse >> ? îi spuse; ? Îi strigă >> ? îi strigă;  ? Îi şopti >> ? îi şopti;  ? Îi vorbi >> ? îi vorbi;  ? Îi zise >> ? îi zise.

     Dacă la Configurarea Punctuaţiei OCR Plus nu se activează setarea "Majusculă la început de frază – după ! şi ? urmat de spaţiu", atunci nu este nevoie să ruleze opţiunea de faţă. Este posibil ca în această situaţie să rămână câteva situaţii care vor necesita majusculare, dar acest lucru se va putea face manual cu ocazia corecturii.

     În concluzie:
          – Dacă la Configurarea Punctuaţiei OCR Plus activăm setarea "Majusculă la început de frază – după ! şi ? urmat de spaţiu", atunci este obligatorie activarea opţiunii "4.7. Convertire majusculă în minusculă în dialog francez".
          – Dacă la Configurarea Punctuaţiei OCR Plus nu activăm setarea "Majusculă la început de frază – după ! şi ? urmat de spaţiu", atunci nu vom activa nici opţiunea "4.7. Convertire majusculă în minusculă în dialog francez".

     Care este varianta cea mai bună?
     Părerile sunt împărţite: useri cu experinţă în corectură preferă să nu activeze aceste opţiuni şi să execute eventualele majusculări în mod manual, iar alţi useri cu experinţă în corectură adoptă varianta activării ambelor opţiuni.
     Ceea ce pentru un utilizator al programului pare mai comod şi mai uşor, pentru alt utilizator poate părea greoi şi dificil şi invers.

     Cel mai bine este ca fiecare user să-şi stabilească varianta preferată.
     Pentru a stabili varianta optimă este bine să se facă testări în ambele variante, prin ceea ce vom numi "Test 100", adică testarea a o sută de pagini de carte.
     Se alege un text de maxim 100 de pagini de carte, se prelucrează separat în cele două variante şi apoi prin vizualizarea textelor rezultate [se face o vizualizare foarte atentă, dar fără a face o corectură prin citire cuvânt cu cuvânt], se stabileşte varianta care pare mai comodă.

     Menţiune importantă:
     Există 8 înregistri care ar trebui să ruleze în acest dicţionar, dar pentru că necesitau confirmare în mod obligatoriu, au fost mutate în ultimul dicţionar care rulează în cadrul Meniului OCR Plus; este vorba de dicţionarul CO_Var4.imd, iar înregistrările se alflă pe ultimele 8 poziţii ale dicţionarului.
     Aceste înregistrări sunt:
          ! I^_ >> ! i^_    ! Le^_ >> ! le^_    ! O^_ >> ! o^_    ! Se^_ >> ! se^_
          ? I^_ >> ? i^_    ? Le^_ >> ? le^_    ? O^_ >> ? o^_    ? Se^_ >> ? se^_
     Informez utilizatorii că grupul de caractere  ^_  este codul pentru spaţiu.

     Utilizatorii care nu activează opţiunea "4.7. Convertire majusculă în minusculă în dialog francez", când programul va ajunge să ruleze aceste înregistrări cu confirmare vor acţiona asupra butonului "renunţ" pentru fiecare dintre înregistrări pentru ca programul să renunţe la căutări.
     Butonul "Renunţă" ocupă poziţia a treia în fereastra de confirmare, redată în imaginea de mai jos:



Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 5. MARCARE CARACTERE:


       – Marcare ghilimele
       – Marcare apostroafe
       – Marcare consoane independente în format „Spaţiu_Consoană_Spaţiu”
       – Marcare caracterele: ~ & * ( ) \ /
       – Marcare caracterele: ~ & = + $ % Ł # { } [ ] ( ) / \ > < *



     Numele opţiunii este suficient de sugestiv, iar fereastra de setări este foarte clară, astfel că nu va fi nevoie de prea multe explicaţii în legătură cu această opţiune.

     Opţiunea permite utilizatorilor să marcheze prin colorare diferite caractere, pentru a fi mai uşor de urmărit la corectare.
     După cum se poate vedea în imagine, utilizatorul poate marca doar anumite caractere sau toate caracterele implementate în opţiune. Pentru fiecare dintre cele 5 categorii de caractere se poate alege câte o culoare diferită de marcare a fontului, ori se poate alege o singură culoare pentru toate caracterele pe care le dorim a fi marcate.
     De reţinut că marcarea se face prin colorarea fontului şi nu a fundalului.

     Nu se pot face recomandări pentru activarea sau neactivarea opţiunii.
     Pentru unii utilizatori marcarea poate fi benefică, prin scoaterea în evidenţă a unor caractere ce trebuie urmărite; de exemplu, prin marcare se poate urmări mai uşor existenţa perechilor de ghilimele - este posibil ca uneori Abbyy sp nu recunoască ambele ghilimele care formează perechea ci numai unele dintre ghilimele, fie ele de deschodere sau închidere.
     Pentru alţi utilizatori marcarea poate să deranjeze, să atragă mai mult atenţia asupra caracterelor marcate, "sărind" peste alte tipuri de erori ce trebuiesc corectate.
     După corectarea câtorva volume, fiecare utilizator va şti sigur care dintre variante i se "potriveşte" cel mai bine, care variantă [marcarea sau nonmarcarea] i se pare mai comodă.
     Recomand ca şi la această opţiune să se facă ceea ce am numit "Test 100", pentru a stabili care metodă de lucru mare mai comodă.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 6. ŞTERGERE CARACTERE:


       – Eliminare Cratimă semiindependentă ["Cratimă_spaţiu" şi "Spaţiu_Cratimă]
       – Eliminare Apostrof independent ["Spaţiu_ Apostrof _Spaţiu”]
       – Eliminare Artefacte cărţi obişnuite [„Spaţiu_Artefact_Spaţiu”]
       – Eliminare Artefacte cărţi tehnice [„Spaţiu_Artefact_Spaţiu”]



     Opţiunea este oarecum similară cu opţiunea precedentă, doar că de data aceasta anumite caractere [cunoscute şi sub numele de artefacte sau răgălii] sunt şterse şi nu doar marcate.
     De asemenea, numele opţiunii este suficient de sugestiv, iar fereastra de setări este foarte clară, astfel că nu va fi nevoie de prea multe explicaţii privind această opţiune.
     Şi... nici la această opţiune nu există o recomndare clară privind activarea sau nonactivarea opţiunii.

      Este important de reţinut că există două cauze ale apariţiei în text a acestor "răgălii".
         – Prima cauză: unele dintre "răgălii" apar în text fără să existe un caracter asemănător în original; aceste "răgălii" apar ca urmare a unor defecţiuni la scanare, ori ca urmare a unor mici pete pe pagina scanată sau defecţiuni ale texturii hârtiei pe care a fost tipărită cartea. Într-un mod sau altul, automat sau manual, ele vor fi şterse deoarece nu există în text.
         – A doua cauză: o altă categorie de "răgălii" apar în text în locul unor alte caractere asemănătoare; de exemplu: caracterul < j > poate înlocui caracterul < ; >, caracterul < / > poate înlocui caracterul < z >, caracterul < $ > poate înlocui caracterul < ş > etc... etc... În astfel de situaţii este mai uşor de observat locul unde trebuie făcută corectura manuală arunci când se păstrează caracterul "răgălie" în locul respectiv şi se poate "sări" mai uşor peste eroare dacă acel caracter a fost şters.

      Ca şi la opţiunea precedentă, propun executarea "Test 100" pentru ca fiecare utilizator să poată alege varianta de lucru optimă: activarea, activarea parţială sau nonactivarea opţiunii.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 7. Înlocuieşte toate liniile de pauză cu:


       – EmDash
       – EnDash
       – Horizontal Bar.



     Să începem prin a face câteva comentarii în legătură cu "Linia de pauză.

     Prin "Linie de pauză", conform DOOM 2/2010 se înţelege:
        "1.2.5. Linia de pauză [–]
     Este utilizată ca semn ortografic numai în scrierea unor cuvinte compuse complexe (cu caracter mai mult sau mai puţin ocazional) care cuprind cel puţin un cuvânt compus scris cu cratimă: americano–sud-coreean, nord–nord-vest, sud-est–nord-vest.
     În această situaţie nu este precedată sau urmată de blanc."
     În nota de subsol nr. 39, de la  pagina XLIII se arată:  Linia de pauză este "Plasată aproximativ la jumătatea înălţimii rândului. Numită şi pauză. Este mai lungă decât cratima. Este şi semn de punctuaţie."

     În realitate, în sensul acestei opţiuni, nu este vorba de Linia de pauză tratată de DOOM 2, ci de o altă liniuţă, cunoscută şi sub numele de "Linie explicativă" sau "Cratima mare". Această linie este precedată şi urmată de blanc [spaţiu] şi se foloseşte în următoarele două situaţii:

          ■ Linia explicativă care marcheză [separă] comentariul autorului de vorbele unui personaj, într-un dialog, exemplu:
     — De altfel – adăugă ea, coborând vocea – va fi un prieten în plus la caz de nevoie.
     — Nu sunt un om învăţat – adăugă el – şi nu mi-e ruşine s-o mărturisesc.
     Comentariu autorului într-un dialog poate fi marcat prin încadrarea între linii explicative sau prin încadrarea între virgule; nu se folosesc în acelaşi text ambele variante.

          ■ Linia explicativă care introduce un comentariu, o explicaţie şi care poate fi înlocuită cu paranteze, ca în exemplul următor:
     Tocmai atunci vânătorul, făcând un gest cu mâna – ca şi cum ar fi anunţat că cedează – rosti în engleză, parcă vorbind cu sine însuşi:
această frază ar putea fi scrisă şi în varianta în care se folosesc paranteze în locul liniilor explicative, astfel:
     Tocmai atunci vânătorul, făcând un gest cu mâna (ca şi cum ar fi anunţat că cedează ), rosti în engleză, parcă vorbind cu sine însuşi:          

     Recomand ca liniile de pauză să fie marcate cu EnDash, aducând următoarele argumente:
       – argumentul 1 – DOOM 2/2010 spune că Linia de pauză "Este mai lungă decât cratima".
       – argumentul 2 – în Word, atunci când facem editare şi introducem linia explicativă folosind cratima încadrată de spaţiu, editorul o transformă automat în EnDash.
       – argumentul 3 – argument estetic: EnDash are lăţimea unui caracter obişnuit şi arată elegant ca linie de pauză, timp în care cratima este prea mică şi se pot produce confuzii, iar EmDash încadrat de spaţii este neelegant şi mult prea mare. Este adevărat că în limba engleză linia de pauză este redată prin Emdash, dar în acest caz linia este lipită de cuvintele alăturate.
       – argumentul 4 – nu este indicat a se folosi Horizontal Bar pentru a marca liniile de pauză, deoarece pe multe eReadere, dar şi în unele editoare, caracterul nu este redat corespunzător, ci este înlocuit cu semnul întrebării sau cu pătrăţel.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 8. Înlocuieşte toate liniile de dialog cu:


       – EmDash
       – EnDash
       – Horizontal Bar.



     Recomand ca liniile de dialog să fie marcate cu EmDash, aducând următoarele argumente:
       – argumentul 1 – Prin prelucrările făcute de opţiunea "2.2. Corectare linii de pauză şi linii de dialog", teoretic toate liniile de dialog sunt deja convertite în Emdash. Păstrarea în continuare a liniilor de dialog sub forma caracterului EmDash reduce aproape de zero timpul de rulare a opţiunii, timp în care modificarea liniilor de dialog cu alt caracter măreşte timpul de rulare, deoarece uneori sunt mii de linii de dialog într-un text şi programul trebuie să realizeze căutarea şi modificarea fiecărei linii în parte.
       – argumentul 2 – Linia de dialog nu poate fi redată prin cratimă; acest lucru ar fi incorect din toate punctele de vedere şi este complet inestetic.
       – argumentul 3 – Linia de dialog nu poate fi redată prin EnDash, deoarece linia de dialog trebuie să fie diferită şi mai mare decât linia de pauză.
       – argumentul 4 – Deşi liniile de dialog de tip Horizontal Bar arată foarte elegant, linia de dialog nu poate fi redată prin Horizontal Bar, deoarece pe multe eReadere, dar şi în unele editoare, caracterul nu este redat corespunzător, ci este înlocuit cu semnul întrebării sau cu pătrăţel.
       – argumentul 5 – în regulile tipografice se arată că linia de dialog trebuie să aibă lăţimea a două caractere obişnuite; liniile care îndeplinesc această condiţie sunt Horizontal Bar şi EmDash; am explicat mai sus de ce nu se poate folosi Horizontal Bar, deci singura linie care îndeplineşte toate condiţiile este EmDash.

     Părerea mea personală este că nu trebuie să ne facem mari probleme în alegerea tipului de liniuţă în această etapă a corecturii, deoarece liniile de dialog, ca şi liniile de pauză, pot fi oricând înlocuite prin comenzi foarte simple de Find&Replace în Word sau alt editor.
     Stabilirea tipului de linie de dialog, ca şi înlocuirea spaţiului de după linia de dialog cu spaţiu neseparator, ţin mai degrabă de formatarea finală a unui document corectat decât de precorectura unui OCR.

     Notă: Dacă dorim să printăm pe hârtie un text [o carte] care conţine linii de dialog, atunci recomand ca liniile de dialog să fie înlocuite cu Horizontal Bar, deoarece textul tipărit astfel arată elegant. Dacă documentul nu este destinat tipăririi, ci folosirii şi/sau prelucrării şi corectării de alte persoane, atunci vom folosi EmDash.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 9. Elimină linii de pauză exclusiv din Dialoguri:


       9.1. – Înlocuieşte "Spaţiu_LiniePauză_Spaţiu" în "Virgulă_Spaţiu".
       9.2. – Elimină virgula de după semnul de exclamare/întrebare.
       9.3. – Înlocuieşte "Spaţiu_ LiniePauză _Virgulă_Spaţiu" în "Virgulă_Spaţiu"


          ■ 10. Elimină TOATE liniile de pauză din text


       10.1. – din "!_Spaţiu_ LiniePauză_Spaţiu" în "!_Spaţiu"
       10.2. – din "?_Spaţiu_ LiniePauză_Spaţiu" în "?_Spaţiu"
       10.3. – din "Spaţiu_ LiniePauză_Spaţiu" în "Virgulă_Spaţiu"
       10.4. – din "Spaţiu_ LiniePauză_Virgulă_Spaţiu" în "Virgulă_Spaţiu"




     Apreciez că aceste două opţiuni pot fi tratate împreună, deoarece au caracteristici comune.
          – Ambele opţiuni se referă la eliminarea liniilor de pauză din text şi înlocuirea lor, după caz, cu virgulă, ori doar eliminarea fără a fi înlocuite cu un caracter anume.
          – Ambele opţiuni sunt opţiuni pretenţioase şi de înaltă fineţe. Practic modificările pe care le fac aceste opţiuni nu ţin de simpla curăţare a unui text de tip OCR, ci realizează o modificare importantă a modului de editare a textului. Acest drept nu e recomandat să fie folosit de un simplu utilizator care încearcă să reproducă o carte din format clasic tipărit în format electronic, ci este dreptul editorilor de carte, al traducătorilor şi autorilor de carte.

     Recomand utilizatorilor, în special celor cu experienţă redusă, să nu activeze niciuna dintre aceste opţiuni.
     Eventuala activare a acestor opţiuni sau doar a uneia dintre ele să fie făcută doar după o profundă analiză şi doar de utilizatorii cu experienţă care ţin neapărat să facă astfel de modificări.

     Recomandare personală: setare INACTIVĂ   pentru ambele opţiuni.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 11. RULARE GRUP DE DICŢIONARE ÎNLOCUIRE MULTIPLĂ





     Această opţiune este una specială şi trebuie analizată în detaliu.
          – Opţiunea permite rularea unui număr nelimitat de dicţionare personale, altele decât cele 32 de dicţionare care rulează obligatoriu în cadrul meniului.
          – În funcţie de experienţa acumulată în corectura textelor, de aptitudinea de a remarca înlocuirile utile şi aceea de structurare şi editare a dicţionarelor, fiecare utilizator poate edita şi rula în cadrul acestei opţiuni un număr nelimitatt de dicţionare cu un număr nelimitat de înregistrări. Noile condiţii ce le oferă fereastra de editare a dicţionarelor de înlocuire multiplă dau posibilitatea realizării de dicţionare deosebit de complexe, de mare funcţionalitate.
          – Modul de folosire a acestei opţiuni poate face diferenţa dintre doi utilizatori ai programului şi, respectiv diferenţa de calitate a curăţării unui text.

     La acest moment există circa 30 de dicţionare puse la dispoziţia utilizatorilor sub forma a două arhive, numite "Dicţionare Uzuale" şi "Dictionare Cifre romane". Dicţionarele sunt structurate pe litere, dar unele dintre ele au foarte puţine înregistrări. Toate aceste dicţionare pot şi trebuie să fie îmbunătăţite prin adăugarea de noi înregistrări. Practic, îmbunătăţirea acestor dicţionare sau a altora este nelimitată. Cu cât se vor adăuga mai multe înregistrări în aceste dicţionare, cu atât textul va fi "curăţat" mai bine.

     Ce dicţionare rulăm în această pţiune? - acest lucru îl stabileşte fiecare utilizator.
     Cum se face adăugarea dicţionarelor ce vor fi rulate în cadrul opţiunii? - acest lucru îl vom clarifica în continuare.

     Activăm [bifăm] opţiunea "11. Rulare grup de dicţionare înlocuire multiplă". Observăm că opţiunea aste prevăzută cu opţiuni de setare. Acţionăm butonul "opţiuni" şi se va deschide o fereastră de setare numită "Rulare dicţionare", ca în imaginea de mai sus.
     În stânga ferestrei trebuie să fie afişată o listă de dicţionare, iar în partea dreaptă a ferestrei, se pot observa poziţionate unele sub altele 5 butoane.

     Mai întâi ne vom referi la butonul al doilea "Adaugă" şi butonul al treilea "Şterge".
     Acţionând butonul "Adaugă" se deschide o fereastră clasică de deschidere fişiere şi putem adăuga în listă câte un dicţionar sau un grup de dicţionare. Dicţionarele se pot afla în orice loc de pe hard disk, dar am convenit ca dicţionarele suplimentare să fie salvate în folderul Dicţionare\Dic_Speciale. Vpm adăuga în listă toate dicţionarele pe care le considerăm necesare.
     Acţionând butonul "Şterge" se poate elimina din listă dicţionarele pe care nu dorim să fie rulate. Pentru ştergere nu se pot marca mai multe dicţionare, deci ştergerea dicţionarelor se face ştergând câte un singur dicţionar la fiecare apăsare a butonului "Şterge"
     Important de reţinut: dacă un dicţionar trecut în listă a fost mutat sau redenumit, acest dicţionar trebuie şters şi apoi adăugat la listă de la noua adresă sau cu noul nume, altfel programul nu va găsi dicţionarul aflat în listă şi va da mesaj de eroare.

     La ce folosesc butoanele 4 "Mută sus" şi 5 "Mută jos"?
     Uneori este obligatoriu ca o parte dintre dicţionare să ruleze într-o anumită ordine, deoarece unele înlocuiri pot avea efect doar dacă mai întâi a fost făcută o altă înlocuire. Lista de dicţionare afişată în stânga ferestrei de setare arată şi ordinea de rulare a dicţionarelor. Pentru a modifica ordinea de afişare şi respectiv de rulare a unor dicţionare procedăm astfel: marcăm cu mausul dicţionarul ce trebuie mutat mai sus sau mai jos în listă şi cu ajutorul butoanelor "Mută sus" sau "Mută jos" vom deplasa dicţionarul pe poziţia dorită.

     După stabilirea dicţionarelor ce trebuie rulate şi a ordinii de rulare, acţionăm primul buton, numit "Setează", salvând astfel lista de dicţionare ce vor fi rulate.
     Programul salvează dicţionarele, calea lor de căutare şi ordinea de rulare în fişierul "ListaDictionare.txt" aflat în folderul AutoCorect Contemporan, respectiv AutoCorect Clasic, unde se află şi folderul Dicţionare.
     Deşi nu are legătură cu opţiunea, putem aminti că tot aici se mai află un fişier important, numit "RulareAutomataOCRPlus.txt" în care se salvează opţiunile setate de utilizator ca active, ordinea lor şi opţiunile de setare.
     Aceste salvări se păstrează până la o nouă modificare a setărilor sau o nouă instalare a programului.

     Revenind la problema activării acestei opţiuni, recomandarea este una singură şi fermă: opţiunea trebuie ACTIVATĂ obligatoriu.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ 12. SETĂRI FINALE


       12.1. – Înlocuire spaţiu după linia de dialog cu spaţiu neseparator
       12.2. – Corectare cuvinte rupte şi înlocuiri cu confirmare




     12.1. – Înlocuire spaţiu după linia de dialog cu spaţiu neseparator
     Opţiunea este implementată prin cod, iar numele său este suficient de sugestiv.
     Programul înlocuielte spaţiul obişnuit de după fiecare linie de dialog cu spaţiu neseparator [Nonbreaking Space].
     Rolul înlocuirii este unul estetic.

     Este important de reţinut că această opţiune se poate rula separat [fără accesarea întregului meniu OCR Plus], şi în cazul textelor corectate.
     Prin corectarea manuală este posibil să mai introducem linii de dialog în text, acolo unde nu au fost recunoscute de Abbyy, iar aceste linii de dialog să fie urmate de spaţiu obişnuit.
     Dacă vom avea un text rtf corectat şi accesăm în mod independent numai această opţiune, textul nu va suferi alte modificări, ci se vor face doar înlocuirile spaţiilor obişnuite de după linia de dialog şi doar în poziţiile în care este cazul.

     Sunt câteva opţiuni care se pot accesa separat în orice moment al etapei de corectură şi chiar după corectură, fără a afecta structura textului şi fără a produce modificări ce ar trenui verificate manual.
     De cele mai multe ori este necesară o rulare suplimentară a unora dintre aceste opţiuni după corectarea textului; aceste opţiuni sunt următoarele:
         1.1 Conversii preliminare >> Conversie dialog bullets în dialog text
         1.3 Conversii preliminare >> Eliminare tab şi spaţii multiple
         1.4 Conversii preliminare >> Eliminare spaţii la început de paragraf
         12.1 Setări finale >> Înlocuire spaţiu după linia de dialog cu spaţiu neseparator

     În afara de aceste 4 opţiuni se mai pot rula cu oarece atenţie şi opţiunile din pachetele 7 şi 8.
         7. Înlocuieşte toate liniile de pauză cu >> EmDash / EnDash / Horizontal Bar         
         8. Înlocuieşte toate liniile de dialog cu >> EmDash / EnDash / Horizontal Bar


     12.2. – Corectare cuvinte rupte şi înlocuiri cu confirmare
     Opţiunea se bazează pe rularea a 4 dicţionare de înlocuire multiplă şi a suferit de-a lungul timpului mai multe modificări, fapt pentru care pare atipică, deoarece are două părţi:
           ■ partea care corectează "cuvintele rupte", adică acele cuvinte care apar scrise în mod eronat cu cratimă, ca urmare a faptului că în cartea pe hârtie cuvintele erau despărţite [rupte] la capăt de rând; corectarea acestor cuvinte se bazează pe rularea dicţionarelor CO_Var1.imd ÷ CO_Var3.imd.
           ■ partea care face înlocuiri cu confirmare şi care rulează dicţionarul CO_Var4.imd.


     Corectare cuvinte rupte
     În cartea pe hârtie, respectiv în imaginea scanată a unei pagini, o serie de cuvinte sunt despărţite la capăt de rând. În aceste cazuri avem 3 elemente: prima parte a cuvântului, cratima şi a doua parte a cuvântului. După cum este şi normal, prima parte a cuvântului se află la sfârşit de rând şi este însoţită de cratima care marchează faptul că se face "ruperea" cuvântului; partea a doua a cuvântului ocupă prima poziţie pe rândul următor şi nu este însoţit de cratimă.
      Atunci când Abbyy face extragerea OCR, textul îşi schimbă structura rândurilor, în sensul că rândurile pot fi, de regulă, mai lungi decât cele din cartea originală, astfel că unele dintre cuvintele rupte se vor afla undeva la mijlocul rândului şi în mod corect ele trebuie să fie complete şi fără cratimă, deoarece Abbyy este instruit să lipească cele două părţi ale cuvântului rupt la capăt de rând şi să elimina cratima care marchează despărţirea.
       Abbyy face recunoaşterea corectă a unora dintre aceste cuvinte, în sensul că în OCR cuvântul apare întreg şi fără cratimă; în acelaşi OCR unele recunoaşteri se fac în mod eronat, astfel că respectivele cuvinte apar în text cu cratimă; uneori cratima este lipită de ambele litere, alteori cratima este lipită doar de o parte a cuvântului şi apare inserat un spaţiu între cratimă şi cealaltă parte a cuvântului.

       Să presupunem că pe cartea tipărită, fraza următoare, în care apare cuvântul "trebuincioase", este scrisă astfel:
       "În urma acestei propuneri se apucară amândoi să pregătească cele trebuin-
cioase pentru prânzul zilnic."


       Cuvântul "trebuincioase" poate fi recunoscut de către Abbyy în mod corect, adică în forma:
       "În urma acestei propuneri se apucară amândoi să pregătească cele trebuincioase pentru prânzul zilnic."
sau poate fi recunoscut eronat în varianta cu cratima lipită de ambele părţi ale cuvântului trebuin-cioase,
ori în varianta în care cratima este lipită de o parte a cuvântului dar are inserat spaţiu între cratimă şi cealaltă parte a cuvântului, adică sub forma trebuin- cioase sau sub forma trebuin -cioase.

       Până la acest moment, cele trei dicţionare corectează cuvinte rupte în care cratima este lipită de ambele părţi ale cuvântului; deocamdată nu se fac corecţii pentru cuvinte la care este inserat şi spaţiu lângă cratimă.
       Numărul de înregistrări este încă destul de mic; corecţiile care se fac sunt structurate astfel:

     ■ Cu dicţionarul CO_Var1.imd se fac în principal corecţii ale unor verbe în forma de gerunziu; s-a luat în calcul despărţirea între ultima şi penultima silabă şi despărţirea între penultima şi antepenultima silabă.
     Astfel, pentru cuvinte precum: necăjindu-i, rotunjindu-le, vrăjindu-ne...
s-au făcut înregistrări cu condiţiile "Cuvânt întreg la sfârşit" + "Potrivire perfectă"
        -du-l        du-l          Ci  Sc  Pp   
        -du-le      du-le         Ci  Sc  Pp   
        -du-ne     du-ne        Ci  Sc  Pp   

sau înregistrarea de mai jos care are doar condiţia "Potrivire perfectă"
        -jindu-    jindu-    Pp   

     ■ Dicţionarul CO_Var2.imd corectează cuvinte care au frecvenţă mare în text şi s-au luat în calcul toate posibilităţile de despărţire; Condiţiile sunt "
        dum-neavoastră          dumneavoastră          Ci  Pc   
        dumnea-voastră          dumneavoastră          Ci  Pc   
        dumneavoas-tră          dumneavoastră          Ci  Pc   

     De regulă, la acest dicţionar au fost puse condiţiile: "Cuvânt întreg la ambele capete" + "Păstrează capitalizarea", ceea ce înseamnă că se vor face înlocuiri ale cuvintelor întregi care pot fi scrise atât cu minusculă, cât şi cu majusculă

     ■ Dicţionarul CO_Var3.imd face corecţii pentru cuvinte compuse cu sufixe şi care sunt rupte în zona finală, deci la sfârşit de cuvânt, cum ar fi exemplele de mai jos:
        -bilor          bilor          Ci  Sc  Pp
        -cilor          cilor          Ci  Sc  Pp
        -dilor          dilor          Ci  Sc  Pp
     Ca şi în cazul primului dicţionar, condiţiile folosite sunt  "Cuvânt întreg la sfârşit" + "Potrivire perfectă".


     Înlocuiri cu confirmare
     Dicţionarul CO_Var4.imd, care este şi ultimul ce rulează în cadrul meniului OCR Plus, execută numai modificări cu confirmare. Pentru fiecare situaţie găsită în text de computer care îndeplineşte condiţiile şi poate fi modificată, este necesar acceptul sau refuzul utilizatorului.
     Înregistrările sunt prevăzute cu condiţii speciale, care reduc căutările la situaţii foarte concrete. Astfel, unele căutări se vor face doar între cuvinte scrise cu orice literă minusculă, dar nu şi cifre etc... Aceste condiţii puse înregistrărilor vor fi analizate în mod special atunci când vom discuta modul de editare a dicţionarelor de înlocuire multiplă.

     În principiu, au fost mutate în acest dicţionar toate înregistrările care necesitau confirmare, chiar dacă unele înregistrări ar fi trebuit să ruleze la alte opţiuni. Scopul mutării înregistrărilor a fost acela de a evita întreruperea rulării programului la diferite opţiuni pentru obţinerea confirmărilor; s-a considerat că este mai comod pentru utilizator ca programul să ruleze în mod continuu şi toate intervenţiile utilizatorului să fie făcute în partea finală a procesării.

     Există patru categorii de modificări cu confirmare înregistrate în dicţionar, astfel:

          – cuvinte foarte scurte scrise eronat cu majusculă iniţială sau finală în interiorul frazei:
     Cu >> cu, CU >> cu, Şi >> şi, Un >> un, aI >> al, aI >> ai, Ia >> la, I-a >> l-a, ou >> cu, ou >> eu.
     Aceste situaţii este posibil să nu apară în anumite texte, dar pot exista în altele, în funcţie de calitatea OCR.

          – patru înregistrări ce ţin de corectarea cifrei 1 cu litera L mic şi a cifrei 0 cu litera O mic; cifrele 1 sau 0 trebuie să fie lipite de o cratimă, care la rândul ei este lipită de orice literă mică, dar nu şi de o cifră. Înregistrările au fost mutate din dicţionarele care rulau la opţiunea 4.2 pentru a nu opri rularea programului la acea opţiune pentru cererea confirmărilor.
     —1 >> -l,  -1 >> -l,  —0 >> -o,  -0 >> -o
     Teoretic, înlocuirea cifrelor 1 şi 0 cu literele L mic şi O mic sunt rezolvate în totalitate la opţiunea 4.2. Aceste înregistrări au fost puse pentru situaţii excepţionale, ca o măsură de siguranţă în plus, astfel că în mod normal ele nu ar trebui să apară la rularea opţiunii.

          – perechi de cuvinte asemănătoare ca formă [paronime], care nu pot fi modificate fără confirmare deoarece este posibil ca în text să fie valabilă oricare dintre cele două forme ale cuvântului.
     clacă >> dacă,  clar >> dar,  clin >> din,  clădea >> dădea,  lot >> tot,  lotul >> totul,  miner >> mâner,  minerul >> mânerul.
     Mai mult ca sigur o parte dintre aceste înregistrări, dacă nu chiar toate, vor găsi în text situaţii care îndeplinesc condiţiile căutate, astfel că utilizatorul va trebui să confirme sau să infirme modificările propuse de program.

          – elemente scurte ce ţin de dialogul francez, care nu se pot modifica fără acceptul utilizatorului şi care au fost mutate din dicţionarul de la opţiunea 4.7 pentru a nu întrerupe programul pentru cereri de confirmare.
     ! I >> ! i,  ! Le >> ! le,  ! O >> ! o,  ! Se >> ! se,  ? I >> ? i,  ? Le >> ? le,  ? O >> ? o,  ? Se >> ? se.
     Aşa cum am arătat la opţiunea 4.7, utilizatorii care nu au activat opţiunea 4.7,  pentru aceste 8 înregistrări, în fereastra de confirmare vor acţiona butonul "Renunţ" pentru ca programul să renunţe la căutări şi înlocuiri.

     Recomandare personală: setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ DEMARCARE TEXT


     Aceasta este ultima opţiune pe care o oferă meniul OCR Plus şi nu rulează automat, ci separat şi independent de celelalte opţiuni.
     Opţiunea trebuie rulată doar în situaţiile în care avem în text marcări color ale fontului sau fundalului şi dorim să renunţăm la acestea.
     Trebuie reţinut că fontul poate fi marcat color în următoarele situaţii:
          - dacă textul iniţial conţinea font color, iar la opţiunea "1.2 Conversii preliminare >> Setare text la font şi mărime unică" nu s-a stabilit uniformizarea textului la culoarea Negru. Situaţii de acest gen sunt foarte rare.
          - dacă a fost activată opţiunea "5. Marcare caractere"

     Fundal marcat color poate exista într-o singură situaţie:
          - dacă cel puţin unul dintre dicţionare are activată condiţia de marcare a modificărilor executate. În mod sigur niciunul dintre cele 32 dicţionare care rulează automat nu are această condiţie. De asemenea, niciunul dintre dicţionarele suplimentare nu trebuie să aibă această condiţie. Dacă am scăpat vreun dicţionar cu această condiţie activă, atunci este o eroare şi activarea a rămas din perioada executării testării acestor dicţionare.

     La accesarea acestei opţiuni din meniul OCR Plus se va deschide o fereastră ca în imaginea de mai jos.
     După executarea demarcărilor dorite, închidem manual fereastra, acţionând butonul "X" din colţul dreapta-sus al ferestrei, deoarece fereastra nu se închide în mod automat.



      Ce mai trebuie să reținem?
      Trebuie să ţinem minte culorile pe care le-am folosit la marcarea textului, deoarece opţiunea cere să "spunem" ce anume culoare are fontul sau fundalul căruia trebuie să-i anuleze [să-i şteargă] marcarea. Acest lucru e valabil doar în cazurile în care vrem să facem demarcarea doar pentru o parte dintre marcă.
      Dacă dorim să demarcăm toate culorile de fundal sau toate culorile de font, atunci nu marcăm nici o culoare ci doar acţionăm butonul "Demarcare text" sau "Demarcare fundal".

      Trebuie să mai reţin că demarcare de culoare a fontului sau a fundalului se face, de regulă, pe timpul corecturii şi nu neapărat în mod automat folosind această opţiune, deoarece marcarea are ca scop scoaterea în evidenţă a anumitor elemente care să fie de ajutor pe timpul corecturii.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ■ PRECIZĂRI FINALE


      Ce-ar mai fi folositor să fie spus după prezentarea fiecărei opţiuni?
      Sper să nu fi uitat ceva...

      Trebuie să reamintim că AutoCorect OCR Plus nu face corectură, ci doar o curăţare a textului care are ca scop uşurarea muncii de corectare şi nu înlocuirea acestei munci.
      Trebuie reamintit faptul că în mod obligatoriu după rularea opţiunilor din meniul OCR Plus trebuie să urmeze corectură manuală prin citirea cuvânt cu cuvânt, frază cu frază şi pagină cu pagină a întregului text de la cap la coadă.
      Niciodată nu trebuie folosit AutoCorect ca un instrument de şlefuire a unui text corectat.
      Cine face acest lucru şi crede el că ştie mai bine ce are de făcut, în realitate este într-o mare eroare şi face o imensă gafă. A rula o carte versiune [V1.0] sau chiar [V2.0] sau [V3.0] prin AutoCorect, [aşa cum am văzut deja pe forum] este o prostie mare cât Piramida lui Keops. Asta înseamnă să strici un text corectat, asta înseamnă să-i faci pe hoţii şi cerşetorii din Curtea Miracolelor sau alte personaje colorate din mahalalele Parisului sau de aiurea, să folosească un limbaj corect, ceea ce nu este deloc corect, deoarece autorul a folosit în mod voit cuvinte stâlcite sau bâlbâite, ori arhaisme şi regionalisme şi, mai ales, limbaj de argou şi jargon.

      Trebuie să reamintim în mod obligatoriu că AutoCorect OCR Plus este un program care trebuie dezvoltat în continuare. Programatorii au implementat toate aceste opţiuni. Probabil că în viitor se vor mai putea face unele îmbunătăţiri, dar în principiu au cam încheiat partea de programare. Opţiunile implementate fac să ruleze cele 32 de dicţionare obligatorii şi alte nenumărate dicţionare suplimentare. Aceste dicţionare sunt în mare parte la început. Ele fac încă foarte-foarte puţine înlocuiri faţă de câte înlocuiri ar putea să realizeze.
      Dezvoltarea şi îmbunătăţirea dicţionarelor nu mai este treaba programatorilor, ci este menirea utilizatorilor. Nu e chiar cel mai simplu lucru editarea unui dicţionar, dar nici pe departe un lucru foarte complicat. E nevoie doar de puţină voinţă şi un dram de dorinţă... restul este muncă şi plăcere.

      Poate că ar mai trebuie să reamintim că AutoCorect OCR Plus este un program interactiv cu care utilizatorul trebuie să conlucreze permanent. Aşa cum un joc de calculator rulează diferit în funcţie de calităţile jucătorului, în acelaşi mod AutoCoredct OCR Plus poate avea performanţe diferite de la un utilizator la altul. Ca să putem să folosim programul la parametrii maximi, trebuie să cunoaştem foarte bine programul, să ştim ce poate să facă şi ce nu, ce trebuie şi e bine să facă şi ce nu, trebuie să înţelegem foarte exact ce anume face fiecare opţiune şi cum poate fi făcută ea să funcţioneze cu randament maxim.
      Ceea ce am scris pe acest topic este doar o prezentare sumară a programului făcută de un simplu utilizator.

      Nu ştiu dacă ar mai trebui adăugat ceva. Poate că e deja prea mult...
      Mult sau puţin, cu toate bâlbele şi exprimările alambicate pentru care îmi cer scuze, am intenţionat să ajut pe cei interesaţi să afle cum poate fi folosit cât mai bine acest program.
      Dacă ceea ce am postat aici va folosi cuiva, voi fi foarte mulţumit; dacă nu va folosi nimănui, voi avea mulţumirea că măcar am încercat să fiu util.

      După Sărbătorile de Paşte voi continua cu câteva explicaţii despre editarea dicţionarelor de înlocuiri multiple.

      Toate cele bune!
      şi să aveţi un Paşte Fericit!

      Seven

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
          PROPUNERI PERSONALE PENTRU ACTIVARE
                                      —  Rezumat  —



1. Conversii preliminare
     1.1 Conversie dialog bullets în dialog text – setare ACTIVĂ
     1.2 Setare text la font şi mărime unică – Rog studiaţi tutorialul înainte de activare
     1.3 Eliminare tab şi spaţii multiple – setare ACTIVĂ
     1.4 Eliminare spaţii la început de paragraf – setare ACTIVĂ
     1.5 Repararea rândurilor rupte – setare ACTIVĂ
     1.6 Rupere rânduri care încep cu dialog aflate în interiorul paragrafului  Utilizatori Începători = INACTIVĂ şi Avansaţi = ACTIVĂ

2. Punctuaţie
     2.1 Eliminare paragraf-artefact – opţiunea nu rulează corect – setare INACTIVĂ
     2.2 Corectare linii de pauză şi linii de dialog – setare ACTIVĂ
     2.3 Funcţii obişnuite – setare ACTIVĂ
     2.4 Corectare suplimentară elipsis – setare ACTIVĂ
     2.5 Conversie combinatii ? ! si . ,   – setare ACTIVĂ

3. Conversie text clasic în text contemporan  – setare ACTIVĂ

4. Corectare caractere reproduse eronat
     4.1 Corectarea majusculelor încorporate  – setare ACTIVĂ
     4.2 Corectarea literelor l, d si m reproduse eronat  – setare ACTIVĂ
     4.3 Corectare cuvinte foarte scurte  – setare ACTIVĂ
     4.4 Corectare minuscule la început de paragraf  – setare ACTIVĂ
     4.5 Înlocuire secvenţe cuvinte  – setare ACTIVĂ
     4.6 Corectare cuvinte întregi şi expresii  – setare ACTIVĂ
     4.7 Conversie majusculă în minusculă la dialog francez  – Rog studiaţi tutorialul înainte de activare

5. Marcare caractere  – Rog studiaţi tutorialul înainte de activare

6. Ştergere caractere  – Rog studiaţi tutorialul înainte de activare

7. Înlocuieşte toate liniile de pauză cu:
     7.1 cu >> EmDash  – INACTIVĂ
     7.2 cu >> EnDash  – setare ACTIVĂ
     7.3 cu >> Horizontal Bar  – INACTIVĂ

8. Înlocuieşte toate liniile de dialog cu:
     8.1 cu >> EmDash  – setare ACTIVĂ
     8.2 cu >> EnDash  – INACTIVĂ
     8.3 cu >> Horizontal Bar  – INACTIVĂ

9. Eliminare linii de pauză exclusiv din Dialoguri  – ATENŢIE: – Pachet de opţiuni pentru profesionişti
     9.1 Înlocuieşte "spaţiu""linie de pauză – oricare ar fi ea""spaţiu" în "virgulă""spaţiu" INACTIVĂ
     9.2 Elimină virgula de după semnul de exclamare/întrebare INACTIVĂ
     9.3 Înlocuieşte "spaţiu""linie de pauză""virgulă""spaţiu" în "virgulă""spaţiu" INACTIVĂ

10.1 Elimină TOATE liniile de pauză din text – ATENŢIE: – Pachet de opţiuni pentru profesionişti
     10.1 Din " !""spaţiu""linie de pauză""spaţiu" în " !""spaţiu" INACTIVĂ
     10.2 Din " ?""spaţiu""linie de pauză""spaţiu" în " ?""spaţiu" INACTIVĂ
     10.3 Din "spaţiu""linie de pauza""spaţiu" în "virgulă""spaţiu" INACTIVĂ
     10.4 Din "spaţiu""linie de pauză""virgulă""spaţiu" în "virgulă""spaţiu" INACTIVĂ

11. Rulare grup de dicţionare înlocuire multiplă  – Rog studiaţi tutorialul înainte de activare

12. Setări finale
     12.1 Înlocuire spaţiu după linia de dialog cu spaţiu neseparator  – setare ACTIVĂ
     12.2 Corectare cuvinte rupte şi înlocuiri cu confirmare  – setare ACTIVĂ

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

                  ═════════     EDITAREA DICŢIONARELOR DE ÎNLOCUIRE MULTIPLĂ    ═════════





          ■ GENERALITĂŢI


     Una dintre cele mai puternice funcţii, dacă nu chiar cea mai puternică, pe care a are implementată AutoCorect este aceea de a putea realiza înlocuiri multiple.

     Opţiunea "Înlocuire multiplă" din AutoCorect este asemănătoare opţiunilor de tip Find & Replace din oricare dintre editoarele de text, dar are caractristici net superioare oricărei opţiuni de acest tip, don oricare dintre editoarele de text cunoscute, fie ele free sau dintre cele care costă foarte mult şi care au în spate un număr foarte mare de programatori.

     "Înlocuirea multiplă" din AutoCorect are câteva caracteristici specifice; acestea o fac superioară oricărei opţiuni similare din celelalte editoare de text:
           ─ cu opţiunea "Înlocuirea multiplă" din AutoCorect se pot face un număr nelimitat de înlocuiri, ce se pot realiza cu o singură comandă, prin rularea unui dicţionar de înlocuiri multiple; în acelaşi timp, în toate celelalte editoare, înlocuirile se pot face una câte una prin editarea de fiecare dată a şirului de caractere de căutat şi a şirului de caractere cu care va fi înlocuit;
           ─ înlocuirile ce dorim a fi făcute într-un text se pot salva într-un fişier de tip dicţionar de înlocuiri multiple, iar acest dicţionar este salvat la rândul său de către program, putând fi accesat de oricâte ori este nevoie pentru a fi făcute înlocuirile pe orice text, oriunde şi oricând;
           ─ dicţionarele de înlocuiri multiple pot fi transmise de la un utilizator la altul, acest lucru reducând timpul de editare a unui dicţionar ce prezintă interes pentru mai mulţi useri;
           ─ în cazul executării unui număr mare de înlocuiri, timpul total de executare al înlocuirilor este mult mai scurt în AutoCorect, decât în oricare dintre celelalte editoare.


     Accesarea ferestrei "Înlocuire multiplă" se poate face în două moduri, ca în imaginea de mai jos:
           ─ din meniul principal: "Editare" >>  "Înlocuire multiplă";
           ─ actionând asupra ultimului [din dreapta], aflat pe bara de iconuri.



     Fereastra "Înlocuire multiplă" [vezi imaginea de mai jos] permite deschiderea şi editarea dicţionarelor de înlocuire multiplă, precum şi o serie de alte acţiuni, precum crearea de noi dicţionare, salvarea lor, sortarea înregistrărilor în ordine alfabetică, copierea, mutarea sau ştergerea unei înregistrări sau a unui pachet de înregistrări.

     Copierea şi mutarea înregistrărilor se poate face dintr-un dicţionar de tip AutoCorect în altul, dar şi dintr-un dicţionar AutoCorect în alte editoare de text sau foi tabelare [ca de exemplu, Excel].

     Se pot face, de asemenea, copieri şi mutări din diferite editoare de texte sau foi tabelare în dicţionare de tip AutoCorect, dar această acţiune este una mai dificilă şi necesită mai multă experienţă din partea utilizatorului.
     Despre astfel de acţiuni vor fi date câteva detalii în partea finală a tutorialului



Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          Fereastra "Înlocuire multiplă"



     Fereastra "Înlocuire multiplă" are o mărime minimă standard sub care nu se mai poate redimensiona, în schimb poate fi mărită atât pe verticală, cât şi pe orizontală prin tragerea cu mausul de una din laturi sau unul dintre colţurile ferestrei.

     Deoarece această fereastră este una foarte complexă, pentru a putea descrie mai uşor modul de editare a înlocuirilor şi toate celelalte opţiuni asociate ferestrei, am recurs la un artificiu şi am împărţit fereastra în 3 zone [blocuri] separate.




     Împărţirea ferestrei în cele trei zone este doar o încercare de sistematizare a discuţiilor, cu scopul de a uşura descrierea şi înţelegerea modului de funcţionare a fiecărei opţiuni în parte.

     Aceste 3 zone principale ar putea fi împărţite astfel:

         ■ Zona de afişare a înregistrărilor - se află în partea din stânga-sus a ferestrei şi are structura unui tabel cu 5 coloane şi un număr variabil de rânduri; în această fereastră se afişează la fiecare înregistrare următoarele elemente:
                ─ "Nr." - reprezintă numărul de ordine al înregistrărilor; el este creat automat de program, deci nu se editează de către utilizator;
                ─ "Caută..." - este coloana în care sunt afişate cuvântele [şirurile de caractere] de înlocuit;
                ─ "Înlocuieşte cu..." - este coloana în care sunt afişate cuvântele [şirurile de caractere] cu care se face înlocuirea;
                ─ "Opţiuni" - este coloana în care sunt afişate condiţiile [opţiunile] pentru fiecare înregistrare în parte. Aceste condiţii sunt afişate sub fprmă de abrevieri [prescurtări].

     Mărirea dimensiunii pe orizontală a ferestrei poate fi făcută pentru a vizualiza înregistrările în totalitatea elementelor lor, atunci când există sau edităm înregistrări care conţin un şir lung de caractere. Practic, la lărgirea ferestrei pe orizontală îşi măresc dimensiunile numai coloanele "Caută..." şi "Înlocuieşte cu..."; toate celelalte elemente ale ferestrei îşi păstrează lăţimea standard.
     Se poate recurge la mărirea pe verticală a dimensiunii ferestrei pentru a vizualiza un număr mai mare de înregistrări [rânduri].

         ■ Blocul butoanelor dicţionarelor - se află în partea din dreapta-sus a ferestrei. Rolul fiecăruia dintre aceste butoane va fi analizat în mod detaliat în cadrul tutorialului.

         ■ Zona de editare a înregistrărilor - se află în partea de jos a ferestrei "Înlocuire multiplă" şi cuprinde cele două miniferestre de editare manuală a înregistrărilor, un pachet de opţiuni [condiţii] de căutare ce se pot aplica individual sau în grup pentru fiecare înregistrare în parte, precum şi butoane pentru înserare de caractere speciale [caractere simbol] sau coduri specifice programului AutoCorect.
     Modul de editare al înregistrărilor şi caracteristica fiecărei opţiuni de căutare în parte, va fi analizată în mod detaliat.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
         ■ Variante de afişarea a Zonei de editare a înregistrărilor


     Trebuie reţinut că această zonă de editare a ferestrei "Înlocuire multiplă" are un mod de afişare special.
     Zona de editare este împărţită în trei sectoare pliabile, care se pot desfăşura sau restrânge una câte una, cu ajutorul unor butoane de forma ▲ sau ▼ care se află în partea dreaptă a fiecărui sector.
     Când un astfel de buton este orientat cu vârful în jos [adică are forma ▼], prin acţionarea lui, sectorul aflat sub acest semn se extinde, iar când butonul este orientat cu vârful în sus [adică are forma ▲], prin acţionarea lui, sectorul aflat sub acest semn se restrânge.

     Iată în imaginile de mai jos modul de afişare a zonei de editare în cele trei variante:


     Varianta redusă [neextinsă] în care este afişat doar primul sector.
     Acest mod de afişare este folosit atunci când utilizatorul face doar rularea sau vizualizarea unui dicţionar şi nu este necesară editarea înregistrărilor.


     Varianta extinsă parţial, în care sunt afişate primele două sectoare, dar nu este afişat cel de-al treilea.
     Acest mod de afişare este folosit atunci când utilizatorul face modificări ale înregistrărilor existente sau adaugă înregistrări noi, dar care îndeplinesc condiţii simple la căutare.


     Varianta extinsă total, în care sunt afişate toate cele trei sectoare.
     Se recurge la acest mod de afişare atunci când utilizatorul face înregistrări care sunt însoţite de condiţii complexe de căutare, ori trebuiesc inserate în înregistrări caractere speciale sau coduri specifice.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
         ■ Prezentarea detaliată a opţiunilor din Zona de editare a înregistrărilor



     Opţiuni de rulare a dicţionarelor:
     "Înlocuieşte în tot documentul " şi "Marchează modificările"


     Ambele opţiuni acţionează asupra tuturor dicţionarelor în întregul lor şi nu doar asupra unora dintre înregistrări.
     Este foarte important de reţinut că dacă marcăm sau demarcăm una dintre opţiuni într-un singur dicţionar, aceste marcări sau demarcări se aplică asupra tuturor dicţionarelor.
     Pentru a scoate în evidenţă faptul că aceste două opţiuni sunt diferite de celelalte opţiuni din zona de editare, realizatorii programului le-au grupat într-un sector de fereastră separat, iar fontul cu care sunt afişate aceste opţiuni are culoarea albastru, faţă de celelalte opţiuni care apar afişate cu font neagru.


     Opţiunea "Înlocuieşte în tot documentul" este activată implicit şi trebuie să rămână activată totdeauna în cazul tuturor dicţionarelor.
     Activarea acestei opţiuni produce următorul efect: programul va căuta şi va face înlocuirile înregistrate în tot documentul; altfel spus, dacă într-un text avem 100 de cazuri în care cuvântul "binc" trebuie înlocuit cu "bine", dicţionarul va face toate cele 100 de înlocuiri necesare.
     Dezactivarea acestei opţiuni produce următorul efect: programul va căuta şi va face doar câte o singură înlocuire pentru fiecare înregistrare în parte, fără a căuta în document dacă mai există înlocuiri care îndeplinesc aceleaşi condiţii; altfel spus, dacă într-un text avem 100 de cazuri în care cuvântul "binc" trebuie înlocuit cu "bine", dicţionarul va face o singură înlocuire a acestui cuvânt şi anume în prima poziţie din text în care găseşte cuvântul "binc", fără a căuta mai departe în text, astfel că celelalte 99 de cazuri în care înlocuirea era necesară, vor rămâne nemodificate.

     Opţiunea "Marchează modificările" este dezactivată implicit.
     Această opţiune se activează numai în situaţia în care utilizatorul face teste cu anumite docţionare sau înregistrări şi doreşte să vadă efectul înregistrărilor în text.
     Activarea acestei opţiuni produce următorul efect: toate modificările realizate la rularea dicţionarele vor fi redate în text cu font normal pe un fundal color; culoarea fundalului poate fi aleasă de utilizator sau poate rămâne cea setată implicit.
     Marcarea în text a modificărilor obişnuite nu este recomandată, deoarece produce efectul de oboseală pe timpul corectării textului.
     Utilizatorul obişnuit va trebui să păstreze opţiunea inactivă, aşa cum este setată implicit.
     Aşa cum s-a arătat, aceasta este o opţiune recomandată persoanelor care participă la dezvoltarea programului AutoCorect şi va fi activată doar pentru a urmări efectul unei modificări sau mai multor modificări într-un text.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
     Ferestrele de editarea a înregistrărilor

     Pentru ca diferitele opţiuni şi butoane să fie mai uşor de urmărit pe imaginile care reprezintă zona de editare a fereastrei "Înlocuire multiplă", am procedat la evidenţierea color a acestora. 



     Nu cred că sunt necesare foarte multe explicaţii; numele butoanelor şi al ferestrelor de editare sunt suficient de sugestive.
     Fereastra "Caută"  În această fereastră va fi editat manual cuvântul [şirul de caractere] ce trebuie căutat pentru a fi înlocuit. 
     Fereastra "Înlocuieşte cu"  În această fereastră va fi editat manual cuvântul [şirul de caractere] cu care trebuie să se facă înlocuirea.
     Butonul "Salvează" permite salvarea în dicţionar a unei noi înlocuiri, precum şi salvarea modificărilor făcute asupra unor înlocuiri existente în dicţionar.
     Butonul "Renunţă" permite renunţarea la salvarea în dicţionar a o unei noi înlocuiri şi, de asemenea, permite renunţarea la modificarea unei înlocuiri existente în dicţionar.

     Pe de altă parte, este important de reţinut faptul că înregistrarea unei înlocuiri nu se rezumă doar la editarea celor două cuvinte [şiruri de caractere] din ferestrele "Caută" şi "Înlocuieşte cu". Pentru fiecare înlocuire se vor stabili una sau mai multe condiţii de căutare.
     
     Să luăm spre exemplificarea, înlocuirea succesiunii de caractere:  "marc" >> "mare"
     Succesiunea corectă "mare" poate apărea în text în mai multe situaţii:
           – cuvânt întreg scris cu minusculă – în această situaţie înlocuirea  "marc" >> "mare" este corectă.
           – cuvânt întreg scris cu majusculă iniţială – înlocuirea  "Marc" >> "Mare" este incorectă, deoarece există cuvântul corect "Marc" = nume de persoană, care nu trebuie înlocuit cu "Mare".
           – cuvânt întreg scris cu majuscule – înlocuirea  "MARC" >> "MARE" este incorectă din motivele arătate mai sus.
           – succesiune de caractere aflată la începutul cuvântului, ca în cuvintele: marcat, marcant, marcă, marcaj, marchiză, marcaj... etc. – înlocuirea  "marc" >> "mare" este incorectă;
           – succesiune de caractere aflată la mijlocul cuvântului, ca în cuvintele: remarcă, demarc, marchidan, neremarcând, telemarc... etc. – înlocuirea  "marc" >> "mare" este incorectă;
           – succesiune de caractere aflată la sfârşitul cuvântului, ca în cuvintele: marc, demarc, telemarc, remarc... etc. – înlocuirea  "marc" >> "mare" este incorectă;

     Efectuarea înlocuirilor în toate situaţiile enunţate mai sus este o gravă eroare; de aceea va trebui "să-i spunem" programului să facă înlocuirile doar în situaţiile în care succesiunea "marc" este un cuvânt întreg şi doar în situaţia când este scris cu minuscule.
     Se poate comunica programului acest lucru, aplicând înregistrării "marc" >> "mare" opţiunile de căutare "Cuvânt întreg" şi "Potrivire perfectă".
     
     Pentru ca userii să poată stabili în mod corect opţiunile de căutare pentru fiecare înlocuire în parte, se impune o descriere amănunţită a fiecăreia dintre aceste opţiuni de căutare.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
         ■ Opţiunil de căutare [condiţii de căutare] a înlocuirilor


     Notă: În zona de afişare a înregistrărilor, situată în partea din stânga-sus a ferestrei „Înlocuire multiplă”, în coloana „Opţiuni” vor fi afişate toate opţiunile de căutare activate pentru fiecare modificare în parte.
     Evidenţierea opţiunilor de căutare se face în formă abreviată.
     Pentru a obişnui utilizatorul cu aceste abrevieri, în explicaţiile următoare, după numele fiecări opţiuni de căutare voi nota între paranteze drepte abrevierea opţiunii respective, aşa cum este folosită în afişarea din coloana „Opţiuni”.


     "Cuvânt întreg" [Ci]



     În programul AutoCorect Standard, înainte de dezvoltarea versiunii AutoCorect OCR Plus, opţiunea de căutare „Cuvânt întreg” avea exact sensul cunoscut în mod obişnuit prin noţiunea „Cuvânt întreg”.
     În timpul activităţii de dezvoltare a versiunii OCR Plus a apărut necesitatea implementării unor noi opţiuni care să caute succesiuni de caractere numai la începutul cuvintelor sau numai la sfârşitul cuvintelor.
     Pentru a nu aglomera fereastra de editare prin adăugarea de noi opţiuni şi butoane şi pentru a evita punerea în dificultate a utilizatorului care ar fi trebuit să aleagă dintr-un număr mare de opţiuni, s-a recurs la varianta lărgirii opţiunii „Cuvânt întreg” la care s-au adăugat 3 variante de setare, astfel.

            – „Cuvânt întreg – la ambele capete” [Ci] – în sensul prezentei opţiuni, prin „cuvânt întreg la ambele capete” se înţelege un şir de caractere delimitat la ambele capete; rezultă că se pot seta astfel, atât înlocuirile care conţin un singur cuvânt, cât şi înlocuirile fragmentelor de text care conţin mai multe cuvinte.
     Exemplul 1: "fcreastră" >> "fereastră", "cuvănt" >> "cuvânt", "Măria" >> "Maria", "utili/ator" >> "utilizator", "secuenţă" >> "secvenţă"...
     Exemplul 2: "din cauza faptului că erau niştie oameni harnicii" >> "datorită faptului că erau nişte oameni harnici".

            – „Cuvânt întreg – la început” [Ci Ic], nu se referă la un cuvânt întreg ci la secvenţe de caractere situate la început de cuvânt;
     Exemplu: "binc" >> "bine", pentru cuvinte de genul: binecrescut, binecunoscut, binecuvânta, binedispun, binefacere, bineînţeles, binemerita, bineştiut, binevenit, binevoitor... etc. Există în limba română circa 490 de cuvinte care încep cu secvenţa „bine”.

            – „Cuvânt întreg – la sfârşit” [Ci Sc], se referă la secvenţe de caractere situate la sfârşit de cuvânt;
     Exemplu: "ânclu-i" >> "ându-i", pentru cuvinte de genul: acuzându-i, agitându-i, apucându-i, blocându-i, calmându-i, cântându-i, dându-i, evitându-i, luându-i, picându-i, redându-i… etc.  Există în limba română circa 2200 de cuvinte care se termină cu secvenţa „ându-i ”, deci înlocuirea poate corecta foarte multe erori, dacă Abbyy a făcut confuzia între litera „d” şi grupul ”cl”.

     Practic, pentru activarea opţiunii „Cuvânt întreg” într-una dintre cele trei variante, se activează mai întâi opţiunea, apoi din fereastra etichetei „Cuvânt întreg înseamnă:” se alege una din variante, astfel:
            – pentru setarea variantei „Cuvânt întreg – la ambele capete” [Ci] se activează doar opţiunea „Cuvânt întreg”, fără a mai stabili setarea „la ambele capete”, deoarece programul are setată implicit varianta „cuvânt întreg la ambele capete”.
            – pentru setarea variantei „Cuvânt întreg – la început” [Ci Ic] se activează opţiunea „Cuvânt întreg”, apoi se alege setarea „la început”.
            – pentru setarea variantei „Cuvânt întreg – la sfârşit” [Ci Sc] se activează opţiunea „Cuvânt întreg”, apoi se alege setarea „la sfârşit”.

     În mod normal, dificultăţi sau efecte secundare nedorite nu apar la stabilirea înlocuirilor de tip „Cuvânt întreg – la ambele capete” [Ci], dar pot apărea uneori la stabilirea înlocuirilor de tip „Cuvânt întreg – la sfârşit” [Ci Sc] şi destul de des la stabilirea înlocuirilor de tip „Cuvânt întreg – la început” [Ci Ic].

     Să luăm ca exemplu înlocuirea: „aşezărnint” >> „aşezământ”
     Dacă activăm opţiunea „Cuvânt întreg – la ambele capete” [Ci] nu sunt efecte secundare.
     Dacă activăm opţiunea „Cuvânt întreg – la început” [Ci Ic], vor fi corecte înlocuirile pentru formele de singular: aşezământ, aşezământul, aşezământului, dar va fi o eroare înlocuirea formelor de plural: aşezăminte, aşezămintele, aşezămintelor.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
     "Păstrează capitalizarea" [Pc] şi "Potrivire perfectă" [Pp]




     Vom face o descriere prin comparaţie a celor două opţiuni.

     Fiecare dintre aceste opţiuni poate fi activată împreună cu altă opţiune de căutare, dar niciodată acestea două nu trebuiesc activate împreună pentru aceeaşi modificare, deoarece sunt contrarii şi-şi vor anula condiţiile de căutare în mod reciproc, ceea ce poate duce la erori.

     Să recurgem din nou la exemple şi, de data asta să alegem trei modificări de cuvinte întregi:
            "carc" >> "care", "marc" >> "mare" şi "rnare" >> "mare".
     În mod obişnuit, majoritatea cuvintelor pot fi scrise în 3 variante:
         - toate literele minuscule: carc/care, marc/mare, rnare/mare
         - toate literele majuscule: CARC/CARE, MARC/MARE, RNARE/MARE
         - iniţiala majusculă şi celelalte litere minuscule: Carc/Care, Marc/Mare, Rnare/Mare
     
     Dacă activăm opţiunea "Păstrează capitalizarea" [Pc] pentru modificarea carc >> care, programul va executa modificarea în toate cele 3 variante în care este scris cuvântul de modificat "carc", dar păstrând modul de scriere al cuvântului de modificat, astfel că deşi vom face o singură înregistrare, vom avea în realitate trei modificări: "carc" va deveni "care", "Carc" va deveni "Care" şi "CARC" va fi modificat în "CARE".
     Opţiunea de căutare "Păstrează capitalizarea" [Pc] se cuplează, de regulă cu opţiunea "Cuvânt întreg - la ambele capete"[Ci]  sau  "Cuvânt întreg - la început"[Ci Ic].

     Dacă activăm opţiunea "Potrivire perfectă" [Pp] pentru aceeaşi modificare: carc >> care, programul va executa modificarea doar pentru situaţiile în care cuvântul este scris cu minuscule, deci exact aşa cum este înregistrată modificarea. Rezultă că variantele "Carc" şi "CARC" existente în text nu vor fi modificate.

     Să revenim la modificările luate ca exemplu ["carc" >> "care", "marc" >> "mare" şi "rnare" >> "mare"] şi să stabilim care dintre cele două opţiuni trebuie activată pentru fiecare dintre modificări:

         "carc" >> "care" – modificarea este corectă în toate variantele de scriere a cuvântului, deci opţiunea corectă ce trebuie activată este "Păstrează capitalizarea" [Pc]. Opţiunea se va cupla cu "Cuvânt întreg - la ambele capete"[Ci].

         "marc" >> "mare" – modificarea este corectă în varianta scrierii cu minuscule pentru că se referă doar la adjectivul "mare", dar poate da erori în varianta cu iniţială majusculă şi varianta toate literele majuscule, deoarece cuvântul căutat ar putea fi atât adjectivul "mare", dar şi numele de persoană "Marc". În cazul în care cuvântul găsit este numele "Marc" nu trebuie făcută mpdificarea. În acest caz singura opţiune activată corect este "Potrivire perfectă" [Pp]. şi în acest caz este obligatorie şi activarea opţiunii "Cuvânt întreg - la ambele capete"[Ci].

         "rnare" >> "mare" – modificarea este corectă pentru varianta scrierii cu minuscule, deoarece Abbyy realizează confuzii între grupul de litere "rn" şi litera "m", dar nu face niciodată confuzii între majusculele aceloraşi litere, deci nu va scrie "Rn" sau "RN" în locul literei "M".
     Dacă am activa opţiunea "Păstrează capitalizarea" [Pc], programul va procesa mai mult timp, încercând să caute toate cele 3 variante de scriere, dar va face modificări doar în cazul cuvintelor scrise cu minuscule, deoarece nu va găsi cazuri în care cuvintele de modificat sunt scrise cu majuscule sau cu iniaţială majusculă.
     În cazul acestei modificări, opţiunea corectă este "Potrivire perfectă" [Pp], la care se adaugă opţiunea "Cuvânt întreg - la ambele capete"[Ci].

     O recomandare simplă, dar nu şi completă:
     "Păstrează capitalizarea" [Pc] cred că trebuie folosită în principal împreună cu setarea "Cuvânt întreg - la ambele capete"[Ci] şi "Cuvânt întreg - la început"[Ci Ic].
     "Potrivire perfectă" [Pp] cred că trebuie cuplată cu setarea "Cuvânt întreg - la sfârşit"[Ci Sc], ori atunci când avem secvenţe mediane.
     Important este ca înainte de stabilirea setărilor să analizăm bine efectul ce îl vor avea setările propuse asupra căutării cuvintelor de modificat.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
     "Înserare simbol"




     Dacă trebuie să facem nişte înregistrări de genul Francois >> François  sau  Pepiniere >> Pépiničre, vom constata că nu putem scrie direct de la tastatură, caracterele é, č, ç, specifice limbii franceze.
     Opţiunea „Înserare simbol” este un instrument care permite inserarea de caractere speciale în timp ce înregistrăm o modificare.
     Menţionez că la accesarea opţiunii [butonului] „Înserare simbol” se afişează o fereastră care conţine caractere speciale, ca în imaginea următoare.



     În cazul înlocuirii Francois >> François, în fereastra „Caută:” se va scrie cuvântul „Francois” direct de la tastatură, iar în fereastra „Înlocuieşte cu:” vom scrie de la tastatură succesiunea „Fran”, apoi accesăm butonul „Înserare simbol”, căutăm caracterul „ç”, apăsăm butonul „Inserează”, după care continuăm să edităm de la tastatură succesiunea „ois”.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
         Setări complexe


     Opţiunile următoare nu au existat în versiunea AutoCorect standard, ci au fost implementate pe timpul dezvoltării proiectului AutoCorect OCR Plus, deoarece unele înregistrările făcute în dicţionarele care rulează automat în cadrul meniului OCR Plus aveau nevoie de condiţii speciale de căutare sau de modificare.
     Astfel au fost implementate opţiuni care permit căutări numai la început sau la sfârşit de paragraf, ori care permit realizarea de înlocuiri cu confirmare, inserarea în înregistrări a unor caractere speciale care nu pot fi introduse foarte simplu de la tastatură, precum şi alte opţiuni ce vor fi analizate în continuare.



     "Confirmare la înlocuire" [Cli]




     "Confirmare la înlocuire" [Cli] este o opţiune cu un  nume suficient de sugestiv.
Programul va căuta toate situaţiile care îndeplinesc condiţiile pentru realizarea unei modificări înregistrate, dar nu va executa automat modificarea, ci va cere utilizatorului să confirme sau să refuze executarea modificării pentru fiecare situaţie în parte.
     Această opţiune poate fi combinată fără probleme cu una sau mai multe dintre celelalte opţiuni.

     În momentul rulării unei modificări setate cu opţiunea "Confirmare la înlocuire" [Cli], programul marchează rând pe rând în text locurile unde trebuie să se facă fiecare înlocuire în parte şi, în plus, afişează o mică fereastră [cea din imaginea următoare] cu 4 butoane, care au următorul rol: „Da” = confirm înlocuirea propusă; „Nu” = nu se execută înlocuirea propusă; „Renunţ” = se renunţă la TOATE înlocuirile pe care ar putea să le facă o singură înregistrare; „Toate” = se acceptă toate modificările din text ale unei singure înregistrări.



     Chiar dacă se foloseşte unul dintre butoanele „Renunţ” sau „Toate”, fereastra nu dispare decât atunci când nu mai există în dicţionar alte înregistrări setate cu opţiunea "Confirmare la înlocuire" [Cli].

     Să facem o paranteză şi să amintim că „paronimele” sunt cuvinte cu formă aproape identică – uneori diferă un singur  sunet – şi cu sensuri diferite. [Exemple: abilitate-agilitate, arbitrai-arbitrar, dependenţă-dependinţă, familial-familiar, libret-livret, ordinal-ordinar...]
     Situaţiile cele mai frecvente în care este necesară activarea opţiunii "Confirmare la înlocuire" [Cli] sunt cele în care cuvântul de înlocuit şi cuvântul înlocuitor sunt paronime.
Iată câteva exemple de astfel de paronime care sunt deja înregistrate în dicţionarul CO_Var4.imd: intre-între, lot-tot, lotul-totul, mal-mai, miner-mâner, minerul-mânerul, clar-dar, clară-dară, clin-din.

     Timpul necesar executării modificărilor setate cu această opţiune va fi mult mai lung decât în cazul înlocuirii automate, de aceea vom seta modificările cu această opţiune numai în cazurile în care modificările automate ar produce şi modificări nedorite.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
     "Început de paragraf" [Pi] şi „Sfârşit de paragraf” [Ps]




     Deşi aceste două opţiuni sunt folosite destul de rar, numele lor este suficient de sugestiv, astfel că nu necesită foarte multe explicaţii.
     Opţiunea "Început de paragraf" [Pi] va face căutarea şirului de caractere de înlocuit doar la început de paragraf şi, bineînţeles, opţiunea „Sfârşit de paragraf” [Ps] va face căutarea doar la sfârşit de paragraf.

     Cu opţiunea "Început de paragraf" [Pi] au fost setate înregistrările din dicţionarul CO_LinD.imd. Acest dicţionar face corecturi ale liniei de dialog – în mod practic, sunt eliminate caracterele de tip artefact [cunoscute şi ca "răgălii"] care însoţesc linia de dialog, ori diferite tipuri de linii, însoţite sau nu de artefacte sunt modificate în linia de dialog de tip EmDash.
     Linia de dialog este totdeauna începutul unui paragraf nou, astfel că o înlocuire de genul   - >> — [cratimă se modifică în Emdash] nu se va face şi în interiorul paragrafului, ci doar la început de paragraf.
     În acest moment, teoretic la finalul unei procesări complete în AutoCorect OCR Plus toate liniile de dialog sunt curățate de diferitele artefacte și toate liniile de dialog pot fi setate, în funcție de dorința utilizatorului, ca EmDash, EnDash ori Horizontal Bar.
     Dacă nu ar exista opţiunea de căutare la "Început de paragraf" [Pi], toate aceste "curăţări" ale liniei de dialog şi eliminarea de caractere însoţitoare nedorite, ar fi fost imposibilă.
     
     Opţiunea „Sfârşit de paragraf” [Ps] poate fi folosită cel puţin în cazul eliminării unor artefacte care există la sfârşit de paragraf. Nu de puţine ori la sfârşitul unui paragraf, în zona albă a hârtiei care se află în continuarea ultimului rând, Abbyy crede că recunoaşte nişte caractere, ce sunt în realitate doar pete ale hârtiei sau umbre rezultate la scanare, astfel că la sfârşitul unui rând mai scurt decât celelalte [este cazul ultimului rând din paragraf, deci sfârşit de paragraf] apare un şir mai lung sau mai scurt de caractere false, cunoscute ca artefacte sau răgălii.
     Aceste artefacte [răgălii] pot fi eliminate manual la citirea şi corectarea textului, dar se poate face şi o încercare de curăţare a lor în mod automat prin folosirea unui dicţionar.
     Exemple de artefacte sunt caracterele: ■  ^  •  <  >  |  ►  □  ▪  ▫  ●  ▼  ◄  ▲  ¦  @  #  $  Ł  %

     Dacă vom edita o modificare, înregistrând în fereastra "Caută:" caracterul ^ , iar în fereastra "Înlocuieşte cu:" nu vom pune nimic, nici măcar un spaţiu, atunci programul va căuta caracterul ^ în orice zonă a textului şi-l va şterge.

     Dacă această înregistrare va avea activată opţiunea „Sfârşit de paragraf” [Ps], atunci programul va căuta acest caracter numai la sfârşit de paragraf şi-l va şterge.
     În situaţia când am realiza un dicţionar cu mai multe înregistrări, iar la fiecare înregistrare vom pune un alt caracter dintre cele menţionate vom avea posibilitatea să ştergem toate artefactele aflate la sfârşizul unui paragraf, deoarece dicţionarul va şterge câte un singur caracter, dar prin căutări repetate va avea şansa să le elimine pe toate.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
     "Înserare caractere speciale"







Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
     "Ignoră marginile la înlocuire"
          [Ima... Ims... Imd...]



     Este una dintre opţiunile specifice programului AutoCorect, o noutate în materie de opţiuni de căutare şi, incontestabil, una dintre opţiunile cele mai complexe, care necesită explicaţii detaliate, dar şi ceva mai multă atenţie.
     Trebuie subliniat că aceasta este o opţiune bivalentă, adică asigură condiţii la căutare, dar asigură condiţii şi la înlocuire.


     Cred că cel mai uşor este să recurgem din nou la exemple de modificări.
     Sunt cunoscute cazurile în care Abbyy, în mod eronat, scrie la mijlocul frazelor cuvinte foarte scurte cu iniţială majusculă. Este vorba de cuvinte compuse din două sau trei litere, în care prima literă este una dintre literele c, j, o, p, s, ş, u, v, w, z [care seamănă până la identificare cu forma lor majusculă C, J, O, P, S, Ş, U, V, W,  Z].
     De multe ori, putem constata că la mijlocul frazei întâlnim cuvintele „cu, un, şi… etc.” scrise sub forma: „Cu, Un, Şi… etc.”
     Dacă am înregistra o modificare de forma: Un >> un – cu condiţiile „Cuvânt întreg” plus „Potrivire perfectă” [Ci Pp], se vor executa modificări şi asupra situaţiilor în care cuvântul „Un” se află la început de frază, deci şi când ar fi scris corect.
     Există posibilitatea ca modificarea să primească şi opţiunea "Confirmare la înlocuire" [Cli]; în acest caz putem face modificările în mod corect, având posibilitatea să alegem care sunt poziţiile în text ale cuvântului „Un” ce trebuie modificate şi care dintre ele vor rămâne nemodificate; dezavantajul este că vom consuma ceva mai mult timp pentru executarea modificărilor.

     Dacă am putea pune condiţia ca programul să caute aceste cuvinte numai în interiorul frazelor, atunci căutările s-ar reduce exact la situaţiile în care trebuie făcute modificările.
     Condiţia ar fi ca programul să nu caute cuvântul „Un” la început de frază, ci numai atunci când acesta se află în interiorul propoziţiei, adică ar fi poziţionat între cuvinte scrise cu minuscule.

     Ca să arătăm că în faţa cuvântului „Un” şi după el, se află câte un cuvânt este suficient să arătăm că în faţă se află o literă urmată de spaţiu, iar ca să arătăm că „Un” este urmat de un cuvânt este suficient să arătăm că este urmat de spaţiu şi apoi o literă.
     Ca să eliminăm si situaţia în care este vorba de un titlu scris cu majuscule, ar fi bine să punem condiţia ca literele „vecine” să fie minuscule.
     Condiţia se poate scrie sub forma.
          „orice_literă_minusculă” - „spaţiu” - „Un” -„spaţiu” - „orice_literă_minusculă”

     Există implementate în AutoCorect o serie de coduri, printre care:
          ^_      cod pentru spaţiu
          ^l      cod pentru orice literă minusculă
          ^L      cod pentru orice literă majusculă

     Înlocuind în condiţia de mai sus „orice_literă_minusculă” cu codul pentru orice literă minusculă, se poate rescrie condiţia de căutare sub forma:
                            ^l^_Un^_^l

     Asta înseamnă că am putea edita în ferestrele „Caută:” şi „Înlocuieşte cu:” modificarea următoare:
                            ^l^_Un^_^l  >>  ^l^_un^_^l

     Înregistrarea este incorectă, este falsă, iar înlocuirea este imposibil de realizat, deoarece programul poate căuta foarte uşor ^l  [orice literă minusculă], dar nu trebuie să înlocuiască cu „orice literă minusculă”, ci doar cu cea pe care a găsit-o la fiecare poziţie în parte.

     Condiţia "Ignoră marginile la înlocuire" poate rezolva această situaţie.
     Mai întâi să clarificăm ce înseamnă şi care sunt marginile cuvântului de căutat „Un”:
       – marginea din stânga este formată din două caractere: ^l^_  adică, orice literă mică urmată de un spaţiu;
       – marginea din dreapta este formată tot din două caractere: ^_^l   adică, un spaţiu urmat de orice literă mică.

      „A ignora marginile la înlocuire” înseamnă că programul, după ce va găsi şirul de caractere care îndeplineşte condiţia impusă la căutare, va face modificarea cuvântului „Un” fără a mai modifica şi marginile, ci doar cuvântul propriu zis, ; acest lucru înseamnă că „ignoră” marginile.

     Forma corectă pentru înregistrarea modificării propuse are forma:
                            ^l^_Un^_^l  >>  un

     Opţiunea "Ignoră marginile la înlocuire" are doi parametrii de setare:
       – primul parametru = numărul de caractere din care este compusă marginea:
              – „1 car” [In1] – înseamnă că marginea este formată dintr-un caracter;
              – „2 car” [In2] – înseamnă că marginea este formată din 2 caractere;
              – „3 car” [In3] – înseamnă că marginea este formată din 3 caractere.
       – al doilea parametru = marginile; acestea pot fi setate astfel:
              – „stânga” [Ims] – înseamnă numai marginea din stânga; rezultă următoarele variante de setare: [Ims In1] stânga 1 caracter, [Ims In2] stânga 2 caractere, [Ims In3] stânga 3 caractere
              – „dreapta” [Imd] – înseamnă numai marginea din dreapta; rezultă următoarele variante de setare: [Imd In1] dreapta 1 caracter, [Imd In2] dreapta 2 caractere, [Imd In3] dreapta 3 caractere
              – „ambele margini” [Ima] – înseamnă atât marginea din stânga, cât şi cea din dreapta; rezultă următoarele variante de setare: [Ima In1] ambele margini 1 caracter, [Ima In2] ambele margini 2 caractere, [Ima In3] ambele margini 3 caractere.
     Se constată că numărul de caractere stabilit este acelaşi atât la marginea din stânga cât şi la marginea din dreapta. Pentru a nu complica foarte tare setările opţiunii nu s-a implementat varianta în care numărul de caractere să fie diferit la marginea din stânga faţă de cea din dreapta.



Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     Corectat eroarea: î [mic] în loc de Î [mare]


     Un coleg de forum mi-a semnalat pe mesaj privat că are o problemă, în sesul că un text are multe litere î [mic] în loc de Î [mare].
deoarece s-ar putea să nu fie singurul care are astfel de situaţii, m-am gândit că e mai bine ca explicaţia să o dau pe forum şi nu tot pe mesaj privat.
     Mai mult decât atât am găsit de cuviinţă să scriu mesajul pe acest topic pentru a-l aduce la vedere pentru cei interesaţi, deoarece el se afla undeva la sfârţitul acestei secţiuni.
     Ceea ce voi spune în continuare despre î/Î este valabil şi în cazul celorlalte litere care au aceeaşi formă atât ca minuscule cât şi ca majuscule, precum: c/C, i/I, j/J, k/K, o/O, p/P, s/S, ş/ş, u/U, v/V, w7W, x/X, z/Z

     ■ ÎN WORD:
     Se fac înlocuiri cu opţiunea "Find & Replace".
     Atenţie! Voi folosi paranteze pătrate pentru a marca conţinutul câmpurilor, dar aceste paranteze nu se trec în câmpuri.
          ● În interiorul unui paragraf înlocuim î [mic] cu î [mare] la început de frază, după punct, semnul exclamării, semnul întrebării sau elipsis.
          – la "căutare" punem [. î] sau [? î], [! î], [… î]
          – la "înlocuire cu" punem  [. Î] sau [? Î], [! Î], [… Î]
          – condiţie: activăm "match case"

     ● Înlocuire la început de paragraf.
     În acest caz diferenţa este că în loc de [. ? ! …] vom avea marcajul de început de paragraf, adică [^p] "Paragraph mark", care este prima opţiune din pachetul "Special", rezultând astfel:
          – la "căutare" vom avea [^pî]
          – la "înlocuire cu" punem  [^pÎ]
          – condiţie: activăm "match case"

     ■ ÎN AUTOCORECT:
     Problemele de minuscule la început de paragraf apar din cauza setărilor incorecte ale punctuaţiei.
     A se vedea postările privind
   ● CONFIGURARE PUNCTUAŢIE OCR_Plus
din acest topic de la adesa:
şi următoarele.

   ● DICŢIONAR DE ÎNLOCUIRE MULTIPLĂ PERSONALIZAT
     O variantă de lucru pentru un text deja rulat este să creem un mic dicţionar de înlocuiri multiple pe care-l rulăm manual.
     Crearea dicţionarului se face astfel:
     – din fereastra principală accesăm "Editare" >>  "Înlocuire multiplă";
     – se va deschide asutomat un dicţionar gol numit "implicit.imd", care arată ca în imaginea de la linkul:
     – salvăm acest dicţionar gol cu un alt nume, ex: "Î majusculă.imd"
     – În acest dicţionar adăugăm înlocuirile necesare.
     – după înregistrare rulăm dicţionarul.
     Redau în imaginea următoarea partea de jos a ferestrei înlocuiri multiple:



     Acum să discutăm la concret.
          ● În interiorul unui paragraf înlocuim î [mic] cu î [mare] la început de frază, după punct, semnul exclamării, semnul întrebării sau elipsis.
          – la "căutare" punem [. î] sau [? î], [! î], [… î]
          – la "înlocuieşte cu" punem  [. Î] sau [? Î], [! Î], [… Î]
          – condiţie: activăm "Potrivire perfectă". Şi pentru a vedea exact fiecare situaţie activăm şi condiţia "Confirmare la înlocuire"
          – apoi acţionăm butonul "Salvează" pentru salvarea înregistrării.
     Putem adăuga înregistrări şi pentru celelalte litere asemănătoare amintirte mai sus.

          ● Înlocuire la început de paragraf.
     Trebuie să reamintim că avem mai multe situaţii în care litera Î apare la început de paragraf şi anume:
          – paragraf normal care începe cu litera Î;
          – paragraf care începe cu linie de dialog urmată de litera Î;
          – paragraf care începe cu combinaţie de ghilimele şi linie de dialog, urmată de litera Î;
     Din aceste motive va trebui să înregistrăm fiecare tip sde situaţie în parte.

          – la "căutare" vom avea [î] sau [— î], [„î], [—„î] [„—î] etc.
          – la "înlocuire cu" punem  [Î] sau [— Î], [„Î], [—„Î] [„—Î]
          – condiţii activate obligatoriu: "Potrivire perfectă" şi "Început de paragraf".          Pentru orice eventualitate activăm şi condiţia "Confirmare la înlocuire".

     Procedăm similar cu celelalte litere.

     Sper ca explicaţiile să fi fost de folos.
     Dacă sunt probleme aştept să fie semnalate pentru a da mai multe detalii.

     Seven   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
aditz_a
Membru Gold

Inregistrat: acum 15 ani
Seven, respect!
E bine că ai specificat <<Pentru orice eventualitate activăm şi condiţia "Confirmare la înlocuire".>>
Dar era bine să mergi mai departe cu explicațiile.

Îmi cer scuze că intervin peste tine, dar simt nevoia să o fac și sunt sigur că o să mă înțelegi (văd cât ești de dăruit în activitatea ta de aici) după ce vei citi tot mesajul meu.
Vor fi unii (mai ales începătorii în DTP) care din diverse motive nu vor înțelege cât de importantă este remarca ta și vor face totul cu Replace All.
Să nu mă înțeleagă greșit nici ei.
NU îi judec.
Resect munca lor, mai ales că eu nu contribui cu nimic. Sunt doar un parazit aici.
Doar că încerc să îi ajut și eu cum mă pricep.

Să nu considere doar un amănunt lipsit de importanță "Confirmare la înlocuire".

Problema este cu litera î după ? sau ! sau elipsis, la dialoguri, de exemplu.

Iată:
- ... ! întări și el spusele ei.
sau
- ... ? îngăimă ea.
Aici trebuie să rămână î, nu Î.

Și mai rău este când avem CAPS toate literere care urmează după ? sau  ! sau elipsis, într-un dialog.

Ceva de genul:
- ...? Aruncă el momeala.
sau
- ...! Zise el gânditor.

Am citit așa ceva și a fost ... enervant.
D-asta a spus Seven "Confirmare la înlocuire".

Și vreau să mai adaug, pentru cei care se feresc, din diverse motive, să folosească Wildcards.
Să nu se mai ferească.
Dacă nu știu cum, pot începe de aici:

Și nici de toate celelalte opțiuni de la Find&Replace.
Ajută mult.
Păcat numai că Wordul are atât de puține opțiuni.

Modificat de aditz_a (acum 4 ani)


pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Salut prieteni,
Am început si eu să folosesc Autocorect şi încep să ma descurc binişor, citind în permanenţă recomandările.
Până acum, am o problemă pe care nu reuşesc să o rezolv si anume, înlocuirea automată a unor cuvinte la rularea OCR plus.
Este vorba de cuvinte de genul: s'a să fie înlocuit cu s-a
n'am cu n-am, să'i cu să-i, m'am cu m-am, n'am cu n-am, s'o cu s-o, într'o cu într-o, într'un cu într-un, etc.

Deci înlocuirea acelui apostrof cu cratimă.
Operaţia de înlocuire o pot face doar rulând manual documentul din meniul "Ortografie" al OCR şi alegerea cuvântului sugerat de program cu "Modifică toate".
Oare nu e posibil sa se faca automat la rularea OCR prin  nişte setări iniţiale?!

Mulţumesc.

Modificat de dacopand (acum 4 ani)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Salutare, dacopand!

      Există un pachet special de dicţionare pe care le-am numit "Interbelice" care rezolvă situaţii ca cele arătate de tine, dar şi alte genuri de probleme.
      Pentru că digitalizarea cărţilor interbelecice se face destul de rar, aceste dicţionare nu au fost integrate în pachetele obişnuite de dicţionare... şi de altfel nici nu am prevăzut o astfel de situaţie pe vremea când s-a lucrat pe forum softul AutoCorect OCR Plus, ca să propunem nişte opţiuni în genul ăsta.

      Vreau să informez din start că pachetul "Interbelice" nu este foarte bine organizat, deşi dicţionarele au o anumită ordine... dar sunt dicţionare pe care le-am creat personal pentru mine şi la care am tot adăugat alte înregistrări.

      Încerc să mă mai uit puţin prin ele şi revin peste 1-2 ore cu o arhivă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Ok,

Mulţumesc.
Ar fi necesar să ştiu unde să le plasez acele dicţionare ca să mearga automat.
Am descărcat de pe site pe cele din 11.11.2018. le-am pus în Roaming\Autocorect Contemporan, le-am adăugat la rulare grup dictionare inlouire multiplă, dar merg doar cu confirmare si sigur că dintr-un punct de vedere e bine , deoarece lucrează pentru toate cuvintele unde trebuie înlocuit apostrof cu cratimă, nu numai unde sunt eu interesat.
Stimă,

Modificat de dacopand (acum 4 ani)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Cred că înainte de a posta linkul cu dicţionarele interbelice, s-ar cuveni să explic cum procedez eu la prelucrarea acestor texte cu grafie interbelică.

     Rularea AutoCorect o fac în 4 etape:
     – Et. I – rulez în modul obişnuit până la apariţia înlocuirilor cu confirmare, practic până la dicţionarul CO_Var4.
     – Et. II – rulez manual în ordine alfabetică Dicţionarele din pachetul „Interbelice”
     – Et. III – revin la pachetul OCR_DIC şi rulez manual dicţionarele CO_Var4 – CO_Var7.
     – Et. IV – rulez manual dicţionarele CO_Vt1 – CO_Vt4 dic acelaşi pachet, OCR_DIC.

     La ce mă refer când zic „rulare manuală”?
     Practic încarc/deschid manual fiecare dicţionar în parte.
     Se fac înlocuirile cu confirmare şi dacă este nevoie se întrerupe rularea şi se fac şi modificări de la tastatură, apoi se reia rularea ignorând [apăsând pe butonul Renunţ] modificările făcute deja şi continuând până când apare necesară întreruperea şi editarea de la tastatură.
     Sunt convins că cei mai mulţi utilizatori consideră metoda greoaie şi ar prefera să renunţe la atâtea întreruperi, dar ca unul care foloseşte permanent AutoCorect vă spun că timpul consumat la rularea în acest mod este incomparabil mai scurt decât timpul necesar la corectura manuală dacă nu facem cât mai multe înlocuiri în AutoCorect.

     Să revin un pic la dicţionarele „Interbelice”
     Ele nu sunt făcute pentru texte bine scanate, caz în care s-ar înlocui apostroful cu cratimă şi alte câteva forme vechi ale cuvintelor.
     Aceste cărţi interbelice au hârtia îmbătrânită şi apar tot felul de puncte în textura hârtiei, puncte pe care Abbyy le interpretează ca fiind apostrofuri, asteriscuri sau puncte, aşa că per total vom avea apostrofuri reale care trebuie înlocuite cu cratimă şi apostrofuri false care trebuie şterse.
     Din această cauză sunt multe dicţionare: unele corectează cu cratimă cuvinte scurte, altele cuvinte lungi, unele elimină apostrofurile, altele elimină asteriscurile şi multe fac înlocuiri de cuvinte cu forme vechi pe tipuri de înlocuiri.

     E important de menţionat că grafia interbelică nu este aceeaşi pe toată perioada, deoarece au avut loc mai multe reforme lingvistice în această perioadă.
     Pentru început eu propun să fie rulate toate dicţionarele interbelice în ordine în care apar în pachet.

     Postez mai jos un link spre arhiva DIC_AC[mai 2020].rar
     Arhiva cuprinde 3 pachete de dicţionare actualizate la zi şi anume: OCR_DIC, Dic. Uzuale şi Dic. Interbelice.

     Link:

     Referitor la întrebarea din ultima postare:
     Practic dicţionarele interbelice ocupă un subfolder separat şi pentru că marea majoritate a înlocuirilor sunt cu confirmare, nu prea se justifică rularea automată.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Am descarcat arhiva si am montat-o în Roaming\AutoCorect Contemporan.
Eu aveam setat  la 9.Rulare grup de dicţionare multiplă 4 dictionare şi anume:CO_Vt1.imd,CO_Vt2.imd,CO_Vt3.imd,CO_Vt4.imd.
Rulam OCR până ce se ajungea la confirmări din grupul de dicţionare, efectuam corectarea sugerată din dicţionare, şi la final dupa "corectare cuvinte rupte" şi "marcare caractere", închideam procesul si salvam tot în format rtf.
Deschideam din nou fişierul salvat cu OCR PLUS  şi fără să mai bifez "începe cu primul rând" dam click pe "Ortografie" în stânga, şi începeam corectarea manuală a cărtii(având deschis în spate şi documentul original, pentru confruntare).Corectarea manuală o făceam utilizând sugestiile OCR si documentul original.
Dar întâmpinam acele probleme menţionate mai sus la unele cuvinte care se repetau şi la care apostroful trebuia înlocuit cu cratimă.


Cum voi seta acum la punctul 9.Rulare grup de dicţionare multiplă? CUM se setează la OPŢIUNI?!Practic ar trebui să fie căsuţa goală şi să fie introduse pe rând şi rulate dicţionarele în etapele sugerate de dl seven!!

Mulţumesc.

Modificat de dacopand (acum 4 ani)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Îmi cer scuze că nu am putut intra mai devreme pe forum.
      La vreme de PlanDemie a trebuit să fac astăzi pe instalatorul sanitar şi mi-a reuşit destul de greu.
      Dar să revenim la treburile noastre.

     Deci plecăm de la calea amintită de @dacopand şi anume ...Roaming\AutoCorect Contemporan.
     Dacă deschidem acest folder vom găsi instalate deja următoarele:
          – 4 fişiere: „AutoCorect.ini”, „Combinatii.dic”, „ListaDictionare.txt” şi „RulareAutomataOCRPlus.txt”
          – un folder pe nume „Dictionare”.

      În folderul „Dictionare” avem deja câteva dicţionare: implicit.imd, a.dic, i.dic, np.dic şi p.dic. şi trebuie să avem câteva subfoldere şi anume:
      - subfolderul OCR_DIC în care trebuie să fie cele 39 de dicţionare "imd" al căror nume încep cu CO [de la CO_Apco.imd până la CO_Vt4.imd]. Atenţie acest subfolder trebuie să-l cheme exact OCR_DIC şi nu altfel, pentru că numai aşa funcţionează dicţionarele.
      - subfolderul cu dicţionare Uzuale poate fi numit oricum îşi doreşte utilizatorul.
      - subfolderul Interbelice despre care am vorbit azi poate fi şi el numit cum doreşte utilizatorul.
      - subfolderul periere Finală poate fi şi el redenumit.

      NOTĂ 1: pentru că eu am instalat AC de mulţi ani, nu mai ştiu dacă folderul OCR_DIC este creat deja de executabilul AC sau trebuie creat manual. Celelalte 3 subfoldere sau mai multe se crează de utilizator.

      Acum să stabilim cum rulează aceste dicţionare:
      Toate dicţionarele din OCR_DIC sunt puse în funcţiune de softul AC prin opţiunile sale.

      NOTĂ 2: Dicţionarele Vt1-Vt4 nu rulează automat la comanda "Rulează toate funcţiile de corectare OCR", ci rulează în grup de 4 cu Opţiunea "Modificări speciale de text/Modificări text corectat eronat.
      Practic după definitivarea AC am profitat de această opţiune şi am pus acolo modificări cu confirmare.

      Dicţionarele Uzuale rulează în opţiunea "9. Rulare grup de dicţionare de înlocuire multiplă"
      Pentru a stabili dicţionarele ce rulează în această opţiune se procedează astfel:
      Se activează opţiunea "9" şi apare o fereastră goală sau care conţine dicţionare, fereastră prevăzută cu mai multe butoane: Rulează, Adaugă, Şterge, Mută sus, Mută jos.
      Să presupunem că folderul este gol: acţionăm butonul "Adaugă" şi mergem în subfolderul UZUALE şi putem să selectăm toate dicţionarele uzuale, adică 36 dicţionare.
      Dacă avem alte dicţionare aici, ar fi de preferat ca mai întâi să fie şterse toate dicţionare şi apoi adăugate cele necesare.
      Menţionez că dacă la adăugare se pot adăuga grupuri de dicţionare, la Şterge se şterge doar câte un dicţionare.

      Dicţionarele Interbelice şi cele din Periere finală le-am gândit să fie rulate manual.

      Aceasta ar fi scurt explicaţia rulării dicţionarelor.
      NOTĂ 3: la opţiunea "9. Rulare grup dicţionare ÎM" nu punem niciun dicţionar OCR_DIC, deci cele care încep cu CO_ pentru că aşa cum am spus fiecare dintre ele este pus în funcţiune de softul AutoCorect.

      Dacă mai sunt neclarităţi vă rog să le postaţi.
      Sunt o seamă de colegi care chiar dacă au unele neclarităţi evită să posteze întrebări, mergând pe ideea că o anumită întrebare poate suna penibil sau prostesc.
      Convingerea mea este că nicio întrebare nu este prostească sau penibilă, dacă este pusă cu bună intenţie. Răspunsurile pot fi adeseori prosteşti sau penibile, dar nu întrebările. În cel mai rău caz o întrebare poate fi cu rea intenţie... dar asta e altă problemă.

      Toate cele bune!

      Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Mulţumiri dlui seven pentru răspunsuri - este un om deosebit.

Am învăţat multe azi despre OCR Plus şi posibil să mai întreb şi de setările din interiorul AC, poate mai e necesar să mai setez si pe acolo câte ceva.
Deocamdată iată ce constat eu:

Dicţionarele Vt1-Vt4   rulează  şi dacă le pui la 9.(cum le-am pus eu pe toate 4) şi fac acelaşi lucru ca şi  Opţiunea "Modificări speciale de text/Modificări text corectat eronat.

Nu poţi trece mai departe de punctul 9 cu ele puse acolo, până nuj faci Modificări speciale de text/Modificări text corectat eronat.

Dacă nu le pui acolo deloc şi laşi căsuţa goală, programul rulează automat până la sfârşit.
Apoi cu indicaţii dl seven le rulezi - am verificat şi merge.

Am pus în căsuţă toate(şi numai) dicţionarele uzuale şi am rulat programul si programul a rulat până la sfârşit, fără să ceară vreo confirmare.Apoi am dat click Opţiunea "Modificări speciale de text/Modificări text corectat eronat şi am făcut manual corecturile sugerate.


"Dicţionarele Interbelice şi cele din Periere finală le-am gândit să fie rulate manual. " - zice dl seven si eu întreb în neînţelegerea mea: CUM SE FACE ASTA  -  RULAREA MANUALĂ?Adică le pun şi pe astea tot în căsuţa unde le-am pus pe cele uzuale?!? si dau rulare?!?Am făcut asta şi nu cred că e bine că apar "răgălii"....

Mulţumesc.

Modificat de dacopand (acum 4 ani)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Orice dicţionar adăugat la Opţiunea 9 poate rula acolo... asta este adevărat, dar Ac este gândit ca la Opţiunea 9 să ruleze doar dicţionare Uzuale.

     Trebuie să dau câteva explicaţii: primele 8 opţiuni rulează dicţionare care funcţionează automat, deci nu au nicio înlocuire cu confirmare.
     La Opţiunea 9 trebuie să ruleze doar dicţionare uzuale care şi ele sunt în totalitate automate, deci nici ele nu conţin dicţionare cu confirmare.
     La opţiunea 10 sunt 3 dicţionare cu înlocuire automată [mai exact [Var1-var3] şi 4 dicţionare mixte [unele înlocuiri rulează automat şi alte doar cu confirmare].
     În afara opţiunilor mai sunt 4 dicţionare cu confirmare, adică Vt1-Vt4.

     În concluzie, avem 31 de dicţionare OCR_DIC şi 36 de dicţionare care rulează complet automat.

     Şi acum să fim atenţi:
     Dacă la opţiunea 9 avem cele 36 dicţionare uzuale şi numai acestea fără altele, înseamnă că la rularea prin comanda unică din meniul OCR_DIC vor rula automat 67 de dicţionare, deci calculatorul ronţăie singur şi utilizatortul poate să nu fie în faţa calculatorului.

     Calculatorul va rula până la opţiunea 10.2 unde va rula var1-VaR3 ŞI VA începe rularea dicţionarului Var4 şi se va opri undeva după înlocuirea nr.47 a dicţionarului, adică acolo unde va fi prima înlocuire cu confirmare.
     Repetăm: în acest fel vor fi rulate 10 opţiuni cu 67 de dicţionare.

     Să revenim acum la varianta propusă mai sus.
     Dacă în opţiunea 9 adăugăm şi alte dicţionare, adică din cele cu confirmare, atunci calculatorul se va opri la prima înlocuire cu confirmare, dar asta înseamnă că nu mai rulează opţiunea 10, deoarece calculatorul s-a oprit la opţiunea 9.

     Am să încerc să fiu şi mai explicit: În opţiunea 9 nu are niciun rpst să adăugăm dicţionare din OCR_DIC pentru că ele ar rula o dată conform softului şi încă o dată la opţiunea 9, deci consumăm timp aproape dublu.
     Bun. Să mergem mai departe: nu punem toate dicţionarele OCR_DIC, ci numai cele 4 Vt.
     Ei bine, calculatorul se va opri la prima înlocuire cu confirmare din Vt1, dar nu va mai rula dicţionarele Var1-Var4 care rulează automat la opţiunea 10.

     În concluzie, la opţiunea 9 punem doar dicţionarele Uzuale.

     Să trecem la rularea manuală:
     Pur şi simplu apărăm iconul înlocuiri multiple, adică ultimul icon din dreapta sus, cel ce seamănă cu două persoane care se ţin de mână. Sau din meniul "Editare" alegem opţiunea "Înlocuire multiplă". Totuşi, eu recomand iconul.
     Deci accesăm opţiunea Înlocuiri multiple şi se va deschide automat dicţionarul "implicit.imd".
     Accesăm butonul "Deschide dicţionar" şi căutăm dicţionarul de rulat, iar după încărcarea dicţionarului apăsăm butonul "Rulează". De câte ori închidem dicţionarul AC va rămâne în pagina respectivă şi putem face corecţii direct de la tastatură.

      Sper că până aici am clarificat cât de cât problema rulării dicţionarelor.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Vă salut cu drag,

Am înţeles cum se face rularea manuală acum a dicţionarelor.
Pe măsură ce voi lucra, dacă mai întâmpin nelămuriri, o să mai apelez.
Să vedem acum cum va merge cu noile setari si foldere actualizate ale dictionarelor.

Respect pentru muncă şi RĂBDARE dle Seven.


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutare!
     Îmi cer iertare! Din neatenţie nu am postat corect calea de căutare a dicţionarelor.
     Am să revin şi am să corectez şi în posturile anterioare.

     Deci plecăm de la calea amintită de @dacopand şi anume ...Roaming\AutoCorect Contemporan.
     Dacă deschidem acest folder vom găsi instalate deja următoarele:
          – 4 fişiere: „AutoCorect.ini”, „Combinatii.dic”, „ListaDictionare.txt” şi „RulareAutomataOCRPlus.txt”
          – un subfolder pe nume „Dictionare”.
     
     În acest subfolder „Dictionare” se instalează/crează subfolderele OCR_DIC, Uzuale, Interbelice sau alte dicţionare personale.
     În mod greşit în postările anteriare am spus că subfolderele cu dicţionare se instalează direct în folderul „AutoCorect Contemporan”.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
La mine nu apare fişierul „Combinatii.dic”.

În rest toate sunt aşa cum ziceţi şi eu le pusesem unde trebuie...

Modificat de dacopand (acum 4 ani)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      În fişierul „Combinatii.dic” se înregistrează scurtături de la tastatură şi probabil că apare atunci când se face prima înregistrare.
      Este vorba de opţiunea „Instrumente” > „Combinaţii de taste” cu care se pot seta scurtături de la tastatură; adică pentru a obţine să zicem ghilimele româneşti de început de forma 99 jos putem folosi scurtătura Ctrl+2... pentru ghilimele de sfârşit de forma 99 sus se setează Shift+Ctrl+2.... etc...

      Oricum este o problemă cu funcţia asta... ştiu că s-a discutat pe vremuri ceva în legătură cu ea, dar nu-mi mai amintesc care era problema. Cert este că unele scurtături funcţionează, altele nu...
      De pildă mie îmi merg ghilimele amintite mai sus, dar nu pot să setez sub nicio formă EmDash, indiferent dacă pun semnul — sau dacă pun codul ^+.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Ok.
Deci nu este nicio problemă că la mine lipseşte acel fişier.
Încă nu am experimentat scurtăturile.
Aveţi dreptate cu "apariţia" fişierelor, deoarece şi celelalte două(„ListaDictionare.txt” şi „RulareAutomataOCRPlus.txt”) au aparut după ce am intrat prin setări.

Modificat de dacopand (acum 4 ani)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Am început să corectez un document aplicând ultimile sfaturi şi setări.
A aparut o problemă şi anume, faptul că, dacă setez fontul la Bookman Oldstyle din OCR Plus -->Conversii preliminare ---> setare text şi font la mărime unică ........literele "ş" şi "ţ" nu mai sunt recunoscute.

Pentru font Arial merge bine.
Oare unde este problema ?!?


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Este o chestie legată de diacritice Ş,s Ţ,ţ cu virgulă versus Ş,s Ţ,ţ cu sedilă...
      ...dar nu exact cam care ar fi problema în concret.
      În principiu s-ar părea că tu ai setată tastarura pe Romanian Legacy/Tradiţională care "vede" diacriticele ŞŢ cu cedila [adică mai vechi], iar textul are dicritice ŞŢ cu virgulă şi de aceea nu se văd.
      Nu e nicio problemă că foloseşti această variantă de tastatură; ba mai mult AutoCorect are înregistrările cu diacritice cu cedila.

       - În principiu mă interesează dacă textul de rulat este obţinut de tine personal în calculatorul cu care lucrezi acum sau este un text luat de la altă persoană.
       - Problema se rezolvă direct în AutoCorect, astfel:
       Din meniul "Editare" alege penultima opţiune "Conversie diacritice" şi apoi a doua opţiune "cu  virgulă în diacritice cu sedilă."
        Acum setează din nou fontul Bookman Old Style şi verifică dacă se văd diacriticele ŞŢ.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Vă salut,
Este un text obţinut de mine dintr-un document pdf trecut prin ABBY 15 şi salvat în format rtf(formatted text).
Am procedat cum aţi spus şi acum merge şi Bookman oldstyle, dar e necesar ca la fiecare document nou să fac procedura cu Editarea cu conversie diacritice - nu a ţinut minte Autocorect....la rulare OCR plus , iar nu citeşte Ş , Ţ, dacă nu intru înainte de rulare pe tabul Editare.
Mulţumesc.

Modificat de dacopand (acum 4 ani)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Da.... ai dreptate... am uitat că Abbyy 14 şi 15 folosesc diacritice cu virgulă.
     Eu folosesc încă Abbyy 12 şi până la el Abbyy realiza OCR cu diacritice cu virgula.

     Deci de ţinut minte: după extragerea textului din Abbyy 15 [14] încărcăm OCR-ul în AutoCorect şi facem conversia virgulă > sedila.

     Există pe forum şi două macrocomenzi Word care fac conversia virgulă > sedilă sau sedilă > virgulă, iar eu am implementate aceste macro în Word aşa că nu este necesar să fac conversia în AutoCorect.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
O să setez font ARIAL , unde nu e necesară această etapă, scoate corect diacriticile.
Deja trebuie prea multe proceduri ţinute minte.


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Practic Arial are ambele variante de diacritice şi de aceea se văd, dar ele tot cu virgulă sunt.
     Trebuie să precizez că toate dicţionarele AutoCorect folosesc diacritice cu sedila, deci cu astfel de diacritice funcţionează el corect.
     Ar fi bine ca mai întâi să faci conversia... sau să foloseşti Abbyy 12... oricum ar fi e bine să foloseşti diacritice cu sedila.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 ani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Ok.
Atunci voi folosi cum spune dl Seven pentru o funcţionare corectă.

Mulţumiri dl Seven încă odată.

Respecte.


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 ani
   
Stelevadris
Moderator

Inregistrat: acum 19 ani
EmDash si restul le puteti adauga in fereastra caractere comune.
Chiar daca nu merg combinatiile de taste, le puteti accesa rapid de acolo.

t>


_______________________________________
Totul despre cărți - About e-books - Tehnici de scanare, sfaturi, proiecte etc. - Support, future projects, etc.

pus acum 4 ani
   
Pagini: 1  

Mergi la