Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
Dimitriu livia Profile
Femeie
24 ani
Bucuresti
cauta Barbat
26 - 55 ani
Forum Romania Inedit / Totul despre cărți - About e-books / [AC] Dictionare Inlocuire Multipla Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini:  1 2
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Pentru că mi s-au cerut mai multe lămuriri despre editarea dicţionarelor Ac de tip IM [înlocuire multiplă] voi posta aici câteva lucru în acest sens.
     Intenţia mea este să reorganizez complet acest topic, astfel încât el să se transforme într-un tutorial pas cu pas privind dicţionarele de înlocuire multiplă în AutoCorect OCR Plus.
     Pentru asta voi peria sau elimina toate discuţiile care semnalau probleme ce au fost deja rezolvate şi voi reedita fiecare postare în parte.... pentru asta va fi necesar ceva mai mult timp.

     Deocamdată am să continui de la această postare cu câteva explicaţii la întrebările primite, urmând ca în timp să mut fiecare problemă la locul ei.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Ei bine! Să începem.


     ÎNTREBARE:  Cu ce program se editează un dicţionar de tip AutoCorect?
     RĂSPUNS:  Deschiderea, crearea unor noi dicţionare sau editarea unui dicţionar de tip "imd" se face doar în programul AutoCorect OCR Plus.


     Pentru anumite prelucrări, editări, adăugiri, modificări se pot folosi şi programe precum NotePad, Excel şi Word, dar acestea vor fi folosite doar complementar prin import-export de înregistrări.
     Exportul din AC în Word sau din AC în Excel şi invers se vor face în mod obligatoriu prin intermediul programului NotePad.
     Astfel se pot face exporturi de înregistrări prin Copy&Paste în felul următor:
     Dicţionar AC → Notepad → Excel  şi invers: Excel → NotePad → Dicţionar AC
sau
     Dicţionar AC → Notepad → Word  şi invers: Word → NotePad → Dicţionar AC

     Pentru ce ar fi necesare astfel de exporturi şi importuri?
     Unele acţiuni sunt mai uşor de realizat în Excel sau Word.

     Dau un singur exemplu: s-a constat că Abbyy recunoaşte de multe ori litera â în locul literei ă.
     Această eroare este frecventă în situaţia în care litera ă este ultima literă a unui cuvânt, dar la cuvintele scurte, de 4-5 litere, eroarea poate apărea în orice poziţie s-ar afla litera ă, inclusiv în situaţia în care ă se află în poziţia 2 sau 3.
     Principalele [cele mai frecvente] cuvinte din 4 litere cu ă în poziţia 3, sunt următoarele:
          agăţ, apăi, apăr, apăs, arăm, arăt, clăi, crăp, grăi, ivăr, luăm, odăi, omăt, ovăz, spăl, stăi, stăm, trăi, udăm, umăr...
     În cazul acestor cuvinte Abbyy le-ar putea reda eronat sub forma:
          agâţ, apâi, apâr, apâs, arâm, arât, clâi, crâp, grâi, ivâr, luâm, odâi, omât, ovâz, spâl, stâi, stâm, trâi, udâm, umâr...

     Putem înregistra fiecare modificare în parte în fereastra de editare a AutoCorect OCR Plus, dar ne putem folosi de un şablon în Excel unde aceste cuvinte vor fi puse în coloană unele sub altele.
     Practic, în Excel un dicţionar AC va ocupa 4 coloane astfel:
        – coloana nr.1: în această coloană apare cifra 1 care înseamnă "înregistrare activă" sau cifra 0 care înseamnă "înregistrare inactivă", adică AC nu o va citi, nu o va prelucra la rulare. AC interpretează o înregistrare inactivă ca fiind inexistentă. În Dicţionarul AC această primă coloană are titlul ...; să nu confundăm cu a doua coloană, numită Nr..
        – coloana nr.2: aici apar cuvintele de căutat [cuvintele eronate]; în Dicţionarul AC - coloana Caută.
        – coloana nr.3: aici apar cuvintele cu care se face înlocuirea [cuvintele corecte]; în Dicţionarul AC - coloana Înlocuieşte cu.
        – coloana nr.4: condiţii în Dicţionarul AC - coloana Opţiuni.

     Bun. Avem lista de cuvinte corecte - 4 litere, litera ă în poziţia 3.
     În Word ordonăm cuvintele în coloană, fără spaţii sau taburi înaintea sau după aceste cuvinte, după care le mutăm în Notepad şi apoi în Excel în coloana nr.3
     Revenim în Word şi înlocuim litera ă din poziţia 2 a fiecărui cuvânt cu litera â şi la sfârţit mutăm această listă de cuvinte în Wordpad apoi în Excel în coloana nr.2.
     Fiindcă avem în Excel un şablon în cadrul căruia am adăugat cele două coloane, înseamnă că avem coloanele 1 şi 4 completate. Înseamnă că putem copia fragmentul din Excel care va cuprinde 4 coloane şi 20 de rânduri şi-l vom copia în Notepad şi de aici în Dicţionarul AC.

     Adevărul este că aceste lucruri sunt un picuţ mai complicate: după fiecare înregistrare trebuie să existe un Tab care înseamnă final de înregistrare, astfel că în realitate, în Excel se copiază 5 coloane, ultima fiind o coloană goală, iar în NotePad se urmăreşte ca după fiecare înregistrare să existe un Tab şi numai unul şi doar după aceea se face copierea în Dicţionarul AC. Dacă există o singură eroare, în Dicţionarul AC se vor copia doar înregistrările din faţa primei erori.

     Aceste chichiţe şi mărunţişuri le vom discuta pe parcurs.
     Eu am vrut să arăt că doar în AC se poate crea sau edita un dicţionar, dar că în mod complementar ne putem folosi şi de alte programe pentru a rezolva mai repede anumite operaţiuni.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     DICŢIONARE AC – NIMIC MAI SIMPLU



     Adeseori întâlnim cuvinte scrise eronat pe care AutoCorect nu le corectează.
     Putem să-i zicem ceva de dulce celui care a făcut dicţionarele şi să facem corectura manuală, dar putem să ne uşurăm munca şi să "culegem" noi personal astfel de cuvinte în nişte dicţionare personale pe care le putem rula suplimentar la rularea OCR Plus, ori le putem rula ori de câte ori dorim fără a activa meniul OCR Plus.

     Crearea şi editarea unui dicţionar "imd" este un lucru destul de simplu şi la îndemâna oricărui doritor.
      Este adevărat că există în AC şi anumite condiţii care par foarte complicate, dar pentru rezolvarea celor mai multe erori este sunt suficiente două sau trei condiţii.

      Să luăm un prim exemplu:
      erori: fiindcâ, fiindca, fiincă, fundcă, fiinclcă – cuvânt corect: fiindcă;
      Cuvintele fiindcâ, fiindca, fiincă, fundcă, fiinclcă nu există în limba română, deci aceste erori sunt erori totale şi permanente.
      În astfel de cazuri, înlocuirile automate realizează modificări sigure, cu 100% efecte benefice şi 0% efecte secundare.
      Pentru aceste înlocuiri avem nevoie de doar două condiţii: "Cuvânt întreg" [Ci] şi "Păstrează capitalizarea" [Pc].
          fiindcâ >> fiindcă   Ci Pc
          fiindca >> fiindcă   Ci Pc
          fiincă >> fiindcă   Ci Pc
          fundcă >> fiindcă   Ci Pc
          fiinclcă >> fiindcă   Ci Pc

      Să luăm un alt exemplu:
      eroare: intre – cuvânt corect: între;
      În acest caz, înlocuirea  "intre >> între   Ci Pc"   este o înlocuire nesigură şi va produce multe efecte nedorite, deoarece în text vor exista şi multe situaţii în care varianta "intre" este corectă, iar înregistrarea sub această formă va produce modificarea şi în aceste cazuri.
      Atunci, ce facem? Renunţăm la înregistrarea înlocuirii şi recurgem la corectura manuală?...
      Nu, nu renunţăm.
      Înregistrăm modificarea, dar adăugîm condiţia "Cu confirmare" [Cli].
      Userul va stabili el însuşi poziţiile din text în care va confirma sau va refuza executarea înlocuirii.
      Înlocuirea corectă este:
          intre >> între   Ci Pc Cli

      Bineînţeles că există înlocuiri care sunt mai eficiente dacă li se adaugă alte condiţii, dar cu aceste 2, respectiv 3 condiţii, se pot rezolva mii de erori.
      După ce vom înregistra câteva zeci de modificări, vom constata că editarea unui dicţionar AC este ceva deosebit de simplu şi încet-încet vom înţelege logica celorlalte condiţii şi le vom adăuga pentru ca dicţionarul să fie mai performant.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     PONT: Cum pot rula automat dicţionare personale în AC OCR Plus?



     Putem crea un număr de 4 dicţionare personale de timp înlocuire multiplă, pe care le putem rula în mod automat în AC OCR Plus, ori de câte ori dorim, fără să trebuiască să rulăm întregul meniu OCR Plus.

     AutoCorect are 39 de dicţionare în folderul OCR_DIC.
     Meniul OCR Plus rulează automat doar 35 dintre aceste dicţionare.
     Un număr de 4 dicţionare rulează doar dacă accesăm opţiunea "Modificări speciale de text → Modificare text corectat eronat".
     Menţionez că această opţiune nu este una complementară la rularea automată a meniului OCR Plus, ci este o opţiune complet separată, ori - mai degrabă - un fel de alternativă la rularea automată OCR Plus.

     Opţiunea a fost creată suplimentar pentru utilizatorii avansaţi şi "cu pretenţii speciale", care cunosc foarte bine funcţiile programului AutoCorect şi care doresc să realizeze nişte modificări speciale şi de dificultate ridicată a unor texte care au fost deja corectate dar care au anumite erori. Opţiunea rulează un pachet de 4 dicţionare. În proporţie de peste 90%, aceste înregistrări au condiţia "Cu confirmare".
     Aceste dicţionare sunt ultimele 4, mai exact: CO_Vt1.imd, CO_Vt2.imd, CO_Vt3.imd şi CO_Vt4.imd.

     Dicţionarele fac două tipuri de modificări: o parte dintre modificări sunt de tip corecţii erori OCR şi acestea sunt executate deja de rularea automată a meniului OCR Plus, iar o altă parte dintre înregistrări fac corectări de limbă.
     În principiu, cine rulează meniul automat OCR Plus nu trebuie să mai ruleze şi această opţiune deoarece modificările sunt deja făcute şi vom fi agasaţi din nou cu o serie de confirmări pe care va trebui să le refuzăm în marea lor majoritate.

     Una peste alta, majoritatea utilizatorilor nu folosesc deloc aceste dicţionare.
     Acestor utilizatori mă voi adresa în continuare.
     Utilizatorii avansaţi, care foloseasc opţiunea "Modificări speciale de text", ştiu ei singuri cum să-şi creeze şi editeze noi dicţionare.


     ATENŢIE!...   ATENŢIE!...   ATENŢIE!...

     Soluţia pe care o propun trebuie să fie foarte bine înţeleasă şi aplicată întocmai, în caz contrat pot interveni deficienţe în funcţionarea programului.
     Dacă sunt aspecte neclare, rog puneţi întrebări ca să clarificăm totul înainte de a trece la aplicarea în practică a pontului pe care vi-l propun.

     Practic, vă propun să realizaţi 4 dicţionare proprii, pe care să le rulaţi cu opţiunea "Modificări speciale de text", ori de câte ori doriţi.

     ■ Pasul 1: Dezactivăm prin redenumire [deci, nu le ştergem] cele 4 dicţionare: CO_Vt1.imd ÷ CO_Vt4.imd.
     La fiecare dicţionar adăugăm la început particula [INI] şi vom avea  [INI]CO_Vt1.imd... iar cele 4 dicţionare vor fi sortate şi puse la începutul listei din folderul OCR_DIC.
     În acest fel, AutoCorect OCR Plus nu va mai "vedea" aceste dicţionare, deşi ele există şi vor putea fi activate oricând prin redenumirea cu numele lor reale.

     ■ Pasul 2: Vom crea 4 dicţionare personale pe care le vom salva în folderul OCR_DIC sub numele CO_Vt1.imd, CO_Vt2.imd, CO_Vt3.imd şi CO_Vt4.imd.
     În cazul în care avem deja 4 dicţionare personale, le vom redenumi ca mai sus şi muta în folderul OCR_DIC.

     ■ Pasul 3: Putem îmbunătăţi aceste 4 dicţionare ori de câte ori descoperim erori pe care AutoCorect nu le-a rezolvat şi putem rula cele 4 dicţionare cu o singură comandă, accesând opţiunea "Modificări speciale de text" de oricâte ori dorim, acţiune care va dura doar câteva secunde.

     ■ Pasul 4: Dacă va trebui să recurgem la rularea adevăratelor dicţionare Vt1÷Vt4, atunci putem redenumi cele 4 dicţionare personale, adăugând în faţa numelui particula [DP] "dicţionar personal", astfel ele devenind inactive pentru AC, şi reactivăm adevăratele dicţionare prin revenirea lor la numele iniţiale.

     Putem activa dicţionarele personale sau adevăratele dicţionare Vt1÷Vt4 de câte ori dorim, dar trebuie să fim atenţi să nu ştergem din greşală pe vreunul dintre el. pentru orice eventualitate, este bine să facem câte o arhivă cu dicţionarele ce urmează să fie dezactivate înainte de a le redenumi.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     ÎNREGISTRĂRI ACTIVE – ÎNREGISTRĂRI INACTIVE




     Imaginea de mai jos reprezintă fereastra de editare a unui dicţionar de înlocuire multiplă.
     Fereastra nu este desfăşurată complet, în sensul că în partea de jos a ferestrei mai există nişte opţiuni care în acestă imagine sunt "ascunse".
     Am evidenţiat color anumite zone ale imaginii spre a fi mai uşor de urmărit explicaţiile.
     


     Să analizăm mai întâi prima coloană a unui dicţionar de înlocuire multiplă, coloană pe care am şi evidenţiat-o color.
     Această coloană arată starea activă sau inactivă a fiecărei înregistrări în parte.
     Deşi imaginea este destul de sugestivă, cred că nu strică două-trei explicaţii.
     Dacă pătratul din coloană este bifat, adică în interiorul lui apare semnul de bifă de forma literei "V", înregistrarea este activă şi la rularea dicţionarului ea realizează modificările de rigoare.
     Dacă pătratul din coloană este nebifat, adică interiorul său este gol, înregistrarea nu este activă şi la rularea dicţionarului ea nu va fi "citită" de program, ca şi când ar fi ştearsă ori o astfel de înregistrare n-ar exista în dicţionar.

     În imagine constatăm că 3 înregistrări sunt inactive, marcate color cu albastru deschis; acestea sunt următoarele:
          – înregistrarea nr. 1 – este un fel de titlu [nume] al dicţionarului şi are doar rol informativ, pentru ca pe timpul lucrului cu mai multe dicţionare, să ştiu unde înregistrez diversele modificări.
          – înregistrările nr. 2 şi 11 au rol de separatoare între diferite grupe de înregistrări.

     Pentru ca aceste înregistrări să rămână doar cu scopul informativ pentru care au fost create şi să nu-şi producă efectul la o activare din greşală, ele au încă 2 măsuri de siguranţă:
          – în coloana "Caută" primele semne sunt un grup de 2 ÷ 4 caractere "Division Sign" Unicode 00F4 [ ÷÷ ÷÷÷ ÷÷÷÷ ] sau "Multiplication Sign" Unicode 00D7 [ ×× ××× ×××× ], şiruri de caractere aproape imposibil de întâlnit într-un text, astfel că programul nu va găsi înregistrarea şi nu va realiza modificări.
          – înregistrările au condiţia "Cu confirmare", după cum se vede în coloana Opţiuni, unde apare abrevierea "Cli" care corespunde condiţiei "Cu confirmare". Dacă din greşală se activează înregistrarea şi prin absurd programul întâlneşte şirul de caractere, din coloana "Caută", modificarea nu se poate face fără confirmare.

     La ce foloseşte o înregistrare inactivă?
     În afară de scopul pur informativ sau de marcaj, ca în exemplele din acest dicţionar, pot exista şi situaţii în care una sau mai multe dintre înregistrările obişnuite am dori să nu mai fie active pentru o anumită perioadă.
     Să ne imaginăm că avem un dicţionar personal pe care-l îmbunătăţim pe măsură ce corectăm şi-l rulăm de mai multe ori pe acelaşi text şi că în respectivul dicţionar sunt un număr de înregistrări cu confirmare. Ştim că înregistrările cu confirmare rulează greu, consumând timp, pentru că fiecare propunere de modificare trebuie acceptată sau refuzată. Bineînţeles că o realuare a rulării dicţionarului nu ar face altceva decât să pierdem timp cu refuzarea situaţiilor pe care le-ar găsi la fiecare rulare.
     Dacă aceste înregistrări cu confirmare sunt puţine şi uşor de găsit [eventual, sunt grupate şi limitate de marcaje de genul celor din imagine], atunci este mai simplu să le dezactivăm, iar când trecem la un nou text le activăm din nou.

     Dacă cineva nu vede rostul activării/dezactivării şi nu doreşte să utilizeze această opţiune, nu-i nicio problemă, important este să se ştie că există această posibilitate.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cand ajungi la sfarsit cu explicatiile, sa stii ca le-as dori si sub forma unuo pdf unitar.
Sau sa anunti ca ai terminat de explicat ca sa le copii din subiect.


pus acum 10 ani
   
Pagini:  1 2  

Mergi la