Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
Profil Elena01
Femeie
19 ani
Braila
cauta Barbat
19 - 31 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect - reactualizare Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini:  1 2 3 4
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
÷÷÷
     Am pus la punct o ultimă versiune a dicţionarelor OCR_DIC şi a Dicţionarelor Uzuale pe care le voi urca pe mediafire în cursul zilei de azi.

     Înainte de asta cred că ar trebui să discutăm un pic despre două opţiuni.
     Este vorba despre opţiunile 5 şi 6:  5.Marcare caractere  şi  6.Ştergere caractere.

     Părerile despre utilitatea acestor opţiuni au fost împărţite între userii încă de la propunerea lor.
     Ambele opţiuni pot fi foarte bune pentru unii dintre utilizatori şi pot fi ignorate de către alţii, fără a considera că unii dintre ei au dreptate şi ceilalţi nu.

     Pur şi simplu activarea sau neactivarea acestor depinde de cel care face corectura.
     Dacă utilizatorul simte că marcarea şi/sau ştergerea acestor caractere [numite de noi şi răgălii] îi este utilă la corectură, atunci va activa una sau ambele opţiuni.
     Dacă pe utilizator îl încurcă la corectură marcarea sau ştergerea acestor caractere, atunci nu va marca opţiunile.



      5. MARCARE CARACTERE


     IMPORTANT:
     Atunci când facem rularea prin AC OCR Plus, dar nu intenţionăm să corectăm noi personal textul, ci va fi oferit spre corectat unei alte persoane, recomandarea mea este să nu fie activată niciuna dintre opţiunile 5 şi 6.
     Dacă cel care va corecta textul, va simţi nevoia marcării sau ştergerii răgăliilor, pur şi simplu va mai rula încă o dată textul prin AC OCR Plus cu marcarea acestor opţiuni.

     Rularea de două sau mai multe ori a unui text prin AC OCR Plus nu produce efecte secundare nedorite, ci dimpotrivă poate corecta unele aspecte care nu au putut fi rezolvate la prima rulare.
     Nu intru în detalii, doar insist să subliniez că o a doua rulare prin AC este benefică.

     Şi încă un aspect legat de acest lucru: persoana care a rulat prin AC cu marcarea caracterelor, e posibil ca din lipsă de timp să nu fi rulat dicţionarele cu opţiuni care rulează greoi dar rezolvă foarte multe probleme.
     Menţionez că sunt persoane [printre care mă număr şi eu] care rulează suplimentar, faţă de ceea ce oferă OCR_DIC mai multe dicţionare de înlocuire cu confirmare pentru a peria textul cât mai bine. Alte persoane, dimpotrivă, preferă să nu piardă timpul cu confirmări, fapt pentru care nu rulează complet nici dicţionarele cu confirmare din OCR_DIC.

     Persoana care va corecta, vede că textul este marcat şi trage concluzia corectă că textul a fost rulat prin AC, dar fără să ştie că nu s-a făcut tot ce se putea în text [adică nu s-au făcut înlocuirile cu confirmare], fapt pentru care nu-l mai rulează şi el, dar rămâne cu o serie de erori pe care le va rezolva la corectura manuală, deşi putea să le rezolve la o reluare a rulării textului prin AC.

     De aceea, repet recomandarea, nu rulaţi opţiune 5.Marcare caractere, decât în situaţia în care corectaţi personal textul rulat şi numai dacă sunteţi convinşi de faptul că această marcare a caracterelor de tip răgălie vă ajută în corectură.


     În legătură cu opţiunea 6.Ştergere caractere, lucrurile sunt şi mai importante astfel că voi reveni cu o prezentare în amănunt a efectelor produse de rularea sau nerularea acesteia.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
÷÷ 2 ÷÷

      ARTEFACTE - RĂGĂLII



     În argoul OCR-iştilor, artefactele mai sunt numite şi "răgălii"

     Ce sunt răgăliile?
     Ca un aspect general o răgălie poate fi orice caracter, altele decât litere, cifre şi semne de punctuaţie care apar în text, cum ar fi:
              – caractere de tip bullet: ■ ♦ • □ ● ▼ ▲ ◄ ► ◊ ◘ ◙
              – diverse caractere cu rol tipografic sau alte caractere, precum:   @ # / \| ÷ × € $ § < > ~ ˇ ^ ˘ # % & [ ] { }
     Răgălii pot fi şi litere din limba română care apar în mod individual, de regulă consoane independente.


     Unde şi de ce apar răgăliile?
     În principal sunt trei situaţii:
              – răgălii care nu au nicio legătură cu textul şi care apar în zone de pagină fără text, ca urmare a unor pete apărute în timp în textura hârtiei. Acestea sunt recunoaşteri de text fals [paragraf fals] şi ar trebui sau ar putea fi şterse în totalitate.

              – răgălii care au legătură cu textul, deci apar în interiorul textului; în acest caz răgăliile ţin locul unor litere reale cu care seamănă, cum ar fi de exemplu: "€" în loc de "C" sau "E", "$, §, 5..." în locul literelor "S, s, Ş, ş..."  caracterul /  în locul literei "z", caracterul  |  în locul literelor fusiforme "l, i, î, f, t, ţ..."

              – răgălii de tip literă individuală: consoane fusiforme în locul semnului exclamării; cuvinte scurte de două [chiar şi de trei] litere la care nu s-a făcut recunoaşterea completă; una dintre litere nu a fost recunoscută ca urmare a faptului că litera era relativ ştearsă, tipărită foarte slab, cerneală decolorată... aşa că în text a apărut o singură literă însoţită sau neînsoţită de un artefact.


      O primă şi simplă concluzie ar putea fi următoarea: 
              ■ răgăliile care nu au nicio legătură cu textul ar putea fi şterse în totalitate fără să afecteze textul. Aceast lucru încearcă să-l facă într-o oarecare măsură opţiunea 2.1 Eliminare paragraf-artefact. Tehnic, opţiunea nu poate acţiona decât asupra răgăliilor care se găsesc la începutul sau la sfârşitul unui paragraf.

              ■ răgăliile care au legătură cu textul, care apar îl locul unei litere, cred că trebuie păstrate în text, pentru că ajută la corectură...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      6. ŞTERGERE CARACTERE


     Cred că acum putem discuta în cunoştinţă de cauză despre opţiunea 6.Ştergere caractere.
     Această opţiune poate şterge toate aceste răgălii, astfel că vom obţine un text mult "mai "curat".
     Atenţie: un text "mai curat" nu înseamnă totdeauna şi un text "mai bun".

     Opţiunea va şterge toate paragrafele false [paragraf-artefact], deci paragrafele care nu există în realitate, şi care în OCR-ul nostru conţin doar răgălii. Acesta este un avantaj incontestabil.

     Opţiunea va şterge deopotrivă şi toate răgăliile care au legătură cu textul, deci care apar în interiorul textului şi ţin locul unei litere reale.
     Acest efect poate fi considerat benefic de către unele dintre persoanele care fac corectură, dar poate fi considerat dăunător de către alte persoane care fac corectură şi care consideră că e mai bine să se păstreze răgăliile.
     Eliminarea sau păstrarea răgăliilor în text are legătură cu metoda de lucru a fiecăruia.


     Să privim imaginea următoare şi vom observa cum unele răgălii însoţite sau nu de litere [alte litere decât cele care ar trebui] ţin locul unor litere reale. Există multe alte situaţii. Aceste exemple le-am găsit într-un text rezultat dintr-o scanare cu probleme a unei cărţi vechi.



     Să privim a doua imagine în care apar aceste cuvinte în cele două situaţii posibile:
              – când s-au păstrat răgăliile [majoritatea cazurilor vor fi subliniate şi de corectorul Word];
              – când toate răgăliile au fost şterse; atenţie răgălia se înlocuieşte cu NIMIC, deci dintr-un cuvânt în interiorul căruia există o răgălie va rezulta un cuvânt "curat" dar incorect, deoarece secvenţa de cuvânt aflată în faţa răgăliei s-a unit cu secvenţa de după răgălie, formând un nou cuvânt, care nu poate fi cel din text.



     Cred că efectul activării sau neactivării opţiunii este acum mult mai clar.
     Ca şi la opţiunea anterioară, cred că fiecare persoană poate alege orice variantă dacă va fi ea cea care va face corectura manuală a textului.

     Dacă cel ce rulează textul prin AC OCR Plus nu va face şi corectura, atunci recomandarea mea este să nu activeze sub nicio formă opţiunea 6.Ştergere caractere, din cel puţin trei motive:
              – cel care va face corectura este foarte posibil să prefere să facă o corectură pe un text la care s-au păstrat răgăliile;

              – cel care va face corectura este posibil să facă în continuare nişte modificări bazate pe un dicţionar temporar în care secvenţe care conţin răgălie însoţită de litere să fie înlocită cu confirmare sau fără cu o secvenţă reală de cuvânt. Un astfel de utilizator va prefera textul cu răgălii ca să poată face mai uşor înlocuirile respective;

              – cel care va face corectura este un începător, care văzând "textul curat" şi neştiind multe lucruri despre erorile posibile în Abbyy, despre AC etc... etc... va face o corectură superficială şi va rezulta în final un text fără valoare. Începătorul poate fi foarte bine intenţionat dar fără experienţa corecturii şi, deşi el va depune efort pentru corectarea altor erori care apar, o serie de aspecte îi vor scăpa.
     Reamintesc aici ceea ce am spus mai sus: este posibil ca dintr-un cuvânt românesc mai lung, prin eliminarea uneia sau mai multor litere să rezulte un cuvânt românesc real şi scris corect, deci Word nu-l va sublinia, doar că locul său nu este în fraza respectivă.


     În concluzie:
              ■ atunci când urmează să şi corectaţi textul rulat prin AC, gândiţi-vă foarte bine dacă doriţi sau nu să activaţi această opţiune.
              ■ atunci când rulaţi OCR prin AC OCR Plus, dar altă persoană va face corectura, recomandarea mea fermă este să nu activaţi în niciun caz această opţiune.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      DICŢIONARE - ULTIMA ACTUALIZARE



     Data reactualizării: 22.01.2014

     Dicţionare actualizate:

     Pachetul Dicţionare UZUALE [rulează cu op.9]
            Nume arhivă: Dic UZUALE Contemporan [2014.01.22].rar
            Adresă folder mediafire "3. Dic. FACULTATIVE"
                       
 
     Pachetul OCR_DIC
            Nume arhivă: OCR_DIC Contemporan [2014.01.22].rar
            Adresă folder mediafire "2. Dictionare OCR_DIC"
                       


     Informaţii despre dicţionare:

     Pachetul Dic UZUALE Contemporan
     A fost adăugat dicţionarul "Z Verb perf comp.imd"; au fost îmbunătăţite cu câteva înregistrări toate celelalte dicţionare.
     Total înregistrări în pachet:  2.932 înregistrări [faţă de 1.539 la 31.10.2012].

     Pachetul OCR_DIC Contemporan
     Îmbunătăţite dicţionare cu noi înregistrări: în special CImf1-CImf3; Sc2-Sc4; Var1-Var7.
     Reorganizarea completă a dicţionarele Var4.imd ÷ Var7.imd, care se referă la modificări cu confirmare
     Total înregistrări în pachet:  15.148 înregistrări [faţă de 8.252 la 31.10.2012].


     Atenţie:
     Am reorganizat dicţionarele Var4.imd ÷ Var7.imd, astfel:
          - am redus o parte dintre înregistrări, mergând pe principiul că e mai bine să fie rulat un dicţionar mai mic decât să nu fie rulat unul mare.
          - am executat mutări şi rocade de înregistrări şi dicţionare, în scopul de a uşura munca de confirmare a utilizatorului.

     Practic, am reorganizat dicţionarele astfel încât mai întâi să ruleze modificări la care confirmarea se face în procent mare şi refuzul în procent foarte mic şi am dus la final modificările "agasante" cu confirmări rare şi refuzuri frecvente.

     Cei cu mai puţină răbdare pot face înreruperea rulării la un moment care va fi uşor de recunoscut pe timpul rulării.
     Aceste semne sunt următoarele: ultimele înregistrări la care utilizatorul trebuie să ajungă sunt o serie de înregistrări care propun "Semnul exclamării" în locul succesiunii "spaţiu urmat de cifra 1, la sfârşit de paragraf, ori la sfârşit frază.

     Imediat după aceaste modificări urmează o serie de modificări de genul 11, II >> il, îl...
     Aici se poate opri rularea dicţionarelor, acţionând asupra butonului de închidere "X" din partea dreaptă sus a ferestrei de confirmare.

     Următoarele înregistrări, adică cele la care se renunţă la momentul subliniat mai sus sunt şi ele importante, dar sunt modificări oarecum dificile pentru că se referă la înlocuiri ale sucesiunilor 11, II >> il, îl..., apoi urmează nişte înlocuiri care ţin de punctuaţie; ultimele înregistrări fac înlocuiri de limbaj, deci nu erori de OCR, înlocuiri la care se poate renunţa.

     Baftă!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
In penultima postare vorbesti de Dicţionare OCR_DIC - ultima reactualizare  07.12.2013
Nu trebuia sa vorbesti de OCR+ 2014?

Sa inteleg ca ai inceput sa aduni postarile necesare deschiderii unui topic nou sau rearanjezi totul intr-unul vechi?

Te rog totodata sa redenumesti topicul acesta:


Noua denumire sa fie AutoCorect OCR+ Setari Portabile.

Modificat de utilitasetveritas (acum 10 ani)


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     În ideea reducerii numărului de topicuri destinate AC, am mutat aici diverse postări care conţineau informaţii cu termen de valabilitate mai lung.
     Din acest motiv o seamă de postări au data postării 24.01.2014, dar în realitate ele au fost făcute cu mai mult timp în urmă şi doar mutate la 24.01.2014.


     În legătură cu reactualizările:
     În ultima lună au fost făcute 3 reactualizări.
     Am vrut să fac o reactualizare care să fie postată la sfârşitul anului 2013, astfel că am postat pe cea din decembrie 2013 în care apăreau multe înregistrări legate de cuvinte formate din 4 litere şi alte câteva înregistrări diverse, doar că am continuat să aloc cam tot timpul pentru dezvoltarea dicţionarelor şi la începutul lui ianuarie am postat ceea ce reuşisem să finalizez în acel moment, adică înregistrări referitoare la cuvinte formate din 5 cuvinte.

     Ultima reactualizare la acest moment, cea din 22.01 face şi restructurarea completă a dicţionarelor cu variante şi confirmări, şi în plus sunt adăugate o serie de variante de ruperi la sfârşit de rând a verbelor la gerunziu şi alte cuvinte.
     Tot acum, la dicţionarele Uzuale am adăugat un dicţionar care se referă la corecţii de Verbe la perfectul compus şi care face modificări la sfârşitul cuvântului, ca în cazurile:
                 am adăugai  >>  am adăugat;
                 am adormii  >>  am adormit;
                 am adresai  >>  am adresat.
       
     la acest moment ultima versiune de dicţionare este cea din 22.01.2014.
     
     Să fiu mai exact: este ultima versiune postată, pentru că eu lucrez deja la altceva... atunci când acest altceva va avea o formă cât de cât finală, o voi pune, bineînţeles, la dispozia tuturor...

     În acest moment mă preocupă nişte dicţionare pe grupuri de cuvinte care prin rulare automată să corecteze cuvinte care încă le corectăm cu confirmare.
     Am pus câteva exemple într-o pagină care se poate vizualiza AICI


     Oricum o nouă reactualizare nu va apărea înainte de următoarele 6 luni.
     Deci undeva prin lunile iunie-iulie... poate chiar mai târziu voi reveni cu o nouă reactualizare sau eventual noi dicţionare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am uitat un aspect important...
      Am deschis un topic pe care l-am pus sus în secţiunea cărţi in limba română.
      Este vorba despre 

      Pentru ca userii să nu mai caute linkurile prin diverse topicuri, am pus acolo toate lincurile importante, inclusiv unele spre topicuri care se referă la tutoriale sau diverse aspecte privind AutoCorect.
      Am cules toate informaţiile din ultimul tău topic şi le-am trecut acolo, iar acel topic al tău l-am şters, deoarece nu mai avea justificare.

      Acum cei interesaţi pot găsi tot ce îi interesează într-un singur loc... şi la vedere...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      PROBLEME DOWNLOAD?

     Mă interesează dacă sunt probleme cu vreuna dintre adresele de download.
     Contorul de pe mediafire îmi indică la fişierul "OCR_DIC Contemporan [2014.01.22].rar" = zero downloaduri, ceea ce înseamnă că, ori este vorba de o eroare de contorizarea, ori este o problemă cu downloadul.

     Dacă sunt probleme cu downloadul, atunci trebuie să ştiu, pentru a face reupload la acest fişier.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Merge fara probleme.
Descarcat de mai multe ori.
Probabil e problema de site.


pus acum 10 ani
   
pryvacy_girl
Membru Puf

Inregistrat: acum 12 ani
Exista si un site de unde se poate descarca autocorectul fara sa fie virusat?

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani

pryvacy_girl a scris:

Exista si un site de unde se poate descarca autocorectul fara sa fie virusat?


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Avem şi un tutorial în format PDF, după topicul "AutoCorect OCR_Plus - Instructiuni de folosire", realizat de @caluseriu calin, căruia îi mulţumesc pentru sprijin.

      Deocamdată PDF-ul este în format A4 şi este reproducerea exactă a topicului amintit.

      În perioada următoare, intenţionez să reformatez tutorialul la pagină format A5 [pentru a fi mai uşor de vizualizat] şi aş încerca să-l împart în două-trei bucăţi mai mici, fiecare axat concret pe un anumit aspect dintre cele prezentate pe topicul respectiv.

      Adresa de download: Tutorial AutoCorect OCR PLUS [A4.v1].pdf


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Salutare!

      N-am încetat să adaug din când în când câte o înregistrare în dicţionarele AC OCR Plus.
      Alteori am acordat mai mult timp şi am adăugat câteva sute de noi înregistrări.
      La ora asta am în computer versiuni de dicţionare care conţin circa 2000 de înregistrări în plus faţă de ultima versiune oficială urcată pe mediafire.
      Voiam să urc o reactualizare, dar sunt încă în plin lucru cu o serie de dicţionare, aşa că aş prefera să le termin pe cele aflate în lucru şi după aceea să uploadez o reactualizare.

      În principiu, ar fi vorba despre înregistrări care privesc modificări de tipul:
            – secvenţe de cuvinte formate din câte 4 litere;
            – cuvinte întregi [în forma "cuvânt întreg la ambele capete" sau "cuvânt întreg la început"];
            – expresii formate din 3 sau mai multe cuvinte.

      Pentru a micşora numărul de confirmări de la finalul rulării încerc să lucrez dicţionare de expresii.
      De exemplu: grupul < 111 > poate însemna < în >, dar poate însemna şi altceva. De aceea nu pot face o înregistrate automată "1111 >> în", ci doar una cu confirmare.
      Dacă totuşi recurgem la expresii care conţin acest cuvânt, atunci putem face modificarea în mod automat.

      Iată câteva exemple:
          1    111 cele din urmă    în cele din urmă    Ci  Pc   
          1    111 celelalte    în celelalte    Ci  Pc   
          1    111 ceea ce    în ceea ce    Ci  Pc    .........
          1    111 fel şi chip    în fel şi chip    Ci  Pc   
          1    111 felul acesta    în felul acesta    Ci  Pc    .........
          1    111 mai mult    în mai mult    Ci  Ic  Pc   
          1    111 mai puţin    în mai puţin    Ci  Ic  Pc   
          1    111 mai toate    în mai toate    Ci  Pc   
          1    111 mai mare    în mai mare    Ci  Pc    .........
          1    111 mod absolut    în mod absolut    Ci  Pc   
          1    111 mod amănunţit    în mod amănunţit    Ci  Pc   
          1    111 mod cert    în mod cert    Ci  Pc   
          1    111 mod clar    în mod clar    Ci  Pc   
          1    111 mod corect    în mod corect    Ci  Pc   
          1    111 mod ideal    în mod ideal    Ci  Pc   
          1    111 mod inutil    în mod inutil    Ci  Pc   
          1    111 mod nefericit    în mod nefericit    Ci  Pc   
          1    111 mod normal    în mod normal    Ci  Pc    .........
          1    111 orice alt    în orice alt    Ci  Pc   
          1    111 orice altă    în orice altă    Ci  Pc   
          1    111 orice chip    în orice chip    Ci  Pc   
          1    111 orice clipă    în orice clipă    Ci  Pc   
          1    111 orice mod    în orice mod    Ci  Pc    .........
          1    111 timpul acesta    în timpul acesta    Ci  Pc   
          1    111 timpul ăsta    în timpul ăsta    Ci  Pc    .........  ......... .........

     Rulând astfel de dicţionare, o mare parte a situaţiilor se pot rezolva prin rulare automată, rămânând mult mai puţine de confirmat,ori chiar renunţând la confirmare.

     Este de asemenea cunoscut faptul că < 1111 > poate însemna "nu" sau "un".
     Expresii în care să înlocuiesc "1111 >> un" sunt mai greu de găsit pentru că, pe de o parte  se pot crea erori, pe de altă parte este nevoie de un număr foarte mare de expresii care să conţină majoritatea substantivelor masculine şi neutre.
     Dimpotrivă, expresii în care "1111 >> nu" sunt mai uşor de găsit; am deja circa 630 expresii sigure şi un dicţionar cu aproximativ 670 de înregistrări "în aşteptare".
     Le spun "în aşteptare" pentru că nu ştiu dacă le voi folosi în forma actuală sau le voi reduce la doar 8 înregistrări mai simple.

     Este vorba de înregistrări de genul:
          1    1111 m-ar ÷÷÷÷    nu m-ar ÷÷÷÷    Ci  Pc   
          1    1111 te-ar ÷÷÷÷    nu te-ar ÷÷÷÷    Ci  Pc   
          1    1111 l-ar ÷÷÷÷    nu l-ar ÷÷÷÷    Ci  Pc   
          1    1111 ne-ar ÷÷÷÷    nu ne-ar ÷÷÷÷    Ci  Pc   
          1    1111 v-ar ÷÷÷÷    nu v-ar ÷÷÷÷    Ci  Pc   
          1    1111 i-ar ÷÷÷÷    nu i-ar ÷÷÷÷    Ci  Pc   
          1    1111 s-ar ÷÷÷÷    nu s-ar ÷÷÷÷    Ci  Pc   
          1    1111 le-ar ÷÷÷÷    nu le-ar ÷÷÷÷    Ci  Pc
unde ÷÷÷÷ este forma unui verb precum: acuza, aduce, afla… bănui… crede… dori, duce… iubi, înşela, înţelege… primi, pune, putea… vrea, vedea…

     Din păcate nu reuşesc să găsesc nişte înregistrări care să facă modificări automate de genul  "11 >> îl" şi "11 > îi", pentru că expresiile pot fi valabile atât pentru "îl" cât şi pentru "îi".


     Ideea este următoarea: înregistrările le fac atât în dicţionare OCR_DIC, dar şi în dicţionarele Uzuale.
     În principiu, nu sunt unele înregistrări mai importante decât altele.
     De asemenea, nu lucrez unele cu mai multă atenţie şi alte cu superficialitate.
     Logica locului unde sunt înregistrate este una simplă: dacă e vorba de o eroare care apare frecvent, atunci o înregistrez în OCR_DIC; dacă avem un cuvânt care nu are frecvenţă foarte mare este înregistrat la Dic. Uzuale.
     Mai mult decât atât, dicţionarele care rezolvă doar o eroare folosind multe înregistrări de expresii, prefer să le înregistrez la Uzuale pentru că sunt mai uşor de gestionat.
     Deocamdată... atât.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Asteptam

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Deocamdată, asta e oferta.
     Aş avea şi nişte cereri, dar le voi posta mai pe seară.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am mare nevoie de semnalări şi propuneri pentru dicţionarele AutoCorect.

     Nu putem discuta despre partea de soft a AutoCorect.
     Ceea ce s-a făcut la acest program e bun făcut şi deocamdată nu cred că se pot face modificări.

     Programul AC OCR Plus v5.1, aşa cum este el astăzi, oferă posibilitatea înregistrării unui număr infinit de modificări, astfel există posibilitatea îmbunătăţirii permanente a lui prin îmbunătăţirea dicţionarelor.

     Am două mari rugăminţi la utilizatorii AC OCR Plus:

     1. Este necesar să se semnaleze situaţii în care un utilizator descoperă că la rularea AC OCR apar modificări eronate sau neinspirate.

     2. De asemenea am nevoie ca utilizatorii să-mi propună modificări noi:
dacă constataţi că anumite cuvinte apar frecvent cu aceleaşi tip de erori. Mă refer în special la cuvinte care au o frecvenţă mare sau medie în texte şi, în acelaşi timp, la cuvinte ceva mai scurte, de până la 7-8 litere.
     Adică, dacă apar erori la cuvântul "muşchiul sternocleidomastoidian"    nu e o eroare importantă pentru că e vorba de un cuvânt folosit foarte rar într-un text şi este un cuvânt lung. Astfel de erori se pot elimina foarte uşor la corectura manuală.
     Dacă constatăm erori la cuvinte de genul "poate", "foarte", "spune".... "adevărat", "înseamnă"...... "niciodată", "întotdeauna"..... etc., e nevoie să le corectăm pentru că sunt cuvinte care au o frecvenţă foarte mare şi majoritatea lor sunt destul de scurte.
     Este posibil ca unele din aceste cuvinte să fie înregistrate, doar că nu sunt înregistrate toate erorile posibile. Dacă un cuvânt are maxim 6-7 litere, teoretic se pot găsi toate erorile posibile.

     Atenţie! A semnala o eroare nu înseamnă a critica programul sau dicţionarele.
     Astfel de semnalări nu numai că nu mă deranjează, ci îmi sunt foarte folositoare.
     Atunci când eu editez modificări pot să greşesc vreo modificare din neatenţie, ori pot avea pur şi simplu o fractură de logică... Deoarece fac, de multe ori, modificări în serie, adică un tip de eroare o aplic la mai multe cuvinte, e posibil ca la unul dintre cuvinte să apară şi un efect secundar nedorit.
     Întotdeauna mai mulţi oameni pot gândi mai bine decât unul singur.
     În concluzie, o semnalare sau o propunere este practic un ajutor şi orice ajutor este important şi binevenit.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cand au fost, au fost.
Daca se mai observa ceva, ori de catre mine ori de altcineva, ai fi auzit.
Deci ori AC-ul nu este folosit ori nu s-au observat probleme.


pus acum 10 ani
   
paciu
Membru Puf

Inregistrat: acum 14 ani
Doresc să semnalez eu nişte, hai să le spunem, modificări nedorite.
Ex. Avionul DC 3 transporta paraşutiştii....Avionul DE 3 transporta paraşutiştii. Am rezolvat problema cum m-am priceput mai bine, adică intr-un dicţionar de diverse DE transformat în DC cu confirmare.
Ex. F.B.I. acţionează pe teritoriul SUA......F.B.I. Acţionează pe teritoriul SUA. Aici nu am ştiut ce să fac. Corectat la citire.

Modificat de paciu (acum 10 ani)


_______________________________________
Nu te certa niciodată cu un prost!
Te va aduce la nivelul lui și te va bate cu experiența!

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Of!... forumul ăsta e mai mult mort decât viu...

      Mulţumesc, @paciu!

      Chestia cu "DC 3 >> DE 3" am rezolvat-o [deocamdată în dicţionarele din computerul meu], doar că trebuie să mai completez cu nişte înregistrări.

      Era vorba de câteva cuvinte de 2 litere "ce, de, pe, se, te" care trebuiau corectate dacă apăreau în forma "cc, dc, pc, sc, tc".

      Eroarea de înregistrare îmi aparţine.
      Am s-o explic detaliat ca să poată fi înţeleasă şi rezolvată şi de alţi useri în alte situaţii.

      Cum trebuia rezolvat?
      Trebuia să înregistrez înlocuiri de tipul "cc >> ce, Cc >> Ce, dc >> de, Dc >> De....... Tc >> Te" cu condiţiile "Cuvânt întreg la ambele capete" [Ci] plus "Potrivire perfectă" [Pp], adică:
      dc    de    Ci  Pp   
      Dc    De    Ci  Pp   

      În dicţionare, înregistrările erau de tipul:
      dc    de    Ci  Pc   

adică aveau condiţia "Păstrează capitalizarea" şi nu "porivire perfectă".

      Dacă pentru "dc >> de" avem condiţia "Porivire perfectă" înseamnă că modificarea se face doar dacă AC întâlneşte cuvântul "dc" scris exact aşa. Nu se vor face înlocuiri dacă acest cuvânt apare scris sub forma "Dc", "DC" sau.. "dC".
      Dacă pentru "dc >> de" avem condiţia "Păstrează capitalizarea" atunci se vor face înlocuiri asupra tuturor cuvântelor întregi care cpnţin cele două litere în ordinea "de", indiferent cum sunt scrise "dc, Dc, DC, dC" și le va modifica păstrând în continuare modul cum sunt scrise, astfel că vor rezulta înlocuirile "de, De, DE, dE".

     Dacă în loc de condiția "Cuvânt întreg la ambele capete" se va folosi condiția "Cuvânt întreg la început" modificările se vor face la TOATE cuvintele care încep cu acest grup de litere.

      Bun! Aceste erori le-am rezolvat. Trebuie ca acum să fac înregistrări pentru cuvinte care încep cu acest grup, doar că va trebui să găsesc secvențe de început de 3-4 litere pentru ca eventualele erori să fie prevenite.


      Referitor la majuscularea de după ”F.B.I.”...
      Opțiunea 2.3. Punctuație / Funcții obișnuite majusculează orice literă care urmează după punct urmat de spațiu.
      Dacă debifăm funcția asta, nu se va mai face majuscularea de după ”F.B.I.”, dar vor rămâne multe minuscule după punct, ceea ce nu-i avantajos.
      Cel mai bine este să faci modificări cu Find/Replace, doar că va trebui să cauți toate literele care pot urma după ”F.B.I.”, adică:
       ”F.B.I. A  >>  F.B.I. a”, ”F.B.I. B  >>  F.B.I. b” .............  ”F.B.I. Z  >>  F.B.I. z”
      Atenție! pentru ca modificarea să se facă corect,în vord trebuie bifată prima condiție Search și anume ”Match case”.


     LE: semnalarea "dc >> DE" este mult mai importantă decât se poate bănui pentru că în acelaşi mod erau înregistrările şi pentru "cc, pc, sc, tc" şi pot apărea diferite nume [mărci de produse], prescurtări etc., unde se va modifica şi "CC > CE, PC > PE, SC > SE, TC > TE" ceea ce nu e deloc în regulă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     I M P O R T A N T !

     Deşi intenţionam să termin modificările aflate în lucru şi apoi să uploadez dicţionarele, va trebui să urc în următoarele două zile dicţionarele la faza în care se găsesc ele astăzi pentru ca să putem vorbi aceeaşi limbă.
     Menţionez că a fost necesar să fac şi modificări de structură a dicţionarelor; de exemplu, din Uzuale am mutat cuvinte în CO_Cimf2, timp în care din Co_Cimf2 am mutat cuvinte în CO_Sc3; mai mult decât atât,  Co_S1 ÷ CO_S4 au fost renumerotate și restructurate, astfel că acum în S1 apar cuvinte cu 1÷3 litere, în S2 cuvinte cu 4 litere, în S3 cuvinte cu 5÷6 litere şi tocmai în S4 am mutat cuvintele scrise cu cratimă.
     Am mutat înlocuirile "intre >> între" şi "lingă >> lângă" în S4 ca să nu producă înlocuiri la cuvintele de 5-6 litere din S3. Sunt şi multe alte modificări făcute, ca de exemplu înregistrarea de secvenţe mai concrete formate din 4 litere sau chiar mai multe.

     Intenţionez ca în CO_S4 să adaug încă două înregistrări "sting > stâng" şi "stingă > stângă" pentru ca mai apoi să fac o recorectare în CO_Expr1 sau CO_Expr2 cu modificări de genul "să stâng > să sting, nu stâng > nu sting, mai stâng > mai sting... pentru că recorectările sunt mai puţine în acest fel [voi avea: "să, nu, mai" plus "mă, mi-o, mi-l, te, ţi-o, ţi-l, o, i-o, îl, i-l, ne, vă, le, îi" urmate de stâng >> xxx sting.
     Formula inversă de modificare ”picior [piciorul] sting > picior [piciorul] stâng”.... ”mâna stingă >> mâna stângă”... necesită mult mai multe înregistrări.

     Deci, în două-trei zile urmează să urc dicţionarele reactualizate la data de 5 octombrie 2014. Apoi putem dicuta mai concret.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      În principiu, dicţionarele ar fi gata pentru upload.
      Menţionez că am adăugat o serie de înregistrări pentru cuvinte care încep cu literele A, B, C... până la N.
      În perioada următoare urmează să continui cu cuvinte care încep cu litera O, P, R... Z, după care revin cu upload.
      De asemenea voi continua cu dicţionarele grup care rezolvă automat "111 >> în" şi "1111 >> nu", astfel încât pentru confirmare să rămână doar "1111 >> un", respectiv "11 >> îl" şi "11 >> îi", pentru care nu găsesc formule de modificare automată.

      La acest moment am nevoie de un sfat.
      În dicţionarul Cimf.3 [care rulează modificări de cuvinte întregi la opţiunea  4.6 Corectare caractere reproduse eronat / Corectare cuvinte întregi şi expresii] am nişte înregistrări care nu rezolvă erori OCR, ci erori de "limbă".

      Aceste înregistrări sunt următoarele:

          01     adaog   >>   adaug
          02     agreem   >>   agreăm
          03     agreind   >>   agreând
          04     agrează   >>   agreează
          05     agreiez   >>   agreez
          06     agreiezi   >>   agreezi
          07     aevea   >>   aievea
          08     asterics   >>   asterisc
          09     asterix   >>   asterisc
          10     aşează   >>   aşază
          11     creerea   >>   crearea
          12     creearea   >>   crearea
          13     creiarea   >>   crearea
          14     creem   >>   creăm
          15     creind   >>   creând
          16     crează   >>   creează
          17     creiez   >>   creez
          18     creiezi   >>   creezi
          19     deasemenea   >>   de asemenea
          20     deasemeni   >>   de asemeni
          21     defapt   >>   de fapt
          22     greşala   >>   greşeala
          23     greşală   >>   greşeală
          24     înşeală   >>   înşală
          25     noştrii   >>   noştri
          26     voştrii   >>   voştri
          27     vre-o   >>   vreo
          28     vre-odată   >>   vreodată
          29     vre-un   >>   vreun
         
          30     mişloc   >>   mijloc   
          31     aşa dar   >>   aşadar
          32     dela   >>   de la

      Deoarece înregistrările nu fac corecturi ale erorilor OCR, întrebarea este următoarea:
             a. Să las aceste înregistrări în CO_Cimf.3.imd  şi să ruleze automat?
             b. Ori să le mult în CO_Var.6.imd şi să ruleze cu confirmare?

      Am numerotat înregistrările pentru a fi semnalate mai uşor în eventualitatea în care unele ar putea rămâne în Cimf.3 şi altele să fie mutate în Var.6.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Confirmare evident.
Daca rulezi dictionarul automat pe o carte de a lui Rebreanu o sa-ti "corecteze" textul original.
Nu as putea sa zic daca apar sau nu aceste forme "popolare" in texte si cat de des. Dar, daca esti in dubii, lasa mai bine cu confirmare.

P.S.
I-am dat un mesaj si lui Cosimo pe tema asta. El ridicase o probleme de asta acum ceva timp.

Modificat de utilitasetveritas (acum 10 ani)


pus acum 10 ani
   
_Cosimo_
Membru Senior

Inregistrat: acum 13 ani
Vă scriu părerea mea foarte pe fugă, scuze...
Înregistrările de mai sus trebuie împărţite în două: unele nu trebuie aplicate decât cu confirmare, altele trebuie musai aplicate.
Câteva exemple din prima categorie:
- adaogă - Mircea Eliade scria mereu "adaogă", dacă apare altfel în scrierile lui, e greşit. Chiar dacă astăzi corect este "adaugă", la autori precum Eliade o asemenea corectură strică.
- "aevea" e folosit de Sadoveanu...
şi tot aşa...

Trec la cele care trebuie musai aplicate, indiferent cum au scris Sadoveanu, Eliade şi oricine altcineva:

          08     asterics   >>   asterisc
          09     asterix   >>   asterisc
          10     aşează   >>   aşază
          11     creerea   >>   crearea
          12     creearea   >>   crearea
          13     creiarea   >>   crearea
          14     creem   >>   creăm
          15     creind   >>   creând
          16     crează   >>   creează
          17     creiez   >>   creez
          18     creiezi   >>   creezi
          19     deasemenea   >>   de asemenea
          21     defapt   >>   de fapt
          24     înşeală   >>   înşală
          25     noştrii   >>   noştri
          26     voştrii   >>   voştri
          27     vre-o   >>   vreo
          28     vre-odată   >>   vreodată
          29     vre-un   >>   vreun
          30     mişloc   >>   mijloc   
          32     dela   >>   de la

Astea sunt greşeli de limbă mai mult sau mai puţin grave şi chiar la marii scriitori dacă le întâlniţi, e mai degrabă vina culegătorului de la tipografie, care a cules cum a ştiut el că se scrie.

Chestia asta nu trebuie să apară deloc:
         20     deasemeni   >>   de asemeni
"de asemeni" e o greşeală, nu există decât şi decât "de asemenea". Cuvântul "asemeni" nu există, niciodată şi în niciun context. Dacă îl întâlniţi, e eroare de limbă. DAR... e folosit de autorii români mai vechi, eu l-am întâlnit la Radu Tudoran, de pildă, deci trebuie lăsat în astfel de cazuri. În rest, jos cu el!


Asta nu trebuie introdusă deloc. Poate fi "aşa dar, mai rar" etc., când prin "dar" se înţelege "cadou". Adică se poate întâlni în ambele forme.
          31     aşa dar   >>   aşadar

Nu uitaţi să înlocuiţi automat şi "vroi" cu "voi", să scăpăm de aberaţiile astea: "vroiam, vroia..."
Cam atât, pe scurt, sorry, am treabă multă azi.


pus acum 10 ani
   
kilimanjaro
Membru Senior

Inregistrat: acum 17 ani
Eu as mai adauga:

- cu confirmare:

33  de loc >> deloc;
34  o dată cu >> odată cu;
35  o dată ce >> odată ce;
36  dintr-o dată  >>  dintr-odată;
37  luminare  >>  lumânare

- automat:

01  înşeală  >>  înşală;
02  va să zică  >>  vasăzică;
03  care va să zică  >>  carevasăzică;
04  posomorit  >>  posomorât.


_______________________________________
Honoré de Balzac | Lev Tolstoi | Émile Zola | Nikolai Gogol | Aldous Huxley | I.S. Turgheniev
A.E. van Vogt | Mario Vargas Llosa | Marin Preda | I. Goncearov | Carson McCullers | Henry Lawson

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mulţumesc mult! Am împărţit înregistrările aşa cum aţi propus.

     Actualizare dicţionare la 05.10.2014

     [2014.10.05] OCR_DIC Contemporan.rar 
                         conţine peste 19.850 înregistrări

     [2014.10.05] Dic UZUALE Contemporan.rar 
                         conţine peste 7.050 înregistrări

     Aşa cum am menţionat anterior am abandonat lucrul la dicţionarele AC Clasic, astfel că toate actualizările privesc doar Ac OCR Plus Contemporan.

     Sunt câteva lucruri de menţionat.
     ■ deoarece am în lucru o serie de dicţionare uzuale care mai pot fi încă îmbunătăţite, pentru o mai uşoară verificare şi editare, există câteva litere care au 2 sau 3 dicţionare uzuale:
          – la litera C – 2 dicţionare: Uz_C1 [div] conţine cuvinte obişnuite, Uz_C2 [înc] face modificări doar la începutul cuvintelor
          – la litera Î – 2 dicţionare: Uz_Î1 [i-î] se referă la cuvinte care încep eronat cu litera "i", Uz_Î2 [div] corectează erori obişnuite [diverse]
          – la litera N – 3 dicţionare: Uz_N1 [div] este un dicţionar obişnuit, Uz_N2 [Nici] rezolvă erori ale cuvintelor din familia "nici", Uz_N3_NTR este un dicţionar care se ocupă de erori pentru cuvintele care încep cu "într-, dintr- printr-".
     ■ Am realizat în plus 3 dicţionare grup de cuvinte, marcate cu ăarticula "Gr"
          – Gr_Cifr_rom este un dicţionar care rezolvă cifre romane în forma "II-lea....XXXIX-lea" şi "II-a... XXXIX-a". Am considerat că numărul 39 este suficient de mare şi nu e cazul să adaug mai multe înregistrăr. În altă ordine de idei, am renunţat la cifrele simple care nu sunt însoţite de particula "-lea" sai "-a", deoarece aceste cifre simple pot produce multe erori. menţionez că acesta este singurul dicţionar care se referăla cifre romane, dicţionarele vechi pe această temă le-am eliminat.
          – Gr_TOT este un dicţionar nou care încearcă să corecteze automat "lot >> tot" şi "toi >> lot", pentru a nu mai pierde timpul cu confirmarea în dicţionarul Var_5.
          – Gr_Vb_PC este un dicţionar mai vechi care face înlocuieşte "i" final cu "t" final la verbe la perfectul compus, ca de exemplu: "am aruncai >> am aruncat".
     În concluzie, la opţiunea "9 Rulare grup dicţionare..." trebuiesc şterse din setări vechile dicţionare şi adăugate toate cele de mai sus.

     ■ sunt câteva schimbări de nume şi structură ale dicţionarelor OCR_DIC, dar am să revin şi cu descrierea acestora.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Seven, arunca-ti un ochi si aici:





pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ups!...
      Am descoperit 3 înregistrări aiurea în Co_Var.5 şi 4 înregistrări în CO_Var.5
      Cele din Var.5 au "scăpat" cu condiţii nepotrivite: în loc de "Ci Pc" am pus "Pc Pi"; celelalte trebuiau să înlocuiască < 1 > cu < i >.... doar că... Dumnezeule!... înlocuiesc pe < 1 > cu < l >

      Îmi cer mii de scuze!
      Am şters linkul.
      Verific tot şi revin cu un nou upload.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ei, ce vrei, sunt doar cateva mii de inregistrari

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am rezolvat.
     Am verificat toate înregistrările din cele două dicţionare. Am corectat condiţiile acolo unde a fost necesar.
     
      Pentru cei care au downloadat deja fişierul [2014.10.05] OCR_DIC Contemporan.rar, uecat acum câteva zile, am urcat o mică arhivă care cuprinde doar cele două dicţionare modificate [CO_Var5.imd şi CO_Var6.imd]
      Nume arhivă: [2014.10.12] CO Var.5+6.rar
      Adresa:

      Pentru cei care nu au făcut încă download la actualizarea din [2014.10.05], am urcat o arhivă completă care cuprinde toate dicţionarele OCR_DIC la data de 12.10.2014.
      Nume arhivă: [2014.10.12] OCR_DIC Contemporan.rar
      Adresa:


      De reţinut! [1]
      Prin termenul "Cuvânt întreg" în înţelesul Ac OCR Plus se înţelege un sir de caractere format din diverse caractere, astfel:
          - putem avea un cuvânt în înţelesul obişnuit, format din una sau mai multe litere, precum "i, de, fiu, dacă, adică, dintre, fiindcă, adevărat, mulţumesc, întotdeauna..."
          - putem avea un grup de cuvinte cu spaţiile şi semnele de punctuaţie dintre ele: "Nu există putere care să nu"... "Aflaţi că avem părinţi. Nu prea ştiţi voi bine ce"...

      Şirul de caractere poate începe cu orice caracter, cu excepţia semnelor de punctuaţie.
      Şirul de caractere se poate termina cu orice caracter, inclusiv semne de punctuaţie.

      Un şir "cuvânt întreg" nu poate începe cu un semn de punctuaţie.
      Dacă avem un şir care începe cu un semn de punctuaţie, nu se poate pune condiţia "cuvânt întreg", ci doar "păstrează capitalizarea" sau "Potrivire perfectă".
      O înregistrare de genul    "? 1111 fi îngrijorat  >> ? Nu fi îngrijorat"      setată cu condiţia "Cuvânt întreg" nu funcţionează... nu rulează...

      De reţinut! [2]
      Condiţiile "Păstrează capitalizarea" şi "Potrivire perfectă" nu se pot pune împreună, deoarece ele sunt relativ opuse.
      Practic, condiţia "Potrivire perfectă" anulează condiţia "Păstrează capitalizarea".
      În concluzie, putem pune doar una dintre condiţii: ori "Păstrează capitalizarea", ori "Potrivire perfectă".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Primul tau pont chiar nu il stiam.
Oricum atunci cand ma hotarasc sa adaug o inregistrare in dictionarul meu, mai intai il testez pe 3-4 randuri de text ca sa ma asigur ca se ocupa cum trebuie de portiunea de text ce ma intereseaza.
M-ai scutit de ceva nervi prin urmare

Multumesc pentru treaba excelenta pe care o faci.


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Eroare nouă.

     De fapt, doar descoperirea este nouă... probabil eroarea a existat, numai că nu a fost semnalată pe forum.
     Este vorba de confuzia Abbyy  " ri =  n".
     Până acum ştiam de confuzia " m = rn ", unde, de regulă, litera "m" era redată eronat prin grupul "r n".
     Mult mai rar eroarea apare şi invers, când grupul "r n" este redat eronat sub forma literei "m".
     De eroarea asta ne-am ocupat şi vor mai fi şi alte înregistrări.

     Să revenim la " ri = n ".
     Scanez nişte cărţi în care punctul de pe "i" este poziţionat mai sus decât în mod normal şi Abbyy nu vrea să "citească" şi punctul, astfel că-l "vede" pe acel "i" fără punct şi-l redă ca fiind "l" [L mic], ori îl lipeşte de o literă vecină.
     În situaţia în care acest "i" apare după un "r", Abbyy s-a gândit el că e vorba de litera "n".
     N-am constatat ca eroarea să apară şi invers, dar n-o exclud.

     Acest "n" eronat mi-a apărut de cele mai multe ori la sfârşit de cuvânt.
     Am plecat de la această constatare şi am făcut căutarea grupului "r i" la sfârşitul cuvintelor.
     Sunt frecvente două terminaţii care conţin grupul "ri":
               "rilor" =  24.503 cuvinte
               "rile"  =  18.231 cuvinte
     Ar mai fi terminaţia la gerunziu  "rind" = 464 cuvinte plus  secvenţa "rindu- " = 887.
     Alte terminaţii clare n-am mai găsit încă.

     Deocamdată am rezolvat problema pentru [toate] cuvintele care au terminaţia "rilor".
     Am înregistrând secvenţe de final formate din 7 litere: 2 litere + terminaţia "rilor".
     Ex.: anlor  >>  arilor; banlor  >>  barilor  ........  yunle  >>  yurile;  zunle  >>  zurile.
     Total înregistrări =  276.

     Plecând de la aceste terminaţii am realizat şi nişte înregistrări pentru corectarea ruperii acestor cuvinte; de data asta a folosit secvenţe formate din 8 litere: 3 litere plus terminaţia "rilor", ca în exemplul:
               b- aurilor  >>  baurilor
               bau- rilor  >>  baurilor
               bauri- lor  >>  baurilor
     Fiind vorba de 3 litere din faţa terminaţie şi de 3 înregistrări pentru fiecare astfel de secvenţă, numărul înregistrărilor rezultate este destul de mare: 4410 înregistrări.

     Dacă sunt useri dispuşi să testeze aceste dicţionare sau să se documenteze mai mult asupra lor, pot uploada dicţionarele şi materialele statistice folosite.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Pe moment (sunt la pagina 300 din 600 in Abby) nu am ce testa.
Cand o sa finalizez si ocr-ul asta blestemat o sa fac verificarea pagina cu pagina a ceea ce a facut AC-ul.

Nu te stresa chiar atat de tare cu erorile de citire din Abby. Tind sa varieze in functie de carte. Poti face dictionare separate cu noile descoperiri, lasa optiunea de marcare a textului si adu-le pe forum.


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ai dreptate @utilitasetveritas.
      Nu ne putem ţine cu dicţionarele după toate erorile Abbyy, deoarece fiecare tip de font, fiecare editură... oferă alte şi alte tipuri de erori.

      M-am gândit să trec la o nouă fază în AutoCorect - reducerea timpului de rulare.

      Am început să testez fişiere mari OCR-brut şi să urmăresc timpii de rulare ai fiecărei opţiuni, apoi să reverific numai opţiunea respectivă pe bucăţi şi bucăţele.
      Am constatat că o singură înregistrare eronată poate duce la modificări în buclă, care lungesc durata de rulare, chiar dacă la sfârşit se obţine un rezultat bun.
      Am scurtat deja timpii la câteva opţiuni, dar cred că se mai pot face încă multe lucruri pentru eficientizare.
      De exemplu: la L3 am un pachet de 96 de înregistrări, de genul:
              " 1 s-a spus, 1 se explica...  >>  I s-a spus, I se explica... "

      Pentru ca cifra 1 să fie litera I mare, este vorba de început de frază, astfel că a trebuit să repet înregistrările în mai multe condiţii, astfel că avem:
              " . 1 s-a spus  >>  . I s-a spus " - început de frază după punct.
              " 1 s-a spus  >>  I s-a spus " - la început de paragraf obişnuit;
              " — 1 s-a spus  >>  — I s-a spus " - început de paragraf cu linie de dialog;
              " —^s1 s-a spus  >>  —^sI s-a spus " - început de paragraf cu linie de dialog urmată de spaţiu neseparator.

      Adăugând o înregistrare de genul   " — s1   >>  —^s1 "   deci punând spaţiu neseparator după toate liniile de dialog după care urmează cifra 1, am putut elimina pachetul de 96 de înregistrări care se referea la linia de dialog cu cifra 1 urmată de spaţiu obişnuit.
      Ăsta este un exemplu.

      Alt exemplu: am constatat că la opţiunea 2.2 Punctuatie / Corectare linii de pauză şi dialog timpul de rulare era cam mare faţă de numărul de înregistrări.
      N-am găsit explicaţia, aşa că am început să rulez fiecare dintre cele două dicţionare separat. Dicţionarul Co_LinD.imd rula mai greu şi se împotmolea undeva la 80%, deci înregistrările care produceau probleme se aflau undeva în zona înregistrării 128 din totalul de 160 de înregistrări.
      Am dezactivat toate înregistrările de la nr.120 până la 160, am făcut o rulare, apoi am acrivat încă 2 înregistrări şi tot aşa.  Am dat peste o înregistrare pe care eu o credeam " Horizontal Bar >> EmDash",  în care la căutare era forma grafică şi nu codul pentru Horizontal Bar, doar că în realitate era era o înregistrare " EmDash >> EmDash ", care deşi nu producea o eroare, era o rulare în plus şi de lungă durată. Am corectat cu Horizontal Bar şi dicţionarul rulează mult mai repede pentru că el caută numai Horizontal Bar în loc de dialog şi nu mai înlocuieşte EmDash cu el însuşi.

      Sunt şi probleme care par mai uşor de rezolvat în Word.
      De exemplu, opţiunea 1.3 Conversii preliminare / Eliminare tab şi spaţii multiple rulează destul de greu în AC. În principiu, dacă am face mai înainte două înlocuiri: "tab >> spaţiu" şi "două spaţii >> un spaţiu",atunci opţiunea ar rula mult mai repede.
      Am testa cele două înlocuiri în Word: ele se fac foarte-foarte repede, mult mai repede decât în AC.
      Cred că un mic template prin care să rulăm textul înainte de a-l încărca în AC, ar fi de mare folos.

      Una peste alta, ideea este că după ce voi mai face câteva modificări de dicţionare, voi urca o nouă versiune, care ar trebui să ruleze ceva mai repede.
      Dekci,urmează dicţionare noi....   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
era mal > era mai
fi mal > fii mai
fii mal > fii mai
cel mal > cel mai
cea mal > cea mai


mal puțin > mai puțin
mal tare > mai tare
mal încet > mai încet
mal repede > mai repede
mal lent > mai lent



Pc Cli
(sa nu uiti sa debifezi Cuvant Intreg))

Nu par a fi in OCR+. A doua serie de inlocuiri e discutabila, cred ca lista de expresii care incep cu "mai" poate fi cam lunga. Prima serie consider ca e folosita mai des.
Pe de alta parte, cred ca nici cuvantul "mal" nu apare atat de des intr-un text incat sa enerveze utilizatorul cu alerte inutile.
Cred ca e mai bine doar o inlocuire de genul:

mal > mai
Ci Pc CLi


P.S.
Timpii de rulare cresc simtitor atunci cand e folosit un fisier txt.

Modificat de utilitasetveritas (acum 10 ani)


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      1. N-am încercat rularea în AC+ a fişierelor "txt".
      Am încercat fişiere "txt" doar pentru căutări de cuvinte în AC+ şi uneori viteza de căutare în "txt" a devenit mult mai mare decât "rtf", deoarece fişierul s-a mărit la convertirea rtf > txt.
      Voi încerca să fac nişte teste în sensul ăsta.
      Din păcate o serie de cărţi nu pot fi reduse la formatare "txt".

     2. "mal > mai" şi alte asemenea.
     Eu am lucrat ceva în sensul ăsta, folosind înlocuiri grup cuvinte.
     Am folosit condiţia înlocuire automată, dar şi înlocuiri cu confirmare.
     Dacă înlocuiri de genul "cea/cel/cele/cei mal bun[e/i]  >>  cea/cel/cele/cei mai bun[e/i] se pot face automat, atunci sunt înlocuiri ca cele menţionate de tine unde confirmarea este obligatorie.

     Ideea este că astfel de dicţionare sunt foarte preţioase uneori şi total lipsite de importanţă de cele mai multe ori... depinde de carte....
     Din cauza asta ele nu pot fi incluse în OCR_DIC sau UZUALE pentru că ar prelungi rularea fără rost atunci când nu sunt necesare, deci în majoritatea situaţiilor.
     Pe de altă parte, în cazurile în care eroarea "mal > mai" este frecventă, o singură înregistrare cu confirmare ne-ar consuma foarte mult timp.

     Cred că am avea nevoie de o a treia categorie de dicţionare la acre să apelăm numai în situaţii speciale... să le zicem acum Dicţionare ZZZ.
     Astfel de dicţionare le putem păstra în computer fără să facem rularea automată a lor, ci să apelăm la ele doar atunci când constatăm că este nevoie de vreunul dintre ele.
     Adică... dacă rulând OCR_DIC unde avem înlocuirea cu confirmare "mal >> mai" constatăm că sunt multe înlocuiri, atunci renunţăm la această înlocuire, urmând ca după terminarea rulării programului să rulăm manual dicţionarul "Z_mal_mai.imd".

     Sunt şi alte cuvinte care care pot fi corectate cu astfel de dicţionare.
     De exemplu cuvântul ele "ele", care la unele cărţi poate fi redat eronat chiar cu cuvântul "de".
     Atât "ele"  cât şi "de" sunt cuvinte de mare frecvenţă, aşa că atunci când apar astfel de erori, dacă mergem pe confirmare situaţie cu situaţie, vom consuma extrem de mult timp.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
A... da, scuze, nu am fost clar.

Genul asta de inlocuiri le fac separat de OCR+. Am un dictionar ZZZ, dupa cum zici tu, si uneori e folositor, alteori nu face absolut nimic.
Adaug in el acele probleme, gasite la verificarea 1.0 a textului, ce se repeta si care nu fost aranjate de OCR+.
Oricum nu cred ca sunt mai mult de 30 de erori pana acum.


pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Constat că apar mereu probleme legate de instalarea sau funcţionarea AutoCorect OCR Plus.
      Mi se semnalează că programul nu rulează corect... că apar mesaje de genul "Dicţionarul _____ nu poate fi deschis."

      Programul nu are nicio hibă. problema este că utilizatorul a greşit ceva pe undeva.
      Am să reiau discuţia şi să explic câteva probleme de bază despre AutoCorect, apoi voi încerca să redau câteva cauze posibile al unor astfel de mesaje.

   
      Să revenim la mesajul "Dicţionarul _____ nu poate fi deschis."

      1. Ce tip de dicţionar nu poate fi deschis? Este vorba despre unul dintre dicţionarele din OCR_DIC sau un dicţionar Uzual?
      Cum stabilim acest lucru? Ne uităm la numele dicţionarului cu probleme şi vedem din ce pachet face parte.

      Varianta cea mai simplă:
      1.1. Este vorba despre un dicţionar Uzual.

      Cauza: faţă de setările anterioare folosite de noi a apărut un dicţionar sau mai multe cu numele schimbat.
      Rezolvare: apăsăm opţiunea de rulare automată a opţiunilor OCR Plus.
      Apare fereastra cu opţiunile afişate unele sub altele.
      În dreptul unora dintre dintre ele apare în dreapta menţiunea "Opţiuni", ca în imaginea următoare:



      În dreptul opţiunii 9. Rulare grup de dicţionare... apare această menţiune, marcată cu roşu în imagine.
      Apăsăm butonul "Opţiuni" din dreapta opţiunii 9 şi se va deschide mica fereastră "Rulare dictionare".
      Cel mai simplu este să ştergem unul câte unul toate dicţionarele şi apoi încărcăm din nou dicţionarele pe care le avem acum la dispoziţie, fie ele dicţionarele Uzuale, dar şi unele personale [dacă avem aşa ceva]
      Aici se pot încărca dicţionare din mai multe foldere. AutoCorect va salva calea lor de căutare într-un fişier text, aşa că le va găsi oriunde le-aţi pune.
      Atenţie! nu se încarcă aici şi dicţionarele OCR_DIC,deoarece ele ar rula de două ori: o dată rulate de opţiunile OCR PLus şi apoi se face rularea în grup... ceea ce înseamnă pierdere nejustificată de timp.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Varianta mai complicată:
      1.2. Este vorba despre un dicţionar OCR_DIC.

      Pentru situaţia asta există mai multe cauze.
      Dacă utilizatorul a folosit AutoCorect OCR Plus şi lucrurile au mers bine şi a apărut acum un astfel de mesaj înseamnă că a apărut o eroare: a fost şters sau redenumit din întâmplare un dicţionar. Utilizatorul cu experienţă va găsi problema şi o va rezolva.

      Dacă utilizatorul nu a mai folosit AutoCorect OCR Plus, deci este la prima instalare, înseamnă că nu a copiat dicţionarele OCR_DIC unde trebuia.

      Menţionez un aspect: kiturile de instalare AutoCorect Standard [variantele Contemporan sau Clasic], executabilele AutoCorect OCR Plus şi ultimele dicţionare sunt cele postate pe topicul
      AutoCorect OCR Plus 5.1 – Ultima Actualizare

      Kiturile AC Standard şi executabilele sunt postate acolo chiar de către Cosmin Ciupercă şi sunt cele mai bune. Nu e cazul să căutaţi cu Google kituri pentru Ac Standard. Luaţi-le cu încredere pe cele postate chiar de autor. Nu există în altă parte ceva mai bun.

      În concluzie, dacă AC OCR Plus nu funcţionează, nu kiturile sunt de vină, ci în mod sigur modul de instalare şi locul unde au fost copiate dicţionarele.

      Să stabilim un lucru clar:
      AutoCorect OCR Plus are două foldere numite Dictionare în două locuri complet diferite.
      Dacă nu copiem dicţionarele în folderul care trebuie, AC OCR Plus nu va funcţiona.
      Aş face o glumă: a confunda cele două foldere Dictionare e ca şi când am confunda Noua Zeelandă cu Islanda... pentru singurul motiv că în ambele ţări există vulcani activi.

      Să revenim la cele două foldere numite Dictionare.
      Primul se află în Program Files în folderul de instalare al AutoCorect. El se instalează automat la instalarea AutoCorect standard, aşa ca în imaginea următoare:
      Pentru amicşora imaginea, am păstrat din imagine doar calea de căutare şi conţinutul folderului şi am marcat pe imagine calea de căutare şi folderul cu pricina.
     


      Iată ce anume conţine acest folder Dicţionare. Am marcat şi aici calea de căutare.
     



      Buun! Deci,aici avem dicţionarul DEX, alte dicţionare ale limbii române, dicţionare pe baza cărora funcţionează corectorul de limbă al AutoCorect.
      Acest folder nu are nicio legătură cu dicţionarele care rulează la opţiunile OCR Plus.
      Ăsta ar fi subfolderul Dicţionare din Noua Zeelandă.

      Acum să căutăm celălalt folder Dicţionare, adică pe cel din Islanda.
     


      Iote-l frate! Uitaţi-vă la calea de căutare! Nimic comun cu celălalt folder Dicţionare... doar Diskul este acelaşi.
      Atenţie! În calea de căutare apare un "K7" - aşa-l cheamă pe computerul meu. Pentru cine nu ştie, la instalarea Windows fiecare stabileşte un nume pentru computerului lui. Pe al meu aşa-l cheamă... K7.

      Să ne uităm acum în imaginea următoare şi la ceea ce conţine acest folder Dicţionare din AppData [ca să nu mai zic din Islanda].
     


      În acest folder Dicţionare găsim:
           – folderul OCR_DIC este folderul care ne interesează şi în care se găsesc ele 39 de dicţionare din pachetul OCR_DIC. Demenţionat că acest folder trebuie să se numească chiar aşa. Dacă-l redenumim, AC OCR Plus nu mai funcţionează deoarece executabilul are stabili numele exact al folderului în care să caute şi calea de căutare.

           – folderul Dic UZUALE Contemporane este folderul care conţine dicţionarele uzuale. El poate avea orice nume doreşte utilizatorul, deoarece executabilul nu are stabilită deja o cale de căutare pentru aceste dicţionare. Asta o stabilim noi aşa cum am spus mai sus.

     Tot aici mai găsim şi câteva fişiere, astfel:
           – dicţionarul "implicit.imd" pe baza căruia putem crea noi dicţionare de înlocuire multiplă: el este instalat direct la prima rulare a executabilului AC OCR Plus.
           – dicţionarele  a.dic, i.dic, np.dic, p.dic  sunt dicţionare suplimentare care se folosesc la rularea ortografiei în AC, astfel: "a.dic" conţine înregistrări de abrevieri ale programului, "i.dic" conţine cuvintele ignorate de dumneavoastră când aţi rulat ortografia, "p.dic" conţine cuvintele adăugate de dumneavoastră când aţi rulat ortografia, iar "np.dic" conţine nume de persoane şi este un dicţionar  instalat deja de AC.

     Iată în imaginea de mai jos dicţionarele din folderul OCR_DIC:
     


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Să revenim:
      Dacă primim un mesaj în care se arată că nu se poate deschide un dicţionar.
      Vedem din ce pachet face parte dicţionarul.
      Dacă este un dicţionar Uzual am explicat mai sus cum procedăm.

      Dacă este vorba de un dicţionar din pachetul OCR_DIC privim cu atenţie, pentru că sunt două posibilităţi:
           – dicţionarul pare să fie unul de tip OCR_DIC, dar nu este nicunul din cele 39 din imaginea din poatarea anterioară.
     De exemplu, mesajul este "Dicţionarul CO.SMed.imd nu poate fi deschis."
     În acest caz este vorba de un dicţionar care într-adevăr a avut acest nume, dar asta se întâmpla cu mult timp în urmă. La momentul acela aveam un singur dicţionare de secvenţe mediane.
     Între timp au fost stabilite două şi le cheamă CO.SMed1.imd şi CO.SMed2.imd... deci CO.SMed.imd nu mai există în ultima versiune AC OCR Plus.
     Înseamnă că executabilul AC OCR Plus pe care-l folosiţi este un executabil vechi, deci nu aveţi ultima versiune a executabilului.
     De-a lungul timpului au existat peste 100 de versiuni de executabile... deci faceţi download şi copiaţi în folderul de instalare ultima variantă a executabilului şi apoi verificaţi funcţionarea AC.

           – dicţionarul este într-adevăr unul dintre cele 39 arătate mai sus, el există... şi cu toate astea AutoCorect face pe nebunul şi zice că nu-l găseşte.
     Ei bine, AutoCorect nu este nebun şi nici nu-i arde de glume.
     Înseamnă că dumneavoastră aţi copiat dicţionarele OCR_DIC în alt loc şi nu acolo unde trebuie.
     Cred că e ceva confuzie între folderul din Noua Zeelandă şi cel din Islanda...
     Verificați bine calea de căutare pe care am arătat/o mai sus și puneți dicționarele exact acolo unde trebuie.

     Sper din tot sufletul ca acum să fi clarificat mai bine problema asta.
     Şi scuze de comparaţia cu Noua Zeelandă şi Islanda, dar... n-am găsit alta.   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
tuf
Vizitator



Tot nu am reusit sa imi dau seama care sunt ultimele variante de dictionare.
Un pic de ajutor?


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      În următoarele două zile postez varianta actualizată pentru toate dicţionare: atât OCR_Plus, cât şi Uzuale, inclusiv acel dicţionar separat care corectează "literă mică_cratimă_spaţiu_literă mică".
      După câte ştim, situaţia "literă mică_cratimă_spaţiu_literă mică" se poate cotecta în trei moduri:
           - unirea unui cuvânt rupt [practic se şterge cratima urmată de spaţiu];
           - unirea unui cuvânt cu cratimă care este rupt [se şterge spţiul şi rămâne cratima];
           - cratima apare în mod eronat între două cuvinte separate [dicţionarul şterge doar cratima şi rămâne spaţiul dintre două cuvinte].


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Îmi cer scuze că nu m-am putut ţine de cuvânt şi am întârziat aproape două luni.
      Între timp am încercat să rezolv şi alte probleme decât cele pe care le aveam în vedere în ianuarie.

      Referitor la ultimul grup de modificări, mă refer la înlocuirea cratimei cu EnDash pentru marcarea intervalelor numerice şi înlocuirea literei x cu caracterul × [Unicode 00D7] pentru marcarea semnului pentru înmulţire, menţionez că am lăsat modificările tot în varianta cu confirmare şi le-am pus în ultimul dicţionar [CO_Var7.imd].

      În arhiva de mai jos am pus atât dicţionarele din folderul OCR_DIC, cât şi pe cele Uzuale, aşa cum sunt ele în acest moment în calculatorul meu.

      Download:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Un ultim sfat!

      Atunci când bănuiţi că AC OCR Plus a făcut nişte modificări nedorite, dar nu sunteţi siguri dacă el este vinovat, puteţi proceda astfel:
           – deschideţi programul AC OCR Plus; automat AC deschide şi un document gol;
           – copiaţi în documentul gol un fragment de text care să conţină cuvintele, expresiile pe care credeţi că le modifică;
           – faceţi rularea automată a opţiunii OCR_Plus;
           – urmăriţi în panou dacă şi care opţiune face modificările;

     Dacă nu s-au făcut modificările suspectate, atunci nu AC este vinovatul pentru respectivele nereguli.
     Personal păstrez o salvare de rezervă a OCR_BRUT pentru a confrunta eventualele modificări.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Referitor la ultima versiune de dicţionare:
      Este important de reţinut că în ultima opţiune "10.3 Înlocuiri cu confirmare" rulează 3 dicţionare [CO_Var5.imd, CO_Var6.imd şi CO_Var7.imd] cu un total de circa 1500 de înregistrări cu confirmare.
      Sunt într-adevăr multe, dar dacă ne plictisim şi renunţăm să le rulăm, înseamnă că nu beneficiem de vreun sfert din posibilităţile AC.

      În altă ordine de idei, menţionez că am încercat să elimin cât mai multe dintre înregistrările care produc efecte secundare nedorite: pe unele le-am transferat la modificări cu confirmare.
      Pe de altă parte am adăugat multe înlocuiri în dicţionarele Uzuale: deşi este vorba de cuvinte lungi, unde posibilitatea efectelor secundare este redusă, este posibil, totuşi, ca la vreunele să nu fi observat la timp existenţa efectului secundar.

      Dat fiind că am hotărât să renunţ şi eu la acest proiect şi nu mai intenţionez să dezvolt dicţionarele, ar fi bine ca în perioada următoare, adică timp de o lună, maxim două luni, să mi se semnaleze eventualele înregistrări care produc efecte secundare nedorite pentru a le corecta.

      Referitor la utilitatea AutoCorect OCR Plus.
      Nu intenţionez să laud sau să critic AutoCorect OCR Plus şi nici să recomand folosirea lui ori să propun evitarea lui.
      Singurul lucru pe care-l pot menţiona este că eu îl folosesc la pregătirea textelor din vara anului 2009 când exista versiunea AutoCorect 2.3 şi voi continua să-l folosesc atâta timp cât voi mai corecta cărţi în interes public sau personal.
      Eu sunt unul dintre miile de useri de pe forum, aşa că din punct de vedere matematic părerea mea are o valoare care tinde către zero.

      AutoCorect OCR Plus există.
      Fiecare user este în măsură să hotărască dacă-l foloseşte sau nu.
      Singura recomandare: când foloseşti o unealtă, un instrument, este bine să te documentezi cum funcţionează; e valabil şi la AutoCorect.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Toate erorile semnalate de mine au fost verificate prin metoda pe care ai propus-o in penultima postare. Banuiesc ca nu e o noutate, doar ai uitat sa o mentionezi pana acum.

Daca renunti la dezvoltarea dictionarelor, nu e nicio problema. Chiar ma intrebam cat mai rezisti de unul singur.
Dar, in masura in care iti sunt semnalate erori, daca poti, sa asiguri un minim de asistenta.
Banuiesc ca o sa fie nevoie sa faci un mic tutorial cu felul in care gasesti o inregistrare eronata in toate acele dictionare.
Pe de alta parte, pana acum, numarul de erori a fost destul de mic, asa ca nu cred ca o sa fii sufocat, pe viitor, de erori si cereri de remediere a lor.

Cred am ajuns si in situatia de a avea un subiect FINAL cu AC si OCR+. Peste 2-3 luni bineinteles.

Multumesc pentru toata munca depusa. Mi-ar fi placut sa fie mai multa agitatie prin aceste pagini. Dar, daca doresti, poti considera ca ti-ai facut treaba suficient de bine incat clientul sa nu aiba plangeri de nicio natura.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Practic pe mine nu mă deranjează să dezvolt în continuare dicţionarele.
      Oricum o fac pentru mine personal şi la fiecare carte adaug cuvinte noi într-un dicţionar TEMP pe care apoi le selectez şi pe unele le mut la locul lor, pe altele le şterg.
      Chestia este că am sentimentul că vorbesc singur, că par cineva care vrea doar să se bage în seamă clămpănind aiureli despre lucruri neinteresante. Sentimentul meu este că deranjez şi par cel puţin nebun tot vorbind despre AC unor oameni pe care nu-i interesează absolut deloc problema asta.
      Pur şi simplu, încerc să nu mai postez despre AC pentru a nu mai atât de penibil.

      Postarea de mai sus am făcut-o doar în ideea ca userul să verifice dacă AC-ul este cel care produce anumite greşeli, ori dacă greşelile respective ţin de Abbyy... sau de altă manevră făcută cu neatenţie.
      Eu ştiu că AC poate face unele modificări nedorite, mai ales la cuvintele străne - pentru simplu fapt că este gândit pentru secvenţe de litere din limba română, dar în acelaşi timp ştiu că i s-au pus în cârcă lucruri pe care nu le-a făcut niciodată.

      Am să încerc să fac nişte tutoriale.
      Cred că am să le explic mai întâi pe forum, apoi am să le culeg într-un fişier DOC sau PDF.
      Poate că ar trebui să explic mai întâi care sunt dicţionarele pe care le rulează fiecare opţiune pentru a putea şti cum să fie depistate dicţionarele suspecte;
      Mă mai gândesc... încerc să găsesc soluţia cea mai comodă pentru mine, dar şi pentru eventualii useri interesaţi.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

tuf a scris:

Seven, eu nu mai tin minte, noile dictionare OCR se ocupa si de problema ghilimelelor?
Ma refer la acel dictionar separat. De cand am pus noile dictionare OCR, problemele ghilimelelor au disparut, cu exceptia unei situatii legata de  ghilimele si puncte de suspensie la inceput de cuvant.

Cu dictionarul celalalt ai avut timp sa faci vreo ceva?


     Mai întâi de toate, am să te rog să postezi aici problemele legate de dicţionare.
     Topicul ăsta este mai vizibil decât cel pus sus şi văd mai repede că s-a postat ceva nou.

     1.a. Ghilimele rezolvate
     Da, am încercat să rezolv problema ghilimelelor; cred că cele de sfârşit [de închidere] este rezolvată complet.
     Am încercat ca toate ghilimele de sfârşit să fie de forma 99 sus; e posibil să fi rămas ceva situaţii cu cele de forma 66 sus; oricum, toate ghilimele drepte, fie ele verticale sau oblice, ar trebui să fie rezolvată.

     1.b. Ghilimele nerezolvate:
     Rămân încă probleme în interiorul paragrafului cu acele ghilimele false, apărute  ca urmare a unor pete pe hârtia tipărită.
     De asemenea am descoperit nişte probleme la ghilimele de început, în situaţiile în care nu sunt lipite de litera care urmează. N-am găsit încă un mod de rezolvare.

     2. Dicţionarul tău - punctuaţie.
     Majoritatea situaţiilor sunt rezolvate cu câteva excepţii:
              conversia ?! >> !?; eu cred că există ambele variante şi nu aş înregistra această modificare;
              există 3-4 înregistrări pe care nu le înţeleg, deoarece par că se modifică prin ele însele;

     2. Dicţionarul tău - cuvinte.
     O parte există deja înregistrate, altă parte dintre înregistrări nu sunt în dicţionarele OCR.
     Deocamdată, pe baza dicţionarului tău am salvat un nou dicţionar din care am eliminat ceea ce este deja înregistrat şi acum încerc să vedem ce şi unde mai pot înregistra.
     Cele mai importante înregistrări mi se par cele din familia "tăcu >> făcu", doar că încerc să le găsesc o formulă în grup de litere ca să nu caute toate cuvintele cu rădăcina "tăcu"

      Ideea este că am să-ţi restiui un dicţionar mai mic, care va conţine doar înregistrări care nu se regăsesc în OCR_DIC sau Dic_Uzuale.

      ATENŢIE! Toate dicţionarele OCR_DIC şi Uzuale au diacritice cu sedila. Am văzut că la tine apar şi diacritice cu virgulă.
      E o problemă la care trebuie să cugetăm foarte bine.
      Pentru cei care folosesc diacritice cu virgulă există două variante de lucru:
            - ori rulează OCR_DIC în varianta diacritice cu sedila şi la final fac tot în AC conversia "diacritice cu sedila >> diacritice cu virgula"
            - ori va trebui ca toate dicţionarele să fie realizate şi în varianta diacritice cu virgulă, dar e mult de muncă [eu nu mă bag la editarea lor] şi, în plus,unii dintre useri vor încurca dicţionarele.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Bun, astept varianta prescurtata a dictionarului meu.

Chestia cu sedila... hmmm.... nu stiam de chestia asta
Conversia in virgula o faceam la final in ocr. Dar au fost si texte cu forma actuala de scriere, sa inteleg ca acestea nu au beneficiat de OCR+ din cauza sedilei din dictionare?

In esenta nu ar fi o problema, nu a modificat nimic, si atat. Efect nul.
Dar e bine de stiut.

P.S.
Am deschis dictionarul meu PostOCR+ in AutoCorect, cu Open With.
Am inlocuit virgulele cu sedila, am salvat. Dictionarul pare OK.
Ai incercat asa?

P.S.
De fapt nu merge. Dictionarul nu pare sa functioneze.

P.P.S.
Uite 2 dictionare functionale:

P.P.P.S.
Cred ca te-am inteles gresit. De fapt dictionarele functioneaza, indiferent de tipul de diacritice folosit in text, dar inlocuirile se fac numai cu sedila, deoarece asta exista in dictionare.

Bun. Notepad+

permite deschiderea tuturor dictionarelor in acelasi timp si poate face aceeasi inlocuire in toate dictionarele in acelasi timp. Nu pare sa strice nici dictionarele asa cum face Notepad-ul din Windows.
Deci e floare la ureche de inlocuit sedila cu virgula.
Asta ti-o zic din fuga calului...
Daca solutia mea nu functioneaza, tot nu e bai.
Cat de greu sa fie sa in locuiesti in Word Ș si Ț cu sedila cu Ș si Ț cu virgula?

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Referitor la corecţia modului de scriere a intervalelor numerice; situaţiile concrete cele mai întâlnite sunt periaodele de timp exprimate în ani [1495-1514; 1877-1878....]:
     În dicţionarul CO_Var7.imd am înregistrat următoarele situaţii:

                 99_spaţiu_En_spaţiu_99 >> 99_En_99
                 99_spaţiu_En_99 >> 99_En_99
                 99_En_spaţiu_99 >> 99_En_99

                 99_Crat_99 >> 99_En_99
                 99_spaţiu_Crat_spaţiu_99 >> 99_En_99
                 99_spaţiu_Crat_99 >> 99_En_99
                 99_Crat_Spaţiu_99 >> 99_En_99

                 99_EM_99 >> 99_En_99
                 99_spaţiu_EM_spaţiu_99 >> 99_En_99
                 99_spaţiu_EM_99 >> 99_En_99
                 99_EM_spaţiu_99 >> 99_En_99

unde 99=orice cifră, En=EnDash, EM=EmDash, Crat= cratimă

     Toate înlocuirile sunt cu confirmare.
     Dacă textul nu conţine astfel de perioade - programul nu vă va deranja cu nimic; dacă textul conţine multe astfel de situaţii, vi se va cere confirmarea, ceea ce este deranjant, dar este mult mai comod decât să căutaţi şi să corectaţi manual fiecare situaţie.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Deci 99 inseamna orice cifra?
Zau? Eu tocmai terminasem seria cu 4 )

OK, deci descarc iarasi OCR+... de unde?

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       NUuuuuuuuuuu!
       1. Din păcate nu există în AutoCorect un cod pentru "orice cifră"
       Am folosit eu 99 în postarea de mai sus doar ca să nu mai scriu de fiecare dată "orice cifră".
       În realitate, pentru fiecare situaţie de mai sus sunt 100 de înregistrări; în total sunt 1100 de înregistrări doar pentru corectarea perioadelor numerice amintite.

       2. Am multe dicţionare în lucru aşa că nu pot urca de îndată dicţionarele pe host.
       În timp ce fac o corectură înregistrez din când în când câte-o eroare necorectată de AC şi care mi se pare importantă. Înregistrarea o fac în nişte dicţionare temporare, deci nu în dicţionarele de bază.
       Când îmi găsesc un pic de timp verific dacă nu cumva unele dintre înregistrări există deja, apoi pe celelalte le repartizez pe căprării.
       În ultimele două zile am cam golit dicţionarele temporare, dar mai sunt înregistrări nerepartizate. Încerc în seara asta să mai distribui înregistrări în dicţionarele de bază şi la noapte sau mâine am să urc dicţionarele la zi.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     DICŢIONARE REACTUALIZATE LA 22.05.2015


     Am urcat ultima versiune pentru dicţionarele OCR_DIC şi pentru dicţionarele UZUALE.
     Ambele arhive sunt însoţite de data de astăzi scrisă sub forma [2015.05.22]

     Atenţie! Am păstrat pe host şi varianta anterioară a dicţionarelor; pentru a downloada ceea ce trebuie trebuie să fim atenţi la data pusă înaintea arhivelor.
     
     Adrese arhive RAR neparolate:
     Dicţionare OCR_DIC:   – folder deschis mediafire
     Dicţionare Uzuale:   – folder deschis mediafire


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Mda, te-ai miscat repede cu inregistrarile numerice. Dupa cum ziceam, eu de abia ajunsesem la 4
Pe de alta parte, acum mi-am dat seama ca puteam genera numerele cu Excel.
Merci pentru adaugarea de dictionar.

Astept sa il finalizezi si pe cel primit de la mine, ca sa pot vedea si eu ce pot sa mai adaug in el.

Nu te bat la cap, doar intreb


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Ei... poate o rezolvăm cumva cu un cod pentru cifre şi aducem vom reduce înregistrările alea la 11.
     
     Acum vreau eu să te întreb o chestie: în ce măsură mai foloseşti opţiunea aia separată "Modificări speciale de text", care rulează dicţionarele Vt1 - Vt4 ?

      Aş vrea să aflu cumva cam câţi useri foloseasc această opţiune casă ştiudacă am putea să-i schimbăm rolul.
      Am o serie de grupuri de cuvinte [aproape toate cu confirmare] care ar putea fi introduse în Vt1 - Vt4. Înregistrările cu confirmare par plictisitoare dar sunt foarte eficiente şi pot peria mult mai bine textul. Dacă aş face nişte dicţionare mari cu înregistrări cu confirmare, ar putea fi folosite de către cei interesaţi.
      Problema este că nu ştiu dacă acele dicţionare mai sunt folosite în scopul propus iniţial.
      Ar trebui să facem cumva un fel de sondaj printre useri ca să aflăm cam câţi folosesc opţiunea "Modificări speciale de text".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator




Seven a scris:

***
     Ei... poate o rezolvăm cumva cu un cod pentru cifre şi aducem vom reduce înregistrările alea la 11.
     
     Acum vreau eu să te întreb o chestie: în ce măsură mai foloseşti opţiunea aia separată "Modificări speciale de text", care rulează dicţionarele Vt1 - Vt4 ?

      Aş vrea să aflu cumva cam câţi useri foloseasc această opţiune casă ştiudacă am putea să-i schimbăm rolul.
      Am o serie de grupuri de cuvinte [aproape toate cu confirmare] care ar putea fi introduse în Vt1 - Vt4. Înregistrările cu confirmare par plictisitoare dar sunt foarte eficiente şi pot peria mult mai bine textul. Dacă aş face nişte dicţionare mari cu înregistrări cu confirmare, ar putea fi folosite de către cei interesaţi.
      Problema este că nu ştiu dacă acele dicţionare mai sunt folosite în scopul propus iniţial.
      Ar trebui să facem cumva un fel de sondaj printre useri ca să aflăm cam câţi folosesc opţiunea "Modificări speciale de text".


Nu am folosit niciodata doar o optiune din meniul OCR+. Rulez tot OCR+ o data, apoi punctuatia cu lista ei de erori, apoi acel dictionar pe care ti l-am trimis (mai mult pentru modificarile facute de punctuatie la punctele de suspensie), apoi ortografia.

Spre rusinea mea.... nici nu mi-am dat seama de existenta optiunii la care te referi. Am presupus ca toata dictionarele OCR si Uzuale sunt rulate direct din OCR+.

Daca spui ca totul e cu confirmare o sa o folosesc de acum inainte.

Sunt de acord cu orice dictionar de inlocuiri cu confirmare, indiferent de cat de mare e.
Mai nou, lucrez cartile pe capitole, nu ma lucrez cu tot textul. Le iau pe rand, treaba merge mai repede, mai bine, nu mai e asa de obositor.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Bun. Acele ultime 4 dicţionare din OCR_DIC, mai exact Vt1 - Vt4 au apărut la un moment dat pentru verificarea unor texte care erau deja corectate manual dar care nu fuseseră rulate iniţial prin AutoCorect.
      Să ne amintim exact cum au stat lucrurile:
              - la momentul respectiv lucrai la topicul Serge Brussolo şi aveai la dispoziţie volume corectate manual dar care prezentau erori pe care ochiul nu le percepea deloc, ori le percepea foarte greu.
              - utilizatorii au o anume reticenţă mai mare sau mai mică la înlocuirile cu confirmare, aşa că iniţial am încercat să avem cât mai puţine înregistrări cu confirmare;
              - pentru că existau deja 3 dicţionare cu confirmare care rulau cu opţiunea automată OCR_Plus, ne-am gândit ca aceste 4 dicţionare [Vt1-Vt4] să ruleze în pachet dar într-o opţiune separată şi să le ruleze doar cei în cunoştinţă de cauză;
              - mai mult decât atât aceste 4 dicţionare erau rulate de useri care nu rulau pachetul automat OCR_Plus.
     În concluzie cine rula pachetul automat OCR_Plus nu mai trebuia să ruleze şi opţiunea "Modificări speciale de text", iar cine rula această opţiune însemna că nu a rulat pachetul automat.
     
     Aşa au stat lucrurile iniţial.
     La acest moment eu am o propunere de modificare a dicţionarelor Vt1-Vt4.
     Propun care cei mai grăbiţi şi pe care nu-i interesează să şlefuiască la maxim un text, să ruleze pachetul automat OCR_Plus ca şi până acum.
     Userii care vor să cureţe textul câtr mai bine vor rula mai întâi pachetul automat OCR_Plus şi apoi, în aceeaşi secţiune Ac sau în altă sesiune să continuie cu rularea opţiunii "Modificări speciale de text" unde se vor găsi alte modificări decât cele rulate deja, modificări care au rolul săşlefuiască cât mai bine textul.

     Toate modificările din această opţiune vor fi cu confirmare, deci userii au nevoie de răbdare şi atenţie; în principal va fi vorba de grupuri de cuvinte.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Deci VT1-VT4 pot fi accesate doar din meniul de sus, adica Modificari speciale text > Modificare text corectat eronat?
Aceste 4 dictionare nu sunt rulate de OCR+?

Daca doresti sa aduci imbunatatiri acestor dictionare, chiar daca vor fi exclusiv cu confirmare, eu sunt de acord.
Oricum, dupa cum ai vazut, rulam deja, la final, un dictionar cu confirmare separat de cele implicite.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
tuf
Vizitator





Seven, ai 4 optiuni pentru ghilimele la punctuatie.
Tu ce intelegi din ele? Eu as spune ca fie se contrazic, fie trateaza ghilimele diferite.
Tu cum ai setarile?

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Cred că avem o problemă.
     Eu fac doar rulări din pachetul OCR_Plus; în cazul ăsta folosesc "Punctuaţie/OCR Plus".
     Setările din "Punctuaţie/Documente" nu mă afectează, aşa că pot fi oricum.

     Să revenim la tine:
     Tu faci rulare OCR Plus, deci te interesează setările din "Punctuaţie/OCR Plus".
     După aceea faci corectură manuală în AutoCorect, lucru pe care eu nu-l fac.
     În mod normal nici pe tine nu ar trebui să te intereseze setările "Punctuaţie/Documente", pentru că ai rulat deja opţiunile pentru punctuaţie.

     Întrebarea este: dacă pe timpul corecturii rulezi opţiunea "Punctuaţie" din stânga-sus a ferestrei, care dintre opţiunile "Punctuaţie" ar rula?
     Nu sunt sigur, dar cred că în acest caz ar rula "Punctuaţie/Documente"; deci doar în acest caz te-ar interesa setarea acelor opţiuni.
     Cel mai bine ar fi să eviţi rularea suplimentară a Punctuaţiei folosind opţiunea din panoul din stânga.

     Revenind la întrebare:
     Da, acele opţiuni se contrazic; ele funcţionează pe baza funcţiei "SAU" şi nu pe baza funcţiei "ŞI"; deci, ele nu se activează toate, ci ori o variantă, ori cealaltă variantă.
     Aceste setări nu sunt nişte erori de implementare, ci implementate la cerere.
     Am urmărit toată istoria AutoCorect din primii 10 ani; cea mai importantă perioadă de dezvoltare a fost prezentată pe un forum al traducătorilor de subtitrări.
     Ei bine, oamenii de acolo, traducătorii şi corectorii de subtitrări, au cerut implementarea acestor opţiuni şi se refereau în mod special la modul de afişare a diverselor lucruri în subtitrări.

     Se pare că în tipografie şi subtitrarea profesionistă pentru Cinema şi TV există un caracter care se numeşte "jumătate de spaţiu", caracter care înseamnă exact ceea ce sugerează numele. Acest caracter este folosit înaintea semnelor de punctuaţie, lucru care pe computer nu se poate face.
     Din acest motiv traducătorii de subtitrări au avut o dezbatere lungă pe tema dacă semnele de punctuaţie trebuie însoţite sau nu de spaţii şi fiecare argumenta cu modele de subtitrare din alte limbi pe de o parte şi cu regulile de editare a limbii române pe calculator pe de altă parte.
     Ca să-i împece şi pe unii şi pe alţii, s-a propus implementarea punctuaţiei pentru ambele variante.
     Ăsta este motivul pentru care în "Punctuaţie/Document" au apărut acele setări complexe.

     Pentru noi, pur şi simplu Cosmin Ciupercă şi Daniel Morlova au creat o opţiune complet nouă care nu are legătură cu celelalte şi aşa a apărut "Punctuaţie/OCR Plus".


     Iată cum arată setările mele în cele 5 taburi.
     Ca să nu lungesc postarea, imaginile se afişează doar la activarea linkurilor.

     Tab "Conversii" 
     Tab "Punctuaţie de bazăi" 
     Tab "Majusculă" 
     Tab "Diverse" 
     Tab "Sugestii" 


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



OK, o sa trec pe setarile tale pentru a avea rezultatele si problemele cat mai asemanatoare.
P.S.
Setarile noastre de OCR+ sunt identice, cu exceptia notificarilor de punctuatie pe care tu nu le folosesti.
Dilema mea e la program. Vezi mai jos.

Cu prima ocazie cand aduci dictionarele la zi, urca-le direct in AC portabil cu setarile facute cum crezi tu ca e mai bine.
Atat pe partea de program cat si pe partea de OCR.
Motivul pentru care rulez functia de Punctuatie a programului, e pentru ca am nevoie de acea lista de posibile erori.
Vezi imaginea de jos.

Nu prea imi este clara problema pe moment. Cred ca pot sa ajung unde vreau dar trebuie sa mai experimentez.

Am instalat Windowsul ieri, confirm faptul ca dictionarele, ortografie si cele de cuvinte ignorate per fisier, nu sunt afectate.
Se gasesc in:
Autocorect\AutoCorect.cameyo.files\CHANGES\%AppData%\AutoCorect Contemporan\Dictionare

p.dic - contine cuvinte corecte adaugate manual in DEX-ul AC-ului pe durata rularii corectorului ortografic.

NumeFisier.ExtensieFisier.dic contine cuvintele ignorate (IGNORE ALL) pe durata rularii corectorului ortografic. Sunt corecte, dar nu au relevanta decat pentru acel fisier.

Cat de des te-ai lovit de grupul asta?
„î
«î
recunoscut eronat ca î mic?

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Folosesc Word de foarte mult timp, mai folosesc şi câteva macrocomenzi mai simpluţe, aşa că mi-e mai la îndemână să corectez în Word.
     În altă ordine de idei prefer să corectez în Word şi să adaug atunci când este necesar înregistrări în dicţionare AutoCorect. De aceea, folosesc opţiunea Ortografie doar din când în când şi numai pentru anumite cărţi.
     Opţiunea Ortografie din AuroCorect este foarte puternică, doar că ar fi dificil să întrerup pentru a înregistra o eroare, aşa că până acum am fost aproape obligat să nu o folosesc.

     Referitor la lista de posibile erori de punctuaţie.
     La începuturile AC OCR Plus am folosit atât varianta cu listă, cât şi varianta fără listă.
     Dacă iei fiecare situaţie din listă la verificat şi corectat te costă ceva timp. În situaţia în care folosesc AC doar pentru rularea pachetului OCR_Plus şi alte dicţionare, nu-mi mai este de folos lista.
     Acele eventuale erori de punctuaţie le corectez pe timpul corecturii manuale şi în plus fac câteva verificări de genul: paragraf care se termină cu virgulă, paragraf care se termină cu literă... la final vor mai apărea un număr foarte mic de astfel de situaţii şi le corectez pe loc.
     Astea sunt motivele pentru care îmi setez punctuaţia fără afişare listă de erori.

     Revenind la cele două situaţii semnalate: „î  şi  «î
     Nu sunt sigur dacă am înţeles:
           -  „î  şi  «î  apar în loc de Î mic simplu, adică n-ar trebui să apară acele ghilimele? Nu-mi amintesc să fi întâlnit foarte des astfel de situaţii.
           -  „î  şi  «î  apar în loc de Î mare la început de paragraf sau început de dialog? În cazul ăsta putem adăuga 4 înregistrări cu sau fără confirmare şi o rezolvăm.
           -  „î  şi  «î  apar în loc de Î mare în mijloc de paragraf? Atunci e musai ca înlocuirile adăugate să fie cu confirmare pentru că există foarte multe situaţii în care după cele două variante de ghilimele, "î"-ul este chiar "î" mic.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Cele doua grupuri le intalnesc des la o carte plina de citate. Am î in loc de Î, cu ghilimele in fata.
Daca nu prea ai intalnit-o, o sa o consider doar o particularitate a acestui ocr.

Daca nu folosesti optiunea de Punctuatie, daca doar rulezi OCR+ si apoi te muti in Word, atunci nu iti mai bate capul.
Oricum ar fi, am verificat acum si optiunea ce ma interesa nu e accesibila din setarile programului. E ascunsa sub o singura bifa ce contine mai multe chestii:

Pentru documente:
Scoate spaţiile de la sfârşitul de linie
Majusculă la început de propoziţie (nu cu liniuţă de dialog)
Introduc spaţiu între liniuţa de dialog şi cuvânt la început de frază
Schimb virgula în punct înainte de liniuţa de dialog
Trei liniuţe se înlocuiesc cu trei puncte  (---)  ®  (...)
Pune spaţiu înainte de paranteză deschisă ( [ {
Pune spaţiu după paranteză închisă ) ] }
Scoate spaţiu după paranteză deschisă ( [ {
Scoate spaţiu înainte de paranteză închisă ) ] }
Scoate repetare  caracterelor ; : ,   (;;; ®
Scoate spaţiu înainte , . ; ? !
Pune spaţiu după virgulă
Pune spaţiu după :
Pune spaţiu după ; ! ?
4 sau mai multe puncte trec în 3 (......) ® (...)
Scoate spaţiu dintre combinaţiile de ? şi !  (? !  ®  ?!)

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am înţeles chestia cu Î şi ghilimele.
     Am adăugat deja în VT4 variantele pentru ambele tipuri de ghilimele în următoarele situaţii:
           - la început de paragraf;
           - la început de dialog.
           - la început de frază: după punct urmat de spaţiu, ! urmat de spaţiu şi ? urmat de spaţiu.
     Deocamdată sunt cu confirmare, dar cred că merg automat, exceptând ! şi ? urmat de spaţiu urmat de ghilimele. În aceste două situaţii, î-ul ar putea să fie corect cu minusculă.
     Vor rămâne necorectate situaţiile în care citatul este în mijlocul frazei, caz în care grupul poate apărea după virgulă sau literă mică urmată de spaţiu.
     Dacă aş înregistra o astfel de situaţie, ae exosta mai multe refuzuri de confirmare decât cazuri de confirmare. Dacă apreciaţi că este nevoie, atunci pot adăuga şi astfel de situaţii.

     Am rezolvat şi problema cu spaţiu după „... Ana are...
     Este o situaţie specială care la prima vedere contravine regulilor Punctuaţiei.
     Punctuaţia adaugă spaţiu după semnele de punctuaţie, deci şi după Elipsis [puncte de suspensie].
     În cazul nostru acest Elispsis nu încheie o frază, ci o deschide.
     În astfel de situaţii poate interveni doar un dicţionar. La momentul ăsta corectura este înregistrată.

      Acum am ceva de rezolvat. Revin mai spre seară.

     Apropo!
     Cred că am deja prima versiune pentru dicţionarele care rulează cu opţiunea "Rulează toate funcţiile de corectare OCR" plus opţiunea independentă "Modificări speciale de text".
     Începând cu aceste dicţionare ambele opţiuni se rulează în mod OBLIGATORIU.

     La acest moment dicţionarele Vt1 - Vt4 care rulează cu opţiunea "Modificări speciale de text" sunt înregistrări cu confirmare.
     Mai am câteva dicţionare de expresii de 2-3 cuvinte care rezolvă cuvinte de genul "mal >> mai", "ele >> de" etc. Aceste dicţionare conţin atât înregistrări automate de genul "cele mal mari >> cele mai mari", dar şi înregistrări cu confirmare de genul "am/ai mal >> am/ai mai"
     Dat fiind că înregistrările sunt atât automate,cât şi cu confirmare nu le-am adăcugat încă în aceste dicţionare, dar cred că şi ele ar merita să fie adăugate.

     Le mai verific şi aş vrea săle postez pe forum, dacă există useri care ar fi dispuţi să facă nişte testări.
     Dat fiind că aceste dicţionare vor fi ultimele, adică varianta finală, nu-mi pot permite să le postez fără o testare mai serioasă decât până acum.
     Dacă sunt persoane care vor să mă ajute cu astfel de testări pot să posteze direct aici pe topic sau să-mi confirme pe MP sau mail.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Pentru a fi testate cu adevarat mai intai se folosesc, apoi se corecteaza cartea prin citire.
Nu am cum sa te ajut acum, nu am nimic de corectat prin citire acum.

Trimite-mi link pe MP sau adu-le aici cu mentiunea TEST.
Imediat ce finalizez chestiile de acum, trec si la dictionarele noi.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Gata. Am finalizat dicţionarele pentru noua variantă de rulare a AC OCR Dic.
      Mai am ceva de lucru la Vt7.
      Atenţie, @tuf!  Actualul Vt7 cuprinde şi ce amai rămas din dicţionarul tău, aşa că nu mai trebuie rulat separat.

      1. Din dicţionarele uzuale a fost eliminat dicţionarul „Gr_TOT.imd”.
      La prima rulare trebuie făcută setarea la opţiunea 9 şi şters acest dicţionar din lista de rulare.

      2. După rularea automată a opţiunii "Rulează toate funcţiile de corectare OCR", se rulează în mod obligatoriu şi opţiunea independentă "Modificări speciale de text/Modificări text corectat eronat”.

      Nume arhivă:  DIC Finale V1.1.rar
      Adresa:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Cred ca o sa refac AC-ul portabil cu noile dictionare.

Deci asta e o versiune de test sau finala?

Pana la urma esti sigur ca noile dictionare iti ruleaza in AC portabil? Sigur nu ruleaza tot cele vechi?
Ai verificat inlocuirile pe care le face, iar ele corespund noilor dictionare?


pus acum 9 ani
   
corall
Membru Gold

Inregistrat: acum 17 ani
Se poate verifica în dicţionare cuvântul sabie? La trecerea prin autocorect acesta este inlocuit de săbie (ex. sabiei-săbiei) Am constatat acest lucru la folosirea AC-portabil cat şi la folosirea dicţionarelor mai vechi.
Ar mai fi un lucru de semnalat apariţia literei î la început de paragraf, rămâne litera mică în locul celei mari.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Tuf, nu cred că trebuie refăcut AC Portabil la momentul ăsta.
     De altfel, în acelaşi portabil se pot înlocui vechile dicţionare cu acestea noi.
     Singura problemă ar putea fi cu acel dicţionar pe care l-am şters din uzuale şi a fost transferat în dicţionarele Vt.
     Am numit-o varianta finală ca să atrag atenţia userilor că dicţionarele astea sunt altceva decât cele de până acum şi că se rulează în mod obligatoriu două opţiuni.

     Am făcut mutări masive de înregistrări dintr-un dicţionar în altul şi deocamdată asta este o variantă test. Nu voi mai adăuga alte înregistrări, dar s-ar putea să mai şterg câteva, ori să le mut, sau să modific condiţiile pe undeva.
     Adevărata varianta finală o vom avea după ce mai mulţi useri vor testa această variantă.

     Corall,
     Înregistrarea sabiei-săbiei a existat, dar a fost eliminată. Cred că nici în varianta de dinaintea acesteia nu mai exista.
     Litera î minusculă se înlocuieşte cu Î majusculă la început de paragraf, doar dacă înainte avem un paragraf întreg.
     În AC, prin "paragraf întreg" se înţelege un paragraf text care respectă toate regulile.
     Este pusă această condiţie pentru a nu pune majuscule în cazul în care un paragraf este rupt la sfârşit de pagină şi şi se continuă pe pagina următoare, continuarea începând cu un cuvânt care începe cu litera î.

     Problema o rezolvăm doar cu o înregistrare cu confirmare.
     Am adăugat-o deja şi este prima înregistrare cu confirmare care rulează în dicţionarul Var5, practic prima înregistrare cu confirmare din program.
     Vezi şi setările mele la punctuaţie care sunt postate sub formă de imagini la acesare link, cu câteva postări mai sus. E posibil ca setările tale la majusculare să fie diferite.

     LE:
     Am copiat aici setările mele la Punctuaţie.
     Tab "Conversii" 
     Tab "Punctuaţie de bazăi" 
     Tab "Majusculă" 
     Tab "Diverse" 
     Tab "Sugestii" 


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ca să nu mai fie nicio problemă am urcat o nouă arhivă care cuprinde şi modificarea de mai sus.
      Nume arhivă:  DIC Finale V1.2.rar
      Adresa:

      Aş mai avea nevoie de o listă de nume româneşti care încep cu litera I, precum Ileana, Ioan, Iulian şi care apar eronat cu L mic, adică lleana, loan, lulian.
      Avem un dicţionar în Uzuale care se numeşte "Z Nume Rom.imd" dar ar mai trebui completat.

      ATENŢIE!
      La ultimele dicţionare mă interesează atât dacă cineva descoperă modificări nedorite, dar mai ales dacă o anume înregistrare este mai agasantă şi ar trebui mutată mai la coada dicţionarelor.
      Prin înregistrare agasantă înţeleg o înregistrare care deşi este corectă necesită multe refuzuri de confirmare... pentru comoditatea userilor, astfel de modificări le putem muta în ultimul dicţionar.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     Trebuie să menţionez că în afară de dicţionarele postate mai sus, eu mai folosesc un dicţionar pentru a rezolva ruperile de cuvinte.
     Este vorba de succesiune:  cratimă_spaţiu_litere mici
     Avem trei moduri de rezolvare:
          - lipirea unui cuvânt obişnuit [care se scrie fără cratimă]; practic se elimină cratima şi spaţiul şi se uneşte cuvântul;
          - lipirea unui cuvânt care se scrie cu cratimă; se elimină spaţiul şi se păstrează cratima, obţinând un cuvânt scris cu cratimă.
          - eliminarea unei cratime false dintre două cuvinte; se elimină cratima falsă şi se păstrează spaţiul dintre două cuvinte.

     Acest dicţionar este unul atipic şi îl rulez separat după rularea opţiunilor la pachet.
     De ce este un dicţionar atipic?
     Pentru că are 6 înregistrări, dintre care 3 cu rol de avertisment şi 3 cu rol de înlocuire.
     Deoarece n-am găsit o metodă simplă de a introduce o AVERTIZARE sau o INFORMAŢIE, am apelat la varianta de dicţionar cu confirmare pe următorul principiu: am pus câte o  înregistrare care afişează un mesaj, iar următoarea aplică modificarea afişată în mesaj.
     Practic la mesaj se răspunde cu "renunş" urmând ca apoi imediat să confirmăm doar situaţiile menţionate în mesaj.

     Să detaliem:
     Deschidem dicţionarul şi îi dăm comanda de rulare.
     Dicţionarul caută un cuvânt cu frecvenţă mare; eu am ales cuvântul "de" şi apare fereastra de înlocuire cu confirmare; ceea ce apare aici ca înlocuire este practic doar un mesaj de avertizare, care ne informează ce anume face următoarea înregistrare:
     Primul mesaj este:
Următoarea înlocuire LIPEŞTE cuvinte. Apasă RENUNŢ.
      Acţionăm butonul "Renunţ" şi începe rularea următoarei înregistrări, cea care lipeşte cuvinte. Din păcate la această înregistrare nu apare nimic ca mesaj "Înlocuieşte cu", deoarece dicţionarul şterge caractere dar nu adaugă nimic.
     Trebuie să fim atenţi să dăm confirmare doar pentru situaţiile în care cuvintele trebuie lipite pur şi simplu.
     Iată mesajele care apar la primele două înregistrări:



     După ce s-a verificat întregul text, dicţionarul revine la începutul textului şi intră în funcţiune înregistrarea nr.3 care este din nou un mesaj care ne informează ceea ce face următoarea înregistrare.
     De data aceasta mesajul este:
Următoarea înlocuire pune CRATIMĂ. Apasă RENUNŢ.
     Apăsăm renunţ şi confirmăm apoi doar situaţiile în care vor fi lipite cuvinte care se scriu cu cratimă.
     De data aceasta la înregistrarea care face modificarea avem afişată o cratimă.
     În imaginea următoare avem fereastra de confirmare pentru înregistrările nr. 2 şi 3.



     După confirmare tutror modificărilor necesare, dicţionarul revine la începutul textului, şi cu înregistrarea nr.5 caută cuvântul "de" pentru a putea afişa următorul mesaj:

     Următoarea înlocuire pune SPAŢIU. Apasă RENUNŢ.
     Imediat va începe rularea înregistrării 6 care şterge cratima şi păstrează spaţiul dintre cuvinte; şi de data aceasta avem înlocuirea afişată în fereastra sub forma ^_ care este codul pentru spaţiu obişnuit.
     Mai jos avem imaginea cu ferestrele de confirmare pentru înregistrările 5 şi 6.



     Pentru cei interesaţi am urcat din nou acest dicţionar care se numeşte "[C] Cratimă eror - cu avertizare.imd"
     Adresa este tot cea de mai sus:
 


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



O sa il refac imediat ce ne convingem de finalitatea dictionarelor.

Dar... repet intrebarea initiala, esti sigur ca dictionarele noi ruleaza? Esti sigur ca noile inlocuiri sunt operate in text?


pus acum 9 ani
   
tuf
Vizitator



Apropo... o alta inregistrare cu confirmare
etc. litera mare > etc. litera mica

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Trebuie să mai aşteptăm puţin. Poate că apar ceva probleme.

      Am constatat că Portabilul preia nişte setări din AC instalat dacă avem şi un AC instalat sub Windows. De exemplu, fără să modific ceva AC Portabil găsea singur dicţionarele Uzuale din computerul meu şi nu pe cele din folderele de la portabil. Poate că totuşi am făcut din greşeală vreo setare. Dar dacă n-am făcut li AC portabil preia şi celelate dicţionare din computer.
      Eu am o problemă. Nu pot şterge AC instalat pentru că am mare nevoie de el.
      Cred că doar cineva care are doar Portabil, precum Zvona, poate să ne spună dacă lucrurile sunt în regulă.

      Am mai constata un lucru. Am dezactivat nişte dicţionare din OCR_DIC prin redenumire. Ele nu rulează şi nu deranjează cu nimic, dar au rămas în pachet: este vorba despre: CO_SMed1 [2].imd, Z CO_Grn [2].imd şi Z CO_Var6 [22.05].imd. Practic în OCR_DIC sunt 42 de dicţionare în loc de 39, dar numai cele 39 rulează. Singura problemă este că au rămas acolo.
      Din acest motiv voi mai umbla la dicţionare... în plus trebuie să mai lucrez la Vt7.

      LE: complicat cu modificarea literei după acel "etc.". Nu pot implementa cu o singură înregistrare gen:
          etc. ^l  >> etc. ^L
pentru că nu am cum să pun orice literă mare identică cu litera mică.

      Trebuie să pun înregistrări de genul
          etc. A  >> etc. a;  etc. B  >> etc. b; ...  etc. Z  >> etc. z

      Revin să spun dacă am implementat chestia asta şi am să spun unde le-am înregistrat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Tuf, am definitivat structura.
     Dacă vor mai exista modificări, ele se vor referi doar la modificările unor înregistrări din dicţionare; deci structura va rămâne absolut aceeaşi.
     Cred că poţi face o nouă variantă de Portabil cu condiţia să pui dicţionarele din arhiva următoare:

     Nume arhivă:  DIC Finale V1.30.rar
     Adresa:

     Ca să nu mai fie nicio problemă am şters deja celelalte două variante de dicţionare, dar am continuat să cresc numărul de versiune.
     Am să adaug şi o notă care-i averuzează pe useri că trebuie să ruleze obşigatoriu cele două opţiuni şi că trebuie să şteargă un dicţionar din Uzuale.

     Gata. În următoarele zile nu modific nimic, dar aştept semnalări de la useri privind înregistrările.

     Am uitat să anunţ că am făcut 30 de modificări legate de "etc. urmat de literă mare" şi le-am pus la începutul ultimului dicţionar, Vt4 şi se regăsesc în arhiva demai sus.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



OK. O sa fac o noua versiune cu noile dictionare. E mai sigur asa.
Totodata vreau sa mai incerc cateva aplicatii portabile.

Motivul pentru care te bat la cap cu dictionarele:
- daca sterg toate dictionarele OCR si uzuale, apoi rulez OCR+, primesc cateva erori de dictionare lipsa.
- daca ma duc in setarile si in dosarele dictionarelor uzuale, gasesc cateva dictionare, desi acolo ar trebui sa fie gol.
Unele dintre ele apar spontan, e posibil sa fie chiar acele dictionare la care primesc erori.
Acesta e motivul pentru care vreau sa fiu sigur ca AC-ul lucreaza cu noile dictionare, ca nu cumva sa le acceseze pe cele vechi care sunt ascunse cine stie pe unde.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      După ce refaci Portabilul şi dezinstalezi AC sub Win, nu uita să ştergi manual dicţionarele din Appdata care nu se şterg la o simplă dezinstalare. Doar atunci eşti convins că dicţionarele există doar în AC Portabil.

      După ce postezi noul AC Portabil am să fac şi eu o dezinstalare completă şi am să fac testări.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     tuf, fii atent la ce m-am gândit.

      Am constatat că unii dintre useri au probleme exact la găsirea subfolderelor în care trebuie să pună  noile dicţionare.

     După ce realizezi AC Portabil şi înainte de a-l posta, cred că ar fi bine să creezi un subfolder "Comenzi rapide" în care să aduci 3 scurtături: scurtătură de le subfolderul OCR_DIC, de la subfolderul Dic_Uzuale [sau speciale... - nu ştiu exact cum le numeşti tu] şi de la executabilul AC OCR Plus.
      În felul ăsta userii care au mai puţină experienţă vor putea modifica dicţionarele mai uşor, fără să caute prin folderele şi subfolderele portabilului.
      Poate că scurtătura de la executavil ar trebui scoasă chiar mai în faţă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Pai uite noua varianta cu dictionare la zi:

Este posibil ca setarile din Roaming/Aplication Data sa se amestece cu cele portabile. Recomand dezinstalarea AutoCorectului si stergerea dosarului din Roaming/Aplication Data.
- practic problema era la una dintre setarile mele, am facut o instalare si o setare pe curat, pe baza ei am refacut executabilul, acum totul merge direct "din cutie" fara setari suplimentare.

Inclusiv dictionarele uzuale.
ASTEPT O CONFIRMARE SEPARATA!


Partea a doua:
- pe un sistem curat (care nu a vazut AC in viata lui), am adus AC-ul portabil, am sters toate dictionarele si am rulat OCR+. Erori de dictionare.
- partea ciudata e ca optiunea 9 din OCR+ continua sa afiseze dictionarele uzuale, ba chiar le si adauga.
- iar asta e valabil pentru toate dictionarele, daca incercam sa deschidem un dictionar OCR sau uzual, folosind optiunea de inlocuiri, acele dictionare par a fi acolo. Dar nu sunt, dau eroare la

deschidere.

P.S.
Pentru gasirea dosarelor cu dictionare, nu se pot face scurtaturi. Locul in care va fi pus programul variaza de la utilizator la utilizator.
Poate fi doar indicata calea catre ele in cadrul dosarului de program.

P.P.S.
Desi e posibil (in teorie) ca dupa ce executabilul si-a extras fisierele, sa inlocuiesti dictionarele cu altele noi, dictionarele originale se gasesc in continuare in executabil.
Mai pe scurt, in cate dosare pui executabilul si il pornesti, de atatea ori va extrage fisierele si dictionarele existente la momentul crearii sale.
Tocmai de asta imi tot suprascria si mie dictionarul personal de ortografie.
Acele fisiere sunt extrase din executabil pentru a grabi pornirea programului si a evita "contaminarea" calculatorului gazda.
Deci am in continuare indoieli in privinta aducerii la zi a dictionarelor doar prin inlocuirea loe


pus acum 9 ani
   
tuf
Vizitator



Am facut niste dictionare OCR cu niste inlocuiri la nimereala, le-am inlocuit pe cele bune.
A functionat.


pus acum 9 ani
   
tuf
Vizitator



Executabilul portabil pare sa functioneze DIRECT pe XP SP3.

Pe Windows 8.1 64 biti da eroare la incarcarea dictionarelor uzuale. Problema se remediaza usor, prin stergerea si selectarea dictionarelor din cadrul optiunii 9.
O sa incerc sa fac o versiune pe Windows 7 64 biti sau pe Windows 8.1 64 care sa functioneze direct, fara interventii din partea utilizatorului.


pus acum 9 ani
   
rickerk
Membru Gold

Inregistrat: acum 19 ani
salutari!

am incercat ultima varianta Autocorect postata de  @tuf.
Problema: la proces de rulare OCR+ punctul 9 imi apare mentiunea ,, Dictionarul Gr_Cifr_rom.ind nu poate fi deschis''
Poate ma ajutati mai departe!

P.S. : am lasat setarile in program asa cum erau; am Win 7 64


pus acum 9 ani
   
tuf
Vizitator



AutoCorect Portabil pentru Windows XP:


AutoCorect Portabil pentru Windows 7&8 64 biti:


Toate ar trebui sa functioneze fara modificari din partea utilizatorului. Testat pe masini virtuale, astept comentarii.

P.S.
Seven, cred ca pot fi editate si executabilele impreuna cu fisierele din interior, adica putem sterge sau putem adauga dictionare. Dar vedem asta la urmatoarea serie de dictionare. Sau putem incerca mai devreme.

P.S.
Astept detalii rickerk.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       1. Am dezinstalat AC OCR Plus CO şi CL, am şters toate "rădăconile" din AppData.
       În mod normal Portabilul ar trebui să nu mai găsească nimic în computer.
       Am început o testare cu un fişier OCR BRUT care este în derulare.

       2. Văd că noua variantă constă doar într-un executabil.
       În acest caz sunt aproape convins că indiferent ce setări am face, ele dispar la închiderea programului, iar la o deschidere nouă programul porneşte de la setările iniţiale.
       Pentru userii mai puţin iniţiaţi este mai bine, doar că va trebui să refaci portabilul dacă vom face îmbunătăţiri.

       3. Mă gândeam dacă n-ar fi bine să deschidem un topic special pentru AC Portabil; cred că ar putea fi mai uşor de urmărit de către cei interesaţi.
       În cazul în care deschidem un topic nou, poate ar fi bine să mutăm nişte postări de aici în noul topic.

       LE: a apărut şi la mine mesajul: "Dicţionarul Gr_cifr_rom.imd nu poate fi deschis". M-am uitat în folderele desfăşurate pe timpul rulării programului şi nu apat dicţionare uzuale.
       Am constatat că în aceste foldere aceste dicţionare apar [se extrag] pe măsură ce rulează programul.
       S-ar părea că după mesajul despre dicţionarul Gr_cifr_rom.imd, programul a renunţat complet să mai ruleze opţiunea 9.
       E posibil cumva ca tu să fi şters dicţionarul "Gr_cifr_rom.imd" în loc să ştergi "Gr_TOT.imd"? şi din cauza asta să apară mesajul?
       Rularea se apropie de final. Astea sunt primele constatări.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am Win7/32 şi am folosit varianta portabilă pentru XP.

      Constatări - 2
      Folderele şi subfoldere extrase pe timpul primei rulări au rămas în computer,deci nu s-au şters la închiderea programului.
      Încerc sp pun un subfolder pentru Uzuale şi apoi să redeschid programul şi să setez calea de căutare la opţiunea 9.

      Postarea asta rămâne deschisă pentru a nota următoarele constatări.
      Apar probleme...
      Cred că am găsit o rezolvare.
      Am şters tot portabilul.
      L-am redownloadat şi am deschis programul şi un fişier.
      Portabilul şi-a instalat folderele şi subfolderele principale.

      Nu am rulat nicio opţiune şi am mers direct la opţiunea 9.
            - în subfolderul portabilului AutoCorect.cameyo.files/PROG/%AppData%*/AutoCorect Contemporan/Dictionare/
am crea un subfolder "Dic_UZUALE" în care am copiat dicţionarele uzuale.
            - la opţiunea 9 am intrat pe setări, am şters dicţionarele care aveau calea de căutare pentru Ac Instalat, apoi am încărcat dicţionarele din subfolderul "Dic_UZUALE" creat mai sus.
            - am rulat opţiunea 9 şi opţiunea arulat corect fără să mai afişeze mesaje că nu găseşte dicţionare.

****************
      Am revenit la opţiunea principală "Rulează toate funcţiile de corectare OCR" şi am dat comanda de rulare a pachetului.
      Rularea s-a desfăşutar fără probleme.
      Am dat comanda de rulare a opţiunii "Modificări speciale de text/Modificare de text eronat".
      Rulare fără probleme.
      Am salvat documentulşi am închis programul.

      Apropo! M-au cam enervat nişte modificări pe care trebuie să le mut spre final.
      Trebuie să pun nişte modificări  ti >> ţi; deocamdată avem doar  ti >> fi.

      Voi redeschide programul pentru arula un alt fişier pentru a vedea dacă apar probleme.
****************

      Am redeschis programul portabil.
      Bidefender a făcut pe deşteptul şi m-a avertizat că a dezinfectat el ceva. E posibil să-mi fi şters ceva din portabil. Deocamdată nu ştiu despre ce e vorba.
     
      10.02 [cca] Am încărcat fişier OCR şi am pornit pachetul de bază, care a început să ruleze.
      10.11 Programul rulează corect, dar merge mult mai greu. A a ajuns doar la op.4.4 în cca 7-9 minute.
      10.20 Terminat pachetul "Rulează toate funcţiile de corectare OCR"; pornensc opţiunea "Modificare de text eronat"
      10.24 Terminat rularea. Salvat fişier. Ieşit din program.
                N-au fost probleme.

       Am să încerc o a treia rulare, după ce iau o pauză de fo juma de ceas.
       Apropo! N-am înţeles ce zice Bitdefender că a dezinfectat. Oricum, se pare că nu a şters ceva care să "deranjeze" rularea programului.

****************
       10.35 Start rularea nr.3
       Ups!... ups!... ups!... mii de goange!!... Nu mai găseşte dicţionarele OCR_DIC, deşi ele există în subfolderul respeciv.
       Nu mai găseşte nici dicţionarele Uzuale. Bineânţeles că şi ele există.
       Rularea 3 eşuată complet.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
rickerk
Membru Gold

Inregistrat: acum 19 ani
Salutari!

la punctul 9 aceeasi problema.

PS : @ tuf - antivirusul meu ( G- Data ) m-a avertizat ca fisierul pe care l-ai postat este virusat; s-ar putea ca si alti useri sa aiba probleme cu descarcarea.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     tuf şi rickerk, cred că aţi văzut notele mele de mai sus privind cele 3 rulări.
     La prima rulare apare mesajul "Dicţionarul Gr_cifr_rom.imd nu poate fi deschis".
     Eu cred că mesajul trebuie interpretat că programul nu găseşte niciun dicţionar uzual pentru că după mesaj programul renunţă la opţiunea 9.
     Dacă la prima rulare avem doar această problemă, la rulările următoare apar şi alte probleme.

     Eu am un Portabil pentru Ms Office 2010 care cuprinde executabile pentru programele din pachet şi un fişier "DAT" imens în care sunt toate măţăraiele programului.
     În timpul rulării programului se creează şi alte fişiere, dar aceste fişiere suplimentare sunt şterse automat la închiderea programului. Rezultă că folderul principal al Portabilului rămâne de fiecare dată acelaşi şi nu se modifică.

     Ideea este următoarea:
     Cred că înainte de convertirea Ac în portabil, s-ar putea încerca următoare modificare.
     Folderul Dic_UZUALE să fie mutat din AppData în Folderul de instalare alături de folderele Dicţionare şi DEX.
     Tuf face setarea ca uzualele să se încarce din folderul Uzuale din folderul de instalare.
     După asta face convertirea în AC Portabil.
     E posibil ca în acest mod programul să ruleze corect la prima rulare/încărcare.
     Dacă prima rulare/încărcare rulează corect, atunci avem primul pas.
     Mai întâi salvăm acel executabil de rulare/instalare primară.
     
     Dacă la rulările ulterioare apar probleme, atunci putem şterge de fiecare dată folderele create în portabil şi pornim de la executabilul de rulare/instalare.
     Indiferent cum ar fi este nevoie de ajutorul celor care se pricep la softuri,dar până atunci am putea încerca varianta propusă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



AC Win 7&8


AC Win XP



Sterge-ti toate versiunile portabile.
Dezinstalati AC-ul, daca e cazul. Daca puteti sterge si dosarul din Roaming/AppData, ar fi perfect.
Dati un restart.
Apoi descarcati versiunea de AC de sus, in functie de sistemul vostru de operare (Nu descarcati XP pentru Windows 7).

Versiunea vine sub forma unui executabil, la pornire isi va crea dosarele necesare.
Rulati noua versiune, vorbim dupa asta.
Nu deschideti niciun document, >>>>>>>> doar rulati OCR+ in gol, fara a modifica nimic, apoi rulati optiunea de modificari speciale de text. <<<<<<<<<<< fisierele sunt extrase pe masura ce sunt folosite. Tot de asta ruleaza mai greu la prima folosire.
Daca sunt probleme cu dictionarele, le veti primi.

P.S.
Legat de antivirus, nu am ce sa va fac
Seven, ai mesaj.
Apropo, pentru Windows 7 foloseste varianta de Windows 7.
Eroare cu dictionar de cifre romane lipsa se poate remedia reincarcand dictionarele uzuale. Dar nu vreau asta. Vreau sa aud ca v-a mers direct, fara modificari suplimentare.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
tuf
Vizitator



Vedeti si postarea de mai sus.



Dupa cum banuiam, eroare de mai sus apare doar cand folositi versiunea XP pe Windows 7, sau invers.
Daca pe Windows 7 32 biti, problema persista, probabil ca o sa fac o versiune pentru 32 de biti.
Versiunea de XP e verificata pe XP SP3, iar cea de Windows 7 si 8 e verificata pe Windows 7 si 8.1, ambele pe 64 biti.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
tuf
Vizitator



Vedeti cele 2 postari de sus.

Am verificat executabilul de Windows 7 si 8 64 biti, pe Windows 7 32 biti. Functioneaza ireprosabil.

Tot pe Windows 7 32 biti, daca rulez executabilul de XP, primesc eroarea de dictionar cifre romane.
Asa ca nu amestecati versiunile intre ele.

Si, ca idee generala, atat dosarul cat si executabilul poate fi redenumit dupa pofta inimii.
Iar daca doriti sa reveniti la setarile de "fabrica" ar trebui sa fie suficient sa stergeti toate fisierele in afara de executabil. Apoi, la pornirea executabilului, fisierele vor fi refacute cu setarile implicite.

Totodata, tin sa va anunt, ca in afara de 2 locatii numite VOS din registrii, si de cateva aparitii in Prefetch, AC-ul portabil nu genereaza alte fisiere decat cele din dosarul in care ruleaza.

Si cam atat. Pot sa ma bat singur pe umar pentru treaba buna facuta 

O sa mai experimentez cu cateva setari, dar nu prea cred ca mai are importanta deja. E functional.

Sper sa nu spuneti altceva. Seven, nu uita de mesaj.

P.S.
Apropo de chestia cu antivirusul, am intampinat si eu o problema asemanatoare.
In browser, dupa ce se descarca arhiva de pe zippyshare, imi scrie "Blocked: may contain virus or spyware" dar nu cred ca e antivirusul.
Chiar daca il dezactivez, problema ramane deoarece Firefoxul este de vina.
Descarcati cu alt browser.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
tuf
Vizitator



Inainte de a descarca, vedeti ultimele 3 postari de sus. Problema de descarcare nu era de la antivirus, nici de la browser. Se pare ca era de la zippyshare. Am schimbat site-ul.

Tot ce era de de zis, s-a zis sus. Asta e versiunea finala de program.

AC XP

AC Win7&8

P.S.
Se descarca OK.
La mine totul functioneaza ireprosabil. Astept raspunsurile voastre.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Bravo frate! Sincere felicitări!
      Dacă la tine funcţionează perfect, e musai să lucreze şi la mine.
      Am să mai dezinstalez încă o dată AC pe care l-am reinstalat deja pentru că a trebuit să mut la coadă câteva înregistrări care mă agasau şi am şters două [mal >> mai şi ele >> de], pentru că deja am înregistrări grup cuvinte pentru cele două.

      Cred că astăzi nu mai am timp de teste, dar le voi relua mâine.
      După testările de mâine revin la Ac instalat pentru că tot dezinstalând şi instalând risc să-mi pierd dicţionare cum mi s-a întâmplat acum un an... ori or fi fiind deja 2?

      Pun şi eu o întrebare de prost bătrân.
      Ar fi vreo şansă ca un astfel de portabil să lucreze şi pe Linux?
      Ştiu că există câţiva useri care şi-ar dori asta.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Da, ar trebui sa lucreze si pe Linux.
Dar e nevoie de emulatorul de Windows, Wine.
Hai ca imi arunc un ochi si in chestiunea asta, dar sa finalizam partea de Windows.

P.S.
Daca vii si imi zici ca nu iti merge, ai cel mai teribil ghinion pe care care l-am vazut la vreo cineva.

P.P.S.
Daca faci modificari de dictionare, sa mi le dai ca sa refac executabilul.
Cu ocazia asta sa vad si treaba cu editarea executabilului daca merge.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
tuf
Vizitator



Pe linux e prea complicat pentru mine. Nu inteleg deloc documentatia Wine.

Astept si verdictul tau de maine.
La mine totul pare ok la versiunile de Windows.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

tuf a scris:

     [...] P.S.
     Daca vii si imi zici ca nu iti merge, ai cel mai teribil ghinion pe care care l-am vazut la vreo cineva.  [...]


     Nu, nu mă consider absolut deloc ghinionist.
     Pentru că doar @rickerk părea să facă teste, m-am grăbit să dau o mână de ajutor şi n-am fost foarte atent la executabilul pe care trebuia să-l folosesc, aşa că am folosit în mod eronat pe cel pentru Win XP.
     Nu-l cunosc pe colegul @rickerk şi nu ştiu câtă experieneţă are în folosirea AC. M-am gândit că având mai multă experienţă pot să fac mai multe teste, aşa că ai văzut că nu am mai aşteptat comentariile tale şi am trecut la treabă şi notam continuu ceea ce constatam.

     Aşa cum ştii sunt principalul utilizator care încearcă să păstreze în în siguranţă toate modificările AC, aşa că ştergerea totală din computer a AC OCR Plus instalat, pentru mine nu-i un lucru foarte comod, pentru că risc să pierd informaţii atunci când instalez şi dezinstalez un program pe care sunt cumva obligat să-l ţin la zi.
     De aceea pentru mine e mult mai bine să nu fac astfel de teste, dar m-am gândit să dau o mână de ajutor.

     Referitor la testele de astăzi: îmi cer scuze, dar sunt cumva în imposibilitatea de a le face pentru că momentan mă ocup de modificarea unor înlocuiri.
     În urma testelor de ieri am constatat că sunt înregistrări cu confirmare care au multe refuzuri, ceea ce pot deranja/agasa/obosi pe utilizator, cum ar fi "fata >> faţa, fată >> faţă".
     În acest moment încerc să elimin câteva dintre aceste înlocuiri cu confirmare şi să adaug în locul lor nişte înlocuiri automate.
     De exemplu: "în fata >> în faţa" poate fi corect în ambele variante, fapt pentru care apar şi situaţii de confirmare, dar şi multe refuzuri; dacă găsesc grupuri de cuvinte de genul "în fata casei/ferestrei/oglinzii/sobei... >> în faţa casei/ferestrei/oglinzii/sobei..." înlocuirile se pot face automat şi nu-l mai obosesc pe utilizator.
     După ce definitivez ceea ce am început, îmi voi salva toate dicţionarele, voi dezinstala AC şi am să testez Portabilul.

     Oricum, mi s-ar părea foarte corect ca beneficiarii direcţi ai acestui program portabil să-şi expună ei concluziile.
     Mă refer în mod direct la userii care nu au posibilitatea să-şi instaleze un AC OCR Plus sub Win, dar ar putea rula un portabil.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
rickerk
Membru Gold

Inregistrat: acum 19 ani
@ tuf

Asa cum tiam scris si in PM la mine nu functioneaza ( poate sint eu mai ghinionist ).
e adevarat ca nu am experienta la folosirea AC dar eu cred ca nu e greu si nici nu am facut nimic gresit la instalare
( dupa descrierea + video a lui @tuf ).
Am incercat de mai multe ori insa fara nici un rezultat.

P.S. : de fiecare data cind am vrut sa sterg fisierul unde se afla AC ,Win imi da mentiunea ca acest fisier nu poate fi sters deoarece acesta sau alte fisiere din acest fisier sint deschise in alt program. Dupa cca 10 minute am putut sterge fisierul.
Sorry, exprimarea mei in termeni tehnici nu e pre corecta. Nu e limba mea materna.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     @rickerk, tu vrei neapărat varianta portabilă sau poţi să faci instalarea obişnuită a programului sub Windows?
     Dacă merge şi varianta instalată atunci te pot contacta şi găsim în mod sigur modul de rezolvare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
rickerk
Membru Gold

Inregistrat: acum 19 ani
@ seven

Nu trebuie neaparat ca AC sa fie portabil. Am crezut ca varianta instalabila nu va mai fi actualizata daca tu si @ tuf va ocupati de AC portabil.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am înţeles.
     Există utilizatori care au computere [laptopuri] de serviciu pe care nu pot instala softuri suplimentare, ci doar cele necesare serviciului, chiar dacă ei le au în folosinţă şi merg [pot merge] cu ele acasă.
     Pentru ca şi astfel de persoane să poată folosi AC, @tuf a realizat varianta portabilă.

     Varianta instalată este în mod sigur mai rapidă, aşa că cine are computer personal, este de preferat să folosească varianta instalată sub Windows care este verificată şi paraverificată în ultimii 4 ani.
     În sens intenţionăm să nu ne mai ocupăm de el?
     Programul propriu-zis este finalizat din 2012. Varianta finală a executabilului AC OCR Plus a fost realizată de Cosmin Ciupercă în noiembrie 2012. Practic programul nu s-a mai modificat.
     În timpul funcţionării programului se rulează şi nişte dicţionare care pot fi modificate.
     Dicţionarele se bazează pe principiu "Find&Replace" din Word, doar că este o funcţie mult mai complexă decât cea din Word, în sensul că se pot pune tot felul de condiţii de căutare, astfel încât căutarea să se facă doar la început de cuvânt ori la sfârşit şi multe altele şi... cel mai important - se pot face un număr infinit de înregistrări.
     La acest moment AC OCR Plus rulează 72 de [39+33] dicţionare care au în total peste 33.000 de înlocuiri.
     Încerc să ajung la o variantă finală a dicţionarelor, astfel încât userii să nu mai fie nevoiţi să tot reactualizeze dicţionarele.
     În principiu, la ora asta dicţionarele sunt suficient de puternice şi stabile.
     Aşa s-ar traduce afirmaţia că nu voi mai lucra la ele.

     În realitate, mici îmbunătăţiri voi continua să fac. Atunci când corectez şi constat că apar erori pe care AC nu le-a rezolvat, am obiceiul să verific şi dacă este nevoie mai adaug în dicţionare câte o înregistrare sau un grup de înregistrări. Dacă va exista interes nu-i nicio problemă: pot să urc variantele actualizate şi pe forum.
     
     Acestea fiind zise, putem discuta acum despre o instalare nouă a AC OCR Plus, şi putem clarifica orice problemă neplăcută care poate apărea pe timpul instalării şi funcţionării.
     Chiar mă gândesc, dacă eşti de acord, ca toată discuţia noastră s-o purtăm pe un topic nou pentru a folosi şi altor useri care vor să-ţi instaleze AutoCorect.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator




rickerk a scris:

@ tuf

Asa cum tiam scris si in PM la mine nu functioneaza ( poate sint eu mai ghinionist ).
e adevarat ca nu am experienta la folosirea AC dar eu cred ca nu e greu si nici nu am facut nimic gresit la instalare
( dupa descrierea + video a lui @tuf ).
Am incercat de mai multe ori insa fara nici un rezultat.

P.S. : de fiecare data cind am vrut sa sterg fisierul unde se afla AC ,Win imi da mentiunea ca acest fisier nu poate fi sters deoarece acesta sau alte fisiere din acest fisier sint deschise in alt program. Dupa cca 10 minute am putut sterge fisierul.
Sorry, exprimarea mei in termeni tehnici nu e pre corecta. Nu e limba mea materna.


1. Eroarea de stergere este ceva normal. Dupa utilizarea AC-ului portabil trebuie sa astepti vreo cateva minute pentru a-l sterge. Sunt anumite fisiere care raman accesate de Explorer si de un alt serviciu din Windows.

2. Sterge toate variantele de AC portabil. Descarca doar pe cea potrivita din linkurile de de mai sus.

3. Procedeaza ca in clip.

4. Ce inseamna ca nu iti merge? Ce sistem de operare ai si ce versiune de program folosesti?

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
tuf
Vizitator



Dictionarele OCR si uzuale cu diacritice cu virgula


P.S.
Am editat si varianta portabila. Am adaugat dictionarele de sus.
Nu e pe RI deocamdata.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Pagini:  1 2 3 4  

Mergi la