Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
loca23
Femeie
24 ani
Cluj
cauta Barbat
23 - 44 ani
Forum Romania Inedit / Totul despre cărți - About e-books / [AC] Dictionare Inlocuire Multipla Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini:  1 2
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
La sugestia lui Seven am facut acest topic separat pentru a se discuta despre Inlocuirea Multipla.
Aici vom continua discutia din topicul general "pus sus".


Seven a scris:

***
      Îmi cer scuze! nu am mai intrat pe forum şi nu am văzut ultima postare.

      Am instalat ultima versiune a executabilului, am redenumit dicţionarele şi am făcut o testare, de fapt mai multe testări cu un fişier şi totul pare că funcţionează perfect. Mă refeream în special la dicţionare... în sensul că rulează toate dicţionarele.
      Am testat şi funcţia de marcare şi demarcare; Chiar este utilă marcarea asta, cel puţin în această perioadă de realizare a dicţionarelor.

      Dicţionarele pentru Clasic...
      Mai întâi voi arunca eu un ochi peste dicţionare ca să văd care dintre ele au nevoie de modificări... şi pe urmă mai discutăm.

      În acest moment mă ocup de dicţionare care modifică secvenţe finale de cuvânt care conţin cratimă. Ceea ce mă cam sperie este numărul mare de înregistrări ce trebuiesc făcute pentru secvenţele finale. Nu mă refer la faptul că ar fi foarte muncă la editarea lor, ci că e posibil ca rularea lor să necesite mult timp.

     Concret, am încercat să rezolv doar modificarea secvenţelor < â-> în < ă-> şi <-â > în <-ă >
     Complicată este prima modificare. Pentru a micşora numărul erorilor, nu am pus o simplă modificare ca mai sus, ci am pus toate variantele de după cratimă, adică:
        ă-i, ă-l, ă-le, ă-mă, ă-mi, ă-n, ă-ne, ă-o, ă-te, ă-ţi

     Ca să fie şi mai multă informaţie în "Caută/Înlocuieşte cu" am luat în calcul şi litera din faţa lui ă, astfel că doar pentru secvenţa bâ- / bă- au rezultat:
        bâ-i / bă-i, bâ-l / bă-l, bâ-le / bă-le, bâ-mă / bă-mă, bâ-mi / bă-mi, bâ-n / bă-n, bâ-ne / bă-ne, bâ-te / bă-te, bâ-ţi / bă-ţi.

      Problema nu s-a terminat aici, deoarece ca să pot să arăt că e vorba de o secvenţă finală, a trebuit ca pentru fiecare dintre aceste înlocuiri să pun la sfârşit spaţiu, virgulă, punct şi virgulă, semnul întrebării sau semnul exclamării. Acum îmi dau seama că nu am pus şi varianta cu punct şi, probabil trebuie luată în calcul.
      Pentru fiecare consoană au rezultat 45 sau 50 de înregistrări [câteva consoane din faţa lui ă nu aveau şi forma ă-o], astfel că tot dicţionarul a ajuns la 812 înregistrări, deşi nu face prea multe înlocuiri. Este adevărat, 3-4 consoane au doar înregistrări de forma ă-l, aşa că au avut doar 5 înregistrări.

      Un lucru e cert, am prins în dicţionar toate combinaţiile din limba română în care apare grupul ă-
      Am crezut că e foarte bine să înregistrez toate combinaţiile... dar după ce am văzut numărul mare de înregistrări, mă gândesc dacă nu era mai corect să pun doar 10 înregistrări de forma:
        â-i / ă-i, â-l / ă-l, â-le / ă-le, â-mă / ă-mă, â-mi / ă-mi, â-n / ă-n, â-ne / ă-ne, â-te / ă-te, â-ţi / ă-ţi.

      Iniţial, m-am gândit că timpul de rulare este determinat de numărul de modificări efectuate şi nu de numărul de căutări cu rezultate zero, dar... acum nu ştiu dacă nu cumva sunt în eroare.

      Deci, cum ar fi mai bine de procedat? Punând înregistrări cât mai clare, care duc direct la o secvenţă bine definită, dar care necesită multe înregistrări, respectiv căutări? sau punând înregistrări mai puţine, chiar dacă ele sunt mai puţin definite?

      Întreb acest lucru, pentru că mai sunt încă multe secvenţe finale de rezolvat. În perioada următoare încerc să mă ocup de modificarea secvenţelor < ţl-> în < ţi-> şi <-ţl > în <-ţi >, care vor avea aproximativ acelaşi număr de înregistrări.

      ***
      Mă mai gândeam la opţiunea cu "marginile" despre care am discutat zilele trecute...
      Ar putea să ajute opţiunea respectivă la reducerea înregistrărilor, astfel încât în loc de a face 6 înregistrări pentru aceeaşi secvenţă finală, una urmată de spaţiu, alta urmată de virgulă, respectiv punct şi virgulă, punct, semnul întrebării, semnul exclamării?
     Dacă răspunsul este da, atunci aş putea ca deocamdată să identific secvenţele, dar să nu fac şi dicţionarele, urmând ca ele să fie făcute după implementarea opţiuniii respective, indiferent când se va face acest lucru.



ciuperca_cosmin a scris:

Cautarea este mult mai rapida decat inlocuirea in text.
Deci pentru a se micsora timpul de rulare pe ansamblu, trebuie redus numarul de inlocuiri la minim - asta e solutia.
De exemplu asta a fost principalul motiv pentru care functia care am facut-o acu cateva luni in locul uneia cu dictionar a fost mult mai rapida.

As fi preferat sa pun acea optiune la IM dupa ce terminam la punctuatie. Dar, daca e asa urgent, am sa discut totusi cu Daniel despre ea.



ciuperca_cosmin a scris:

Seven, ai putea te rog sa dai cateva exemple concrete la inlocuirile care vrei sa le faci?
Adica sa arati efectiv ce va cauta si cu ce va inlocui.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Mai întâi vreau să subliniez că dicţionarele care sunt deja integrate în program în cadrul OCR_DIC fac o "curăţare" destul de bună a fişierelor OCR şi programul ar putea funcţiona destul de bine, aşa cum este el la această dată.
     Practic, dicţionarele de tip L1-L3.imd şi S1-S4.imd fac cele mai importante modificări şi ele sunt aproape finalizate.
     Mai sunt câteva, şi ele deja implementate, cărora le-am acordat multă atenţie, astfel încât ele să ajute cât mai mult şi să producă efecte secundare cât mai puţine.
     În principiu, eu consider că principalele probleme au fost rezolvate.


     Fiecare dintre noi tinde spre o continuă perfecţionare; oricând, indiferent cât de bine ar arăta un lucru, el poate fi şlefuit, lustruit... etc.
     De exemplu, prin anii 1995, atunci când pe piaţa românească puteam aproviziona cu 460 $ un computer 286 second hand, toţi ne gândeam la cel mai tare computer al tuturor timpurilor, cel mai minunat, cel mai performant, cel-mai-ce, nemaipomenitul, extraordinarul 486. Cei mai mulţi eram convinşi că ceva superior va fi greu de realizat... Timpul a dovedit cu totul şi cu totul altceva.


     Acum mă aflu sau ne aflăm într-o a doua etapă... aceea a perfecţionării.
     Dacă vreţi, mă gândesc la ceva separat de OCR_Plus, un fel de OCR++

     Dicţionarele la care lucrez în acest moment sau la care doar mă gândesc nu sunt nişte dicţionare obligatorii, ele nu trebuie neapărat să ruleze automat în meniul OCR_Plus, dar pot fi de mare ajutor pentru perfecţionişti, pentru cei ce vor să facă o "curăţare" profesionistă.

     Ele se adresează utilizatorilor cu pretenţii ridicate, este practic o altă etapă de prelucrare, o etapă benevolă, dar pe care m-am gândit că o putem pune la dispoziţie.
     Deocamdată nu mă interesează ca aceste dicţionare să rulează automat. Eu le testez folosindu-mă de opţiunea 11. După realizarea lor putem discuta şi despre implementare.

     A nu se confunda aceste dicţionare cu dicţionarele personale, pe care le-am pus la dispoziţie.
     Dicţionare personale cuprind modificări de cuvinte întregi [sau secvenţe lungi, de cel puţin 5-6 litere] specifice unor volume, pe care eu le-am realizat corectând diferite volume. Aceste dicţionare sunt cumva specifice unor anumite cărţi. Ele pot să facă sau să nu facă prea multe modificări în cazul rulării lor, pentru că e vorba de o bază redusă de cuvinte, care pot fi găsite sau nu, în cărţile pe care le corectează alţi useri.


     Dicţionarele de secvenţe sunt nişte dicţionare cu un anumit specific.
     Ele sunt un fel de dicţionare pentru avansaţi, dar pot fi rulate pentru curăţarea superiară a oricărui volum.

     Despre ce e vorba?
     Există o serie de litere care pot apărea frecvent unele în locul altora, ca de exemplu:
       - ă - â,  c - e,  l - i,  r+n - m,  c+l - d,  î - i....

     Luăm exemplu apariţia lui "c" în loc de "e".
     Am luat secvenţele de cuvinte de câte 3 litere, cu litera "c" la mijloc, precum:
        bcb, bcc, bcd, bce, bcf, bcg, bch, bci, bcj, bck, bcl, bcm, bcn, bco, bcp, bcr, bcs...  zcz.
     Am verificat pentru fiecare astfel de secvenţă în parte dacă ea, secvenţa se regăseşte în cuvintele aflate în DEX şi celelalte dicţionare care însoţesc AutoCorect.
     Dacă secvenţa bcb a dat rezultate zero, deci nu există niciun cuvânt care să cuprindă asemenea secvenţă atunci am adăugat-o în dicţionarul de secvenţe, înlocuind grupul bcb în beb. Aşa am procedat cu toate grupurile de 3 litere posibile de la bcb până la zcz.
     În acelaşi mod am procedat cu litera l şi i, înlocuind blb, blc, bld... zlz, cu bib, bic, bid ... ziz...
     
     Buun. Multe probleme pot fi corectate în partea finală a cuvintelor, deci terminaţii...
     În această zonă s-a aflat corecţia <â->  în <ă->, exemplu:
     "a repara", poate avea formele: repară-i, repară-l, repară-le, repară-mă, repară-mi, repară-n, repară-ne, repară-te, repară-ţi, în care în loc de ă-, Abbyy a pus â-.
     Se poate pune foarte uşor o înlocuire de genul "caută: â-" şi "înlocuieşte cu: ă-", dar această înlocuire poate produce efecte secundare şi să facă şi înlocuiri nedorite, deorece litera â ar putea fi redată de Abbyy şi în locul lui a sau poate veni dintr-o altă eroare de convertire în care la origine ar fi putut fi litera i....
     Dacă în locul unei înlocuiri foarte simple, punem o secvenţă mai lungă, precum "râ-i, râ-l, râ-le..." se înlocuieşte cu "ră-i, ră-l, ră-le...", atunci înlocuirile accidentale nedorite se pot reduce foarte mult.

     În afară de secvenţe, tot în dicţionare pentru curăţare se încadrează şi dicţionarele care cuprind grupuri de litere.
     Există cuvântul "stingă" de la a stinge, dar şi mai frecvent este folosit cuvântul "stângă", doar că Abbyy recunoaşte ambele cuvinte în forma "stingă".
     Se poate face corecţia prin înlocuire cu confirmare, defilând prin tot documentul şi dând acceptul de înlocuire sau nu, acolo unde e cazul.
     Dacă se face un dicţionar în care expresii ca: "latura stingă, mâna stingă, urechea stingă, coloana stingă..." se modifică cu "latura stângă, mâna stângă, urechea stângă, coloana stângă..." atunci majoritate situaţiilor se rezolvă şi vom putea renunţa la înlocuirea cu confirmare, ori o vom putea folosi, mergând în principal pe apăsarea butonului "caută următorul", fără a face prea multe modificări.
     
     Deci aceste dicţionare nu sunt unele indispensabile rulării programului AutoCorect, ci ele fac parte din... ceva ce s-ar putea numi ca în SF, dicţionare din "generaţia următoare".

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
La naiba
In curand o sa avem o sectiune dedicata
Chiar, oare nu se poate?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Cred că am clarificat câte ceva.

      Continui acum cu alte câteva detalii.
      Nu sunt probleme cu secvenţele intermediare, deci cele aflate în interiorul cuvintelor.
      Cu cât vor fi mai multe secvenţe înregistrate, cu atât va fi mai bine.
      Timpul de rulare, chiar nu contează; cine vrea să le ruleze, le va rula conştiend fiind că pierde ceva timp, dar face o corectură suplimentară; cine nu va fi interesat, pur şi simplu nu va face rilarea acestor dicţionare.

      Probleme apar la secvenţele finale, deci secvenţele care apar exact la sfârşitul cuvintelor, deoarece aceste cuvinte pot avea după ele spaţiu, ori punct sau virgulă, punct şi virgulă sau puncte de suspensie, semnul întrebării sau semnul exclamării.
      Dacă în dicţionar vom pune numai secvenţa formată din litere, fără a adăuga şi semnul de punctuaţie [aici includ şi spaţiul ca semn de punctuaţie pentru a reduce explicaţiile] de după secvenţă, atunci secvenţa poate fi interpretată şi ca secvenţă interioară unui cuvânt, iar modificările realizate pot produce efecte nedorite, prin modificarea unor cuvinte, când nu e cazul.

      Să luăm ca exemplu o formă de gerunziu: "bolborosind", care ar putea fi redată de Abbyy ca "bolborosincl" deci cu "c+l" final în loc de "d" final.
      Să notăm doar în această explicaţie cu # orice semn de punctuaţie inclusiv spaţiul.
      Dacă vom pune înregistrarea: "Caută" <incl#> şi "Înlocuieşte cu" <ind#>, atunci se vor face modificări numai la sfârşitul cuvintelor, dar dacă vom pune simplu: "Caută" <incl> şi "Înlocuieşte cu" <ind> se vor face înlocuiri şi în interiorul cuvintelor şi vom avea cuvântul "inclus" transformat în mod eronat în "indus"... ceea ce este o mare eroare.
     
      Problema apare ca urmare a faptului că trebuie să punem mai multe înregistrări pentru o singură secvenţă finală, astfel:
          "Caută"  incl^-   şi   "Înlocuieşte cu"  ind^_
          "Caută"  incl...   şi   "Înlocuieşte cu"  ind...
          "Caută"  incl.   şi   "Înlocuieşte cu"  ind.
          "Caută"  incl,   şi   "Înlocuieşte cu"  ind,
          "Caută"  incl;   şi   "Înlocuieşte cu"  ind;
          "Caută"  incl!   şi   "Înlocuieşte cu"  ind!
          "Caută"  incl?   şi   "Înlocuieşte cu"  ind?

      Dacă vom găsi o soluţie, ca în loc de atâtea modificări să punem doar una sau două:
una cu secvenţa finală urmată de spaţiu:
         "Caută"  incl^-   şi   "Înlocuieşte cu"  ind^_
şi alta cu secvenţa finală urmată de orice semn de punctuaţie [doar în această postare # ţine locul unui astfel de cod ce ar putea ţine locul oricărui semn de punctuaţie].
          "Caută"  incl#   şi   "Înlocuieşte cu"  ind#
sau
          "Caută"  incl#   şi   "Înlocuieşte cu"  ind   - fără margini în dreapta
atunci dicţionarele ar putea fi mai puţin stufoase.

      Deocamdată e singura chestie care m-ar interesa: dacă teoretic este posibil a fi implementat un astfel de cod sau o funcţie care să reducă numărul acestor înregistrări. Repet nu mă interesează o implementare a unui astfel de cod foarte repede, ci doar dacă e posibilă, pentru a nu crea dicţionare foarte lungi.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Sa explic cum va arata noua optiune: o bifa cu numele "ignora marginile la inlocuire" + 2 dropdown in care se va alege un numar de caractere 0..9 pentru stanga si dreapta (inceputul/sfarsitul) sirului de caractere.
Codificarea in dictionarul imd va fi ceva de genul "im32" = "ignora marginile la inlocuire 3 caractere la inceput si 2 caractere la sfarsit".
Seven, esti sigur ca asa ceva te ajuta la aceste dictionare?

PS: abia acu am vazut ce-ai scris anterior, Seven, ne-am cam "suprapus"

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     da, ne-am suprapus... aşa că e posibil, să mai fi clarificat ceva în postarea a doua.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Ma gandesc la alta solutie: optiunea "Cuvant intreg" sa poata fi setata pe "jumatate" la Setari complexe: ori numai la stanga (inceput), ori numai la dreapta (sfarsit).
In acest fel ai putea fi sigur ca "incl" e gasita la sfarsitul unui cuvant.

Ce parere ai..?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Uaauuuuu!!!     
     Am citit mesajul ăsta de mai multe ori... şi, tot nu-mi vine a crede ochilor.
     Apăi, asemenea opţiuni "Început cuvânt" şi "Sfârşit cuvânt" ar fi minunate.
     Este adevărat că sunt şi câteva [câteva, mai multe..] înregistrări şi cu început de cuvinte, dar aici a fost mai simplu să pun o secvenţă care are un spaţiu înainte.

     Da, asemenea setări ar rezolva foarte-foarte multe situaţii.

     Nu ştiu dacă o înregistrare de genul:
          "Caută"  incl   şi   "Înlocuieşte cu"  ind - condiţia "Sfârşit de cuvânt"
ar rula mai repede decât toate situaţiile lui incl/ind de mai jos:
          "Caută"  incl^-   şi   "Înlocuieşte cu"  ind^_
          "Caută"  incl...   şi   "Înlocuieşte cu"  ind...
          "Caută"  incl.   şi   "Înlocuieşte cu"  ind.
          "Caută"  incl,   şi   "Înlocuieşte cu"  ind,
          "Caută"  incl;   şi   "Înlocuieşte cu"  ind;
          "Caută"  incl!   şi   "Înlocuieşte cu"  ind!
          "Caută"  incl?   şi   "Înlocuieşte cu"  ind?
dar ceea ce ştiu sigur este faptul că dicţionarele setate astfel, ar fi mult mai uşor de editat.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Va rula mai rapid, dar doar un pic mai rapid. Cum am spus mare parte din timp e luat de inlocuirea propriuzisa si in acest caz va inlocui la fel.
Dar tot e bine ca te ajuta sa simplifici dictionarele .

Va fi un fel de dropdown (combobox se numeste in limbaj de programare) cu 3 setari: tot (setata implicit), inceput, sfarsit. Acesta se va activa doar daca in setarile obisnuite "Cuvant intreg" e bifat.
In dictionarul imd vor fi codate ca "ic" respectiv "sc".

O vom implementa zilele astea...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Sărut mâna! E perfect aşa.
      Implementarea poate fi făcută oricând, chiar şi mai târziu.
      Pur şi simplu dicţionarele se pot edita şi acum, cu menţiunea că în numele lor voi pune [End] sau [Sf_cuvânt] şi voi reveni cu setările de rigoare, atunci când setarea va fi implementată.

      Cred că în legătură cu "Înlocuiri multiple", cel puţin deocamdată nu mai trebuie alte îmbunătăţiri, aşa că putem reveni la discuţiile pentru "Setări punctuaţie", care e problema principală.

      Urmează să fac o primă verificare a dicţionarelor pentru versiunea Clasic.
      Deoarece există câteva înregistrări care se vor putea seta ca "ic" sau "sc", aş prefera să definitivez dicţionarele pentru Clasic un pic mai târziu...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Am şi verificat şi convertit o parte din dicţionare pentru folosirea lor în AutoCorect Clasic OCR_Plus. Mai exact am definitivat 13 dicţionare dintre cele 20, câte rulează acum în Meniul OCR_Plus.

     Singurele dicţionare dintre cele ce rulează automat pe care nu le-am convertit sunt L1-L3.imd şi S1-S4.imd.
     Aici trebuie analizată fiecare înregistrare în parte... lucrurile sunt cumva mai delicate şi o simplă converire a lui "â" în "î", produce efecte nedorite, pentru că o parte dintre înregistrări pleacă de la confuzia a-â-ă şi nu de la i-î...

     Voi reveni zilele următoare şi cu aceste dicţionare, dar voi fi nevoit să şterg o parte din înregistrări, care la o simplă convertire din "â" în "î" ar putea avea efecte neplăcute.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Mulțumesc Cosmin pentru implementarea noilor opțiuni la "Înlocuiri multiple"!

      Noile opțiuni de cuvânt întreg pe părți sunt mai mult decât binevenite.
      Am făcut deja ceva editări și sunt foarte mulțumit.

      Fiindcă aceste opțiuni au fost deja implementate, cred că ar fi bine ca în perioada următoare să mă ocup un pic de actualizarea tuturor dicționarelor, atât cele din Meniul OCR_Plus cât şi cele suplimentare... pentru ca să nu uit ceva... şi toate să fie aduse la zi, conform cu ultimele opţiuni şi facilităţi.
      ... şi după aceea să ne întoarcem la Punctuaţie...  Mă rog, poate era mai bine să spun că după aceea eu mă voi întoarce la Punctuaţie...

      Dacă, totuşi în perioada asta lucraţi la punctuaţie, atunci pot să lucrez cumva în paralel, pentru că am deja formată o imagine asupra unor setări noi la punctuaţie...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Cosmin,
     Văd că nu esti on line...
     M-am apucat să fac modificările cu setarea "Cuvânt întreg - la început" la dicţionarul DMidp.imd, cel care are 2007 înregistrări. Tare aş avea nevoie de un ajutor.

     Dacă aş avea un exe temporar în care să fie setată default varianta "la început" şi nu cea "la ambele capete", aş putea face modificările un pic mai repede, ca să nu mai deschid de fiecare dată şi această fereastră "la ambele capete/la început/la sfârşit"..


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
De obicei e setat implicit pe "ambele capete" deoarece asa e utilizata implicit "Cuvant intreg".
Pentru tine am facut un astfel de exe.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Mulţumesc frumos!
     Da, este normal ca setarea default să fie pe "Cuvânt întreg - la ambele capete", doar că acum aveam nevoie de o scutătură.
     Am probat deja acest temp exe şi modificările se fac mult mai uşor...
     Încă o dată multe mulţumiri!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      1. Am rezolvat toate dicţionarele ce necesitau setări "Cuvânt întreg - la sfârşit", aşa că adresa cu executabilul de mai sus ar fi bine să fie ştearsă, pentru a nu fi luată de cineva drept un executabil obişnuit.

      2. Dicţionarele L1-L3 şi S1-S4 - varianta Clasic
      Se pare că nu sunt multe probleme la adaptarea pentru Clasic, dar vor trebui eliminate câteva înregistrări.
     
      2. Dicţionarele L1-L3 şi S1-S4 - varianta Cpntemporan
      Am modificat complet structura la L1-L3, dar mai am de lucru.
      Motivul nu este neapărat micşorarea timpului de rulare, ci mărirea procentului de corectitudine al înlocuirilor.
      Pentru a mări procentul de corectitudine al înlocuirilor, a micşora numărul de erori nedorite, dar şi pentru micşora numărul de căutări, am încercat să elimin setarea "Potrivire perfectă" şi am încercat să merg pe cât posibil pe "Cuvânt întreg", astfel că am pus în L1 numai cuvinte întregi, în L2 sfârşit de cuvinte întregi şi în L3 început de cuvinte întregi.

      L3, care are un număr mai mic de înregistrări, va fi completat la final cu circa 4 căutări cu confirmare, adică: dacă după ce se rulează cele 3 dicţionare va mai rămâne vreo situaţie în care cifrele "1" sau "0" nu au fost modificate în litera "L mic" sau "O/o" se va mai face o căutare, dar cu confirmare, pentru a nu modifica eventualele situaţii corecte în care trebuie să apară 1 sau 0.
      Cele 4 modificări cu confirmare sunt: [ -1  -0  1-   0- ]
      E posibil să adaug şi variantele [ —1  —0  1—   0— ], deci să fie 8 modificări cu confirmare.

      Lucrez încă la aceste dicţionare, dar aş avea nevoie de un pic de ajutor.
      Îmi este foarte greu ca să aflu dacă în limba română există anumite secvenţe cum ar fi să zicem terminaţia "...du-i-se"
      Deocamdată, am un utilitar realizat de Cosmin cu care scanez cuvintele din dicţionarele anexate la AutoCorect...

      Aş vrea să fac căutări şi în alte dicţionare, în afara celor ataşate la AutoCorect.
      Cred că ar fi bine să pot face astfel de căutări şi în dicţionarele on line, dar nu ştiu să caut decât cuvintele de bază sau cuvintele rădăcină... sau cum se mai cheamă ele.
      Nu ştiu dacă se pot căuta şi forme derivate de la cuvintele de bază...

      Ştie cineva cum aş putea să fac astfel de căutări?
      Stimă şi respect!
      Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

        Erori ce trebuie corectate în dicţionarele imd


        1. Pentru varianta AutoCorect Clasic.
        Dicţionarul CL_S3.imd, înregistrarea 56 e valabilă doar în forma de la Contemporan.
        Trebuie ştearsă înregistrarea sîn --> sân [Cuvânt întreg], ori modificată în sin --> sîn [Ci].

        2. Dicţionare Uzuale/Personale
        În dicţionarul Uz_N.imd sau dicţionarul Uz_NO.imd, înregistrare nr.4 "neînţeles" --> "neânţeles" este eronată şi trebuie ştearsă. Posibil ca la înregistrare să fi avut intenţia ca înregistrarea să aibă forma "neânţeles" --> "neînţeles" şi am înregistrat-o greşit. Oricare ar fi motivul înregistrării, ea trebuie să fie ştearsă.

        Aştept şi alte semnale despre posibile erori în dicţionare pe acest topic, pentru a fi aduse la cunoştinţa tuturor spre rezolvare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
       Cosmin,
       Presupunem că avem nişte înlocuiri de grupuri de cuvinte, de genul:
       "umărul său sting, piciorul său sting, ochiul său sting..."
se modifică în
       "umărul său stâng, piciorul său stâng, ochiul său stâng..."

       Pentru a reduce numărul de înregistrări aş putea să fac o înregistrare sub forma:
       Caută:   "ul său sting"
       Înlocuieşte cu:  "ul său stâng"
       Condiţia: "Cuvânt întreg - la sfârşit"

       Întrebare: Este corectă o astfel de înregistrare?

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Din punct de vedere al sintaxei e corecta.
Pe de alta parte s-ar putea sa existe situatii (destul de rare ce-i drept) in care "sting" nu trebuie modificat. Pentru a clarifica ar trebui facute ceva teste...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Mulţumesc! Doar din punct de vedere al sintaxei mă interesa dacă e corectă o astfel de abordare.
      Într-adevăr, sunt necesare teste... e posibil ca unele modificări să nu trebuiască făcute. Expresia "ul său sting" am folosit-o doar ca exemplu.
      Pe principiul ăsta, înţeleg că se poate folosi similar şi condiţia "Cuvânt întreg - la început" pentru expresii de genul "atât de frumo", pentru a nu trebui să scriu: "atât de frumos, atât de frumoasă, atât de frumoşi..."


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Da.

Altceva: de ceva vreme ma gandesc la o posibilitate de a imbunatati viteza inlocuirilor. Unul din factorii principali care o influenteaza - in orice editor care suporta text cu formatari - e marimea textului.
Dar ce-i interesant e ca viteza nu depinde liniar de marime. Mai exact pare sa depinda la "patrat". De exemplu daca maresti textul de 2 ori viteza de inlocuire scade cam de 4 ori.
Cam pe asta se bazeaza ideea mea: sa impart aceste texte mari in cateva bucati in zone separate de editare (invizibile pentru utilizator), fac inlocuirile si apoi recombin.
Evident, impartirea pe bucati si recombinarea iau si ele timp dar la texte mari sau foarte mari in care se fac multe inlocuiri s-ar obtine pe ansamblu un spor apreciabil de viteza.
Nu va bucurati inca deoarece mai sunt probleme de rezolvat:
1. Trebuie sa fiu sigur ca textele vor fi impartite la locatii care nu taie textul nepotrivit si ca se recombina fara sa piarda ceva;
Intrebarea e unde sa taie; initial m-a gandit sa taie la inceputul unui paragraf. Pentru IM pare bine dar ma gandeam sa se utilizeze si la rularea automata din OCR Plus (impartita o data inainte de a incepe respectiv recombinate dupa ce termina) dar in acest caz s-ar putea sa faca probleme la "Repararea randurilor rupte".
2. la inregistrarile cu confirmare nu va merge deoarece, cand va vrea sa intrebe utilizatorul, va trebui sa recombine textul in editorul principal ca sa-l afiseze corect - astfel incat utilizatorul sa vada si modificarile care au fost facute intre timp. Ei, daca, pe ansamblu, fiind facuta de putine ori, timpul de recombinare e acceptabil, cand o sa astepti cateva secunde in plus de fiecare data cand te va intreba, nu cred ca va fi asa de placut...
Poate are cineva vreo idee...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Nu m-am gândit la o soluţie...

      Voiam să spun că este foarte importantă constatarea că lungimea textului de corectat măreşte "la pătrat" timpul de rulare...
      Am văzut şi eu nişte diferenţe de timp mari între două cărţi... dar nu m-am gândit ca lungimea textului de corectat are o influienţă aşa mare.

       Deocamdată este important de reţinut acest aspect.
       Până la găsirea unei metode de implementare, avem o soluţie mai simplă la îndemână: noi utilizatorii, să împărţim textul de corectat în două-trei-patru părţi.
       Metoda corecturii pe părţi se foloseşte frecvent, inclusiv pentru corectarea manuală, mai ales dacă este vorba de o carte foarte mare... aşa că nu ar fi o problemă deosebită.

       Noi utilizatorii, putem să facem împărţirea pe părţi ţinând cont de structura cărţii, adică să facem "rupere" chiar la începutul unui capitol... e mai uşor de urmărit şi reasamblat.

       Ar mai fi o problemă... să vedem cam care ar fi mărimea optimă a unei părţi...
       Să fie 200 de pagini de carte obişnuită?... Sau chiar mai puţin.. să zicem 150?

      Cred că nu trebuie coborât la mai puţin de 150 de pagini, pentru că la o carte de 600 de pagini, dacă o împărţim în bucăţi de câte 100 de pagini, pare că ne-am complica prea mult...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Da, 2..4 bucati, 150..200 de pagini pe bucata par optime.

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Si eu procedez la fel. Mai ales cu antologiile de povestiri.
Prefer sa le impart.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Am gasit litera J ca fiind ], la finalul unor cuvinte si asta doar in urma citirii.
Dar banuiesc ca da rulam OCr_Plus i marca cu rosu?

     Am înţeles de la Cosmin că Ortografia AC nu caută astfel de caractere... deci de la Ortografie nicio speranţă.
     Dicţionare care să ia în calcul ] şi j nu există până în acest moment, dar aş putea să prind cuvintele respective în dicţionarul Uz_J, care poate fi rulat la opţiunea 11, iar dacă există cuvinte scurte mai des folosite cum ar fi ]os > jos, pot fi trecute în dicţionarele de cuvinte scurte ce rulează automat.

     Eu te-aş ruga ceva, dar bănuiesc că nu te încântă de nicio culoare să faci aşa ceva. Dacă mi-ai da o eventuală listă cu astfel de cuvinte mi-ar fi de mare folos... Sau, măcar să-mi spui dacă astfel de erori apar mai mult la începutul cuvintelor, ori la sfârşitul lor...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
La sfarsit. Doar asa am intalnit. Nu au fost multe cazuri, 4-5.
Dar ma gandea, in general, ca nu ar trebui sa apara, in mod normal, cifre sau elemente grafice in cadrul cuvintelor intregi si ca ar trebui semnalizata situatia asta.
Nici in Word nu e detectata genul asta de situatie.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Păi... într-un fel e normal să nu sublinieze mesa], masa], eşafoda]... pentru că există cuvinte corecte de forma mesa, masa, eşafoda... iar semnul ] îl consideră ca fiind închidere de paranteză dreaptă.

      La astfel de cuvinte care au şi forme corecte fără j la sfârşit e problematică şi realizarea unui dicţionar, deoarece ar merge doar unul cu confirmare, iar confirmările la dicţionare sunt foarte enervante.

      A fost în discuţie o variantă de înlocuiri multiple care au "margini"... va trebui să aşteptăm ca să se definitiveze Punctuaţia şi celelalte... Dacă se va reuşi implementarea acelei condiţii la Înlocuiri multiple, cred că vom scăpa de multe înregistrări cu confirmare.

       Cealaltă situaţie când litera J este pusă în locul parantezei drepte de închidere, cred că e şi mai dificil de monitorizat.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     AutoCorect OCR_Plus este funcţional şi realizează o precorectare a OCR-urilor cu mult peste ceea ce am fi putut imagina în urmă cu o jumătate de an.
     Dacă programul AutoCorect OCR_Plus, cel puţin pentru perioada imediat următoare, nu pare că ar fi necesar să fie îmbunătăţit, deoarece asigură o multitudine de opţiuni, ei bine, funcţionarea programul se poate perfecţiona în mod continuu, prin îmbunătăţirea dicţionarelor ce sunt rulate automat în cadrul meniului, precum şi a dicţionarelor suplimentare.

     De exemplu, la o serie de cărţi mai vechi, am constatat o mulţime de situaţii în care Abbyy face confuzia între c şi e.
     Multe astfel de situaţii au fost deja corectate în dicţionarele de cuvinte scurte, dar cu toate acestea s-au păstrat o serie de cuvinte care nu au fost corectate.
     Dintr-un motiv pe care nu l-am înţeles foarte exact, dar despre care am o vagă bănuială, cele mai multe erori apar nu la cuvintele lungi, ci la cele scurte. Am numit până acum „cuvinte scurte” ca fiind cele cu un număr de până la 4 litere inclusiv. Aş lărgi înţelesul aceste noţiuni la cuvinte de până la 5 litere inclusiv.

     Deci, am constatat că unele cuvinte, exemplu „bine” şi „care”, apăreau frecvent scrise de Abbyy ca „binc” şi „carc”, deci cu litera „c” finală în loc de „e” finală.

     Am trecut aceste cuvinte în dicţionarele scurte, dar am mărit aria înregistrărilor, căutând şi cuvinte cu formă similară, [nu cred că le-aş putea spune paronime], precum: „bare, care, dare, mare, oare, pare, rare, sare, tare, zare” sau „bine, cine, fine, line, mine, sine, şine, tine, şine, vine”
     Bineînţeles că la verificări, unele dintre aceste cuvinte „au căzut”; nu toate aceste cuvinte pot fi modificate automat; de exemplu „parc” nu poate fi înlocuit cu „pare”, deoarece ambele cuvinte sunt corecte.

     Înregistrarea unor astfel de cuvinte scurte este unul dintre lucrurile care mă preocupă în prezent.
     Doar, că lucrurile nu se pot opri aici. Acest „c” final apare eronat şi la sfârşitul cuvintelor lungi, astfel că trebuie intervenit şi aici, numai că este prea dificil ca să adaug în dicţionare mii de cuvinte, şi atunci procedez la înregistrarea unor corecţii de terminaţii de cuvinte, ceea ce implică multe căutări în prealabil, pentru a evita trecerea unei înregistrări, care ar putea modifica şi ceea ce nu este necesar.
     Bineînţeles că nici aceste terminaţii nu sunt foarte puţine, deoarece trebuie verificată foarte bine existenţa în limba română a ambelor variante [cea de corectat şi cea corectă] pentru fiecare terminaţie.

     Personal, cred că voi urca o reactualizare a dicţionarelor, cel mai devreme peste vreo două săptămâni. Urcarea mai des a unor astfel de reactualizări, ar putea produce confuzii unor useri mai puţin atenţi, astfel că iniţiativa de a reactualiza cât mai des a dicţionarelor ar putea avea un efect negativ, ea putând să facă mai mult rău decât bine.

     Mă voi ocupa în continuare de perfecţionarea dicţionarelor care rulează automat.
     Uşor-uşor îmi voi reduce activitatea pe forum, rămânând doar în zona AutoCorect şi încă ceva pe lângă…
     Important este că dicţionarele acestea nu vor fi în stare să corecteze toate erorile, indiferent cât de mult ar putea să fie ele îmbunătăţite.
     Utilizatorii de AutoCorect trebuie să-şi poată crea singuri dicţionare personale atunci când întâlnesc noi erori necorectate.
     De aceea, în acest topic, în timp, vom încerca să prezentăm pe larg tot ce ţine de crearea, editarea, modificarea şi utilizarea dicţionarelor de înlocuire multiplă.

     Subliniez, totuşi un lucru: ca să putem clarifica tot ceea ce este necesar este nevoie de dialog. A posta lucruri despre care nu ştii dacă le citeşte cineva sau dacă folosesc cuiva… este un destul de neplăcut şi a devenit foarte obositor.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Te cred ca e neplacut si obositor, dar nu uita ca sunt si unii ce apreciaza ceea ce faci. Si... mai multe persoane ce folosesc munca ta, dar nu prea dau de stire.

Care e numarul de download-uri la dictionare?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Numărul de downloaduri nu este suficient de sugestiv... deoarece au fost multe versiuni de dicţionare urcate... unele le stergeam si puneam altele în locul lor.

     Când am spus de dialog, mă refeream concret la discuţia despre ceea ce va fi postat aici în legătură cu editarea dicţionarelor de înlocuiri multiple.
     Îmbunătăţirile aduse la AutoCorect au fost multe şi greu de urmărit [eu am o arhivă de peste 70 de variante de executabile AC OCR_Plus]; poate că nici nu era nevoie să fie urmărite toate aceste discuţii şi îmbunătăţiri - important este să fie folosit programul.

     Problema editării dicţionarelor de înlocuire multiplă este cu totil altceva. Editarea dicţionarelor trebuie însuşită de către toţi userii care lucrează cu AutoCorect şi pentru asta este nevoie de dialog.

     Cu dumneata, domnu' utilitasetveritas am o problemă personală.
     Tu eşti mult mai cunoscător în problema liniuţelor şi dialogului francez decât mine. De fapt... la cât m-ai omorât cu liniuţele astea, trebuie că eşti Expertul...
     Ai văzut că am lăsat-o în coadă de peşte cu explicarea setărilor Punctuaţiei la tagul "Sugestii". E vorba de prima şi a treia setare: "Sugerează tipul de liniuţă" şi "Arată posibile cazuri de dialog francez".
     La ambele probleme aveam acum mai multe variante de rezolvare.
     M-ar interesa metoda ta de lucru la acest moment... cum crezi că ar trebui setate cele două setări?... să le lăsăm activate şi la punctuaţie şi la OCR_Plus? sau cum ar fi mai bine?... Eu nu am insistat prea mult pe niciuna dintre cele două probleme aşa că nu prea ştiu ce să recomand.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Stai asa sa ne intelegem, nu de alta dar esti sef de trib pe vreo 5 topicuri de AC )

Tagul Sugestii pe unde vine? "Sugerează tipul de liniuţă" şi "Arată posibile cazuri de dialog francez" ce rezolvari ar putea fi la astea? Ar trebui sa ramana la nivel de sugestii, fie ele si incorecte in cazul liniutelor, dar suficient cat sa te trimita unde trebuie.

Daca te referi la activarea/dezactivarea lor in OCR sau in Punctuatie, eu zic sa le lasi in ambele in locuri, daca nu e bai.
Daca e musai sa se renunte la una din ele, renunta la cea din OCR.
Motiv? In AC mai bagi si texte relativ faine, nu numai ocr-uri.
In rest cele 2 functii isi fac treaba cu varf si indesat, sunt extrem de multumit de ele.
E adevarat ca la unele texte am o multime de avertismente, dar mai bine sa le am la precorectura decat sa le aranjez eu manual in timp ce citesc si totodata sa mai sar peste ele din greseala.

Daca ar fi sa lasi cele 2 setari de mai sus, active doar in OCR, nu prea o sa sara in ochi si de asemenea la prima rulare a Punctuatiei normale pe un text 2.0 sa zicem, textul ala se duce dracului in privinta dialogului francez.
Sunt niste exemple faine in topicul lui Brussolo, texte destul de curatele, dar pe care s-a rulat AC-ul cu punctuatia normala.
Iar avertismentul ala cu liniutele combate foarte eficient problemele de formatare unitara, e cam greu sa mai stii uneori care e Horizontal Bar, EmDash sau Endash, mai ales cand lucrezi pe fonturi noi.

P.S.
Ai situatia asta in dictionarele tale?


intreba întreba

P.P.S.
Apropo eu chiar recomand ca executabilele de RI sa vina setate implicit pe cele 2 optiuni.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Mă refer la activarea acestor sugestii în Puncuaţie, adică aici:


     Întrebarea mea era: să fie activate şi aici la punctuaţie? sau e suficient că ele se pot rezolva din meniul OCR_Plus
     Am înţeles că propunerea ta este ca ambele să fie activate.

     Dicţionare: intreba >> întreba
     Doar cuvinte scurte, până la 4 litere inclusiv [şi câteva de 5 litere] apar în dicţionarele care rulează obligatoriu în meniul OCR_Plus.
     Există o excepţie la dicţionarul CO_DMidp.imd care face majusculare, unde sunt câteva sute de cuvinte care sunt scrise eronat cu I mare în loc de Î mare.
     
     Multe cuvinte lungi se află în dicţionarele numite Dictionare UZUALE sau personale.
     Exemplul tău se află în dicţionarul "Î3 [i - î] 650 înreg.imd" la poziţia 503.
     Problema este că şi acest dicţionar este în lucru... deoarece...
     La data când a fost editat nu exista condiţia "Cuvânt întreg - la început", aşa că este înregistrat cu condiţia "Potrivire perfectă" sub forma: ^_ntreba >> ^_întreba.
     Acum lucrez la el şi-l refac sub condiţia "Cuvânt întreg - la început".
     O să mai dureze un pic... dar cred că peste câtva timp voi putea urca nişte dicţionare refăcute şi suficient de puternice, încât să fie eficiente.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ei lasa ca nu vreau sa le rescrii pentru mine. Doar iti aduceam la cunostinta un exemplu ce ma tot streseaza la un text.

Si da, daca nu e cazul sa se elimine una din locatii, sa ramana ambele setari. Nu incurca cu nimic. Toate cele 3 optiuni ce apar in imagine, de regula, trebuiesc bifate pe textele beletristice.

Prima poate da sugestii incorecte, dar te duce pe zonele cu probleme.
A doua e inutila in cazul beletristicii. Daca o rulezi pe o carte o sa ai poate sute de avertismente ce sunt ok de fapt. De asta am si cerut-o imi facea niste liste de avertisemente de ma plictiseam.

Iar cazurile de dialog francez e cireasa de pe tort. Fie ai intr-adevar un dialog acolo, fie ai o litera mica ce trebuie facuta litera mare.
Am intalnit si exceptii de la regula, situatii ce nu sunt semnalizate, dar asta e partea a doua. Pe un text formatat normal e o solutie fara gres.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Cosmin a urcat o versiune AutoCorect pentru TESTE, versiune ce cuprinde şi opţiunea de înlocuire secvenţe de cuvânt.
      Este vorba despre acest excutabil:
      Această versiune de testare AC are nevoie de dicţionarul SM.celi.imd
      Menţionez că executabilul nu reprezintă cea mai nouă versiune de AutoCorect OCR_Plus, el este realizat doar cu scopul de testera a dicţionarelor de secvenţe.
      Nici dicţionarul nu are o formă finală;  acesta este deocamdată un dicţionar în lucru, iar numele şi conţinutul poate fi modificat.

      Pentru cei interesaţi, am pus şi un document Excel care cuprinde înregistrările din SM.celi, dar separat pe litere.
      În acelaşi doc Excel mai apar şi dicţionare care sunt în lucru şi netrecute în SM.celi.

      Folder de dicţionare temporare pe mediafire:
      Nume:      Dictionare in lucru
      Adresa:   

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Am urcat în folderul binecunoscut, Dictionare AutoCorect, ultimele actualizări la dicţionarele care lucrează automat în AC OCR_Plus Contemporan.

      Au fost adăugate noi înregistrări la mai multe dicţionare, aşa că ar fi bine ca toate dicţionarele să fie înlocuite.
      În aceste arhive sunt cuprinse inclusiv dicţionarele SM_celi.imd şi CO_DArtef.imd
      Menţioneaz că deocamdată nu am făcut îmbunătăţiri la dicţionarele pentru varianta Clasic.

      Am reactualizat şi dicţionarele UZUALE care pot fi rulate în opţiunea "11. Rulare grup de dicţionare de înlocuire multiplă"

      Atenţie: dacă la aceste dicţionare, varianta care a fost până acum pe mediafire aţi făcut adăugiri personale, atunci ele trebuie verificare sau... cel mai simplu, la aceste ultime dicţionare trcate azi, le schimbaţi numele din "Uz_" în "N_" sau "Nou_"... sau altfel, încât să rămână şi ultimele actualizări făcute de mine. dar şi ultimele făcute de dumneavoastră.
       Faptul că o aceeaşi înregistrare se va regăsi în două dicţionare nu va produce erori şi nici nu va mări prea mult timpul de rulare, deoarece timpul este dat în principal de numărul de modificări făcute şi mai puţin de numărul de căutări.

       Cele două arhive actualizate astăzi au următoarele nume:
                [ACTUALIZAT 02.03.2012] OCR_DIC Contemporan.rar
                [ACTUALIZAT 02.03.2012] Dictionare UZUALE.rar

       Adresa: 

       Seven 

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Multam' Seven 

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
"— Asta el făcu Poole." > "— Asta e! făcu Poole."

Cred ca se poate face o regula de inlocuire cu confirmare la situatia de mai sus.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Corect.
      Pentru că nu am întâlnit efecte secundare până acum, am crezut că "e!" >> "el" este o înregistrare corectă; nu m-am gândit că forma "e" [este] a verbului a fi poate ocupa o ultimă poziţie în propoziţie; într-adevăr, este foarte clar că trebuie modificată.

      Pentru a nu-i complica pe useri, urcând o nouă arhivă de dicţionare la două zile după ce s-a făcut ultimul update, e bine ca la acest moment, cei interesaţi să facă următoarea modificare:
        - se şterge din dicţionarul CO_L1.imd [respectiv, CL_L1.imd] înregistrarea nr. 6
        - se face aceeaşi înregistrare în dicţionarul CO_DVar4.imd [respectiv, CL_DVar4.imd], punând condiţiile "Cuvânt întreg"+"Potrivire perfectă" + "Cu confirmare" = Ci Pp Cli - adică exact condiţiile de la celelalte înregistrări.

      Mai există o înregistrare similară pentru litera a: "a!" >> "al"
      Deocamdată o lăsăm aşa, pentru că nu cred că ar putea să se încheoe o propoziţie în "a", dar dacă apare ceva... facem modificarea.

      LE:
      Am mai cugetat... În definitiv, dicţionarele nu pot fi perfecte... ele trebuie să ajute cât mai mult posibil; în cazul ăsta alegem varianta care ne foloseşte mai mult.
      Practic situaţii în care este corectă varianta "e!" ca în exemplul tău sunt foarte foarte rare.
      Dacă modificarea e! >> el rămâne în dicţionar în forma iniţială se vor face foarte multe înlocuiri corecte şi... din când în când câte o eroare ce poate fi corectată manual... ba, poate că nici nu va exista vreo situaţie într-un volum întreg.
      Dacă vom pune condiţia "Cu confirmare", atunci va trebui să dăm multe "Da" în fereastra de confirmare....
      Deci, nu este neapărat necesar să facem modificările propuse mai sus.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Am implementat ignorarea marginilor la inlocuire.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Mulţumesc frumos, Cosmin!
      Sunt convins că a fost multă muncă pentru această implementare.
      Mă apuc să fac testări să văd cum funcţionează.
      Stimă şi respect!
      Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
    Cosmin,
     În sfârşit am reuşit să-mi blochez computerul în AutoCorect

     Am un fişier care s-a blocat undeva în timpul rulării opţiunii 12.2 Dicţionare cu variante. E posibil să fi rulat şi aceste duicţionare... ideea este că nu mai mişca.
     Iată o imagine aici.

     Am deschis un folder mediafire unde am să urc toate fişierele ce ţin de problema asta.
     Adresa folder:
     Deocamdată am urcat un dicţionar CO_DVar4.imd la care te rog să te uiţi dacă nu am greşit cumva modul de editare.
     Acest dicţionar nu ştiu dacă a rulat, deoarece nu sunt cazuri ca cele înregistrate.
     Sintaxa dicţionarului... posibil să nu fie greşită, deoarece dicţionarul rulează dacă se dă comandă independentă.

     Am folosit ultimul executabil de pe forum.
     AC s-a blocat de două ori în acelaşi loc.
     marchez locul în text şi urc şi fişierul text pe care l-a rulat.
     
     LE: urcat textul cu pricina; nume fişier: TEST Stăpânul.rar

     LE2: Am mai verificat. programul se blochează la trecerea de la dicţionarul CO_DVar3.imd la dicţionarul CO_DVar4.imd
     Am urcat toate cele 4 dicţionare în forma în care le-am rulat în seara asta, sub numele de arhivă: CO_DVar1-4.rar
     menţionez pentru useri, că nu este vorba despre adevăratele dicţionare cu acest nume; acestea au fost dicţionare folosite pentru teste.

     LE3: M-am documentat mai mult. Nu este vorba de probleme ale textului de corectat.
     problema este că executabilul nu reuşeşte să deschidă dicţionarul al patrulea.
     Şi da. Sunt probleme la sintaxa celui de-al patrulea dicţionar

     LE4: Sintaxa pare corectă. Dicţionarul rulează corect din "Editare" --> "Înlocuire multiplă", dar se blochează la rulare automată.
     Nici textul nu are probleme. Am făcut proba şi pe alte texte.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Vad ca amandoi suntem "nocturni" - la 4:30 dimineata inca testezi, eu modific codul
Am rezolvat si am pus exe in topicul principal.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Am înţeles şi mulţumesc.

     Iniţial am avut probleme la înregistrările cu condiţia "ignoră margini", în sensul că nu puneam corect "înlocuieşte cu"...
     De aceea nu-mi dădeam seama dacă este greşit dicţionarul... sintaxa lui... ori e problemă la exe.

     Între timp am mai descoperit un cuvânt care apărea cu cifra 1 în locul literei L mic şi nu era corectat automat de AC, după care plecând de la acest "Încă-1" scris şi "Încâ-1", am adăugat în dicţionarul L2.imd secvenţe finale în care apare *ă-1 sau *â-1 în locul lui *ă-l, doar că pentru asta am făcut căutări şi numărări de apariţii pentru fiecare secvenţă în parte: bă-l, că-l, dă-l...
     Am constatat că erorile secundare apar în număr mai mic dacă secvenţa este mai lungă... cumva, să-i zic mai aproape de completă... fără posibilitări de interpretare...
     Lucrul ăsta şi testarea şi retestarea dicţionarelor cu condiţia "ignoră margini" au necesitat destul timp, aşa că...

     Cu noul exe am să lucrez şi să-l testez mai târziu... bineînţeles tot pe seară.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Salutare!
     Nu ştiu dacă ar fi viabilă o opţiune de înlocuiri expresii sau grup cuvinte... problema este că voi înghesui pe undeva câteva înregistrări de acest gen.

     Mă deranjează câteva modificări pe care le-am pus cu confirmare. Este destul de enervant să rulezi un dicţionar care are multe cuvinte ce se înlocuiesc cu confirmare.
     O parte dintre cuvinte nu pot fi înlocuite decât folosind condiţia "cu confirmare", dar mai există unele pentru care am găsit o soluţie cam glumeaţă - adică nu folosind drumul cel mai scurt ci unul mult mai complicat.

     ■ E vorba de  intre >> între
     M-am gândit că e posibil să evit confirmarea pentru ca modificările să se poată face automat, dar un pic mai complicat.
     Iniţial am folosit confirmare pentru intre >> între... şi am constatat că erau o grămadă de "să intre" care nu trebuiau modificate. M-am gândit cum aş putea pune o condiţie pentru ca programul să "sară" peste aceste "să intre"...
     Şi fiindcă soluţia nu venea, m-am gândit că e mai uşor dacă ar fi modificarea inversă, adică de la < între> spre < intre>...

     Am testat circa 15 fişiere, versiuni corectate din Tolstoi, Dumas, Zevaco etc... şi am constatat că intre există în 90% dintre cazuri în forma "să intre", iar celelalalte circa 10% sunt de forma: să nu intre, să [nu] mai intre, să-mi, să-ţi, să-i... intre etc., în total circa 28 de înregistrări.

     Practic soluţia de rezolvare are doi paşi în loc de unul:
     - primul pas: se fac automat înlocuirile:  intre >> între
     - pasul doi: se fac automat înlocuiri, dar de data asta în format "grup de cuvinte", cum ar fi: să [nu] între >> să [nu] intre, să [nu] [mai] între >> să [nu] [mai] intre...

     ■ Dinţii >> dintâi
     Aici am mers pe înlocuiri automate de genul: [cel, cea, cei, cele, celei, celui, celor] dinţii >> [cel, cea, cei, cele, celei, celui, celor] dintâi

     ■ Ar mai fi: sting >> stâng şi stingă >> stângă
     Aici am folosit mult mai multe înregistrări... cam trei pentru câte un organ, adică: ochi stâng, ochiul stâng, ochiului stâng... apoi ceva despre mal, ţărm, flanc.

     ■ A... si am mai pus ceva: nicio singură >> nici o singură; niciunei singure >> nici unei singure; niciun singur >> nici un singur; niciunui singur >> nici unui singur.
     Acum... nu ştiu dacă e bine... eu m-am gândit că da... dar poţi pentru ca să ştii?...

     Deci... am făcut ce-am făcut şi am pus-o şi de nişte expresii...
     Dacă le facem o opţiune separată, poate vom mai găsi şi altceva... dacă nu, atunci le pot înghesui pe undeva pe la dicţionarele cu confirmare, chiar dacă nu mai au ele confirmare.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
M-am gandit si eu la asta si ca teorie pare ok.
Dar cred ca AC-ul suporta deja inlocuiri de genul asta.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Cred ca merge ca optiune separata in meniul OCR Plus...
N-o sa fie usor de implementat dar daca crezi ca te ajuta codul de la diacritice in aceste situatii o sa incerc sa vad ce pot face...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Cred că n-am înţeles... Comentariile voastre sunt la ce am zis eu?...
      ...sau este vorba despre altceva?
      Pentru că nu pricep la ce mi-ar folosi codul de la diacritice...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
A.... eu ziceam ca era mesajul pentru tine 

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Da, erau la ce se discuta aici.
Am mentionat de codul de diacritice deoarece, cel putin in unele situatii, cred ca s-ar descurca destul de bine sa puna î-ul la inceput.
Dar era doar o sugestie, nu e bai daca faci cu dictionare.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Pai dati-i bataie.

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Pai dati-i bataie.

     Ei!... pisici electronice!... faci glume cu noi...
     Dăm bătaie la maxim...

     Dacă vrei, distrează-te un pic pe o fişă de lucru pentru câteva secvenţe finale... asta ca să vezi că n-am pus-o de mămăligă...
     Uite colea'şa fişierul Finale ...ndu-şi - 02.rar
   
     Aştept cu interes o analiză urmată de propuneri pentru dicţionarul de secvenţe finale.

     Apropo, similar cu < intre vs. între > am rezolvat-o şi cu < lingă - lângă >... doar că aici a ieşit un dicţionar naşpa rău... pare luat de pe alte secţiune a forumului.   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
kiko
Moderator

Din: italia
Inregistrat: acum 18 ani

Seven a scris:



     pare luat de pe alte secţiune a forumului.   

Moderez eu acolo cumva? 


_______________________________________
[mp3=http://www.youtube.com/watch?v=5LXKd3nPqqg]

 
PENTRU TOTI POSESORII DE VOLKSWAGEN, AUDI, SKODA SI SEAT
VEZI ISTORIA FILMULUI ROMANESC
STOP TORTURARII ANIMALELOR!! 

                       
  ---->  ROMANIA, TREZESTE-TE!!!  <---- 

GALERIE FOTO PERSONALA

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Nu, nu, nu! Nu e vorba despre muzică...
      E vorba de o secţiune scrisă cu coloarea... un pic mov.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Marc > Mare
Inlocuirea asta ar trebui sa fie cu confirmare. Atunci cand e cu litera mare cel putin.


Mod de rezolvare:
      Înregistrarea nr. 81 din dicţionarul CO_SC4.imd [şi nr.78 din CL_SC4.imd] se modifică astfel:

      în loc de condiţiile "Cuvânt întreg" + "Păstrează capitalizarea"
  se vor pune condiţiile "Cuvânt întreg" + "Potrivire perfectă"


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Adica sa o faca utilizatorul acum si mai incolo va face parte din pachet?

P.S.
Scuze, dar de abia acum am vazut mesajele tale din susul paginii.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Pentru a nu încurca userii cu modificări şi remodificări ale dicţionarelor urcate pe mediafire, făcându-i pe aceştia să nu mai ştie exact ce variantă au downloadat, intenţionez să urc o ultimă variantă de dicţionare undeva în luna iunie.

      Propun ca până la definitivarea acestora şi urcarea lor pe mediafire ori pe pagina Web oficială AutoCorect, modificările constatate pe forum să şi le facă fiecare user în computerul său, pentru a nu urca alte dicţionare pentru fiecare modificare în parte.

      De aceea voi încerca să postez toate modificările importante aduse dicţionarelor pe acest topic, indiferent pe ce topic ar fi prezentate propuneri sau constatări privind funcţionarea defectuoasă a unor dicţionare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
       Am actualizat dicţionarele OCR_DIC în ambele variante [Contemporan şi Clasic]  la data de 04.05.2012
       Adresa este cea cunoscută: Dicţionare şi documentaţie AutoCorect OCR Plus:  Mediafire

       Deoarece am eliminat câteva înregistrări în dicţionarul care elimină artefacte şi în cel care face curăţarea liniilor de dialog, este posibil să mai apară  situaţii în în care liniile de dialog rămân necorectate.
       Cine descoperă astfel de situaţii sau altele, îl rog să le semnaleze pe acest topic.

Modificat de Seven (acum 11 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

jullien_alphonse a scris:

Intrucat Dictionarele Autocorect modifica anumite cuvinte CORECTE
sau NU modifica anumite secvente eronate,

am urmatoarele Sugestii de modificare a DICTIONARELOR,
care cred ca AR FI BINE de adaugat UNDEVA mai la urma corecturilor
pe care le face OCR PLUS:

(SECVENTA necesara a fi inlocuita = secventa corecta)

1. FARA APROBARE user:

învestig= investig
iior=ilor
iie=ile

2. CU APROBARE user:

învestit= investit
învestiţ= investiţ


Modificat de Seven (acum 11 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Mulţumesc pentru atenţionare!
     După cum am mai spus, dicţionarele vor trebui modificate şi îmbunătăţite în continuare, aşa că este binevenită orice propunere de îmbunătăţire.


     Concret, la constatările de mai sus, am următoarele propuneri de rezolvare:

     1. În legătură cu modificările nedorite de tipul:  investe >> înveste;   investi >>     învesti
     Aceste două tipuri de modificări se realizează automat de 8 înregistrări, care se află în două dicţionare.
     Sunt de părere că aceste înregistrări nu se justifică, deoarece produc mai multe efecte nedorite decât efecte dorite, astfel că ele trebuiesc şterse. dacă le vom şterge, atunci nu mai este nevoie de adăugarea înregistrărilor propuse: învestit >> investit  şi învestiţ >> investiţ.
     Ştergerea înregistrărilor se face astfel:

     Dicţionarele: "CO_Midp.imd" [respectiv, "CL_Midp.imd"]:
     Se şterg înregistrările: 1912-1913, 1257-1258 şi

1912       . Investi  >> . Învesti       Ci  Ic  Pp  Pi
1913       . Investe >> . Înveste      Ci  Ic  Pp  Pi

1257       — Investi  >> — Învesti       Ci  Ic  Pp  Pi
1258       — Investe >> — Înveste      Ci  Ic  Pp  Pi

602       Investi  >> Învesti       Ci  Ic  Pp  Pi
603       Investe >> Înveste      Ci  Ic  Pp  Pi

     Atenţie, ştergerea trebuie făcută în ordinea de mai sus, adică începând cu înregistrările 1912-1913 şi nu cu 602-603, pentru a nu schimba numrul de ordine.

     Dicţionarul suplimentar [uzual] "Uz_Î3 [i - î] 682.imd"
     Se şterg înregistrările: 627 şi 628i

627       investi  >> învesti       Ci  Ic  Pc
658       investe >> înveste      Ci  Ic  Pc


     2. În legătură cu înregistrările:  iior >> ilor   şi   iie >> ile
     Jullien, dacă aceste secvenţe sunt secvenţe finale, atunci le am deja în lucru, doar că vor fi mai multe şi mai lungi, ca să evit efecte suplimentare nedorite, cum ar fi situaţie în care iilor=itor.
     Secvenţele vor fi de genul: biior >> bilor, ciior >> cilor, diior >> dilor...
respectiv:   biie >> bile,   ciie >> cile,  diie >> dile...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Ca să nu mai fie nevoie ca fiecare user să facă modificările propuse mai sus, am făcut modificarea celor trei dicţionare şi le-am postat pe mediafire.
     Am realizat un folder special pe care-l voi folosi numai pentru modificări valabile temporar, unde voi urca şi alte dicţionare modificate.
     Nume folder deschis:     Z2 Modificare dictionare
     Adresa folder deschis: 

     Nume fişier care cuprinde cele 3 dicţionare modificate: 2012.05.20 Modif 3 Dic.rar


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
_Cosimo_
Membru Senior

Inregistrat: acum 12 ani
Eu v-aş sugera să introduceţi ca modificare FĂRĂ APROBARE din "vroi" în "voi" şi "Vroi" în "Voi". În felul acesta se corectează verbul inexistent "a vroi", care e de fapt o contaminare a verbelor "a vrea" şi "a voi", şi scăpăm de nişte erori extrem de des întâlnite: "vroiam, vroia, vroi, vroiră".
Scuze dacă este deja implementată această modificare.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Nu mai este implementată o astfel de modificare.
     Au existat astfel de modificări, dar am renunţat la ele pentru că lucrurile s-au dovedit a fi ceva mai complicate...

     După ce am transformat toate "a vroi" în "a voi", a fost necesar să fac alte înlocuiri pe timpul corecturii prin citire, de genul "a voi" >> "a vrea" şi chiar revenirea la "a vroi", deoarece:
     În multe situaţii "a voi" sună bine [în special în zonele de text care conţin comentariul autorului], dar în alte situaţii "a vrea" pare varianta mai bună.
     În dialogurile unora dintre personaje, hibridul incorect "a vroi" pare să se "asorteze" mai bine cu limbajul colorat al acestora.

     Din aceste cauze am eliminat modificările iniţiale şi am renunţat la "a vroi" >> "a voi".

     Dacă credeţi că este neapărat necesară modificarea, atunci o voi implementa într-unul din dicţionarele suplimentare, dar nu pot fi introduse într-unul din cele 32 de dicţionare care rulează obligatoriu în meniu, deoarece acestea corectează doar caractere recunoscute eronat şi nu trebuie să facă îmbunătăţire de limbaj.
     În plus, implementarea modificărilor într-un dicţionar suplimentar dă posibilitatea fiecărui user să aleagă dacă vrea sau nu să facă aceste modificări.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
_Cosimo_
Membru Senior

Inregistrat: acum 12 ani
Păi nu văd unde este problema. "A vrea" nu se încurcă niciodată cu "a vroi", pur şi simplu cuvintele "vroiam, vroia, vroiai, vroiră, vroi" nu există.

"a vrea" se conjugă altfel: "vream, vreai, vrui, vru, vrură" etc., niciodată şi la niciun timp nu apare vreo conjugare care să se "pupe" cu vreuna dintre formele aşa-zisului verb "a vroi".

Iar "a voi" nici atât nu se încurcă cu "a vroi": "voiam, voia, voiai" etc.

E o modificare cât se poate de simplă şi care ar trebui făcută întotdeauna. Iar verbele "a voi" şi "a vrea" au exact acelaşi înţeles, practic nu există nicio diferenţă semantică între ele. Singura diferenţă e de ordin etimologic, unul vine din latină (a vrea), iar celălalt l-am moştenit de la slavi (a voi). Avem multe asemenea "dubluri" în limba română, fiind pe jumătate latină şi pe jumătate slavă. Unele s-au diferenţiat semantic în timp, dar nu e şi cazul acestor două verbe. Iar de al treilea chiar că nu mai avem nevoie, nu? 

Ştiu că e o greşeală de limbă extrem de des întâlnită, din păcate, dar e totuşi o greşeală şi ar fi nu ştiu cum să nu fie corectată automat şi fără confirmare de Autocorect, când e atât de simplu de implementat.
Sunt altele la fel de grave şi de răspândite, dar care nu pot fi corectate decât cu confirmare, precum confuzia între persoana 1 singular şi persoana 1 plural a mai mult ca perfectului: în o mulţime de cărţi întâlnim "noi mersesem/cântasem/făcusem/citisem" în loc de "noi merseserăm/cântaserăm/făcuserăm/citiserăm". În asemenea cazuri, într-adevăr, nu le poţi corecta automat, dar în cazul lui "vroiam" e super simplu şi nu are ce confuzii să genereze. Eu aşa zic.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Este adevărat: tehnic implementarea este foarte uşor de făcut.
      Sunt total de acord cu ceea ce ai postat, deşi, în legătură cu afirmaţia „pur şi simplu cuvintele "vroiam, vroia, vroiai, vroiră, vroi" nu există”, aş zice mai degrabă că verbul „a vroi” nu există din punct de vedere teoretic, adică nu este acceptat de lingvişti, dar, practic el este folosit frecvent atât în limbajul zilnic urban, dar mai ales în limbajul rural.

     
      Revenind la implementarea modificării în AutoCorect; în încercarea mea de a nu scrie foarte mult, cred că nu m-am exprimat suficient de clar.
      Sunt două aspecte la care vreau să mă refer, unul legat de principiile AutoCorect şi al doilea legat de ce anume modificări putem face într-o ediţie electronică faţă de ediţia originală.

      1. După cum ai spus "a vroi" este o greşeală de limbă.
      Cosmin Ciupercă şi Daniel Morlova au conceput şi dezvoltat pe parcursul a 10 ani programul AutoCorect [Standard] ca un program care să pună dicritice în textele scrise fără diacritice şi să realizeze corectări de ortografie şi de punctuaţie, fără a interveni în corectarea de limbă.
      Acesta este un principiu de bază al programului şi a fost respectat de la crearea programului până la acest moment.

      Meniul OCR Plus face doar corectări ale erorilor de recunoaştere optică a Abbyy sau alte programe de gen; el corectează doar caractere pe care Abbyy le-a "văzut" ca fiind altceva decât caracterele corecte.
      Practic, prin rularea meniului OCR Plus, programul AutoCorect încearcă să aducă textul OCR la o formă cât mai apropiată de cartea originală, fără să facă alte îmbunătăţiri.

      Meniul OCR Plus, ca şi AutoCorect Standard, respectă principiul de a nu face corectare de limbă.
      Singura intervenţie este cea legată de conversia de la "clasic" la "contemporan" şi, legat de această conversie a apărut modificarea „nici o” >> „nicio”, dar care este considerată ca fiind problemă de ortografie şi nu de limbă.
      De aceea se evită implementarea în mod automat în OCR Plus a conversiei "a vroi" >> "a voi" sau alte corectări de limbaj.


      2. Al doilea aspect se referă la cât de multe modificări poate suporta o ediţie electronică în comparaţie cu ediţia originală pe hârtie.
      În legătură cu acest lucru au existat foarte multe discuţii de-a lungul timpului pe forum, dar nu s-a putut ajunge la o concluzie unanim acceptată.
      Unii useri au fost de părere că trebuie ca versiunea electronică să fie o copie fidelă a originalului, în care să se păstreze inclusiv regulile ortografice ale perioadei în care a fost tipărită cartea…
      Alţi useri au fost adepţii modificărilor, mergând până la intervenţii [uneori nu tocmai inspirate] asupra traducerii textului, astfel că ediţia electronică devenea una diferită faţă de ediţia tipărită.
      Între aceste variante, să le zicem extreme, au existat multe variante intermediare, inclusiv acelea în care se păstra traducerea, dar se schimba ortografia, sau chiar elemente de limbaj.
      Am constatat de-a lungul timpului că indiferent cât de logică şi corectă ar fi o propunere pe forum, se vor găsi totdeauna câţiva useri, care, pe principiul „Traim intr-o tara libera, fiecare cu gustul sau”, vor contesta propunerea şi vor face oricum altcumva pentru a se simţi liberi.
      Acesta ar fi al doilea motiv pentru care nu putem să impunem o regulă tuturor, deoarece s-ar găsi suficienţi de mulţi useri care să conteste o astfel de regulă.


      Ca să putem rezolva totuşi astfel de situaţii ca cea pe care ai subliniat-o şi în acelaşi timp să nu intrăm în conflict cu alţi useri, am încercat o formulă intermediară şi am propus implementarea modificărilor într-un dicţionar suplimentar care poate fi rulat doar de userii care doresc o astfel de modificare.

      RE:
      Am făcut un mic dicţionar care cuprinde 10 înregistrări [imp. + p.s].
      Cred că nu mai sunt folosite şi alte forme ale hibridului.
     

      Fiecare utilizator îşi poate personaliza dicţionarele, aşa că pentru cine doreşte ca ele să ruleze automat, poate să adauge înregistrările la unul dintre dicţionarele CO_CImf1.imd - CO_CImf3.imd. Recomandat unul dintre aceste dicţionare, deoarece ele fac modificări de cuvinte întregi.

Modificat de Seven (acum 11 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
_Cosimo_
Membru Senior

Inregistrat: acum 12 ani
Mulţumesc că ai avut răbdarea să-mi răspunzi pe larg, dar eu nu intenţionasem decât să fac lumea virtuală un pic mai bună, mai puţin agramată. Eu întotdeauna corectez greşelile de gramatică, atunci când le întâlnesc prin cărţi, pentru că eu însumi sunt redactor de carte de multă vreme şi ştiu foarte bine că unui redactor bun nu-i scapă asemenea perle. Nenorocirea e că întotdeauna au existat redactori nepricepuţi în ale limbii, care mai rău au stricat cărţile, uneori, decât să le îngrijească. Toate cărţile care se retipăresc sunt revăzute de un redactor (cel puţin la editurile serioase), a cărui misiune e şi îndreptarea limbii; prin urmare, dacă vei lua orice ediţie de acum o sută, cincizeci sau zece ani şi o vei compara cu una proaspăt ieşită de sub tipar, vei constata că pot fi diferenţe serioase de la o ediţie la alta, din punct de vedere strict al redactării cărţii. Nu există două ediţii identice ale aceleiaşi cărţi. Dă-mi aceeaşi carte în două ediţii şi îţi exemplific concret. Chiar mi-ar plăcea. Nu m-aş mira să găsesc şi corectura vroiam/voiam.
Desigur, sper că nu înţelege cineva că trebuie corectată limba vorbită de Ghiţă Pristanda sau de ţiganii lui Eugen Barbu.
Dar ar fi absurd să pretindă cineva să lăsăm "î-ţi place" doar fiindcă aşa apare în ediţia tipărită. "Vroiam" face parte exact din categoria asta, a agramatismelor. Şi sunt mulţi redactori care lasă asemenea prostioare prin cărţi, din păcate. Tot aşa cum sunt o mulţime cărora nu le scapă nicio eroare. În "Istoria artei", pe care tocmai am terminat-o, n-am găsit nici cea mai mică eroare de limbă, singurele greşeli de redactare erau nişte numere inversate la câteva fotografii. Toată stima pentru redactorul care a lucrat cartea.

Şi să dau şi un exemplu concret. Ia orice carte apărută la Nemira până acum cinci, şase ani, şi o să vezi că foarte multe dintre ele sunt scrise cu "vroiam". Dar n-o să găseşti niciun "vroiam" (sper) în cărţile apărute în ultimii trei, patru ani la Nemira, pentru că între timp s-au schimbat şi redactorii, şi nivelul lor de pregătire. Aşa că toate reeditările din ultimii ani beneficiază şi de modificarea vroiam/voiam. Şi atunci, dacă avem scanul unei ediţii de acum zece ani, trebuie să lăsăm greşeala de limbă doar ca să respectăm ortografia ediţiei cu pricina? Ar fi absurd.

Cât despre intervenţia asupra traducerii, dacă tot ai adus vorba, şi eu recomand extremă prudenţă. Adică dacă n-ai tradus niciodată o carte şi n-ai o bogată experienţă redacţională în confruntarea originalului cu traducerea - că asta face un redactor, printre altele, spre deosebire de corector -, mai bine abţine-te, să nu strici mai rău.

În concluzie, susţin în continuare că modificarea asta ar trebui inclusă în "programul de bază", nu în dicţionarele personalizate, pentru că mulţi chiar nu-şi dau seama că "a vroi" e o greşeală, dar până la urmă voi hotărâţi dacă o includeţi sau nu, e programul vostru.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Sunt două-trei situaţii speciale care mă preocupă în acest moment.
      Am văzut pe forum foarte multe texte corectate de-a lungul timpului în care apare frecvent cifra 1 în locul literei L mic sau în locul lui i mare.

      1. Este vorba de grupul < 11 > scris eronat, în locul cuvintelor < Îl > sau < Îi >, poate chiar < Îl > sau, chiar şi < II >
      Aici încă nu mi-e foarte clar cum se poate rezolva, dar e o situaţie ce trebuie rezolvată.

      2. Ar mai fi vorba de cuvântul < ÎI > scris eronat, în locul cuvântului corect < Îl >
      Cred că cea mai simplă soluţie este să adaug această modificare cu confirmare în în dicţionarul CO_Var4.imd. Probabil că ar fi mai bine ca dicţionarul să caute acest cuvânt doar la început de frază, început de dialog şi început de paragraf, deşi... o căutare în toate poziţiile nu ar îngreuna foarte mult, deoarece cuvinte scrise cu toate iterele majuscule sunt destul de puţine într-un text, aşa că o căutare totală nu ar lungi prea mult căutarea, dar ar evita "sărirea" acestui cuvânt scris eronat în altă poziţie decât la început de frază [dialog, paragraf].

      2. A treia situaţie este cea în care cuvântul < I > apare recunoscut de Abbyy ca fiind cifra < 1 >
      Am testat peste 40 deja corectate din autorii Tolstoi, Dumas, Monsigny, Cooper şi Ponson du Terrail şi am scos situaţiile în care litera < I > apare singură la început de frază [dialog, paragraf]. Majoritatea expresiilor sunt forme ale verbului "se pare", cum ar fi < I se pare, I se părea, I se păru, I se păruse, I se va părea >, dar apar cu frecvenţă mai mică şi alte câteva expresii.
      Practic am căutat aoariţia în text a lui I mare urmat de spaţiu şi am notat expresiile în componenţa cărora apărea I mare.
      M-am gândit la un dicţionar [nu neapărat un dicţionar nou, înregistrările pot fi adăugate în unul existent], în genul următor:

             *******************
             1 se pare  >>  I se pare
             1 se părea  >>  I se părea
             1 se păru  >>  I se păru
             1 se păruse  >>  I se păruse
             1 se va părea  >>  I se va părea

             1 l-am   >>  I l-am
             1 l-ar  >>  I l-ar
             1 l-au  >>  I l-au
             1 le  >>  I le
             1 le-a   >>  I le-a
             1 le-am  >>  I le-am
             1 le-au  >>  I le-au

             1 s-a  >>  I s-a
             1 s-ar fi  >>  I s-ar fi
             1 s-ar  >>  I s-ar
             1 s-au  >>  I s-au

             1 s-o fi  >>  I s-o fi
             1 s-or fi  >>  I s-or fi

             1 se-a...  >>  I se-a...
             1 se-î...  >>  I se-î...
             1 se-m...  >>  I se-m...
             1 se-n...  >>  I se-n...
             1 se-o...  >>  I se-o...
             1 se mai  >>  I se mai
             1 se tot   >>  I se tot
             1 se va   >>  I se va

             ********************

      Alte expresii ce au fost găsite în texte se pot vedea aici

      Deocamdată voi face un dicţionar separat, dar cred că voi adăuga înregistrările la dicţionar existent, precum unul din dicţionarele CO_L13.imd - CO_L3.imd... deşi... parcă ar merge adăugate şi la CO_Midp.imd, care rulează la opţiunea 4.4 Corectare minuscule la început de paragraf, cu care seamă nă mai mult... deoarece, expresiile vor fi căutate după punct, la început de dialog şi început de paragraf.
      Încerc să editez înregistrările astfel încât să nu fie nevoie de confirmări.

      Menţionez că nu am făcut testări de texte de tip SF. Poate mă mai ajută cineva cu alte câteva expresii.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Vorbesti de acel dictionar ce se ruleaza pe textele formatate?

pus acum 11 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 16 ani
In cazul textelor provenite din OCR-uri ale jpg/tif
PROST SCANATE am intalnit:

- cea mai frecventa eroare a grupului < 11 > :
n

- cele mai frecvente erori ale grupului < 1111 > :
    un
sau
    nu.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Pentru 1111, cred că cel mai bine este să înregistrez 2 înlocuiri cu condiţiile cuvânt întreg plus confirmare, ca mai jos:
             1111 >>  un     Ci  Cli
             1111 >>  nu     Ci  Cli
     Grupul 11 nu l-am urmărit în mod special. Nu am fost atent şi nu ştiam că înlocuieşte litera "n" [poate că şi "u"]... Credeam că e vorba de Îl, îi, fi... adică de două caractere fusiforme...
     N-am nicio idee... nu ştiu cum să rezolv... Mai are rost să încerc vreo modificare?


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     
     Am urcat la adresa cunoscută Dicţionare actualizate, astfel.
         OCR_DIC Contemporan - reactualizare 01.07.2012
         Dicţionare Suplimentare Uzuale - reactualizare 01.07.2012


     NOTĂ: pentru că este ceva mai mult de lucru la verificarea şi reactualizarea dicţionarelor OCR_DIC Clasic, acestea vor fi postate în zilele următoare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     ansambl >> asambl  Ci Ic Pc
     meridiane şi utilitasetveritas - sunt de acord cu voi; această înlocuire crează multe probleme şi nu se poate rezolva aşa de simplu

     Într-adevăr, stabilirea înlocuirilor dintr-un dicţionar este o activitate mult mai dificilă decât pare la prima vedere şi necesită multă atenţie.


     Eu am împărţit dicşionarele în trei categorii:
           - dicţionarele din OCR_DIC - efectele lor sunt valabile în orice tip de text frecvenţa înlocuirilor este mare, efectele secundare nedorite sunt minime; În aceste dicţionare, deşi au fost foarte multe propuneri, am încercat să pun doar înregistrări care îndeplineau toate condiţiile menţionate mai sus.

           - dicţionare suplimentare [uzuale] care se pot rula la opţiunea 11; aici înlocuirile sunt corecte, efectele secundare destul de mici, dar frecvenţa înlocuirilor poate fi
variabilă în funcţie de text, până la foarte mică. Aceste dicţionare au fost create de mine pentru uz personal, pentru unele erori cu frecvenţă mijlocie, descoperite în unele texte, pe măsură ce executam corectura prin citire a acelor texte. Pentru că nu produc efecte secundare nedorite notabile, am considerat că le pot folosi şi ceilaţi useri.

           - dicţionare TEMPORARE - aceste dicţionare se pot crea separat, chiar şi pentru un singur volum, cuprinde un număr relativ mic de înregistrări care îşi produc efectul benefic doar în textul pentru care au fost create, dar pot produce efecte nedorite în alte texte. În funcţie de calitatea scanului, a tipului de font folosit la tipărirea cărţii etc. etc. Există unele tipuri de erori care sunt caracteristice unui volum [sau unei serii de volume care au fost realizate în aceleaşi condiţii de tipărire-scan-OCR] dar care nu au niciun efect venefic în cazul altor volume.
Într-un astfel de dicţionar aş putea pune înlocuiri de genul ansambl... >> asambl...


     Pentru a evita modificarea cuvântului care se referă la ansamblu [folcloric etc], se poate rezolva problema ansambl... >> asambl... prin înregistrarea acestei modificări  într-un dicţionar temporar pentru textul respectiv, care pare că se referă la domeniul tehnic sau prin realizarea mai multor înregistrări, astfel încât să nu necesite condiţia "Cu confirmare", dar care să nu producă şi efecte nedorite.
     În acest caz nu vom mai folosi forma [ansambl >> asambl], ci forme care cuprind şi următoarea literă de după litera "L mic"

           ansambla >> asambla  Ci Ic Pc
           ansamblă >> asamblă  Ci Ic Pc
           ansamble >> asamble  Ci Ic Pc
           neansambla >> neasambla  Ci Ic Pc
           neansamblă >> neasamblă  Ci Ic Pc
           neansamble >> neasamble  Ci Ic Pc
           dezansambla >> dezasambla  Ci Ic Pc
           dezansamblă >> dezasamblă  Ci Ic Pc
           dezansamble >> dezasamble  Ci Ic Pc

     Nu se va face o înlocuire de genul [ansamblu >> asamblu  Ci Ic Pc]
     Forma [ansamblu >> asamblu] ar produce doar efect nedorit asupra sunstantibului corect "ansamblu". Nu s-ar niciun efect befic, deoarece în limba română nu există nicio for,ă a verbului " a asambla" care să aibă forma "asamblu..."


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu. Stai sa ne intelegem.
Lasa cuvantul, vorbeste-mi doar de situatie.

dezANSAMBLATe

Ce setari trebuiesc puse pentru a modifica doar "ansamblat" din mijlocul cuvantului?
Asta vreau sa stiu.
Daca nu merge, o sa fac cateva inregistrari, cu inceput de cuvant, care sa contina variabilele re-, dez-, etc.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Păi, dacă nu ţinem cont de cuvântul în sine, ci doar despre situaţie, atunci vorbim de o SECVENŢĂ de cuvânt; mai mult decât atât este o secvenţă mediană, deci nu se poate pune niciuna dintre condiţiile Cuvânt întreg [la început ORI la sfârşit], astfel că pot apărea multe erori, pentru că va căuta oriunde.
      Pentru a preveni erorile e musai să folosim condiţia "Cu confirmare"

      Condiţia "Păstrează capitalizarea" se justifică doar pentru situaţia în care secvenţa ar fi un început de cuvânt sau ar fi scrisă în totalitate cu majuscule.
      Condiţia "Cuvânt întreg" am arătat că nu se poate pune.
      Condiţia "Potrivire perfectă" ar reduce căutările atunci când secvenţa este la început cu iniţială majusculă sau secvenţa s-ar afla oriunde scrisă cu toate literele majuscule.

      În conluzie, eu aş pune "Cu confirmare" şi facultativ "Păstrează capitalizarea".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Asta am zis si eu.
Problema mea e ca daca bifez Confirma la inlocuire, iar apoi bifez Pastreaza capitalizarea, se bifeaza automat si Cuvant intreg. Iar daca debifez Cuvant Intreg, se debifeaza si Pastreaza Capitalizarea.

Deci cum fac sa folosesc doar cele 2 conditii, Confirmarea si Capitalizarea?


Dupa ce lamurim asta, o sa vreau sa discutam nitel despre folosirea seriilor de cuvinte dictionar.

Dupa ce o lamurim si pe asta, o sa iti pasez cele 2 dictionare facute pentru textele deja formatate. O sa mai fie o mica discutie si pe tema asta.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
       Ai dreptate, condiţia "Păstrează capitalizarea" merge doar în cuplu cu condiţia "Cuvânt întreg" fie ea cel puţin "Cuvânt întreg la început".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Si sunt sanse sa se rezolve asta?
Poate fi de mare ajutor atunci cand cautam secvente mediane, dar mai dam si peste aceleasi secvente puse la inceput de cuvant.

Ca sa definesc in dictionar secventa de cuvinte "m-am dus la lupta" > "nu m-am dus la lupta", am inteles din explicatiile tale ca trebuie sa o definesc ca fiind Cuvant Intreg, fara Pastreaza Capitalizarea. Si nici nu trebuie sa pun spatiu inainte de primul si dupa ultimul cuvant din ambele secvente, nu?

Aici:


ai dictionarele de care ziceam mai devreme. Unul e acel dictionar de inlocuiri cu confirmare pe care l-au pus tu pe forum+cateva adaugiri, al doilea contine cuvinte scrise, de obicei gresit, si forma lor corecta.
Ambele au ca scop rularea pe texte deja formatate si care nu mai suporta rularea OCR+.
In dictionarul inlocuiri cu confirmari, sunt cateva inlocuiri ce sunt dublate de mine, iui > lui, numai ca cele originale au niste conditii in plus.

Uita-te cand ai timp si spune-mi parerea ta. Continutul ambelor dictionare, chiar si atunci cand suntem 100% siguri de acuratetea inlocuirii, se ruleaza mereu cu Confirmare la Inlocuire. Au ca tinta erorile ortografice vizuale, gen Iui > lui, si greselile uzuale de ortografie, erori ce inca mai apar chiar si intr-un 3.0.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Acu ceva ani cand am inceput sa fac Inlocuirea Multipla am discutat cu Daniel ceva timp si am ajuns amandoi la concluzia ca "Pastreaza capitalizarea" ar trebui activata doar cand "Cuvant intreg" e activata. De aceea bifarea "Pastreaza capitalizareaa" duce la bifarea automata a "Cuvant intreg".
Dar se pare ca situatia e mai complexa.
Daca se ajunge la concluzia unanima ca e mai bine ca bifarea automata sa fie scoasa, am s-o scot.


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
In cazul inlocuirilor multiple, cred ca ar fi cazul sa beneficiem de capitalizare si in lipsa optiunii Cuvant intreg.
Doar in meniul de inlocuiri multiple, atat. Astept si parerea lui Seven.

Pot sa faci programul sa bifeze implicit optiunea Cuvant Intreg atunci cand se activeaza Pastreaza Capitalizarea (ca acum), dar daca utilizatorul debifeaza manual Cuvant Intreg, sa nu mai fie afectata si capitalizarea.


Dar sa fii sigur ca ai inteles ce se doreste si felul in care ar trebui sa functioneze.

Exemplu:

ansambla > asambla
> Confirmare la inlocuire, Pastreaza capitalizarea (fiind o secventa mediana, poate fi gasita si la inceputul cuvantului si la mijloc si la sfarsit)


Ei au ansamblat obiectul > Ei au asamblat obiectul.
Ei au Ansamblat obiectul > Ei au Asamblat obiectul.
Ei au dezansamblat obiectul > Eu dezasamblat obiectul.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

utilitasetveritas a scris:

(...)Poţi sa faci programul sa bifeze implicit optiunea Cuvant Intreg atunci cand se activeaza Pastreaza Capitalizarea (ca acum), dar daca utilizatorul debifeaza manual Cuvant Intreg, sa nu mai fie afectata si capitalizarea.(...)

     Dacă se poate aşa, cred că ar fi foarte bine.


     2. M-am uitat la cele două dicţionare şi din punct de vedere al condiţiilor sunt OK.
     Înregistrările originale care au niste conditii in plus sunt setate astfel încât să caute numai în interiorul frazei; Practic cuvântul de înlocuit este căutat doar în poziţia în care se află între cuvinte scrise cu litere mici.
     Am o problemă cu modificarea nr.7 [asterisc] - cred că modificarea nu este corectă.

     Aş mai propune câteva înlocuiri; am întâlnit relativ frecvent situaţiile de mai jos:
          însemnează >> înseamnă - cu sensul de rezultă
          sorei >> surorii
          soartei >> sorţii
          formele lui "a trăzni" cu Z >> "a trăsni" cu S


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ai dreptate in privinta inregistrarii nr. 7.
Am inversat termenii din neatentie.


Adauga ce ai de adaugat in dictionare, fa si modificarea cu asteriscul si cele doua de jos, apoi pune-le pe forum. Le iau, le folosesc/folosim, mai adaug, etc. si revin cu noutati daca e cazul.

adaog > adaug
Inceput Cuvant, Confirmare, Capitalizare

alt fel > altfel
Confirmare, Capitalizare

Deci acele inlocuiri originale pot sta impreuna cu ce am adaugat eu, cu altfel de conditii.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Am modificat si am urcat exe-urile la locatia binestiuta.

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Oki doki si sanchiu.

Merge brici

In cazul asta:

ansambl > asambl

A ansamblat tot. > A asamblat tot.
A Ansamblat tot. > A Asamblat tot.

Merge ok.


In cazul asta:


ansambl > asambl

A ansamblat tot. > A asamblat tot.
A AnsamBlat tot. > A asamblat tot.

Merge ok, dar daca mai ai o majuscula in cuvant, le face pe toate minuscule.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Da, stiu, pentru ca asa e facut codul - sa lucreze pe 4 cazuri:
1. lungimea textului ce va fi inlocuit e egala cu lungimea textului cu care va fi inlocuit >> majusculele sunt pastrate 100% prin comparatie directa cu textul original.
2. majuscule la inceput.
3. toate majuscule;
4. toate litere mici.

"Pastreaza capitalizarea" e facuta sa lucreze efectiv cu cuvinte nu fraze; pe de alta parte in aproape toate cazurile majuscule in cuvant amestecate cu litere mici inseamna eroare.
Sa o modific in acest sens nu e asa usor pentru ca nu e asa de usor de mentinut sincronizarea dintre textul de inlocuit si textul ce va inlocui.
Cand e doar un caracter diferenta (ca in exemplele tale) e mai usor, da, dar problema e ca trebuie sa fac un cod care sa mearga si in situatiile mai ambigue.


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu, nu. Lasa asa, nu fa nimic.
Dupa cum zici si tu, majuscule in mijlocul cuvantului inseamna eroare.
Era doar un exemplu de om prea curios


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Seven, daca nu mai ai nimic de adaugat la dictionar, in afara de ceea ce ai postat aici, lasa-le asa, ma ocup de ele eu.

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Seven, ai in arhiva un text si acel dictionar de inlocuiri cu confirmare.


Problema mea e ca am toate, cel putin asa pare, inregistrarile setate sa fie cu confirmare. Dar dupa ce rulez dictionarul, chiar si in cazul in care aleg "Renunta" la toate inlocuirile, AC-ul imi zice ca a facut 200 si ceva de inlocuri.


Deci am la toate "Confirmare la inlocuire" si totodata anulez fiecare inlocuire la care mi se cere acordul. Dar inlocuiri tot se fac fara voia mea.

Ai idee care e problema?


P.S.

Am gasit problema, dar nu pot sa mi-o explic.

. î » . Î

Pe moment am sters-o din dictionar. Dar nu inteleg de ce nu imi cerea confirmarea.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      1. Într-adevăr în fişierul postat astăzi toate înregistrările au condiţia "Cu confirmare". Cred că fişierul de acum câteva zile conţinea vreo 2-3 înregistrări fără această condiţie. Posibil ca acele înregistrări să fi produs probleme. Practic, înregistrările de astăzi nu trebuie să producă modificări fără să ceară aprobarea utilizatorului.
      Am făcut modificări la câteva înregistrări, am testat apoi pe un text şi nu a făcut nicio modificare din capul lui. Eu cred că ar trebui să ruleze corect.


      Să clarificăm două aspecte:
          - condiţiile "Potrivire perfectă" şi "Păstrează capitalizarea"nu merg împreună; trebuie să alegem ori una ori alta.
      De exemplu: atunci când înlocuirea se face la începutul cuvântului ca în cazurile: clar >> dar, clacă >> dacă... atunci punem "Potrivire perfectă", dar fără "Păstrează capitalizarea" pentru că eroarea este valabilă doar la minuscule, adică nu se va face eroare între CLACĂ şi DACĂ, ci doar în cazul clacă - dacă.
      Dacă eroarea de corectat este la mijlocul cuvântului atunci merge "Păstrează capitalizarea", dar fără să activăm şi "Potrivire perfectă"
      În dicţionarul pe care l-am modificat am eliminat câteva "păstrează capitalizarea" acolo unde nu era cazul 

      Condiţia "ignoră margini la înlocuire" trebuie reţinut că:
         - la caută: se pun şi marginile
         - la înlocuieşte cu: se pune doar cuvântul de înlocuit fără a mai pune şi marginile.
      În sensul ăsta am făcut o modificare: am pus o condiţie "ignoră" la 55 dh >> ch, astfel încât să caute grupul doar între litere mici. În acest moment înregistrarea arată aşa:
          55  ^ldh^l  >>  ch   Pp  Cli  Ima  In1  - unde ^l înseamnă literă mică. Dacă apreciezi că ar trebui să caute şi la început de cuvânt atunci debifezi condiţia "ignoră.." şi la caută modifici [ ^ldh^l ], lăsând doar [ dh ].

       Dicţionarul modificat l-am urcat temporar pe mediafire:
              nume:   Dic_conf_08.07.rar
              adresa:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Inregistrarea respectiva transforma ". î" (litera mica) in ". Î" (majuscula). Singura optiune setata e cea de confirmare.
Cat gaseste î (litera mica) si intreaba nu e problema. Dar in aceasta forma va merge si cand gaseste majuscula. In acest caz AutoCorect nu mai intreaba degeaba dar totusi, dupa ce ma gandisem mult, decisesem ca deocamdata sa nu anulez inlocuirea (desi e inutila).
Ca sa se evite aceste probleme se poate seta optiunea "Potrivire perfecta".
Dar oricum in OCR-uri intalnesti rar Î majuscula in aceste cazuri asa ca nu e problema mare.

Intrebare: ce parere aveti - sa anulez inlocuirea inutila sau s-o las cum fac si celelalte programe?


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Da, asa e, cel de acum cateva zile avea cateva inregistrari fara confirmare la inlocuire.
Dar nu despre ele era vorba.

Ia arhiva,are un dictionar cu o singura inregistrare, ruleaza-l asa cum e pe textul din arhiva. O sa iti faca vreo 200 de inlocuiri, care nu exista. Foloseste-o cu conditia de marcare a modificarilor.


Inregistrarea in cauza are bifata Confirmarea la inlocuire, dar nu confirma niciodata. De ce?



P.S.
Inregistrarea asta trebuia sa o pun cu Potrivire Pefecta, alminteri inlocuieste face inlocuiri in toate locurile in care gaseste acel grup de caractere.
Dar nu inteleg de ce nu se face cu confirmare la inlocuire.

P.P.S.

Ok, problema lamurita.

1. Pentru a aplica corect acea inlocuire, era necesar sa activez Potrivirea Perfecta. Trebuia sa caute doar zonele de text cu litere mici si sa le inlocuiasca cu litere mari.

2. Confirmarea la inlocuire era activata. Nu a fost afisata dintr-un motiv ce tine de AC.
Textul meu nu continea zone in care sa apara ". î", continea doar zone cu ". Î".

Felul in care programasem inlocuirea a pus programul sa caute toate zonele in care apare ". î", chiar si cand era scris cu majuscula. Problema a fost faptul ca eu aveam toate acele situatii doar cu majuscula.

Iar programul a facut niste inlocuiri "inutile" a inlocuit majuscula cu majuscula. De aceea nu a mai cerut confirmare, pentru ca nu a schimbat nimic.

Daca in text ar fi aparut si ". î" atunci ar fi aparut fereastra de confirmare.


P.P.S.

Am discutat cu Cosmin. Am inteles ca asa e setat programul. La inlocuirile "inutile", ca cea mai de sus, programul nu mai da fereastra de confirmare. Din moment ce am inlocui pe Î cu Î, nu e nimic de confirmat.

Eu consider ca e mai bine ca acest gen de inlocuire sa se faca cu confirmare.
De ce?
Pentru ca desi nu prea are ce strica din text, e un mod ineficient de folosire a AC-ului.
Daca, in cazul meu, fereastra de confirmare ar fi aparut, mi-as fi dat seama de prostia facuta si as fi activat si conditia de Potrivire Perfecta.

Daca omul vede o data, de doua ori, de trei ori, etc. ca inlocuirea e inutila, isi da seama de eroarea facuta si o remediaza folosind Potrivirea Perfecta.
La urma urmei, pentru asta e si facuta aceasta conditie. Sa caute exact acel grup de caractere.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Ideea pentru care am implementat in AutoCorect sa nu mai ceara confirmare inutila in aceste cazuri era ca sa nu mai streseze inutil utilizatorul final care nu va sti unde sa modifice dictionarul IM.
Am o idee care cred ca va multumi pe majoritatea: cand un dictionar IM va fi rulat din fereastra de Inlocuire Multipla, sa ceara confirmare chiar si aceste cazuri. In acest fel profesionistii care fac dictionare IM isi vor da seama de problema in teste. In schimb in restul situatiilor sa nu intrebe si nici sa nu inlocuiasca inutil astfel incat sa nu streseze inutil utilizatorii obisnuiti.


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Sau asa 

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      În urmă cu vreo 3-4 ore încercam şi eu să dau un răspuns, dar tocmai s-a blocat forumul. Deocam dată postez exact ceea ce pregătisem, deşi între timp unele dintre lucruri s-au clarificat...

      1. Într-adevăr în fişierul postat astăzi toate înregistrările au condiţia "Cu confirmare". Cred că fişierul de acum câteva zile conţinea vreo 2-3 înregistrări fără această condiţie. Posibil ca acele înregistrări să fi produs probleme. Practic, înregistrările de astăzi nu trebuie să producă modificări fără să ceară aprobarea utilizatorului.
      Am făcut modificări la câteva înregistrări, am testat apoi pe un text şi nu a făcut nicio modificare din capul lui. Eu cred că ar trebui să ruleze corect.
      [printre modificările făcute era şi aplicarea lui "potrivire perfectă la înregistrarea . î >> . Π De aceea mie nu-mi mai făcea modificări inutile]

      2. Să clarificăm două aspecte:
          - condiţiile "Potrivire perfectă" şi "Păstrează capitalizarea"nu merg împreună; trebuie să alegem ori una ori alta.
      De exemplu: atunci când înlocuirea se face la începutul cuvântului ca în cazurile: clar >> dar, clacă >> dacă... atunci punem "Potrivire perfectă", dar fără "Păstrează capitalizarea" pentru că eroarea este valabilă doar la minuscule, adică nu se va face eroare între CLACĂ şi DACĂ, ci doar în cazul clacă - dacă.
      Dacă eroarea de corectat este la mijlocul cuvântului atunci merge "Păstrează capitalizarea", dar fără să activăm şi "Potrivire perfectă"
      În dicţionarul pe care l-am modificat am eliminat câteva "păstrează capitalizarea" acolo unde nu era cazul 

      Condiţia "ignoră margini la înlocuire" trebuie reţinut că:
         - la caută: se pun şi marginile
         - la înlocuieşte cu: se pune doar cuvântul de înlocuit fără a mai pune şi marginile.
      În sensul ăsta am făcut o modificare: am pus o condiţie "ignoră" la 55 dh >> ch, astfel încât să caute grupul doar între litere mici. În acest moment înregistrarea arată aşa:
          55  ^ldh^l  >>  ch   Pp  Cli  Ima  In1  - unde ^l înseamnă literă mică. Dacă apreciezi că ar trebui să caute şi la început de cuvânt atunci debifezi condiţia "ignoră.." şi la caută modifici [ ^ldh^l ], lăsând doar [ dh ].

       Dicţionarul modificat l-am urcat temporar pe mediafire:
              nume:   Dic_conf_08.07.rar
              adresa:

      LE:
      În legătură cu problema înlocuirilor inutile... cred că cel mai bine ar fi să alegem  varianta în care dicţionarul rulează mai repede.
      Ar mai exista şi o variantă temporară: Poate că deocamdată ar fi bine să nu modificăm nimic, ci doar să notăm constatările şi să vedem ce alte efecte ar mai putea apărea.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
E buna si sugestia sa alegem varianta in care dictionarul ruleza mai repede, e buna si varianta temporara - cum mai e de lucru la dictionare, mai poate astepta.
Oricum, de data asta, indiferent ce modificare se alege, nu am mult de lucru la implementare. Dureaza doar cateva min...


pus acum 11 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 16 ani
In romana nu exista cuvinte care se termina cu â din A.
Conform experientei, â final apare la OCR ca eroare - in loc de ă final.

Ar fi bine de prevazut in dictionare
reguli pentru INLOCUIRE CORECTA, de forma:

â spatiu - ă spatiu
â punct - ă punct
â ENTER - ă ENTER
â virgula - ă virgula
â PUNCT SI VIRGULA - ă PUNCT SI VIRGULA
â DOUA PUNCTE - ă DOUA PUNCTE
â! - ă!
â? - ă?

EXEMPLU :
încurajâ - încurajă

intrucat actualmente OCR plus imi SUGEREAZA doar inlocuirea
încurajâ - încurajî


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Se pare ca Jullien are dreptate.
In ortografia noua, in cuvant, la margini se pune doar  î, iar â este rezervat exclusiv pentru interiorul cuvantului.

â spatiu - ă spatiu
â punct - ă punct
â ENTER - ă ENTER
â virgula - ă virgula
â PUNCT SI VIRGULA - ă PUNCT SI VIRGULA
â DOUA PUNCTE - ă DOUA PUNCTE
â! - ă!
â? - ă?

Toate aceste conditii pot fi cuprinse intr-o singura inregistrare:

â > ă

Cuvant Intreg, La sfarsit, Pastreaza Capitalizarea, Confirmare la inlocuire.


Hmmmm, daca tot veni vorba....
Cuvant intreg inseamna un sir de caractere cuprins intre 2 spatii libere?
Daca da, atunci cum sta treaba cu cuvintele ce au lipte de ele semne de punctuatie gen virgula, semn intrebare, etc.? In acest caz, atat cuvantul cat si semnul de punctuatie sunt cuprinse intre cele 2 spatii, iar semnul de punctuatie ar fi ultimul caracter din cuvant.

Am rulat inlocuirea pe grupul de propozitii:

Maria are mere si le încurajâ de mai multe ori.

Maria are mere si le încurajâ, de mai multe ori.

Maria are mere si le încurajâ! de mai multe ori.

Maria are mere si le încurajâ! De mai multe ori.

Maria are mere si le încurajâ: de mai multe ori.

Maria are mere si le încurajâ; de mai multe ori.

Rezultatul e ok.



P.S.

A aparut o problema totusi.
Daca incerc sa adaug in dictionar inregistrarea:

â > ă

Cuvant Intreg, La sfarsit, Pastreaza Capitalizarea, Confirmare la inlocuire.

Si apoi inregistrarea:

â > ă

Cuvant Intreg, La inceput, Pastreaza Capitalizarea, Confirmare la inlocuire.

Nu imi permite acest lucru pe motiv ca exista deja.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 12 ani
Cuvant intreg la Inlocuire multipla inseamna sirul de caractere cautat aflat intre caractere care nu pot fi intr-un cuvant. Adica caractere care nu-s litere, cifre, cratima, apostrof.
Deci cu acele semne de punctuatie care le-ai mentionat merge la fel ca la spatiu.

Referitor la imposibilitatea introducerii unei inregistrari cu acelasi text dar cu conditii diferite: codul momentan e facut sa testeze numai textul pentru ca sunt destul de putine situatii (exceptii) in care 2 inregistrari cu acelasi text dar conditii diferite nu vor fi redundante.

Pentru a rezolva totusi si aceste exceptii am 2 solutii:
1. Codul sa compare si optiunile setate si, daca intalneste situatii acceptabile sa lase utilizatorul sa introduca inregistrarea respectiva.
2 probleme:
- trebuie discutate toate combinatiile si stabilite la care trebuie lasat;
- la dictionare foarte mari si/sau pe calculatoare mai slabute e posibil ca introducerea unei inregistrari noi sa fie vizibil incetinita.
2. In loc sa nu lase utilizatorul sa introduca inregistrarea, codul ar putea doar sa-l atentioneze si sa-l intrebe daca e sigur ca vrea sa continue. Daca da clic pe Da, continua, da clic pe Nu, renunta.


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
E mult mai simplu sa alegi varianta a 2.
Si pentru tine, si pentru utilizator, si pentru cei pe care vrei sa ii chemi la discutie

Daca primeste atentionarea, o sa se verifice inregistrarea deja existenta, daca nu va fi multumit o va adauga pe cea de a doua.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Asa se prezinta posibila problema din dictionarele de texte formatate:



Aici e arhiva cu portiunea de text:

Nu prea pare sa aiba sens inlocuirea, sunt tentat sa cred ca s-a uitat bifarea pastrarii capitalizarii.
Problema e in CO_Var7.

Nu inteleg totusi care e rostul spatiului (^_) de dinaintea cuvantului.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     N-am  uitat, dar nici nu mi-am pus capul la contribuţie ca să fac modificarea.
     Înregistrările din dicţionarele tale le-am trecut în V7 exact aşa cum le-am primit.
     În dicţionarul original înregistrarea avea spaţiu în faţa ei dar nu era marcat cu cod, ci era doar spaţiu simplu.
     Am constatat la sortare că două înregistrări nu se duceau la locul lor şi atunci am observat că era vorba de spaţiu. Am crezut că aţi vrut să faceţi înlocuirea doar la cuvintele din interiorul propoziţiilor şi nu am gândit prea mult.

     Eu am modificat acum ambele înregistrări şi le-am pus Cuvânt întreg + Păstrează capitalizarea + Confirmare.
     Cea de-a doua înregistrare era să aibe >> să aibă      Ci  Pc  Cli.
     Deocamdată nu urc nimic pe host pentru că nu mai am timp.
     Am să lipsesc în jur de o săptămână, aşa că undeva în jurul datei de 20 revin cu o athivă nouă de dicţionare. Probabil până atunci poate face şi Cosmin modificarea care se referă la opţiunile 12.2 şi 12.3


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Da, asa e. Se strecurase un spatiu acolo.
In rest, ai setat corect.

Ciudat ca nu mi-a aparut chestia asta pana acuma.


pus acum 11 ani
   
Pagini:  1 2  

Mergi la