Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
GeorgianaBC
Femeie
23 ani
Bacau
cauta Barbat
28 - 80 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect versiune pentru Romania-Inedit Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1 ... 9 10 11 12 13
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Bun. Deci am ramas in urma cu dictionarele sau am prelucrat ocr-ul cu ceva timp in urma.
O alta chestie intalnita sunt cuvintele intregi ce contin paranteze patrate.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      @utilitasetveritas,
      Nu înţeleg ce probleme sunt la cuvintele întregi ce conţin paranteze pătrate.
      Este vorba, cumva, despre spaţiile din faţa şi de după paranteze?

      @jullien_alphonse
      Am rezolvat un sfert de problemă...
      În legătură cu eroarea care producea introducerea unei linii EmDash după indicele unei note de subsol; este vorba de indicele din textul normal şi nu de indicele din nota de subsol, aşa cum am înţeles eu iniţial.
      Am testat fiecare opţiune în parte şi am reuşit să descopăr care era opţiunea ce producea acest efect.
      Era vorba de dicţionarul CO_LinD.imd care făcea corecturi ale liniilor de dialog.

      Am eliminat înregistrările care puteau fi interpretate ca fiind coduri AutoCorect şi acum nu se mai produce introducerea liniuţei după indicele notei de subsol.
     
      Au mai rămas de rezolvat următoarele:
          - undeva [cred că la formatarea textului, poate în altă parte] o opţiune rulează eronat; am constata cazuri în care indicele din text [deci vorbim de acelaşi indice] se deplasează în text, poziţionându-se după cuvântul următor sau chiar la mijlocul unui cuvânt următor. Încerc să aflu ce opţiune produce acest efect.
          - încerc să aflu de ce înregistrările eliminate din dicţionar produceau efecte în interioarul unui paragraf, deşi ele erau setate să acţioneze numai la început de paragraf. Pentru asta am să fac teste cu fiecare înregistrare eliminată în mod separat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Uneori in loc de l sau de t apare paranteza patrata si AC-ul nu zice nimic de asta desi e un cuvant intreg:

patra] > patrat

Pe de alta parte textul a fost lucrat cu versiunile (deja) vechi de AC si dictionare, asa ca mai aman discutia asta pana la o noua prelucrare de text cu ce e pe piata acum.


pus acum 12 ani
   
gaddy
Membru Puf

Inregistrat: acum 12 ani
Buna seara.
As avea un sfat in ceea ce priveste rigla in autocorect si pagina. Ar fi ideal daca ati seta-o ca in Microsoft Word 2003. Adica in partea dreapta la 16 si pagina sa vina implict A4. Eu unul asa folosesc si cred ca toti folosesc pe sistemul A4 pagina. Vad ca vine implicit A5, este ciudat, cel putin pentru mine, ar fi bine sa vina implicit A4 la setarea paginii si rigla sa vina uniform exact ca in Microsoft Word 2003 in partea dreapta pe 16. Intelegeti voi. Va multumesc.

Modificat de gaddy (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cosmin,
      La Înlocuire multiplă, avem o problemă de interpretare la opţiunea de căutare "La început de paragraf".
      Este vorba tot de indicele care marchează nota de subsol [vorbim de indicele din textul normal şi nu de cel de la nota de subsol], despre care Jullien a făcut mai multe constatări.

      Dintr-un motiv necunoscut programul crede că indicele notă de subsol marchează sfârşit de paragraf şi că ceea ce urmează după acel indice este un paragraf nou.

      Faptul că programul insera un EmDash după indice avea două cauze:
             - prima cauză: o succesiune de semne şi anume ^_ era interpretată în mod corect ca fiind cod pentru spaţiu, iar modificarea era: ^_  >> EmDash. Am eliminat înregistrarea deşi era setată "la început de paragraf" deci ar fi trebuit să nu producă înlocuiri decât pentru spaţiu înainte de paragraf.
             - a două cauză: interpretarea de către program a faptului că indicele notei de subsol ar fi marcaj de sfârşit de paragraf.

      Încă nu am reuşit să stabilesc ce opţiunea poate produce deplasarea indicelui în text, constatare menţionată în postarea mea precedentă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
@utilitasetveritas acea problema s-a mai discutat.

@gaddy Cand AutoCorect incarca un text rtf setarile de pagina "inmagazinate" in acel rtf iau "controlul".
Atunci cand genereaza un document nou pagina e A4 nu A5. Cand incarca subtitrari pagina e A5 dar poate fi schimbat din Configurare.
OCR Plus schimba implicit in A5, da, dar poate fi schimbat din meniul OCR Plus >> Conversii preliminare >> Setare text si font la marime unica.
Daca tot consideri ca e vreo problema pe undeva te rog specifica mai detailat unde.

@Seven O sa fac cateva teste pentru a stabili de la ce vine problema.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Seven, am rezolvat problema.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
gaddy
Membru Puf

Inregistrat: acum 12 ani
Nu ca ar fi problema. Eu in general nu incarc in AutoCorect text-ul din .doc sau .rtf. Pur si simplu copiez textul cu mana din mana din document, nu incarc direct documentul, si de aceea ziceam ca ar fi mai bine sa fie asa in partea dreapta la 16 ca sa vina uniform pagina centrata frumos exact ca in MS Word 2003. Si da la subtitrare este A5. Ati vazut si voi documente care arata uniform, textul pe mijloc.

Modificat de gaddy (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Deci sa inteleg ca de fapt nu sunt probleme cu A4/A5...?
AutoCorect e facut in principal sa corecteze texte deja scrise, nu sa scrii documentul de la 0. Copierea intregului text cu Copy/Paste n-o recomand decat in situatii cand n-ai de ales ceea ce nu pare a fi si cazul tau. Pur si simplu salvezi in Word ca rtf si-l incarci in AutoCorect. S-ar putea sa dureze pina te obisnuiesti dar asta recomand.
In ce priveste setarea documentului nou sa arate exact ca in Word, nu intentionez sa fac totul exact ca la Word, desi stiu ca acesta e folosit de multi si s-au obisnuit cu modul cum functioneaza (cu setarile lui implicite de font si de pagina). Unul din motive e ca AutoCorect nu e doar o extensie (sau plugin extern) al Word-ului - desi poate unii gandesc asta - ci e un program de sine statator cu setarile lui proprii.
Dar o sa ma gandesc totusi la sugestia ta.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Atunci cand faci un copy/paste in AC, intr-un document nou, tipul de pagina finala e cel al documentului nou, nu al selectiei adaugate.
Salvati docurile ca rtf si apoi deschideti-le cu AC direct.
E stupid sa faci import de doc sau sa il muti cu copy/paste.
In privinta tipului de pagina folosit, nu e o problema. Setarile se schimba usor si sunt accesibile oricui.


pus acum 12 ani
   
gaddy
Membru Puf

Inregistrat: acum 12 ani
Asta am si incercat sa subliniez, asa cum ai spus si tu, ca foarte multi sunt obisnuiti cu MS Word 2003 sau 2010 cu acelasi font adica Times New Roman setat pe 12 implicit ( din fabrica cum s-ar zice ) la fel si cu pagina si rigla frumos centrata pe mijloc.

Modificat de gaddy (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Dupa cum am zis, setarile sunt accesibile oricui.

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Pe unde umbla ultima versiune de exe stabila?
Seven, nu poti sa o tii si pe ea pe Mediafire langa dictionare si restul?

Cosmin, te rog sa procedezi asemenea lui Seven, adauga data la numele arhivei cu executabilul. L-am luat de pe prima pagina, pe moment.

De asemenea, vezi ca in prima postare ai linkuri de dictionare. Ce e cu ele?

Intrebare... Folderul din Roaming contine si setarile AC-ului, cele pe care le face utilizatorul in meniuri?

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ultima versiune stabila de exe o gasesti intotdeauna in prima postare.
Cateodata scot si o versiune de test in ultimele postari. Alte exe nu tin ca n-are rost + acestea 2 au nume diferite asa ca nu vad rostul sa le pun data.
Cine urmareste acest topic oricum va sti ca a fost scos un exe nou.

Da, in prima postare e si linkul catre niste dictionare dar sunt mai vechi asa ca am sa schimb cu noul link care-l are Seven in semnatura. N-am stiut ca a schimbat folderul pe mediafire, am crezut ca a schimbat doar continutul.

Folderul din Roaming contine si setarile AutoCorect, da.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
OK. Dar cata vreme Seven foloseste semnatura pe post de "topic", nu cred ca are rost sa mai tii doctionarele si tu. Nu de alta, dar trebuie sa tii pasul cu Seven mereu.

Apropo, acel folder din roaming, pastreaza si setarile facute in OcrPlus, da?

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Apropo, acel folder din roaming, pastreaza si setarile facute in OcrPlus, da?


Da.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Uff!... şi Uraaa!...
      Uff... Am făcut zeci de testări la un text cu 87 de note de subsol şi după fiecare rulare am urmărit fiecare indice şi notă de subsol în parte.
      Am căutat foarte mult cauza unei ruperi de rând lângă un indice şi într-un final am descoperit că nota de subsil propriu zisă conţinea la sfârşitul explicaţiei un Enter, deci nota era formată din două paragrafe, din care cel de-al doilea paragraf era gol. După eliminarea acelui Enter din textul original, nu a mai apărut fenomenul ruperii de rând.
      A doua problemă după care am cotrobăit vreo 3 ore era fenomenul de mutare a indicelui notei de subsol după sau la mijlocul cuvântului următor. Am avut senzaţia că la un moment dat s-a întâmplat fenomenul şi cu ultimul executabil, dar reluând testele de cel puţin 20 de ori cu noul executabil fenomenul nu s-a repetat.

      Este clar că fenomenele neplăcute constatate anterioar au fost eliminate în totalitate. Deci, Uraaa!...

      Singurul dezavantaj este că am eliminat câteva înregistrări care modificau combinaţii ale liniilor de dialog cu câteva caractere, aşa că e posibil ca unele dintre aceste combinaţii să rămână în text şi trebuiască să fie corectate manual.

      Despre alte probleme ridicate între timp revin un pic mai târziu.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Felicitari
Si la mai mare!

Eu nu am avut probleme cu notele pana acum.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
@utilitasetveritas,
     În legătură cu apariţia parantezei ] în locul literei J mic...
     Am încercat să rezolv problema cu un dicţionar de înlocuire multiplă, dar am renunţat să fac unul, deoarece majoritatea cuvintelor cu frecvenţă mare sau medie care se termină cu litera "j" au şi forme corecte mai scurte, la care lipseşte acest "j".
     Iată câteva exemple de cuvinte terminate în "j": „abordaj, acroşaj, acuplaj, afişaj, ambreiaj, anturaj, apanaj, balotaj, betonaj, blindaj, blocaj, bobinaj, cablaj, cabraj, capotaj, debraiaj, decalaj, decapaj, demontaj, dopaj, dozaj, flambaj, flotaj, ghidaj, hidromasaj, instructaj, linşaj... etc.”
     Toate aceste cuvinte au şi forma fără "j", precum: „aborda, acroşa, acupla, afişa, ambreia, antura, apana, balota, betona, blinda, bloca, bobina, cabla, cabra, capota, debraia, decala, decapa, demonta, dopa, doza, flamba, flota, ghida, hidromasa, instructa, linşa”.
     Astfel de cuvinte ar putea să încheie nişte explicaţii cuprinse între paranteze drepte, deci scrierea cu ] ar fi corectă. Este adevărat că în beletristică parantezele drepte sunt foarte rare, dar nu sunt excluse; pe de altă parte e posibil ca utilizatorii să prelucreze şi alte genuri de cărţi. Pentru a face modificări corecte ar trebui să facem un dicţionar cu confirmare, dar acest dicţionar trebuie să fie unul suplimentar şi nu unul care rulează obligatoriu cu meniul OCR Plus.
     Dacă sunt multe astfel de cazuri şi trebuie neapărat corectate cu dicţionare, atunci voi încerca să fac adăugiri de astfel de modificări în dicţionatul "Uz_J.imd" care poate fi setat să ruleze la opţiunea 11.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cosmin, cred că mai avem o problemă pe la punctuaţie...
      E vorba despre ghilimele de tip «  »
      Am rulat un text în care aceste ghilimele sunt însoţite de spaţii ce ar trebui să dispară la rularea punctuaţiei, dar nu au dispărut, astfel că exemple ca « Allen Carr », « Metoda voinţei », « întreba », « hipnoterapeut »... au rămas neatinse.
      Poţi, te rog, să vezi despre ce e vorba?


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu trebuie rezolvata printr-un dictionar, ci printr-o atentionare de Ortografie.
Nu mai stiu in ce text erau, dar daca le gasesc o sa le postez aici.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

Seven a scris:

***
      Cosmin, cred că mai avem o problemă pe la punctuaţie...
      E vorba despre ghilimele de tip «  »
      Am rulat un text în care aceste ghilimele sunt însoţite de spaţii ce ar trebui să dispară la rularea punctuaţiei, dar nu au dispărut, astfel că exemple ca « Allen Carr », « Metoda voinţei », « întreba », « hipnoterapeut »... au rămas neatinse.
      Poţi, te rog, să vezi despre ce e vorba?


La mine a rezolvat cu ghilimelele franceze atat punctuatia obisnuita cat si cea de la OCR Plus.
Poti te rog sa-mi dai un exemplu de text in care nu o face + poate chiar sa-mi dai AutoCorect.ini (in caz ca e vorba de vreo setare care nu merge bine)?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
Da, le trimit pe mail.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Le-am primit, am testat si m-am lamurit despre ce e vorba: spatii neseparatoare, nu obisnuite. Cum intelesesem ca spatiiile neseparatoare nu se intalnesc intr-un OCR brut, n-am implementat in toate situatiile posibile (e deja la majoritatea oricum).
Acum le scoate la ghilimelele franceze.

Exe:


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Apropo... m-am lovit si eu de o problema asemanatoare.
Am convertit un pdf intr-un rtf si rulat OcrPlus pe el.
Toate Endash-urile aveau spatiu neseparator inainte si dupa. Cred ca ar fi bine daca s-a adauga o convertire automata din neseparator in separator undeva prin OcrPlus.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Este corect, nu cred că pot exista într-un OCR spaţii neseparatoare.
     Fişierul cu care am avut probleme a circulat pe net, formatat astfel, deci nu este un OCR.

     Am încercat să fac modificarea în Word şi e eliminat spaţiile dar a modificat şi ghilimelele în ghilimele româneşti.
     Am reuşit modificarea în AC cu un dicţionar de două înregistrări, dar pentru că am folosit Copy&Paste luând din Word ghilimelele împreună cu spaţiul de lângă ele, nu mi-am dar seama că e vorba de un altfel de spaţiu.
     N-am înţeles de ce nu se făcea modificarea şi la rularea punctuaţiei. Acum e clar.

     Mulţumesc pentru răspunsul prompt şi pentru noul executabil!
     Stimă şi respect!
     Seven

     LE: Am văzut mai târziu propunerea lui utilitasetveritas privind confirmarea spaţiilor...
     Cred că e o propunere bună. Ar rezolva eventuale probleme similare cu cea de la ghilimele.
     Mai cred că nu este nevoie să fie afişate în numele unei opţiuni, chiar toate lucrurile pe care le face acea opţiune... Ar putea foarte bine ca această convertire să fie implementată în opţiunea 1.3 care elimină spaţii multiple şi taburi.
     Nu cred că trebuie modificat numele opţiunii...
     Aş mai avea şi eu o convertire de "urcat" acolo. Mă tot gândesc de mult timp că ar fi mult mai simplu dacă convertirea în Elipsis ar fi făcută deja înainte de pachetul punctuaţie. E vorba doar de situaţia în care 3 puncte trec în Elipsis... restul rămâne aşa cum este acum.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cu placere.

Cum am spus majoritatea functiilor/optiunilor sunt deja setate sa lucreze si cu spatiu neseparator.
As putea sa le modific si pe restul dar intrebarea e daca exista si alt(e) motiv(e) pentru care acele spatii neseparatoare sa fie inlocuite cu spatii normale. Ca daca e vorba doar de functiile obisnuite n-ar fi mare nevoie; ma gandesc doar ca in cazurile asemanatoare celui mentionat de utilitasetveritas va dura foarte mult sa le inlocuiasca (mai ales la un document mare).

In ce priveste elipsis - deocamdata nu vad vreo problema...


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Spatiile neseparatoare exista doar dupa linia de dialog.
Dupa ceva timp de mixat si remixat carti pe aici, inca nu am auzit pe nimeni care sa le foloseasca la altceva.
Eu as prefera ca acea optiune sa existe, cea de convertire neseparator in separator, sa fie pusa undeva pe la inceput, ca mai apoi la urma sa fie adaugata de optiunea pentru linii de dialog.
Da, dureaza mult. De aceea prefer sa existe, dar pentru a nu cauza neplaceri altora, recomand sa fie debifata ca default.

Ce am patit eu si poate si Seven, se datoreaza unor documente ce nu provin dintr-un ocr clasic. Genul acesta de situatii apar la convertiri pdf>doc, epub>doc, etc. sau la anumite 0.9.9 ce plutesc pe aici si pe care suntem nevoiti sa rulam OcrPlus.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Practic noi am încercat să propunem opţiuni care sunt de folos pentru curăţarea OCR-urilor brute. La OCR nu are cum să existe spaţii separatoare; tehnic asta nu e posibil.
      Între timp am constatat că şi alte tipuri de documente ar trebui curăţate cu AC OCR Plus, dar "sărind" peste unele opţiuni cum ar fi "1.2 Setare text la font şi mărime unică", deoarece acele texte sunt deja formatate; probabil mai sunt şi alte opţiuni ce ar trebui dezactivate la astfel de texte...

      Aşa cum spune @utilitasetveritas, pe forum există multe variante de documente ce se vor a fi OCR-ul perfect, dar care abundă de erori ce se pot rezolva prin rularea în meniul OCR Plus. Astfel de versiuni, deşi au foarte multe erori nerezolvate prezintă anumite formatări, printre care acest spaţiu neseparator.

      Dacă în astfel de texte, spaţiul neseparator se află doar în poziţia după linia de dialog, atunci nicio opţiune nu va produce erori şi meniul va rula corect şi fără probleme. Dacă acest spaţiu neseparator apare şi în alte locuri, aşa cum a fost în cazul ghilimelelor franceze, atunci ele ar trebui să dispară şi să fie convertite în spaţiu obişnuit.

      Dacă această convertire este făcută în cadrul punctuaţiei, atunci nu ar mai trebui să apară implementată într-o opţiune nouă, care ar necesita un timp de rulare în plus.

      Probabil cel mai simplu ar fi să se verifice şi să se modifice dacă e cazul la punctuaţie, ca toate spaţiile care trebuiesc să rămână în text în faţa sau după semnele de punctuaţie să fie doar spaţii obişnuite. Cum, deja acest lucru este implementat în majoritatea cazurilor, ar fi mai simplu de făcut modificarea şi la celelalte.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
O precizare: la optiunile care au implementat spatiul neseparator nu face inlocuirea de spatiu neseparator cu normal ci doar le "vede" ca fiind acelasi lucru.
Exemplu: daca gaseste un spatiu dupa virgula, pentru acea optiune nu conteaza ca e normal sau neseparator, important e ca e un spatiu acolo.
Daca crezi ca trebuie schimbat ceva in aceasta "comportare" discutam...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Da, cred că trebuie să discutăm.
      Eu mă gândeam că setarea este ceva mai complexă, adică: dacă după virgulă găseşte sau nu un spaţiu, indiferent de care tip, ar rămâne după rularea punctuaţiei doar spaţiu obişnuit.
      Nu ştiu exact dacă ar fi mai bine să se întâmple aşa, pentru că sunt argumente şi pro şi contra.
      Trebuie ca în legătură cu chestia asta să fie postate mai multe păreri ale celor ce fac corectură şi care pot spune dacă au întâlnit sau nu probleme legate de aceste spaţii neseparatoare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       Am actualizat dicţionarele OCR_DIC în ambele variante [Contemporan şi Clasic]  la data de 04.05.2012
       Adresa este cea cunoscută: Dicţionare şi documentaţie AutoCorect OCR Plus:  Mediafire

       Deoarece am eliminat câteva înregistrări în dicţionarul care elimină artefacte şi în cel care face curăţarea liniilor de dialog, este posibil să mai apară  situaţii în în care liniile de dialog rămân necorectate.
       Cine descoperă astfel de situaţii sau altele, îl rog să le semnaleze pe topicul [AC]_Dicţionare Inlocuire Multipla


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am modificat executabilul astfel incat la punctuatia OCR Plus sa foloseasca doar spatii normale.
A fost testat de Seven si se pare ca nu sunt probleme.
Puteti sa-l descarcati din folderul lui Seven de pe mediafire >> Executabile OCR Plus.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani


      Folderul deschis de pe mediafire, numit: AC OCR Plus V5.0 - 2012
de la adresa   
conţine următoarele subfoldere şi tipuri de fişiere:
      1. Executabile OCR Plus – conţine executabile AutoCorect OCR Plus, actualizate la zi.
      2. OCR_DIC [Contemporan] – conţine pachetul de 32 dicţionare OCR_DIC actualizate pentru varianta Contemporan.
      3. OCR_DIC [Clasic] – conţine pachetul de 32 dicţionare OCR_DIC actualizate pentru varianta Clasic.
      4. Dictionare Suplimentare [UZUALE] – conţine dicţionare siplimentare ce pot fi rulate la opţiunea 11.
      5. Documentatie - Aprilie 2012 – va conţine documentaţie şi tutoriale referitoare la AutoCorect OCR Plus.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cosmin, la ce serveste butonul din imagine si cele 3 pozitii ale sale?

Seven, te rog sa adaugi si ultima versiune de exe Clasic, chiar daca ea nu a mai fost lucrata de ceva timp.



Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cu acel buton stabilesti unde sa fie alineatul (stanga, dreapta, centru).
Am adaugat exe AutoCorect Clasic in folder pe mediafire.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Un anunt important:
Din cauza unor probleme mari de sanatate + pentru ca sunt acu practic singur la AutoCorect (si deci trebuie sa lucrez dublu pentru acelasi rezultat), sunt nevoit sa ma restrang doar la a face "mentenanta de stricta necesitate".
Mai precis voi lucra doar la eliminarea erorilor mari si medii (din OCR Plus sau din alte "zone").

Imi pare rau ca nu va pot ajuta mai mult.

Daca va apare cineva cu cunostinte (cel putin medii) de programare in Delphi + care va demonstra ca e intr-adevar interesat de dezvoltarea AutoCorect, ii voi furniza mijloacele pentru asta.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Naspa
Sper sa iti revii, batrane.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ortografia e complet ignoranta in cazul:

1-am > l-am

Am schimbat numarul cu altul, rezultatul e acelasi.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, asa e.
Dar, atentie, AutoCorect e setat special sa ignore orice cuvant ce incepe cu cifra, nu ca le ignora din cauza unei erori.
Motivul: in texte (pe ansamblu, nu doar in OCR-uri) marea majoritate a situatiilor in care un cuvant incepe cu o cifra sunt la indicative si mai ales numar + unitate de masura lipite. De exemplu "12Km" in loc de "12 Km".
Ar fi generat prea multe alarme false in comparatie cu destul de putinele atentionari bune deci pe ansamblu ar fi mai bine daca ar fi ignorate.
Ca o paranteza, si alte variante de Office le ignora, inclusiv cel de la MS - deci au ajuns la aceeasi concluzie.

Intre timp am mai gasit totusi ceva energie si timp si am implementat deja jumatate din modificarile recente din exe Contemporan si la versiunea Clasic.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Vrei sa mai continui cu acele dictionare sau le pastrez doar pentru mine? Cele cu cuvintele lipsa.

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Apreciez faptul ca incerci sa ajuti cu aceste dictionare dar problema e ca, ca si la carti, e nevoie de mai multi care sa verifice fiecare cuvant din aceste dictionare - inainte de a fi adaugate la dictionarele obisnuite - pentru a se elimina orice greseala.
Ca sa fac o analogie cu corectarea cartilor - adaugam aceste cuvinte numai daca-s de "versiune" >= 3.
Pana acum eu si Dan la verificam si rezultatul era bun dar acum ca-s singur va fi doar "versiune" 2 dupa ce le voi verifica si deci de calitate mai slaba.
Pe de alta parte aceasta verificare nu e chiar usoara - tinand cont si de problemele mele medicale.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Tot nu pot fi de acord cu functia ce transforma:

A venit vara - dar foarte repede! - si au aparut florile.

in

A venit vara - dar foarte repede! - Si au aparut florile.

Producand o atentionare cum ca il loc de linie de pauza ar fi necesara o linie de dialog.


Ar fi mai bine ca aceasta situatie sa fie semnalata ca posibil dialog si atat. Iar daca chiar este o sa se puna de utilizator si litera mare si EMDash.
Alminteri o sa trebuiasca sa modifice din urma programului.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Seven, Cosmin, am o rugaminte/intrebare pentru voi:

- cat de ok este sa se ruleze dictionarele de inlocuire multipla pe un text ajuns la 2.0 dar care a beneficiat doar de corectura vizuala, in felul acesta ramanand in urma mai multe situatii de genul Iui > lui, chestii de astea mai putin vizibile...

- daca nu e ok sa se ruleze dictionarele OCR, se poate face un dictionar care sa fie rulat pe textele aranjate deja si care sa se ocupe de situatiile de genul asta?

- care e diferenta dintre Autocorect Clasic si Contemporan? O sa incep o serie de carti scrise prin 1980. Le voi trece pe grafia noua, dar voi pastra cuvintele scrise gresit, conform standardelor noastre actuale.
Seven, tu ai avut experiente de genul asta, cum te-ai descurcat? In afara de un dictionar personalizat pe masura ce parcurgi textul, ce mai recomanzi?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     1. În primul rând, problema cu majuscularea după linia de pauză din exemplul:
     "A venit vara - dar foarte repede! - Si au aparut florile."
nu mai apare la ultimul executabil, dacă la Setări Opţiuni Punctuaţie OCR se bifează în tab 3 - Majuscule, opţiunile 1,3 şi 5, adică:
     Majusculă la început de dialog (inclusiv dialog cu ghilimele).
     Majusculă început paragraf – [numai paragraf întreg]
     Majusculă la început de frază – doar după punct urmat de spaţiu.

     Rulare text corectat prin citire.
     A trebuit să fac câteva corecţii de genul ăsta asupra unor texte deja corectate şi se pot rula fără afectarea corecturii câteva opţiuni, astfel:

1. Conversii preliminare
        1.1 Conversie dialog bullets în dialog text
        1.2 = NU
        1.3 Eliminare tab şi spaţii multiple
        1.4 Eliminare spaţii la început de paragraf
        1.5 = NU
        1.6 = NU

2. Punctuaţie
        2.1 = NU
        2.2 Corectare linii de pauză şi linii de dialog
        2.3 Funcţii obişnuite
        2.4 Corectare suplimentară elipsis
        2.5 = NU

3. Conversie text clasic în text contemporan = NU

4. Corectare caractere reproduse eronat = NU

5. Marcare caractere = NU

6. Ştergere caractere = NU

        7.2 Înlocuieşte toate liniile de pauză cu: >> EnDash [sau altă variantă: 7.1 / 7.3]

        8.1 Înlocuieşte toate liniile de dialog cu >> EmDash [sau altă variantă: 8.2 / 8.3]

9. Eliminare linii de pauză exclusiv din Dialoguri = NU

10. Elimină TOATE liniile de pauză din text = NU

11. Rulare grup de dicţionare înlocuire multiplă = NU

12. Setări finale
        12.1 Înlocuire spaţiu după linia de dialog cu spaţiu neseparator
        12.2 = NU

     NOTĂ: Pentru eliminarea eventualelor erori rămase la corectura vizuală
               cifra 1 >> L mic,  cifra 0 >> O/o
               Iui, Ie, Ia >> lui, le, la
               sting, lingă, mina, miner, dinţii >> stâng, lângă, mâna, mâner, dintâi
               Cu, Se, Pe, Şi, Un... >> cu, se, pe, si, un - arunci când sunt în interiorul propoziţiei
propun rularea unui dicţionar special, care să aibă toate înregistrările cu confirmare.
     Deşi rularea ar consuma ceva timp pentru confirmări, ea are avantajul că nu va realiza modificări nedorite.
     Nu am realizat încă un astfel de dicţionar; deocamdată eu am rulat separat dicţionarul CO_Var4.imd, dar cred că trebuie realizat unul special, ceva mai complex, care să conţină şi alte înregistrări în plus.


      Despre corectură ortografie 1880, discuţia este mai amplă...
      În perioada respectivă a existat un sistem de scriere de tranziţie... şi unul deja "modern", care folosea doar caractere latine folosite în limba română actuală.
      În limbajul de tranziţie erau folosite mai multe semne [î, â, ę, ô] pentru sunetul î, sunetul z era reprezentat printr-un d cu sedila, dar şi prin z, în locul cratimei este folosit dialogul... etc... etc...
      Am ceva dicţionare pe care le-am folosit, dar va trebui să le analizezi înainte de a le folosi.
      Am folosit şi pentru cărţi ante sau interbelice doar varianta Contemporan. Dicţionarele suplimentare [uzuale] nu sunt valabile pentru varianta Clasic, ci doar pentru Contemporan.

      LE:
      Scuze... nu am văzut bine... am crezut că e vorba de cărţi tipărite în 1880, dar erau în 1980.
      Păi singura modificare pe care o face convertirea Clasic > Contemporan asupra cuvintelor este nici o > nicio şi nici un > niciun; toate celelalte cuvinte rămân exact ca înainte doar că sunt scrise cu â în interiorul cuvintelor, în loc de î şi, bineînţeles cu sunt, suntem, sunteţi.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
La naiba sa le ia de executabile. Iarasi sunt cu unul in urma.

Discutia cu corectura ortografiei 1980, o las asa. Sa vad cu ce ma confrunt, totul e la nivel de scan pe moment.

Cu dictionarul special pentru o simpla pre-corectura ortografica a textului, fara a fi afectata formatarea sau alte caracteristici, o sa incerc sa il fac, desi nu prea stiu de unde sa incep. O sa iau cazurile enumerate de tine totusi

Setul ala de optiuni propuse de tine pentru debifare/bifare, nu prea ma ajuta pentru ca trebuie sa bifez/debifez totul mereu in functie de ce vreau sa fac. O sa il pun deoparte totusi pentru a vedea cum functioneaza pe texte.

Merci de raspuns.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Nu cred că nu ai ultimul executabil, ci că ai făcut rularea mai demult... O problemă de genul ăsta ai mai ridicat şi deja era rezolvată şi atunci.
     
      Opţiunile pe care le-am enumerat pot fi rulate separat, fără a mai face o rulare automată... În fond este vorba de 9 comenzi care nu fac modificări asupra literelor şi cuvintelor, ci numai asupra spaţiilor, liniilor şi punctuaţiei... în plus dicţionarul cu confirmare.
      Nu trebuie să faci tu acum un dicţionar, ci doar să rulezi dicţionarul CO_Var4.imd, direct din meniul Editare --> Înlocuire multiplă...
      Dicţionarul rulează foarte bine şi acum, doar că mai trebuie adăugate câteva înregistrări în plus, dat fiind faptul că unele corecturi se fac cu alte dicţionare.

      Uite am făcut unul separat, dar va trebui să mai adaug şi alte civinte ce vor fi propuse.
      Dic_cu_confirmare.imd
     

      Discuţia cu ortografia 1980...
      Nu e nicio problemă cu această perioadă.
      Toate opţiunile din meniul OCR Plus sunt gândite exact pentru astfel de cărţi, care sunt scrise cu î din i; Singura modificare este scrierea cu â din a, fără a afecta modul de scriere a cuvintelor; deci corecte au fost - corecte rămân, greşit au fost scrise - greşit rămân.
      Marele avantaj este că folosind limbajul contemporan este mult mai uşor de corectat în Word, dacă folosim corectorul de limba română. Dacă în Word am folosi limbajul Clasic, corectorul de limba română nu mai foloseşte la nimic, şi atunci utilizatorul nu va putea beneficia de un foarte mare ajutor.

      În plus... cine vrea şi insistă să aibă un text final scris ca acum 20 de ani [deşi nu am înţeles niciodată motivul pentru care se doreşte această chestie], la finalul corecturii are de făcut 5 modificări cu Find&Replace: [â >> î] şi [Â >> Î], şi în plus [sunt >> sînt], [suntem >> sîntem] şi [sunteţi >> sînteţi]... asta e tot.
      Din Clasic în Contemporan este ceva mai complicat, dar fiind modul de scriere al cuvintelor compuse, dar din Contemporan în Clasic... nimic mai simplu.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
OK. O sa folosesc dictionarul incropit de tine si tinem legatura cu eventualele adaugiri sau eliminari.
Merci din nou.

Apropo, asta se intampla la rularea OCR+:

A venit vara – dar foarte repede! — și au aparut florile.

Asta se intampla la rularea punctuatiei normale:

A venit vara – dar foarte repede! - Si au aparut florile.

Ori ca imi baga un EMdash, ori ca imi face litera mare dupa cratima sau Emdash, in ambele cazuri necesita o corectura manuala. Ar fi mai elegant de adaugat ca avertizare "Posibil Dialog" si lasat userul sa ignore sau sa modifice textul.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am finalizat implementarea ultimelor modificari si in versiunea clasica.
Exe:

Am mai corectat cateva mici probleme si la versiunea contemporana (le-am observat cand am trecut codul in clasic).
Exe:


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Sanchiu 

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Seven, ce zici de aceste adaugiri la dictionarul pentru texte formatate?


Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Exista in AC posibilitatea inlocuirii folosind ^p?
Am incercat ieri si nu a mers.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Nu se poate folosi codul ^p pentru că nu este implementat.
     Toate codurile implementate se afişează la acţionarea butonului "caractere soeciale".

     Pentru început de paragraf, dar şi pentru sfârşit de paragraf există două opţiuni speciale în fereastra de înlocuire multiplă.
     Dacă vom face o înlocuire de tip î >> Î cu condiţia la început de paragraf + potrivire perfectă, va majuscula litera î doar la început de paragraf.
     Dacă vom face o înlocuire de genul "spaţiu" >> "înregistrare vidă" cu condiţia sfârşit de paragraf, atunci vor fi şterse toate spaţiile care se găsesc după sfârşitul unui paragraf.



Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Auzi, dar ce nebunie de fereastra mai e si aia?
Mie nu imi apare asa. E cea care apare cu Ctrl+F?

A... gata.... Inocuite Multipla, sageata aia mica.

Deci ca sa inlocuiesc cratima si spatiul de la inceput de paragraf, cu emdash si neseparator, ar trebui sa fac ce?

Hop, gata si cu asta.
E cam aiurea ca trebuie salvat in dictionar, dar merge si asa. Nu ar strica totusi si optiunea de a rula direct din fereastra de adaugare a termenului de inlocuit si a celui de inlocuire.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
gaddy
Membru Puf

Inregistrat: acum 12 ani
La copierea textului in cliboard din Monitorizare Cliboard, am sesizat foarte multe erori de corectie diacriticelor la vuinte. Chiar am fost surprins ca nu a stiut sa corecteze automat o propozite simpla. Deci trebuie reparata/remediata acaesta probleme pentru o corectie cat mai buna a frazelor. Eu unul am sa mai fac teste in limita timpului disponibil si revin cu exemplele. Sper sa fie remediate aceste probleme de corectie si la monitorizarea cliboard-ului. Am un prim exemplu "Încercaţi să ajutaţi uşerii sau uşerul care vor să instaleze Windowsul" - Dupa cum vedeti a corectat "uşer" si "uşeri".

Modificat de gaddy (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Vrei diacritice corecte. foloseste adaugarea manuala de diacritice.

Bifeaza:
- confirmare cu inlocuire.
- la orice schimbare.

sau macar la variantele incerte.

Automat o sa produca greseli multe asa cum e si normal.
Daca nu intelegi de ce, cauta in dictionar "uşer" si vezi daca e gresit sau nu.


pus acum 12 ani
   
gaddy
Membru Puf

Inregistrat: acum 12 ani

utilitasetveritas a scris:

Vrei diacritice corecte. foloseste adaugarea manuala de diacritice.

Bifeaza:
- confirmare cu inlocuire.
- la orice schimbare.

sau macar la variantele incerte.

Automat o sa produca greseli multe asa cum e si normal.
Daca nu intelegi de ce, cauta in dictionar "uşer" si vezi daca e gresit sau nu.

In primul rand ceea ce mi-ai spus tu nu exista la Monitorizare Clipoard cu confirmarea la inlocuire. Iar AutoCorect trebuie sa faca distinctia intre "uşer" si "user" in functie de context de fraza, nu e logic?

Modificat de gaddy (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu, nu e logic, pentru ca AC-ul e program si tu nu.

Lasa Clipboard-ul, nu te ajuta la ce vrei tu. Asa ca nu il mai activa.

Da un copy/paste in AC, iar apoi foloseste functia de diacrtitice cu confirmare la toate inlocuirile.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Scuze ca n-am mai raspuns de ceva timp dar am fost plecat din oras pentru cateva zile.
Referitor la problema cu "userul": acesta e un neologism introdus recent in limba romana. De fapt corect in acea fraza este sa se scrie "utilizator".
Adaugarea de diacritice din AutoCorect e facuta pentru limba romana obisnuita, la care pe ansamblu se atinge 85..95% acuratete pe automat (depinzand de tipul textului). Nu se poate mai mult din diverse motive obiective pe care niciun program de acest fel nu le-a rezolvat pina acum (si nici nu sunt perspective ca se vor rezolva). Daca e interesat cineva am sa le expun.
Pe texte in care se introduc astfel de neologisme nou aparute sau chiar direct cuvinte din alte limbi evident procentul de acuratete va scade.
O rezolvare e cea data de utilitasetveritas.
O alta ar fi sa dai tot copy/paste, rulezi pe automat si pe urma iti faci un mic dictionar de inlocuire multipla cu care sa treci din nou uşer in user (precum si alte cuvinte intalnite mai des). In acest fel adaptezi modificarile facute de AutoCorect la acel tip de text. Rarele probleme care raman pot fi rezolvate mai usor la editarea manuala care se face de obicei ulterior.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
O alta inlocuire cu confirmare, potrivire perfecta, inceput de paragraf:

-... > Emdash... sau punctele alea dintr-o bucata.

Sunt si dialoguri ce incep cu puncte de suspensie.

Seven, as vrea sa inlocuiesc cu confirmare "-1"
E vorba de cuvinte de genul, prinzandu-1 > prinzandu-l sau 1-am > l-am
Nu cred ca are rost sa fac o lista de cuvinte, cred ca e mai simplu sa ma axez doar pe "-1" sau "1-".

Dar in afara de confirmarea la inlocuire, ce alte conditii ar trebui sa mai pun? Mai ales la margini.

camea > carnea


Si o ciudatenie aparuta la editarea dictionarului.

iţi > îţi

Inlocuirea are loc, am ales cuvant intreg, confirmare inlocuire si pastreaza capitalizare. Dar cand execut dictionarul, inlocuirea se face automat fara confirmare.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Îmi cer scuze!... Sunt foarte ocupat până pe 22-23... de aceea nu am răspuns.
      Câteva răspunsuri scurte, referitoare la lista de înlocuiri pe care mi-ai trimis-o:
           - Există deja în dicţionarul CO_Midp.imd, înlocuirile:
                  152    Incă    Încă    Ci  Pp  Pi   
                  632    Işi    Îşi       Ci  Pp  Pi   
                  633    Iţi    Îţi       Ci  Pp  Pi   
de aceea se făceau înlocuirile fără confirmare.

           - Există deja în dicţionarul CO_Var4.imd, înlocuirile care se referă la -1, 1-, -0, 0-:
                  ^l 0 ^l    o    Pp  Cli  Ima  In2   
                  , 0 ^l    o    Pp  Cli  Ima  In2   
                  ^l—1    -l    Ci  Sc  Pp  Ims  In1   
                  ^l-1    -l    Ci  Sc  Pp  Ims  In1   
                  ^l—0    -o    Ci  Sc  Pp  Ims  In1   
                  ^l-0    -o    Ci  Sc  Pp  Ims  In1   
      Condiţiile puse aici pentru fiecare înregistrare în parte sunt ca cifra 1 [respectiv cifra 0] să fie legată cu cratimă numai de litere mici, ca să se evită căutări de genul 1330-1331; 
      În principiu la ora asta AutoCorect, prin intermediul dicţionarelor CO_L1.imd - CO_L3.imd plus cele de mai sus, ar trebui să rezolve absolut toate situaţiile legate de cifra 1 > L mic şi 0 > o/O.

           - Exista înregistrat în dicţionarele Uzuale: adăugindu-se > adăugându-se în forma adăugind > adăugând - cu condiţia început de cuvânt

           - Am mai înregistrat în dicţionarele Uzuale:
      cetii > ceții, într-unui > într-unul, scârțiit > scârțâit

           - O serie de cuvinte trebuie înregistrate numai "Cu confirmare" pentru că ambele cuvinte există în limba română. Este vorba de: pomi > porni, venin > venim, langa > lânga, rase > râse, puțind > putând, vâri > vârî, fată > față, importantă > importanță, țarină > țărână, frecventă > frecvență, maturase > măturase

           - A existat, dar am renunţat la înlocuirea II > Îl, deoarece se modifică numărul celui de-al doilea capitol, care , de regulă este scris cu cifre romane, deci II şi nu cu cifre arabe.

      Cred că m-am referit la majoritatea cuvintelor propuse... mai multe discuţii... după 23 iunie.
      Toate cele bune!

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Mmm... ok, dar legat de problema cu confirmarea.
Eu foloseam un dictionar propriu in care adaugasem acea inregistrare acum si nu mai foloseam alte dictionare.

Discutia se refera la acel dictionar de inlocuiri cu confirmare care sa nu afecteze formatarea textului.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 17 ani
Autocorectul SCHIMBA secventele:

a.m. (antemeridian) si p.m. (postmeridian)
------------------------------------------------------------- CU:
a.în.                           p.în.

Va rog sa aveti in vedere PASTRAREA (corecta si NEMODIFICATA) a secventelor
corespunzatoare.

Modificat de jullien_alphonse (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mulţumesc, Jullien!
     Am găsit problema pentru a.m. > a.în şi p.m > p.în.

     În dicţionarul CO_Sc1.imd [CL_Sc1.imd], la poziţia nr. 100 există următoarea înregistrare:
            m  >>  în    Ci    Pp
     Atunci când am făcut înregistrarea nu am luat în calcul că un "m" între două puncte va fi considerat cuvânt întreg, deşi este normal să fie aşa.

     Rezolvare: am modificat înregistrarea astfel:
         în loc de înregistrarea:      m  >>  în    Ci    Pp
         am modificat-o în forma:    ^_m^_  >>  ^_în^_    Pp
unde ^_ înseamnă spaţiu obişnuit; deci vom pune "m" şi "în" între spaţii; renunţăm la condiţia "cuvânt întreg", care nu-şi mai are sens.


      LE: În jurul datei de 1 iulie, voi urca o variantă îmbunătăţită a tuturor dicţionarelor.
            Orice propunere de modificare a unor înregistrări, ori de adăugare de noi înregistrări automate sau cu confirmare este binevenită.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cosmin, se poate obtine o formatare unitara a notelor de subsol sau o extragere  a lor si adaugata direct in text?

pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Bun program.

Modificat de meridiane (acum 12 ani)


pus acum 12 ani
   
gaddy
Membru Puf

Inregistrat: acum 12 ani
Inca ceva, Nu se poate adauga unde ne alegem textul sa putem avea si marimea 13,15 sau 12,5 13,5. Sunt doar 8,10,12,14 etc numere pare. Numele impare nu sunt. La Microsoft Word se poate pune si 12,5 13,5, 14,5 etc. Intelegeti ce vreau sa spun. Sau macar daca nu numere impare sa fie si cu virgule.

Modificat de gaddy (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cosmin, Autocorectul poate salva un rtf ca html?

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
gaddy, in lista sunt valorile standard pentru fonturi TTF. Se pot introduce si cele impare prin editare directa in casuta.
In ce priveste marime fonturi cu virgula, din pacate e o limitare in componentele de Delphi folosite de AutoCorect - ce nu depinde direct de mine.


pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Seven,

ş.a.m.d. este schimbat în ş.a.în.d., apoi după rulare dictionare devine ş.a. În.d.

Îmi rămân cuvinte cu ultima litera â. Ce trebuie rulat?

Modificat de meridiane (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
meridiane,
      În legătură cu transformarea lui m >> în, a mai fost semnalată de Jullien şi am o postare pe această pagină cu vreo 7-8 postări mai sus [postarea din 12-06-2012 14:22:00], în care am arătat că eroarea provine de la înregistrarea nr. 100 din dicţionarul CO_Sc1.imd [CL_Sc1.imd].
      Aş vrea să te rog să faci modificarea de acolo şi să-mi spui dacă persistă erorile.


      În legătură cu litera finală â... încă nu-mi dau seama de unde apare eroarea...
      Am constatat şi eu ceva... şi lucrez la o rezolvare, dar sunt erori de genul ce-î, care-î, să-î... deci cu <î> în loc de <i>...

      Despre â final?... nu am găsit până acum aşa ceva şi nu ştiu de unde apare aşa ceva... am totuşi o rugăminte: poţi să te uiţi în textul nerulat prin AC, deci într-un OCR brut şi să vezi dacă există şi acolo acest â final?
      Trebuie să stabilim dacă o vorba de o eroare AC sau o eroare de recunoaştere a lui Abbyy [dacă e eroare Abbyy, atunci litera corectă ar trebui să fie ă şi uneori a] şi este mult mai simplu de rezolvat.
      Am să te rog să-mi trimiţi şi un text cu astfel de situaţii, ca să pot să selecţionez cuvintele ce trebuie corectate.
     
      Încerc să mă ţin de cuvânt şi să urc o nouă versiune de dicţionare îmbunătăţite până la sfârşitul lunii.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Tinand cont de munca titanica pe care o faci, noi iti tinem pumnii!

pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani

Seven a scris:

Trebuie să stabilim dacă o vorba de o eroare AC sau o eroare de recunoaştere a lui Abbyy [dacă e eroare Abbyy, atunci litera corectă ar trebui să fie ă şi uneori a] şi este mult mai simplu de rezolvat.


Cuvântul este coborî, corect gramatical.
Este un î final.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am înţeles. Nu este o eroare AC, ci o eroare Abbyy.
      Cel mai simplu e să adaug o înregistrare cu confirmare de genul:
      â  >> î  - Cuvânt întreg la sfârşit + Confirmare [ Ci Sc Cli ]

      Revin în câteva minute şi urc ultima variantă a dicţionarului CO_Var4.imd...

      Gata: am pus ultima variantă a dicţionarului cu confirmări care rulează automat la 12.2.
      Nume arhivă:  [2012.06.21] CO_Var4.rar
      Adresa fişier:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cosmin, am nevoie de dictionarele din AutoCorect Clasic, in format text.

Vreau sa le folosesc impreuna cu Abby 9 deoarece imi semnaleaza zeci de erori pe pagina din cauza grafiei vechi.
E suficient sa le schimb extensia?


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Cosmin, am nevoie de dictionarele din AutoCorect Clasic, in format text.

Vreau sa le folosesc impreuna cu Abby 9 deoarece imi semnaleaza zeci de erori pe pagina din cauza grafiei vechi.
E suficient sa le schimb extensia?


Mai exact despre care dictionare vorbesti, ca AutoCorect are multe...?

PS: sa inteleg ca vrei sa folosesti dictionarul de ortografie din Clasic in Contemporan..?

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Da, cel de ortografie.
Abby 9 salveaza dictionarele intr-un text:

DICTIONARY_PROPERTIES=USE_CONFIDENCE
atat 100
bătrîni 100
c-am 100
Ce-o 100
d-tale 100
fetiţa-i 100
gheboşită 100
gîndurile 100
gînguritul 100
Iehova 100
mănînci 100
mîine 100


Dar vad ca e o problema cu textul, fiecare cuvant e urmat de 100.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Pai nu te sfatuiesc sa faci asta, din 2 motive:
1. dictionarele de ortografie din folderul AC nu sunt in format text;
2. Intern ortografia la fiecare AC lucreaza diferit, adaptata fiecare la dictionarul propriu.
Sfatul meu e sa folosesti AC Clasic pentru ortografie daca ai un text in format clasic...


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ei, in cazul asta o sa trebuiasca sa adaug vreo cateva sute de cuvinte in Abby
Fac corectura initiala in Abby, AC-ul il rulez dupa.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Dictionarul de ortografie din AutoCorect are peste 1 milion de cuvinte. L-as putea transforma in text (poate chiar in acel format cu 100) dar sunt curios daca Abby rezista sa bagi peste un milion de cuvinte in el...

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ar fi interesant de aflat
Dar cred ca e prea mult de munca, doar de dragul unei incercari.

Auzi, dar AC-ul cum rezista la un asemenea dictionar?

Astept o opinie mai calificata din partea lui Seven.
Stiu ca el a folosit destul de des dictionarele de Abby... sau poate gresesc.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Salutare!

     Şi da şi ba...
     Pattern-urile de care m-am ocupat, le-am numit "dicţionare", dar ele sunt altceva; acestea nu cuprind cuvinte, ci o corespondenţă între imagini ale unor caractere şi codul lor grafic... în sfârşit e altceva.

     Datorită curiozităţii tale excesive şi un pic contagioase, m-a prins şi pe mine curiozitatea şi m-am apucat de cotrobăit prin Abbyy... cred că am găsit drumul bun spre realizarea dicţionarului care să funcţioneze în Abbyy... doar că trebuie lucrat în echipă...

     Fiind vorba despre Abbyy, am să încerc să mut postările din acest topic care se referă la Abbyy în topicul Abbyy 9 vs, Abbyy 11 şi acolo am să postez ceea ce am descoperit până în acest moment.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Ar fi interesant de aflat
Dar cred ca e prea mult de munca, doar de dragul unei incercari.


E mediu de lucru, doar sa stiu formatul exact in care sa-l transform.
S-ar merita daca v-ar ajuta intr-adevar.
Pentru asta as putea trece peste problemele mele medicale si sa va ajut.


utilitasetveritas a scris:

Auzi, dar AC-ul cum rezista la un asemenea dictionar?


Tocmai pentru ca dictionarul nu e text, e incarcat si stocat in RAM intr-o "bucata" nu cuvant cu cuvant... Asta reduce timpul de incarcare si memoria alocata. Plus ca formatul lui intern e optimizat pentru accesare si cautare de cuvinte.


pus acum 12 ani
   
gaddy
Membru Puf

Inregistrat: acum 12 ani
Si pana la urma cand scoateti versiunea 5 pe site? Cea oficiala? Mai dureaza mult?

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Probabil atunci cand o sa aiba ceva de schimbat la cea actuala.

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
@gaddy Sunt singur acu la AutoCorect.
N-am scos versiunea oficiala din 2 motive:
1. N-am rezolvat inca o problema la ortografie (mentionata aici pe forum acu ceva timp) - pentru ca n-am gasit inca o solutie din lipsa de energie si timp + pentru ca e "spinoasa";
2. Acum ceva timp cand i-am spus lui Seven despre scoatere ca versiune oficiala, mi-a spus ca mai are nevoie de timp pentru a mai "cizela" dictionarele.

Cand se vor rezolva ambele, voi scoate si versiune oficiala.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ce problema spinoasa?

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cu anumite texte (nu carti), textul din fereastra de ortografie se desincronizeaza. Problema a aparut cand am marit viteza functiei. A fost detectata mai tarziu de Daniel.

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
A.... da, am intalnit-o si eu.

Desi parca de 6 luni inca, sa zicem, nu cred ca a mai aparut.


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Aha... deci am o oarecare problema legata de modul de functionare a inlocuirii multiple.

Daca salvez cateva inregistrari, fara sa le salvez ca dictionar separat, cand redeschid programul, ele tot acolo sunt.

Daca deschid un dictionar, ce a fost salvat separat, imi fac treaba si inchid. La redeschidere, iarasi o sa am acel dictionar incarcat in Inlocuiri. Daca fac prostia sa le sterg din meniu, constat ca s-au sters si din dictionar.

La fiecare deschidere de program meniul de Inlocuiri Multiple ar trebui sa fie gol.

Atunci cand din meniul de inlocuiri se sterg toate inregistrarile, aceasta actiune sa nu afecteze si dictionarul care a fost salvat separat de utilizator.

Inlocuirile ce nu sunt salvate de utilizator sa fie puse intr-un fisier temporar din AC.
Atunci cand utilizatorul incarca un dictionar propriu, acele inregistrari sa fie transferate in acel fisier temporar si numai DACA utilizatorul alege sa salveze dictionarul (atentie, dictionarul, nu inregistrarea) sa fie modificat si dictionarul propriu-zis.


P.S.
Totusi, cu AC-ul fara text incarcat, vad ca nu se mai comporta asa. Posibil sa fi fost ceva in neregula la mine.

Ramane problema cu stergere inregistrari > stergere efectiva dictionar.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     De fapt nu ai o problemă...
     Dacă salvezi câteva înregistrări fără să salvezi cu un nume de dicţionar, în realitate salvezi acele înregistrări în dicţionarul "implicit.imd".
     Un dicţionar îşi salvează înregistrările dacă îl dai comanda de rulare prin apăsarea butonului "Execută" sau dacă ieşi din fereastra de editare a dicţionarului prin apăsarea butonului "X" din stânga sus.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cum se pot uni 2 sau mai multe dictionare diferite?

Ce se intampla daca, dupa unire, 2 sau mai multe dintre ele, contin inlocuiri identice?

Am  3 dictionare ce le vreau comasate.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      În dicţionarul din care dorim să copiem înregistrările:
           - se selectează înregistrările pe care dorim să le copiem;
           - click dreapta şi alegem Copiere sau folosim combinaţia Ctrl-C;
      Deschidem dicţionarul în care dorim să copiem înregistrările, apoi
           - facem click pe înregistrarea SUB CARE dorim să adăugăm înregistrările;
           - facem click dreapta şi alegem Lipire sau folosim combinaţia Ctrl-V.
      Putem folosi butonul "Sortează" pentru a indexa înregistrările în ordine alfabetică [şi apoi să ştergem înregistrările duble]
           - obligatoriu folosim bitonul "Execută" pentru a salva dicţionarul în noua formă.


      Cu puţin antrenament înregistrările dintr-un dicţionar de înlocuire multiplă pot fi mutate şi prelucrate în/din WordPad, alte editoare de text şi chiar în foaie de calcul de tip Excel.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     
     Am urcat la adresa cunoscută Dicţionare actualizate, astfel.
         OCR_DIC Contemporan - reactualizare 01.07.2012
         Dicţionare Suplimentare Uzuale - reactualizare 01.07.2012


     NOTĂ: pentru că este ceva mai mult de lucru la verificarea şi reactualizarea dicţionarelor OCR_DIC Clasic, acestea vor fi postate în zilele următoare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani

Seven a scris:

***
      În dicţionarul din care dorim să copiem înregistrările:
           - se selectează înregistrările pe care dorim să le copiem;
           - click dreapta şi alegem Copiere sau folosim combinaţia Ctrl-C;
      Deschidem dicţionarul în care dorim să copiem înregistrările, apoi
           - facem click pe înregistrarea SUB CARE dorim să adăugăm înregistrările;
           - facem click dreapta şi alegem Lipire sau folosim combinaţia Ctrl-V.
      Putem folosi butonul "Sortează" pentru a indexa înregistrările în ordine alfabetică [şi apoi să ştergem înregistrările duble]
           - obligatoriu folosim bitonul "Execută" pentru a salva dicţionarul în noua formă.


      Cu puţin antrenament înregistrările dintr-un dicţionar de înlocuire multiplă pot fi mutate şi prelucrate în/din WordPad, alte editoare de text şi chiar în foaie de calcul de tip Excel.

Sau setezi AC-ul sa permita instante multiple. Deschizi 2 instante de AC.
Intr-unul deschizi dictionarul implicit, in al doilea deschizi, pe rand, dictionarele a caror continut doresti sa il muti. Copy/paste din AC2 in AC1.


Nu sunt in cea mai buna forma pentru discutii de gen, dar...

Cum trebuie definita urmatoarea inregistrare din inlocuiri multiple?

ansamblat > asamblat

Daca ii dau Cuvant Intreg, imi cauta doar forma de sus+Capitalizare dupa caz.
Daca ii dau Potrivire Perfecta, imi cauta numai si numai forma de sus scrisa cu minuscule.
Daca vreau ca inlocuirea sa cuprinda si termenii: ansamblata, ansamblase, ansamblasera, etc. scrise cu litere mari sau mici, trebuie sa bifez ce? Doar confirmarea la inlocuire? Si daca da, cum pot face sa pastrez majusculele sau minusculele cuvantului original? Cele de inceput de rand, de exemplu.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Înlocuire:  ansambl > asambl
     Condiţii: Păstrează capitalizarea + Cuvânt întreg la început
     Va căuta: ansambla, ansamblat, ansamblare, ansamble...

     Dekci: Cuvânt întreg are 3 variante de setare:
                      - [cuvânt întreg] la ambele capete - ceea ce înseamnă cuvânt întreg în sensul obişnuit;
                      - [cuvânt întreg] la început - este cazul nostru - va căuta şi înlocui toate cuvintele care încep cu secvenţa respectivă;
                      - [cuvânt întreg] la sfârşit - va căuta şi înlocui toate cuvintele care se termină cu secvenţa respectivă.


utilitasetveritas a scris:

Sau setezi AC-ul sa permita instante multiple.

     Cum se face setarea asta?... că eu nu o ştiu...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani


Nu am intalnit probleme pana acum.
Dar e interesant de stiut daca pot aparea.


Ambele instante folosesc simultan aceleasi fisiere, in speta dictionarele.
Daca am un dictionar deschis in ambele instante, si il modific, diferit, in ambele, cum se salveaza modificarea din moment ce acelasi dictionar e deschis de 2 ori?


Si ca tot vorbim de alte modalitati de folosire a programului...
Cosmin, Seven, cum merge varianta portabila a AC-ului cu dictionarele si executabilele? Cred ca ar avea vreo 2-3 avantaje fata de cea de tip installer.

Si ramand in acelasi exemplu:

ansambl > asambl

Daca vreau ca inlocuirea sa cuprinda si reansamblat, dezansamblat?

E clar ca nu mai pot folosi conditia cu inceput de cuvant.

Fie definesc alt 2 termeni de inlocuire cu re- si dez-, dar ma lovesc de problema pluralului, de exemplu.

dezansamblate

Secventa de inlocuit e prinsa intre dez- si -ate.
Am incercat diverse setari, dar nu am gasit niciuna multumitoare. Singura optiune posibila e inlocuirea cu confirmare, fara alte conditii atasate. Problema ei e ca desi gaseste toate locurile in care apare acel grup de caractere, dar cand face inlocuirea, o face exact asa cum a fost scrisa in dictionar, adica cu minuscule.
Nu merge folosita doar capitalizarea si inlocuirea cu confirmare?
Alminteri:

dezansAmbLate > dezasamblate

Doar un exemplu de dragul exemplului. Dar cred ca se intelege unde bat.

P.S.
Nu, nu cred ca e posibil. Inlocuirea mea schimba un cuvant cu altul si nu cred ca programul poate sa isi dea seama ce pastreaza si ce nu.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ca la orice program in care deschizi acelasi fisier in instante multiple, pe HDD va ajunge doar ultima salvare. In cazul Inlocuirii Multiple se vor salva modificarile din instanta la care fereastra IM a fost inchisa ultima (sau a fost rulata ultima).

Referitor la varianta portabila: vorbesti de cea facuta de a_catalin sau de altceva...?


pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani

Seven a scris:

***
     Înlocuire:  ansambl > asambl
     Condiţii: Păstrează capitalizarea + Cuvânt întreg la început
     Va căuta: ansambla, ansamblat, ansamblare, ansamble...



a asambla - verb
asamblare, asamblari - substantiv

ansamblu, ansambluri - substantiv


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Da, stiu de situatia asta.
Lucrez la un dictionar de greseli ortografice frecvente.

ansamblat > asamblat

dezansamblat, reansamblat, ansamblate, ansamblati, etc.

Cuvantul "ansamblu" nu e tinta inlocuirii. Care oricum se face cu confirmare.


pus acum 12 ani
   
Pagini: 1 ... 9 10 11 12 13  

Mergi la