Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** @tuf, aceea [3.3.1] este ultima versiune. Din câte ştiu eu agigi nu a mai adus modificări noi.
DICŢIONARE.... VECHI ŞI NOI
Postarea asta va fi din nou una lungă şi o voi edita în mai multe etape. Voi aduce câteva clarificări, ori voi reaminti nişte chestii mai vechi pe care userii noi nu le ştiu.
Am pierdut din vedere că pe forum apar useri noi şi că nu au putut vedea "în direct" multele discuţii de pe forum legate de AutoCorect şi mai ales despre tot felul de dicţionare.
Prima subliniere: AutoCorect OCR Plus nu face corecţii de limbă, nu face corecţii gramaticale,nu schimbă cuvinte vechi cu unele mai noi. Să dăm un exemplu: "Nevastă-mea plecă pân' la prăvălie să facă nişte târguieli."
Niciodată AutoCorect nu va face nicio modificare de genul: Soţia mea a mers la hypermarket să facă shopping."
AutoCorect nu schimbă niciun cuvânt, indiferent dacă el nu corespunde normelor actuale... nici măcar < pân' > cu < până >, cu atât mai puţin <prăvălie> cu <magazin> etc. AutoCorect nu articulează cuvinte, nu corectează forma greşit folosită a unui cuvânt; nu corectează bâlbe etc... etc...
Scopul de bază al AutoCorect este să corecteze erori de OCR. Eroare de OCR este acea greşeală de recunoaştere a unora dintre litere, pe care o face Abbyy [sau alt program similar] şi se datorează faptului că unele litere seamănă cu altele, iar Abbyy le interpretează greşit
Sau să fim mai exacţi... există câteva corecturi de ortografie... Se fac automat două înlocuiri "noştrii >> noştri" şi "voştrii >> voştri", pentru că în limba română aceste cuvinte nu se scriu niciodată cu 2 i. Mai sunt circa 10-15 modificări cu confirmare; este vorba de vreo 2-3 substantive la genitiv [sorei >> surorii, soartei >> sorţii], forme ale verbului a voi [vroia... >> voia...] şi câteva situaţii în care cuvintele se scriau despărţit înainte de DOOM2 şi acum se scriu legat sau invers. Ei bine aceste corecturi nu se fac automat, ci doar cu confirmare şi aceste înregistrări se află undeva în ultimul dicţionar al programului... deci mulţi useri nici nu ajung la ele.
Am explicat aceste lucruri ca să clarific faptul că AutoCorect nu schimbă cuvinte, nu schimbă sensul cuvintelor. Au fost situaţii când cineva mi-a atras atenţia că AC a schimbat cuvintele dintr-o frază. Nu. AC nu poate face aşa ceva pentru că nu are nicio înregistrare de acest fel. În astfel de situaţii trebuie căutată cauza în altă parte. Un sfat: creaţi pentru fiecare carte un folder "Arhivă" în care să puneţi salvări de rezervă; salvaţi acolo OCR brut, apoi salvaţi versiunea după rularea prin AC. Când aveţi bănuieli, deschideţi salvarea de rezervă şi vedeţi dacă problema apărea în OCR_BRUT, respectiv în OCR_AC. În acest mod vedeţi clar când a apărut problema care vă deranjează. Cam atât despre acest aspect.
Ce este diferit la noile dicţionare OCR_DIC faţă de cele vechi? Cred că este o problemă pe care trebuie s-o clarificăm. Să explic: Corectez o carte pe care a luat-o de la zero [pe care am scanat-o, OCR-izat-o şi am rulat-o prin AC]; pe timpul corecturii găsesc anumite tipuri de erori pe care AC nu le-a "văzut". Bineînţeles că nu este vorba de orice eroare, ci doar ce unele care ar "merita efortul" să fie înregistrate, adică: – cuvinte scurte de max 6-7 litere, care au o frecvenţă mare în limba română; dacă cuvântul este unul care apare mai rar într-un text fac corectura manuală şi merg mai departe; dacă întâlnesc "fundcă, fiindca, fiinclă..." deci o eroare de la cuvântul "fiindcă", atunci înregistrez modificarea, pentru că acest cuvânt este unul cu frecvenţă mare şi apare în orice fel de text. Dacă găsesc un cuvânt de genul "regirnului" în loc de "regimului", atunci fac corectura şi merg mai departe, pentru că "regimului" nu este un cuvânt folosit foarte des. –un anumit tip de eroare care se repetă la cuvinte diverse dar care conţin o anumită secvenţă de litere; de exemplu, litera "g" apare eronat în locul literei "ş" la început de cuvânt. În acest caz verific dacă sunt multe cazuri de acest gen şi dacă treaba este serioasă, atunci fac înregistrări la câteva cuvinte de frecvenţă mare care încep cu "ş", cum ar fi: şi, ştiu-ştii-ştie-ştim-ştiţi şi poate alte câteva. Normal că nu mă complic să înregistrez cuvinte lungi şi rare, chiar dacă şi în cazul lor litera apare greşit.
Legat de înregistrarea de noi modificări aş sublinia două aspecte: – înregistrez doar înlocuiri pe care le consider necesare şi utile; ideea este că nu doresc să aglomerez dicţionarele cu înlocuiri care apar ra sau foarte rar, ci doar cuvinte cu frecvenţă mare şi foarte mare. –am întotdeauna în AC vreo 5-6 dicţionare temporare [unul cu confirmare, unul pentru cuvinte întregi, altul pentru dicţionare de tip uzuale... etc]; atunci când am nevoie fac înregistrarea într-unul din aceste dicţionare şi când am timp... la 2 săptămâni,poate mai des ori mai rar, iau la mână înregistrările,le triez şi le pun la locul lor în dicţionarele OCR_DIC sau uzuale. Sunt şi situaţii în care în această etapă renunţ la una sau mai multe dintre înregistrări pentru că apreciez că frecvenţa lor nu este suficient de mare ca să merite a fi înregistrate.
Atunci când descopăr că o anumită eroare a apărut după rularea AC, atunci caut înregistrarea care a produs eroarea şi o elimin sau o modific.
În concluzie, dicţionarele mai noi [adică cele urcate în 2015] au, de regulă, modificări în plus faţă de cele anterioare, dar pot avea şi câteva înregistrări eliminate, iar altele modificate. Pur şi simplu, versiunea mai nouă se doreşte a fi mai bună decât precedenta. Nu intenţionez să tot agasez utilizatorii cu alte şi alte versiuni de dicţionare, ci încerc să fac astfel încât dicţionarele să fie cât mai utile,iar textul rezultat să fie cât mai curat.
Ce facem cu noile dicţionare? Unde le salvăm? Am primit mesaje private de genul: Am instalat dicţionarele 2015 şi programul nu mai merge. Îmi apare mesajul că "Programul nu găseşte dicţionarul CO_Artef.imd." Acelaşi mesaj apare şi pentru alte dicţionare...
Atenţie! Noile dicţionare nu sunt ALTE dicţionare; nu sunt dicţionare ÎN PLUS; sunt aceleaşi dicţionare, doar că unele dintre ele sunt ÎMBUNĂTĂŢITE, fie prin adăugarea de noi înregistrări, fie prin mutarea unei înregistrări în dicţionar cu confirmare pentru a nu produce efecte secundare, fie prin eliminarea unor înregistrări care produceau efecte secundare.
Rezultă că noile dicţionare le vor înlocui pe cele vechi. Deci vom şterge vechile dicţionare şi punem înlocul lor - absolut în acelaşi loc - noile dicţionare. Este adevărat că arhiva are nume de genul [2015.05.21]OCR_DIC Contemp.rar şi că la dezarhivare fişierele vor fi scrise într-un folder care se va numi [2015.05.21]OCR_DIC Contemp, dar asta nu înseamnă că dicţionarele vor rămâne într-un folder cu acest nume.
Noi avem dicţionarele de tip "imd" în două foldere: – un folder se numeşte obligatoriu OCR_DIC şi aici trebuie să avem cele 39 de dicţionare care încep cu particula CO_; dacă din greşeală modificăm numele folderului OCR_DIC, atunci schimbăm adresa de căutare a dicţionarelor şi bineînţeles că programul nu le mai găseşte. – al doilea folder în care avem dicţionarele uzuale se poate numi Dic_UZUALE sau cum doreşte fiecare utilizator.
Cum procedăm cu dicţionarele actualizate? – facem downloadul arhivei care conţine dicţionarele OCR_DIC, salvăm undeva în calculator arhiva şi apoi extragem fişierele; – din folderul OCR_DIC ştergem dicţionarele vechi; le putem arhiva şi salva undeva unde păstrăm versiunile dicţionarelor sau le ştergem pur şi simplu. – copiem dicţionarele noi din folderul în care s-m făcut dezarhivarea noilor dicţionare şi le ducem exact în folderul OCR_DIC exact în locul celor pe care le-am şters.
Asta înseamnă că nu avem două rânduri de dicţionare, ci doar pe cele noi, iar ele trebuie să stea exact în acelaşi folder unde au stat cele vechi. În acest mod, programul va căuta dicţionarele la aceeaşi adresă pe care o are stabilită în soft şi numele dicţionarelor sunt exact aceleaşi prevăzute în soft. Dacă, să zicem, în acelaşi folder OCR_DIC vom adăuga unul sau mai multe dicţionare, ele nu vor rula pentru că softul nu ştie că există. Chiar în acest moment,la dicţionarele urcate la 22.05.2015 există un dicţionar în plus care se numeşte "CO_Grn 2.imd" pe care softul nu-l rulează. În acel dicţionar am salvat înregistrări pe care le-am scos din dicţionarul "CO_Grn.imd", înregistrări pe care le-am considerat suspecte de efecte secundare şi pe care le voi şterge după o nouă verificare.
Să revenim la problema noilor dicţionare. Dacă până zilele trecute AutoCorect a funcţionat corect, iar după înlocuirea dicţionarelor programul nu mai funcţionează, înseamnă că nu am pus noile dicţionare unde trebuie... şi am făcut una dintre greşelile următoare: – am modificat fără să ne dăm seama numele folderului OCR_DIC – am adăugat un folder nou pe care programul nu-l re/cunoaşte. – am pus folderul OCR_DIC în alt loc în computer, deci nu la adresa corectă.
Dicţionarele Uzuale. După metoda OCR_DIC procedăm similar şi cu noile dicţionarele uzuale. Reamintesc faptul că acestea rulează cu opţiunea "9.Rulare grup de dicţionare de înlocuire multiplă" şi că opţiunea permite setarea căi de căutare a dicţionarelor,precum şi posibilitatea de ştergere a unoa dintre dicţionare precum şi adăugarea unor dicţionare noi. Dicţionarele uzuale nu contează cum sunt denumite şi câte sunt, deoarece programul le încarcă de locurile indicate de noi în setarea opţiunii.
SFAT! Pentru a nu mai căuta folderele care conţin dicţionarele şi pentru a evita ca dicţionarele noi să fie copiate în alt loc decât cel corect, propun să faceţi o scurtătură pe ecran la folderul Dicţionare, folder în care se află subfolderele OCR_DIC şi Dic_UZUALE.
Sper că am reuşit să clarific problema. Dacă sunt neclarităţi, vă rog să le semnalaţi.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|