Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
Profil Larina23
Femeie
23 ani
Timis
cauta Barbat
28 - 80 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect 2020 Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini:  1 2
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     DICŢIONARE - Rugăminte



     Aşa cum ştiţi, dicţionarele sunt într-o continuă dezvoltare, deşi cuvintele adăugate sunt din ce în ce mai puţine.
     Practic avem o bază de cuvinte care s-au dovedit a fi utile şi în principiu stabile [adică provoacă foarte rar efecte secundare nedorite], dar adeseori constat că unele erori nu sunt rezolvate.
     Atunci când fac perierea unui OCR, dar mai ales când fac corectura manuală, descopăr unele erori nerezolvate de AutoCorect. Dacă este vorba de o eroare care are frecvenţă mai mare în text, atunci o înregistrez.

     Dat fiind faptul că sunt 85 de dicţionare doar în folderele OCR_DIC şi Uzuale... plus vreo 30 în Interbelice, mi-ar lua ceva timp ca de fiecare dată să fac înregistrarea direct într-unul dintre aceste dicţionare...
     ...aşa că prefer să lucrez cu câteva dicţionare temporare. Menţionez că pentru a nu pierde timp cu verificarea rezultatelor, la majoritatea înregistrărilor pun condiţia "Cli" [cu confirmare].

     Atunci când am ceva mai mult timp [de regulă o dată sau de două ori pe lună] verific dacă înregistrările mai există cumva în în dicţionarele consacrate şi apoi încep să distribui înregistrările pe căprării, adică fiecare înregistrare într-unul dintre dicţionarele consacrate.
     Chiar în acest moment încerc să distribui o serie de înregistrări din dicţionare temporare în dicţionare consacrate. Dat fiind că am lucrat la OCR-uri în limbaj interbelic, înregistrările sunt cam multe şi trebuie analizat foarte bine dacă o anume înregistrare va fi mutată în dicţionarele obligatorii şi/sau în dicţionarele Interbelice... deci mutarea cere ceva mai mult timp.

     Important!
     Dat fiind că iniţial înregistrările au fost cu confirmare, se întâmplă ca uneori unele înregistrări să fie mutate în dicţionare automate, dar să rămână cu condiţia "cu confirmare".
     Eu încerc să verific astfel de situaţii, dar s-a întâmplat de mai multe ori să-mi "scape" condiţia cu confirmare la înregistrări din dicţionare automate.

     PRIMA RUGĂMINTE:
     Dacă constataţi, cumva, că vreun dicţionar automat se întrerupe din rulare pentru a solicita o confirmare, vă rog insistent să observaţi opţiunea automată care cere confirmare şi să semnalaţi acest lucru pe forum pentru a corecta respectiva eroare!

     A DOUA RUGĂMINTE:
     Vă rog să semnalaţi orice alte probleme legate de rularea dicţionarelor şi mai ales să faceţi propuneri sau orice solicitări care ar putea îmbunătăţi rularea dicţionarelor!

     Cu mulţumiri anticipate,
     Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 an
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     REACTUALIZARE AutoCorect la 02.02.2023



     EXECUTABILE AutoCorect


     Executabile AutoCorect OCR v6.23
     Nume arhivă:  Executabile_AC_v6.23.rar
     Adresă: – fişier mediafire
     Conţine: executabile AC 6.23 Install şi Portable
     

     Executabile AutoCorect OCR v6.24
     Nume arhivă:  Executabile_AC_6.24.rar
     Adresă: – fişier mediafire
     Conţine: executabile AC 6.24 Install şi Portable



     DICŢIONARE AutoCorect actualizate la 02.02.2023

     Nume folder:  Dictionare 2023.02.02
     Adresă: – folder deschis mediafire
     Conţine: dicţionare OCR_DIC, Uzuale şi Interbelice


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 an
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Mulţumesc din suflet dl Seven.
Am copiat la locul lor în Roaming dicţionarele şi am înlocuit executabilul din calculatorul meu cu versiunea 6.24.
M-am gândit că aceasta este cea mai nouă.
Am încărcat din nou în OCR dicţionarele uzuale(opţiunea 9), ştergându-le mai înainte pe cele vechi.
Am o singură întrebare şi anume că la mine dicţionarele interbelice, la dezarhivare, în interiorul folderului dezarhivat au apărut şi alte câteva foldere denumite „0 Artefacte”, „3 Cratimă”,  „2 Apostrof”,  „1 Asterisc” şi m-am întrebat dacă e în regulă.Sau ar fi trebuit să scot dictionarele din interiorul acestor foldere să fie la un loc cu celelalte dicţionare interbelice.

Respecte,

autocorect 2020 din suflet seven.am copiat locul lor roaming şi înlocuit din meu versiunea

24.6KB


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 1 an
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     În ultima perioadă am tot periate OCR-uri interbelice şi mi s-a părut mai comod să grupez în subfoldere dicţionarele care se ocupă de eliminarea şi înlocuirea artefactelor în general, aşa că am grupat în subfoldere aceste dicţionare, lăsând la vedere doar dicţionarele care se ocupă concret de înlocuire/corectare de cuvinte.
     Tu poţi proceda după cum ţi se pare mai comod: poţi lăsa dicţionarele în subfoldere sau le poţi scoate pe toate în folderul principal.
     Ideea este ca mai înainte de a trece la înlocuirea de cuvinte să se cureţe toate artefactele [asteriscuri, apostrofuri şi cratime] şi apoi să se treacă efectiv la corectarea cuvintelor.
     Pentru perierea artefactelor eu folosesc în principal funcţia "Caută" din meniul "Editare" şi mai puţin dicţionarele.
     Pentru înlocuirea apostrofului, respectiv a asteriscului, folosesc mai întâi primele două dicţionare de la fiecare şi apoi fac curăţarea cu funcţia de "Căutare".
     În sfârşit, la eliminarea Cratimelor, rulez primele două dicţionare, apoi căutarea "cratimă+spaţiu" şi la final rulez dicţionarul "DEL_Cratimă" pentru finalizare.
     
     După ce am terminat cu toate acesta rtefacte, apostrofuri, asteriscuri şi cratime parazite, trec la rularea în ordine a dicţionarelor de cuvinte, cele care încep cu litera C.
     Dicţionarele notate la început cu litera D se referă oarecum la corectarea Punctuaţiei.

     Deoarece la ultimul roman la care lucrez, în dialoguri separarea explicaţiilor autorului au fost marcate cu linie de pauză [practic este o linie mai lungă, redată în principal cu linie de dialog, am adăugat un dicţionar numit "D81 Elimin linii dialog.imd" care înlocuieşte primul marcaj de liniuţă cu virgulă.
     Aici a fost ceva mai simplu, în sensul că am înregistrat situaţii de genul "adăugă, afirmă, exclamă, spuse, zise" etc... etc...  Dicţionarul are peste 1600 de înregistrări şi elimină aproape 100% primul marcaj.

     Pentru al doilea marcaj, nu am putut găsi nişte reguli specifice, aşa că acest dicţionar nu rezolvă şi această situaţie.
     În aceste OCR, apare şi o aiureală: în cadrul unui paragraf dialog, fiecare nouă frază are în faţa sa linie de dialog, deşi este în interiorul paragrafului.
     Pentru a elimina şi aceste marcaje, plus al doilea marcaj al explicaţiilor autorului, menţionat mai sus am adăugat un al doilea dicţionar "D81 Elimin linii inter.imd", care încercă să rezolve aceste probleme.

     Cu toate aceste dicţionare, textele interbelice şi mai ales romanele foileton care sunt tipărite în fascicule pe hârtie de ziar au zeci de mii de artefacte, fapt pentru care perierea, cu tot ajutorul AutoCorect, durează foarte mult. La ultimul roman fiecare volum a 400 de pagini mi-a luat câte o săptămână de muncă serioasă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 an
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Întrebare;Dacă nu scot dicţionarele din subfoldere şi le las aşa cum le-aţi postat, oare AC-OCR le „vede” acolo, le utilizează automat, sau e necesară interogarea lor manual?!

„În dialoguri, separarea explicaţiilor autorului au fost marcate cu linie de pauză [practic este o linie mai lungă, redată în principal cu linie de dialog, am adăugat un dicţionar numit "D81 Elimin linii dialog.imd" care înlocuieşte primul marcaj de liniuţă cu virgulă.
     Aici a fost ceva mai simplu, în sensul că am înregistrat situaţii de genul "adăugă, afirmă, exclamă, spuse, zise" etc... etc...  Dicţionarul are peste 1600 de înregistrări şi elimină aproape 100% primul marcaj.”

MULŢUMESC pentru acest dicţionar minunat, îl doream de mult, dar nu am ştiut că este posibil să se introducă în AC un aşa ajutor.
Abia aştept să îl folosesc.

Modificat de dacopand (acum 1 an)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 1 an
   
raganar
MEMBRU VIP

Din: Codlea
Inregistrat: acum 16 ani
Seven,
poti sa imi explici cum se instaleza dictionarele in program si cum se folosesc?


_______________________________________
Nu lasa pe maine ce poti face astazi, lasa pe poimaine ca poate nu mai e nevoie sa-l faci.
Micul fara mustar e ca barbatul fara femeie.

pus acum 1 an
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     @raganar,
     e un întreg program pe care l-am explicat pas cu pas pe forum de-a lungul anilor.
     Am realizat nişte tutoriale detaliate, un fel de manuale, care se găsesc pe mediafire.
     Sunt 5 tutoriale care au următoarele nume:
     – TAC1 – Instrucţiuni de utilizare [V1.0].pdf
     – TAC2 – Dictionare de înlocuire multiplă [V1.0].pdf
     – TAC3 – Prelucrarea cărţilor interbelice [V1.0].pdf
     – TAC4 – Instalare AutoCorect OCR 6.1.pdf
     – TAC5 – Îmbunătăţiri şi noutăţi în AC v6.2.pdf

     Nume folder mediafire:  Tutoriale_AC_OCR_v6.2
     Adresă download:

     Pe tine te-ar interesa în mod special TAC4 şi TAC4.


     @dacopand
     În principiu, toate dicţionarele interbelice trebuie încărcate manual.
     Dicţionarele interbelice pot fi "văzute" de către AutoCorect doar dacă sunt încărcate într-una din primele două opţiuni din meniul OCR Special, "Rulare grup 2 [3] dicţionare".
     Astfel ele vor rula ca grup de dicţionare şi stabilirea grupului care va rula se va face ca şi în cazul opţiunii "9. Rulare grup de dicţionare uzuale".

     Problema este că rularea şi confirmarea unui dicţionar interbelic este destul de greoaie şi migăloasă, iar cele din subfoldere [cele care curăţă artefacte, apostrofuri, asteriscuri şi cratime] necesită uneori realuarea rulării de mai multe ori.
     Aşa că o rularte în grup ar fi un maraton dificil de parcurs.

     Dar, pentru că oameni simt diferit, fiecare persoană poate rula aceste dicţionare aşa cum este obişnuit, cum se i se pare mai comod.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 an
   
Stelevadris
Moderator

Inregistrat: acum 19 ani
Seven, e vreun motiv pentru care ai lasat link pentru 2 versiuni de executabile?

_______________________________________
Totul despre cărți - About e-books - Tehnici de scanare, sfaturi, proiecte etc. - Support, future projects, etc.

pus acum 1 an
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutări, tuturor!

     la prima vedere cele două versiuni par identice, dar există o mică diferenţă între ele.
     Fiecare are un avantaj şi un dezavantaj faţă de cealaltă.

     AutoCorect v6.23 este perfect pentru rulările obişnuite ale dicţionarelor, fie ele automate sau cu confirmare, dar nu este recomandat pentru editare din fereastra principală a AutoCorect, deoarece nu elimină sublinierea cuvintelor după corectare.
     Avantajul acestei versiuni este că funcţionează perfect la confirmare combinată cu editare, iar folosirea funcţiei Undo nu crează probleme.

     AutoCorect v6.24 este foarte bun pentru cei care preferă să facă corectură manuală direct din AutoCorect pentru că dacă se face corectură din fereastra principală, după efectuarea corecturilor dintr-un paragraf cuvintele corectate nu mai rămân subliniate.
     Dezavantajul acestei versiuni este că la folosirea Undo din confirmare poate provoca blocaje, dacă se abuzează de funcţia Undo.
     Mai concret, Undo trebuie folosit doar 2-3 paşi înapoi şi nu se accesează Undo dacă s-a combinat confirmarea cu editarea; în astfel de cazuri pot apărea conflicte şi blocaje ale aplicaţiei.

     Deoarece în ultima perioadă am periat OCR-uri cu foarte-foarte multe probleme, a trebuit să folosesc editare din fereastra principală AutoCorect. Din acest motiv am folosit exclusiv versiunea v6.24.
     Recomand ca perioada de timp la care se face salvarea să nu fie mai mare de 10 minute; dacă se întâmplă totuşi să apară vreun blocaj al aplicaţiei e bine să rămână puţine modificări nesalvate.

     Aşa cum am menţionat, niciuna dintre versiuni nu se blochează la rulările obişnuite de dicţionare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 an
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
REACTUALIZARE AutoCorect la 02.02.2023

Atenţie!
Linkurile nu par să mai fie active!!!!

O seară bună!


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 1 an
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     E posibil să fi fost mediafire mai aglomerat sau să fi prins o perioadă de mentenanţă...
     Am verificat de mai multe ori şi linkurile sunt în continuare active.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 an
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani



       ═══════  DICŢIONARE DE ÎNLOCUIRE MULTIPLĂ – Modificări 2024  ═══════



     Voiam să postez un nou Instaler pentru AutoCorect care are încorporate dicţionarele reactualizate.
     După ce am realizat instalere pentru ambele versiuni [AC Instalat şi Ac Portabil] am constatat că dicţionarele ar trebui mai întâi puse în discuţia şi de-abia după aceea să realizez instalere după ce se vor trage nişte concluzii clare.
     Deci, mai întâi să discutăm despre dicţionare:


     În ultima perioadă am făcut o serie de înregistrări noi în dicţionarele AC.
     Dat fiind faptul că am prelucrat texte interbelice, cele mai multe înregistrări sunt, bineînţeles, în zona dicţionarelor Interbelice.
     Cu toate acestea sunt o serie de înregistrări care se pot aplica şi cărţilor obişnuite.
     În principal sunt înregistrări cu confirmare, dar sunt şi o serie de înregistrări automate.

     Deşi o parte dintre înregistrări au fost deja integrate în dicţionarele cunoscute, totuşi, cea mai mare parte dintre modificări se află încă în dicţionare separate.
     Din acest motiv aş avea un pic de nevoie de ajutor din partea domniilor voastre pentru a stabili unde ar fi mai bine să integrez noile modificări.
     Rugămintea o adresez celor ce lucrează cu AutoCorect şi în mod special celor care rulează şi dicţionarele cu confirmare.

     În mare modificările au apărut în zona următoarelor dicţionare:
     1. Dicţionare automate pentru cărţi obişnuite
          1a – înregistrări cu rulare automată integrate în dicţionarele cunoscute.
     O serie de înregistrări sunt integrate în dicţionarele OCR_DIC sau UZUALE cunoscute.
          1b – înregistrări cu rulare automată neintegrate.
     Am realizat o serie de înregistrări care corectează exclusiv cuvinte cu diacritice scrise eronat fără diacritice, dar şi invers, precum corectarea lui <î> care apare în loc de <i> la final de cuvânt.
     Deocamdată aceste dicţionare sunt în număr de 10 dicţionare şi din motive tehnice au fost puse într-un subfolder nou, numit UZ_DIACRITICE. Ele funcţionează ca şi Uzualele cu opţiunea "9 Rulare grup de dicţionare uzuale".
     Practic la setarea opţiunii nr 9 se încarcă mai întâi toate dicţionarele din subfolderul UZUAL_DIC, apoi cele din subfolderul UZ_DIACRITICE.
     Motivul pentru care deocamdată aceste dicţionare sunt separate este un motiv pur tehnic. Mie îmi este mult mai uşor să verific şi să adaug o astfel de înregistrare într-unul dintre cele 10 dicţionare decât să defilez prin mii de înregistrări din OCR_DIC sau în cele uzuale.

     2. Dicţionare cu confirmare pentru cărţi obişnuite
          1b – înregistrări cu confirmare integrate în dicţionarele cunoscute.
Aici sunt două dicţionare de remarcat:
          – Dicţionarul "Var8.imd" din OCR_DIC, care se ocupă de în special de corectarea punctuaţiei, am adăugat un set de înregistrări care cotectează punctuaţia la sfârşit de paragraf; ar fi de remarcat virgula în loc de punct, punct şi virgulă în loc de două puncte... şi mai ales de adăugarea punctului la paragrafele terminate în literă fără semn de punctuaţie.
     Trebuie să menţionez că am adăugat nişte înregistrări de tip mesaje care avertizează ce fel de modificări urmează să fie făcute în următoarul pachet de înregistrări. Vom mai reveni cu detalii asupra dicţionarului.
          – Dicţionarul "Var7.imd" din OCR_DIC, care se ocupă de demajuscularea unor cuvinte. Este vorba în principal despre puncul eronat pus în loc de virgulă şi urmat de o majusculă. Am adăugat câteva înregistrări noi în dicţionarul existent care a ajuns la un total de 5385 de înregistrări active şi inactive.
     Pentru că mai puteau fi adăugate încă o serie de înregistrări, dar rularea devenea mai greoaie şi apărea şi inconvenientul că multe situaţii trebuiau refuzate şi nu acceptate, am salvat dicţionarul ca "Var7 NOU.imd" iar la acesta am adăugat circa 3000 de înregistrări, aşa că acesta la acest moment un total de 8423 active şi inactive.
     Acest nou dicţionar se află imediat înaintea celui vechi şi el poate fi probat şi rulat manual. Utilizatorii vor putea alege între cele două şi-l vor rula pe cel dorit.

          – Mai sunt câteva dicţionare cu confirmare pe care le-am folosit în special la textele interbelice, dar uneori pot fi necesare şi în cazul cărţilor obişnuite din perioada de dinainte de 1989.
     Este vorba de aşa-numitul dialog francez, în care delimitarea explicaţiilor autorului de dialogul propriu zis al personajelor este făcut cu liniuţe de pauză [practic este folosită atât EnDash, cât şi EmDash], în loc de virgulă.
     Aici sunt două dicţionare:
     – Primul dicţionar, numit "DEL LinDi Prim.imd" elimină prima liniuţă după care urmează explicaţii de genul: afirmă, bombăni, exclamă, întrebă, spuse, zise etc... Dicţionarul are un total de cca 5100 înregistrări. Aici nu sunt probleme de rulare; pe de o parte dicţionarul a prins cam toate expresiile folosite şi pentru fiecare expresie există 12 înregistrări, aşa că el "vede" marea majoritate a situaţiilor; pe de altă parte situaţiile de refuz al confirmării sunt foarte-foarte rare şi tind către zero.
     – Al doilea dicţionar, numit "DEL LinDi Sec.imd" elimină a doua liniuţă, cea de după explicaţia autorului. Din păcate aici nu am găsit reguli clare, aşa că este ceva mai mult de lucru, dat fiind că apar suficiente situaţii de refuz al confirmării.
     – Un alt dicţionar corectează amănunţit gruparea eronată virgulă_punct şi lucrez la gruparea inversă, adică punt_virgulă. Şi acest dicţionar este separat, deci nu este încă integrat. E posibiul să mai fie şi alt dicţionar, dar în acest moment nu-mi amintesc altă situaţie.

     Încă nu ştiu unde să pun aceste dicţionare. Deocamdată ele se află în pachetul INTERBELICE. Am putea să le punem la sfârşitul OCR_DIC şi să fie rulate manual, ar putea de asemenea să fie puse în subfolderul Periere Finală... deocamdată nu ştiu unde e mai bine, aşa că aştept părerile voastre.


     Bineînţeles că am dezvoltat foarte mult dicţionarele Interbelice, dar şi un pachet nou de dicţionare Antebelice
     Dar despre acestea vom discuta ceva mai târziu.

     Seven 12.07.2024


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 luni
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Vă salut,
Dacă postaţi aceste dicţionare şi cu prima dvs. propunere de plasare a lor(folderul), voi încerca corectarea unei cărţi(de probă) cu ele să văd cum merg şi ce inconveniente ar putea apare, datorită plasării.
În urma acelei rulări, voi comunica părerea mea, care, în mod cert, nu este foarte autorizată, deşi eu folosesc numai Autocorect de pe forum de foarte mult timp, neavând alt program de corectare.
Respecte.


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 luni
   
tibibasston
Membru Senior

Inregistrat: acum 13 ani
Bună ziua,
În urma corectării unei cărți prin AutoCorect m-am lovit de o problemă:
La setarile din cadrul punctuației, deși am bifat majusculă la început de dialog și majusculă început paragraf - orice literă, litera î nu este schimbată în majusculă (atât la început de dialog cât și la început de paragraf).
În rest, totul merge bine.
Unde greșesc?

Modificat de tibibasston (acum 2 luni)


pus acum 2 luni
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutare, tibibasston!

     Răspunsul scurt este că nu greşeşti nimic în legătură cu setările.

     Pe de altă parte cred că este o nuanţă, în sensul că nu se majusculează TOATE î, dar unele dintre ele se majusculează.
     Explicaţia pentru majuscularea parţială vine de la faptul că la momentul rulării opţiunii "2.3 Punctuaţie/Funcţii obişnuite" nu toate literele î sunt cu adevărat Î, ci pot fi şi i sau 1, plus că nu toate liniile de dialog sunt EmDash.
     Linia de dialog se setează la opţiunea 8, deci mult mai târziu după opţiunea 2.4.
     Pe de altă parte o serie de cuvinte care apar iîn OCR scrise cu iniţiala i se corectează în Î într-unul dintre dicţionarele uzuale.

     Şi ar mai fi o explicaţie: atunci când s-a lucrat la AutoCorect s-a făcut o nuanţare: s-a folosit noţiunea de "paragraf întreg", acesta fiind paragraful text care începe întotdeauna după un alt paragraf text. Deci nu este considerat "paragraf întreg" acel paragraf care urmează după un rând gol sau un paragraf număr, adică după un număr de pagină.
     În cazul ruperii unei fraze la sfârşit de pagină şi continuarea ei pe următoarea pagină se majuscula în mod eronat primul cuvânt de pe pagina următoare, deşi era vorba despre aceeaşi frază.
     Chestia cu "paragraf întreg" a fost implementată cu scopul de a preveni majuscularea în acest caz.
     A trecut mult timp de atunci şi memoria nu e punctul meu forte, dar... e posibil ca la final să fi pus această caracteristică la toate paragrafele... chiar dacă nu e stipulat acest lucru.

     Oricum, ideea este că în dicţionarul Var8 se rezolvă majuscularea la început de peragraf în toate situaţiile.

     Dacă sunt eu în eroare şi e vorba de altceva, revino, te rog, cu detalii!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 2 luni
   
tibibasston
Membru Senior

Inregistrat: acum 13 ani

Seven a scris:

***
     Salutare, tibibasston!

     Răspunsul scurt este că nu greşeşti nimic în legătură cu setările.

     Pe de altă parte cred că este o nuanţă, în sensul că nu se majusculează TOATE î, dar unele dintre ele se majusculează.
     Explicaţia pentru majuscularea parţială vine de la faptul că la momentul rulării opţiunii "2.3 Punctuaţie/Funcţii obişnuite" nu toate literele î sunt cu adevărat Î, ci pot fi şi i sau 1, plus că nu toate liniile de dialog sunt EmDash.
     Linia de dialog se setează la opţiunea 8, deci mult mai târziu după opţiunea 2.4.
     Pe de altă parte o serie de cuvinte care apar iîn OCR scrise cu iniţiala i se corectează în Î într-unul dintre dicţionarele uzuale.

     Şi ar mai fi o explicaţie: atunci când s-a lucrat la AutoCorect s-a făcut o nuanţare: s-a folosit noţiunea de "paragraf întreg", acesta fiind paragraful text care începe întotdeauna după un alt paragraf text. Deci nu este considerat "paragraf întreg" acel paragraf care urmează după un rând gol sau un paragraf număr, adică după un număr de pagină.
     În cazul ruperii unei fraze la sfârşit de pagină şi continuarea ei pe următoarea pagină se majuscula în mod eronat primul cuvânt de pe pagina următoare, deşi era vorba despre aceeaşi frază.
     Chestia cu "paragraf întreg" a fost implementată cu scopul de a preveni majuscularea în acest caz.
     A trecut mult timp de atunci şi memoria nu e punctul meu forte, dar... e posibil ca la final să fi pus această caracteristică la toate paragrafele... chiar dacă nu e stipulat acest lucru.

     Oricum, ideea este că în dicţionarul Var8 se rezolvă majuscularea la început de peragraf în toate situaţiile.

     Dacă sunt eu în eroare şi e vorba de altceva, revino, te rog, cu detalii!


Mulțumesc frumos, Seven, pentru explicații. Am primit exact informațiile de care aveam nevoie.
Toate cele bune.


pus acum 2 luni
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     REACTUALIZARE Dictionare_PRS la 22.10.2024


     Pentru început postez dicţionarele din pachetele OCR_DIC, UZUALE şi DIACRITICE.
     La acest moment mai fac unele şlefuiri la dicţionare INTERBELICE şi ANTEBELICE, apoi am să le postez şi pe ele.

     Câteva explicaţii:

     ■ Pachetul OCR_DIC:
     — Am adăugat câteva înregistrări prin mai multe dicţionare, atât în cele cu confirmare, cât şi în cele cu rulare automată;
     — Dicţionar Var7. Am menţionat în postarea din iulie că am dezvoltat dicţionarul Var7, care se ocupă de înlocuirea punctelor eronate urmate de majuscule iniţiale cu virgulă sau spaţiu urmate de minuscule, în diverse situaţii. Prelucrând OCR-urile avute la dispoziţie în perioada din urmă am constatat că dicţionarul deşi putea face o curăţare mult mai bună, avea o serie de înlocuiri care trebuiau refuzate la înlocuire, fapt ce devenea obositor. Din acest motiv am renunţat la noul Var7 şi l-am păstrat pe cel vechi cu oarecare îmbunătăţiri.
     — Dicţionar Var8. Aşa cum am menţionat în aceeaşi postare, la dicţionarul Var8 – care se ocupă în principal de corectarea semnelor de punctuaţie –, am adăugat două grupuri de înregistrări noi care corectează punctuiaţia la sfârşit de paragraf, astfel:
          – un grup înlocuieşte virgula, cratima etc., aflate la sfârşit de paragraf cu punct sau punct şi virgulă cu două puncte;
          – al doilea pachet adaugă semn de puntuaţie după paragrafele terminate exclusiv în literă, deci care nu au niciun semn de punctuaţie la sfârşit. Aici sunt două situaţii: literele fusiforme [i, î, l, t] pot fi urmate de punct la o primă rulare sau înlocuite cu semnul exclamării la a doua rulare... ori rămân neschimbate sfârşit de pagină atunci când paragraful se continuă pe pagina următoare. Celelalte litere rulează câte o singură dată, ele primind punct sau sărind peste situaţie la sfârşit de pagină atunci când paragraful se continuă.
     — Dicţionarele Var1–Var4. Aici am făcut o rocadă între Var1–2 cu Var3–4, în sensul că acum Var1–2 sunt dicţionarele de expresii cu confirmare, iar Var3–4 sunt cuvinte cu confirmare. Am constatat că rularea în această nouă ordine este mai comodă şi mai eficientă.
     — Dicţionar Vt3. Atenţie la rularea acestui dicţionar care face corecţii ortografice de genul „o dată >< demult”, „de mult >< odată”, „de loc >< deloc” etc.

     ■ Pachetul UZUALE:
     — Aici nu sunt modificări notabile, ci doar îmbunătăţiri obişnuite.
     — Numele folderului este cel pe care l-a stabilit fiecare utilizator.

     ■ Pachetul DIACRITICE:
     — Aşa cum am spus aceste dicţionare trebuie să fie setate să ruleze împreună cu pachetul UZUALE la opţiunea 9. Eu am numit subfolderul UZ_DIACRITICE, dat fiind că mi se pare mai sugestiv [adică duce cu gândul că este legat de dicţionare Uzuale; în plus, eu lucrând la dicţionare am multe subfoldere temporare în lucru şi dacă îi ziceam simplu „Diacritice” ar fi fost indexat printre subfoldere temporare / în lucru.
     — Deocamdată avem un fişier gol: Dia_W-X-Y-Z.imd; fişierul nu conţine încă înregistrări, dar l-am creat deja pentru înregistrări viitoare.
     — Avem şi un dicţionar care se referă exclusiv la cuvinte scrise cu cratimă, notat cu DiCrat1.imd

     ADRESĂ FIŞIERE MEDIAFIRE:

     Nume fişiere/arhive:
          2024.10.22_OCR_DIC.rar;
          2024.10.22_UZUAL_DIC.rar;
          2024.10.22_UZ_DIACRITICE.rar.
     Nume folder: 2024.10

     DESCARCĂ: – folder deschis mediafire


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 luna
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Am luat toate dictionarele postate de dvs. si le-am pus în Folderul Dictionare_PRS.
În acest folder am acum următoarele foldere:DIC Interbelice; OCR_DIC; UZUAL_DIC; UZ_DIACRITICE; Periere FINALA.
În folderele de mai sus am introdus conţinutul  noilor dicţionare postate de seven.
În plus eu am păstrat încă folderul periere FINALA.
Folosesc OCRPLUS.
Nu am stiut să setez sa ruleze de la opţiunea 9 ca să ruleze 2 foldere.

„Aşa cum am spus aceste dicţionare trebuie să fie setate să ruleze împreună cu pachetul UZUALE la opţiunea 9.”
CUM SĂ SE FACĂ ACEASTĂ SETARE?!

Mulţumesc.

Modificat de dacopand (acum 1 luna)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 1 luna
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

    Setarea opţiunii „9 Rulare grup dicţionare uzuale”



     ■ Se deschide AC care afişează un fişier nou/gol. Nu este nevoie să încărcăm un fişier real OCR. Fereastra AC trebuie să ocupe doar o jumătate din lăţimea ecranului, de preferat jumătatea din stânga..
     ■ Accesăm meniul „OCR Plus”, apoi opţiunea „9 Rulare grup dicţionare uzuale”. Se deschide fereastra „Rulare dicţionare uzuale”, care conţine lista cu dicţionarele uzuale de rulat şi 5 butoane.
     ■ Apăsăm butonul „Adaugă” şi verificăm dacă se deschide subfolderul cu dicţionare Uzuale. În mod normal ar trebui să se deschidă exact acest subfolder; totuşi, uneori se poate deschide o altă locaţie, iar în acest caz trebuie să defilăm până la deschiderea subfolderului cu dicţionare Uzuale.
     ■ Accesăm meniul „Ajutor”, opţiunea a treia „Deschide folder dicţionare OCR” şi se va afişa în dreapta ecranului folderul respectiv. În acest folder deschidem subfolderul cu dicţionare Uzuale. Deocamdată atât în folderul din jumătatea dreaptă.
     ■ Verificăm dacă dicţionarele din fereastra de rulare sunt identice cu cele din subfolderul cu dicţionarele uzuale.
     ■ Folosim butonul „Adaugă” şi/sau „Şterge” pentru a adăuga un dicţionar pe care nu-l avem în listă sau pentru a şterge un dicţionar care nu mai există.

     Pentru cei cu oarecare experienţă se poate alege varianta golirii complete a listei de dicţionare din fereastra „Rulare dicţionare uzuale” şi apoi adăugarea în bloc a dicţionarelor din subfolderul „Uzuale”, astfel:
          – în fereastra „Rulare dicţionare uzuale” se poate şterge câte un singur dicţionar şi avem la deschidere selectat primul dicţionar din listă; apăsăm butonul „Şterge”, dicţionarul se va şterge şi acum este selecţionat următorul dicţionar. Apăsând în mod repetat butonul „Şterge” vom şterge întreaga listă;
          – acţionăm butonul „Adaugă”; se deschide subfolderul Uzuale, selectăm toate dicţionarele folosind combinaţia de taste Ctrl+A, apoi apăsăm butonul „Deschidere” şi în acest moment se încarcă lista cu toate dicţionarele uzuale.

     Indiferent de metoda folosită, în acest moment avem setate toate dicţionarele Uzuale şi urmează să încărcăm dicţionarele Uz_Diacritice.
     ■ Acţionăm din nou butonul „Adaugă”; se deschide folderul de dicţionare Uzuale şi defilăm până deschidem subfolderul „Uz_Diacritice”, apoi selectăm toate dicţionarele şi le încărcăm în listă.

     Acum avem în listă de rulare toate dicţionarele necesare.
     Apăsăm butonul „Rulează” şi ar trebui să apară notificarea „Nu s-a făcut nicio înlocuire. Durată x sec.”
     Dacă nu apare o altă notificare care să menţioneze că nu se găseşte un anume dicţionar, înseamnă că setarea opţiunii este completă şi corectă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 1 luna
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Metodologia descrisă mai sus este cea standard din Instrucţiunile de instalare AC.
Diferenţa(pe care nici nu am putut să o aplic este
„ ■ Accesăm meniul „Ajutor”, opţiunea a treia „Deschide folder dicţionare OCR” şi se va afişa în dreapta ecranului folderul respectiv. În acest folder deschidem subfolderul cu dicţionare Uzuale. Deocamdată atât în folderul din jumătatea dreaptă.”
A treia opţiune este „Şterge”. Cele 5 opţiuni sunt:„Setează”, „Adaugă”, „Şterge”, „Mută sus”, „mută jos”.

Şi o mică nedumerire - de ce am mai făcut separat de „Uzuale” -   „Uz_Diacritice”, din moment ce, pentru rulare, oricum vom adăuga conţinutul acestui dicţionar TOT acolo unde sunt cele Uzuale.
Eu, oricum urmasem paşii descrisi de dvs., cu excepţia celui de „Ajutor”, care nu apare la mine.

Cu stimă,


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 saptamani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Îmi cer scuze! Este greşeala mea.
     În ideea de a fi mai scurt în exprimare am făcut rocadă între ordinea a două etape.

     Aşa cum eronat am spus în postarea anterioară, dacă se deschide mai întâi opţiunea 9, avem o opţiune deja deschisă şi programul nu ne permite să deschidem o alta în paralel.
     Deci, mai întâi se accesează opţiunea „Ajutor” / „Deschide folder dictionare OCR”. Folderul se deschide şi în momentul acesta se poate accesa orice opţiune în AC.
     De abia acum deschidem opţiunea 9 şi se va afişa fereastra „Rulare dicţionare uzuale”.
     În acest moment vom avea deschisă în AC fereastra „Rulare dicţionare uzuale”, care practic este [doar] o listă a dicţionarelor de rulat; în dreapta avem deja folderul de dicţionare OCR, unde deschidem subfolderul uzuale.
     Acum putem face comparaţia între liste din stânga şi folderul cu fişierele reale ale dicţionarelor şi de altfel mişcarea asta are un singur scop: acela de a verifica dacă în listă avem exact aceleaşi dicţionare ca în subfolderul real.
     Cele 5 butoane [„Rulează”, „Adaugă”, „Şterge”, „Mută sus” şi „Mută jos” apar doar în fereastra „Rulare dicţionare uzuale” a opţiunii 9. Nu avem astfel de butoane în folderul din dreapta şi nici nu trebuie pentru că dacă am şterge acolo un dicţionar s-ar şterge fişierul respectiv.

     Şi dacă tot suntem aici, trebuie să menţionez un aspect: de-a lungul timpului doar dicţionarele din OCR_DIC au exact acelaşi număr şi aceleaşi nume de la o versiune la alta, pentru că ele sunt specificate în program fiecare cu numele său la opţiunea la care lucrează.
     Dicţionarele Uzuale au suferit modificări de-a lungul timpului, atât ca nume, dar şi ca număr. Astfel, dacă cineva a păstrat subfolderul cu dicţionarele de acum 4-5 ani şi a copiat noile dicţionarele noi peste cele vechi, e posibil să aibă toate dicţionarele noi, dar şi unele vechi care au fost şterse sau redenumite.
     De aceea este bine ca la reactualizare, mai întâi să se golească subfolderul prin ştergerea tuturor dicţionarelor şi mai apoi să se copieze dicţionarele noi.

     Am scris toate astea în ideea de a clarifica mai bine lucrurile, sper că nu le-am încurcat şi mai rău.

     *************

     Referitor la întrebarea de ce am mai făcut un pachet în plus [pachetul Uz_Diacritice] dacă dicţionarele rulează oricum împreună cu Uzualele?
     Răspunsul este că este mai simplu pentru mine ca dezvoltator de dicţionare.
     Mai concret: toate dicţionarele Uzuale, de asemenea toate dicţionarele Uz_Diacritice, precum şi o mare parte din dicţionarele OCR_DIC rulează automat. Dacă nu s-ar mai adăuga nicio înregistrare şi aceste înregistrări ar rămâne ca formă finală, atunci Uzualele şi UZ_Diacritice ar putea fi integrate în unele dintre dicţionarele OCR_DIC şi ar rămâne mult mai puţine dicţionare şi ce-i drept mult mai mari – asta ar însemna să fie ceva mai simplu pentru utilizatorul programului, dar nu înseamnă că s-ar reduce timpul de rulare, dat fiind că am avea acelaşi număr de înregistrări, dar într-un număr mai mic de dicţionare.

     Pentru dezvoltatorul de dicţionare lucrurile sunt mult mai complicate, deoarece atunci când stabileşte că mai trebuie adăugată o înlocuire, este musai să găsească exact dicţionarul unde ar trebui să-şi aibă locul şi poziţia respectiva înlocuire.
     Trebuie să menţionez că TOATE dicţionarele cu confirmare, dar şi o parte dintre dicţionarele automate NU POT şi NU TREBUIE să fie indexate/sortate pur şi simplu în ordine alfabetică, deoarece ele sunt organizate pe grupuri de înlocuiri şi în cadrul grupului este o ordine alfabetică, dar nu obligatoriu. Asta înseamnă că a găsi exact locul unde trebuie inserată o anume înregistrare este o adevărată căutare a acului în carul cu fân.
     De aceea prefer să creez dicţionare după o tematică şi cumva după o anumită logică a mea personală, care e logică pentru mine, dar care ar nu e la fel de logică şi pentru alte persoane pentru că ele ar privi din alt unghi sau punct de vedere.

     Toată această complicăreală de dicţionare este valabilă pentru curăţarea OCR după cărţi vechi şi foarte vechi; la cărţile noi / cu scanuri curate, foarte multe înregistrări sunt pur şi simplu pasive.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 saptamani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Dacă lucrurile s-au clarificat, aş vrea să mergem mai departe.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 3 saptamani
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani

Seven a scris:

***
     Dacă lucrurile s-au clarificat, aş vrea să mergem mai departe.

La mine, da.
Se poate merge mai departe, sigur.


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 3 saptamani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***

     Pentru cărţile obişnuite, adică cele tipărite pe hârtie mai bună decât cea de ziar şi publicate în ultimii 30-40 de ani, cred că dicţionarele postate mai sus sunt suficiente pentru procesare.
     Sau… ca să fiu mai exact, ar mai trebui folosit în plus acel dicţionar care elimină cratimele false, în special cele apărute la ruperea/despărţirea cuvintelor la capăt de rând. Dicţionarul este cunoscut sub numele „DEL Cratima.imd” sau un alt nume apropiat şi a fost postat mai demult în folderul „Periere finală”.
     La acel dicţionar nu au apărut modificări, deci se poate folosi cel postat anterior.

     Pentru cărţile mai vechi postbelice ar mai fi nişte lucruri de spus, iar pentru cărţile interbelice şi antebelice urmează să postez o serie de dicţionare specifice.

     Totuşi, înainte de a posta dicţionare interbelice şi antebelice, m-am gândit să mai abordăm câteva aspecte.

     Deoarece am prelucrat complet câtevaşilea cărţi pe forum… de asemenea am prelucrat câteva cărţi pe care le-au corectat alţi colegi de pe forum… plus contribuţia mea la dezvoltarea dicţionarelor şi a chiar a unei părţi din programul AutoCorect, cred că nu ar fi o mare lipsă de modestie dacă aş considera că am acumulat o oareşcare experienţă în zona asta.
     Pe de altă parte, deoarece am şi o anumită vârstă şi o serie de şuroabe mi-au ruginit de-a lungul timpului şi scârţâie ba pe ici, ba pe colea, şi n-am nici cea mai vagă idee ce planuri are Cel de Sus cu mine, cred că e bine să nu mai amân pe mâine ceea ce am de spus astăzi, pen’că mâine?!…

     Este adevărat că am postat în urmă cu câţiva ani etapele procesării unui text OCR în AutoCorect şi el rămâne valabil şi azi, dar cu timpul am mai constatat că unele etape pot fi mai eficiente dacă se mai adaugă câte ceva sau se modifică un pic… practic nişte mici chiţibuşuri.

     Nu ştiu dacă ordinea prezentării acestor mici şmecherezuri este cea mai comodă pentru Domniile Voastre, dar încerc să le pun într-o oarecare ordine.

     Acestea fiind zise, să purcedem la treabă!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 zile
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      ÎNLOCUIRI SIMPLE ÎN AC vs. ÎNLOCUIRI ÎN WORD



     Discuţia asta nu este nouă, deci nu face parte dintre micile chiţibuşuri, dar vreau să mai insistăm un pic asupra acestui aspect.

     Mulţi utilizatori consideră că e o pierdere de timp să mai ruleze dicţionarele cu confirmare, mergând pe ideea că dacă mai e nevoie de înlocuiri, acestea se pot face destul de bine şi în Word sau în alt editor de text.
     Eu insist să spun că e mai comodă rularea dicţionarelor cu confirmare, deoarece:

     1. timpul este incontestabil mai scurt folosind aceste dicţionare decât să facem aceleaşi înlocuiri în Word;

     2. În AC există deja înregistrate eventualele erori, timp în care în Word trebuie ca mai întâi să fie descoperite şi apoi înlocuite. Iar dacă eroarea înregistrată nu există în text, pur şi simplu, dicţionarul trece la următoarea înregistrare cu viteză destul de mare.

     3. În fereastra AC cuvântul de înlocuit apare în centru ferestrei AC, deci se poate vizualiza foarte uşor contextul, astfel că avem o imagine mai clară a corectitudinii sau nu a cuvântului respectiv; în Word cuvântul căutat în text este afişat pe primul rând al ferestrei şi pentru a putea vizualiza contextul trebuie să urcăm manual câteva rânduri;

     4. În AC mausul stă aproximativ în aceeaşi poziţie, în fereastra de confirmare pe care o putem stabili să fie afişată în partea de sus a ferestrei principale şi doar apăsăm butonul „DA” sau „NU” ori „RENUNŢ”, timp în care în Word fereastra de căutare trebuie scoasă din fereastra principală pentru a putea vedea textul, şi de multe ori trebuie să trecem din fereastra de căutare în fereastra de text şi invers.
     Mai mult decât atât în opţiunea de „căutare” simplă din Ac, continuarea căutării se face cu butonul F3 fără a mai avea o fereastră de căutare; în Word continuarea căutării se face obligatoriu prin accesarea butonului Next.

     Folosirea dicţionarelor cu confirmare sau a înlocuirilor cu căutare simplă în AC este cu atât mai utilă cu cât scanul, respectiv OCR-ul  este de calitate mai slabă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 4 zile
   
dacopand
Membru Junior

Din: DACIA
Inregistrat: acum 9 ani
Subscriu în totalitate la observaţiile dlui seven.
Eu fac de multe ori verificări a unor cărţi, la care nu am decât în varianta word, o convertesc în rtf şi o trec prin AC pentru corectare si apoi revin la word.
Mie mi se pare mult mai rapid şi, am sesizat faptul că, atunci când am încercat corectarea documentului în word, NU am sesizat multe cuvinte scrise greşit, dar la rularea prin AC, aceste cuvinte nu au mai scăpat nedepistate.
Şi citisem wordul de multe ori si tot nu am sesizat cuvintele gresite.
Şi da, procedura este mai uşoară, să îi spunem ergonomic în AC.
Asta şi poate că eu m-am obişnuit mult cu AC şi nu am reuşit să cumpăr autocorrectul din word(despre care nici nu stiu mare lucru).
Cu respect,

Modificat de dacopand (acum 4 zile)


_______________________________________
„Forumul nu e o anexă a dormitorului sau a closetului de acasă.  E o ieşire în lume, cu tot ceea ce o asemenea ieşire presupune,  de la veşmânt la discurs.”
Andrei Pleşu

pus acum 4 zile
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

     DICŢIONARE NUME DE LOCURI ŞI PERSOANE



     Continuăm cu ceva mai uşor şi oarecum facultativ.

     EXPUNERE DE MOTIVE
     În cazul cărţilor de vechi, de dinaintea apariţiei calculatorului, când textele pentru tipar erau bătute la maşină iar în tipografii zeţarii culegeau literele de plumb, o serie de nume străine pot apărea în carte scrise în mai multe variante; de pildă nume care în componenţă litere duble [şi mă refer în special la consoane duble] pot apărea în text atât cu consoană dublă, cât şi în varianta simplă. Dacă e vorba de un nume cu două consoane duble în componenţă, avem deja vreo 4 variante.
     Pot apărea şi multe altele precum rocade W <> V sau Y<>J<>I şi multe altele.
     Deci chiar în cartea tipărită avem mai multe variante de nume, să le zicem greşeli de tipar.
     La toate astea se adaugă erorile de recunoaştere optică ale lui Abbyy sau alt program de acest gen.
     Şi nu în ultimul rând, sunt nume [mai ales nume de locuri] care în limba română erau folosite la momentul editării cărţii într-o anumită formă, iar între timp se foloseşte o altă formă. Şi aş da un singur exemplu: forma veche Lipsca pentru oraşul german Leipzig, de unde şi nume de străzi „Lipscani” pentru străzi pe care se aflau prăvălii ale unor comercianţi din acest oraş.

     Din păcate, nume scrise în mai multe variante apar şi la cărţi mai noi editate pe computer [situaţie în care s-ar observa mult mai uşor deviaţia de la numele corect al unui nume]. Există mai multe serii/cicluri de cărţi apărute în ultimii ani, la care editurile au folosit mai mulţi traducători, astfel că într-un volum un nume poate fi ortografiat într-un fel, iar în alt volum – al altui traducător, este ortografiat altfel.

     În concluzie, nu totdeauna este necesară crearea unui astfel de dicţionar – de aici şi afirmaţia „facultativ” de la începutul postării.
     Totuşi, în multe cazuri este necesar un astfel de dicţionar care să uniformizeze formele eronate ale numelor.
     Utilizatorul este singurul în măsură să stabilească dacă are nevoie sau nu de un astfel de dicţionar suplimentar.

     NOTĂ
     În cazul în care avem mai multe volume ale unui roman, este bine să avem deja la dispoziţie fişierele scan de la toate volumele [PDF sau DjVu] în care să putem face căutări de cuvinte, deci fişiere Searchable.



     Continuare postare 20.11.2024


     ETAPELE REALIZĂRII UNUI DICŢIONAR DE NUME
     – Ne aflăm în AutoCorect, având deschis primul OCR din serie/ciclu şi am făcut deja prima rulare OCR_Plus, adică dicţionare automate şi dicţionarele de la opţiunea 10.2 Corectare cuvinte rupte – cu confirmare.
     – Practic acum AC este rulat automat şi fişierul salvat automat.
     – Din acest moment ar trebui să ne ocupăm de eliminarea artefactelor şi a cratimei false, apoi de rularea dicţionarelor cu confirmare; În aceste etape avem posibilitatea să defilăm prin text şi să observăm numele de locuri şi persoane subliniate cu roşu, deci necunoscute de corectorul AC.

     PRACTIC vom desfăşura două activităţi separate:
     1. Identificarea numelui corect şi înregistrarea acestuia în Corectorul AC. Acest tip de înregistrare se face cu click dreapta pe cuvântul respectiv, iar în fereastra de opţiuni ce se deschide alegem a treia opţiune „Adaugă în dicţionar” şi pur şi simplu apăsăm pe această opţiune. În acest mod cuvântul s-a înregistrat în Corector şi nu va mai fi subliniat.
     2. Corectarea erorilor de afişare a numelui respectiv; acest lucru se face într-un dicţionar de tip „imd” [înlocuiri multiple] pe care îl vom crea noi dacă vom considera că este necesar.
     Pentru asta trebuie să creăm un dicţionar „imd” de nume, astfel:

     CREAREA DICŢIONARULUI DE NUME
     – Acţionăm asupra iconului de Înlocuiri Multiple care este ultimul din dreapta pe bara de iconuri, cel negru care se aseamănă cu două persoane una lângă alta. În mod automat se va deschide dicţionarul „implicit.imd”. Acest dicţionar ar trebui să fie gol, dar dacă conţine ceva înregistrări nu-i nicio problemă.
     – Apăsăm butonul „Salvare dictionar” şi se va deschide folderul principal „Dictionare_PRS”. Alegem locul [subfolderul] în care dorim să salvăm dicţionarul şi îi dăm un nume, de genul „NUME Titlu-carte.imd”, unde „Titlul_carte” va fi numele cărţii de prelucrat sau o prescurtare a titlului”. De exemplu pentru romanul foileton „Victor von Falk – Călăul din Berlin” eu am stabilit numele dicţionarului ca „NUME Călău.imd”
     Majuscularea cuvântului NUME am făcut-o doar pentru pentru a fi mai uşor de remarcat acest dicţionar.
     Dacă în folderul principal mai avem şi alte dicţionare, pentru a găsi mai repede acest dicţionar putem să-i adăugăm înaintea numelui un număr [ex. 01], o combinaţie literă cifre [ex: A1, A01] sau o literă ori două de la începutul alfabetului, astfel ca la indexarea automată dicţionarul să se afişeze undeva la începutul listei.
     Dacă dicţionarul „implicit.imd” a avut ceva înregistrări, acestea vor fi salvate şi în dicţionarul de nume; în acest caz selectăm toate înregistrările existente şi le ştergem, astfel încât dicţionarul de nume să rămână gol.
     N-ar fi rău, totuşi, să avem în acest dicţionar unul sau două separatoare [înregistrări false separatoare]. Voi reveni cu explicaţii asupra acestui tip de înregistrare.

     IDENTIFICAREA, VERIFICAREA ŞI ÎNREGISTRAREA CORECŢIILOR DE NUME ÎN DICŢIONAR
     Suntem în etapa de eliminare artefacte pe care o facem cu opţiunea „Căutare”. În timp ce defilăm prin text şi facem corecţiile respective, întâlnim printre alte erori şi nume de locuri şi persoane subliniate cu roşu, deci care nu sunt cunoscute de corectorul AC.

     Identificarea numelui:
     Presupunem că găsim un toponim [nume de locuri] precum „Molkenmartef” [este numele unei mari pieţe din Berlin, nume găsit în romanul „Călăul din Berlin”].

     Verificarea corectitudinii numelui:
     Este necesar să vedem dacă numele identificat este corect şi facem două categorii de verificări:
     – în cazul unui toponim prima verificare o facem cu ajutorul lui Gogu… Căutăm cu Google numele respectiv şi poate avem şansa să descoperim că numele este real şi în acest caz stabilim şi grafia corectă, deoarece e posibil ca grafia din text să fie un pic diferită; dacă grafia este diferită atunci deschidem dicţionarul imd de Nume creat şi facem înregistrarea de corectare a numelui.
     – a doua verificare o facem în scan; căutăm cuvântul respectiv şi vedem dacă apare într-un număr suficient de mare pentru a fi înregistrat. Dacă numele respectiv apare doar de 2-3 ori şi nu are o grafie complicată, atunci putem să-l ignorăm şi să nu facem.
     – există încă o situaţie: e posibil ca un toponim să aibă în limba română o formă consacrată, formă care diferă de numele oficial, astfel că nu înregistrăm London, ci Londra, nu înregistrăm Moskva ori Moscow, ci Moscova etc.

     Înregistrarea numelui corect în Corectorul AC:
     După ce am stabilit că un nume este corect, trebuie să-l înregistrăm în Corectorul AC pentru ca el să nu mai fie afişat subliniat cu roşu.
     Aşa cum am spus ducem cursorul undeva pe cuvântul respectiv, facem click dreapta şi alegem opţiunea „Înregistrare în dicţionar”.
     Unde se face înregistrarea?
     În folderul principal „Dictionare_PRS” există mai multe dicţionare cu extensia „dic” şi 4 dintre ele fac parte din Corectorul AC. Acestea sunt: a.dic, i.dic, np.dic şi p.dic.
     Dintre aceste dicţionare, două conţin înregistrări direct de la instalare şi sunt needitabile direct din AC – acestea sunt: a.dic care conţine abrevieri/prescurtări care se scriu cu 2-3-4 litere majuscule, respectiv np.dic care conţine o mică listă de nume proprii. Ambele dicţionare pot fi dezvoltate în Notepad sau alt editor de text simplu.
     Dicţionarul i.dic el este gol la instalare şi în el se adaugă corecţii făcute manual în opţiunea Ortografie; acest dicţionar nu ne interesează în cazul nostru.
     Cel de-al patrulea dicţionar p.dic este cel care ne interesează în mod special; aici se înregistrează cuvintele adăugate la dicţionarul ortografic. Deci atunci când facem click dreapta şi accesăm opţiunea Adaugă la dicţionar, aici se înregistrează cuvintele respective, fie ele nume de locuri şi persoane, dar şi alte cuvinte obişnuite.

     Dicţionarul este practic o listă de cuvinte scrise unele sub altele în ordinea adăugării la dicţionare, deci dicţionarul nu se ordonează alfabetic automat.
     El poate arăta cam aşa:
new
caffarelli
colonna
suleima
rebecca
santa
madalena
giovanna
raimondi
yusuf
allah
violetta


     Mai trebuie spus că toate cuvintele se înregistrează exclusiv cu minuscule, deci numele nu au majusculă iniţială, motiv pentru care corectorul nu sesizează ca eronat un nume scris fără majusculă iniţială.
     Dacă încercăm să edităm în Notepad o parte dintre nume şi să punem majusculă la început, corectorul nu mai recunoaşte aceste cuvinte-nume, deci dicţionarul p.imd trebuie să rămână scris exclusiv cu minuscule.

     După terminarea procesării unui roman [ciclu de romane], acest dicţionar poate fi periat în Notepad sau alt editor simplu de text, în sensul că putem şterge cuvintele care nu mai prezintă interes pentru un nou text.
     Bun! În acest moment am făcut înregistrarea numelui respectiv în Corectorul AC.



     POSTARE ÎN LUCRU

     Pentru că în aceste zile lucrez şi la volumul 3 al romanului Călăul din Berlin, printre picături mă ocup şi de continuarea acestei postări şi a următoarelor.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 3 zile
   
Pagini:  1 2  

Mergi la