Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
andreeadede pe Simpatie
Femeie
24 ani
Ilfov
cauta Barbat
24 - 39 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect - reactualizare Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini:  1 2 3 4
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani



      În cursul zilei de 1 noiembrie vor fi urcate pe mediafire ultimele versiuni AutoCorect OCR Plus.
      De asemenea vor fi urcate pachete de dicţionare OCR_DIC.
      Executabilele şi dicţionarele sunt realizate separat pentru cele două versiuni AC, adică există câte un executabil şi un pachet de dicţionare pentru AutoCorect OCR Plus Contemporan şi câte un executabil şi un pachet de dicţionare pentru AutoCorect OCR Plus Clasic.


      Ultima versiune AutoCorect OCR Plus împarte opţiunile din OCR_Plus în două categorii:

         - prima categorie are 10 pachete de opţiuni;
      Această categorie de opţiuni este recomandată pentru curăţarea OCR brut înainte de corectarea manuală.
      Opţiunile din cele 10 pachete pot fi accesate separat fiecare sau pot fi setate să ruleze toate sau o parte dintre ele în mod automat. 

         - a doua categorie are 3 pachete de opţiuni care sunt recomandate să fie rulate numai de utilizatorii cu experienţă şi cu pretenţii şi pregătire în domeniul editării.
      Ele nu corectează erorile de recunoaştere pe care le face Abbyy, ci fac modificări ale stilului de editare, corectează forme vechi sau greşite ale cuvintelor, înlocuieşte cuvinte cu sinonime, înlocuieşte liniile explicative cu virgule etc...
      Aceste opţiuni rulează numai separat [deci nu mai pot fi activate pentru rularea automată ameniului]

      Măsura reorganizării meniului a fost luată pentru a se evita situaţiile când un utilizator insuficent informat ar fi setat ca aceste opţiuni să ruleze în mod automat, deşi nu ar fi dorit să fie executate acele modificări.



_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      AutoCorect Standard Contemporan v4.1.5

           fişier "Instal": AutoCorect_CO_Std_Setup.rar
           ►►


      Executabile actualizate la 01.11.2012:
         


      Dicţionare reactualizate la 04.04.2016

      Fişier-arhivă:  Cpl DIC AC [2016.04.04].rar
      Adresă:   –  folder deschis mediafire



Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
raganar
MEMBRU VIP

Din: Codlea
Inregistrat: acum 16 ani
Care e diferenta dintre clasic si contemporan?

_______________________________________
Nu lasa pe maine ce poti face astazi, lasa pe poimaine ca poate nu mai e nevoie sa-l faci.
Micul fara mustar e ca barbatul fara femeie.

pus acum 12 ani
   
cuculean
Moderator

Inregistrat: acum 15 ani
î/â, sînt/sunt etc.

Sau ceea ce numeai tu "regramare" printr-o postare pe aici pe undeva.

Modificat de cuculean (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Contemporan - folosirea regulilor de scriere de după 1993: scrierea cu sunt, suntem, sunteţi şi â din a la mijlocul cuvintelor....
     Clasic - folosirea regulilor de scriere de dinainte de 1993: scrierea cu sînt, sîntem, sînteţi şi î din i în interiorul cuvintelor.

     Când AutoCorect se instalează prima dată, în folderul de instalare a programului îşi instalează şi o serie de dicţionare de limba română: DEX, Dic neologisme, Dic sinonime etc... pe care le încarcă automat şi pe baza cărora se face verificarea ortografică.
     Aceste dicţionare respectă regula de mai sus, deci ele sunt scrise cu î di i la varianta clasică şi cu â din a la Contemporan.

     AutoCorect OCR Plus face o curăţare a textului şi corectează o serie de erori pe care le face Abbyy. În afară de dicţionarele despre care am vorbit [DEX şi celelalte], pentru funcţionarea AC OCR Plus se mai copiază 39 de dicţionare [acestea nu se instalează automat, ci se copiază de utilizator într-un folder special].
     Aceste dicţionare au în acest moment un total de 8250 de înregistrări. Practic aceste înregistrări sunt înlocuiri de genul Find&Replace, dar care se fac la pachet.

     Este important de ştiut că un text scris cu î din i poate fi convertit de AutoCorect în text scris cu â din a.

     Pentru ca să se poată lucra atât OCR-uri care folosesc limbajul clasic, cât şi cele care sunt scrise în limbaj contemporan, atunci şi aceste 39 de dicţionare trebuie să fie în două variante.

     Să zicem că avem cuvântul "când" care a fost ocerizat după o carte veche în care era folosită scrierea cu î di i şi Autocorect l-a recunoscut sub forma "cind"

     Dicţionarele din AC OCR Plus Contemporan vor avea înregistrarea: cind >> când
iar dicţionarele din AC OCR Plus Clasic vor avea înregistrarea: cind >> cînd.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani


Începând cu acest executabil versiunea AutoCorect OCR Plus a devenit 5.1


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani

Seven a scris:

http://123poze.3x.ro/files/8712629339006647806.png

Începând cu acest executabil versiunea AutoCorect OCR Plus a devenit 5.1

Dictionarele uzuale si cele cu numere romane functioneaza ca si pana acuma?
Le incarca utilizatorul separat sau sunt integrate in OCR+?

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am deschis acest topic doar cu scopul de a informa cât mai mulţi utilizatori despre faptul că la 1 noiembrie au fost reactualizate executabilele şi dicţionarele AC OCR Plus, iar intenţia mea era ca topicul să fie şters astăzi.
   
     Dacă apreciaţi că el ar putea să fie util încă o perioadă de timp, el va mai fi păstrat pe secţiune atât timp cât este activ şi va fi mutat la "Atelier" doar atunci când va ajunge în pagina 3. Mă gândesc la pagina 3, pentru că în pagina 2 poate ajunge din întâmplare într-o singură zi.

      Încerc să dau câteva răspunsuri la întrebări care deja mi-au fost puse.
      Dacă mai sunt lucruri de clarificat, rog frumos să postaţi aici orice întrebare indiferent cât de lipsită de importanţă sau naivă ar putea părea. Important este ca un număr cât mai mare de utilizatori să beneficieze de acest instrument de curăţare a OCR-urilor şi să nu nechinuim să corectăm manual lucruri ce pot fi făcute automat în câteva minute.

      Încerc în continuare să răspund la câteva întrebări imaginare şi la câteva pe care le-am primit pe MP sau pe topic.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

              1. Ce tip de fişiere prelucrează AutoCorect OCR Plus?

     AC OCR Plus prelucrează fişiere de tip RTF.
     AC poate importa fişiere de tip DOC, dar salvarea se va face doar în format RTF.
     Se recomandă ca salvarea OCR în Abbyy să se facă în format RTF Formatted text [în cazul folosirii Abbyy 9] sau în format RTF Plain text [în Abbyy 11]. În acest fel nu mai este nevoie să se facă convertirea în Word din DOC în RTF.
     După rularea în AC, fişierul va fi deschis şi prelucrat în Word şi va fi salvat după dorinţă în rtf, doc, docx....


              2. Când poate fi folosit AutoCorect OCR Plus?
     AC OCR Plus se foloseşte pentru curăţarea OCR-urilor brute imediat după salvarea lor din Abbyy, înainte de executarea corecturii manuale.
     Este OBLIGATORIU ca după rularea textului în AC să se execute corectura manuală, deoarece la rularea dicţionarelor se fac în procente mici şi anumite modificări nedorite.
     La elaborarea dicţionarelor s-a mers pe principiul realizării unui maxim de înlocuiri corecte, chiar dacă aceeaşi înlocuire poate produce şi un procent foarte mic de modificări incorecte.

     Abbyy poate recunoaşte eronat litera "L mic" ca fiind cifra 1, litera i mare sau !, uneori chiar literele î, t; face confuzie între literele e şi c, dar uneori litera o cu defecte poate fi recunoscută ca e sau c. Se confundă grupul rn cu litera m, grupul cl cu litera d... Sunt multe alte astfel de erori.
     Să luăm ca exemplu erorile: <ma1, ce1 şi să-1>; <maI, ceI şi să-I> şi <ma!, ce! şi să-!> care sunt erori ale cuvintelor <mal / mai>, <cel / cei> şi <să-l / <să-i>.
     În cazul  <ma1, maI, ma!> dicţionarele înlocuiesc aceste erori cu cuvântul <mai> pentru că frecvenţa lui "mai" într-un text este mult mai mare decât a cuvântului "mal", care poate că nici nu apare în text. Cu toate acestea, nu este exclus ca în realitate să existe şi situaţii în care modificarea corectă ar fi fost "mal".
     În cazul <ce1, ceI şi ce!> şi <să-1, să-I şi să!> dicţionarele înlocuiesc aceste erori cu cuvintele "cel", respectiv "să-l", deoarece din testările făcute s-a constatat că litera L mic este recunoscută eronal ca cifra 1, litera i mare sau !.
     Totuşi, nu este exclus ca în unele cazuri să fi fost corectă înlocuirea cu cuvintele "cei" sau "să-i".

     Acesta este motivul pentru care rularea unui text prin AC OCR Plus se face totdeauna înaintea corecturii manuale şi nu după corectură. ideea de a "finisa" un text corectat prin rularea lui în AC este o eroare, deoarece s-ar putea produce modificări incorecte.


              3. Ce dicţionare ruleazăîn AutoCorect OCR Plus?
     În folderul OCR_DIC trebuie să existe 39 de dicţionare.
     În acest moment, cele 39 de dicţionare conţin un număr de 8252 de înregistrări.
     Acestea sunt: [le voi posta doar pe cele cu CO_ pentru varianta Contemporan; dicţionarele pentru varianta Clasic au aceleaşi nume doar că în loc de particula CO_,numele lor vor începe cu CL_]
     CO_Apco  CO_Apct  CO_Artef
     CO_CImf1  CO_CImf2  CO_CImf3
     CO_DFr
     CO_Elips 
     CO_Expr1  CO_Expr2  CO_Gcl
     CO_Grn
     CO_L1  CO_L2  CO_L3
     CO_LinD  CO_LinP
     CO_Midp
     CO_Sc1  CO_Sc2  CO_Sc3  CO_Sc4
     CO_SInc1  CO_SInc2  CO_SMed1  CO_SMed2  CO_STer1  CO_STer2
     CO_Var1  CO_Var2  CO_Var3  CO_Var4  CO_Var5  CO_Var6  CO_Var7

     CO_Vt1  CO_Vt2  CO_Vt3  CO_Vt4

     Primele 35 de dicţionare [de la Co_Apco până la Co_Var7, inclusiv] vor rula automat cu pachetele de opţiuni 1-8 şi 10 şi folosesc la curăşarea OCR.

     Ultimele 4 dicţionare [cele notate cu Vt] rulează în cadrul opţiunii suplimentare
"Modificări speciale de text / Modificări text corectat eronat" şi vor fi rulate doar de către persoanele care fac modificări de editare.

      Opţiunea "9. Rulare grup de dicţionare înlocuire multiplă", permite să fie rulate automat orice şi oricâte alte dicţionare, în afară de cele 39 menţionate mai sus.
      Pentru a nu aglomera folderul OCR_DIC  şi pentru a se putea face mai uşor reactualizarea dicţionarelor, se recomandă să se mai creeze un folder separat pentru dicţionare suplimentare în care să se copieze dicţionarele deja realizate numite Dicţionare UZUALE, Dicţionarele Cifre Romane etc.
      În acest folder suplimentar sau chiar într-un alt folder personal se pot crea dicţionare personale care să corecteze cuvinte pe care utilizatorul le găseşte cu ocazia corecturii unui text.

      Dicţionarele UZUALE care există la ora actuală conţin circa 1500 de înregistrări şi sunt următoarele:     
     Uz_A Uz_B Uz_C
     Uz_D Uz_E Uz_F
     Uz_G Uz_H
     Uz_I
     Uz_Î1 div; Uz_î2 într-;  Uz_î3 i-î
     Uz_J Uz_K
     Uz_L Uz_M Uz_N
     Uz_O Uz_P Uz_R
     Uz_S Uz_Ş
     Uz_T Uz_Ţ
     Uz_U Uz_V Uz_XY  Uz_Z

     Se constată că dicţionarele sunt organizete pe litere şi că pentru litera "Î" există 3 dicţionare, deoarece unul conţine cuvinte diverse, al doilea înlocuiri legate de cuvinte care încep cu "într-", iar cel de-al treilea înlocuieşte cuvinte care încep cu litera "î" dar pe care Abby le-a recunoscut ca începând cu litera "i".
     În aceste dicţionare se pot adăuga orice alte înregistrări pe care fiecare dintre noi le consideră utile.


              4. Cum se reactualizează dicţionarele noi în calculator?
     Reactualizarea dicţionarelor se face cu programul AC OCR Plus închis.

      Reactualizarea celor 39 de dicţionare din OCR_DIC
      - Se face download la noile pachete de dicţionare.
      - Se face dezarhivarea dicţionarelor.
      - Identificăm folderul OCR_DIC în care trebuie să copiem cele 39 de dicţionare.
      - Ştergem sau arhivăm şi păstrăm pentru orice eventualitate dicţionarele pe care le-am folosit. Important este ca folderul să rămână gol pentru a fi siguri că nu avem dicţionare rebele prin folder.
      - Copiem în folderul OCR_DIC cele 39 dicţionare menţionate mai sus.
      - AC OCR Plus se deschide şi poate funcţiona.

      Reactualizarea dicţionarelor uzuale şi suplimentare.
      Dacă utilizatorul nu a făcut înregistrări personale în dicţionarele de mai sus,atunci se poate proceda ca la OCR_DIC.
      Dacă utilizatorul a făcut deja îmbunătăţiri ale dicţionarelor poate renunţa la reactualizare, ori poate să le copieze într-un folder temporar şi să facă o comparaţie a fiecărei perchi de dicţionare [dicţionarul Uz_A.imd pe care îl avea în computer şi Uz_A.imd downloadat] şi să observe dacă sunt înregistrări în plus pe care le copia în dicţionarul său.
      Cea mai uşoară comparaţie se poate face într-o pagină Excel copiind alăturat cele două dicţionare, care mai întâi au fost sortate.


              5. Cum se reactualizează executabilele noi în calculator?
      Dacă avem deja instalat una dintre variantele AutoCorect OCR Plus şi vrem să-l actualizăm cu un nou executabil se procedează astfel:
      - programul AC OCR Plus este închis.
      - Se face download la noul exe [care, de regulă, este arhivat].
      - Extragem din arhivă executabilul "AutoCorect.exe".
      - Identificăm folderul "C:\Program Files\AutoCorect Contemporan" în care trebuie să copiem noul executabil "AutoCorect.exe".

      Dacă nu avem instalată una dintre variantele AutoCorect OCR Plus,atunci se face o instalare de la zero, mai întâi instalând AutoCorect Standard şi apoi reactualizând executabilul.
      Informaţii despre acest lucru în tutorialul:
      [AC1] Instalare si reactualizare AutoCorect OCR_Plus.pdf
     


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
mastica65
Membru Senior

Din: Timisoara
Inregistrat: acum 12 ani
trebuie sa dezinstalez versiunea veche (5.0) ca sa-l pot folosi pe acesta (5.1)...?

eu am dezinstalat tot (curatat cu RevoUninstaler), am pornit executabilul ([01.11.2012] exe AutoCorect Contemporan) dar in autocorectul deschis imi spune ca este versiunea 5.0 nu 5.1

acest executabil (AutoCorect.exe) nu este un installer?

petru ca nu a rulat astfel ci s-a deschis programul direct

ruleaza normal cand corectez un rtf...dar

LE:

vechiul executabil (AutoCorectSetup_Contemporan.exe) instalat de mine avea 48MB iar acesta are 6MB

Modificat de mastica65 (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ieri am actualizat de două ori executabilele.
      Ca să fie mai clar pentru fiecare utilizator că lucrează cu ultima versiune, am propus lui Cosmin să modifice versiunea din 5.0 în 5.1.
      La prima oră am urcat executabilele noi, dar pe care scrie V5.0, iar după amiază le-am înlocuit cu cele pe care scrie 5.1.
      Practic este vorba despre absolut aceleaşi executabile, doar că s-a modificat numărul versiunii.

      Nu, versiunile noi "exe" ale AC OCR Plus nu sunt de tip installer; ele sunt dor fişierul AutoCorect.exe din folderul de instalare.
      Acel fişier iniţial este aşa de mare deoarece la prima instalare se instalează dicţionarele limbii române [DEX şi celelalte],care sunt foarte mari.


       Dacă aţi dezisnstalat complet AutoCorect,atunci trebuie făcută instalarea ca la prima instalare, adică:
       - se instalează mai întâi AutoCorect Standard [AutoCorect v.4.1.5] de pe saitul oficial:
                     
       - apoi se face reactualizarea executabilului cum am arătat mai sus.

       Dacă nu instalăm mai întâi AutoCorect Standard, programul pare că lucrează normal, dar... nu va rula ortografia şi probabil şi alte opţiuni care au nevoie şi de celelalte fişiere din folderul de instalare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
mastica65
Membru Senior

Din: Timisoara
Inregistrat: acum 12 ani
ok...

vroiam sa fiu sigur ca lucrez cu cel nou



pus acum 12 ani
   
dewlight
Membru Senior

Inregistrat: acum 13 ani
Seven, utile info.
O intrebare mai am: locatia folderului OCR_DIC este cea din Users/User Name/AppData/Roaming/AutoCorect Contemporan/Dictionare?

Sugestia mea este ca acest topic sa ramana o perioada de timp mai lunga pe prima pagina, mai mare decat cele 48 de ore pe care le-ai mentionat, ca suport pentru cei care nu sunt familiarizati cu Autocorect-ul.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Da, locaţia folderului OCR_DIC este cea pe care ai menţionat-o, dacă e vorba de Windows 7.

      Reamintesc şi pe cea pentru Win XP:
          C:\Documents and Settings\NUME\Application Data\ AutoCorect Contemporan\Dictionare

      Dacă topicul este util, atunci el poate rămâne mai mult timp.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
mastica65
Membru Senior

Din: Timisoara
Inregistrat: acum 12 ani
optiunea Corectare OCR (ultima din panoul lateral) este cumva suma celorlalte optiuni de mai sus?

sau se pot folosi si celelalte, dupa o rulare automata a Corectare OCR?

si in ce cazuri, daca este asa...

multumesc


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani



     Dacă te referi la ultima opţiune din panoul din stânga, în dreptul căreia am scris "Comandă rapidă pentru AutoCoredct OCR Plus", răspunsul este:

     Aceasta e o scurtătură [comandă rapidă] pentru prima opţiune din meniul OCR Plus, adică opţiunea Rulează toate funcţiile de corectare OCR.

     Deci, ori că accesezi această comanda rapidă, pri că accesezi opţiunea Rulează toate funcţiile de corectare OCR,programul face acelaşi lucru, adică îşi permite rularea celor 10 pachete dewstinate corectării OCR.

     Mai multe detalii se pot găsi pe topicul: [AC] AutoCorect OCR Plus - Instructiuni de folosire, unde este analizată fiecare opţiune în parte, inclusiv recomandări pentru activarea sau neactivarea unora dintr ele.
     De exemplu,nu putem seta să ruleze toate cele 3 opţiuni de la pachetul 7 sau de la pachetul 8, pentru că ele se anulează reciproc şi computerul ar munci la greu şi degeaba.
     La 7 şi 8 este obligatorie alegerea unei singure versiuni, pentru că practic putem alege doar o variantă de setare din 3 posibile.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
printzuska
Membru Gold

Din: Constanta
Inregistrat: acum 12 ani
buna...la mine nu exista folderul OCR_DIC ci Dictionare...trebuie sa fac un folder nou ? sau sterg din el si pun dictionarele, cele 39

pus acum 12 ani
   
printzuska
Membru Gold

Din: Constanta
Inregistrat: acum 12 ani
calea  Users/User Name/AppData/Roaming/AutoCorect Contemporan/Dictionare, nu am AppData/Roaming....ce am gresit de nu mi-a aparut?

Modificat de printzuska (acum 12 ani)


pus acum 12 ani
   
corall
Membru Gold

Inregistrat: acum 17 ani
Pentru Printzuska

Pentru a vedea folderul AppData trebuie sa-l faci vizibil acesta fiind un folder ascuns.
Ca sa-l faci vizibil trebuie sa urmezi pasii:
- dupa ce ai ajuns in C:\Users\Nume\ - faci click pe butonul Organize (se afla in stanga sus) - mergi la "Folder and search options" si click pe el. Se va deschide un meniu numit Folder Options.
- acest meniu contine trei ferestre: General, View  si Search
- treci pe fereastra a doua "View" - si de aici din optiunea "Hiden files and folders" - bifezi "Show hiden files, folders and drivers " -click pe Apply - OK - astfel faci vizibile folderele ascunse de sistem.

Calea dictionarelor in Windows 7 este urmatoarea:
C:\Users\nume_utilizator\AppData\Roaming\AutoCorect Contemporan\Dictionare
In folderul Dictionare se mai creaza inca doua:
1. OCR_DIC - in el se pun cele 39 de dictionare
2. Dic_Suplimentare - in el se pun dictionarele suplimentare cele cu cifrele romane  si dictionarele uzuale.


pus acum 12 ani
   
printzuska
Membru Gold

Din: Constanta
Inregistrat: acum 12 ani
Multumesc mult. Am facut asa cum ati spus si mi-a reusit.

pus acum 12 ani
   
deletlon
Membru Gold

Inregistrat: acum 13 ani
Sal all.Am o intrebare.Pentru functia import doc/html....programul cere un programel...de import files ...trebuie instalat separat...nu ma pricep...care o fi?  Scz daca sunt  tamp...........

off topic  ...e bai daca folosesc a 10 ?  or voi recomandati 9 sau 11???  am doar 10

Modificat de deletlon (acum 12 ani)


_______________________________________
O carte pe lună. 🌒

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani

deletlon a scris:

Sal all.Am o intrebare.Pentru functia import doc/html....programul cere un programel...de import files ...trebuie instalat separat...nu ma pricep...care o fi?  Scz daca sunt  tamp...........

off topic  ...e bai daca folosesc a 10 ?  or voi recomandati 9 sau 11???  am doar 10


Da, asa este. AC-ul cere instalarea unui filtru de conversie pentru importarea docurilor.
Asteptam raspunsul lui Cosmin.

Si o alta chestie:
- in dosarul OCR_DIC ar trebui facut un alt dosar, eu ii zic Dictionare Incarcate Automat. Locatia acestui dosar sa fie integrata in exe, tot asa cum e si cea a OCR_DIC-ului.
Toate dictionarele regasite in el, vor fi rulate de optiunea 9 a OCR+.
In felul acesta, putem uni cele 2 seturi de dictionare, uzuale si OCR+, si scapam de vesnica problema a incarcarii uzualelor in OCR+.
Pur si simplu, adaugam dosarul OCR+ in locul cerut de program, si totul merge de la sine.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

deletlon a scris:

Sal all.Am o intrebare.Pentru functia import doc/html....programul cere un programel...de import files ...trebuie instalat separat...nu ma pricep...care o fi?  Scz daca sunt  tamp...........

off topic  ...e bai daca folosesc a 10 ?  or voi recomandati 9 sau 11???  am doar 10


E vorba de acesta:
Se pot importa astfel doc/docx/docm în AutoCorect dar totuşi recomand, la documente de formatare complexă, să transformaţi cu Word în rtf. Asta deoarece Microsoft a limitat funcţionarea acestor filtre de conversie în alte programe decât cele proprii (făcute de Microsoft).


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani

ciuperca_cosmin a scris:


deletlon a scris:

Sal all.Am o intrebare.Pentru functia import doc/html....programul cere un programel...de import files ...trebuie instalat separat...nu ma pricep...care o fi?  Scz daca sunt  tamp...........

off topic  ...e bai daca folosesc a 10 ?  or voi recomandati 9 sau 11???  am doar 10


E vorba de acesta:
Se pot importa astfel doc/docx/docm în AutoCorect dar totuşi recomand, la documente de formatare complexă, să transformaţi cu Word în rtf. Asta deoarece Microsoft a limitat funcţionarea acestor filtre de conversie în alte programe decât cele proprii (făcute de Microsoft).

Si de treaba cu imbinarea dosarelor de dictionare nu zici nimic?


pus acum 12 ani
   
mastica65
Membru Senior

Din: Timisoara
Inregistrat: acum 12 ani

ciuperca_cosmin a scris:


deletlon a scris:

Sal all.Am o intrebare.Pentru functia import doc/html....programul cere un programel...de import files ...trebuie instalat separat...nu ma pricep...care o fi?  Scz daca sunt  tamp...........

off topic  ...e bai daca folosesc a 10 ?  or voi recomandati 9 sau 11???  am doar 10


E vorba de acesta:
Se pot importa astfel doc/docx/docm în AutoCorect dar totuşi recomand, la documente de formatare complexă, să transformaţi cu Word în rtf. Asta deoarece Microsoft a limitat funcţionarea acestor filtre de conversie în alte programe decât cele proprii (făcute de Microsoft).


iar daca nu ai inca docul si lucrezi in ABBYY la un scan oarecare, dupa finalizarea lui poti face salvarea direct in rtf pentru o prelucrare in AC



pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Si o alta chestie:
- in dosarul OCR_DIC ar trebui facut un alt dosar, eu ii zic Dictionare Incarcate Automat. Locatia acestui dosar sa fie integrata in exe, tot asa cum e si cea a OCR_DIC-ului.
Toate dictionarele regasite in el, vor fi rulate de optiunea 9 a OCR+.
In felul acesta, putem uni cele 2 seturi de dictionare, uzuale si OCR+, si scapam de vesnica problema a incarcarii uzualelor in OCR+.
Pur si simplu, adaugam dosarul OCR+ in locul cerut de program, si totul merge de la sine.



Teoretic e o idee bună, va ajuta unii utilizatori, dar problema e că in acest fel se pierde setarea manuală de dicţionare din fereastra de la 9.
O soluţie care ar împăca şi capra şi varza: la prima rulare a AutoCorect să încarce setul de dicţionare din acel folder; în fereastra de la 9 să fie adăugat un buton nou numit "Implicit" care la fel să încarce doar acel set de dicţionare; în rest fiecare va modifica acea listă cum îi va place.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
deletlon
Membru Gold

Inregistrat: acum 13 ani
Multumesc pentru raspuns.Am sa incerc si cu filtre si fara..sa vedem. Eu a mabby 10...imi recomandati alta versiune ?Multumesc.Riki.

_______________________________________
O carte pe lună. 🌒

pus acum 12 ani
   
Equinox
VETERAN

Inregistrat: acum 14 ani

deletlon a scris:

Multumesc pentru raspuns.Am sa incerc si cu filtre si fara..sa vedem. Eu a mabby 10...imi recomandati alta versiune ?Multumesc.Riki.

Abbyy 9 si 10 sunt foarte bune. Nu-ti recomand Abbyy 11.


_______________________________________
Urăsc prostia!
Star Wars - Banda desenata tradusa in limba romana

pus acum 12 ani
   
deletlon
Membru Gold

Inregistrat: acum 13 ani
Multumesc

_______________________________________
O carte pe lună. 🌒

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

utilitasetveritas a scris:

Si o alta chestie:
- in dosarul OCR_DIC ar trebui facut un alt dosar, eu ii zic Dictionare Incarcate Automat. Locatia acestui dosar sa fie integrata in exe, tot asa cum e si cea a OCR_DIC-ului.
Toate dictionarele regasite in el, vor fi rulate de optiunea 9 a OCR+.
In felul acesta, putem uni cele 2 seturi de dictionare, uzuale si OCR+, si scapam de vesnica problema a incarcarii uzualelor in OCR+.
Pur si simplu, adaugam dosarul OCR+ in locul cerut de program, si totul merge de la sine.


    Eu sunt împotriva modificării lucrurilor gândite şi croite într-un anumit fel şi pe care dorim să le ducem la croitoreasă să le mai strâmteze sau să le mai adauge o pensă pe ici pe colo să mai facă o modificare bună sau rea dar să facă neapărat ceva modificări.

    Problema RTF şi DOC
    Dacă cel ce munceşte de 11 ani la acest program, Cosmin Ciupercă, cel care a scris fiecare literă din tot programul, spune că l-a creat să lucreze corect cu RTF, atunci se cheamă că nimeni nu ştie mai bine decât el ce spune şi RTF rămâne.
    Orice altă propunere este o improvizaţie şi ca în cazul oricărei improvizaţii, cine a făcut-o îşi asumă riscul..


     Privind dicţionarele
    1. Cele 39 de dicţionare din OCR_PLUS care rulează automat le-am lucrat cu atenţie, dar nu e imposibil ca în cele peste 8200 de înregistrări să fie şi prostii, adică un număr de înregistrări care nu au condiţiile puse corect, ori ar putea produce şi alte modificări decât cele pe care mi le-am propus.
     Am rugat şi altă-dată ca ceea ce pare suspect să fie postat pe forum ca să vedem ce trebuie corectat.
     Acestea trebuie să fie în OCR_DIC şi aici nu am altceva de spus în legătură cu ele.

    2.Dicţionarele Uzuale, cele de Cifre Romane, alte asemenea dicţionare nu sunt valabile oriunde şi oricând şi nu pot funcţiona decât separat de dicţionarele OCR_DIC.
    Acelea sunt nişte dicţionare pe care eu le-am creat pentru amă ajuta la o carte anume, care avea nişte erori caracteristice.
    La rularea lor la alte cărţi e posibil să nu facă absolut nicio modificare.

    Acele dicţionare sunt doar nişte exemple.
    Singurele importante sunt cele 3 de la litera "Î"
    Dicţionarele Uz_Î1 - diverse.imd, Uz_Î2 într- [208].imd şi Uz_Î3 [i - î] 682.imd sunt importante pentru toate textele şi oricum sunt greu de editat pentru că au multe înregistrări.

    Celelalte însă, nu sunt decât un model ca fiecare să îşi completeze propriile dicţionare atunci când se impune să facă nişte înlocuiri care nu sunt făcute de AC.

    Există de exemplu de dicţionar care se cheamă probabil "Nume_Rom.imd în care sunt modificări care în unele cazuri sunt valabile, în altele nu.
    De exemoplu: Abbyy îmi punea toate numele Maria sub formă de Măria, astfel că am făcut o modificare
          Măria >> Maria
această înregistrare va derabja pe cei ce lucrează carte istorică unde apare expresia Măria Ta, aşa căori elimină înregistrarea ori lasă aşa şi adaugă încă una de forma:
          Maria Ta >> Măria Ta

     Deci trebuie săne uităm în acele dicţionare şi să adăugăm ce ne mai trebuie, ştergând ceea ce nu ne foloseşte.

     Din acest motiv nu trebuie ca aceste dicţionare să fie cuplate,unite sau alte chestii.
     Ele pot sta în folder separat lângă folderul OCR_DIC şi nu vărsate în el.
     Eu am în Dicţionare vreo 5 foldere,pentru că uneori avem nevoie de nişte dicţionare care să corecteze numele franţuzeşti de locuri sau persoane, alteori numele sun germane sau asiatice etc...
     Poate cineva lucrează un document de drept sau ceva de medicină şi are nevoie de nişte termeni specifici la un moment dat, dar nu-i vor mai trebui la alte cărţi.

      Deci, lângă folderul OCR_DIC din Dicţionare se poate crea folderul Dicţionare Uzuale sau sub orice alt nume şi nu este nicio problemă dacă ele stau acolo.

      La opţiunea 9, la prima rulare a AC se pot seta ce anume dicţionare dorim să ruleze. Setarea se va păstra până când dorim să facem o modificare,adică să mai adăugăm sau să ştergem un dicţionar sau mai multe.
      Nu enevoie să încărcăm toată ziua aceste dicţionare. Setarea se păstrează permanent atât timp când nu ştergem programul din computer.
      Aşa că nu e nevoie de un buton în plus.

      Îmi pare rău că tasta "Spaţiu" dă erori şi sunt multe cuvinte lipite.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ei, uite ca treaba asta cu uzualele nu o  stiam.
Ramane ca si pana acum.


pus acum 12 ani
   
eowinn
Membru Gold

Inregistrat: acum 19 ani
Poti sa faci si o varianta portabila ?

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Se poate face în 2 feluri:
1. O versiune separată în care se bagă toate dicţionarele în executabil respectiv să încarce pe cele care se modifică des dintr-un folder lângă exe.
2. Să apelaţi la a_catalin să facă o versiune portabilă cu Spoon Studio (a mai pus astfel de versiuni pe secţiunea "New softwarez".
Cu prima se obţine calitate mai bună cu 5..10% decât a doua, dar e mult mai mult de muncă.
Dacă sunt mulţi care vor portabilă voi încerca eu să fac versiune separată.


pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani

ciuperca_cosmin a scris:

Se pot importa astfel doc/docx/docm în AutoCorect dar totuşi recomand, la documente de formatare complexă, să transformaţi cu Word în rtf. Asta deoarece Microsoft a limitat funcţionarea acestor filtre de conversie în alte programe decât cele proprii (făcute de Microsoft).


Eu evit RTF-urile. Pina salveaza trece o gramada de timp si uneori se mai si blocheaza. Si mai are si autosave. Mai mult astepti sa salveze decit sa citesti.
La DOC il salvezi cind vrei.


pus acum 12 ani
   
corall
Membru Gold

Inregistrat: acum 17 ani

meridiane a scris:


ciuperca_cosmin a scris:

Se pot importa astfel doc/docx/docm în AutoCorect dar totuşi recomand, la documente de formatare complexă, să transformaţi cu Word în rtf. Asta deoarece Microsoft a limitat funcţionarea acestor filtre de conversie în alte programe decât cele proprii (făcute de Microsoft).


Eu evit RTF-urile. Pina salveaza trece o gramada de timp si uneori se mai si blocheaza. Si mai are si autosave. Mai mult astepti sa salveze decit sa citesti.
La DOC il salvezi cind vrei.


Aici cred ca ai inteles putin gresit, Cosmin recomanda pentru corectarea in Autocorect, formatul RTF, dupa care se revenea la doc, docx pentru corectarea prin citire.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cred că ar trebui să spun câteva lucruri care ar putea lămuri câteva dileme:
     
      1. În ce etapă a digitalizării a fost gândit AC OCR Plus să fie rulat?

      Prima etapă: extragerea OCR
      Pornim de la Abbyy: OCR-ul din Abbyy îl salvam direct în format RTF şi nu în DOC, pentru ca să nu pierdem timpul cu tot felul de convertiri.
      Repet ceva ce am mai spus: mie personal mi se pare că în Abbyy 9 cel mai bun format este RTF - Formatted text, pentru că păstrează şi caracteristica italică, respectiv bold a fontului ceea ce la multe cărţi este foarte important.
      În Abbyy 11 [sau 10] este indicat doar RTF - Plain text, deoarece alte formate salvează o grămadă de lucruri care nu ne folosesc dar ne încurcă.
      În concluzie, din Abbyy salvăm numai în format RTF şi nu în alt format.

      Etapa a doua: periere facultativă.
      În funcţie de câteva lucruri, etapa asta poate exista sau nu.
      Se deschide RTF-ul extras dib Abbyy cu Word şi aici putem face câteva mici perieri, eliminarea titlului şi numelui autorului atunci când ele au fost tipărite pe fiecare pagină, eliminarea informaţiilor de după copertă, cele care se referă la caracteristicile tehnice ale cărţii, eventualele fragmente de imagine sau imagini care nu ne interesează.
      Se pot face mult mai multe mici perieri sau se poate sări peste etapă. La ieşirea din Word salvarea se face tot în format RTF.
      Atenţie: dacă fişierul este foarte mare, adică avem o carte cu peste 300 de pagini tipărite, atunci recomand împărţirea cărţii în 2-3 fişiere de circa 200-250 de pagini pentru rularea mai rapidă prin AutoCorect.
      Diferenţa la timpul de rulare a unui fişier de 600 de pagini faţă de unul de 300 de pagini nu este doar de două ori adică 600/300 = 2, ci va fi de 2 la puterea a doua, adică de vreo 4 ori, iar unul de 900 de pagini va dura de peste 6 ori mai mult.

      Etapa a treia:
      Rularea automată prin AutoCorect OCR Plus:     
      Avem deci fişierul în format RTF, AutoCorect se înţelege foarte bine cu acest format, aşa că lucrurile vor trebui să funcţioneze normal.
      Setăm opţiunile pe care dorim să le rulăm automat şi trecem la rularea automată.
      În partea finală computerul ne cere să confirmăm sau nu o serie demodificări de cuvinte care au doua variante corecte în limba română.

      Deşi am mutat nişte opţiuni, mai sunt încă unele dintre cele ce pot fi rulate automat pe care unii pot să aleagă să le ruleze sau nu. Deci nu mergem pe rularea tuturor opţiunilor posibile, ci mai întâi ne documentăm cam ce face fiecare opţiune şi ce anume ne dorim să rulăm.
      În tutorialul despre care am mai vorbit am analizat fiecare opţiune în parte şi am propus marcarea sau demarcarea în fiecare caz.
      De reţinut că ceea ce am stabilit la o primă rulare rămâne salvat în program şi nu trebuie reluate setările la fiecare rulare, ci doar atunci când vrem în mod intenţionat să facem o modificare a setărilor. Din acest motiv trebuie ca prima setare să o facem pe îndelete, fără grabă şi în cunoştinţă de cauză.
     
      După rularea, salvăm şi ieşim din AC. Bineînţeles că salvarea va fi în format RTF.

      Etapa a patra: revenim în Word şi putem face o serie de chestii preliminare, sau pur şi simplu revenim doar pentru a converti fişierul în format DOC.
      De aici înainte putem lucra în format doc.
      Cei avansaţi care ştiu să facă înregistrări în dicţionarele AutoCorect nu se vor grăbi cu convertirea în Word pentru că mai pot adăuga ceva modificări într-un dicţionar de lucru şi vor dori să mai ruleze fişierul în AC doar pentru a face modificările din acest dicţionar de lucru.

      Deci, nu este nevoie să convertim de multe ori fişierele din doc în rtf sau invers, ci putem alege varianta aceasta,pentru că în acest sens a fost gândit AutoCorect OCR Plus. Practic el face o periere automată în timp de câteva minute ca să-l ajute pe utilizator.


      AutoCorect OCR Plus Portabil
      De ce nu este indicat un portabil în cazul concret al AC OCR Plus?
      Pentru că nu e nevoie să ruleze toate dicţionare create. Unele şterg caractere pe care alţii doresc să le păstreze.
      Deci nu trebuie încărcate toate dicţionarele automat
      Pentru că dicţionarele nu rulează în ordinea lor alfabetică, ci în ordinea opţiunilor,iar schimbarea ordinii ar bulibăşi modificările făcute.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       Sau, spus mai plastic.

       Cineva îşi zugrăveşte casa... - asta ar fi ca extragerea OCR

       - după ce s-a terminat cu zugrăvitul ridică foliile de pe podea dacă le-a avut, mai râcâie eventuale picături de material şi scoate gunoiul.  - asta ar fi ca perierea facultativă;

       - după ce gunoiul mare a fost scos dă cu mătura [sau cu aspiratorul] ca să facă un fel de curăţare primară; - asta ar fi cam ca rularea prin AC OCR Plus.

       - în final gospodina ia la mână fiecare colţişor din casă, îl curăţă, îl prontoieşte, clearuieşte, şlefuieşte, lustruieşte şi face totul lună; - asta e corectura manuală.

       La o adică mai poate da şi acum cu mătura [aspiratorul], doar că nu prea mai are ce mătura deoarece este totul curat.

       Cam asta face AutoCorect: el a fost gândit să măture OCR Brute, exact sau aproape exact aşa cum rezultă ele din Abbyy.

       Dacă cineva face corectură preliminară în Abbyy nu e o metodă greşită, doar că în cazul ăsta AC OCR îl va ajuta mai puţin deoarece el deja a periat textul.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Probabil ca stau cam prost cu intelegerea... 

Modificat de meridiane (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Eu mai mult ca sigur.
      Dacă ai spune cu mai multe cuvinte la ce te referi, poate aş putea să înţeleg despre ce e vorba şi eventual să spun ce ştiu despre problema în cauză.

      Nu mă pricep la programare nici cât baba la limba cantoneză, şi nici n-am afirmat vreodată aşa ceva, asta a fost treba lui Cosmin Ciupercă şi până la un moment dat a lui Daniel Morlova dar despre ordinea opţiunilor şi rularea dicţionarelor pot vorbi săptămâni întregi dat fiind că m-am ocupat de cel puţin 35 dintre ele şi pot crea alte oricât de dificile ar fi condiţiile unei înregistrări, la fel de uşor precum e mersul pe jos.

      Are cineva o neclaritate despre dicţionare? Pot să-l ajut fără nicio problemă pentru că la asta mă pricep şi nu mă dor mâinile să tastez o explicaţie.
       
      Altfel, dacă punem problema doar în parabole, mi se pare o tentă de mişto şi, sincer, deja regret timpul consumat pentru a da o mână de ajutor la realizarea acestui instrument.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
mastica65
Membru Senior

Din: Timisoara
Inregistrat: acum 12 ani
multumesc mult Seven pentru ca ai avut rabdare sa faci acest „rezumat”

e foarte util



pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani

Seven a scris:

      Altfel, dacă punem problema doar în parabole, mi se pare o tentă de mişto şi, sincer, deja regret timpul consumat pentru a da o mână de ajutor la realizarea acestui instrument.


Departe de mine gindul sa fac misto.



corall a scris:

Aici cred ca ai inteles putin gresit, Cosmin recomanda pentru corectarea in Autocorect, formatul RTF, dupa care se revenea la doc, docx pentru corectarea prin citire.


Si corectarea asta prin citire, nu se poate face tot in AC?


Eu pentru asta folosesc AC. Eu corectez in AC. Nu in word. Nu in abby.

Imi place teribil partea cu ortografia.

Daca se incarca (importa) un doc in AC, poti corecta si salva cind consideri.

Daca avem un RTF si fisierul este mai mare...
Ii da cu autosave cind vrea el (el fiind programul).
Si asta dureaza ceva timp.
Daca nu faci modificari in fisier citeva minute, cind dai un click sau incerci sa faci ceva iar salveaza.
In cele din urma daca se mai blocheaza de citeva ori, incepe sa-ti para rau de timpul pierdut...

Modificat de meridiane (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

meridiane a scris:

Daca avem un RTF si fisierul este mai mare...
Ii da cu autosave cind vrea el (el fiind programul).
Si asta dureaza ceva timp.
Daca nu faci modificari in fisier citeva minute, cind dai un click sau incerci sa faci ceva iar salveaza.
In cele din urma daca se mai blocheaza de citeva ori, incepe sa-ti para rau de timpul pierdut...


Salvarea automată e setată în configurare la 5 minute implicit, nu când vrea el - dar o poţi seta la un timp mai mare (10..30 min) mai ales dacă ştii că lucrezi cu texte mari. Sau o poţi dezactiva pur şi simplu.
Salvează atunci când e ceva de salvat. Deci dacă au trecut 5 min şi nu are ce salva nu o face. Dar dacă modifici ceva va salva - deci nu când doar dai un clic, ci când modifici ceva efectiv.
Când imporţi un doc, deoarece numele fişierului încă nu e setat, nu salvează automat. Are acelaşi efect cu dezactivarea salvării automate din configurare.

Sfatul meu este să lucrezi direct cu rtf şi să măreşti timpul de salvare automată (sau chiar să o dezactivezi).


pus acum 12 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Multumesc....


Si lui Seven

Multumesc...

Modificat de meridiane (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Meridiane,
      Îmi cer scuze! Am înţeles greşit. M-au cam lăsat nervii în ultimul timp şi poate că ar trebui să iau o pauză de la tot o săptămână două.

      Eu şi cu tine am vorbit de două lucruri diferite.

      Uite cum stă treba: eu nu pot să fiu scurt indiferent cât de mult aş încerca, aşa că pregăteşte-te să citeşti un capitol de roman.

      Digitalizarea la acest moment seamănă un pic cu artele marţiale: aşa cum artele marţiale au fost învăţate în multe şcoli fiecare cu specificul său, şi digitalizarea se face prin metode care diferă mai mult sau mai puţin între ele.

      Rezultatul final trebuie să fie acelaşi: luptătorul cunoscător de arte marţiale să învingă, iar corectorul de carte să realizeze o carte digitală citibilă.
      Aşa cum la asiatici ăia fiecare luptător are un sensei, mulţi dintre cei care digitalizează au sau au avut un mentor.

      De regulă au aplicat metoda de lucru a mentorului, chiar dacă pe parcurs a modificat-o pe ici pe colo.

      În ce program se face corectura MANUALĂ?
      Fiecare în ce editor este obişnuit şi în editorul în care el se simte stăpân pe situaţie.
      Foarte mulţi dintre cei ce corectează lucrează sub diverse variante de Linux şi folosesc OpenOffice sau Libre.
      Noi ăştia cu Win, mergem de regulă pe Word.
      "Utilitasul" nu iese din AutoCorect nici ameninţat cu tancul.

      Şi foarte mulţi, în ultimul timp, folosesc tablete sau eReadere şi marchează dacă tehnica le permite, sau notează pur şi simplu cu creionul pe hârtie problema constatată, urmând ca apoi s-o corecteze pe computer.

      Cei din şcoala veche fac corectura numai pe computer cu două ecrane împărţite pe monitor, în stânga scanul de control, în dreapta textul de corectat şi de regulăîn Word, pentru că cei mai mulţi folosesc stiluri în Word.

       Metoda este criticată de alţii, doar că fiecare metodă are avantajele şi dezavantajele ei şi nu exclude altă metodă; în plus ea a fost folosită pentru corectura cărţilor mai vechi scanate cu scanuri mai puţin performante în care Abbyy dădea multe erori ori pur şi simplu nu putea citi o bucăţică de text şi o considera imagine.

       Deci, poţi face corectura manuală în AutoCorect, dar tot ceea ce am spus mai sus se referă doar la rularea părţii din AutoCorect care se referă la OCR Plus.
       Şi mie îmi place ortografia din AutoCorect şi o folosesc frecvent, dar mă întorc la Word pentru că acolo mă simt eu mai bine.

       Aş menţiona un lucru: tu ai putea face partea de corectură manuală şi în AutoCorect Standard, deci nu neapărat în AutoCorect OCR Plus, pentru că la ortografie intră în funcţiune dicţionarele standard ale programului [DEX şi celelalte dicţionare] şi nu se rulează nicio opţiune din meniul OCR Plus.

       Cu toate astea, bănuiesc că înainte de a începe corectura manuală, faci rularea automată din OCR Plus.

       Chestia cu mătura-aspirator, treaba cu formatul RTF se referă [doar] la acestă etapă în care AC OCR Plus face rularea automată.
       Dacă vom încărca RTF aşa cum am spus mai sus, la opţiunea "1.2 Setare text la font şi mărime unică" timpul de rulare va fi unul decent; dacă vom încărca un DOC atunci putem avea şansa unui timp mai lung sau chiar a unei blocări.
       Acelaşi lucru se va putea întâmpla dacă din Abbyy vom alege formate mai complicate decât RTF - Formatted text, respectiv Plain text.

       În concluzie tot ce am vorbit în postarea de mai sus, inclusiv împărţirea textului pe bucăţi mai mici se referă exclusiv la acea parte de rulare automată care trebuie făcută înainte de corectura manuală.
       
       La rularea automată OCR Plus programul lucrează la capacitate maximă, consumând şi resurse pe măsură. Acolo trebuie să facem tot ce-i posibil ca programului să nu-i dăm de rumegat lucruri în plus.

       La corectarea manuală folosind opţiunea Ortografie lucrurile sunt ceva mai lejere, computerul nu mai ronţăie la maxim ci în parametrii normali de lucru.

       Dacă ai văzut că poţi să lucrezi bine în format Word, atunci poţi lucra în Word fără probleme.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Pai nici nu am de ce sa ies.
AC-ul in momentul asta ar trebui sa fie instrumentul perfect de corectura pentru incepatori si pentru a aplica o formatare minima de text.
Numai simplul fapt ca ai un meniu ce iti permite sa inserezi fara batai de cap temutele liniute (dialog, pauza, etc) si tot soiul de caractere din alte limbi, ar trebui sa il califice ca unealta perfecta a incepatorului in ale digitalizarii.
O alta minunatie cu care bate la fund oricare editor de text e functia de Punctuatie.
Functia asta e cu adevarat mana cereasca, permite detectarea randurilor lipsite de incheiere din n motive, tot soiul de chichite gen punct si virgula care risca sa scapa ochiului, etc.
Sa nu mai zic de faptul ca nu necesita instalarea acelor tastaturi suplimentare, no way, man.
Ai apasat pe Alt>S si ai sh. Si basta.

Cum naiba sa nu adori un asemenea program?
Ca sa nu mai zic ca e romanesc, ca e moaca si ca are suport tehnic chiar pe acest forum, si ca iti aplica automat pe putin jumatate din chestiile continute de ghidul RIF.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ce facem cu paginile goale rezultate din AutoCorect?

      Am primit această întrebare personal, dar cred că poate fi de interes mai larg.

      După rularea OCR prin AutoCorect, putem constata că o pagină de carte se termină pe pagina documentului undeva în partea de sus, iar următoarea pagină de carte începe pe următoarea pagină de document, deşi în pagina document rămâne liber suficient spaţiu.



       Nu este vinovat AutoCorect de acest aspect, nu el este cel ce a făcut forţarea paginii.
       AutoCorect este doar cel care prin schimbarea dimensiunii paginii a făcut să pară mai vizibil acest aspect de forţare a trecerii la pagina următoare.
       Mai multe detalii şi modul de rezolvare le-am notat într-un foarte-foarte mic tutorial [4 pagini A5] care se poate vizualiza  AICI  sau downloada de la adresa: Eliminare marcaj Page Break.pdf


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
printzuska
Membru Gold

Din: Constanta
Inregistrat: acum 12 ani
Dupa ce dau click pe OCR corectare, dupa un timp imi apare " dictionarul Uz_A.imd nu poate fi deschis". Puteti sa-mi explicati de ce imi apare asa ceva, chiar de fiecare data cand dau corectare OCR?

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani

printzuska a scris:

Dupa ce dau click pe OCR corectare, dupa un timp imi apare " dictionarul Uz_A.imd nu poate fi deschis". Puteti sa-mi explicati de ce imi apare asa ceva, chiar de fiecare data cand dau corectare OCR?


Nu folosi fisierele din topic, sunt versiuni vechi.

Detalii despre problema ta gasesti in penultima postare.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutări! Am revenit.
     printzuska, dacă mai ai probleme cu dicţionarele alea uzuale, atunci îţi pot explica şi eu unde e problema.

     Am mai editat câteva înregistrări. E vorba de vreo 500 de cuvinte scurte din 4 litere.
     Deocamdată sunt în fază de testare. Probabil la 1 ianuarie am să fac un nou update al dicţionarelor OCR_DIC.

     Mă interesează dacă aţi constatat probleme la următoarele trei perechi de cuvinte:
           cel - cei;       îl - îi        se - să;
     Dacă sunt probleme la aceste cuvinte, încerc să fac un dicţionar de expresii care să cuprindă astfel de cuvinte, dar se pare că necesită confirmare marea majoritate a înregistrărilor, aşa că nu prea aş vrea să fie introduse în OCR_DIC... poate în nişte dicţionare suplimentare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
printzuska
Membru Gold

Din: Constanta
Inregistrat: acum 12 ani
Nu mai am problema...le-am sters si le-am incarcat din nou si spre surprinderea mea a mers, asa ca nu mai am probleme. Multumesc.

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Deoarece câţiva useri m-au contactat, cerându-mi sfaturi în legătură cu etapele corecturii, am revenit la un topic vechi despre corectură, la care lucrez şi câteva dintre postări sunt gata reactualizate, iar altele sunt în lucru.
      Postările au trebuit să fie modificate în totalitate, deoarece topicul era depăşit la acest moment ca urmare a faptului că AutoCorect rezolvă multe lucruri dintre cele care înainte trebuiau rezolvate cu macrocomenzi sau o serie de înlocuiri complicate în Word.
      Topicul cu pricina se află pe secţiunea " Totul despre cărți - About e-books", la adresa:
      [TT] Precorectura si corectura cartilor electronice

      Este posibil ca pentru unii dintre userii noi, o parte dintre informaţii să apară ca o noutate mai greu de digerat; din acest motiv am hotărât ca topicul să fie adus acum în prima pagină şi nu după reactualizarea totală a lui, pentru ca informaţiile să apară în trepte şi nu basculate toate odată.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am îmbunătăţit câteva dicţionare prin adăugarea de noi înlocuiri.

      Am primit în ultimele zile un dicţionar de înlocuire multiplă cu un foarte mare număr de  înlocuiri.
      În principiu dicţionarul cumulează actualele înlocuiri ce sunt înregistrate în dicţionarele uzuale la care au fost adăugate multe alte înregistrări, astfel că dicţionarul primit cuprinde peste 3000 de înregistrări.
      Înregistrările sunt de toate genurile: secvenţe intermediare, secvenţe de început de cuvânt, cuvinte întregi, cu şi fără confirmare.

      Acest dicţionar va fi prelucrat astfel:
           - înlocuirile cu valabilitate largă şi FĂRĂ confirmare [în special cuvinte scurte de maxim 5 litere] vor fi prelucrate şi mutate în dicţionarele de tip OCR_DIC şi vor rula automat.
           - înlocuiri de cuvinte FĂRĂ confirmare cu frecvenţă mai mică, cuvinte specifice unor domenii sau unor genuri de cărţi, vor fi repartizate în dicţionarele pe litere din cadrul Dicţionarelor uzuale.
           - înlocuiri de cuvinte CU confirmare vor fi repartizate în cadrul OCR_DIC în dicţionarele CO_Var5.imd - CO_Var7.imd sau într-un dicţionar cu confirmare din cadrul Dicţionarelor uzuale.
           - vor exista şi un număr mic de înlocuiri care nu vor fi înregistrate ca urmare a faptului că procentul situaţiilor în care înlocuirile ar fi corecte este aproximativ egal cu procentul situaţiilolr în care înlocuirile ar fi incorecte, iar folosirea funcţiei cu confirmare ar consuma foarte mult timp.

      Pentru ca înlocuirile propuse să fie acceptate şi apoi repartizate în dicţionarele corespunzătoare, mai întâi fac o verificare a fiecărei înlocuiri în parte cu nişte executabile de căutare speciale pe care mi le-a pus la dispoziţie Cosmin, astfel că durata de timp în care voi face aceste modificări va fi una mai lungă [între o lună şi trei luni].

       Rog insistent userii care mă mai pot ajuta şi cu alte propuneri de înlocuiri să mi le transmită prin orice mijloc [pe forum, prin MP sau mail] şi sub orice formă: dicţionar de tip imd, sub formă de text ori foaie de calcul Excel.

      Pentru că oricum în acest moment trebuie să verific dacă o anume înregistrare a mai fost făcută deja în vreunul dintre dicţionare, mi-ar fi mult mai simplu să fac acest lucru pentru mai multe dicţionare, decât dacă aş repeta această verificare într-o perioadă următoare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Aşa cum am promis, am adăugat o serie de înregistrări la dicţionarele AutoCorect şi sunt în curs de selecţie şi analiză alte înregistrări.

      Sunt convins că există şi înregistrări la care am putea renunţa.
      Probabil există înregistrări cu confirmare care enervează prin apariţia lor puţin folositoare, în sensul că forma corectă este cea căutată şi sunt doar câteva situaţii în care înlocuirea să fie valabilă.
      De exemplu mă gândesc la înlocuirea cu confirmare ele >> de.

      Dacă apreciaţi că ar bine să renunţăm la unele dintre înregistrări care agasează prea mult, vă rog mult să veniţi cu exemple pe care să le analizăm.

      În principiu aş dori ca astfel de situaţii enervante să fie eliminate ori mutate la coada ultimului dicţionar, astfel încât să se poată renunţa sau continua după dorinţă.

      Aştept ajutor!   


      RE: pentru că topicul ar putea fi interesant pentru mai multe persoane, l-am "pus sus".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
La inlocuirea cuvintului

stingă ai decit optiunea stîngă

dar de multe ori trebuie inlocuit cu stînga.


Daca ai bifat in Corectare OCR 9 si 10,3 se repeta operatia pentru

unele cuvinte, cum ar fi:  ele, clar, pomi si multe altele.


Litera î ramine minuscula dupa linia de dialog.


Ma mai gindesc...

Modificat de meridiane (acum 11 ani)


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cuvantul "stingă" nu poate fi inlocuit corect decat daca utilizatorul ruleaza 2 seturi diferite si consecutive de inlocuiri cu confirmare.
stingă>stîngă
stingă>stînga

Optiunea 10.3 se refera la rularea unor dictionare personalizate de inlocuiri cu confirmare, sau, in cazul nostru, generale.
Daca te incomodeaza ce se intampla la rularea ei, ai 3 optiuni:
- debifezi 10.3
- folosesti alte dictionale de inlocuiri decat cele care au fost puse la dispozitie de Seven
- modific dictionarele deja existente.

In privinta literei mici de dupa dialog, da un exemplu.

Modificat de utilitasetveritas (acum 11 ani)


pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
De modificat dictionare...
Cine stie ce inseamna acele cpi...  si altele.

Daca ma incomodeaza sau nu?
Problema este ca se ruleaza si inlocuiri care au fost deja cerute a fi facute.
Sint dublate seturile de inlocuiri?
In acest caz ar trebui sa le cauti in dictionarele ce se ruleaza la 10.3 si sa le stergi.


Exemplu

— înseamnă că trebuie să ...

in loc de

— Înseamnă că trebuie să ...

Probabil ca trebuie o inlocuire de genul

Emdash sau endash sau ... spatiu î
se inlocuieste cu...
probabil cu confirmare


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mulţumesc, meridiane!
     Mă interesează orice constatare, indiferent cât ar părea ea de măruntă la prima vedere.
     Probabil următoarea variantă de dicţionare va fi şi ultima, adicăcea finală, astfel că aş vrea să se rezolve cât mai multe dintre probleme.

     Să încep mai întâi cu litera î/Î după linia de dialog.
     Nu-mi dau seama de ce programul nu rulează corect.
     Problema majusculării la început de paragraf, la început de frază şi la început de dialog ar trebui rezolvată la rularea opţiunii "4.4 Corectare minuscule la început de paragraf".

     În mod concret toate literele mici [c, î, j, o, p, s, ş, u, v, x, y, z] care apar după linia de dialog ar trebui să se transforme în litere mari [C, Î, J, O, P, S, Ş, U, V, X, Y, Z], deci inclusiv î >> î.
     În imaginea următoare la nr. 3 se face înlocuirea — î  >> — Î la început de paragraf.
     În acelaşi dicţionar mai există la 20:    . î  >>  . Î
     Înlocuirile sunt automate, fără confirmare.



     În legătură cu dublurile la rularea 9 + 10.3, trebuie ca mai întâi să verific ce  înregistrări cu confirmare există la 9 - rulare dicţionare uzuale.
     În dicţionarele uzuale nu ar trebui să existe înlocuiri cu confirmare, ci numai înlocuiri automate, dar ai dreptate, şi eu am avut senzaţia că apar nişte confirmări înainte de momentul 10.1 - 10.3

      LE: am găsit doar 3 înregistrări cu confirmareîn dic.uzuale, setate greşit astfel.
      Trebuia ca setarea să fie Cuvânt întreg la început de cuvânt şi am pus bifa un pic mai sus.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Cred ca am gasit problema. Se pare ca este o greseala de programare.

Ce se intimpla.

Cind se ruleaza 1.1 - Conversie dialog ... se inlocuiesc bullets-urile cu linii de dialog.
Apoi programul introduce un spatiu neseparator in loc de spatiu obisnuit.
Asta face ca toate minusculele din dictionar (nu numai î) sa ramina neschimbate.


L.E. Si la rularea optiunii 2.2 se introduce spatiu neseparator.

In aceste conditii 10.1. este inutila.


Intrebare: Ce rol are ^ in dictionare?

Modificat de meridiane (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      E posibil... spaţiul neseparabil apare la opţiunea: 2.2 Corectare linii de pauză şi linii de dialog, DAAAR,
NUMAI DACĂ este activată şi opţiunea 10.1 Setări finale / Înlocuire spaţiu după linia de dialog cu spaţiu neseparator.
      Dacă opţiunea 10.1 nu este activată [eu nu o activez şi de aceea nu am constatat problema asta] atunci nu se înlocuişete spaţiul normal cu spaţiul separator.

      Încerc să explic mai detaliat:
      Practic opţiunea 10.1 nu rulează decât dacă este rulată separat; când avem rulare automată, opţiunea 10.1 nu rulează ci transmite o comandă spre 2.2, care are două variante de funcţionare: pune după linia de dialog spaţiu obişnuit dacă 10.1 nu este activată SAU pune spaţiu neseparabil dacă 10.1 este activată.

     Mod de rezolvare: deocamdată nu mai activa opţiunea 10.1.
     Între timp voi adăuga în dicţionarul CO_Midp.imd şi variantele care au spaţiu neseparator.

    La întrebarea: "Ce rol are ^ in dictionare?"  răspunsul este următorul:
    Semnul arată că e vorba de un cod şi nu de un caracter:
    Astfel:
          ^l      =   orice literă mică
          ^L     =   orice literă mare
          ^+     =   EmDash
          ^-      =   EnDash
          ^+_   =   Spaţiu obişnuit
          ^+=   =   Spaţiu neseparabil

          ^t      =   tab
          ^h     =   Horizontal Bar
          ^a     =   apostrof românesc

    Aceste coduri apar în fereastra Înlocuiri multiple în partea de jos "sub" butonul "Caractere speciale".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Este adevarat ca in Corectare OCR spatiul neseparator apare la optiunea 2.2 numai daca este bifat 10.1 dar in acelasi timp apare si daca rulezi 2.2 din meniul OCR Plus, chiar fara 10.1 bifat.
Asta in cazul ca ai scapat de bullets inainte de a baga fisierul in AC.

Oricum nu are nici o importanta deoarece dupa rularea lui 1.1, indiferent daca este bifat 10.1 sau nu, dupa linia de dialog apare spatial neseparator.
Si nu poti sa nu-l rulezi pe 1.1.
Numai daca ai scapat inainte de bullets.
Dar trebuie sa nu rulezi nici 2.2.

Modificat de meridiane (acum 11 ani)


pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Inca o intrebare.

Daca vreau sa rulez 10.3 - Inlocuiri cu confirmare - primesc mesaj

CL var 5.imd nu poate fi deschis.

Dar daca rulez mai multe optiuni din corectare ocr nu primesc acest mesaj.

Sa inteleg ca nu am acest dictionar? Atunci ce ruleaza la 10.3?
Si daca nu il am de ce nu ma anunta si la rulare multipla?

Iar daca nu este, de unde apar cererile repetate de inlocuire pentru aceleasi cuvinte?


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Gata am reactualizat dicţionarul CO_Midp.imd de la opţiunea 4.4.
      Acum majuscularea rulează atţt în situaţiile când după linia de dialog există spaţiu obişnuit, cât şi dacă există spaţiu neserator.
      Singura problemă este că acum dicţionarul nu mai are 1979 de înregistrări, ci 2646.
      Până mai lucrez la celelalte dicţionare îl urc doar pe acesta în variantă reactualizată pe o adresă temporară.
      După dezarhivare, vechiul CO_Midp.imd se şterge şi se înlocuieşte cu noul CO_Midp.imd

      Nume fişier:   CO_Midp [2013.04.12].rar
      Adresa folder TEMP: 

      Deci, acum ar trebui să se facă corect majuscularea după dialog,indiferent dacă opțiunea 10.1 este marcată sau nu.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Ma scuzi ca pun atitea intrebari.


Daca am timp am sa ma uit si prin dictionare.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      meridiane, m-am ocupat în mod special de dicționarele de la Limbajul Contemporan, în sensul că toată logica modificărilor este gândită pentru Limbaj Contemporan, iar dicţionarele pentru Clasic sunt doar un fel de "traduceri".
      E posibil ca la Clasic să nu fie toate dicţionarele actualizate. [am verificat acum:  sunt şi ele la fel ca cele de la contemporan; practic lipsesc doar modificările la care lucrez acum, dar care nu au fost urcate pe host].

      Din întrebarea ta ar părea că foloseşti varianta Clasic, deoarece vorbeşti de dicţionarul CL var 5.imd; asta înseamnă că dicţionarul reactualizat de mai sus [CO_Midp.imd] nu-ţi va fi de folos, deoarece încă nu am făcut modificarea şi la CL_Midp.imd, iar acum nu prea am curajul să încerc să fac reactualizarea.

      Acum, concret la întrebarea ta:
      Am făcut o provă cu executabilul AC Clasic; la mine nu apare un astfel de mesaj, deci nu e o eroare a programului:
      La opţiunea 10 rulează următoarele dicționare:
      10.1 - rulează pe bază de cod
      10.2 = rulează 3 dicţionare: CL_Var1.imd  ÷  CL_Var3.imd
      10.3 = rulează 4 dicţionare: CL_Var4.imd  ÷  CL_Var7.imd

      E bine să verifici dacă ai acest dicţionarul CL_Var5.imd; e posibil să ruleze doar celelalte 3; oricum var4 cel destul de mare [în acest moment are 253 înregistrări - am mai adăugat eu câteva], deci sunt destule confirmări care se pot face.

      Deci, care variantă o foloseşti? AC Contemporan sau AC Clasic?

      LE:
      Nu este cazul să te scuz pentru întrebări, ci îţi mulţumeasc pentru ele!
      Astfel de întrebări mă ajută foarte mult pe mine ca să găsesc mai repede hibele şi să încercăm să le rezolvăm pe cele rezolvabile;  şi... sunt convins că întrebările şi răspunsurile folosesc şi altora, chiar dacă ei, dintr-un motiv care-mi scapă nu postează lucrurile pe care le-au constatat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Folosesc AC clasic.

Am doua computere si probabil ca am dictionare diferite pe ele.
Nici nu mai stiu care este ultima versiune.
Pe acesta am si CL 4 la 7. Pe celalalt numai 4.
Pe acesta imi cere cele mai multe inlocuiri de doua ori.

La o prima vedere

in CL_DVar1 este clacă - dacă, clar - dar.

in CL Var 5 gasim iarasi clacă - daca, clar - dar.

Sigur mai sint si altele.

In CL Smed1 este un cuvint cel putin ciudat - subecesibilit...

Modificat de meridiane (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ultima versiune a dicţionarelor şi executabilelor se găsesc pe mediafire la adresele:
            - executabile:
            - dicţionare OCR_DIC:
      Pentru fiecare dintre ele există atât varianta Contemporan, cât şi varianta Clasic

       La ele se poate ajunge foarte uşor accesând linkul Mediafire din semnătura mea care duce la un folder ce conţine 4 subfoldere:
           - 1.Executabile OCR Plus
           - 2.Dicţionare OCR_DIC
           - 3.Dicţionare Suplimentare [UZUALE]
           - 4.Documentatie - Aprilie 2012
       Totdeauna în aceste adrese se află doar ultima versiune de executabile şi dicţionare.

*********************

       Referitor la dicţionarele CL_DVar1.imd şi CL_Var5.imd:

       La un moment dat au existat 12 pachete de opţiuni; la ultima opţiune erau 4 dicţionare numite CL_DVar1 ÷ CL_DVar4.

       S-a reorganizat rularea automată la 10 pachete de opţiuni, iar dicţionarele cu variante şi confirmare au fost dezvoltate, devenind 7 dicţionare numite CL_Var1 ÷ Cl_Var7.
       Practic nu numai că au apărut încă 3 dicţionare în plus, dar au fost şi reorganizate, astfel că ceea ce era în primele 3 dicţionare - acum se află în primele 4, iar ceea ce era în dicţionarul 4 acum se află în 3 dicţionare [adică nr 5, 6 şi 7].
     Cele mai multe înregistrări din fostul CL_DVar4.imd acum rulează în actualul CL_Var5.imd
     Ca să nu existe confuzie a fost eliminată litera "D" din numele dicţionarului.

     Eu cred că în unul dintre computere există o parte dintre dicţionarele vechi şi o parte dintre cele noi şi de aici apare repetarea clacă - daca, clar - dar...

*********************

     Dicţionarele SInc, SMed şi STer cuprind secvenţe de la începutul cuvântului [SInc], de la mijlocul cuvântului, deci secvenţe mediane [SMed] şi de la sfârşitul cuvântului, deci secvenţe terminale [STer].

     Exemple: menţionez că erorile apar la secvenţele scrise cu litere mici; eu voi folosi acum şi litere mari ca să fie mai vizibile.

     Secvenţe de început: rc >> re, rn >> m...
     În limba română niciun cuvânt nu începe cu rc [RC], ci doar cu re [RE], astfel că am pus secvenţa rc >> re cu condiţia cuvânt întreg la început. la fel la rn [RN]...

     Secvenţe în interiorul cuvântului [secvenţe mediane];
     Iau două situaţii: litera C între două consoane şi litera L între două consoane; în principiu, nu există literele C sau L între două consoane, fapt pentru care ele în realitate sunt litera E mic şi litera I mic.
     Cum am procedat? Am luat fiecare secvenţă posibilă: bcc, bcd, bcf, bcg.... până la zcv, zcx, zcz... şi am căutat dacă există respectiva succesiune cu litera C intercalat; dacă nu exista această succesiune o înlocuiam cu secvenţa care conţinea E mic intercalat, astfel că succesiunile au devenit bec, bed, bef, beg.... ...zev, zex, zez;
     La fel am procedat cu blc, bld, blf, blg.... ...zlv, zlx, zlz, pe care le-am modificat în bic, bid, bif, big.... ...ziv, zix, ziz.

     Cum am făcut căutarea? Am un executabil special de căutare care îmi permite să caut la început de cuvânt, la sfârţit de cuvânt sau oriunde; executabilul l-a realizat Cosmin şi căutarea am făcut-o în dicţionarele din folderul de instalare a AutoCorect; e vorba de DEx şi celelalte dicţionare de limba română - deci nu mă refer la dicţionare OCR_DIC; un alt executabil de căutare îmi permite să caut într-un text oarecare, cu condiţia ca fişierul să fie de tip text. Am convertit mai multe cărţi în format text şi am făcut şi aici căutări.

     Bun. Şi acum să explic ce este cu acele cuvinte bizare din dicţionarele SMed.
     La căutarea în dicţionare a succesiunii bcc a rezultat o familie de cuvinte care începeau cu "subccesibilit...", deci "subccesibilitate, subccesibilităţi...." Dacă acel cuvânt este specific vreunui domeniu sau e o eroare nu ştiu nici eu, dar l-am înregistrat pentru orice eventualitate, pentru că el apărea în unul dintre dicţionarele din folderul de instalare.

     În mod normal ar fi trebuit să nu mai fac modificarea bcc >> bec; deoarece era un număr de cuvinte limitat care aveau în componenţă succesiunea de modificat, am făcut totuşi modificarea, dar am pus şi o înregistrare de recorectare a cuvântelor respective care erau un fel de excepţii de la regulă.
     În cele două dicţionare SMed apar mai multe cuvinte, de regulă englezisme dar nu numai, care au fost astfel recorectate.

*********************

     Am reactualizat şi dicţionarul CL_Midp.imd - deci pentru varianta AutoCorect Clasic
     Nume fişier:   CL_Midp [2013.04.12].rar
     Adresa folder TEMP: 


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
printzuska
Membru Gold

Din: Constanta
Inregistrat: acum 12 ani
Am gasit si problema asta frecvent : d>rt

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     printzuska, mulţumesc pentru eroarea semnalată!
     În mod sigur ea nu este prinsă în dicţionare pentru că eu nu am întâlnit-o până acum şi nici nu mi-a semnalat-o altcineva.

     Eu am înţeles că în realitate ar trebui să fie litera "d", dar Abbyy recunoaşte în mod eronat grupul "rt"... ori este exact pe dos?

     Aş vrea să mă ajuţi cu câteva exemple şi dacă poţi aş mai avea nevoie de câteva informaţii:
        - eroarea apare frecvent la cuvinte scurte [3-4 litere] sau şi la cuvinte lungi?
        - eroarea apare de regulă la începutul cuvântului sau în orice poziţie în cadrul cuvântului?

      Cel mai uşor este să fac modificări la cuvinte scurte pentru că pot folosi condiţia "Cuvânt întreg la ambele capete" şi în acest fel nu pot apărea efecte secundare nedorite.
      Dacă trebuie să fac modificări de secvenţe, atunci este mai complicat pentru că unele modificări pot fi corecte în cazul unor cuvinte şi incorecte în cazul altor cuvinte.

      Dacă ai mai multe detalii şi eşti dispusă să foloseşti mail, eu ţi-am dat un MP şi am transmis adresa mea de mail. Pe forum intru din ce în ce cu mai multă greutate.
      Credeam că problemele de logare se vor rezolva, dar văd că se complică parcăşi mai tare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Si ce sa fac?
sa sterg toate dictionarele si sa le copiez iar?

cuvintul corect este succesibilitate  (ceva juridic, de la succesiune)

Modificat de meridiane (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cred că da. Cel mai bine e să înlocuieşti toate dicţionarele OCR_DIC.
      Atenţie! doar pe cele din OCR_DIC. Cu menţiunea că după ce dezarhivezi arhiva OCR_DIC [Clasic] 2012.11.01.rar să înlocuieşti dicţionarul CL_Midp.imd cu cel din arhiva urcată astăzi  cu numele "CL_Midp [2013.04.12].rar", care este reactualizat cu situaţiile linie de dialog urmată de spaţiu neseparator.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
meridiane
MEMBRU VIP

Inregistrat: acum 12 ani
Am inlocuit dictionarele.
Acum nu mai cere aceeasi inlocuire de doua ori.

Nu este nevoie de explicatii atit de detaliate.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Scuze, meridiane!
      Practic, profit de întrebările tale, ale printzuskăi şi cine o mai posta, ca să dau mai multe detalii decât e nevoie pentru că sunt convins că există persoane care au nevoie de mai multe detalii, dar ei fac parte din "marea mută" şi nu postează, dar - din câte mi-am dat seama - citesc comentariile în totalitate.

      Adevărul este că, aşa cum spunea cineva pe forum, AutoCorect a devenit un program destul de complex [asta e adevărat]  şi pare greu de folosit [asta este complet fals]; totuşi cine l-a folosit de două-trei ori şi a văzut cam câte probleme se rezolvă, înclin să cred că nu mai renunţă la el pentru că e păcat să corectezi manual ceea ce se poate face mult mai repede de către AC.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 16 ani

@seven, am doua rugaminti:
1. daca meridiane spune ca nu este nevoie de atatea detalii, eu te rog sa detaliezi in continuare deoarece probabil nu pricep la fel de usor cum sta treaba cu AC.
2. poti sa postezi structura de foldere si, eventual de fisiere, a AutoCorectului de la tine din calculator? de ce te rog asta: sunt asa de multe erori care la mine raman necorectate ca nici nu are rost sa le scriu aici deoarece cred ca greseala este sigur la mine in calculator. este posibil ori sa nu fi inteles eu cum se instaleaza dictionarele ori sa nu am dictionarele corecte ori sa nu le fi pus unde trebuie (la folder ma refer).
multumesc.


LE: Rezolvat. Am inteles in sfarsit cum ajung la folderul unde se pun dictionarele. Incerc sa-l testez cu un ocr sa vad cum functioneaza acum.

Modificat de ZVONACFIRST (acum 11 ani)


pus acum 11 ani
   
cantis
Membru Puf

Inregistrat: acum 13 ani
Si la mine ruleaza dictionarele de doua ori, la ultima versiune AC, la cea dinainte nu se intimpla asta. Eu am instalat dictionarele la zi, dupa ce le-am sters pe cele dinainte.
O sa le sterg si-o sa le mai instalez inca o data.

Unele cereri de inlocuiri sint procesate, chiar daca aplici optiunea ,, Nu" sau ,,Renunt"; de exemplu:

inlauntru vs. inauntru ; vrei primul, iti baga al doilea
soartei    vs. sortii     ; la fel

Face asta la sfarsit, dupa ce nu mai intreaba nimic. Prima versiune nu facea asa.
Dar este un program grozav. Din pacate nu indeajuns de stapanit de catre cei grabiti , care nu-l seteaza dupa cum foarte bine-a explicat Seven si posteaza versiuni 0.9, mai dificil de corectat decat OCR-ul initial. Setarea ca lumea de la bun inceput, este esentiala.

Astept cu nerabdare versiunea finala a dictionarelor. M-a prins ,,microbul" si nu ma mai lasa.


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      cantis, am să revin la ceea ce ai spus, dar la momentul ăsta am şi eu o întrebare;
      Am văzut că lucrezi în altceva decât Word: nu ştiu dacă este OpenOffice sau LibreOffice, dar nu asta e important în acest moment; mă interesa dacă nu cumva foloseşti vreo variantă de Linux ca sistem de operare. Nu ştiu dacă AutoCorect rulează în Linux şi m-ar interesa problema asta.
     Bineînţeles că mă interesează informaţii despre comportamentul lui AutoCorect sub Linux de la orice user dispus să-mi dea informaţii.

     ZVONACFIRST, am să încerc să să fac mai mult decât să arăt ce foldere şi fişiere am eu la acest moment; încerc să descriu AutoCorect de la prima instalare la reactualizare.
     Ca să mă pot "desfăşura" în linişte, îmi voi păstra vreo 3-4 postări de rezervă la care voi pune mai întâi esenţialul, apoi le voi dezvolta.
     Singura problemă este că nu voi folosi pentru imagini afişarea directă care ar lungi prea mult postarea, ci linkuri.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          AUTOCORECT STANDARD - PRIMA INSTALARE


     AutoCorect OCR Plus nu se instalează ca atare, ci este o îmbunătăţire a programului AutoCorect standard.

     Mai întâi se instalează AutoCorect standard în varianta Contemporan sau Clasic.
     Programul este liber şi se poate downloada de pe pagina web de la adresa:
               

      Trebuie să facem o descărcare a programului complet şi nu pe componente.

      INSTALAREA AUTOCORECT STANDARD

      Instalarea AutoCorect se face, ca orice program, în folderul Program Files [Fişiere program].
      Folderul sub care se instalează se va numi AutoCorect Contemporan sau AutoCorect Clasic, în funcţie de varianta aleasă.
      Notă: Se pot instala şi ambele variante.

      Folderul de instalare  AutoCorect Contemporan [Clasic] cuprinde 2 subfoldere şi 5 fişiere:
              - Subfolderul Dex în care se află 4 fişiere: dexb.dic, dexb.len, dexd.dic, dexd.len
              - Subfolderul Dictionare în care se află 55 de fişiere
              - Fișierele: AutoCorect.chm, AutoCorect.exe, AutoCorect.xlm, unins000.dat, unins000.exe

       Atenție! În subfolderul Dex și Dictionare se află fișiere ale dicționarelor DEX și alte dicționare ale limbii române și sunt necesare în funcționarea AutoCorect standard, în special pentru funcția ortografie.
       Subfolderul Dictionare din folderul de instalare nu are nici în clin, nici în mânecă cu folderul Dictionare în care copiem dicționarele OCR_DIC sau alte dicționare de înlocuire multiplă. Acel subfolder se află în cu totul altă parte, asupra căreia vom discuta în continuare.


       La instalarea AutoCorect în afară de subfolderele şi fişierele din Program Files,mai creează un folder numit după caz "AutoCorect Contemporan" sau "AutoCorect Clasic"în următoarea cale de căutare:

        ■ în Windows XP:
     „C:\Documents and Settings\NUME_USER\Application Data\AutoCorect Clasic
sau
     „C:\Documents and Settings\NUME_USER\Application Data\AutoCorect Contemporan

        ■ în Windows 7, 8, Vista:
     „C:\Users\NUME_USER\AppData\Roaming\AutoCorect Clasic
sau
     „C:\Users\NUME_USER\AppData\Roaming\AutoCorect Contemporan

      Acest folder AutoCorect Contemporan [AutoCorect Clasic] are la instalare un Subfolder
şi două fişiere:
              - Subfolderul Dictionare care iniţial este gol;
              - Fişierele AutoCorect.ini şi ListaDictionare.txt
      Pe parcurs după rulare vor mai apărea şi alte fişiere, precum: RulareAutomataOCRPlus.txt etc. etc.
 
       NOTĂ: în fişierul "ListaDictionare.txt" se va salva lista şi calea de căutare a dicţionarelor setate de noi să ruleze la opţiunea 9, iar în fişierul "RulareAutomataOCRPlus.txt" vor fi salvate opţiunile care rulează în mod automat.
       La fiecare modificare a setărilor, fişierele se modifică şi ele astfel încât să păstreze salvarea ultimelor modificări.

       Să ne întoarcem la subfolderul Dicţionare.
       Acesta este cel care ne interesează în mod special.
       În acest subfolder vom crea cel puţin două subfoldere:
                - Subfolderul OCR_DIC în care vom copia cele 39 de dicţionare care rulează automat.
                - Subfolderul Dictionare UZUALE [acest subfolder poate avea orice alt nume] în care se pun dicţionarele uzuale şi personale, orice alte dicţionare care pot rula automat la opţiunea 9. Se poate crea şi alt folder în care să punem dicţionare create de fiecare user în parte în funcţie de necesităţi care pot fi rulate tot automat la opţiunea 9 ori pot fi rulate fiecare în pşarte atunci când simţim nevoia.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          AutoCorect OCR Plus - Actualizare executabil


       
      Deci, avem instalat AutoCorect standard care are folderul de instalare în Program Files  şi un folder pentru dicţionare de înlocuire şi alte dicţionare în AppData [Application Data], conform celor menţionate în postarea precedentă.
      Trebuie să reţinem că executabilul este cel al AutoCorect standard, deci în acest moment poate rula doar programul AutoCorect standard.
       
      Pentru a modifica AutoCorect standard în AutoCorect OCR Plus nu trebuie să facem decât un singur lucru: vom înlocui executabilul  Autocorect.exe din folderul de instalare cu unul din executabilele AutoCorect Plus [Contemporan sau Clasic, după caz] de la adresa:
       

      Atenţie! Un executabil AC OCR Plus Contemporan va trebui să înlocuiască numai un executabil AC standard Contemporan; Acelaşi lucru este valabil şi pentru varianta Clasic.
      Diferenţa dintre Contemporan şi Clasic o face nu numai pachetul de dicţionare OCR_DIC , ci şi dicţionarele DEX şi celelalte Dicţionare ale Limbii Române din folderul de instalare, care sunt editate diferit.

     Practic, trecerea la AC standard la AC OCR Plus sau reactualizarea unui executabil OCR Plus se face în următorii paşi:
           - download arhiva care conţine cel mai nou executabil din adresa menţionată mai sus;
           - dezarhivarea executabilului [şi, eventual, redenumirea lui în Autocorect.exe - dacă executabilul are un alt nume; de exemplu este însoţit de data reactualizării];
           - copierea noului executabil peste executabilul vechi.

     Reţinem că nu trebuie să facem o nouă instalare la reactualizarea unui executabil, ci pur şi simplu înlocuim doar executabilul vechi cu unul nou, toate celelalte fişiere rămânând neschimbate.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          AutoCorect OCR Plus - Actualizare dicţionarel



      Să ne întoarcem acum la subfolderul Dicţionare din calea:

        ■ în Windows XP:
     „C:\Documents and Settings\NUME_USER\Application Data\AutoCorect Clasic\Dictionare
     „C:\Documents and Settings\NUME_USER\Application Data\AutoCorect Contemporan\Dictionare

        ■ în Windows 7, 8, Vista:
     „C:\Users\NUME_USER\AppData\Roaming\AutoCorect Clasic\Dictionare
     „C:\Users\NUME_USER\AppData\Roaming\AutoCorect Contemporan\Dictionare

   
      În subfolderul Dicţionare va trebui să creăm cel puţin două subfoldere:
            - un subfolder sau mai multe în care vom păstra dicţionarele uzuale şi personale ce pot rula la opţiunea 9. Folderul se poate numi oricum pentru că numele său nu este prevăzut în codul programului în mod special. Subfolderul se poate numi Dic_uzuale, Dic_Suplimentare, Dic_personale etc.. etc...
      menţionez că orice dicţionar de tip "imd" poate fi rulat manual cu opţiunea "Editare" → "Înlocuire multiplă", apoi încărcând dicţionarul dorit.

            - "OCR_DIC" - numele acestui subfolder este prevăzut în cod şi el nu poate fi modificat; aici se vor păstra cele 39 dicţionare; menţionăm că nici numele acestor 39 de dicţionare nu pot fi modificate.
      Primele 35 dicţionare deservesc cele 10 opţiuni şi pot fi rulate automat; de asemenea pot fi rulate doar unele dintre ele acţionând o singură opţiune dintr-un pachet; fiecare dicţionar poate fi rulat manual cu opţiunea "Editare" → "Înlocuire multiplă".
      Ultimele 4 dicţionare [CO_Vt1.imd ÷ CO_Vt4.imd] rulează cu opţiunea "Modificări speciale de text"

      În subfolderul OCR_DIC la această dată pentru programul AutoCorect OCR Plus v 5.1
trebuie să fie un număr de 39 dicţionare;
      Acestea sunt următoarele:

Stergere artefacte [răgălii] aflate oriunde în text
      01. CO_Apco.imd - şterge răgălii în cărţi obişnuite [are 39 de răgălii]
      02. CO_Apct.imd - şterge răgălii în cărţi tehnice [are mai puţine înregistrări decât precedentul]

Stergere automată răgălii care se află numai la începutul paragrafului la sfârşitul paragrafului
      03. CO_Artef.imd

Înlocuiri automate cuvinte întregi
      04-06 CO_CImf1.imd, CO_CImf2.imd, CO_CImf3.imd

Dicţionar care înlocuieşte automat litera mare cu literă mică după semnele ? şi ! în dialog francez.
      07 CO_DFr.imd

Înlocuieşte automat combinaţii de 3-4 puncte şi virgule cu elipsis
      08 CO_Elips.imd

Înlocuiri automate de expresii şi grupuri de cuvinte [ex: partea stingă >> partea stângă]
      09-10 CO_Expr1.imd, CO_Expr2.imd

înlocuieşte automat grupurile "cl" şi "rn" cu literele "d" şi "m" în diverse cuvinte
      11 CO_Gcl.imd
      12 CO_Grn.imd 


Înlocuiri automate în diferite combinaţii şi cuvinte a cifrelor 1 şi 0 cu litera L mic şi O mic.
      13-15 CO_L1.imd, CO_L2.imd, CO_L3.imd

Corectează automat linii de pauză şi linii de dialog
      16 CO_LinD.imd
      17 CO_LinP.imd


Majuscularea automată la început de frază, început de paragraf şi după linia de dialog.
      18 CO_Midp.imd

înlocuiri automate la cuvinte scurte [max 4 litere] cu şi fără cratimă:
      19-22 CO_Sc1.imd, CO_Sc2.imd, CO_Sc3.imd, CO_Sc4.imd 

Modificări automate secvenţe de cuvinte la începutul cuvintelor, la mijloc şi la sfârşit.
      23-24 CO_SInc1.imd, CO_SInc2.imd - secvenţe de început
      25-26 CO_SMed1.imd, CO_SMed2.imd - secvenţe mediane
      27-28 CO_STer1.imd, CO_STer2.imd - secvenţe terminale

Corectează automat unele cuvinte "rupte" la capăt de rând
      29-32 CO_Var1.imd, CO_Var2.imd, CO_Var3.imd, CO_Var4.imd

Corecţii cu CONFIRMARE  de cuvinte secvenţe de cuvinte şi elemente de punctuaţie:
      33-35 CO_Var5.imd, CO_Var6.imd, CO_Var7.imd

Dicţionare care rulează la opţiunea numită "Modificări speciale de text".
      36-39 CO_Vt1.imd, CO_Vt2.imd, CO_Vt3.imd, CO_Vt4.imd

      Notă: Această ultimă opţiune ["Modificări speciale de text"] ca şi celelalte două din final ["Eliminare linii de pauză exclusiv din Dialoguri" şi "Elimină TOATE liniile de pauză din text"], nu rulează automat şi nu este recomandată utilizatorilor obişnuiţi.
      Dicţionarele sunt cu confirmare şi se adresează persoanelor cu multă experienţă care fac modificări speciale de corectură şi care nu fac rularea automată a celor 10 opţiuni.
      Multe dintre modificări sunt deja realizate la rularea automată.

      Opţiunea a fost creată special pentru cei ce doresc să schimbe cuvinte, sensul lor etc. şi, de regulă modifică forme populare ale cuvintelor cu forme literare.
      Opţiunea este recomandată la corectarea de texte oficiale şi nu la corectarea cărţilor de beletristică. În beletristică acest lucru este periculos, deoarece un personaj simplu ar putea ajunge să vorbească într-un mod prea corect, ceea ce ar lăsa cu gura căscată pe însuţi autorul cărţii.

       În imaginea următoare ► Vezi IMG aici sunt evidenţiate cele 10 opţiuni care pot rula automat pentru curăţarea prealabilă a unui OCR şi cele 3 opţiuni suplimentare care nu rulează automat, ci doar fiecare în parte şi care nu sunt recomandate rulării OCR obişnuite, ci doar în cazuri speciale pentru prelucrări de limbă şi de sens al frazei.


      Mai jos redau imaginile a 3 subfolde care conţin dicţionare:

Subfolderul OCR_DIC pe care fiecare utilizator AC OCR Plus trebuie să-l aibă în computer.


Subfolderul cu dicţionare suplimentare [uzuale, personale] care pot rula automat cu opţiunea 9.


Acesta este un subfolder cu dicţionare în lucru:


       Notă: personal fac înregistrări într-un dicţionar numit TEMP.imd apoi mut înregistrările în astfel de dicţionare care pot avea orice nume [în acest caz iniţialele C4L înseamnă cuvinte 4 litere, G2C înseamnă grup două cuvinte. După testări, atunci când am timp distribui înregistrările în dicţionarele uzuale sau în OCR_DIC.

       Şi aceste dicţionare pot fi adăugate în lista care rulează la opţiunea automat, ori pot fi rulate separat prin opţiunea "Editare" → "Înlocuire multiplă"

       Este de preferat ca fiecare user să aibă un folder cu dicţionare în lucru, temporare, personale... deoarece fiecare font cu care a fost tipărit o carte poate crea erori specifice care nu se regăsesc în alte situaţii, fapt pentru care astfel de modificări nu apar în dicţionarele OCR_DIC.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          DESPRE DICŢIONARELE AutoCorect OCR Plus



      Câteva cuvinte despre înregistrările din dicţionarele OCR_DIC:

      Există cel puţin două tipuri de dicţionare în folderul Dictionare din AppData:
         - dicţionare de tip "DIC", care au extensia "dic", sunt dicţionare create de program atunci când se face corectură în AutoCorect cu opţiunea Ortografie; aici vor fi înregistrate cuvinte adăugate de utilizator ca fiind cunoscute, cuvinte ignorate etc.
      NOTĂ:  dicţionarele de tip "dic" pot fi deschise cu NotePad şi alte editoare de text.

         - dicţionare de tip "IMD", care au extensia "imd" - de Înlocuire Multiplă;
ca să ne fie mai uşor ne gândim la iniţialele expresiei Înlocuire Multiplă Dicţionar = IMD

      Dicţionarele de tip "imd" nu se pot crea, deschide sau edita decât direct din programul AutoCorect. Ele nu se pot deschide cu NotePad sau alte editoare, aşa cum se poate proceda cu dicţionarele de tip "dic".
      Cu toate acestea, se poate face selectarea unui număr nedefinit de înregistrări consecutive sau "pe sărite" şi ştergerea, copierea, mutarea unor astfel de înregistrări dintr-un dicţionar în altul.
      Se poate face copiere/mutare de înregistrări dintr-un dicţionar "imd" deschis cu AC, într-un fişier deschis cu NotePad şi invers
      Se poate face o operaţiune mai compleaxă de genul AutoCorect - NotePad - Word şi invers: Word - Notepad - AutoCorect. Totuşi, nu recomand prelucrări în Word.
      Cea mai indicată operaţiune de acest gen este  AutoCorect - NotePad - Excel şi Excel- Notepad - AutoCorect. Teoretic funcţionează şi corespondenţa AutoCorect - Excel şi invers, dar apar în mod frecvent erori la mutare.
      Despre toate aceste lucruri vom intra în detalii la capitolul "JONGLERII cu dicţionare de Înlocuire multiplă de tip "imd"

      Toate dicţionarele din OCR_DIC, Dic Uzuale, suplimentare, personale sunt de tip "imd"
      Deci dicţionarele de înlocuire multiplă sunt cele care ne interesează în mod special.

      Sunt foarte multe corecturi posibile care nu se regăsesc în dicţionarele OCR_DIC.
      Principiul de bază pentru înregistrările din OCR_DIC este ca modificările să nu producă efecte secundare.

      De exemplu: frecvent cuvântul "mai" este recunoscut în mod eronat de Abbyy sub forma "mal". Nu vom putea face o înregistrare automată de genul "mal >> mai" deoarece vor fi modificate şi cuvintele care în mod real sunt "mal" cu sensul de marginea unei ape.
      Înregistrarea poate fi făcută doar cu confirmare sau poate fi evitată.
      În unele cazuri se pot folosi modificări de grupuri de cuvinte, dar şi aici pot apărea efecte secundare, deci trebuie să fim atenţi.
      Dacă "ochiul sting, cotul sting, piciorul sting... " pot fi modificate fără probleme în "ochiul stâng, cotul stâng, piciorul stâng... ", nu acelaşi lucru putem spune despre "mal mare, mal mic, mal bun, mal rău... ", care ar putea fi în majoritatea cazurilor corectate ca "mai mare, mai mic, mai bun, mai rău... ", dar, la fel de bine, în unele cazuri ar putea fi vorba chiar de un MAL care este mic, mare, bun sau rău.
      Discuţia poate fi continuată cu "luminare >> lumânare" etc... etc...

      De aceea multe dintre erorile frecvente nu pot fi corectate de AutoCorect,iar uneori înregistrările cu confirmare ne dau mari dureri de cap.
      OCR_DIC nu poate impune unui utilizator să rişte modificări nedorite sau să-l ţină prea mult în faţa computerului pentru a accepta sau nu modificările cu confirmare.

      Cu toate astea putem să ne creăm nişte dicţionare personale în care putem pune tot ce ne interesează la un moment dat. Suntem singurii care hotărâm dacă o anume înregistrare ne foloseşte sau nu, dacă folosirea ei ne avantajează sau ne dezavantajează.

     Din motivele arătate mai sus, putem concluziona:

          ■ Dicţionarele OCR_DIC sunt nişte dicţionare care se vor a fi valabile în cât mai multe dintre cazuri; multe erori nu vor apărea în aceste dicţionare OCR_DIC pentru a nu avea efecte secunadre nedorite, deci nu vor fi corectate de AutoCorect; principalele înregistrări s-au făcut deja şi deşi dezvoltarea acestor dicţionare va continua, nu trebuie să ne aşteptăm să apară foarte multe înregistrări noi faţă de ceea ce avem în acest moment; probabil cele mai multe înregistrări vor fi făcute pentru cuvinte întregi de 4 litere şi a unora de 5 cuvinte, precum şi a unor cuvinte mai lungi cu frecvenţă mare în limba română.

          ■ Dicţionarele UZUALE urcate pe host sunt mai degrabă nişte modele de dicţionare personale. Dintre acestea, cele 3 dicţionare care se referă la cuvinte care încep cu litera "î" sunt singurele care au fost dezvoltate în timp; e vorba de dicţionarele: Uz_Î1 - diverse.imd, Uz_Î2 într- [208].imd şi Uz_Î3 [i - î] 682.imd.
      Celelalte dicţionare, de la Uz_A.imd la Uz_Z.imd, nu au mai fost reactualizate de mult timp, deoarece am folosit frecvent dicţionare temporare sau personale.
      Practic nu am dorit să impun altor persoane înlocuiri care mi-au folosit mie la un moment dat şi care, poate, în unele cazuri pot realiza înlocuiri nedorite.
      Este bine ca fiecare utilizator, plecând de la structura existentă, să verifice înregistrările din fiecare dicţionar, să elimine dacă fdoreşte unele înregistrări care nu-i sunt de folos şi să adauge altele pe măsură ce găseşte cuvinte care pot fi corectate.
      Ideea principală este să se meargă pe cât posibil pe înregistrări de cuvinte întregi la ambele capete sau cuvinte întregi la început.

      Hai să vedem care e problema cu aceste "cuvinte întregi" în sensul programului autocorect:
      Să luăm ca exemplu cuvântul binecuvintarc/binecuvântare.

             - dacă vom face înlocuirea binecuvintare >> binecuvântare înseamnă că în limbajul AutoCorect avem un "Cuvânt întreg la ambele capete", ceea ce în limbajul obişnuit înseamnă cuvânt întreg; Modificarea se va face doar în cazul acestui cuvânt şi nu va produce modificări pentru cuvintele "binecuvintarea", "binecuvintări" binecuvintările" etc... 
       
             - dacă vom face înlocuirea binecuvint >> binecuvânt înseamnă că în limbajul AutoCorect avem un "Cuvânt întreg la început", ceea ce în limbajul obişnuit înseamnă aproximativ rădăcină de cuvânt; dacă vom pune condiţia "cuvânt întreg la început" toate cuvintele care încep cu "binecuvint" vor fi modificate, deci atât "binecuvintare", cât şi "binecuvintarea", "binecuvintări" binecuvintările" etc... 
      Presupunem că am pus înlocuirea binecuvintare >> binecuvântare cu condiţia "cuvânt întreg la început"; în acest caz modificarea se va face la cuvintele "binecuvintare" şi "binecuvintarea" - pentru că au acelaşi început, dar nu şi la  "binecuvintări" binecuvintările" - pentru că au formă modificată în final.

             - dacă vom face o înlocuire de genul ....ănd >> ...ând sub forma ănd >> ând, avem de-a face cu un "cuvânt întreg la sfârşit", deci cu o terminaţie în limbaj obişnuit.
      În cazul de mai sus absolut toate verbele la gerunziu care se termină în "ând", cum ar fi "alungând, autoproclamând, conectând, dedublând, erijând, felicitând, forfecând, idolatrizând, inserând, interferând, înseninând, marcând, mizând, reciclând, redând, secerând" şi care au fost scrise eronat cu litera "ă" în loc de"â" vor fi corectate.
      Cu toate acestea cuvintele care au terminaţiile ...ăndu-mă, ...ăndu-te, ...ăndu-se, ...ăndu-ne etc. nu vor fi modificate, deoarece deşi conţin "ând",ele nu se termină cu "ând".
      Dacă am dori ca orice cuvânt care are în componenţă secvenţa "ănd" să fie modificat în "ând" atunci am folosi doar condiţia "potrivire perfectă" fără altă condiţie, doar că înlocuirea nu ar fi corectă deoarece există suficiente cuvinte care au în mod corect secvenţa "ănd" în componenţă [dăndănaie, hăndrălău, măndel, săndăluţe, smărăndel, tăndăni, ţăndărea...]
      DE ŢINUT MINTE! Dacă vom activa doar opţiunea "cuvânt întreg" fără să stabilim dacă acesta este cuvânt întreg la ambele capete, cuvânt întreg la început sau cuvânt întreg la sfârşit, programul AutoCorect OCR Plus este realizat astfel încât să seteze automat varianta "cuvânt întreg la ambele capete", deci cuvânt întreg în sensul obişnuit al limbajului.
      În concluzie vom umbla la setarea variantei de cuvânt întreg doar dacă e vorba de un început de cuvânt, deci "cuvânt întreg la început" sau de un sfârşit de cuvânt, adică "cuvânt întreg la sfârşit".


          ■ Dicţionarele personale...
      Fiecare utilizator poate crea pentru uz personal dicţionare sau pachete de dicţionare.
      Nu trebuie să acceptăm să gândească alţii pentru noi; suntem cei mai în măsură să constatăm şi să hotărâm ce anume erori ne interesează să fie corectate.

      Fiecare tip de font folosit la tipărirea unei cărţi poate da erori specifice, care nu sunt încă rezolvate de AutoCorect.
      Cu cât un font pare mai elegant, cu cât are nişte caractere ce par mai artistice, cu atât el are şanse ca la recunoaşterea în Abbyy să dea erori. Pot fi fonturi la care diferite litere sunt mai late decât de obicei şi în poziţii aproape lipite de litera următoare; această poziţie foarte apropiată a două litere, transformă pur şi simplu grupul de două litere într-un caracter nou, ceva comparabil cu situaţia literelor ae sau oe care formează caracrele ć şi ś în limba franceză.
      De exemplu: la unele fonturi [foarte plăcute ochiului] litera < f > este un pic mai lată, partea de sus din dreapta lungindu-se deasupra literei următoare, astfel că grupurile de litere fr, fi, fl, ft sunt pentru Abbyy nişte caractere noi pe care le interpretează adeseori greşit.
      Ne amintim că Abbyy "citeşte" caracterele în suprafeţe utile sub formă de dreptunghi, deci fiecare caracter este încadrat într-un dreptunghi. În aceste cazuri Abbyy ori nu va încadra litera "f" în totalitate, lipsind din literă un pic din partea de sus dreapta, ori va încadra toată litera şi în acest caz va "ciupi" un pic din litera următoare, iar litera următoare la citire va avea lipsă bucăţica ce a fost incorect repartizată literei "f".
     Din aceste motive şi din alte 1000 de motive este util ca fiecare utilizator să încerce să-şi facă dicţionare proprii.

     PONT: În AutoCorect există facilitatea marcării cu font colorat a modificărilor făcute de dicţionare.
     Dacă dorim să urmărim/verificăm efectele unor înlocuiri în text, respectiv corectitudinea lor se poate seta ca la rularea unui dicţionar, toate modificările să fie marcate cu font colorat.
     În acest fel, dacă vom constatat că o înlocuire produce mai multă pagubă, deci pe lângă modificările corecte face şi modificări nedorite, atunci pur şi simplu deschidem dicţionarul şi ştergem înregistrarea cu pricina sau căutăm să-i punem nişte condiţii care să-i reducă variantele de căutare şi înlocuire.

     


     Culoarea se poate stabili pentru fiecare sesiune de modificări în parte.
     ATENŢIE: Opţiunea "Marchează modificările" nu se transmite doar dicţionarului la care s-a activat opţiunea, ci este o setare care se transmite tuturor dicţionarelor din AutoCorect, inclusiv celor din OCR_DIC.
     Din acest motiv, după ce rulăm un dicţionar personal pentru testare, vom avea grijă să dezactivăm de îndată această opţiune "Marchează modificările", pentru că dacă o vom uita activată, la rularea automată a unui OCR în AC OCR Plus vom opţine un text foarte colorat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          JONGLERII cu dicţionare de Înlocuire multiplă de tip "imd"



      ■ Despre funcţia Înlocuire multiplă

      Următoarele câteva fraze pot fi considerate pe lângă subiect, dar cred că sunt necesare.
      Am descoperit AutoCorect standard creat de Daniel Morlova şi Cosmin Ciupercă în urmă cu vreo 5 ani, pe vremea versiunii 2.3.
      La momentul respectiv, cel mai mult m-a impresionat funcţia "Înlocuire Multiplă".
      Era pentru prima dată când întâlneam posibilitatea realizării unui număr mare de înlocuiri de tip Find&Replace cu o singură comandă, şi în plus înlocuirile se puteau salva spre a fi folosite şi cu altă ocazie.
      În Word şi nu numai, exista posibilitatea realizări de înlocuiri Find&Replace una câte una, iar despre salvarea lor nici nu se putea discuta.
      E drept, în versiunea AC 2.3 putea fi rulat un singur dicţionar care se numea "implicit.dic", deci era un dicţionar de tip "dic" şi nu unul de tip "imd", dar salvasem mai multe dicţionare şi copiam câte unul în folderul de instalare după care îl redenumeam în "implicit.dic" după care îl rulam, apoi copiam şi redenumeam următorul dicţionar şi tot aşa...
      Poate părea foarte complicat, dar realizarea unui număr teoretic infinit de înlocuiri cu o singură comandă mi se părea şi mi se pare şi astăzi ceva cu totul deosebit.

      Chiar dacă AutoCorect ar avea doar această funcţie şi tot ar fi unul dintre instrumentele cele mai importante în corectura de carte electronică.
      Din acest motiv cred că fiecare utilizator este obligat să ştie să jongleze cu astfel de dicţionare.
      Şi o ultimă frază: faţă de fereastra "Înlocuire multiplă" din AC standandard, Cosmin Ciupercă a perfecţionat şi dezvoltat atât de mult fereastra "Înlocuire Multiplă" din AC OCR Plus, încât în acest moment se poate înregistra un complex de înlocuiri cu o gamă largă de condiţii, astfel că doar această funcţie a "Înlocuirilor Multiple" ar putea fi un program independent foarte puternic.


      ■ Deschiderea ferestrei Înlocuire multiplă

      În orice versiune de AutoCorect se poate ajunge în fereastra "Înlocuire Multiplă", acţionând "Editare" → "Înlocuire Multiplă"
      Doar în AutoCorect OCR Plus [deci nu şi în AutoCorect standard] există şi un icon "Înlocuire Multiplă" care se află ultimul din dreapta pe prima bară de iconuri [vezi imaginea de mai jos].

      Vezi imaginea la dimensiune originală ► IMG Original


      Oricare ar fi varianta de accesare a ferestrei, programul va deschide la început dicţionarul gol numit "implicit.imd"
      Dacă suntem în timpul unei sesiuni în care am rulat deja un dicţionar, atunci la deschidere ferestrei se va deschide ultimul dicţionar folosit. La închiderea programului AutoCorect, acesta "uită" ultimul dicţionar folosit, astfel că la o nouă deschidere va apărea din nou dicţionarul gol "implicit.imd".
      Atenţie! Totdeauna dicţionarul "implicit.imd" trebuie să fie gol, să nu aibă nicio înregistrare. Dacă din nebăgare de seamă şi distragerea atenţiei în dicţionarul "implicit.imd" au rămas înregistrări, atunci ducem mausul pe o înregistrare, facem click-dreapta, alegem "Selectare toate" şi apoi "Ştergere", după care face click pe semnul "X" din partea de sus-dreapta a ferestrei şi închidem dicţionarul "implicit.imd". În acest mod se face salvarea rapidă a dicţionarului, în cazul nostru în varianta gol.

      Să revenim:
      Deschidem fereastra "Înlocuire Multiplă" şi programul deschide dicţionarul "implicit.imd".
      În principiu, avem doauă variante de lucru:
               ● ori creăm un nou dicţionar şi în acest caz acţionăm butonul "Salvează dicţionar" şi vom da un nume pe cât posibil sugestiv noului dicţionar creat,în funcţie de ce anume modificări ne propunem să facem;
               ● ori dorim să deschidem un dicţionar deja creat şi în acest caz acţionăm butonul "Deschide dicţionar", căutând apoi dicţionarul dorit. Remarcăm că în dreapta butonului "Deschide dicţionar" există semnul ▼. Acţionând asupra acestui semn vom găsi ultimele 5 dicţionare folosite, astfel că dacă dicţionarul căutat este unul dintre acestea 5, putem să-l activăm rapid fără a mai căuta prin diverse foldere. Nu contează dacă dicţionarele se găsesc în foldere diferite, ele se vor deschide rapid dacă se găsesc în lista pe care o deschide semnul ▼ aflat în dreapta butonului "Deschide dicţionar".


      ■ Editare dicţionare de Înlocuire multiplă

      Asupra acestui subiect, a condiţiilor de căutare ce se pot stabili pentru fiecare modificare în parte am spus câteva cuvinte în postarea de mai sus despre condiţia "Cuvânt întreg", am discutat detaliat fiecare condiţie pe topicul [AC] AutoCorect OCR Plus - Instructiuni de folosire şi probabil vom mai reveni pe acest topic, dacă va fi nevoie.
      Presupunând că avem suficiente cunoştinţe despre modul în care se fac înregistrările, să încercăm să dicutăm câteva lucruri despre operaţiuni ce se pot face în şi cu dicţionarele de tim "imd".


      ● Operaţiuni ce se pot face într-un dicţionar "imd"

      ► Reeditarea unei înregistrări existente:
      O înregistrare a unei înlocuiri nu este ceva definitiv; ea poate fi reeditată oricând şi de câte ori este necesar.
      Pentru a reedita o înregistrare, o selectăm şi apoi apăsăm butonul "Editează" sau facem dublu click pe înregistrarea respectivă; indiferent de varianta folosită, înregistrarea se va deschide automat în fereastra de editare-reeditare.
      După realizarea modificărilor dorite, aceste modificări trebuiesc obligatoriu salvate, acţionând asupra butonului "Salvează" din dreapta ferestrei de editare.
      Se poate face salvarea şi dacă acţionăm tasta "Enter" după executarea modificărilor. Salvarea cu tasta Enter, ca şi cea cu butonul "Salvează" se poate face indiferent dacă avem cursorul în fereastra "Caută" sau în fereastra "Înlocuieşte cu".
      Dacă nu mai dorim reeditarea, dar înregistrarea s-a deschis deja în fereastra de reeditare, chiar dacă am executat deja unele modificări, putem folosi butonul "Renunţă" şi astfel înregistrarea va rămâne în forma iniţială.

      ► Sortarea în ordine alfabetică a înregistrărilor:
      Se realizează cu ajutorul butonului "Sortează".
      La acţionarea butonului "Sortează" se deschid două variante de sortare: după coloana "caută" sau după coloana "Înlocuieşte cu"; utilizatorul alege varianta de sortare care i se pare mai convenabilă.
      ATENŢIE!  Nu recomand folosirea funcţiei de sortare la cele 39 de dicţionare din OCR_DIC, deoarece înregistrările din unele dicţionare au o ordine prestabilită de rulare care nu ţine cont de ordinea alfabetică, ci de cronologia executării fiecărei modificări în parte. Sortarea alfabetică a unora dintre dicţionarele OCR_DIC le poate face să funcţioneze incomplet sau să producă erori.

      ► Deplasarea cu mausul în sus sau în jos a înregistrărilor:
      Se poate schimba poziţia unei înregistrări, deplasând-o mai sus sau mai jos în cadrul dicţionarului, fără a folosi funcţia de sortare ori cea de Copy&Paste.
      Se selectează una sau mai multe înregistrări şi pur şi simplu se pot trage cu mausul în sus sau în jos până la poziţia dorită.
      Apar situaţii când acest lucru este necesar, de regulă, atunci când se îmbunătăţeşte un dicţionar prin adăugarea de noi înregistrări. E posibil ca o înregistrare veche să trebuiască să rămână pe ultima poziţie a dicţionarului sau în diverse alte poziţii şi să nu fie indicată sortarea.
      E de preferat ca pentru început să se facă astfel de manevre cu câte o singură înregistrare şi mai apoi să se treacă la deplasarea unui grup de înregistrări.
      În imaginea următoare se poate vedea poziţia înregistrării "alut- >> ajut-" înainte [când se afla pe poziţia 15] şi după deplasarea în sus prin tragerea/agăţarea cu mausul [când a ajuns în poziţia 1]

     Vezi imaginea la dimensiune originală ► IMG Original


      ► Selectarea unui grup de înregistrări consecutive sau aflate în diverse poziţii:
      Dacă în AutoCorect standard asupra înregistrărilor se pot face un număr limitat de operaţiuni, în AutoCorect OCR Plus 5.1 se pot face toate operaţiunile [de selectare, copiere, mutare, ştergere] care sunt cunoscute în editoarele de text şi nu numai.
      Selectarea mai multor înregistrări se poate face atât la înregistrări consecutive [folosind tasta SHIFT], cât şi înregistrări din diverse poziţii [folosind tasta CTRL] aşa cum se procedează în diverse programe.
      Selectarea tuturor înregistrărilor se poate face acţionând butonul click-dreapta al mausului şi selectând apoi opţiunea "Selectare totală".

      ► Operaţiuni diverse cu înregistrări selectate:

      Iată în imaginea de mai jos meniul care de desfăşoară la acţionarea click-dreapta a mausului:


      Cred că meniul este suficient de sugestiv şi operaţiunile ce se pot executa sunt uşor de înţeles, deoarece ele sunt operaţiuni clasice, foarte cunoscute, folosite în foarte multe editoare.

      DECUPARE: click dreapta şi "Decupare" sau Ctrl X.

      COPIERE:  click dreapta şi "Copiere" sau Ctrl C.

      PASTE:  click dreapta şi "Paste" sau Ctrl W

      ŞTERGERE: Înregistrările diverse selectate pot fi şterse prin mai multe metode:
                 - folosind butonul "Stergere" de pe panoul din dreapta a ferestrei;
                 - click dreapta şi folosirea opţiunii "Ştergere";
                 - folosind tasta Delete.

      ► Salvarea modificărilor făcute într-un dicţionar:
      Salvarea cea mai frecventă a modificărilor este metoda rulării dicţionarului, prin apăsarea butonului "Rulează".
      Altă variantă de salvare a tuturor modificărilor este prin acţionarea butonului "X" din colţul dreapta-sus a ferestrei de Înlocuire Multiplă.
      ATENŢIE: Dacă după executarea unor modificări într-un dicţionar nu facem niciuna dintre operaţiunile de mai sus, dar deschidem un alt dicţionar cu ajutorul butonului "Deschide dictionar", ei bine, în acest caz modificările nu vor fi salvate.


      ● Operaţiuni cu două sau mai multe dicţionare "imd"


Copiere grup de înregistrări în alt dicţionar

     Vezi imaginea la dimensiune originală ► IMG Original




Copiere Dic.imd → NotePad → Excel şi invers

     Vezi imaginea la dimensiune originală ► IMG Original


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Mulţumesc tuturor pentru semnalări.
      Voi proceda astfel: voi şterge postările care nu conţin semnalări de erori; la postările care conţin semnalări de erori, voi păstra doar semnălările la care voi adăcuga stadiul rezolvării.

      Şi, da, ai dreptate ZC: AC nu converteşte toate tipurile de bullets, ci doar pe cele ce pot fi interpretate ca linie de dialog.

      Putem găsi un mod de rezolvare pentru problemă pentru că am un Doc-Template care conţine câteva macrocomenzi, dintre care prima este cea care converteşte TOATE bullets în caractere. Am verificat acum exact cu testul tău şi funcţionează foarte bine.

      Într-un template de acest fel poate fi rulat un OCR înainte de rularea prin AC, iar timpul consumat cu rularea prin template se câştigă la viteza de rulare în AC.
      Acest template mai face şi alte lucruri care ar veni în ajutorul AC, elimină spaţii multiple, converteşte tab în spaţiu etc., dar are şi macrocomenzi speciale pentru că eu îl folosesc pentru perierea OCR-urilor franceze de la  La jeunesse du roi Henri [Juneţea regelui Henric].
     Trebuie ca mai întâi să elimin sau să modific unele macrocomenzi, astfel încât în template să rămână numai modificările care ne interesează, dar cum nu sunt foarte priceput la macrouri, treaba asta va dura două-trei zile.
     
    Ca să vezi despre ce e vorba şi să poţi face testări, am pus originalul în variantă arhivată şi nearhivată la adresa:
     

    Se deschide template prin dublu click şi se deschide fişierul.
    Apare un mesaj de avertizare că fieşierul conţine macro şi se apasă butonul "Enable Macros".
     La deschiderea fişierului apare în plus o bară cu 6 butoane pentru macrouri.
     Se inserează fişierul cu pricina şi se apasă doar pe butoanele 1 şi 3 [la 1 se face conversia bullets-caratere şi la 3 elimină spaţii multiple şi converteşte tab în spaţiu.
     După asta se dă Save As... şi se alege formatul RTF pentru ca documentul să nu mai păstreze macrourile, respectiv se dă un nume fişierului OCR.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am să şterg şi postările cu dicuţii punctuale ZVONACFIRST, Seven, meridiane, utilitasetveritas.
     Trebuie doar să găsesc o formulare pentru problema legată de faptul că la op.1.1. nu se convertesc toate caracterele bullets, ci doar cele care reprezintă linii de dialog.

      Acum vreau să vă propun o operaţiune simplă de corectare a unui dicţionar.
      Pentru că nu e ceva complicat, ar fi bine să încercăm să realizăm această operaţiune.


     Am revizuit doua dicţionare care aveau înregistrări ce produceau modificările incorecte semnalate în postările de mai sus.
     Este vorba despre dicţionarul  CO_Midp.imd [CL_Midp.imd] din pachetul OCR_DIC şi de dicţionarul Uz_Î3 [i - î] 682.imd din dicţionarele Uzuale. În ambele am făcut corecţiile semnalate şi am făcut verificări în plus; sper că am rezolvat cam tot. Aştept dacă sunt şi alte semnalări.

     Bun. Am urcat deja în folderul TEMP de pe Mediafire variantele revizuite la CO_Midp.imd [CL_Midp.imd] şi urmează să mai fac o verificare şi apoi să urc şi ultima variantă de la Uz_Î3 [i - î] 682.imd
     
     Înainte de a face download aş vrea să vă propun să încercaţi mai întâi să faceţi fiecare modificările la dicţionarul CO_Midp.imd., apoi pentru siguranţă puteţi face şi downloadul.

     Să reamintim: orice dicţionar de tip "imd" poate fi vizualizat şi editat în AutoCorect.
     Folosim opţiunea "Editare" → "înlocuire Multiplă" sau click pe iconul din dreapata sus; ajungeam în fereastra Înlocuire multiplă în care se află în mod obişnuit dicţionarul gol "imiplicit.imd", acţionăm butonul "Deschide dicţionar" şi încărcăm dicţionarul dorit, în cazul nostru CO_Midp.imd.

      Avem următoarele variante de înlocuiri:
             Insera >> Însera    Ci  Ic  Pp  Pi   
             Insere >> Însere    Ci  Ic  Pp  Pi   
             Inseria >> Înseria    Ci  Ic  Pp  Pi   
             Inserie >> Înserie    Ci  Ic  Pp  Pi   
ţi ele se află laurmătoarele coordonate:  2422-2425, 1769-1772, 1116-1119 şi 463-466.

      Ştergerea înregistrărilor o vom face în mod obligatoriu de la sfârşitul dicţionarului spre începutul lui, pentru că dacă am face ştergerea de la începutul dicţionarului, coordonatele date nu ar mai fi valabile.

      Deci, derulăm dicţionarul până în zona înregistrărilor cu nr.  2422-2425. Vom făsi acolo cele 4 înregistrări însoţite de —^s, ceea ce înseamnă linie de dialo urmată de spaţiu neseparabil.
      Selectăm cele 4 înregistri şi le ştergem, folosind tasta Delete, ori Ctrl X, sau click dreapta şi opţiunea Ştergere.
      După ştergere defilăm în sus până la înregistrările 1769-1772 unde vom găsi cele 4 înregistrări într-un alt format; facem ştergerea şi defilăm spre următoarele coordonate.
      După ce am făcut ştergerea şi de la poziţiile 1116-1119 şi 463-466, defilăm până la sfârşitul dicţionarului şi ne uităm câte înregistrări au rămas în dicţionar. Dacă au rămas un număr de 2630 de înregistrări înseamnă că ştergerea a fost corectă.
     
      Atenţie! la dicţionarul CL_Midp.imd am constatat că lipsesc în acest moment două înregistrări, astfel că cele 4 coordonate nu sunt valabile; dacă dorim să facem o ştergere şi aici, atunci coordonatele ar trebui să fie următoarele: 2420-2423, 1767-1770, 1114-1117 şi 461-464.

      Dacă am făcut aceste modificări, atunci putem constata că pe viitor se pot face astfel de ştergeri, corecturi, editări atunci când sunt semnalate de alţii sau atunci când constatăm noi singuri că o înregistrare ar trebui ştearsă ori modificată...

      Dacă aţi greşit ceva la ştergere, nu-i nicio problemă pentru că am adus la zi ambele dicţionare: CO_Midp.imd, respeciv CL_Midp.imd şi ele se găsesc în:
             folderul temporar TEMP
             de la adresa:

      Celelalte dicţionare de tip Midp.imd, modificate în urmă cu câteva zile au fost şterse.
      Pentru că modificarea dicţionarul Uz_Î3 [i - î] 682.imd este mai complexă, voi urca direct varianta reactualizată pe host şi voi menţiona despre acest lucru în această postare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Diacritice cu virgula Vs. diacritice cu sedila

      1. AutoCorect poate lucra cu ambele tipuri de diacritice.
      De altfel, există opţiunea "Editare" → "Conversie diacritice" care permite convertirea din diacritice cu virgula în diacritice cu sedila şi invers.

      2. Toate, dar absolut toate, dicţionarele "imd" sunt editate cu diacritice cu SEDILA, aşa cum toate cărşile corectate de mine de-a lungul timpului sunt editate cu diacritice cu sedila..
      Personal folosesc doar diacritice cu sedila şi format doc [nici măcar docx] dintr-un motiv simplu de ordin tehnic: toată lumea, indiferent de sistemul de operare şi editor poate "vedea" un doc care are are diacritice cu sedila, timp în care nu toţi posesorii de computere pot "vedea" diacriticele cu virgulă.
      Eu merg pe principiu că dacă tot am migălit la corectarea unei cărţi, atunci s-o poată citi oricine îşi doreşte fără să întâmpine dificultăţi de ordin tehnic şi să fie nevoit să apeleze la conversii care adeseori dau erori.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ÎNLOCUIRI CARACTERE REPRODUSE ERONAT



     Notă: pentru a face o notare mai simplă a dicţionarelor, în această postare şi următoarea nu am mai pus particula CO_ [CL_] de la începutul dicţionarelor, care face doar diferenţa dintre variantele Contemporan şi Clasic, şi nici extensia „imd” care se subînţelege, ci am notat doar numele lor concret, asfel că dicţionarele CO_L1.imd ÷ CO_L4.imd, au fost notate cu L1 ÷ L4 şi aşa mai departe.

     Există o serie de caractere sau grupuri de caractere pe care Abbyy le confuncă şi le recunoaşte în mod frecvent eronat, printre care: cifra 1 = l, cl = d, rn = m, c = e, l = i, ă = â etc…

     Înlocuirea cifrei 1 cu litera L mic a fost prima preocupare şi s-a încercat rezolvarea acestei probleme cu înregistrările din dicţionarele L1÷ L4, care iniţial au rulat cu o opţiune separată, iar acum rulează la pachetul nr.4 „Corectare caractere reproduse eronat”, opţiunea „4.2 Corectarea literelor l, d si m reproduse eronat”.

     Confuzia perechilor „cl = d” şi „rn = m” a fost următoarea preocupare şi pentru corectare au fost create dicţionarele Gcl şi Grn, primul făcând o serie de înlocuiri de tipul „cl >> d”,iar cel de-al doilea înlocuiri de tipul „rn >> m”
Ambele dicţioare rulează în cadrul opţiunii amintită mai sus, „4.2 Corectarea literelor l, d si m reproduse eronat”.

     Cu toate acestea au rămas o serie de confuzii nerezolvare,printre care cele mai importante sunt „c = e, l = i”, dar nu numai acestea.
     Corectarea prin formula înlocuire de cuvinte întregi, chiar încercând să modificăm doar rădăcinile cuvintelor şi nu întreg pachetul de cuvinte dintr-o familie, devine aproape imposibilă, deoarece ar necesita zeci de mii de înregistrări doar pentru confuzia „c = e”.

     Din acest motiv a apărut ideea de înlocuire a unor secvenţe de cuvinte şi nu a unui cuvânt întreg.
     Despre astfel de situaţii vorbim pe larg în postarea următoare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

          ÎNLOCUIRI SECVENŢE DE CUVINTE



     Secvenţa de cuvânt este o succesiune scurtă de litere [de regulă de 3-4 litere şi foarte rar un număr mai mare de litere], care pot apărea oriunde într-un cuvânt sau doar la începutul, în interiorul ori la sfârşitul cuvintelor.
     Secvenţele de început au fost înregistrate în dicţionare numite SInc; secvenţele din interiorul cuvintelor, deci mediane, au fost notate cu SMed, iar secvenţele finale, de la terminaţia cuvintelor, au fost notate cu STer.

     Cel mai simplu ar fi fost ca dicţionarele să fie numite SInc, SInt şi SFin; S-au folosit numele de SInc, SMed şi STer pentru ca diferenţa de nume să fie uşor vizibilă, să poată fi sortate alfabetic şi să fie cât de cât sugestive.

     Modificarea secvenţelor de cuvinte se realizează în pachetul de opţiuni nr.4 „Corectare caractere reproduse eronat”, opţiunea nr. 4.5. „Corectare secvenţe cuvinte”

     Accesarea opţiunii 4.5 pune în mişcare rularea automată în ordine prestabilită a 6 dicţionare.
     Pentru fiecare tip de secvenţă există câte 2 dicţionare, iar ordinea de rulare este chiar ordinea de sortare, deci SInc1, SInc2, Smed1, SMed2, Ster1 şi Ster2.


     Cred că înlocuirile secvenţelor de la interiorul cuvintelor sunt cele mai multe şi un pic mai dificile.
     Să încercăm câteva explicaţii despre funcţionarea lor, folosindu-ne de câteva exemple:

     Să luăm în calcul confuzia dintre literele „e” şi „c”; Abbyy poate pune atât „e” acolo unde în mod real există „c”, cât şi invers.
     Dacă vorbim de secvenţe mediane, înseamnă că „e” sau „c” trebuie să se afle obligatoriu între două litere, altfel spus între perechi de litere, aşa că s-a făcut căutarea fiecărei situaţii posibile.

     Pornind de la perechile AA, AB, AC, AD, AE… Până la ZU, ZV, ZX, ZZ, am introdus la mijlocul fiecărei perechi litera e şi am făcut o căutare în dicţionare, apoi litera c şi am reluat căutarea, astfel că am făcut căutări începând cu AEA-ACA, AEB-ACB, AEC-ACC… ZEV-ZCV, ZEX-ZCX, ZEZ-ZCZ.
     Căutarea s-a realizat în dicţionarele de limbă română [DEX şi celelalte], existente în folderul de instalare a AutoCorect.

     La căutare au existat 3 mari variante de rezultate:

     a. La căutare au rezultat un număr foarte mare de cuvinte, atât în secvenţa cu litera E, cât şi în secvenţa cu litera C; în astfel de situaţii nu s-a făcut nicio înregistrare.

     b. La căutare, a rezultat că în limba română între anumite două litere exista doar una dintre secvenţe; în acest caz, pur şi simplu s-a făcut înregistrarea, de regulă înregistrarea modificând succesiunea care conţinea litera „C” în succesiune care conţinea litera „E”.

     c. La căutare au rezultat un număr mare de cuvinte pentru o anumită succesiune [am numit această succesiune REGULA] şi un număr foarte mic de cuvinte pentru cealaltă succesiune pe care am numit-o EXCEPŢIA DE LA REGULĂ [în principal este vorba de cuvinte împrumutate din alte limbi, ori cuvinte specifice unui domeniu cum ar fi cel medical].

     Această situaţie va trebui explicată mai detaliat.
     Să luăm de exemplu succesiunile de 3 litere „MCL” – „MEL”.

     La o căutare în dicţionarele de limba română aflate în folderul de instalare a AutoCorect, rezultă că un număr de 10 cuvinte din familia „Adamclisi” şi „circumcluzie” conţin această succesiunea „MCL”, timp în care un număr de 1919 cuvinte conţin succesiunea „MEL”.

     Aveam posibilitatea să nu fac nicio înregistrare, timp în care o serie dintre cele 1919 cuvinte ar fi putut rămâne cu erori sau puteam să aleg modificarea cu beneficiul cel mai mare şi să fac înregistrare „mcl >> mel”;

     Mai exista o variantă un pic mai complicată, dar pe care o consider un pic mai corectă, aşa că am recurs la ea:
          – pasul 1: am făcut înregistrarea „mcl >> mel”
          – pasul 2: am făcut următoarele două înregistrări care să readucă cele două grupuri de cuvinte la forma iniţială:
           „adamclisi >> Adamclisi”
           „circumcluz >> circumcluz”
ambele cu condiţiile: „Cuvânt întreg la început” + „Păstrează capitalizarea”
     Putem spune că am recurs la un fel de „modificare a modificării”.

     Acest gen de situaţii au apărut şi în alte succesiuni şi acolo unde recorectarea se putea face printr-un număr mic de înregistrări, am procedat similar, astfel că o serie de înregistrări din dicţionarele SMed par foarte aiurea; acestea sunt cele care „modificarea primei modificări” şi par aiurea pentru că sunt cuvinte foarte rare şi foarte puţin cunoscute.

     Să mai dăm un scurt exemplu cu secvenţele „MLL” – „MIL” şi „MLI”
     La căutări au rezultat următoarele:

     Secvenţa „MLL” = zero cuvinte
     Secvenţa „MIL” = 4111 cuvinte
     Secvenţa „MLI” = 60 cuvinte din 5 familii de cuvinte şi anume:
          atomliză = efuziune
          drumlin = formă de relief de origine glaciară, având un contur eliptic.
          Kremlin = oraş rusesc
          omlitui = verb – a face marcotaj, procedeu de înmulţire a unei plante prin marcote.
          şimli = cozoroc la o şapcă

     Mod de rezolvare:
          – pasul 1: am făcut înregistrările „mll >> mil” şi „mli >> mil”
          – pasul 2: am făcut următoarele înregistrări care să readucă cele două grupuri de cuvinte la forma iniţială:
           „kremiln >> kremlin”
           „atomilz >> atomliz”
           „drumiln >> drumlin”
           „omlitui >> omiltui”
           „şimil >> şimli”


     Probleme posibile

     Există o mare problemă dacă ele rămân în acelaşi dicţionar şi o detaliem.

     Ordinea executării înlocuirilor din primul exemplu de mai sus este ordinea în care s-au făcut înregistrările:
           „mcl >> mel”
           „adamclisi >> Adamclisi”
           „circumcluz >> circumcluz”

     Dacă cineva, dintr-un motiv sau altul, face o sortare a înregistrărilor din dicţionar, ordinea va deveni:
           „adamclisi >> Adamclisi”
           „circumcluz >> circumcluz”
           „mcl >> mel”

     În acest caz, primele două înregistrări nu vor avea niciun efect pentru că la momentul în care ele rulează nu s-a făcut încă modificarea,iar cele două grupuri de cuvinte vor rămâne scrise greşit.

     Pentru evitarea unor astfel de situaţii am hotărât ca în dicţionarul „SMed1” să existe numai modificările succesiunilor de cuvinte, iar în „SMed2” vor fi mutate toate acele înregistrări ce par fără sens şi care fac ceea ce am numit „modificarea modificării”.

     Dacă vor apărea astfel de situaţii şi la secvenţele de început de cuvânt sau de sfârşit de cuvânt, voi proceda la fel şi în cazul dicţionarelor „SInc” şi „STer”, astfel că dicţionarele „SInc2” şi „STer2” vor conţine înregistrări de tip „modificarea modificării”.

     Este important de reţinut faptul că oricât de aiurea ni se vor părea înregistrările din dicţionarele „SInc2”, „SMed2” şi „Ster2”, ele nu trebuie şterse, iar dacă facem totuşi ştergerea unei înregistrări, acest lucru trebuie făcut doar după ce am înţeles care este rolul ei.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

            IMPORTANT: UPDATE 23.04.2013



       1. Rezolvare probleme legate de opţiunea 1.1 

       Opţiunea 1.1 face conversia bullets >> caracter text, doar pentru semnele care ţin loc de linie de dialog.
       Pentru rezolvarea conversiei în caracter text a tuturor tiourilor de bullets şi pentru a scurta timpul de rulare a unor opţiuni, am realizat un Doc-Template simplu care poate rula [la acest moment] 4 macrocomenzi.
       Macrocomenzile sunt următoarele:
            "1 Bullet > text" - face conversia tuturor tipurilor de bullets în caractere text.
            "2 Del Spatii multiple" - face conversiua taburilor în spaţii simple şi reduce spaţiile multiple consecutive la un singur spaţiu.
            "3 Del page Break" - şterge marcajele Section Break sau Manual Page Break şi le înlocuieşte cu marcajul Parahraph Mark, adică înlocuieşte trecerea forţată la pagina următoare cu un paragraf [rând] gol.
            "4 PUNCTUAŢIE" - elimină spaţiile din faţa principalelor 6 semne de punctuaţie < , ; . : ! ? >

       Nume template:     Precuratare 2013.04.23.dot
       Adresa template: 

       MOD DE FOLOSIRE:
           - se face dublu click pe template pentru deschidere.
           - după deschiderea automată în Word apare un mesaj care avertizează că fişierul conţine macros şi se apasă butonul "Enable Macros"
           - în mod normal trebuie să apară o bară formată din 4 butoane + text. În WORD 2010 bara apare la afişarea ribonului "Add-Ins". Dacă nu apare bara se deschide Toolsbars şi se activează pachetul numit "TEMP7", care conţine cele 4 butoane.
          - se inserează în document OCR-ul aşa cum rezultă din Abbyy;
          - se rulează macrourile apăsând pe rând butoanele în ordine. În partea de jos a ferestrei se observă o mişcare a contorului de pagini; când contorul s-a oprit înseamnă că macrocomanda şi-a încheiat execuţia şi se apasă butonul următor.
          - după rularea celor 4 macrocomenzi se salvează OCR-ul modificat în format RTF pentru a nu mai păstra macrourile şi fişierul se poate rula normal în AC OCR Plus;
          - la rularea în AC nu trebuie să eliminăm din opţiuni, deoarece macrourile sunt mai simple decât opţiunile şi au doar rolul să reducă timpul de rulare a 2-3 opţiuni.


       1. Rezolvare conversie ghilimelele sus de tip 66 cu ghilimele sus de tip 99.
       Ghilimele româneşti de sfârşit de citat sunt poziţionate sus şi ar trebui să fie de forma numărului 99. Dacă aceste ghilimele sunt bine poziţionate, dar au forma numărului 66, la rularea opţiunii 2.3 Punctuaţie / Functii obişnuite, programul va trece în lista cu semnalări erori toate situaţiile în care ghilimele sunt de tip 66,ceea ce îngreuează verificarea sugestiilor.

        Am rezolvat cel puţin temporar situaţia adăugând o înregistrare în dicţionarul CO_Artef.imd care face conversia ghilimelelor 66 în ghilimele 99, la ghilimele aflate în poziţia SUS.
        Dicţionarul rulează înaintea punctuaţiei, aşa că ghilimele sunt deja modificate la rularea punctuaţiei şi nu vor mai apărea în lista de sugestii.

        PROBLEMĂ: Înregistrarea este ultima în dicţionarul Artef, dar deocamdată am setat-o să ruleze cu confirmare, urmând ca după ce vom constata efectele rulării să stabilim dacă modificarea poate funcţiona automat sau nu va funcţiona şi va trebui eliminată.
        Dicţionarul CO_Artef.imd care conţine modificarea se poate downloada de la adresa:
               

        Pentru utilizatorii AC Clasic, dicţionarul trebuie doar redenumit din "CO_Artef.imd" în "CO_Artef.imd", deoarece conţinutul dicţionarelor este identic.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
printzuska
Membru Gold

Din: Constanta
Inregistrat: acum 12 ani
- în mod normal trebuie să apară o bară formată din 4 butoane + text. În WORD 2010 bara apare la afişarea ribonului "Add-Ins". Dacă nu apare bara se deschide Toolsbars şi se activează pachetul numit "TEMP7", care conţine cele 4 butoane.
       

Nu am gasit cele patru butoane in Add-ins. Si nu gasesc Toolsbars de unde sa activez pachetul acela?


pus acum 11 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 16 ani

MOD DE FOLOSIRE

In Office 2010 nu se intampla la fel cum scrie Seven, sau la mine nu se intampla la fel.
Eu am procedat astfel:
- se activeaza mai intai ribbonul Developer, in caz ca nu este activat deja. Pentru cei care nu stiu cum: File --> Options --> Customize ribbon --> Se bifeaza in lista din dreapta Developer --> OK
- se deschide template-ul pus la dispozitie de Seven. nu va aparea mesajul de avertizare de care aminteste Seven asa ca va trebui sa activam Macros (default sunt dezactivate din motive de securitate). Pentru cei care nu stiu: Developer --> Macro security --> Macro Setings --> Se bifeaza Enable all macros --> Ok
- se deschide ocr-ul brut
- in ocr se selecteaza textul pe care dorim sa-l prelucram (eventual tot documentul) --> Copy
- in template se da Paste. Daca vom deschide documentul direct din template se va deschide ca document de sine statator fara sa poata fi rulate acele macro.
- se ruleaza macrourile folosind butoanele din Add Ins. daca nu apar butoanele rulam "manual" macrourile, pe rand: Developer --> Macros --> Se alege macro dorit --> Run
- se salveaza documentul ca rtf.
Sper sa nu fi uitat ceva. Eu asa am procedat si a mers.

Modificat de ZVONACFIRST (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Eu am Ms Office 2003 instalat pe care îl folosesc permanent şi un Ms Office 2010 portabil pe care-l folosesc doar pentru realizarea PDF din text pentru că rezultă un PDF mai mic şi uneori pentru deschiderea unor fişiere docx care nu sunt compatibile cu doc.

      Am constatat şi eu că deşi Template rula bine în Word 2003, erau probleme în 2010 şi când în sfârşit l-am găsit pe unde era ascuns, am crezut că aceea este varianta universal valabilă.

      Rog pe cei ce se pricep la lucrul cu macro Word-uri superioare să se "milească" de noi şi, poate, face o prelucrare astfel ca cele 4 macros să ruleze mai simplu şi în Word 2010... 2012... şi ce a mai apărut.
      Dacă e nevoie pot urca fişier TXT cu conţinutul macrocomenzilor.

      Până atunci, sper să fie de ajutor explicaţia postată de ZVONACFIRST.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 16 ani

Seven a scris:


      Rog pe cei ce se pricep la lucrul cu macro Word-uri superioare să se "milească" de noi şi, poate, face o prelucrare astfel ca cele 4 macros să ruleze mai simplu şi în Word 2010... 2012... şi ce a mai apărut.
   


@Seven, am facut un tutorial despre cum pot fi integrate macrourile din template-ul tau in Word 2007 si 2010.
Avantajul este ca avem acele macrocomenzi direct in Word fara a fi nevoie sa deschidem de fiecare data un template separat.
Sper ca am reusit sa fiu cat se poate de riguros, de exact si de explicit.
Este posibil sa fie destul de complicat pentru unii mai incepatori dar am pus aproape exlusiv print-screenuri cu pasii enumerati ... sper sa fie simplu.
Pentru intrebari sau nelamuriri... sunt prin zona.

Tutorial

Cam asa arata ceea ce obtinem, un ribbon nou si patru butoane, cate unul pentru fiecare macro. Poate nu am fost foarte inspirat la alegerea iconurilor pentru butoane, dar fiecare poate sa aleaga ce buton doreste.


LE: Nu a incercat nimeni? Sunt curios daca a reusit cineva. Sau poate este prea complicat sau inutil tutorialul?

Modificat de ZVONACFIRST (acum 11 ani)


pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Îmi pare rău că din nişte motive legate de proasta funcţionare a computerului meu a trebuit să scanez şi rescanez computerul cu tot felul de AV şi pentru că rezultatele au fost nemulţumitoare a trebuit să reinstalez de câteva ori Win.
      Înainte de ultima instalare Win am uitat să-mi salvez dicţionarele OCR_DIC, cele la care am lucrat în perioada februarie-mai, astfel că în urmă cu două săptămâni am făcut download dicţionarelor care se aflau pe mediafire.
      Între timp am periat din nou dicţionarele, dar nu pot recupera ceea ce lucrasem în timp de 3 luni.
      Este posibil să reiau lucrul la ele, pentru că eu chiar cred în acest program, dar nu ştiu când voi reuşi să urc ceva mai bun.

      Dacă voi avea noutăţi, ele vor apărea pe un folder deschis pe mediafire:
      Nume folder: Folder: Z1 Noutăti AC OCR Plus
      Adresă folder:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 11 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 16 ani
Stiu ca sunt persoane care nu reusesc sa actualizeze dictionarele in AutoCorect din cauza ca nu gasesc folderul Roaming.
Descriu in continuare o metoda simpla si rapida, aplicabila in Windows 7, pentru a ajunge la folderul Roaming:
1. Click dreapta pe Desktop
2. New - Shortcut
3. In campul Type the location of the items se scrie: %appdata% si apoi se da Next
4. In campul Type a name for this shortcut se scrie Roaming (este posibil sa fie deja scris) si apoi Finish.
Veti avea pe desktop un shortcut catre folderul buclucas.
Sper sa fie de folos.


pus acum 11 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Merci beaucop.

pus acum 11 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am constatat în ultimul timp că una dintre marile probleme nerezolvate încă de AC este rămânerea în text a cratimei de la cuvintele rupte la capăt de rând.
     După rularea AC a unui OCR [şi cred că e vorba în primul rând de OCR obţinute cu Abbyy11] rămân o serie de succesiuni de genul literă_mică-cratimă-spaţiu-literă_mică.

     Sunt 3 situaţii:
        1. în primul rând, este vorba de cuvânte despărţite la capăt de rând şi în aceste cazuri ar trebui să ştergem cratima şi spaţiul de după cratimă, astfel încât cuvântul să se unească.
        2. poate fi vorba de cuvinte scrise corect cu cratimă, dar la care a apărut în plus un spaţiu eronat; în această situaţie trebuie şters spaţiul şi păstrată cratima, astfel că vom avea unirea unui cuvânt care conţine cratimă.
        3. mai poate fi vorba de o cratimă fără niciun sens/rol care apare eronat în spaţiul dintre două cuvinte; în acest caz va trebui să ştergem doar cartima şi să păstrăm spaţiul dintre cuvinte.

     Am încercat să rezolv problema cu un dicţionar în glumă, care conţine 6 înregistrări. Nu este un dicţionar în modul obişnuit, ci unul cumva mai altfel.
     Dicţionarul se numeşte "Cratimă eror - cu avertizare.imd"
     În realitate conţine doar 3 modificări, dar la care am adăugat şi 3 înregistrări cu rol de avertizare.
     Al doilea dicţionar,cel care se numeşte "Cratimă eror - simplu.imd", conţine doar înregistrările care fac modificările, dar este mai dificil de rulat.
     Mai fac două precizări: reamintesc că în AC OCR Plus, inclusiv în dicţionare se pot folosi coduri. Codul  ^_ este codul pentru spaţiul obişnuit. Este important de reţinut acest lucru, deoarece acest cod apare în dicţionarul propus.

      Arhiva care conţine cele două dicţionare poate fi downloadată de la adresa:
                   

      Dicţionarul poate fi salvat oriunde şi va fi rulat pur şi simplu după rularea automată, direct din meniul "Editare" -> "Înlocuire multiplă" şi încărcarea dicţionarului.

      Rezolvarea problemelor cratimei-eroare trebuie făcută printr-o metodă profesionistă, dar până la găsirea acestei metode, sunt curios dacă cineva consideră utilă improvizaţia propusă.
      Bineînţeles că aş dori şi propuneri pentru îmbunătăţirea metodei.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

    DICŢIONAR 4 LITERE



     Am prelucrat de curând în AutoCorect o carte la care am constatat o eroare de mare frecvenţă făcută de Abbyy, cu următoarele caracteristici:
          — eroarea era de fiecare dată de forma „â” final, în loc de „ă” final; toate corecturile au fost de forma „â” >> „ă”;
          — eroarea era determinată de caracteristicile fontului folosit la tipărire, dar nu apărea şi în alte poziţii ale literei, ci doar la final;
          — eroarea a avut apariţii, atât la cuvinte scurte de 4÷5 litere, dar şi la cuvinte lungi şi foarte lungi.

     Atenţie! O astfel de eroare poate apărea la unele cărţi, dar poate să nu aibă nicio apariţie la alte cărţi.

     Înlocuirea cu confirmare pusă la dispoziţie de dicţionarele de la opţiunea „10.3 Înlocuiri cu confirmare”, oferă posibilitatea corectării complete, dar este dificil de folosit ca urmare a numărului mare de confirmări ce trebuie făcute, respectiv a timpului mare necesar.

     Nu am mai întâlnit o astfel de eroare cu o frecvenţă atât de mare, astfel că până acum aveam doar o înregistrare cu confirmare care putea modifica pe „â” final în „a, ă sau î”.

     Pentru că, aşa cum am arătat, în cazul meu toate „â” finale erau în realitate „ă” final, m-am gândit să rezolv problema la cuvintele scurte cu frecvenţă mai mare din limba română, prin rularea modificărilor într-un dicţionar cu înlocuire automată, pentru a nu mai pierde timpul cu confirmările.

     De exemplu, cuvinte scrise eronat de forma „tatâ, tavâ, taxâ, tezâ, tijâ, tisâ, tobâ, tocâ, tonâ, tubâ, turâ, tuşâ, tuvâ”… se modifică automat în forma corectă „tată, tavă, taxă, teză, tijă, tisă, tobă, tocă, tonă, tubă, tură, tuşă, tuvă”…

     Pentru ca numărul de cuvinte înregistrate în dicţionare să nu fie prea mare, am ales să mă ocup, cel puţin pentru moment, doar de cuvinte formate din 4 litere şi cuvinte formate din 5 litere.
     Pentru a preveni eventualele înlocuiri neprevăzute, am ales ca toate modificările să fie înregistrate cu condiţiile „Cuvânt întreg la ambele capete” plus „Păstrează capitalizarea”

     Condiţia „Cuvânt întreg la ambele capete” înseamnă că există o singură formă a cuvântului de căutat; astfel „altâ >> altă”, va face modificarea doar asupra cuvântului întreg „altă”, neafectând cuvintele de genul „ailaltă, alaltăieri, asaltări, baltă, exaltări, saltă, tresaltă” care conţin secvenţa „altă”

     Condiţia „Păstrează capitalizarea” înseamnă că înlocuirea va păstra modul de scriere cu litere mici sau mari a cuvântului de modificat, corectând atât cuvântul „altâ > altă”, cât şi „Altâ > Altâ”, dar şi „ALTÂ > ALTĂ”.

     După cum se ştie, dacă aş fi pus condiţia „Potrivire perfectă” în locul condiţiei „Păstrează capitalizarea”, atunci s-ar fi realizat doar modificarea „altâ > altă”, iar cuvintele scrise sub forma „Altâ” şi „ALT” ar fi rămas nemodificate.


     Căutarea este una destul de migăloasă, cu un consum mare de timp, cel puţin în prima fază, astfel că reactualizarea completă pentru cuvintele de 4 şi 5 litere va necesita ceva timp.

     Am făcut căutări de cuvinte cu 4 litere cu ajutorul funcţiei clasice de căutare din AutoCorect, care oferă posibilitatea folosirii codului < ^l > pentru orice literă, astfel că folosind formula de căutare < a^l ^l ă >, ceea ce înseamnă <litera a - orice literă – orice literă – litera ă >, deci toate cuvinte de 4 litere care încep cu litera „a” şi se termină cu litera „ă”, indiferent care sunt literele de pe poziţia 2 şi 3.
     După găsirea unui număr de 4÷5 cuvinte, le-am trecut într-un dicţionar temporar şi am înlocuit aceste 4÷5 cuvinte cu secvenţe de genul „xxxx”, „yyyy” sau „zzz”, astfel că la următoarea căutare aceste cuvinte nu mai existau în text şi am căutat următoarele 4÷5 cuvinte, procedând în acest mod până la epuizarea tuturor cuvintelor de 4 litere care încep cu litera „a” şi se termină cu litera „ă”

     Pentru prima fază a căutării am folosit un fişier text al romanului „Gheişa”.

     Pentru găsirea altor cuvinte de 4 litere [dar şi pentru cele cu 5 litere, la care lucrez] am continuat căutarea în încă 7 fişiere, care conţineau fiecare câte un ciclu format din 3-9 volume, fiecare ciclu fiind comprimat în câte un singur fişier text.
     Este vorba despre ciclurile: Floris = 4 vol., Mizerabilii = 3, Război şi pace = 4, Torente = 6, Winnetou = 2, Ramses = 5 şi Juneţea = 9 vol [6 episoade de pe forum + 3 episoade noi traduse, care sunt în curs de corectare].

     Verificarea în câte un ciclu nou este destul de simplă în comparaţie cu prima fază, deoarece după încărcarea fişierului în AutoCorect, rulez dicţionarul de înlocuire a cuvintelor găsite cu una dintre secvenţele menţionate „xxxx sau yyyy”, urmând la la căutarea „a^l^lă” să apară doar cuvinte noi, care nu mai sunt în număr mare. Se întâmplă bineînţeles, ca la unele dintre cicluri, căutarea să nu mai returneze niciun rezultat, semn că toate cuvintele de patru litere cu condiţia de mai sus să fi fost deja găsite.

     Am continuat cu căutarea cuvintelor de acest gen care încep cu litera b, c, d, e, ….  x, y, z.

     Am găsit în acest mod 325 de cuvinte din 4 litere care se termină în litera „ă”. În dicţionare mai existau deja câteva, astfel că numărul total este un pic mai mare… undeva între 340 şi 350.
     Sunt convins că mai există şi alte cuvinte, dar dacă ele nu se regăsesc în cele 34 de volume folosite la căutare, înseamnă că frecvenţa lor este destul de mică şi nu vor afecta în mod serios textul.

     Toate aceste cuvinte au fost înregistrate în dicţionarul CO_Sc4.imd, care a fost dezvoltat de la 388 la 700 înregistrări.

     Dicţionarul CO_Sc4.imd reactualizat l-am urcat pe mediafire sub formă de arhivă RAR neparolată.


     Nume fişier:  [2013.11.13] CO_Sc4.rar
     Adresa:       

     La cuvintele de 5 litere care se termină în litera „ă” sunt în acest moment în faza de căutare a cuvintelor. Probabil că înregistrarea modificărilor acestor cuvinte se va face în dicţionarul CO_CImf2.imd, dar mai durează câteva săptămâni.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

    DICŢIONAR 5 LITERE


     Am încercat să mă ţin de cuvânt şi am realizat un dicţionar cu cele mai frecvente cuvinte de 5 litere care se termină în „ă” şi pe care Abbyy le-ar putea recunoaşte eronat cu „â” ca literă finală.
     După găsirea şi selecţionarea cuvintelor am verificat dacă vreunul dintre aceste cuvinte poate exista în forma corectă cu litera „î” în final.
     Pentru căutare, selecţionare şi verificare am folosit 11 fişiere de tip TXT şi RTF, formate fiecare din 3 la 14 volume; am folosit fişierele amintite la dicţionarul anterior, la care am mai adăugat:
         — MUSCHETARII [Cei trei muschetari; După douăzeci de ani; Vicontele de Bragelonne];
         — P. ERDMAN [Filiera Elveţiana; Panica din 89; Ultimele zile ale Americii];
         — Nora ROBERTS [1 Îmblânzitoarea de suflete; 2 Iubire peste timp; 3 Jurnalele unei prostituate de lux; 4 Mai îmbătător decât vinul; 5 Paşi spre fericire; 6 Păcate sacre; 7 Păstrează visul; 8 A fost odată o stea; 9 Trilogia cercului - 3vol; 10 Triumful dragostei; 11 Treptele iubirii; 12 Visuri împlinite];
         — BALZAC [1 Eugénie Grandet; 2 Faimosul Gaudissart; 3 Iluzii pierdute; 4 Ursule Mirouët; 5 Vicarul din Tour].

     Dicţionarul conţine un număr de 856 de cuvinte.
     În funcţie de dorinţa fiecărui user, el poate fi folosit în două moduri:
          ■ ca dicţionar de tip OCR_DIC care rulează automat, sub numele „CO_CImf2.imd”. La înregistrările existente în CO_CImf2.imd am adăugat noile înregistrări, astfel că dicţionarul are în noua formă un număr de 871 înregistrări.
          ■ ca dicţionar independent care se poate rula în grup la opţiunea „9 Rulare grup dicţionare ÎM”, sub numele de „Cuvinte 5 Lit â-ă final.imd”.

     În principiu, dicţionarul CO_CImf2.imd cu îmbunătăţirile aduse nu va prelungi prea mult durata rulării automate, dacă nu vor fi modificări de făcut, fapt pentru care eu recomand folosirea dicţionarului CO_CImf2.imd în forma îmbunătăţită.
     Pentru userii care nu doresc asta, atunci vor păstra vechiul CO_CImf2.imd şi în funcţie de numărul de apariţii al situaţiilor în care „ă” final apare în text ca „â” la opţiunea „10.3 Înlocuiri cu confirmare”, vor stabili dacă rulează suplimentar dicţionarul  „Cuvinte 5 Lit â-ă final.imd”.
     E adevărat, în timpul căutărilor făcute de mine am avut şi situaţii de rulare de lungă durată, dar menţionez că am folosit şi fişiere care aveau în jur de 2500 de pagini, şi toate cuvintele din dicţionar erau înlocuite cu grupul  de caractere „zzz” sau „x-x” ca să elimin cuvintele şi să pot căuta altele noi neînregistrate încă.

     Reamintesc faptul că rularea AutoCorect are eficienţă maximă la rularea cărţilor de circa 200, maxim 250 de pagini. Dacă avem cărţi mai mari este mult mai bine ca să fie împărţite în 2 sau 3 fişiere mai mici.
     Subliniez că dacă rulăm un text de circa 250 de pagini, vom avea o anume durată. Dacă vom rula un fişier de 500 de pagini, deci de două ori mai mare, durata de rulare nu va fi de două ori mai lungă, ci de 2×2=4 mai lungă, adică 2 la pătrat. Dacă vom rula un fişier de trei sau patru ori mai mare, mi-e şi frică să spun care este pătratul lui 3 sau al lui 4.
     Deci, o carte de 800 de pagini va rula într-un timp de 4 ori mai mare decât timpul total necesar pentru rularea a 4 fişiere de câte 200 de pagini.
     Din acest motiv recomand rularea fişierelor pe bucăţi ceva mai mici, chiar dacă avem impresia că vom pierde timp mult la confirmările de la ultima opţiune. În realitate timpul total va fi mai scurt la rularea unui text mare împărţit pe bucăţi decât în cazul rulării sale într-un singur şi mare fişier.


     Am urcat pe mediafire dicţionarele în cele două variante: ca dicţionar separat [„Cuvinte 5 Lit â-ă final.imd”] şi ca dicţionar  „CO_CImf2.imd” îmbunătăţit.
     Pentru studierea de către cei interesaţi, am urcat şi un fişier „doc” ce cuprinde transpunerea în format doc a dicţionarului, sub numele de „Corectură â-ă final cuv. 5 litere.doc”

     Fişiere urcate pe mediafire şi adrese:
     [2013.11.22] Cuvinte 5 Lit â-ă final.rar 
     [2013.11.22] CO_CImf2.rar               
     Corectură â-ă final cuv. 5 litere.doc   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Intenţia mea este să micşorăm la maxim numărul de intervenţii ale utilizatorului pe timpul rulării.
      Mă refer la ultima opţiune, "10.3 Înlocuiri cu confirmare".

      Prefer ca în locul unei înregistrăru cu confirmare la care utilizatorul ar acţiona de 10-15 ori, să fac un dicţionar cu câteva sute de înregistrări, dar să-i uşurez munca utilizatorului. problema este că în puţine cazuri se poate face acest lucru.

      Cred că ar fi de preferat ca utilizatorul să intervină în mai puţine cazuri, chiar dacă programul va rula ceva mai mult.

      Menţionez un lucru, spre liniştirea utilizatorilor.
      Erorile de genul celor corectate în ultimele două dicţionare, în care ă final este recunoscut în mod eronat ca â final sunt erori ce ţin în mod exclusiv de recunoaşterea optică făcută de Abbyy sau alt program de tip recognito.

      Astfel de erori nu pot apărea sub nicio formă la convertirea din limbajul clasic în limbaj contemporan sau la altă opţiune rulată de AutoCorect.
      Acest "â" final eronat nu a fost niciodată "î ".

      Intenţionez deocamdată să mă ocup tot de litera finală, dar de data aceasta de "î" final care apare eronat în locul lui "i", ca în cazurile: căcî, decî, scriî, deviî...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am afirmat într-o postare anterioară, dar şi în alte situaţii, că rularea optimă a AutoCorect OCR Plus se face pentru texte rezultate din 200 de pagini de carte tipărită, maxim din 250 de pagini şi că nu este indicată rularea unei cărţi de mari dimensiuni.

     Pentru a nu părea că e vorba despre o simplă speculaţie, ori o afirmaţie gratuită, am încercat să demonstrez acest lucru şi am făcut câteva teste care pot fi reluate de oricare user interesat.

     Am făcut mai multe testări AutoCorect cu un număr de 5 fişiere de 200, 400, 600, 800 şi 1000 de pagini.
     Practic, am pornit de la un OCR brut rezultat din 200 de pagini de carte tipărită, pe care l-am numit "T200 pg.rtf".

     Copiind acest OCR de două până la cinci ori, am obţinut încă 4 fişiere [T400, T600, T800 şi T1000] care sunt mai mari de 2, 3, 4, respectiv de 5 ori decât fişierul iniţial.

     Am rulat aceste texte prin AutoCorect, folosind absolut aceleaşi opţiuni, urmărind timpul total de rulare pentru fiecare fişier în parte.
     La unul dintre teste am activat un număr de 21 de opţiuni din cadrul celor 10 pachete. Timpul total necesar pentru experiment a fost de câteva ore şi nu am prelucrat încă rezultatele. Totuşi, aceste rezultate pot fi văzut în imaginile notate 20 ÷ 25.

     Un experiment mult mai simplu ce poate fi reluat sau dezvoltat de oricare dintre useri a constat în activarea unui număr foarte mic de opţiuni [cinci opţiuni] şi rularea fiecărui fişier în AC.
     Este vorba de 4 opţiuni relativ simple care nu rulează dicţionare, la care am adăugat opţiunea „9 Rulare grup dicţionare”, care în cazul meu are un număr de 28 de dicţionare cu un total de circa 1550 de înregistrări, opţiune ce a produs 73 de modificări la fişierul T200.
În imaginea următoare se regăsesc rezultatele testării.



     Imaginea cred că este suficient de sugestivă.
     Menţionez că toţi timpii au fost convertiţi în secunde.

     Aş dori să observăm că dacă la fişierul T400 care este exact de 2 ori mai mare decât T200, timpul de rulare total este de doar 2,57 de ori mai mare, ajungem la fişierul T1000 care este de 5 ori mai mare decât fişierul T200, în timp ce timpul total de rulare este de 13,36 ori mai mare.

     Mai departe: urmărind opţiunea „1.3 Elimin tab” [numele complet: Eliminare tab şi spaţii multiple], constatăm că rulează primul fişier în timp de ≈ 31 secunde, iar fişierul T1000 în timp de 8 minute şi 46 de secunde [526 secunde], timp care este de ≈ 17 ori mai mare decât în cazul primului fişier, deşi T1000 este doar de 5 ori mai mare decât fişierul T200.

     Aceste valori nu trebuie luate ca adevăr absolut, deoarece ele nu au aceeaşi valoare în toate situaţiile;  ele depind de numărul de opţiuni, de complexitatea lor, de numărul de căutări şi numărul de modificări făcute etc. valoarea lor diferă, dar tendinţa este aceeaşi.

     Oricare ar fi opţiunile activate, duratele de rulare şi diferenţele de mărime dintre fişierele de diferite dimensiuni, tendinţa este una singură: cu cât este mai mare un text, cu atât rularea sa într-un singur fişier va consuma mai mult timp.
     Este mai rentabilă rularea în pachete de câte 200÷250 de pagini, deoarece timpul total necesar pentru rularea a trei fişiere componente va fi mult mai mic decât timpul necesar pentru rularea textului întreg într-un singur fişier.

     Am urcat pentru cei interesaţi o arhivă RAR neparolată în care pot fi găsite cele 5 fişiere text şi imaginile cu rezultatele celor două testări.

     Nume arhivă:   Test rulare T200-T1000.rar
     Adresă arhivă:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

                Dicţionare OCR_DIC - ultima reactualizare  07.12.2013



      Aşa cum am mai menţionat, scopul meu principal a fost să micşorăm la maxim numărul de intervenţii ale utilizatorului pe timpul rulării opţiunii  „10.3 Înlocuiri cu confirmare”.

     Am considerat că este mai comod pentru utilizator să lase programul să „ronţăie” în linişte dicţionare automate mai mari, decât să fie nevoit să confirme sau nu zeci de situaţii pe care i le oferă dicţionarele cu confirmări.
     Este posibil ca unii utilizatori să considere că mărirea numărului de înlocuiri automate va mări durata de rulare a programului, ceea ce este relativ corect, dar menţionez că durata de rulare a unui dicţionar este influenţată în mod special de numărul de înlocuiri făcute şi mai puţin de numărul de căutări.

     Am făcut diverse modificări, dar m-am ocupat în mod special de corectarea unor cuvinte formate din 4 şi 5 litere, care se termină în mod corect în „i” sau în „ă” şi care sunt reproduse eronat de către Abbyy în „î” sau „â”. De asemenea am urmărit corectarea cuvintelor de 3 litere în care „î” apare în mod eronat în locul lui „i”, atât în poziţie iniţială, cât şi mediană şi finală.
     Am făcut modificări în majoritatea dicţionarelor OCR_DIC, dar principalele dicţionare la care s-au adus un număr mare de înregistrări sunt: CO_Sc3.imd pentru cuvinte formate din 3 litere, Co_Sc4.imd pentru cuvinte formate din 4 litere şi Co_Cimf2.imd pentru cuvinte formate din 5 litere.

     Pentru prevenirea eventualelor efecte secundare, am verificat toate înlocuirile sub forma:
     Cuvânt eronat >> „zzz”  cu condiţiile „Cuvânt întreg” + „Păstrează capitalizare” + „Confirmare”, ceea ce înseamnă că am putut vedea orice existenţă în text a unui cuvânt definit iniţial ca eronat.
     Acolo unde au apărut cazuri în care cuvântul considerat eronat apărea în formă corectă, am eliminat modificarea. De exemplu: pentru că există bir – bâr, fin – fân, mir – mâr – măr, pir – pâr – păr, rid – râd, rit – rât, sir – săr, vid – văd, vâri – vârî… astfel de situaţii şi multe altele, nu au fost prinse în dicţionare.

     Textele în care am făcut verificările sunt următoarele:
     ■ 01. A.Golden – Memoriile unei gheişe = 1 vol.
     ■ 02. J.Monsigny - Ciclul FLORIS = 4 vol.
     ■ 03. V.HUGO - Mizerabilii = 3 vol.
     ■ 04. L.N. TOLSTOI – Război şi pace = 4 vol.
     ■ 05. A.M. Desmarest – Ciclul TORENTE = 6 vol.
     ■ 06. Karl May – Winnetou = 2 vol.
     ■ 07. Christian Jacq – Ciclul RAMSES = 5 vol.
     ■ 08. Ponson du Terrail – Juneţea regelui Henric = 9 vol.
     ■ 09. Al.Dumas – MUSCHETARII [Cei trei muschetari; După douăzeci de ani; Vicontele de Bragelonne];
     ■ 10. P. ERDMAN [Filiera Elveţiana; Panica din 89; Ultimele zile ale Americii];
     ■ 11. Nora ROBERTS [1 Îmblânzitoarea de suflete; 2 Iubire peste timp; 3 Jurnalele unei prostituate de lux; 4 Mai îmbătător decât vinul; 5 Paşi spre fericire; 6 Păcate sacre; 7 Păstrează visul; 8 A fost odată o stea; 9 Trilogia cercului - 3vol; 10 Triumful dragostei; 11 Treptele iubirii; 12 Visuri împlinite] = 14 vol.
     ■ 12. BALZAC [1 Eugénie Grandet; 2 Faimosul Gaudissart; 3 Iluzii pierdute; 4 Ursule Mirouët; 5 Vicarul din Tour]. = 5 vol.
     ■ 13. J. Grisham – [Şi vreme e ca să ucizi, Firma, Cazul Pelican, Clientul, Camera morţii, Juriul, Avocatul străzii, Testamentul] = 8 vol.
     ■ 14. G.R.R. Martin – CGF [Urzeala tronurilor, Încleştarea regilor, Iureşul săbiilor, Festinul ciorilor, Dansul Dragonilor]


     Dicţionarele OCR_DIC reactualizate la 07.12.2013 au fost urcate în folderul cunoscut de pe mediafire în format arhivă RAR neparolată.

     Nume arhivă: OCR_DIC [Contemporan] 2013.12.07.rar
     Adresa folderului:

     Menţionez că acestea sunt ultimele modificări pe care le aduc Dicţionarelor AutoCorect OCR Plus. În acest moment îmi închei şi eu activitatea în echipa AutoCorect.

     Sper ca dicţionarele să fie de folos!
     Sănătate şi toate cele bune!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Ştiu că o serie de persoane evită rularea opţiunii „10.3 Înlocuiri cu confirmare”.

      Referitor la op. „10.3 Înlocuiri cu confirmare” care rulează dicţionarele CO_Var4.imd – CO_Var7.imd informez că am reorganizat dicţionarele astfel încât confirmările agasante să fie în ultimul dicţionar [Var7.imd], aşa încât să se poată ieşi din opţiune, dar să fie făcute deja cele înlocuirile importante.

      În acest sens modificările legate de cifra 1 sau numere de genul 11, 111, 1111 de genul „11 > îl, îi, Îl, Îi, un, nu”… vor fi undeva la finalul opţiunii.
      Dicţionarele sunt încă în lucru şi caut în continuare ca înlocuirile care au multe refuzuri să fie mutate în ultimul dicţionar, aşa cum ar fi şi „ele >> de”, dar şi altele.

      Încerc să stabilesc o înregistrare care să fie cea care-l poate informa pe utilizatorul cu mai puţină răbdare, că din acel moment se poate renunţa la rularea opţiunii.
      Nu am stabilit-o încă, dar ar putea fi ceva de genul „11 >> II”. Utilizatorul va şti că din acel moment urmează înlocuiri la care poate renunţa, urmând ca situaţiilerespective săle rezolve direct la corectarea manuală.

      În maxim două săptămâni voi urca o nouă versiune a dicţionarelor [Var1 – Var7] şi după aceea m-ar interesa nişte constatări, astfel încât să facem ca dicţionarele să fie cât mai eficiente.
      Deocamdată discuţiile pe această temă nu ar fi eficiente, deoarece nu ştim încă despre ordinea în care rulează modificările în dicţionare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 10 ani
   
Pagini:  1 2 3 4  

Mergi la