Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
Profil Angelina20
Femeie
22 ani
Cluj
cauta Barbat
24 - 55 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect versiune pentru Romania-Inedit Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1 ... 8 9 10 11 12 13
xtybyx
MEMBRU VIP

Inregistrat: acum 13 ani
Documentul l-am trecut prin AC, ce e cu rosu  e problema.

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am rulat fişierul lui xtybyx cu executabilul din 23.03.2012, dar la mine nu au apărut probleme. Spaţiul după linia de dialog a fost inserat, atât la dialogurile marcate cu roşu, cât şi la încă alte câteva situaţii nemarcate.
     xtybyx e posibil să fi folosit un exe intermediar, mai vechi decât cel din 23.03?
     Într-adevăr au existat câteva probleme cu executabilele dinaintea celui din 23.03.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am verificat din nou, de astă dată pe OCR original.
     Constatări:
         - liniile de dialog care nu se corectează la o primă rulare, dintr-un motiv aparent necunoscut se corectează la o a doua rulare.
         - liniile de dialog necorectate nu sunt cratime aşa cum par la o primă vizualizare, ci un caracter mai mic decât cratima; acest caracter nu era trecut în dicţionarul "CO_DLd.imd" pentru corectarea liniilor de dialog.
         - Din acest motiv convertirea în Em dash nu era făcută la pachetul "2.Punctuaţie", ci la pachetul "8. Înlocuieşte toate liniile de dialog cu..."  - asta este explicaţia pentru faptul că la a doua rulare apare spaţiul respectiv

     Măsuri: Am adăugat caracterul în dicţionarul "CO_DLd.imd" şi pare că rularea se face acum corect, fără probleme.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 17 ani
Seven,
cand ai timp, te rog, actualizeaza si dictionarele din folderul mediafire, cu ultimii termeni/secvente, adaugati.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Încerc să fac un fel de finalizare a tuturor dicţionarelor, inclusiv cele ce nu sunt urcate pe host.
      În principiu dicţionarele sunt gata, doar că sunt multe şi trebuie grupate înregistrările în dicţionarele existente. Se întâmplă ca unele înregistrăru să le fi pus în două dicţionare şi trebuie periate şi curăţate.
      Sper ca până mâine seară să pot pune la dispoziţie toate dicţionarele pentru varianta Contemporan. Pentru varianta Clasic va mai dura un pic... Nu toate înregistrările din Contemporan se pot aplica şi la Clasic.

      În seara asta stabilesc exact numărul şi numele dicţionarelor de secvenţe, astfel ca în momentul în care Cosmin face implementarea noilor nume să fie gata şi dicţionarele respective.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Îmi cer scuze dacă vă provoc oarece neplăceri.
      Am câteva propuneri pentru un fel de variantă finală a acestei etape de lucru.


            1. Implementare o nouă opţiune.
      Loc: pachetul 4. Corectare caractere reproduse eronat
      Nume: „Corectare cuvinte întregi şi expresii”
      Dicţionare de rulat = 5
      Nume dicţionare:
                 CO_CImf1, CO_CImf2, CO_CImf3 - pentru cuvinte întregi cu frecvenţă mare
                 CO_Expr1, CO_Expr2 - pentru expresii şi grup cuvinte
     
            2. Finalizare opţiune existentă: „4.6. Înlocuire secvenţe cuvinte”
      Dicţionare de rulat = 6
      Nume dicţionare: Dicţionare încep cu „CO_S” [Contemporan_Secvenţe], la care se adaugă „Inc” [început de cuvânt] sau „Med” [secvenţe mediane] ori „Ter” [terminare cuvânt, secvenţe de final]:
                 CO_SInc1.imd + CO_SInc2.imd – pentru secvenţe aflate la început de cuvânt
                 CO_SMed1.imd + CO_SMed2.imd – pentru secvenţe mediane, aflate în interiorul cuvintelor
                 CO_STer1.imd + CO_STer2.imd – pentru secvenţe finale [terminare cuvânt]
       Actualul dicţionar SM_celi va deveni CO_SMed1.imd

            3. Modificare opţiune existentă: „12.2. Dicţionare cu variante”
       Va fi suficient un singur dicţionar în loc de 4 câte rulează acum. Am redus la maxim numărul de înlocuiri care necesită confirmare

            4. Dacă nu este mult prea mult de lucru pentru Cosmin, aş propune şi o simplificare a numelor unor dicţionare care încep cu litera D [de la dicţionar] prin eliminarea acelui D, ca în exemplele:
          CO_DApco.imd  >>  CO_Apco.imd
          CO_DApct.imd  >>  CO_Apct.imd
          CO_DArtef.imd  >>  CO_Artef.imd  .......
       Dacă este posibil acest lucru, voi expune şi celelalte propuneru de midificare a numelor de dicţionare.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Eu sunt de acord.

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, se poate implementa.

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       Dacă se poate implementa, atunci încerc să propun un termen şi o metodă.
       Mă gândeam ca termenul să fie de o săptămână, deci pentru 3 aprilie sau undeva între 3 şi 5 aprilie.
       Lista cu toate modificările de nume de dicţionare a voi face în format doc şi o pun pe forum.
       Ca metodă, propun ca eu să dau adresa dicţionarelor lui Cosmin, iar atunci când este gata executabilul să fie puse atât adresa executabilului cât şi a dicţionarelor în aceeaşi postare, astfel ca userii să le găsească la pachet sau să nu le găsească de loc.


       Şi o ultimă propunere:
       Mă gândesc că cineva vrea să ruleze Meniul OCR_Plus fără a sta în faţa computerului în această perioadă... poate îşi face o cafea [cu lapte]... poate ia o pauză...
       Am reorganizat astfel dicţionarele ca toate confirmările să apară numai la ultima opţiune 12.2 Dicţionare cu confirmare. Deci programul se opreşte după ce a rulat toate opţiunile, cu excepţia ultimei.
       Apare totuşi o problemă: dacă userul activează opţiunile care ţin de dialogul francez, atunci computerul se opreşte la opţiunea "4.5 Conversie majusculă în minusculă la dialog francez" care se află undeva la mijlocul timpului de rulare.

       Întrebarea ar fi cam aşa: ar deranja dacă această opţiune ar fi adusă şi ea în pachetul 12, astfel ca primele 11 opţiuni să ruleze automat şi să nu necesite prezenţa userului în faţa computerului?
       Asta ar fi ultima problemă. personal nu mai am niciun fel de propunere de modificare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Pai de ce ar necesita aprobare?
Acele situatii ar trebui sa apara in lista de probleme indicata de Punctuatia OCR.
Adica ar trebui ignorate si prezentate doar ca sugestii.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     utilitasetveritas, ai dreptate.
     În mintea mea dicţionarul de la Dialog Francez era cu confirmare... m-am uitat şi e corect ceea ce spui: dicţionarul rulează automat, aşa că opţiunea nu deranjează cu nimic - aşa că e foarte bine să rămână acolo unde este.

     Cosmin, dacă implementarea se poate face, atunci termenul poate fi oricare, cu menţiunea că eu nu pot finaliza înainte de 3 aprilie... cel mai devreme 2...
     
      Despre modificarea dicţionarelor.
      Am urcat un tabel în format doc, ca să se poată lucra pe el, aici:
şi pentru vizualizare directă pentru cei interesaţi, Vizualizează aici
      M-am cam întins şi la alte modificări de nume... Nu ştiu câtă muncă implică aceste modificări, dar am vrut să fac astfel încât numele sp fie un pic mai sugestive.
      Astfel am avea 3 dicţionare la care nu se modifică nimic, unele [10 dicţionare] la care se elimină doar acel "D", altele [9 dicţionare] la care se modifică numele mai mult decât doar eliminarea acelui "D" şi un număr de 10 dicţionare complet noi.
     
       Am renunţat la eliminarea dicţionarelor cu variante, deoarece s-a discutat pe forum despre corectarea unor despărţiri de cuvinte la capăt de rând care apar în OCR cu cratimă la mijlocul rândului. M-am gândit că pot fi puse în dicţionarele cu variante.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cosmin, crezi ca ai putea aranja un pic Paste-ul din AC?
Sa fie asemanator celui din Word. Atunci cand faci Paste intr-un document sa poti:  - insera textul in Clear Format, adica text simplu.
- sa se transforme automat in fontul si marimea textului din locul in care e plasat cursorul.
- sa se pastreze formatarea sursei.

Cu memorarea ultimului font folosit cum a ramas?

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

utilitasetveritas a scris:

Cosmin, crezi ca ai putea aranja un pic Paste-ul din AC?
Sa fie asemanator celui din Word. Atunci cand faci Paste intr-un document sa poti:  - insera textul in Clear Format, adica text simplu.
- sa se transforme automat in fontul si marimea textului din locul in care e plasat cursorul.
- sa se pastreze formatarea sursei.


Stai ca ce ai spus se cam bat cap in cap unele cu altele. Text simplu sau cu formatare? "Sa pastreze formatarea sursei" >> formatarea include si fontul.
Drept sa spun n-am folosit niciodata aceasta functie din Word
Poti sa-mi arati te rog unde o gasesc...?

In ce priveste amintirea ultimului font folosit: am facut ceva teste cu Word si am constatat ca de fapt nu e memorat in document (cum ar fi fost normal) ci undeva prin Windows (setarile Word din registry ori din Application Data). Asta nu e prea bine, deoarece cand te duci cu documentul pe alt calculator nu mai tine minte.
Pe de alta parte AutoCorect e un program de corectat texte deja scrise, nu de scris texte de la 0. Asta inseamna ca utilizatorul va corecta texte ce au deja formatare definita si deci rar le va schimba fontul.
Dar daca vor fi mai multi care vor cere asta atunci ma voi gandi la o implementare.

Altceva: am corectat cateva probleme de la Monitorizare Clipboard (aparute in ultimul timp datorita schimbarilor din restul codului).
Exe:

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
E in regula atunci. Lasa-le asa pana cand va fi momentul.
Chestia cu Paste si memorare font folosit ultima oara e utila pentru momentele in care se face copy/paste dintr-o sursa externa. Dar de fapt duc la acelasi rezultat... in cazul meu adica.

Caz concret:
Sunt unele expresii in franceza ce apar fara ciudateniile alea de semne, intrucat nu stiu cum se scrie corect acea expresie o iau de pe Gugle si o bag in text.
Problema e ca e introdusa cu fontul/marimea/culoarea/underline-ul/hyperlink-ul etc sursei.

Daca marimea textului e accesibila usor, de regula e undeva intre 10-18, nu la fel sta cu fontul.
Palatyno de exemplu e pus tocmai pe la coada listei.

Vorbind de functia de Word 2010:
- cand intr-un document deja formatat, faci un paste dintr-un alt document formatat diferit.
Il faci cu Ctrl+V sau cu meniul contextual in care ai 3 optiuni:

When you do this you will then see 3 buttons offering the following options:
Keep Source Formatting – this option retains the formatting used on the source document you copied. This means that text will be displayed using the same fonts and other attributes like the line height of text will be retained too. Images are inserted with the same vertical and horizontal spacing.
Merge Formatting – the pasted elements will adopt the formatting currently in use in the destination Word 2010 document.
Keep Text Only – using this option will discard certain things that were present in the source, such as images and formatting. Only plain text will be pasted so headings, for example, will lose their size and bolding.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Când se copiază un text de pe net, copierea se face în doi pasi: textul se copiază în Notepad [unde îşi pierde formatarea] şi din NotePad în Word.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
NaeChioru
Membru Puf

Inregistrat: acum 13 ani
@Seven

@utilitasetveritas are dreptate, varianta propusa de tine nu este o varianta a unui program profesionist. Cel mai bine ar fi sa apara o fereastra plutitoare dupa apasarea combinatiei de Paste (CTRL+V) cu 2,3,4 butoane in care sa sugereze cum sa se faca lipirea, cu/fara formatare, cu/fara poze, etc...


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, se poate face si asa dar pe de alta parte asta va agasa pe cei care utilizeaza mult lipirea obisnuita - pentru ca ii va obliga de fiecare data sa aleaga.
Trebuie gasita o cale de "mijloc" - de aceea care impaca si capra si varza 


pus acum 12 ani
   
NaeChioru
Membru Puf

Inregistrat: acum 13 ani
Microsoft Office Word 2010 asa are, iar aceasta optiune vine din office 2007, cred ca daca erau multe plangeri o scoteau ei...,  se merita optiunea, mai ales ca este testata de useri si acceptata, iar lumea este deja obisnuita cu ea.

@ciuperca_cosmin felicitari pentru ce faci.

Modificat de NaeChioru (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
O sa ma gandesc la o solutie dar deocamdata sa vad cum fac cu modificarile mentionate de Seven...

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Chill.
Pe moment programul e bun si asa.
Cred ca pe partea de beletristica ar merge o "fortare" a fontului in functie de documentul tinta. Dar asta ar nemultumi pe altii si inca nu e cazul sa specializam programul doar pe baza ideilor/preferintelor catorva utilizatori.
Daca ideile enuntate pe aici sunt interesante, utile si posibile ca realizare sunt sigur ca vor fi puse in practica in masura posibilitatilor. Cand Cosmin o sa ramana fara ocupatie probabil ca o sa rasfoaisca topicul si o sa vada ce ar mai putea fi facut in baza sugestiilor mele sau a altora.

Pe moment, astept cu nerabdare o finalizare "sezoniera" a Ocr_Plus-ului.

Cosmin, bookmark-ul ala de document e inserat in documentul deschis sau in acel document personalizat din Roaming/aplicatio Data ce poarta numele fisierului?
Sa stii ca inca gasesc situatii de genul "punct spatiu litera mica" ce nu apar la Punctuatie si nu pricep de ce.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Bookmark-ul (semnul de carte) e inserat in documentul deschis.
In ce priveste situatiile "punct spatiu litera mica" probabil nu pot fi rezolvate eficient (situatii ambigue); "coleacteaza-le" totusi si cand ai mai multe trimite-mi-le ca sa verific...


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Deci daca formatez, schimb Windows-ul si pun un AC nou, acesta va gasi acel bookmark fara probleme?

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, cum am spus - acel semn de carte e inserat in document si deci nu tine de Windows sau de reinstalare AutoCorect...

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Din casuta cu Caractere Speciale lipseste una dintre diacritici scrisa cu litere mici.

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Corect, multumesc ca mi-ai aratat, am rezolvat.
Noul caracter va apare la cei care au caracterele romanesti implicite in fereastra de caractere speciale sau la cei care instaleaza prima data AutoCorect.
Exe nu pot sa pun deocamdata pe forum deoarece e modificat sa lucreze cu noile nume de dictionare (i l-am trimis deja lui Seven de cateva zile).


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mai am nevoie de maxim 48 de ore pentru definitivarea dicţionarelor.
     Am reactualizat denumirile, am făcut teste pe toate opţiunile şi nu am constatat probleme.
     Programul poate fi definitivat în forma actuală, incluzând problema cu diacriticele, cu două amendamente:

     Amendamentul 1. La pachetul de opţiuni nr.4, cred că ar fi bine ca opţiunea "Convertire majusculă în minusculă în dialog francez" să fie trecută ultima în cadrul pachetului. Ar fi mai uşor pentru utilizator la activarea opţiunilor ce trebuiesc rulate; Toate celelalte opţiuni trebuie activate obligatoriu, iar această opţiune depinde de setarea din punctuaţie.

     Amendamentul 2. La pachetul "12. Setări finale", opţiunea "12.2 Dicţionare cu variante" avem 4 dicţionare [CO_Var1.imd ÷ CO_Var4.imd].
     Am redus la maxim înlocuirile cu confirmare, astfel că în acest moment doar dicţionarul CO_Var1.imd mai conţine înlocuiri cu confirmare.
     M-am gândit să profit de faptul că există implementate încă 3 dicţionare şi în acestea am pus înregistrări care au rolul de a elimina cratima care apare la despărţirea cuvintelor la sfârşit de rând.

      Am înregistrat în "CO_Var2.imd" o serie de situaţii care apar la finalul gerunziului verbelor, cum ar fi: vorbin-du-i >> vorbindu-i; -du-l >> du-l; -du-le >> du-le; -du-mă >> du-mă; -du-mi >> du-mi; -du-ne >> du-ne; -du-se >> du-se; -du-şi >> du-şi; -du-te >> du-te; -du-ţi >> du-ţi; -du-vă >> du-vă... şi alte situaţii pentru verbele la gerunziu, cum ar fi despărţirea cu o silabă mai spre începutul cuvântului: vor-bindu-i >> vorbindu-i...
      Am înregistrat în "CO_Var3.imd" câteva cuvinte cu 2 şi 3 silabe de frecvenţă mare;
      Am înregistrat în "CO_Var4.imd" câteva cuvinte la care am luat în calcul o parte dintre sufixele folosite în limba română; practic despărţirea cuvintelor la capăt de rând se face mai des spre partea finală a cuvintelor decât la începutul lor şi am considerat că este bine de luat în calcul despărţirea în zona de compunere cu sufixe.
      Toate aceste trei dicţionare pot şi trebuie să fie îmbunătăţite pe parcurs.

      Problema ar fi că numele opţiunii nu mai este suficient de corect şi sugestiv.
      Eu consider că opţiunea trebuie să rămână implementată exact aşa cum este acum, dar mă gândeam dacă nu ar fi bine ca numele opţiunii să fie modificat, astfel încât să utilizatorul să înţeleagă mai bine ce anume face această opţiune.
      În acest moment nu am o propunere pentru schimbarea numelui.

      Şi ultimul aspect.
      Pentru mine personal este mult mai uşor să lucrez la acest moment doar pentru varianta Contemporan, iar după definitivarea dicţionarelor pentru Contemporan, să fac conversiile necesare pentru varianta Clasic.

      LE:
      Am urcat o arhivă care cuprinde dicţionarele aflate în lucru: CO_DVar2.imd ÷ CO_DVar4.imd.
      Dicţionarele pot fi vizualizate direct din meniul Editare --> Înlocuiri multiple, dar pot rula şi automat deoarece au numele nemodificat, astfel încât să poată rula cu executabilul urcat pe forum.
     Adresa arhivei:

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Amendamentul 1 - nu vad nicio problema in mutare.
Amendamentul 2 - da, trebuie o denumire mai buna. Dar pe moment nu gasesc nici eu una mai buna

Uite un exe nou (doar pentru tine, Seven - ceilalti nu-l luati ca n-o sa mearga cu dictionarele actuale):
Am o surpriza: uita-te pe bara de unelte, primul rand, ultimul buton din dreapta...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mulţumesc frumos pentru icon!
     E foarte comod de accesat fereastra de înlocuiri multiple folosind un icon, mai ales pentru cineva ca mine, care închide şi deschide fereastra de foarte multe ori într-o sesiune de lucru.
     Bun. Terminat cu distracţia.

     Să trecem la lucruri serioase.
     Până dimineaţă am să urc pe mediafire pe un folder separat de cel vechi, o formă finală a tuturor dicţionarelor care rulează automat în meniul OCR Plus. Dicţionarele vor avea noile denumiri şi pot rula cu executabilul de mai sus.

     Am adăugat la dicţionarele CO_Var.imd, dicţionare care fac "lipirea" cuvintelor rupte la capăt de rând încă o serie de înregistrări.
     Este vorba de cuvinte care se termină la Genitiv-Dativ în "lor" şi "lui".
     Numărul de cuvinte este imens... de multe zeci de mii de cuvinte, astfel că am blocat computerul... rezultatul căutării a apărut după multe minute... la copiere s-a blocat word şi excel... ăsta din urmă zicea că are doar 65536 rânduri şi că sunt mai multe cuvinte...
      M-am gândit că dacă există atâtea cuvinte care por avea finalul "lui" atunci merită câteva înregistrări pentru corectarea cuvintelor rupte [despărţite la capăt de rând]. Am luat în calcul repararea ruperii de la ultimei silabă şi a ruperii ultimelor două silabe. Am încercat să prind şi înregistrări cu ultimele 3 silabe, dar rezulta un număr foarte mare de situaţii.
 
     Ca orice elefant ce se plimbă printre bibelouri, am mai stricat ordinea de până acum şi am făcut o schimbare: pentru ca dicţionarul cu confirmări să ruleze la sfârşitul programului, am dus înregistrările cu confirmare exact în ultimul dicţionar pe care-l rulează programul, şi anume în CO_Var4.imd.

     Prractic, la acest moment mai am de verificat dicţionarele pentru eliminarea "semnelor de carte"; este vorba de rânduri de asterixuri pe care le folosesc pentru a marca zona de lucru în dicţionare.

     Referitor la denumirea ultimei opţiuni: cea în care corectăm cuvintele despărţite la capăt de rând...
     Mă gândeam la termenul de "cuvânt rupt"; dacă avem rânduri rupte şi opţiune de reparare a rândurilor rupte... oare, n-am putea folosi şi termenul de "cuvinte rupte" şi "corectare a cuvintelor rupte"?
     Ar fi sugestivă o opţiune care s-ar numi "Corectare cuvinte rupte şi înlocuiri cu confirmare"?

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ma gandeam si la "Unire bucati cuvinte rupte" dar e cam lung. "Corectare cuvinte rupte" e mai bun (oricum altceva decat unire nu se poate face si deci se va subintelege asta).
Dar in privinta "si inlocuiri cu confirmare" nu sunt 100% sigur.
O alternativa: la dictionarele care au inregistrari cu confirmare s-ar putea adauga (conf) sau (confirmare) in numele optiunii; eventual chiar explicat in Help...
Ce parere aveti...?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Dicţionare cu confirmare
      Au fost 4 înregistrări în dicţionarul CO_L3.imd şi le-am mutat în ultimul dicţionar [CO_Var4.imd] pe care-l rulează meniul OCR Plus.
      Mai erau 6 înregistrări de înlocuiri cu confirmare la dicţionarul CO_DFr.imd [dialog francez]. M-am gândit că pot fi şi ele mutate în ultimul dicţionar [CO_Var4.imd] şi în acest fel, toate confirmările apar doar la acest ultimul dicţionar.
      Dicţionarele care elimină răgălii [CO_Apco.imd şi CO_Apct.imd] rulează automat, deci nici ele nu au confirmări.
      Practic singurul dicţionar la care este nevoie de confirmare, rulează în parte finală a meniului.

      Dacă zici că numele opţiunii "12.2 Corectare cuvinte rupte şi înlocuiri cu confirmare" este cam lung... atunci putem pune şi o formulare mai scurtă... cu prescurtări.
      Eu m-am uitat la lungimea opţiunii "12.1 Înlocuire spaţiu după linia de dialog cu spaţiu neseparator " şi m-am gândit că fiind în acelaşi pachet ar merge şi ceva cu nume mai lung, deoarece ferestra este deja realizată pentru o opţiune cu nume lung...
      ... sau e vorba de numele opţiunii şi nu de lungimea numelui?  numele sub care am propus-o nu sună prea bine?...
      Adevărul este că sunt două opţiuni într-una singură, dar nu ar fi meritat efortul implementării separate... zic şi eu...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
E si numele ca-i lung un pic, e si ca suna un pic ciudat.

Se poate si cu numele mai lung, nu-i problema mare.
Ideea este ca in programe de calculator (si nu numai) totdeauna trebuie sa te straduiesti sa pui nume cat mai scurte dar care "spun"cat mai multe.
Asta evident - unde este posibilitate...
Daca se ajunge la concluzia ca numele lung ajuta mai mult, atunci lasam numele lung...

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Poate apare mâine sau zilele astea o soluţie mai bună pentru numele opţiunii.
      Deocamdată nu găsesc ceva mai bun.

      Gata dicţionarele varianta Contemporan pentru meniul OCR Plus.
      Am urcat dicţionarele pe un folder nou, care cuprinde doar dicţionarele care sunt uploadate astăzi.
      Nume folder:   Dictionare noi - 5 aprilie 2012
      Adresa folder:
      Cuprinde două arhive:
             OCR_DIC [Contemporan] 5 aprilie 2012.rar - acestea sunt cele 32 de dicţionare ce rulează automat în meniul OCR Plus.
             Dictionare UZUALE 5 aprilie 2012.rar - cuprinde dicţionarele suplimentare ce pot fi rulate cu ajutorul opţiunii "11. Rulare grup de dicţionare înlocuire multiplă"


       LE: Aceste dicţionare rulează cu executabilul postat de Cosmin mai sus, care se află a adresa:
     
       ... sau cu următoarele versiuni de executabil.

      Săptămâna viitoare mă ocup de actualizarea dicţionarelor pentru varianta Clasic.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Optiunea "Conversie majuscula in minuscula la dialog francez" e acum pe ultima pozitie in pachetul 4.
Am redenumit 12.2 in "Corectare cuvinte rupte si inlocuiri cu confirmare".
Exe:

Acum cam ar fi fost timpul sa implementez ultimele modificari din Contemporan si in Clasic, pentru ca Seven sa poata actualiza dictionarele pentru clasic.
Se pare ca va mai intarzia putin, deoarece am gasit o mica problema la ortografie.
Precum va amintiti, acum cateva luni am optimizat ortografia sa fie si mai rapida pe texte mari (cum sunt cartile).
Daniel a descoperit recent ca sunt unele texte aparte la care nu afiseaza corect cuvantul subliniat.
Vestea buna e ca se intampla rar si nu face pe rtf-uri de carti, vestea proasta e ca daca nu gasesc o solutie buna va trebui sa revin la metoda veche (inceata).
E un fel de "buturuga mica rastoarna carul mare".
Deocamdata lucrez sa gasesc o solutie care sa mearga in toate situatiile si sa fie totusi rapida.
Dar nu pot estima cand o voi gasi. Poate fi cateva ore sau cateva saptamani...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am început pregătirea dicţionarelor pentru varianta Clasic.

     Rog utilizatorii care au descoperit eventuale greşeli, neconcordanţe... sau care au orice constatări în legătură cu dicţionarele pentru Contemporan, să posteze comentariile pentru a putea să fac cuvenitele corecturi înainte de definitivarea variantelor Clasic.
     Mulţumiri anticipate!
     Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am terminat verificarea şi prelucrarea celor 32 de dicţionare pentru varianta Clasic.
     Aştept în continuare sfaturi, comentarii şi constatări pentru dicţionare.

     În continuare am să mă ocup de revizuirea şi completarea tutorialelor de pe topic şi apoi de trecerea lor în document doc.
     După realizarea tutorialelor în variantă doc, am nevoie de una-două persoane care să facă o verificare-corectare a tutorialelor.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Te ajut eu.
Pana acum tutorialele postate au fost ok.

Hai ca poate avem noroc si cu alt utilizator AC.


pus acum 12 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 17 ani
Semnalez ca AUTOCORECT expandeaza dimensiunea fisierului in megabytes,
in cazul fisierelor ce contin ilustratii jpg in doc.


Astfel, prelucrarea cu Autocorect a unui fisier de 10,5 MB, docx, cu zeci de ilustratii, determina ca RTF-ul sa ajunga la 685 MB, fisierul devenind INOPERABIL
(nici wordul si nici AUTOCORECTUL  nu il mai pot deschide).

Se poate implementa o functie care SA NU EXPANDEZE dimensiunea in mega a pozelor/fisierelor?

Nota
Pentru fisierele mai mici, de 100-200 mega rtf, ce contin poze, fisiere PE CARE LE POATE DESCHIDE wordul,
pacaleala aplicata de mine consta in
re-conversia rtf (corectat cu Autocorect)
in pdf, si apoi
RECUNOASTEREA OCR a pdf-ului astfel obtinut
cu PDF TRANSFORMER,
operatie care reduce dimensiunea fisierului - in urma re-compresarii de catre ABBYY PDF TRANSFORMER a pozelor.

Modificat de jullien_alphonse (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Avem o problemă ce trebuie văzută după Sărbători.
      Este vorba despre marcare fundal.

      Marcare fundal:
      Dacă activez condiţia de marcare fundal a modificărilor făcute la un singur dicţionar, această condiţie se transmite la toate dicţionarele, astfel că toate activează condiţia.
      Bineînţeles că dacă la un dicţionar am activat condiţia şi am pus fundal de culoare galbenă, iar apoi la alt dicţionar am pus culoare verde, toate dicţionarele activează condiţia cu fundal verde.

      Demarcare:
      Funcţionează perfect pentru toate variantele de demarcare fundal şi font.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Scuze ca n-am mai intrat pe aici de o vreme dar am avut, pe langa problema mentionata ultima oara la AutoCorect, si cateva probleme personale.
Forumul de obicei nu ma mai anunta ca am mesaje noi in aceste topicuri...
In plus Mozilla Firefox imi interzice acu sa intru pe acest forum zicand ca "ataca". Am fost fortat sa utilizez Google Chrome.
Chiar acu am vazut ca si Google Chrome ma ia cu acelasi mesaj cand am dat click pe "Postati raspuns".
Nu cred sa fie malware pe forum dar acu il accesez din VirtualBox...

@jullien_alphonse
Da, deocamdata AutoCorect are setata salvarea imaginilor ca bmp-uri deoarece am constatat ca unele editoare de text nu vad imaginile jpg/png/gif.
Dar pe de alta parte inteleg de ce e problema cu cartile. Ca o paranteza, Word nu poate deschide documente asa mari pentru ca e limitat la asa ceva, nu pentru ca AutoCorect i-ar da un format incorect de text.
Cu AutoCorect n-am avut probleme in a redeschide texte de aceasta marime. Dar, evident, depinde si de Ram-ul calculatorului...
O sa ma gandesc la o solutie.

@Seven
De la bun inceput marcarea a fost facuta nu pe dictionar ci pe intreaga "Inlocuire multipla". Cata vreme e bifat va marca modificarile la culoarea selectata curent.
Cand am implementat-o (la vremea respectiva) am mentionat acest lucru.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am adaugat o noua optiune la configurarea AutoCorect.
Acum imaginile care erau jpg sunt salvate tot ca jpg iar restul ca png.

autocorect versiune pentru adaugat noua optiune imaginile care erau jpg sunt salvate tot jpg iar

27.1KB

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Cum se descurca AC-ul cu punctele de suspensie?

Situatii intalnite:
- doua puncte in loc de 3, lipite sau nu de cuvant.
- 3 puncte normale, dar uneori cu spatiu la inceput si la sfarsit, alteori cu una din parti lipite de cuvant.

Niciuna din situatii nu e semnalata la Punctuatie sau corectata de Ocr.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nimic? Nimeni?
Sunt ambele corecte sau ce?

Atâtea specimene nealterate și, ca un făcut, niciunul care să poată sluji cercetărilor sale persecutate! … Eram teribil de surmenați, iar uriașul efort psihic și nervos îi producea prietenului meu o stare de visare morbidă.

Atâtea specimene nealterate și, ca un făcut, niciunul care să poată sluji cercetărilor sale persecutate!… Eram teribil de surmenați, iar uriașul efort psihic și nervos îi producea prietenului meu o stare de visare morbidă.

Cosmin, crezi ca e posibil sa se faca un dictionar particularizat care sa contina diverse forme gresite ale cuvintelor care sa fie adaugate acolo de utilizator?

Si inca ceva... este posibil ca AC-ul sa arate page break-urile atunci cand vizualizam formatarea textului?


Totodata am rulat OCR-ul pe mai multe texte (1.0, 2.0) nu strica prea multe cata vreme se face o corectare prin citire dupa.
Un lucru foarte bun e faptul ca pastreaza notele de subsol. Singurul efect asupra lor e faptul ca isi pierd proprietatea de suprascript, dar in rest sunt neatinse.

Deci daca aveti texte ce contin macro-uri sau diverse stiluri ciudate, e suficient sa mutati textul in AC si sa salvati si o sa scapati de chestiile nedorite.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
@utilitasetveritas,
     1. Elipsis... Ceva îmi aparţine..
     În dicţionarul CO_Elips.imd care face conversie suplimentară Elipsis am adăugat două înregistrări şi anume:
     punct_spaţiu_punct_punct       trece în Elipsis
     punct_punct_spaţiu_punct       trece în Elipsis
     
     Înregistrările sunt valabile, indiferent dacă primul punct este lipit sau nu de ultima literă a cuvântului din faţa sa.

     2. Corect este ca situaţia < ! ... > să treacă în < !... >, adică fără spaţiu între Semnul exclamării şi Elipsis;
     Acelaşi lucru se întâmplă şi cu ? ...
     Aceste situaţii le rezolvă Punctuaţia generală, în urma setării din Configurare Punctuaţie OCR Plus, ultima de la tabul doi, care se numeşte "Elimină spaţiu dintre grupul de caractere !?  ?!  !...   ?...  ...!   ...?"
     Astfel de situaţii ar trebui să fie corectate. Nu înţeleg de ce nu a corectat.

@ciuperca_cosmin,
     Ultima setare pusă la Configurare Punctuaţie referitoare la compresia imaginilor... apare afişată peste celelalte taburi... Cred că e o eroare pe undeva...
      Am senzaţia că se doreşte a fi un tab separat... Oare nu ar merge să fie doar o opţiune la tab 4. Diverse? Nu cred că ar fi o problemă.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Ai dreptate. Este activata optiunea cu pricina, dar nu le-a corectat pe toate. La unele a eliminat spatiul, la altele nu.

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
@utilitasetveritas
O sa ma gandesc la o solutie pentru cazurile cand sunt doar 2 puncte de suspensie.

"dictionar particularizat care sa contina diverse forme gresite ale cuvintelor care sa fie adaugate acolo de utilizator" = teoretic s-ar putea implementa dar la ce ar folosi efectiv...?
Sa se vada page break-urile - o sa vad daca e posibil.

Da-mi te rog cateva exemple in care optiunea nu a corectat cazurile cu ! ? ...

@Seven
Multumesc ca mi-ai spus, o sa corectez.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am corectat problema la configurare si am modificat punctuatia sa arate sugestie de adaugare al treilea punct atunci cand intalneste doar doua.

PS: utilitaetveritas, dar butonul de pe bara de unelte sus mijloc nu e bun pentru ce vrei tu..? Adica acesta:



Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Dictionarul ala de cuvinte sau forme naspa ale unor cuvinte, imi foloseste la adaugarea manuala a lor.
Inca gasesc in texte forme complet gresite ale unor cuvinte pe care AC-ul nu le baga in seama. Cele care o liniuta pusa prin ele sunt cele mai multe. Totusi adaugarea lor nu cred ca e indicata, sunt prea multe posibilitati si cred ca ar ingreuna programul.
Dar raman altele mai unice oarecum.

Si chestia asta nu o poti rezolva din fereastra de ortografie, pentru a ajunge cuvantul acolo, mai intai trebuie sa fie recunoscut ca fiind gresit.

Ar fi foarte usor pentru utilizator daca ar selecta cuvantul gresit nedetectat si apoi sa il "declare" gresit (implicit inscris in acel dictionar) cu ajutorul meniului contextual. Ar fi un fel de anti-DEX
Dar daca e munca multa, un simplu fisier text al carui continut, daca se regaseste in text, sa apara in fereastra de Ortografie, chiar daca nu are variante.
Evident ca asta ti-ar prinde bine si tie. Eu o sa incep sa pastrez dictionarele de la cuvintele adaugate in dictionar manual si cel de mai sus.
Acestea vor ajunge la tine, iar tu vei putea integra continutul lor direct in program apoi.
Tot asa cum faceai cu listele alea de cuvinte  pe care ti le dadeam inainte.

P.S.
De butonul ala e vorba )
Chestia e ca atunci cand il folosesc pentru vizualizarea formatarii, Page Break-urile nu apar de nicio culoare, e doar un simbol de paragraf si atat.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Intai trebuie sa fii foarte sigur ca acele cuvinte sunt 100% gresite in orice context. Sunt unele cuvinte care si mie imi par gresite la prima vedere dar cand le pun in contextul adecvat merg.
Apoi, vezi tu, as putea pune o comanda in meniul contextual pentru asta. Dar sunt 2 lucruri de avut in vedere:
- nu multi o vor utiliza, deoarece de regula ii intereseaza sa corecteze textul nu sa "colecteze" asemenea cuvinte pentru a mi le trimite;
- in meniul contextual, barele de unelte, meniul principal etc. de regula trebuie puse comenzile mai des utilizate, altfel vor deveni "stufoase" si nu vor fi utilizate cu placere de cei mai multi utilizatori...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Cosmin,
     
      N-aş vrea să te supăr, dar aş avea două comentarii:
           - prima: la ultimul executabil, cel postat astăzi, eu nu mai văd în Configurare Punctuaţie OCR Plus opţiunea aia cu compresia imaginilor... neam, deloc, de nicio culoare. Mă refer la cea pe care a reclamat-o Jullien şi care apărea afişată peste fereastra de setare. N-am fost atent... ai scos-o ca să o implementezi mai târziu? ori ar trebui să fie aici şi nu se vede?...

          - a doua... scuze, da' asta e mai aiurea şi trebuie să mă explic.
      Mulţi useri au început să-i atribuie lui AutoCorect însuşiri pe care nu le are. Unii dintre aceştia, au descoperit relativ recent programul şi-l foloses pentru "finisări" texte corectate, ceea ce ştim foarte bine că este o mare eroare.

      Deşi am postat multe avertismente în care arătam că după rularea AutoCorect este musai corectura manuală, foarte mulţi useri au senzaţia că-mi dau şi eu cu părerea aşa de dragul conversaţiei şi au început să ruleze dicţionarele AutoCorect peste versiuni corectate... am văzut chiar cărţi V3.0 rulate în AutoCorect şi postate ca versiune superioară...
      M-am gândit că ar fi mai credibilă avertizarea dacă ar veni direct de la programul AutoCorect şi nu de la un user...

      Eu am o idee, dar nu ştiu dacă se poate implementa şi câtă muncă ar implica implementarea ei.
     Mă gândeam la introducerea unei ferestre de avertizare la începutul rulării.

     La acest moment rularea automată se realizează astfel:
     1. Userul accesează din meniul principal opţiunea "OCR Plus >> Rulează toate funcţiile"
     2. În acest moment se deschide fereastra numită "Rulare automată OCR Plus" în care se face activarea şi setare opţiunilor de rulare automată.

     Propun modificarea astfel:
     1. Userul accesează din meniul principal opţiunea "OCR Plus >> Rulează toate funcţiile"
     2.În acest moment se va deschide o Fereastră de Avertizare care va informa  utilizatorul că AutoCorect face o precorectură a OCR care trebuie urmată în mod obligatoriu de corectură manuală princi citire şi că folosirea lui în cazul versiunilor corectate [poate] produce erori. Textul de avertizare îl vom stabili ulterior dacă propunerea se poate implementa.
     În partea de jos a ferestrei propun să existe două butoane: "Continuă" şi "Renunţă"
     Doar dacă acţionăm butonul "Continuă", atunci va apărea fereastra "Rulare automată OCR Plus" şi cele cunoscute.
     Dacă se acţionează butonul "Renunţă", atunci programul revine la fereastra principală.

     Cred că este mult de muncă, mai ales că apar elemente grafice. E chiar aşa cumplit ceea ce am propus?

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
O sa-ti raspund deocamdata doar la prima ca-s cam obosit acu. La cealalta ma mai gandesc nitel pina maine...
Optiunea nou implementata am intentionat de prima data s-o bag la Configurare >> General >> Documente, asa cum apare si in acea imagine acu cateva postari...
Acolo o gasesti...

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Doamne!... bineînţeles că ai dreptate.
      Se pare că am "citit" cam mult de sărbători... sau ramoleala?... altfel nu se explică de ce mi-am imaginat că probleme de Compresie Imagini ar putea fi încadrate la setări Punctuaţie PCR Plus.
      Scuze! Toate cele bune!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Poate se adauga si cele 2 optiuni cu convertirea de diacrtitice prin lista aia de optiuni OCR

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
@Seven

Referitor la a doua parte a mesajului tau.
Cred ca se pate implementa, da, cu o mica modificare: ferestra respectiva sa aiba si un loc de pus bifa ca sa nu mai apara data viitoare. Nu e necesar sa plictisim utilizatorul cu acest mesaj de fiecare data, e suficient cred sa-l facem sa-l citeasca cel putin o data.
Adica in stilul mesajului cand se incearca adaugarea de diacritice pe automat. I se aduce la cunostinta ca mai e ceva de facut dupa, stie acum si poate sa dezactiveze mesajul.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
@Cosmin,
      E foarte bine în varianta de fereastră cu bifă ca să nu mai apară mesajul.
      Important este să apară de la început un astfel de "avertisment oficial", să zic aşa.
      Ştiu că este mult de muncă pentru implementarea unei astfel de ferestre, dar cred că este foarte necesară.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 17 ani
Sugestie pt gasirea unei solutii de implementare in AC
a CORECTURII AUTOMATE,
(fara aprobare de catre user,  si fara sugerare de catre  AC)
a punctelor de suspensie.


Am testat azi pe text, si am vazut
ca AUTOCORECT sugereaza CORECT adaugarea unui pct langa cele 2 puncte ratacite.

SUGESTIA AC
se poate transforma direct in
OPERATIE AUTOMATA.

Recapitulez ideile...
o parte din ''metodologia'' de mai jos CRED CA este deja rezolvata)

1. in Tabla de Materii, Cuprins (CONTENTS) documente, intalnim multe puncte (sa le spunem ''de suspensie''), ca in exemplul de mai jos:

Introducere .............................. pag. 8
Cuprins.................................... pag 13
Incheiere................................. pag. 217

- propunere:

Reducerea numarului punctelor de suspensie la STRICT trei puncte, adica:

. . .

Nu ne intereseaza pastrarea numarului paginii, intrucat NOI vom determina acest numar, functie de formatul A4, A5, in care FORMATAM documentul final.

Plus ca formatarea CUPRINSULUI se poate face ulterior manual /automat din word.

2. Transformarea TUTUROR secventelor
.,.
,.,
(SI desigur, si a combinatiilor de 4, sau 5 sau ''en-şpe'' puncte si/sau virgule )
in STRICT TREI PUNCTE DE SUSPENSIE.

Atentionare.
La convertirea in Elipsis
ni se transforma gruparea de
trei puncte separate
in ELIPSIS.

DAR nu NI se vor transforma in ELIPSIS
4 sau mai multe puncte.

Personal, consider CA elipsis ne incurca un pic.

Pentru simplificare,
propun eliminarea notiunii si operatiilor de
convert IN elipsis

din ''portbagajul'' AUTOCORECT, intrucat
complica SI corectura automata ulterioara in word.

3. Dupa terminarea (corectura automata)
primelor 2 etape,
si deci, DUPA reducerea nr. punctelor la STRICT 3,
trebuie rezolvate situatiile = oricare din combinatiile
. si ,

- de ex., combinatia Anyletter.,Spatiu
poate ramane ASA, intrucat este foarte des intalnita.
etc.,
obs.,
op. cit.,
O.K.,

-  combinatia INVERSA
AnyLetter,.SPATIU
se poate transforma automat (cu bune rezultate)
in simpla VIRGULA-spatiu,
AC eliminand automat punctul,
iar litera urmatoare (minuscula / majuscula)
ramanand NESCHIMBATA,
si in plus, AUTOCORECT semnaland automat o eventuala combinatie
, ENTER   
care e corectabila la
ELIMINARE RANDURI RUPTE.


Daca hotarati ca secventa
AnyLetter,.SPATIU
sa o transformati in SIMPLU PUNCT,
e foarte posibil ca litera urmatoare SECVENTEI
sa se transforme in majuscula (datorita setarilor userilor),
iar  un eventual ENTER/Paragraph
sa consfinteasca TERMINAREA paragrafului
(uneori in mod eronat).

NOTA
ulterior
userul va adauge SIMBOLUL POTRIVIT/CORECT,
manual, la corectura FINALA dupa original.


4. Dupa rezolvarea acestor probleme
la final, acolo UNDE MAI RAMAN doua puncte (''ratacite'')
. . SPATIU
AUTOCORECT POATE INTRODUCE AUTOMAT
TREI puncte de suspensie in loc de doua.
Si sunt convins ca nu va gresi prea mult.

Modificat de jullien_alphonse (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Jullien, trebuie să mai "rumeg" un pic fiecare din situaţiile prezentate. În principiu, sunt de acord cu o parte dintre propuneri, dar mă cam încurcă o altă parte dintre propuneri.
     Cred că va trebui să găsim o formulă de compromis.
     Deocamdată, doar două probleme.

     Prima problemă: Renunţarea definitiv la opţiunea cu convertirea în Elipsis ar atrage după ea nefuncţionarea în parametrii corecţi a altor opţiuni.

     Dacă această convertire încurcă la corectarea în Word [în acest moment nu-mi dau seama în ce situaţii ar încurca, dar nu neg acest lucru] putem face la sfârşitul programului o reconvertire din Elipsis în trei puncte.

     Să mă explic: Dacă nu s-ar face mai întâi conversia punctelor de suspensie în Elipsis, atunci la opţiunea de majusculare la început de frază care urmează după punct urmat de spaţiu, s-ar majuscula şi frazele [propoziţiile] care încep după punctele de suspensie. După câte ştim, în beletristică, în cele mai multe cazuri, majuscularea după punctele de suspensie nu trebuie făcută.
     Am făcut mai întâi conversia punctelor de suspensie în Elipsis exact din acest motiv, pentru ca ultimul punct de la punctele de suspensie să nu fie confundat cu un simplu caracter "punct". Acum, când activăm opţiunea Majusculă la început de frază care urmează după punct, nu se va face majuscularea frazelor care urmează după Elipsis, ci doar a acelora care urmează după un simplu punct.
     Bineînţeles că mai sunt erori, deoarece alte câteva forme de aranjamente de puncte şi virgule se corectează în Elipsis, doar la următoarea opţiune, numită "2.4 Corectare suplimentară Elipsis".
      Opţiunea asta rulează pe baza dicţionarului CO_Elips.imd. şi în acest dicţionar putem adăuga orice altă grupare care nu este înregistrată încă. Eu deocamdată am prins în dicţionar aranjamente de 3 şi 4 caractere formate din puncte şi sau puncte şi una sau maxim două virgule. În dicţionar se poate adăuga orice grupare care ne este de folos.

      În principiu nu am fost de acord ca doar două caractere fie punct+punct sau punct+virgulă să fie convertite în Elipsis; astfel de situaţii sunt doar semnalate dar nu am propus înlocuire nici automată, nici cu confirmare, pentru că mi s-a părut corect ca le să fie corectate atunci când se face compararea cu originalul.


     A doua problemă: Multe puncte de suspensie [precum cele de la cuprins] să se transforme în doar 3 puncte.
     E corect ceea ce spui. La cuprins fac şi eu exact acest lucru.
     Mai există însă o situaţie în care avem multe puncte de suspensie care trebuie să rămână în aceeaşi formă; este vorba de puncte de suspensie dintre diferite frahmente al cărţii, care marchează lipsă de text faţă de original sau transferarea subiectului în timp sau/şi spaţiu.
     Din acest motiv, mă gândesc că transformarea unui număr mare de puncte în doar 3 puncte trebuie să se facă cu confirmarea utilizatorului şi nu în mod automat.
     Modificarea asta s-ar putea face în ultimul dicţionar al programului, numit CO_Var4.imd... doar că există o problemă.... trebuie să găsim soluţia ca toate aceste situaţii să fie convertite, ori numărul de puncte poate fi diferit, astfel că ar fi nevoie de multe înregistrări... dar ne vom mai gândi la soluţie...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutare, Cosmin!

     Am primit mesajul tău.
     Încerc să găsesc o formulare scurtă, dar suficient de clară.
     Imediat cum rezolv am să-ţi trimit un mail cu soluția propusă.
     De altfel am probleme de vizualizare a MP, aşa că mailul va rămâne singurul canal de comunicare cu tine.

     Stimă şi deosebit respect!

     Seven         


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Marc > Mare

Inlocuirea asta ar trebui sa fie cu confirmare. Atunci cand e cu litera mare cel putin.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Salutare, Cosmin!

     Nu reuşesc să găsesc o formulare mai bună.
     Propun următoarea avertizare:

     Atenţie!
     Cu meniul OCR Plus se pot prelucra automat numai texte de tip OCR brut.
     După prelucrarea textului cu AutoCorect OCR Plus este OBLIGATORIE corectura
manuală prin citire cap-coadă a textului.

     Precesarea automată [cu AutoCorect OCR Plus] a unui text deja corectat este o EROARE,
deoarece dicţionarele OCR plus vor face modificări corecte ale cuvintelor cu frecvenţă mare
în limba română, dar pot realiza modificări nedorite asupra cuvintelor care au frecvenţă mică
în limbajul obişnuit, ori asupra cuvintelor din limbaj popular, argou, jargon etc.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Multumesc Seven.

Am implementat afisarea mesajului:

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Mulţumesc şi eu.
      Am făcut download şi cred că atenţionarea este folositoare.
      Sper că nu sună prea dur, astfel încât userii să se sperie şi să renunţe la prelucrarea textelor OCR cu AutoCorect, ci doar să-i avertizeze că nu e bine să ruleze prin AC versiuni corectate de text asupra cărora nu vor mai reveni cu o verificare nouă.

      Aş avea, totuşi, o constatare în legătură cu fereastra.
      Cred că ar fi şi mai bine dacă ar exista un rând gol între cele două părţi ale atenţionării. Le-ar face mai uşor de citit.
      Pare mai uşor de citit două fragmente mici de text decât unul singur dar mai mare.

      Ca să nu te mai complici cu modificarea codului pentru redimensionarea ferestrei, poate că ar merge ca prima parte a atenţionării să fie scrisă pe acelaşi rând cu "Atenţie!" şi în felul ăsta se câştigă un rând care se poate insera între cele două părţi.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ai dreptate, ar arata mai bine cu un rand gol intre cele 2 parti.

Altceva: stiu ca pentru profesionisti "OCR brut" are sens dar pentru un novice s-ar putea sa fie mai greu sa inteleaga ca e vorba de un text obtinut dupa scanarea unei carti. Nu e rau nici scris asa dar poate gasim o exprimare mai "generala" care sa fie un pic mai pe intelesul tuturor...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Poate că în loc de "OCR brut" să spunem "OCR necorectat"?
      Şi atunci,
în loc de
           "... se pot prelucra automat numai texte de tip OCR brut"
să scriem
           "... se pot prelucra automat numai texte de tip OCR necorectate"?

       Cred că "necorectate" ar trebui să fie la forma de plural, pentru că se referă la "texte"... parcă aş am eu sentimentul că trebuie.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Eu ma gandeam la un termen si mai general precum "texte obtinute prin scanare cu programe OCR" (e doar un exemplu, nu zic sa-l utilizam in aceasta forma).
Dar merge si asa, e ceva mai bine.

PS: si cred ca acordul ar trebui facut cu "tip" nu cu "texte"... E ca si cum spui "texte de tip OCR brute"...
Sau ar merge "texte necorectate de tip OCR".

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ce zici de asta:

autocorect versiune pentru zici asta:

30.8KB


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cred că ai dreptate... Trebuie o formulare mai clară, dar şi mai detaliată.

      Eu m-am gândit că atenţionarea trebuie să se adreseze celor ce digitalizează cărţi dar care e posibil să nu cunoască foarte bine funcţiile şi opţiunile programului. Pentru aceştia atenţionarea propusă ar fi putut fi suficientă.

      Am uitat însă că implementarea meniului în programul standard va face ca toţi utilizatorii "clasici" ai AutoCorect să poată accesa meniul OCR Plus, fără ca aceştia să ştie ce înseamnă OCR, fie el brut sau necorectat.

       În cazul ăsta, cred că atenţionarea ar trebui să înceapă cu o frază suplimentară, suficient de clară, din care să rezulte că meniul OCR Plus este destinat/creat special pentru utilizatorii care digitalizează cărţi.
       Privind situaţia din acest punct de vedere, cred că expresia "texte obtinute prin scanare cu programe OCR" este mult mai clară decât "OCR necorectat".

       Cred că trebuie să găsim o nouă formulare pentru atenţionare, astfel încât să fie suficient de clară şi pentru cei ce nu ştiu ce este acela un OCR şi care nu cunosc nimic despre digitalizare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am reformulat avertismentul. Introducând o nouă frază am încercat să le mai scurtez pe cele deja existe ca textul să aibă loc în fereastră. ...şi am scăpat şi de acorduri.

      Oare varianta asta sună suficient de clar?

     Atenţie! Acesta este un meniu special destinat activităţii de digitalizare a cărţilor şi prelucrează texte obtinute prin scanare cu programe OCR.

     Se pot prelucra automat numai texte de tip OCR. După prelucrarea textului cu AutoCorect OCR Plus este OBLIGATORIE corectura manuală prin citire cap-coadă a textului.

     Procesarea automată a unui text deja corectat este o EROARE, deoarece dicţionarele OCR plus vor face modificări corecte ale cuvintelor cu frecvenţă mare în lb. română, dar pot realiza modificări nedorite asupra cuvintelor care au frecvenţă mică în limbajul obişnuit.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cred ca e suficient de clar, da...

O mica sugestie de modificare: "lb. română, dar pot realiza şi modificări nedorite asupra cuvintelor".


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Da, e bine. E foarte bună şi sugestia, deşi am şi eu o sugestie la sugestie.
      În loc de forma "asupra cuvintelor" aş propune să punem "asupra unor cuvinte", ca să rezulte că doar unele pot fi afectate.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am modificat:

autocorect versiune pentru modificat:

30.1KB


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu e suficient:
Nu rulati aceasta optiune pe un text deja formatat si corectat! Rezultatele variaza!

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Este foarte bine.
      Paragrafele sunt suficient de "aerisite", iar informaţiile par că vin în trepte... ceva de genul: "dacă ai înţeles până aici, atunci citeşte mai departe pentru a afla o informaţie în plus."
      Pare destul de scurt, dar şi suficient de clar.
      Eu cred că e destul de bine aşa. Sper că şi utilizatorii să fie de aceeaşi părere.

      LE:
      utilitasetveritas,
      Să-mi fie cu iertare! nu sunt de acord cu tine, deşi, probabil sună destul de răutăcios ceea ce scriu, dar e părerea mea sinceră.
     
      Nu cred că trebuie oferit totul pe tavă, deşi s-a făcut asta din plin.
      Sunt convins că e de datoria fiecăruia să se documenteze asupra programului.
      Dacă cineva ignoră avalanşa de informaţii despre AutoCorect de pe acest forum, dacă nu se deranjează să citească nimic despre el, ci pur şi simplu se apucă direct de prelucrat texte corectate şi formatate... atunci chiar merită să obţină ce va obţine.

      Sunt destule informaţii în limba română pe forum; trebuiesc doar citite.
      Sunt mulţi useri care s-au chinuit cu programe complet necunoscute, cu meniuri în limbi străine, inclusiv în rusă şi nu numai... şi, dacă aceştia şi-au dorit cu adevărat să afle cum funcţionează programul, au încercat şi reîncercat şi iar au încercat... poate de sute de ori, până au reuşit.

      Nu mai suntem ca acum 3 ani şi ceva, când nu aveam nici cea mai mică informaţie despre digitalizare, când cotrobăiam tot netul ca să aflăm ceva informaţii folositoare, când încă făceam OCR cu Abbyy 6 ori crop cu Photo Edit de la Ms Office 2000 şi când Scan Tailor începea să dea primele semne de viaţă sub forma lui Split Tailor 3.1... dar asta mult mai târziu.
      Acum, dacă cineva îşi doreşte să facă un lucru de calitate va găsi suficiente informaţii chiar pe acest forum, ca să afle cum se ajunge la calitate...

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Si o ultima sugestie de modificare: e adevarat ca marea majoritate a modificarilor asupra textului in OCR Plus se fac prin intermediul dictionarelor imd (mare parte facute de tine) dar utilizatorul obisnuit se uita, vede numai meniuri/functii/optiuni nicidecum dictionare - si va fi cam nedumerit.
De aceea zic ca trebuie explicat pe undeva (aici, in Help sau altundeva) legatura dintre meniuri/functii/optiuni si dictionarele imd aferente dar totusi, acest mesaj fiind prima informatie pe care o vede utilizatorul cand acceseaza OCR Plus, cred ca ar fi indicat ca prima referire sa fie "meniuri/functii/optiuni" (pe urma se "dezvolta" despre dictionare).


pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu stiu daca ne-am inteles.
Ziceam ca poate considerati suficient ca in acea fereastra sa scrie doar:

Nu rulati aceasta optiune pe un text deja formatat si corectat! Rezultatele variaza!

Mergand pe ideea ca deja cine e interesat stie, cine nu o sa afle, doar are de unde.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     utilitasetveritas,
     Sigur nu ne-am înţeles. Îmi cer scuze!
     Am crezut că vrei ca la textul deja implementat să se mai adauge şi fraza propusă de tine. Spaţiul din fereastră era unsuficient pentru asta şi ar fi trebuit o redimensionare a ferestrei.

     Cosmin,
     În legătură cu ceea ce ai spus... Eu cam aşa am încercat să explic fiecare opţiune în parte în topicul AC AutoCorect OCR_Plus – Instructiuni de folosire.
     La fiecare opţiune în parte am specificat dacă rulează pe bază de cod şi/sau pe bază de discţionar, care e dicţionarul, cam ce conţine şi în final recomandare de activare fără probleme a opţiunii, ori activarea cu pridenţă şi după ceva experienţă.

      În următoarele câteva zile, vreau să explic câteva lucruri şi despre Editarea dicţionarelor de înlocuire multiplă. Aici vreau să insist pe explicarea fiecărei condiţii în parte şi modul de stabilire a condiţiilor înregistrărilor.

      La sfârşitul săptămânii încerc să adun toate informaţiile în 2-3 minitutoriale… şi cam atât.
      Am încercat să creionez şi un help, dar editarea helpului este o chestie foarte dificilă pentru mine, aşa că cel puţin deocamdată nu pot să realizez şi un help.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Daca te folosesti de Helpul deja existent in program, nu ar trebui sa iti vina chiar asa de greu.
Ai deja categoriile facute.
Ceea ce ar trebui sa faci e sa iei pe rand fiecare optiune noua si sa o adaugi in categoria ei deja existenta sau sa ii creezi una noua, in speta Ocr_Plus. Iar aici nu o sa mai fie probleme cu numarul de caractere folosit, o sa ai loc sa te desfasori in voie.

Modificat de utilitasetveritas (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

Seven a scris:

***
     Cosmin,
     În legătură cu ceea ce ai spus... Eu cam aşa am încercat să explic fiecare opţiune în parte în topicul AC AutoCorect OCR_Plus – Instructiuni de folosire.
     La fiecare opţiune în parte am specificat dacă rulează pe bază de cod şi/sau pe bază de discţionar, care e dicţionarul, cam ce conţine şi în final recomandare de activare fără probleme a opţiunii, ori activarea cu pridenţă şi după ceva experienţă.


Da, si ai facut o treaba foarte buna.
Dar trebuie sa tii cont si de situatiile cand utilizatorul nu consulta Help-ul online si/sau Help-ul AutoCorect ci porneste direct programul. In acest caz informatiile din acest mesaj ar trebui sa fie cat mai potrivite cu ceea ce "vede" el, urmand ca pe urma sa "descopere" Help-ul (online/offline).
Asta e parerea mea dar daca se ajunge la concluzia ca trebuie scris "dictionare" in acest mesaj atunci lasam asa, nu-i mare problema...


pus acum 12 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 17 ani
Autocorect poate face SI corectura
TEXTELOR SCRISE FARA DIACRITICE
(de catre incepatori in editare text).
Aceste texte nu se incadreaza la categoria OCR
desi sunt aproximativ la fel de ''corecte''.

Pentru precizie, s-ar putea folosi expresia
''Texte dactilografiate / OCR, NECORECTATE"


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cred că acum am înţeles.
      Vrei ca în mesajul de avertizare să nu folosim cuvântul "dicţionarele", ci o formulare de genul meniu/opţiuni...
      Perfect de acord. Eu "am dat vina" pe bietele dicţionare, pentru că ele vor modifica în mod sigur câteva cuvinte.
      Sunt de acord cu modificarea. Eu am propus doar o formulare aşa cum mi-a picat la momentul respectiv. E nirmal că poate fi modificată şi remodificată.

      A... Şi... fără nicio legătură cu fereastra....
      Am prelucrat de curând ceva cam mărişor şi aproape că a murit computerul la opţiunea 2.2. Corectare linie de pauză şi dialog. Am văzut că a durat foarte mult timp mesajul "caut Em dash".
      Când am rulat 12.1, opţiunea cu schimbarea spaţiului de după linia de dialog în spaţiu neseparator, am constata că a făcut zero înlocuiri.
      Înţeleg că această convertire a spaţiunui în spaţiu neseparator a rămas implementată şi la opţiunea 2.2, aşa cum a fost ea iniţial.

      Mă gândeam dacă nu ar fi mai bine ca această convertire să se facă doar la 12.2, unde poate fi activată sau nu. Consumă ceva timp această convertire şi poate că unii useri ar prefera să o dezactiveze, pentru a o rula mai târziu sau pur şi simplu ar dori să facă modificarea în Word la finalul corecturii.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
La momentul respectiv da, am combinat inlocuirea cu EMDash si spatiu neseparator pentru a micsora timpul de prelucrare pe total. Asta deoarece inlocuirea propriuzisa ia mare parte din timp, indiferent ca inlocuiesti un caracter sau doua caractere consecutive. Deci daca inlocuiesti de 2 ori timpul se dubleaza.

Daca zici ca EMDash-urile sunt scanate bine (si deci codul nu va avea ce inlocuiri sa faca) respectiv spatiul neseparator dupa EMDash sa nu fie folosit implicit atunci dezactivarea manuala a 12.1 sau chiar transformarea 12.1 in optiune neactivata implicit va micsora timpul de procesare pe ansamblu.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Eu mă gândeam aşa:
           – la opţiunea "2.2 Punctuaţie >> Corectare linii de PAUZĂ şi linii de dialog" să lăsăm opţiunea aşa cum este acum, dar scoţând din ea convertirea din spaţiu obişnuit în spaţiu neseparator.
           – la opţiunea "12.1 Setări finale >> Înlocuire spaţiu după linia de dialog cu spaţiu neseparator - nu facem nicio modificare.

      Practic la 2.2, dicţionarul care rulează înaintea codului, face foarte multe modificări, convertind toate tipurile de liniuţe [însoţite sau nu de alte caractere] în Em dash; Dacă partea de cod ar face doar convertirea liniuţelor, atunci timpul de rulare ar fi scurt, deoarece majoritatea convertirilor sunt deja făcute.
      Eu cred că rularea acestei opţiuni durează foarte mult pentru că partea de cod trebuie să reia absolut toate liniuţele şi să facă convertirea spsţiilor.
     
      Personal cred că dacă 2.2. se modifică astfel, timpul de rulare al 2.2 + 12.1 nu ar fi mai mare decât cel necesar pentru 2.2 în actuala formă.
      Dacă luăm în calcul faptul că 12.1 am putea alege să nu ruleze, atunci timpul de rulare total se poate reduce.

      Nu contest că e posibil ca ipotezele şi judecata mea să fie eronate, dar cred că merită să fie luată în calcul.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
In acest mod, daca 12.1 e activata iar codul are si de inlocuit liniute cu EMDash, pe ansamblu timpul de procesare va fi mai lung deoarece va face mai multe inlocuiri consecutive.
Daca 12.1 e dezactivata manual, da, se micsoreaza timpul de procesare.
Dar daca utilizatorul va folosi setarile implicite atunci doar cand nu e de inlocuit nicio liniuta cu EMDash se va obtine acelasi timp, in rest va dura mai mult.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cred că ai dreptate... pentru că mai e ceva la care nu m-am gândit...
      La 2.2. dicţionarul face convertiri ale liniilor, dar nu face nicio corecţie privind spaţiul de după linia de dialog. Codul oricum scanează toate liniuţele ca să poată adăuga spaţiu acolo unde el nu există.

      Da, e bine să rămână exact aşa cum este acum, iar dacă 12.1 pare la prima vedere că nu se mai justifică, în realitate se justifică pentru că ea poate fi rulată separat după corectură pentru a corecta eventualele spaţii obişnuite apărute pe timpul corecturii.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Nu, nu toate convertirile de liniute la 2.2 se fac cu dictionar, se fac si cu cod.
Acu cateva luni era problema ca se faceau inlocuri cu EmDash foarte incet si atunci le-am facut in cod + am combinat cu conversia spatiului normal cu cel neseparabil si a mers mai rapid.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am o idee mai neortodoxa: daca 12.1 e activata sau dezactivata sa influenteze si daca sa puna sau nu spatiu neseparator dupa EMDash la 2.2.
In acest fel se impusca 2 iepuri: se obtine viteza maxima in orice situatie iar utilizatorul are control daca sa puna sau nu spatiu neseparator dupa EMDash.
Ce parere aveti


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Adică 12.1 să fie un fel de opţiune de setare pentru 2.2 ?...
      Dacă se poate aşa ceva, mie chiar îmi place.
      E un fel de "unde dai şi unde crapă".

      Foarte serios vorbind, ortodoxă sau neortodoxă la rularea automată a întregului meniu, varianta asta este doar o chestie de cod, invizibilă pentru utilizator.
      Practic, rezultatul este exact cel aşteptat de utilizator, doar că procesarea nu se petrece unde crede el, ci în alt loc.
      Marele câştig este că 12.1 poate fi dezactivată manual. Cine o dezactivează înseamnă că ştie şi de ce o face.

      Am, totuşi, o întrebare sau chiar două:
             - dacă rulăm 12.1 în mod independent, adică accesăm numai această opţiune? asta înseamnă că va rula 2.2 cu convertirea spaţiilor ori nu se întâmplă nimic?
             - dar dacă rulăm independent 2.2...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Daca le rulam independent (nu cu rularea automata) atunci nu vor avea legatura una cu alta.

Bine, daca la rularea automata se decide ca 12.1 sa influenteze 2.2, la rularea independenta a 2.2 probabil ca ar trebui dezactivata convertirea spatiilor normale de dupa EmDash in neseparabile.
Ce parere ai?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       Nu. Nu cred că e nevoie de dezactivare la rularea independentă a opţiunii 2.2.

       Opţiunea 12.1 e posibil să fie rulată rulată independent; există o justificare pentru asta ca o măsură în plus la terminarea corecturii.

       Opţiunea 2.2 nu prea rulează independent... iar dacă totuşi va fi rulată, cred că e chiar foarte bine să ruleze complet, inclusiv convertirea celor două variante de spaţiu.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Bine, atunci maine dimineata ma apuc sa implementez...

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
M-am apucat de implementat, e deja facuta pe jumatate cand din teste a iesit ceva ciudat.
Am o linie de test care incepe asa:
   -   cuvant.
Dupa rularea 2.2 arata asa:
—  -   cuvant.
Am facut ceva teste si inlocuirea primului spatiu se face de catre inregistrarea 110 din CO_LinD.imd: spatiu obisnuit e trecut in EmDash la inceput de paragraf + potrivire perfecta.
Probabil cand se ruleaza intr-un OCR brut nu apar situatii de acest gen dar oricum poti sa verifici te rog Seven...?
Ca o paranteza: vad ca in acest dictionar folosesti mult "Pp" (potrivire perfecta) desi nu ai litere. Potrivirea perfecta are sens sa fie utilizata numai ca sa se faca diferenta intre majuscula si minuscula.

PS: se pare ca problema apare doar la rularea 2.2 nu si la rularea automata. Totusi poate ar trebui oleaca optimizate functiile/dictionarele si pentru rulare independenta - in caz ca cineva le ruleaza asa.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am terminat de implementat.
Uite o versiune de test.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Da. Înregistrarea 110 din Co_LinD.imd [CO_LinD.imd] produce această modificare.
      Această înregistrare trebuie eliminată din cele două dicţionare.

      În legătură cu condiţia Pp.
      Între timp am înţeles că la acest dicţionar această condiţie nu este necesară, dar m-am gândit că nu va produce efecte negative; de aceea nu am mai eliminat-o. Dacă există posibilitatea ca ea să producă efecte negative, atunci am să modific dicţionarul şi am să o elimin condiţia Pp.


      Cred că explicaţia pentru efectul de mai sus are legătură cu implementarea codurilor [ ^_  ^+  ^=  ^a  ^l  ^L  ^t ].

      Înregistrarea voia să înlocuiască succesiunea acestor două caractere ^_  cu EmDash, atunci când se aflau la început de paragraf.
      După implementarea codurilor, această succesiune a devenit codul pentru spaţiu obişnuit şi programul, în realitate caută spaţiu şi nu respectiva succesiune de caractere.

      Efectul negativ al înregistrării a fost descoperit tocmai acum, deoarece la rularea automată în opţiunile din primul pachet sunt şterse spaţiile de la început de paragraf; pe de altă parte, înregistrarea nu are şi un efect pozitiv - deci trebuie ştearsă pentru că nu se mai justifică.

      Caracterul ^ însoţit de alte caractere mai apare şi în alte câteva înregistrări. Voi verifica dacă nu există situaţii similare în care succesiunea este interpretată ca fiind cod.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Caracterul ^ la început de rând trebuie rezolvat cumva pentru că el apare în două mari situaţii, dar trebuie să mă mai gândesc la un mod de rezolvare care să nu producă efecte secundare.

      Am constatat în ultimul rând, în special la Abbyy 11, o eroare frecventă în care sunt recunoscute şi reproduse astfel de caractere la început de rând.
      Când pe cartea tipărită litera Î mare are o mărime mai mare decât celelalte caractere, practic "căciula" lui Î se află cumva deasupra rândului. Din această cauză Abbyy face mai întâi o recunoaştere separată a acestor "căciuli", astfel că vom obţine rânduri formate din unul sau mai multe caractere ^ după numărul de litere Î mare care se află pe rândul respectiv, după care Abbyy face pe rândul următor recunoaşterea textului, doar că acum Î mare este văzut ca I mare, deoarece "căciula" a fost deja recunoscută.
      La antrenamentul Abbyy nu am găsit posibilitatea de întindere a încadrării caracterului astfel încât să cuprindă toată litera, astfel că singurul lucru ce poate fi făcut în acest moment este să se elimine rândurile care conţin doar un caracter ^sau mai multe.

      A doua situaţie era când caracterul ^ apare la începutul unui rând care conţine text, de regulă în zona apropiată a liniei de dialog.
      Cred că se poate elimina separat numai acest caracter la început de paragraf şi scoase din dicţionarul de mai sus combinaţiile cu el, pentru a evita interpretarea unui cod.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Vorbesti de ^_ adica de spatiu obisnuit, nu?
In ce sens trebuie rezolvat..?

PS: a, acum am vazut editarea ulterioara facuta de tine la postare...

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Păi nu cred că trebuie rezolvat, în sensul ca tu să schimbi ceva la coduri ori altceva de genul ăsta.
     Este foarte bine ca acele coduri să rămână aşa cum sunt pentru că foarte multe înregistrări depind de ele.

     Rezolvarea ar consta în evitarea situaţiilor în care să mai înregistrez o succesiune de caractere, care pot fi interpretate ca fiind cod.


     LE: Se pare că merge varianta de ştergere separată a caracterului ^ aflat în prima poziţie la început de paragraf. Trebuie să mai fac ceva teste pe texte mai lungi ca să fiu convins că e o variantă bună.
     Dacă se poate elimina caracterul ^ la început de paragraf, atunci trebuie doar să refac înregistrările care conţin conbinaţiile de caractere în care apărea şi acest caracter în zona liniei de dialog.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 17 ani
Referitor la erori de recunoaştere ABBYY - caciulite Î, etc
un pont :

- Daca scanarea e ok
smecheria principala pt obtinere OCR de CALITATE este

RESIZE jpg la peste 4700 pixeli verticala, 600 dpi.

Adancimea dpi obisnuita de 300  rezultata din scanare
se poate converti la DPI de 600 sau chiar 1200 cu
IRFAN, odata cu prelucrarea Resize
sau cu 
SCAN TAILOR (dubland LA SALVARE rezolutia jpg introduse)

- NUMAI pt jpg continand text -

dati resize jpg
cu IRFAN sau ACDSEE
lăţind imaginea pe orizontala cu 25 %,
fara a păstra proporţia FIXA între dimensiunile
verticala si orizontala - jpg.

Ex:
unui jpg cu proportia de 17x24
ii mariti DOAR latimea (17)
cu 25 la suta
imaginea dv ajungand la proportia de
21 X 24.

Acuratetea creste semnificativ,
mai ales in cazul NOTELOR de subsol.

Pt caciulitza lui Î,
daţi resize VERTICALEI cu +25 la sută, pastrand orizontala
neschimbata.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cum n-au aparut probleme la testare, ultimul exe poate fi folosit de toti:

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Mulţumim, Cosmin.
      După evidenţa mea, acesta a fost cel de-al 85-lea executabil OCR Plus Contemporan postat pe forum, fără a lua în calcul câteva exe speciale pentru teste şi variante pentru Clasic. Asta înseamnă, cu adevărat, o muncă enormă.
      Stimă şi respect!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
utilitasetveritas
Pe lista neagra

Inregistrat: acum 12 ani
Nu se pot ignora cazurile de genul asta:



???


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Au fost deja eliminate.
      În dicţionarele OCR_DIC varianta aprilie 2012 aceste modificări se fac numai în cazul în care cratima este lipită de o literă mică.
      ^l este codul pentru orice literă mică.



Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Pagini: 1 ... 8 9 10 11 12 13  

Mergi la