Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
crazylife 25 ani
Femeie
25 ani
Bucuresti
cauta Barbat
25 - 47 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect versiune pentru Romania-Inedit Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini:  1 2 3 4 ... 13
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
AutoCorect 5 versiune pentru Romania-Inedit

Īmbunătăţiri faţă de versiunea precedentă:
- multe mici īmbunătăţiri la cod şi la dicţionare.

Aici găsiţi versiunea oficială (kit de instalare complet):

Contemporan:

Code:

http://www.mediafire.com/download.php?2l78535qwgg2upu

Clasic:

Code:

http://www.mediafire.com/?duq8w4hpktucmma





Exe modificat pentru AutoCorect OCR Plus:

        Īn folderul mediafire de tip deschis  de mai jos se află īntotdeauna ultima versiune a celor două exe:
AutoCorect Contemporan.exe şi AutoCorect  Clasic.exe
        Nume folder: 1. Executabile OCR Plus

Code:

http://www.mediafire.com/?f12mry259atv9

Instrucţiuni de instalare: descărcaţi kitul complet şi-l instalaţi normal.
Descărcaţi exe modificat, dezarhivaţi-l şi copiaţi peste original (locaţia implicită de instalare e "C:\Program Files\AutoCorect" ).

Ce are in plus faţă de versiunea oficială: funcţii de corectare automată a erorilor de scanare. Le găsiţi īn meniul OCR Plus. Necesită cateva dicţionare tip imd pe care le găsiţi la:

Code:

http://www.mediafire.com/?aozlgwpimcpqt

La locaţia "c:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect [Contemporan/Clasic]\Dictionare" pentru cei care au Windows XP, respectiv la "c:\Users\Nume_utilizator\AppData\Roaming\AutoCorect [Contemporan/Clasic]\Dictionare\" pentru cei cu Windows Vista/7, creati folderul OCR_DIC, dezarhivati arhiva descarcata si copiati acolo dictionarele.


Aştept părerile voastre, critici, sugestii etc. Dacă aveţi o idee de vreo īmbunătăţire ce va folosi şi altora, nu ezitaţi să o scrieţi; dacă e posibil, va fi implementată.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

         ══════════════════════════════════════════════════════

         Dicţionarele  IMD care rulează automat īn meniul OCR_Plus vor fi reactualizate periodic şi urcate pe un folder mediafire deschis.

         Arhivele cu pachetele de dicţionare vor purta nume de genul: [2011.11.18] Dictionare_OCR_DIC.rar
         Arhivele vor avea la īnceputul numelui īn parantează dreaptă data reactualizării sub forma [2011.11.25] pentru a fi mai uşor de urmărit care este cea mai nouă arhivă.

            Nume folder mediafire:      AC OCR Plus V5.1 - 2012
            Adrese folder mediafire:
   


         ══════════════════════════════════════════════════════




         ══════════════════════════════════════════════════════





      Salutare Cosmin,

      Cred că am să te agasez mai mult decāt ţi-ai dori.
      Īncerc să ridic problemele īntr-o anumită ordine, deşi nu ştiu dacă ea va fi ordinea cea mai bună.


     1. Opţiunea: Instrumente -> Ortografie...

      Abbyy dă uneori erori de recunoaştere, "foarte depărtate" ca formă de cea reală a cuvāntului corect.
      Īn plus, datorită faptului că īn beletristică există şi cuvinte străine nerecunoscute de dicţionarele romāneşti, dar şi cuvinte romāneşti īn forme care nu se regăsesc īn dicţionare... īn aceste situaţii, dar şi īn altele, cuvintele existente īn fereastra "Sugestii" sunt insuficiente.

      Sunt situaţii cānd cuvintele cu care ar trebui să fie īnlocuite, deşi există īn dicţionare, ele au o formă mult diferită faţă de cel "recunoscut" de către Abbyy, astfel că ele nu au fost prevăzute ca "Sugestii".
         
      Apare, astfel necesitatea editării, prin adăugarea unor cuvinte īn plus faţă de cele prevăzute la "Sugestii".

          ■ Deci, prima problemă: s-ar putea adăuga o facilitate īn acest sens? Există posibilitatea să se implementeze posibilitatea editării īn fereastra "Sugestii"

          ■ A doua problemă: Aceste cuvinte pe care le-ar putea adăuga utilizatorii, nu cred că trebuiesc adăugate īn dicţionarele existente īn AutoCorect, ci īntr-un dicţionar temporar, deoarece ele sunt valabile doar īn anumite situaţii şi la anume cărţi.

          ■ Se poate discuta despre cāt timp ar trebui să se păstreze acest dicţionar TEMP, dar mai īntāi să clarificăm dacă această posibilitate de editare a ferestrei "Sugestii" există.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Daca nu gresesc, atunci cand modifici manual un cuvant in fereastra de deasupra listei de sugestii, trebuie sa apesi pe unul din butoane pentru a trece mai departe.
De nu ar merge apasat butonul de adaugat in dictionar?

Si chestia cu dictionarul temporar sau separat de cel normal e o idee buna.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, stiu de Abby si de problemele care le are.
De asta la Configurare >> Ortografie exista si optiunea "Litere interpretate gresit la scanare (OCR)". E deci implementata dar, cum trebuie sa se descurce si cu celelalte probleme, nu e specializata 100% doar in OCR.
Pe de alta parte lista de sugestii poate fi oarecum modificata.
De exemplu cand cineva alege o sugestie care nu se afla pe primul loc sau cand editeaza manual textul in acea fereastra de sus (numai cuvantul) programul tine minte asta si afiseaza sugestia pe primul loc data viitoare cand intalneste din nou acel cuvant. Intr-un fel "invata"...
Unde le stocheaza: in "C:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect Contemporan\Dictionare\i.dic" respectiv "C:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect Clasic\Dictionare\i.dic".
Forma de stocare: pe liniile impare pune cuvantul scris gresit iar pe cele pare sugestia care va fi afisata prima. Sunt scrise Ansi, nu Unicode si doar cu litere mici (la cuvinte scrise cu majuscule face programul "paralela").
Ai putea sa faci un astfel de dictionar particularizat in care sa apara perechi ca:

dm
din
pc
pe

E bine asa sau vrei si mai "specializat"?

Am o rugaminte: daca ai putea sa-mi dai exemple de situatii intalnite mai des (spre exemplu anumite grupari de litere care in orice cuvant fac probleme) pentru a incerca sa le implementez.


Altceva, ce nu tine de ce mi-ai vorbit acum: de ieri incerc sa implementez o modalitate mai buna de a cauta si repara zonele de text "rupt" (alta decat cautarea si inlocuirea automata). Mai exact atunci cand Abby taie fraza la jumatate:

"Anul viitor vom
merge la mare si la munte"

In acest caz merge in cele mai multe situatii o cautare de genul [litera_mica][caracter_sfarsit_paragraf][litera_mica] si inlocuite automat cu [litera_mica][caracter_spatiu][litera_mica].
Dar sunt si cazuri cand strica:

"...
a)Text1
b)text2
c)Text3
..."

sau cand se recita ceva ca o poezie dar fara sa puna majuscula la inceput. Si mai sunt si alte situatii.
In concluzie, cautarea si inlocuirea automata ajuta mult la textele care au multe astfel de probleme dar ar strica textele care au putine.

Implementarea care am facut-o pina acum in AutoCorect contemporan:
E ultimul buton din dreapta sus de pe toolbar (primul rand), dupa butonul cu -.
Daca va intereseaza poate o testati si ma ajutati cu critici si sugestii...

@menssana1984 am vazut ca ai scris dupa ce am pus mesajul (ai pus mesajul tau cu putin timp inainte si eu aveam deschisa editarea si n-am avut cum sa mai dau refresh)...
Butonul de adaugat in dictionar se dezactiveaza automat cand utilizatorul editeaza manual deoarece utilizatorul alege clar modificarea manuala si nu mai poate fi adaugat la dictionar in forma initiala. Am discutat cu Daniel acu cativa ani despre asta si amandoi am ajuns la concluzia ca e mai bine sa fie dezactivat in aceasta situatie.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Privind problema Opţiunea: Instrumente -> Ortografie...

     Este perfectă posibilitatea editării īn dicţionarul temporar "i.dic".
     Am făcut cāteva testări şi este exact ceea ce voiam să propun.
     Ar mai fi o problemă. După cāte am constatat [e posibil să mă īnşel] dicţionarul este activ atāt timp cāt este activă opţiunea "Ortografie...", apoi el dispare.
     Mă gāndeam că dacă acest dicţionar ar avea o viaţă ceva mai lungă ar fi şi mai util. De exemplu, dacă acest dicţionar s-ar şterge la ieşirea din programul AutoCorect şi nu imediat la ieşirea din opţiune.
     Ideal pentru cei de pe forum ar fi să poată fi şters atunci cānd userul nu-l mai consideră necesar, adică după ce a terminat de rulat cartea prin AutoCorect, dar asta ar īncurca pe utilizatorii obişnuiţi.


     Privind problema rezolvării "ruperilor de rānd..."
     Am descărcat şi instalat [copiat executabil] ultima versiune şi am văzut opţiunea de rezolvare a acestei probleme.
     Momentan nu am fişiere cu probleme de acest gen, aşa că nu am avut pe ce să fac proba.

     E bine de ştiut că astfel de probleme apar īn Abbyy doar accidental, atunci cānd textul este salvat rtf Plain text. La problema asta trebuie să mai fac cāteva testări cu Abbyy ca să fiu sigur īn ce situaţii apar ruperile de rānd.

     Īn principiu, situaţia apare atunci cānd fişierul text rezultat īn Abbyy este salvat īn format Exact copy sau Editable copy, formate pe care eu nu le recomand din mai multe motive.
     Oricum, la salvarea īn format rtf - Plain text ele nu apar mai mult de cinci-şase la zece pagini...


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Zici ca dispare din locatia respectiva? Ciudat, nu l-am facut sa dispara ci sa ramana chiar si dupa ce AutoCorect e inchis...
Daca esti 100% sigur ca dispare trimite-mi te rog un text la care dispare si arata-mi pasii necesari ca sa apara problema...

PS: intrebare - ai editat cumva fisierul cand AutoCorect era deschis si mai ales cand era pornit pe ortografie...?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Īmi cer scuze!
     N-am fost atent la calea de căutare pe care ai pus-o mai sus. M-am uitat īn subfolderul "Dictionare" din folderul de instalare.
     Da, e acolo unde trebuie. E perfect aşa.
     Am īnţeles şi cum se face editarea.

     Īn principiu, pentru cuvintele foarte scurte de două, trei sau patru litere, prefer dicţionare imd pentru īnlocuire multiplă.
     E mai complicat faptul că aceste dicţionare [imd] nu le pot indexa īn ordine alfabetică şi uneori sunt grupuri de cuvinte pe care nu ştiu dacă le-am pus sau nu.

     E adevărat că multe dintre ele ar putea fi implementate să ruleze automat pentru că de exemplu nu există cuvāntul īntreg "cc" ci doar "ce", ori "$i", ci doar "şi"... etc
     Am să fac o listă cu tot ce am, le supunem discuţiei [să vedem dacă mai apar şi altele] şi pot fi implementate īn genul opţiunii "Litere interpretate greşit la scanare (OCR)"

      Pe de altă parte, cei mai mulţi dintre noi fac precorectura folosind atāt AutoCorect, cāt şi Word sau alte editoare, īnlocuiri Find&Replace simple şi speciale, precum şi macrocomenzi.
      Deci editoarele īn acest caz sunt complementare.
      Īn unele e mai uşor de făcut un anume tip de corectură, īn altele altceva.
      [Cānd zic precorectură, mă refer la toate acţiunile de corectură automată şi semiautomată, care au loc īnainte de corectura prin citire cap-coadă - după corectura prin citire nu mai fac corecturi, decāt īn cazuri foarte rare, ca de exemplu o īnlocuire cu confirmare pentru fiecare situaţia īn parte].


      LE: Am uitat... Am văzut şi un alt dicţionar īn care am recunoscut cuvintele din textul meu.
      Acest dicţionar este "p.dic".
      Este vorba de cuvintele ignorate? Se pare că şi acesta ar putea fi editat cu NotePad, doar că nu se mai trec perechi de cuvinte, ci doar cuvāntul ce trebuie ignorat...

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am sa adaug o sortare alfabetica la imd-uri. Poate chiar si o cautare...
p.dic este echivalentul lui custom.dic din Word - in care sunt stocate cuvintele adaugate la dictionar.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am īnţeles ce e cu p.dic.

     Opţiunea "Īnlocuirile multiple", din punctul meu de vedere este cea mai importantă opţiune; doar ea singură face cāt un program foarte puternic.
     Mai īntāi că nu cunosc să existe un editor care să permită mai multe īnlocuiri, AutoCorect fiind singurul care permite acest lucru. Deci, se pot face un număr nelimitat de īnlocuiri, īntr-un timp foarte scurt; faptul că aceste īnlocuiri pot fi salvate īn dicţionare şi folosite de cāte ori e nevoie şi de către oricine este deja un lucru excelent.

     Dacă se poate adăuga şi sortarea alfabetică la imd-uri, atunci această opţiune, a "Īnlocuirilor multiple" devine ceva cu totul şi cu totul special, foarte utilă şi foarte uşor de folosit.
     O serie de probleme pot fi rezolvate fără a adăuga opţiuni suplimentare la program.

     Personal, mie īmi este suficientă sortarea.
     Funcţia de căutare... nu este neapărat necesară, deoarece ne-am obişnuit deja cu dicţionare pe litere şi e mai uşor de constatat dacă un cuvānt este deja īnregistrat, deoarece īl caut īntr-un singur dicţionar.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat sortare la imd-uri:

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mulţumim Cosmin!
     Mulţumim foarte mult!

     Opţiunea de sortare a dicţionarelor de īnlocuire multiplă este foarte-foarte importantă şi foarte utilă.
     Sortarea astfel implementată, se face foarte rapid şi este uşor de realizat.
     Mulţumesc īncă o dată.
     
     Toată stima şi deosebit respect!
     Seven

      


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cu placere.

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Salutări Cosmin!
Am revenit.

      Am īnceput cu "Īnlocuiri multiple", deoarece această opţiune este de mare importanţă pentru mine.

      Acum aş vrea să purtăm discuţii şi să clarificăm modul de accesare şi funcţionare a altor opţiuni şi īncerc să le luăm īn ordinea īn care apar ele īn meniu.
      Sper că discuţia să folosească şi altor colegi de pe forum, deoarece după cum ai constatat nu mulţi sunt cei ce studiază helpul sau, poate că uneori, helpul nu le clarifică suficient problema a cărei rezolvare o caută.

      Īn măsura īn care eşti dispus aş vrea să intrăm mai īn amănunt īn discuţii despre anumite opţiuni.
      Şi acum să īncepem:

     
       Opţiunea: Editare ―> Conversie text clasic īn contemporan

      Mulţi useri, printre care mă număr şi eu, lucrăm īn varianta text contemporan, deşi OCR-ul rezultat din Abbyy este text clasic.
      Această opţiune devine foarte importantă pentru foarte mulţi dintre noi.

      Ţinānd cont de discuţiile pe care le-am mai purtat, şi anume, că īn textele literare apar frecvent cuvinte cu o formă intenţionat incorectă şi că ele trebuie să rămānă astfel şi să nu fie corectate īntr-o limbă literară corectă, se pune următoarea īntrebare: [Mă voi referi doar la īnlocuirea ī ―> ā, nefiind probleme la sīnt ―> sunt.]

      Rularea acestei opţiuni, face īnlocuirea lui ī din i cu ā din a, fără a face şi alte corecturi ale cuvintelor?...  sau, rulānd dicţionarele din componenţa AutoCorect se fac şi corecturi ale formelor cuvintelor?

      Să mă explic: pānă acum am folosit opţiunea "Īnlocuiri multiple" pentru trecerea de la text clasic īn text contemporan, din trei paşi.
      Pasul 1: Rulez un mic dicţionar doar pentru convertirea de cuvinte īntregi sīnt-sīntem-sīnteţi şi a erorilor de genul sint-sintem-sinteţi-sinteti… etc.
      Pasul 2: Īn continuare, ca să nu afectez textul am folosit un dicţionar cu peste 400 de īnlocuiri, practic fiecare īnlocuire fiind un grup de 3 litere cu litera ī la mijloc; īn acest mod am īnlocuit toate literele ī din interiorul cuvintelor, păstrānd neschimbate literele ī de la īnceputul şi sfārşitul cuvintelor.
      Pasul 3: Pentru corectarea cuvintelor compuse īn care litera ī din i apare īn mod corect īn interiorul cuvintelor am realizat un al treilea mic dicţionar, iar celelalte cuvinte necuprinse īn acest dicţionar, rămānānd īn număr mic, le corectam cu ocazia citirii cap-coadă a textului.

      Revenind,
      Mă interesează dacă folosind opţiunea „Editare ―> Conversie text clasic īn contemporan” obţin un rezultat comparabil cu cel obţinut prin varianta „Īnlocuiri multiple” sau apar şi corecţii īn plus faţă de cele prezentate de mine?

      Īmi pare rău dacă m-am exprimat cam īn multe cuvinte, dar am vrut să dau toate informaţiile pe care le-am crezut de cuviinţă.

      Cu stimă,
      Seven


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Ideal ar fi sa se incerce, pe un text de 3-4 pagini, ambele optiuni.
Iar apoi sa se faca o comparatie.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
N-am mai lucrat cu metoda ta de conversie dar cred ca se obtin in ambele cazuri rezultate destul de apropiate de 100%.
La optiunea din meniu se transforma toate ī din interiorul cuvintelor in ā cu exceptia unor cuvinte dintr-un mic dictionar si a celor care incep cu aceste grupuri de caractere:

Code:

alt
anti
arhi
atoate
atot
auto
bine
bio
bun
cap
co
de
des
dez
ex
foto
hiper
micro
mini
mult
ne
nemai
non
piţ
piţi
prea
pre
pro
pseudo
răs
re
semi
sub
subt
super
supra
tele
tripla
ultra

Cum le-am gasit: am scanat toate cuvintele "compuse" ce aveau ī in mijloc. De regula oricare din acestea de mai sus + un cuvant ce incepe cu ī vor forma un cuvant care aproape intotdeauna va avea ī in mijloc.
Sunt putine exceptii dar majoritatea sunt incluse in acel mic dictionar mentionat mai sus.

Ambele metode au un punct slab: cum nu avem un dictionar cu toate cuvintele limbii romane (pe care bineinteles nimeni nu poate sa-l aiba - din motive obiective) vor exista cuvinte care vor ramane in format vechi sau vor fi modificate incorect.
Dar astea, cum ai spus, se rezolva la editarea manuala.

M-ai intrebat daca metoda din meniu merge la fel sau mai bine - nu pot sa ma pronunt 100% din moment ce nu am dictionarele folosite de tine ca sa pot face comparatie intre texte.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Īncerc să fiu mult mai scurt.

      Nu, nu la gradul de eficienţă mă refeream.
      E foarte clar că varianta mea cu "Īnlocuiri multiple", cel ăuţin īn acest moment, este mult mai slabă.
      Convertirea cu ajutorul "Īnlocuiri multiple" nu acţionează asupra cuvintelor scrise greşit.

      Īntrebarea era, dacă pe lāngă īnlocuirea lui ī cu ā, opţiunea "Editare ―> Conversie text clasic īn contemporan" face şi corectarea unor cuvinte pe care le consideră incorect scrise. Adică, dacă nu se face şi o corectare ortografică..

      Nu-mi vine la īndemānă un exemplu mai bun, dar... īncerc ceva.

      Să presupunem că īntr-un text apare cuvāntul scris intenţionat greşit bīrzīune.

      Pe mine mă interesează dacă după convertirea cu opţiunea: "Editare ―> Conversie text clasic īn contemporan", acest cuvānt va apărea scris bārzāune - ceea ce īmi convine, ori intră īn funcţiune şi anumite dicţionare şi se corectează īn bărzăune - chestie care nu-mi convine foarte tare.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Nu, nu sunt folosite si alte dictionare. E doar o conversie, nu corecteaza.

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Atunci e perfect, este excelent.

     Pentru că opţiunea "Conversie text clasic īn contemporan" este doar o conversie, rezultă că ea este mult mai bună decāt conversia prin metoda mea cu "īnlocuire multiplă", deoarece este mai eficientă, mai avantajoasă, din următoarele motive:

         - Opţiunea "Conversie text clasic īn contemporan" se face īntr-o singură etapă, pe cānd prin metoda "īnlocuirii multiple" se făcea īn 3 paşi;

         - Opţiunea "Conversie...." cuprinde mult mai multe excepţii la convertire pentru cuvintele compuse, deci corectitudinea este mai aproape de 100%; excepţiile la convertire din "Īnlocuiri multiple" cuprinde un dicţionar mult mai mic.


     Pentru userii care au folosit metoda īnlocuirilor multiple pentru trecerea de la text clasic la text contemporan, vă informez că este necesar să se elimine dicţionarele numite: "01 SĪNT-SUNT.imd"; "02 ī trece īn ā.imd"; "03 ā - ī.imd".

     Dicţionarul "11 Eliminare Spaţii.imd" se elimină şi el, deoarece lucrurile au fost rezolvate prin intermediul macrourilor din template-le pus pe forum, astfel că deocamdată primul dicţionar de īnlocuiri multiple ce rămāne de rulat este "12 L_l & 1_l.imd". Poate că īn curānd īn funcţie de discuţiile cu Cosmin, va putea fi eliminat şi el.


     Cosmin,
     deocamdată mă opresc aici, pānă săptămāna următoare.
     Īn timpul ce urmează am să-ţi trimit cele 3 liste cu propunerile mele de īnlocuire la cuvinte formate din două litere, cuvinte formate din 3, respectiv 4 litere.

     Avānd acum la dispoziţie funcţia de sortare īn ordine alfabetică, vreau să le mai revăd īnainte de a le pune la dispoziţie.

     Seven
                 


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
O intrebare: cum tu ai lucrat cu OCR-uri mai mult decat mine, spune-mi te rog cat de des apare situatia in care cratima din cuvinte e inlocuita gresit de Abby cu alt tip de liniuta (de exemplu cu cea de pauza)?

pus acum 13 ani
   
menssana1984
Vizitator



Destul de des. Si nu e singurul fel de liniuta inlocuit aiurea.
Din motivul asta de regula se converteste automat toate liniile in cratima, iar apoi inlocuim automat in functie de situatie (spatiu cratima spatiu > spatiu endash spatiu, ^p cratima > ^p emdash)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Aha, dar aceasta inlocuire de liniute se face inainte sau dupa conversie Clasic >> Contemporan?

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cratima recunoscută incorect cu alte liniuţe...
      Practic nu se poate da un răspuns clar şi mai ales, un singur răspuns.
      Situaţia e diferită de la user la user, funcţie de cāteva setări ale Abbyy.

      Eu nu am astfel de probleme cu cratima, deoarece textul recunoscut de Abbyy īl salvez īn format rtf - Plain text. Īn această situaţie nu apar probleme la cratime, dar pot apărea probleme la liniile de dialog şi liniuţele de pauză

      Subliniez īncă o dată:
      Situatia in care cratima din cuvinte e inlocuita gresit de Abby cu alt tip de liniuta (de exemplu cu cea de pauza) - această situaţie īn cazul meu apare foarte rar sau nu apare de loc.
      Situaţia cānd linia de dialog sau linia de pauză sunt recunoscute eronat... - aici da, sunt frecvente astfel de situaţii.


      Aşa cum spune menssana, īn momentul cānd apar astfel de probleme, se pot rezolva īn procent foarte mare, relativ uşor cu Find&Replace din Word īn mai multe etape.

      Īntāi şi īntāi eliminăm toate spaţiile şi taburile de la īnceput de paragraf; după aceasta, practic linia de dialog ajunge să fie primul caracter la īnceput de paragraf.

      Mai apoi, facem īnlocuiri la linia de dialog, avānd posibilitatea să căutăm īn Word doar īnceputurile de paragraf.
      Urmează rezolvarea problemelor legate de linia de pauză; fiind īncadrată de regulă īntre pauze, iar uneori pauză linie virgulă ori alte formule... este destul de uşor de rezolvat īn marea majoritatea a acestora. ce rămāne nerezolvat se corectează la corectura prin citire.
      Ultimile se rezolvă cratimele [liniuţele de unire şi de despărţire], dacă este nevoie.

      Mai există nişte liniuţe care ne fac probleme: e vorba de liniuţele de despărţire a cuvintelor la capăt de rānd. Nu abordez īn acest moment problema lor; deocamdată am īncercat să răspund concret la īntrebarea privind cratimele.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, multumesc pentru raspunsuri.
De ce am intrebat: conversia Clasic la Contemporan nu lua in considerare cazurile -ī respectiv ī- si le schimba in -ā respectiv ā- daca liniuta nu era cratima.
Am schimbat acu:

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Am descărcat varianta de azi a AutoCorect, dar nu am lucrat īncă nimic cu el.

     Mai aduc īn discuţie o problemă. E vorba de majuscule accidentale īn interiorul cuvintelor.
     Practic nu am īnţeles exact dacă AutoCorect o rezolvă. Personal nu am văzut o opţiune specială īn acest sens.


     Există cāteva litere care au aceeaşi formă atāt ca majuscule cāt şi ca minuscule; le diferenţiază doar mărimea, iar Abbyy face confuzii.
     Este vorba despre: C-c, O-o, P-p, S-s, Ş-s, U-u, V-v, Z-z dar uneori şi despre [F-f, I-i, J-j, K-k].

     Datorită formei identice sau aproape identice a literelor, apar cuvinte īn care unele din aceste litere sunt scrise cu majuscule īn interiorul cuvāntului.
     Să zicem: aZur, reSPeCtiV, claSiC... etc... etc...

     Īntrebarea este: există deja implementată rezolvarea acestor gen de situaţii şi nu am remarcat-o sau īncă nu s-a pus o astfel de problemă?
     Subliniez că nu e vorba de situaţia īn care se foloseşte incorect Caps Lock, cum ar fi:
     sUBLINIEZ CĂ NU ESTE VORBA DE...

     Practic eu mă refer la situaţia cānd īntr-un cuvānt există o singură majusculă ori un grup de 2... poate că şi 3, dacă lui Abbyy nu i s-a făcut acomodarea şi antrenamentul corespunzător.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Nu deocamdata nu e implementata.
Dar se poate implementa. Unde crezi ca ar fi potrivita - ca optiune separata care "niveleaza" literele in cuvant incepand cu a doua pozitie sau adaugata la una din cele deja implementate (si care)...?

PS: Eu ma gandesc sa o fac separata. Sa fie semiautomata si, prin clic pe un buton, sa mearga si automat. Ce parere ai...?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Probă AutoCorect

     Am făcut mai multe probe de convertire de la text clasic la contemporan cu AutoCorectul de azi, atāt pe texte corectate, cāt şi pe OCR-uri brute.
     Nu am constatat nicio problemă sau eroare; am urmărit īn special cuvinte cu cratimă.
     Am verificat textele şi īn Word şi nu a apărut vreo situaţie īn care corectorul Word să afişeze vreo problemă īn plus. Am pentru textul pe care l-am folosit pentru teste şi un dicţionar word suplimentar, astfel că există un număr foarte mic de cuvinte necunoscute, fapt ce-mi permite să vizualizez foarte uşor erorile.


     Despre rezolvarea majusculelor accidentale...
     E foarte important faptul că se poate implementa.
     Unde anume?  Īn momentul ăsta nu sunt pregătit pentru răspuns. Mă mai uit īn meniul AutoCorect şi revin cu o propunere.
     Foarte important: uneori apare la sfārşit de propoziţie sau frază majuscula L. Aici este vorba de altceva: L apare īn loc de l... sau īn loc de !..., deci e altceva.


     Ideea mea este următoarea:
        Există cāteva acţiuni, conversii, opţiuni sau oricum s-ar numi ele, care ţin doar de erori ale OCR, deci sunt specifice dogotalizării cărţilor; aceasta pe de o parte, iar pe de altă parte acestea trebuie să ruleze textul cap coadă fără comenzi sau intervenţii intermediare. Exact cum funcţionează "Conversia de la text clasic la contemporan".

       Din acest motiv, mă gāndesc că aceste "instrumente" ar putea ocupa un loc grupat īn meniul "Editare" sau īn meniul "Instrumente".

       Īn afară de problema majusculelor ar mai fi cel puţin două probleme:
        - cuvintele de 2, 3 şi 4 litere despre care am vorbit tangenţial.
        - problema cifrei 1; pe scurt litera l [L mic] aflată īntr-o poziţie lipită de cratimă, este considerat de Abbyy ca fiind cifra 1; mai rar, Abbyy scrie şi ! īn loc de l [L mic].

       După părerea mea, cam acestea ar fi cam tot ce merită efortul implementării; restul erorilor de recunoaştere a Abbyy se poate rezolva cu dicţionare de īnlocuiri multiple de tip imd.

       LE: acum am văzut completarea ta la mesajul anterior. Se pare că deja suntem de aceeaşi părere. Ceva separat mi se pare mai bine.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
O mica problema.
Cateodata se intalnesc nume proprii "compuse" ca de exemplu: "Yellow-Stone". Programul n-are cum sa stie 100% sigur ca e nume propriu si deci sa-l "sara" dar totusi sa le semnaleze pe cele ca "da-Mi".
Acu, tu stii mai bine decat mine daca cele ca "da-Mi" se intalnesc rar sau des. In primul caz as putea face ca codul sa nu mai semnaleze deloc aceste cazuri si pe ansamblu ar merge mai bine.
Ca o paranteza: am testat cu cartea care am corectat-o recent si m-a exasperat cu cate nume proprii de acest gen a gasit

PS: sau as putea face sa "sara" peste cele care au majuscula la inceput si dupa fiecare liniuta iar in rest au litere mici. Ce parere ai..?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

Seven a scris:

   Există cāteva litere care au aceeaşi formă atāt ca majuscule cāt şi ca minuscule; le diferenţiază doar mărimea, iar Abbyy face confuzii.
   Este vorba despre: C-c, O-o, P-p, S-s, Ş-s, U-u, V-v, Z-z dar uneori şi despre [F-f, I-i, J-j, K-k].


     Dacă te referi la problema asta, şi cred că la aşa ceva te referi, atunci propunerea mea este să nu modifice literele de după cratimă.
     Este suficient să eliminăm majusculele din interiorul cuvintelor obişnuite.
     Adică numai īn situaţia: literă-MAJUSCULĂ-literă.

     Susţin acest lucru din două motive:
          - primul - exact aceste cazuri de nume proprii compuse; noi am lucrat pe forum multe cărţi din literatura franceză, unde astfel de nume sunt foarte-foarte multe; şi, bineīnţeles nu este numai cazul limbii franceze... şi īn alte limbi apar frecvent.

          - al doilea - Prelucrările automate şi semiautomate de text, fie ele cu AutoCorect, Word sau alt program trebuie să ne ajute cāt mai mult, dar ele nu pot şi nu trebuie să rezolve toate problemele. Singura corectură adevărată rămāne cea prin citire-cap coadă a cărţii; īncercăm să facem ca această corectură să fie cāt mai comodă, dar nu va fi niciodată eliminată, indiferent ce program se va folosi, indiferent cāt va fi acesta de puternic.


     Personal nu aş fi de acord nici cu schimbarea majusculei finale dintr-un cuvānt, pentru că īn cazul unei majuscule finale e posibil să fie altă cauză a erorii, aşa cum am amintit că un L final, poate fi īn realitate L mic urmat de trei puncte, dar şi I mic urmat de 3 puncte, dar şi ! urmat de 3 puncte.

     Deci, propun să se rezolve numai majusculele din interiorul cuvintelor simple, obişnuite... aşa cum am spus mai sus, doar īn gruparea:
     literă-MAJUSCULĂ-literă

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am văzut mai tārziu PS-ul tău.
     Cred că ar fi foarte bună variantă de lucru să "sară" peste cuvintele compuse care īncep cu majusculă...
     Problema este cāt de complicat este codul şi apoi, viteza de rulare a opţiunii...

     Varianta ar fi bună pentru că:
     Toate cuvintele compuse care īncep cu literă mică e normal să nu aibă majuscule īn componenţă; Nu văd cum ar putea să existe un cuvānt compus care să īnceapă cu literă mică şi care să aibă majusculă după cratimă;
     Dacă vor exista cuvinte compuse īn care prima literă este majusculă dar litera de după cratimă este īn mod corect literă mică, dar programul "sare" peste ea... vor fi foarte puţine cazurile şi se rezolvă la corectura prin citire.

     Concluzia finală este: ori numai gruparea literă-MAJUSCULĂ-literă, ori această ultimă variantă propusă, dacă ea nu este prea complicată.

     Sincer, nu aş vrea să abuzăm foarte tare de amabilitatea şi bunăvoinţa voastră.
     Oricum rămān la convingerea că AutoCorect este o mare reuşită, iar tu şi Daniel Morlova meritaţi tot respectul nostru.

     Toată stima,
     Seven

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat deocamdata ideea mea; daca da prea multe semnalizari false si nu gasim o metoda eficienta de a le reduce, vom utiliza ideea ta.
Functia e in meniul Editare >> OCR >> Verifica probleme majuscule.
Deocamdata e doar pentru testare nu de folosit in corectare - pina se constata ca merge bine. Eu am testat pe cateva texte si n-a facut probleme dar sunt de preferat mai multe testari...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am făcut download la ultima versiune şi am făcut doar o probă scurtă ca să văd cum funcţionează.
     Īn seara asta nu mai am foarte mult timp să mai fac probe, dar revin māine cu siguranţă.

     Ştiu că am o carte al cărei OCR conţine foarte multe majuscule interioare, dar īn acest moment nu ştiu sigur despre ce carte e vorba, dar pānă māine după amiază am să rulez mai multe OCR-uri.

     Am constatat o situaţie şi trebuie să mai discutăm...
     Īn cartea la care lucrez īn prezent, există un nume Trencavel. Īn OCR apare frecvent scris sub forma TrencaveL īn loc de Trencavel,; deci virgula după l, a făcut să fie recunoscut ca L mare.

     Īn acest moment nu există posibilitatea editării īn text ca la opţiunea "Ortografie...", şi niciuna dintre opţiuninile la dispoziţie nu-mi permite rezolvarea problemei.

     Dacă nu este foarte complicat de lucrat, mă gāndesc totuşi şi la o opţiune de īnlocuire automată doar a secvenţei "literă mică - MAJUSCULĂ - literă mică...
     Am putea face probe cu ambele opţiuni ca să vedem care este cea mai practică.

     Revin cu constatările aici sau pe privat.
     Toate cele bune!
     Seven


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Vad ca pe privat nu mai te vad...

Nu inteleg ceva la TrencaveL - nu poti sa apesi pe primul buton (Prima majuscula) ca sa ti-l faca Trencavel?


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am facut o functie complet automata ce inlocuieste grupurile [litera mica][majuscula][litera mica] cu [litera mica][litera mica][litera mica].
Acelasi link de descarcat.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Salutare, Cosmin!

     Am făcut download la varianta de azi şi am făcut şi probe.
     Funcţionează perfect la secvenţa: literă-MAJUSCULĂ-literă.

     Īntre timp m-am gāndit dacă nu ar exista posibilitatea să apară texte īn care să apară şi
         secvenţa: literă-MAJUSCULĂ-MAJUSCULĂ-literă
         sau chiar secvenţa: literă-MAJUSCULĂ-MAJUSCULĂ-MAJUSCULĂ-literă

      Am pregătit un fragment de text din Zevaco, care cuprinde următoarele situaţii:
            - o singură majusculă intercalată [deci, exact secvenţa propusă "literă-MAJUSCULĂ-literă"]
            - două majuscule consecutive;
            - trei majuscule consecutive.

      Majusculele īn interioarul cuvintelor sunt cazuri rare, dar cred că ar trebui extinsă opţiunea şi pentru 2 şi 3 majuscul consecutive. Nu cred că e cazul să luăm īn calcul 4 majuscule consecutive sau mai multe, dar 2 şi 3 ar putea să apară din cānd īn cānd.

      Textul pentru probe se află la adresa:


      Rog colegii de pe forum să participe la discuţii, pentru că sigur există şi alte situaţii, probleme şi puncte de vedere diferite decāt cele expuse de mine!

      Dacă avem posibilitatea să discutăm direct cu unul dintre autorii programului şi să propunem completarea AutoCorect cu opţiuni speciale pentru noi, atunci să facem acest lucru cāt mai bine posibil...
      Cu cāt vor fi mai mulţi useri participanţi la discuţii, cu atāt mai mult avem şansa să găsim propunerile cele mai bune, iar Cosmin să nu fie nevoit să revină asupra unei propuneri de mai multe ori.

      Toate cele bune!
      Seven


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cred ca ar fi mai usor sa fac o functie recursiva care sa mearga pentru orice numar de majuscule intre litere mici decat sa fac inca doua functii separate pentru 2 si 3 majuscule (in aceeasi functie de corectare vorbesc).
E bine asa sau ar putea apare probleme la numar mare de majuscule..?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Nu cred că ar putea să apară probleme cu un număr mare de majuscule.
     Dacă e mai simplu o singură funcţie care să meargă pentru orice număr de majuscule cuprinse īntre litere mici, atunci e bine să fie o singură funcţie.

     Problema apariţiei majusculelor e īntālnită īn special la cărţile vechi şi cu scanare de calitate mai slabă.
     De fapt problema poate să apară doar la cele amintite mai sus: C-c, O-o, P-p, S-s, Ş-s, U-u, V-v, Z-z; - şi mult mai rar la alte litere.
     Pot apărea grupuri şi de două majuscule dintre acestea şi poate chiar trei, dar nu īn număr foarte mare.

     Bucata de text pe care am urcat-o mai sus conţine un număr de majuscule exagerat de mare; nu ar putea exista un OCR cu atātea majuscule interioare, dar l-am făcut astfel īncāt să nu existe ceva mai dificil de atāt.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



A... si nu ar fi posibil sa se rada din text absolut toate chestiile de genul #$%^&*\?>| etc.?

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Răgăliile de genul #$%^&*\?>| pot fi doar răgălii pentru că Abbyy a găsit nişte puncte şi alte pete īn imagine şi le-a considerat caractere, dar...
     de multe ori aceste răgălii semnalează text care nu a fost corect recunoscut... adică e un semnal al lui Abbyy care s-ar putea traduce īn genul: "Şefu' vezi matale că pacilea lipseşte text... mai uită-te mata pe original şi treci la editat!"

     Din cauza asta părerile sunt īmpărţite īntre cei ce le "rad" complet şi cei ce le păstrează pānă la corectura manuală.

     De exemplu uneori $ poate fi un Ş-ş sau S-s, alteori ^ poate fi īn locul unui ī sau ā; de foarte multe ori / se află īn locul unui z.

     Deci?... personal nu ştiu cum e mai bine.. deocamdată le cam păstrez...


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Chestia asta o aplic doar in cazul ocr-urilor facute dupa un scan clar.
Alminteri poate aparea problema cu text lipsa, asa cum e la marginile de text ce sunt incetosate.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat corectarea problemelor cu majuscule pentru orice lungime a zonelor de majuscule.
Am modificat si functia de reparare text rupt sa fie automata.
La ambele am creat o singura fereastra de configurare din care se pot rula toate sau o parte. Meniul Editare >> Corectare automata dupa OCR
In aceasta fereastra se pot face imbunatatiri si se mai pot adauga si alte functii - daca mai sugereaza cineva...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



De ce ultima optiune e debifata ca default?

Eu am Win7 de ce nu imi apar diacriticele in fereastra?


Crezi ca ai putea ajunge la o intelegere in privinta unui dictionar general de inlocuiri?


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ultima e debifata deoarece sunt unele situatii in care paragrafele nu trebuie unite.
De exemplu:

Code:

a)text;
b)text;
c)text;

In aceste cazuri (intalnite de mine chiar si in beletristica), nu ar trebui activata.

In ce priveste diacriticele cred ca de vina era setarea componentelor de pe fereastra pe charset-ul implicit al Windows-ului, nu pe cel Est Europen. Am schimbat, vezi daca merge bine la tine:

Vorbesti de un dictionar de inlocuiri pentru Corectarile automate dupa OCR (de facut optiune cu bifa in fereastra) ?

PS: daca nici asa nu se vad diacriticele bine o sa le fac Unicode...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
La cererea lui Seven am implementat 2 noi optiuni la Inlocuire multipla: se poate seta ca sirul de caractere sa fie cautat la inceputul unui paragraf respectiv la sfarsitul unui paragraf.
Descarcati versiunea noua de aici:

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Mulţumim, Cosmin!

      Opţiunile noi de la "īnlocuiri multiple", ca şi celelalte implementate īn ultimul timp sunt foarte utile.

      Cred că la momentul ăsta e timpul să fie explicate ceva mai īn detaliu toate īmbunătăţirile ce au apărut pe īn ultima perioadă.
      Pentru că am făcut textări cu fiecare din variantele noi de AutoCorect, īncerc să mă ocup eu de treaba asta.
       Voi īncerca să reiau fiecare nouă opţiune mai detaliat, adăugānd şi imagini din AutoCorect, pentru a īnţelege toţi userii despre cum se pot accesa şi cum funcţionează aceste noi opţiuni.

      Avāndu-te alături, sigur vei interveni dacă, eventual vreo opţiune nu am īnţeles-o īn mod corect sau nu vpi reda toate posibilităţile.

      Seven

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

      De ce să folosim AutoCorect?



     Răspunsul ar putea fi simplu: pentru că este folositor, chiar foarte folositor.
     Cu toate acestea, nu mă voi limita la un răspuns simplu.

     Vreau să subliniez īncă o dată:
     AutoCorect, alte editoare de text şi corectoare ori diferitele template [indiferent cāt de complexe şi perfecţionate ar fi] nu fac altceva decāt să īmbunătăţească şi să pregătească textul īnainte de corectarea manuală.

     Toate aceste editoarele, corectoarele, template, macrocomenzi şi orice alte minuni cibernetice vor fi inventate, indiferent cāt de mult vor fi perfecţionate, nu vor reuşi īn viitorul apropiat să īnlocuiască corectura manuală, pentru faptul că a face corectură manuală, īnseamnă a trăi, a respira, a simţi povestea cărţii pe care o corectezi; corectura manuală se face cu răspundere, dar din plăcere şi cu pasiune; altfel rezultatele vor fi departe de aşteptări.
     Corectānd manual simţi că o frază, o propoziţie sau un cuvānt e „de acolo”, ori dimpotrivă simţi că el „glodeşte, īnţeapă, stă-n ochi, zgārie” şi că nu e nimerit īn text.
     Doar cititorul poate alege īntre forme ale verbelor „a vrea”, „a voi” sau ale hibridului „a vroi”. Indiferent cāt de mult vom dori să eliminăm forma incorect㠄vroiam”, vor exista multe situaţii īn care acesta va trebui să rămānă, pentru că aşa a voit autorul ca personajul lui să vroiască ceva.

     Deci, toate aceste editoare şi corectoare au rolul de a pregăti textul pentru corectura manuală.
     Mai mult decāt atāt, corecturile automate şi semiautomate se fac numai şi numai īnainte de corectura manuală prin citire cap-coadă a textului şi, sub nicio formă după aceasta. După corectura manuală se mai pot face doar cāteva īnlocuiri automate, care ţin de formatare şi nu de corectarea textului.

     Pe de altă parte este ineficient, greoi, enervant şi obositor să corectezi un text OCR brut, rezultat din scanarea nu foarte bună sau, de-a dreptul de proastă calitate a unei cărţi vechi şi să te chinui să corectezi sau să ştergi toate răgăliile, erorile şi alte kirilicisme pe care Abbyy sau alt program de tip recognito le lasă īn text.

     A corecta manual un OCR brut, neprelucrat, seamănă cu a pleca la plimbare cu maşina, dar nu la volan, ci īmpingānd-o cu forţa braţelor. Poate părea exagerat, dar comparaţia are tālcul şi adevărul său. Se poate ajunge īn acelaşi loc şi la volan şi īmpingānd maşina, respectiv şi corectānd un text prelucrat şi unul brut, dar timpul consumat, gradul de oboseală sau relaxare, plăcerea, satisfacţia… vor fi totdeauna diferite.

     E păcat să nu beneficiem de ajutoarele pe care le avem la dispoziţie! Iar AutoCorect este unul dintre ele.

     E posibil ca unii dintre noi să nu fie tentaţi să folosească opţiunile AutoCorect pentru simplu fapt că nu ştiu foarte bine ce oferă acest program.

     Iată de ce cred că ar fi bine să revedem cāteva dintre opţiunile pe care ni le oferă acest program.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

        Conversie text clasic īn text contemporan


   
     JUSTIFICARE:
     Există cărţi tipărite īn text clasic [cu ī īn interiorul cuvintelor şi formele verbului a fi: sīnt, sīntem, sīnteţi] şi cărţi tipărite īn text contemporan [cu ā īn interiorul cuvintelor şi formele verbului a fi: sunt, suntem, sunteţi].

     Părerile sunt īmpărţite īn legătură cu faptul că o carte tipărită īn text clasic, trebuie sau nu digitalizată īn text contemporan sau păstrat textul clasic, ca īn original.
     Indiferent de părerea īn legătură cu varianta textului final, personal consider că pe timpul corecturii este mai uşor de lucrat cu text contemporan, pentru că există mai multe editoare care au sau cărora li se pot implementa corectoare de text contemporan şi mai puţine cele ce au şi versiuni de corectoare şi pentru text clasic.

     Pe de altă parte este foarte uşor de trecut din text contemporan īn text clasic, aceasta realizāndu-se cu doar 5 īnlocuiri: ā–>ī , Ā–>Ī, sunt–>sīnt, suntem–>sīntem, sunteţi–>sunteţi, conversie ce poate fu făcut de orice utilizator, īntr-un timp foarte scurt.
     Conversia de la text clasic la text contemporan este mult mai dificilă, deoarece nu se face pur şi simplu o īnlocuire a lui ī cu ā, ci conversia este mult mai complexă, fiindcă se păstrează scrierea cu ī pentru prima literă şi ultima literă a unui cuvānt şi, īn plus, există o mulţime de cuvinte compuse īn care al doilea cuvānt component īncepe cu litera ī, fapt pentru care se păstrează scrierea cu ī, chiar dacă poziţia acestui ī este īn interiorul cuvāntului.

     AutoCorect poate realiza conversia textului clasic īn text contemporan īn mod automat şi īntr-un timp record.
     Menţionez că pe timpul rulării opţiunii nu se face şi corectarea ortografică a cuvintelor, nu se rulează dicţionare, ci pur şi simplu se desfăşoară doar o conversie a celor trei forme ale verbului a fi şi trecerea lui ī interior īn ā, conform regulilor stabilite de Hotărārea Academiei Romāne din 17.02.1993.
     Rezultă, deci că eventualele cuvinte scrise greşit intenţionat [limbaj īn forme populare, arhaice, regionale, de jargon ori argou etc. etc.], vor fi păstrate īn forma lor originală dar cu ā īn interiorul cuvintelor īn loc de ī.

     Pe forum o parte dintre noi am realizat această conversie cu ajutorul a 3 dicţionare de tip „Īnlocuiri multiple”. S-a procedat astfel, pentru că la versiunile mai vechi de AutoCorect nu exista opţiunea directă.

     Varianta opţiunii „Editare –> Conversie text clasic īn text contemporan” este mult mai rapidă decāt varianta rulării dicţionarelor de tip „Īnlocuiri multiple” şi are un īnalt grad de corectitudine, deoarece se bazează pe existenţa unui dicţionar mai complex de cuvinte compuse de genul: bineīnţeles, reīntoarcere, neīncepere, nemaiīntālnit etc. etc. [vezi exemplele de prefixe la cuvintele care īncep cu ī, postate de Cosmin īn pagina 1 a topicului].


     ACCESAREA OPŢIUNII „Conversie text clasic īn text contemporan”

     Din meniul principal al programului se deschide submeniul Editare.
     Īn zona inferioară a submeniului există opţiunea „Conversie text clasic īn text contemporan”, ca īn imaginea de mai jos:



     La accesarea opţiunii apare fereastra explicativă şi de atenţionare următoare:



     Īn fereastra de atenţionare, acţionăm butonul „OK” şi din acest moment īncepe conversia.
     Fereastra de atenţionare se īnchide automat după accesarea butonului „OK”, programul revenind la fereastra principală.
     Īn bara de stare [situată īn partea de jos a ferestrei programului AutoCorect] se arată īn mod grafic şi numeric procentul de convertire a textului. Cānd conversia este terminată īn bara de stare apare afişat 100%, fără apariţia altor ferestre de informare, aşa cum există la īnlocuiri.
     Īn acest moment conversia este terminată; ea este realizată complet.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Multumesc pentru detalii 

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

        Corectarea majusculelor eronate aflate īn interiorul cuvintelor scrise cu minuscule



     JUSTIFICARE:

     Există cāteva litere care au aceeaşi formă atāt ca majuscule cāt şi ca minuscule; le diferenţiază doar mărimea, iar Abbyy face adesea confuzii.
     Este vorba despre: C-c, O-o, P-p, S-s, Ş-s, U-u, V-v, W-w, Z-z dar uneori şi despre F-f, I-i, J-j, K-k .
     Datorită formei identice sau aproape identice a literelor, apar cuvinte īn care unele din aceste litere sunt scrise cu majuscule īn interiorul cuvāntului.
     Īn funcţie de calitatea scanării, a tipurilor de font folosit la tipărirea cărţilor, de gradul de acomodare şi antrenament al Abbyy cu tipul caracterelor cărţii, pot apărea uneori cuvinte scrise astfel: mUlte, dUce, vădUVă, aCeeaŞi, aZUr, maJusCUle, minUSCUle, claSic…

     Dacă literele folosite la tipărirea cărţii pe hārtie sunt sans serif [fără rotunjiri, adică drepte – aşa cum ar fi Arial] erorile generale ale Abbyy sunt mai puţine; dacă literele tipărite sunt serif [adică rotunjite, cu elemente artistice – cum ar fi Bookman Old Style, cele de tip „Old” etc.], aceste erori, precum şi altele de alt tip pot fi cu frecvenţă mai mare.
     
     Din motivele descrise mai sus, apare necesitatea corectării majusculelor scrise īn mod eronat īn interiorul cuvintelor.


     ACCESAREA OPŢIUNII

     Din meniul principal se accesează submeniul „Editare”.
     Īn partea de jos a submeniului există opţiunea „Corectare automată după OCR” – ca īn partea stāngă a imaginii de mai jos.



     După accesarea acestei opţiuni, apare fereastra denumit㠄Corectarea automată după OCR”, fereastră redată īn partea dreaptă a imaginii.
      După cum se poate constata, această opţiune este una complexă, dar o vom analiza pe secţiuni.
     Menţionez că marcarea cu careuri de culoare orange s-a făcut de subsemnatul pe imagine pentru a fi mai uşor de observat anumite detalii.
     
     Īn această fereastră se poate marca prima opţiunea [cea īncadrată īn orange] şi apoi se apasă butonul „Rulează”

     Īn timpul rulării opţiunii, īn bara de stare a ferestrei principale AutoCorect, este afişat grafic şi numeric procesul de corectare.
     După terminarea executării īnlocuirilor, se afişează fereastra informativă de mai jos:




     Să prezentăm un exemplu de text corectat cu această opţiune:

     Īn imaginile următoare avem un fragment de text aşa cum apare el īnainte şi după rularea opţiunii „Schimbă grupurile de majuscule īn litere mici atunci cānd sunt īncadrate de litere mici”.






     Se constată următoarele două aspecte:
          — cuvintele scrise cu toate literele majuscule [all caps] – cuvintele pe fundal verde – nu au fost modificate; e cazul numelui de capitol şi a primelor două cuvinte din capitol;
          — cuvintele scrise cu litere obişnuite [minuscule, litere de rānd] īn care apar īn mod eronat majuscule – cuvintele pe fundal galben – au fost corectate īn totalitate.

          Menţionez că am propus lui Cosmin ca această opţiune să nu corecteze litera majusculă finală ca īn cazurile: copiluL IoneL minunatL
– deoarece aceste cuvinte ar putea fi „corectate” īn mod eronat ca fiind: copilul Ionel minunatl deşi, īn realitate ele apar ca fiind: copilul… Ionel… minunat!...
     Şi astfel de exemple pot continua.
     Sper că informaţiile sunt suficiente şi nu foarte-foarte plictisitoare.   

Modificat de Seven (acum 13 ani)

_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

        Repararea rāndurilor rupte

   

     JUSTIFICARE:

     Există situaţii īn care īntr-un text, un paragraf [sau mai multe paragrafe, uneori īntregul text] apare īn mod eronat cu rāndurile „rupte”.
     Este situaţia pe care a prezentat-o @lastiz pe topicul Formatarea minima a unui text – pag.9.



     Paragraful corect apare divizat īn mai multe paragrafe, pe care īn această explicaţie le vom numi „paragrafe false”.

     Motivele acestor erori pot fi următoarele:
          — Īn setările Abbyy este activată opţiunea: Options –> 3.Save –> Text settings –> Keep line breaks. [Acest aspect l-am arătat detaliat īn topicul amintit mai sus];
          — Dacă textul este transferat īn Word prin metoda Copy & Paste dintr-un pdf; īn acest caz rāndurile pot apărea exact ca īn pdf, dar fiecare rānd este interpretat de Word ca fiind un paragraf;
          — Dacă textul este transferat īn Word prin metoda Copy & Paste dintr-o pagină Web; situaţia este similară cu cea de mai sus.
     Probabil că există şi alte situaţii, pe care nu le-am īntālnit ori le-am omis īn acest moment.
     Cert este că pe net [subliniez: pe net, mai puţin pe acest forum] există foarte multe cărţi care prezintă astfel de erori.

     Indiferent de cauza acestor erori, se pune problema reparării situaţiei, adică a unirii „paragrafelor false” īn paragraful corect.

      Rezolvarea īn mod automat a acestei situaţii nu este de loc simplă, deoarece apar foarte multe tipuri de structură a rāndurilor rupte, astfel: rāndul rupt sau „paragraful fals” se poate sfārşi īn literă mică, literă mică urmată de liniuţă, spaţiu liniuţă, literă mică urmată de virgulă, literă mică urmată de punct şi virgulă… etc. etc.
     Paragraful fals următor, cel cu care se face unirea/lipirea, trebuie īn mod obligatoriu să īnceapă numai cu literă mică.

      De foarte multe ori am constatat c㠄paragraful fals” se poate termina cu spaţiu, astfel: literă mică urmată de spaţiu, cratimă urmată de spaţiu, virgulă urmată de spaţiu sau punct şi virgulă urmată de spaţiu. Aceste din urmă situaţii nu sunt īncă implementate īn opţiunea AutoCorect şi ele trebuie supuse discuţiilor pe forum.
      Voi reveni cu această problemă la sfārşitul postării.
     

     ACCESAREA OPŢIUNII

     Primii paşi sunt identici cu cei de la opţiunea „Schimbă grupurile de majuscule īn litere mici atunci cānd sunt īncadrate de litere mici”.

     Deci, din meniul principal se accesează submeniul „Editare”.
     Īn partea de jos a submeniului există opţiunea „Corectare automată după OCR” – ca īn partea stāngă a imaginii de mai jos.



     După accesarea acestei opţiuni, apare fereastra denumit㠄Corectarea automată după OCR”, fereastră redată īn partea dreaptă a imaginii.

     Īn fereastra „Corectarea automată după OCR”, cea de-a doua opţiune este cea care rezolvă problema rāndurilor rupte şi se numeşte „Uneşte textul rupt īn următoarele situaţii:”. Īn acest moment, opţiunea are 5 subopţiuni aşa cum apare īn imagine.

     Se impune o paranteză īn legătură cu subopţiunea nr. 5, [punct şi virgulă][sfārşit de paragraf][literă mică].
     Īn cărţi de specialitate, dar uneori – e drept, foarte rar – şi īn cărţile de beletristică există paragrafe reale şi corecte care se termină īn punct şi virgulă şi īncep cu literă mică.
     E vorba de enumerări, clasificări, exemplificări şi alte situaţii.
     La fel de adevărat este că acestea īncep īn multe cazuri cu liniuţă urmată de literă mică, dar de foarte multe ori liniuţa nu este caracter liniuţă, ci un bullet de diferite forme; asta īnseamnă că primul caracter text este tot litera mică.
     Īnceputurile de paragraf pot fi şi de tipul: a) text… b) text… c) text… sau a-text…, b-text…, c-text… etc., deci primul caracter din paragraf este din nou, tot o literă mică.

     Din acest motiv se impune să acordăm o mai mare atenţie activării acestei subopţiuni şi numai după ce am vizualizat cāt de cāt textul de corectat ca să constatăm dacă există astfel de paragrafe, de tipul [punct şi virgulă][sfārşit de paragraf][literă mică] care sunt paragrafe reale şi corecte şi care nu trebuie unite…
     Īn beletristică situaţiile de mai sus sunt rare şi se poate activa opţiunea cu mai mare uşurinţă. Dacă vor exista paragrafe corecte care īncep cu literă mică şi s-a făcut unirea lor, acestea vor putea fi recorectate şi aduse la structura reală cu ocazia corecturii manuale prin citire cap-coadă.

     După activarea subopţiunilor pe care le considerăm valabile pentru textul de corectat, se apasă pe butonul „Ruleaz㔠şi programul īncepe corectarea erorilor.

     Aşa cum am arătat īn postarea anterioară, īn timpul rulării opţiunii, īn bara de stare a ferestrei principale AutoCorect, este afişat grafic şi numeric procesul de corectare.
     După terminarea executării īnlocuirilor, se afişează fereastra informativă.


     Să prezentăm din nou un exemplu de text corectat cu această opţiune:

     Īn următoarele trei imagini, este afişat un fragment de text aşa cum apare el īnainte şi după rularea opţiunii „Repararea rāndurilor rupte”.







     Am marcat cu fond bleu īnceputurile de paragraf [deşi era mai corect sfārşiturile de paragraf – dar am realizat acest lucru după urcarea imaginilor pe host] care se īncadrează īn condiţiile arătate la primele 4 subopţiuni, şi cu fond verde varianta prevăzută la subopţiunea 5.

     Prima imagine prezintă textul īnainte de repararea rāndurilor rupte;
     A doua imagine prezintă textul după reparare, avānd active doar primele 4 subopţiuni;
     A treia imagine prezintă acelaşi text după reparare, avānd active toate cele 5 subopţiuni. Fiind vorba de beletristică, īn acest caz este corectă activarea subopţiunii nr. 5.


      DEZBATERE: Pentru că postarea este deja foarte lungă, voi pune subiectul dezbaterii īntr-o altă postare.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Astept lamuriri cu optiunea nebifata

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Menssana, sper că acum nu mai sunt nelămuriri de clarificat, pentru că am completat postarea de mai sus.

Aşa cum am arătat mai sus continui cu subiectul dezbaterii.

      DEZBATERE:

      Am arătat mai sus că eu personal am constatat că există şi situaţii, īn care „paragraful fals” se poate termina cu spaţiu, astfel: literă mică urmată de spaţiu, cratimă urmată de spaţiu, virgulă urmată de spaţiu sau punct şi virgulă urmată de spaţiu.
      Reamintesc că aceste situaţii nu sunt īncă implementate īn opţiunea AutoCorect şi ele trebuie supuse discuţiilor pe forum.

      Problema se pune astfel:
       [1] Există cu adevărat aceste situaţii şi [2] este necesară implementarea lor?
       [3] Dacă se impune implementarea īn AutoCorect, atunci la ce mod trebuie organizate subopţiunile? Adăugānd īn fereastra „Corectarea automată după OCR” īncă 4 subopţiuni sau cumulānd la fiecare subopţiune atāt situaţia cu spaţiu cāt şi cea fără spaţiu?

      Trebuie reamintit că deşi mai multe subopţiuni īncarcă fereastra „Corectarea automată după OCR”, ceea ce este un dezavantaj, avantajul mai multor subopţiuni este acela că fiecare utilizator are posibilitatea să activeze doar pe acelea pe care le consideră ca fiind sigure.


      Cosmin Ciupercă lipseşte cāteva zile, dar am purtat discuţii despre acest aspect.
      Cosmin, prin bunăvoinţa de care a dat deja dovadă mai mult decāt suficient, este dispus la implementarea acestor situaţii, īn oricare dintre variante, doar că aceasta depinde de părerea noastră, de varianta pe care o alegem noi.

      Pe de altă parte, vreau să menţionez că sunt dispus īn continuare să particip la discuţii, să vin cu propuneri, păreri pro sau contra altor aspecte ce privesc AutoCorect, dar nu mai doresc să-mi asum răspunderea de a hotărī implementarea sau nu, ori modificarea de opţiuni.
      Urmărind postările de pe acest topic, se poate trage concluzia falsă că programul AutoCorect nu prezintă interes pentru useri şi că doar doi useri sunt interesaţi de acest program. Eu cred că există mult mai mult interes, deoarece am urmărit numărul de downloaduri ale versiunilor de Autocorect cu dicţionare urcate de mine pe forum şi acest număr de downloaduri este respectabil.
      Cosmin, īnsă, nu are de unde să ştie acest lucru. El a intrat sau a fost adus pe acest forum cu intenţia şi dorinţa de a ne ajuta īn ceea ce dorim să facem. Neparticiparea la discuţii poate fi interpretat ca o lipsă de interes, deşi pentru unii ar putea fi doar un semn de respect, vezi Doamne, acela de a nu deranja cu păreri care poate nu sunt tocmai bune.
      Nu, nu există respect prin abţinere de la discuţii deschise tuturor. Este ca şi cānd invităm pe cineva la noi acasă şi apoi ne facem că nu vedem că a venit.

      Īmi cer iertare, dacă am adus atingere cuiva.
      Toate ce bune!
      Seven   


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 14 ani
--->

    Faptul că sunt puţini useri care să-şi dea cu părerea este firesc, deoarece hobby-ul acesta tinde să devină ceva profesional, este ceva de nişă... pare ceva elitist [īn sensul bun al cuvāntului]. Sunt multe informaţiile care trebuiesc acumulate: scanare; apoi prelucrare imagini: crop, split, īndreptare imagini etc.; OCR; prelucrare imagini pentru realizare pdf-imagini: redimensionare, optimizare etc.; prelucrare OCR prin template şi AutoCorect etc.; corectare prin citire cap-coadă şi mai sunt şi altele.

    Toate aceste lucruri necesită cunoştinţe destul de avansate pentru Word şi pentru celelalte programe folosite: Abbyy, editoare pentru prelucrare imagini AcdSee şi altele, Adobe Acrobat, ScanTailor sau Scan-kromsator, AutoCorect, programele pentru realizarea formatului DJVU..., convertirea cu Calibre... mai sunt şi altele cu siguranţă.

    Uneori mă sperii şi eu de cāte trebuie să ţin minte, deşi cu corectatul am lăsat-o mai moale.

    Şi Aleph a realizat un ghid privitor la corectarea pānă la v1.0, unde sunt o grămadă de informaţii folositoare īn acel ghid, mult mai multe decāt par la prima vedere.

    Aceste lucruri sperie userii noi care se văd puşi īn situaţia de a corecta la nivelul superior pe care unii dintre userii vechi o fac de ceva timp. Dacă dau şi de o carte veche să o corecteze... e ca şi cum ai pune un mānz la arat.
   
    Ştacheta se ridică mereu, necesită din ce īn ce mai mult timp şi atenţie īn corectare. Avānd atāt de multe informaţii privind realizarea e-book-urilor deja se creionează, pot spune, meseria benevolă de realizator de e-book-uri, fără alt beneficiu decāt de a da cāte ceva īnapoi celor de la care ai luat o carte sau mai multe cărţi.

    Nu vreau să fiu īnţeles greşit, orice informaţie este binevenită, mai ales dacă este prezentată scurt şi pe īnţelesul tuturor. De altfel cred că pe acest forum sunt cele mai multe informaţii privind realizarea de e-book-uri din Romānia.
   
    Chiar aş fi curios să aflu dacă alte ţări au asemenea forumuri privind digitalizarea cărţilor şi dacă cei de acolo folosesc multitudinea astea de programe pentru realizarea cărţilor electronice.


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         Īn inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
idbmax
VETERAN

Inregistrat: acum 14 ani
Salutare, natiune si multumim Cosmin!

Eu personal nu folosesc in mod expres Autocorectul , dar am urmarit cu interes evolutia "directionata RI" din aceasta perioada. Incepe sa devina un instrument util hobbyului asta legat de cartile electronice.E bine ca cei care utilizeaza frecvent programul, sa isi spuna parerea si sa sesizeze problemele intilnite, mai ales ca probabil e printre putinele softuri lucrate special pentru o munca de voluntariat ca a noastra. Asa sansa mai rarut gasesti.
Toate cele bune!

Idbmax


_______________________________________
"de GUSTIBUS et COLORIBUS non disputandum"
(Seneca)
Contributia mea pe forum:
Colectia O Altfel de E-Carte
Colectia Aleksandr Romanovici Beleaev
FOILETON-TRACIA MAGAZIN - O revista virtuala
Colectia Romane  de Aventuri si Istorice - romanesti
Wild, Wild, West - Colectie western
Colectia CALATORI PRIN TIMP

O altfel de E-Carte - BLOG

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Scuze ca nu am mai participat la discutie in ultimele zile dar am fost plecat din oras cu treaba si doar ocazional (10..20 min pe zi) am mai reusit sa intru pe internet (de pe calculatorul altora).
Multumesc Seven pentru prezentari.
Cu placere idbmax.
Ma bucur ca participa acum mai multi la discutie.
Menssana, la intrebarea ta cu privire la suboptiunea nebifata am raspuns acu 3 postari cred.


Ultima e debifata deoarece sunt unele situatii in care paragrafele nu trebuie unite.
De exemplu:

Code:

a)text;
b)text;
c)text;

In aceste cazuri (intalnite de mine chiar si in beletristica), nu ar trebui activata.


Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Salutări tuturor!

      Am primit mai multe mesaje pe mail, MP şi mess din care rezultă că sunt mult mai mulţi cei ce urmăresc discuţiile de pe acest topic şi din care rezultă că nu am fost foarte corect īn finalul comentariului precedent.
      Da, aveţi dreptate atāt cei ce aţi postat pe topic cāt şi cei din mesajele personale şi vă mulţumesc tuturor.
   

      Īntre timp, am continuat să fac cāteva testări īn legătură cu problema RĀNDURILOR RUPTE.
      Am testat, īn principal, texte copiate din pdf-uri şi pagini Web.

            ■ text copiat direct cu Copy & Paste din pdf-uri [mă refer, bineīnţeles la pdf rezultate din text].
      Am copiat fragmente de text din pdf şi le-am lipit īn Word, WordPad şi Notepad.
      Īn toate editoarele textul rezultat avea rāndurile rupte şi fiecare rānd se termina cu spaţiu.
      Practic, prin acest procedeu se face un fel de reproducere exactă a imaginii din pdf, nemaipăstrāndu-se direfitele coduri specifice editoarelor.
      Este cunoscut faptul că pentru convertirea din pdf īn doc, există o serie de programe specializate īn acest sens; există totuşi situaţii cānd se procedează aşa cum am arătat aici, prin procedeul Copy & Paste.

            ■ text copiat din pagini web şi lipit īn fişiere .txt, .rtf şi .doc – direct cu Copy & Paste.
      Rezultatele sunt identice cu cele de la copierea din pdf.


      Concluzia personală:
             [1] Există cu adevărat situaţii īn care rāndurile rupte se termină cu spaţiu;
             [2] Este necesară implementarea acestor situaţii īn AutoCorect;
             [3] La acest moment īnclin spre varianta adăugării de submeniuri la cele 5 deja existente. Īn funcţie de discuţii, voi mai reveni īn legătură cu aceast aspect.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Īn legătură cu structura meniului...
      Mă gāndeam, dacă nu ar fi mai potrivit ca opţiunea "Corectare automată după OCR" din "Editare" să cuprindă o ramură de subopţiuni.

      Adică, la deschiderea opţiunii "Corectare automată după OCR" să se deschidă mai multe subopţiuni:
      Pun mai jos o imagine doar cu scop explicativ. Numele opţiunilor [subopţiunilor] sunt puse doar cu rol de exemplu



      M-am gāndit că e mai rapid şi mai uşor de rulat opţiunile īn modul cumulat, īn care funcţionează ele īn prezent, dar la o carte de cāteva sute de pagini rularea opţiunilor īn mod cumulat ar putea deveni greoie.

      Ataşānd mai multe ramuri opţiunii "Corectare automată după OCR", deşi sunt necesare mai multe comenzi, luīnd īn calcul timpul total necesar pentru rularea opţiunilor, nu cred că vor fi diferenţe foarte mari.

      Pe de altă parte, lăsānd fereastra "Corectare automată după OCR" īn forma actuală, la care se vor adăuga noi propuneri de opţiuni, ar putea deveni cam stufoasă şi dificilă pentru cei mai puţin experimentaţi.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Seven aveam acelasi raspuns si de la Cosmin, dar nu am intalnit niciodata situatia asta. Mi se pare o intrerupere fortata a randului prin folosirea de punct si virgula.

Este posibil ca cei care se rezuma la simpla urmarire a topicului, sa fie, mai mult sau mai putin, in situatia mea, adica sa nu se considere suficient de profesionisti ca sa ia asemenea decizii. Eu am cerut cateva chestii care stiu ca mi-ar usura mie munca, dar nah.... de aici incolo sunt un pic depasit.

Dar... daca Cosmin are suficient timp si energie si doreste sa mearga cu proiectul asta inainte... pai ar cam avea cu ce.
Exista un ditamai ghidul RIF, exista un template si poate chiar un pic de colaborare din partea celui care l-au realizat. Si daca nu gresesc, munca la template s-a sistat de ceva timp.
Acum dupa ce a fost folosit de atatea persoane si dupa atata timp, se poate spune daca e setul de unelte e complet sau nu, si s-ar putea integra noile cerinte in Autocorect.
Deci daca scopul e realizarea unei versiuni de Autocorect dedicata lucrului cu ocr-ul, atunci resurse ar fi, timp si chef sa fie in rest.

Si eu ma asteptam  sa fie un pic mai mult feedback la aparitia lui Cosmin pe forum, dar nah...
Cele 3 persoane (Seven, BlankCd si Idbmax... poate si Aleph ) cred ca au suficient de multa experienta pentru a-l ghida pe Cosmin sau pentru a-l atentiona in anumite probleme.

Seven, in privinta structurii ferestrei... atata vreme cat optiunile respective sunt relativ generale... nu prea conteaza cum e aranjata.
Iar incepatorii, si e destul de sigura chestia asta, nu prea o sa se uite ei pe text mai niciodata daca ei considera ca asta e corectura automata.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
O alternativa la meniuri ar fi si o fereastra cu taburi (cum e cea de la Configurare).

PS: personal eu as prefera sa fac cu meniuri (ca e mai usor de facut in cod) dar am prezentat inca o sugestie ca sa discutati si sa alegeti alternativa care e mai buna pentru voi.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     menssana,
     Ai dreptate şi tu şi Blank şi idb: la acest moment există multă informaţie despre digitalizare aici pe forum, cāt şi pe net. Eu am rămas puţin cu imaginea veche de acum doi ani cānd cotrobăiam īnebunit pe net după o cāt de mică informaţie. Suntem mulţi pe forum care am descoperit muncind şi greşind reguli pe care īntre timp le-am explicat pe forum.
     Pe de altă parte, nu sunt adeptul folosirii unui singur tip de corector, editor, template etc.
     O anume corectare semiautomată se realizează perfect cu un template şi mai greu cu altceva, alte corecturi merg perfect cu AutoCorect, altele trebuiesc realizate īn Word cu confirmare situaţie cu situaţie...
    De aceea cred că pregătirea textului pentru corectura manuală este bine să se facă cu mai multe unelte, unele fiind mai bune decāt altele īntr-o anume etapă.


     Revenind concret la opţiunile AutoCorect
     Da, situaţia ca un rānd rupt să fie chiar īn situaţia īn care se termină cu punct şi virgulă este destul de rară.

     Am insistat şi pe prinderea acestei situaţii īn opţiune [există posibilitatea să fie activată sau nu - deci fiecare face procedează cum crede de cuviinţă, īn funcţie de cartea la care lucrează], deoarece īncă lucrez la cartea "Michel ZÉVACO - Eroina", unde punctul şi virgula sunt folosite īn exces. Sunt fraze după fraze care īncep cu literă mic şi se termină cu punct şi virgulă şi fac parte din acelaşi paragraf.


     Acum,
     Am testat ultima versiune de AutoCorect care cuprinde 10 subopţiuni la "Repararea rāndurilor rupt", una care īncă nu e pusă pe forum.


     Teste şi constatări:
     Am copiat circa 20 de pagini dintr-un pdf realizat la cartea Vraciul pe care am corectat-o pentru [V2.0] şi am transferat textul īn Word. Subliniet că am folosit īnainte de realizarea pdf şi opţiunea de despărţire automată la capăt de rānd, astfel că īn pdf apar circa 5 situaţii de acest gen pe pagină.

     După copierea din pdf īn document Word nou, toate rāndurile apăreau cu spaţii la sfārşit de rānd. Am salvat documentul īn format rtf, l-am īncărcat īn AutoCorect  şi am rulat opţiune ade reparare a rāndurilor rupte.


     Constatare:
     Cu noile opţiuni din varianta de azi, s-au reparat toate rāndurile cu o excepţie.
     Am avut situaţii īn care erau rānduri rupte, dar noul rānd īncepea cu un nume de persoană, care erau scrise cu literă mare.
     Părerea mea personală, ţinānd cont de experienţa rezultată din realizarea unui număr relativ mărişor de OCR, este că această situaţie nu trebuie prinsă īn opţiunea AutoCorect.

     Mai īntāi, apariţia rāndurilor rupte direct din OCR este accidentală, ea poate fi evitată, dar nu īn totalitate, iar excepţiile care rămān se īncadrează perfect īn una din situaţiile deja implementate īn AutoCoret.
     Īn al doilea rānd, la realizarea OCR poate apărea situaţia īn care un punct la sfārşit de paragraf să nu fie recunoscut. Se poate īntāmpla frecvent asta cānd tiparul este mai şters, cartea e mai veche şi unele puncte sunt tipărite mai şters sau prea puţin vizibile. [Am īntālnit cărţi īn care punctele aveau 3-4 mărimi - ceva aşa de la punctoi la punctişor.]
     Pentru a evita unirea unor paragrafe reale, dar cărora le poate lipsi ultimul sau ultimile două-trei caractere, este foarte bine să nu se facă unirea rāndurilor rupte īn cazul īn care un rānd nou īncepe cu literă mare.

     Am menţionat toate acestea, mai puţin pentru Cosmin şi, īn primul rānd pentru useri, ca aceştia să ştie că opţiunea nu rezolvă, dar nici nu trebuie să rezolve absolut toate situaţiile care pot apărea īn practică.
     Este important ca un program să rezolve cāt mai multe situaţii reale [indiferent la ce se referă aceste situaţii], dar să nu "corecteze" īn mod eronat şi situaţii care nu ar trebui rezolvate.
     Sper să fi fost suficient de explicit.


     O a doua constatare
     Am subliniat că au existat cuvinte despărţite la capăt de rānd. Ele s-au īncadrat la la subopţiunea [literă mică,liniuţă, spaţiu][sfārşit de paragraf][literă mică], adică subopţiunea 7 din versiunea de azi a AutoCorect.

      La unirea rāndurilor a apărut situaţia īn care cuvāntul "nevinovat" care fusese despărţit la capăr de rānd īn [nevino-] şi pe rāndul următor [vat], a apărut după repararea rāndurilor rupte, undeva la mijlocul rāndului, scis sub forma [nevino- vat], deci cu cratimă şi spaţiu după cratimă.

      Părerea mea este că aceste situaţii trebuie să rămānă exact aşa după rularea opţiunii AutoCorect şi apoi se pot īnlocui automat sau prin confirmare situaţie cu situaţie īn Word sau īn AutoCorect.
      De ce să rămānă aşa?
      Pentru că de cele mai multe ori Abbyy nu face diferenţa īntre cratima clasică, liniuţa de despărţire a cuvintelor la capăt de rānd, liniuţa explicativă şi alte linii şi liniuţe, făcānd frecvent confuzii şi recunoscāndu-le de cele mai multe ori pe toate ca fiind cratimă.
     
      Deci, ca o concluzie finală, personal sunt foarte mulţumit de opţiunea reparării rāndurilor rupte īn varianta care este ea prezentă īn versiunea AutoCorect 2011.09.08 şi cred că nu mai trebuie revizuită īn niciun fel, ci să rămānă ca variantă finală a acestei opţiuni.

      Seven         


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Uite si exe:
N-am modificat inca pe meniuri sau fereastra cu taburi, astept sa se ajunga la un consens.


pus acum 13 ani
   
menssana1984
Vizitator



Seven, sunt complet de acord cu tine.
Nu cred ca as fi reusit sa prezint situatia asa, dar sunt de acord cu tine. Si eu si putina experienta pe care o am legata de ocr-uri.

Cosmin, daca e mai simplu sa implementezi optiunile in stilul meniu, fa-o asa.
Important e sa stabilesti ce anume este sau va fi functional dintre toate lucrurile ce s-au discutat sau se vor discuta aici. Chestiile ce tin de imagine pot fi rezolvate si mai tarziu.

Seven, i-am propus lui Cosmin sa imparta Autocorectul in 2 executabile diferite,
Autocorectul normal si Autocorectul de tip RI, care sa contina doar acele optiuni.
Propun lucrul acesta pentru a mai decongestiona fereastra un pic.
Dar asta e decizia lui Cosmin, el stie cat e sau nu de dificil.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      M-am gāndit şi eu cu ceva timp īn urmă la două executabile diferite şi am propus asta lui Cosmin.
      Pe undeva cred că eram un pic ofticărit pe ruşii care au făcut Scan-Tailor, Scan-Kromasor şi alte alea şi, mă gāndeam că e bine să avem şi noi un soft special pentru digitalizare.
      Īntre timp m-am răzgāndit şi nu mai susţin două softuri diferite.

      Cel mai important lucru este că avānd două softuri diferite, Cosmin Ciupercă şi Daniel Morlova vor trebui să implementeze fiecare nouă īmbunătăţire īn două softuri şi nu īn unul singur, ceea ce mi se pare mult mai dificil; practic ar fi o muncă dublă.


      Pe de altă parte, dacă ceea ceea ce a implementat pānă acum Cosmin şi, eventual va mai fi dispus să facă, apare īn fereastra de meniuri aşa cum este acum, adică "Editare —> "Corectare automată după OCR", pentru noi cei ce ne ocupăm de cărţi va fi suficient şi vom şti să accesăm ceea ce ne trebuie, iar pentru cei ce folosesc AutoCorect la editare-corectare documente oficiale nu cred că-i deranjează o opţiune īn plus. Ba, mai mult decāt atāt, cred că nici nu se vor prinde foarte repede că a apărut o opţiune īn plus.

      Asta e părerea mea. Cea mai importantă e părerea celor ce lucrează concret la acest program, aşa că doar Cosmin şi Daniel sunt cei ce pot hotărī asta.


      Practic, eu la acest moment īn afară de alte cāteva explicaţii pe care aş vrea să le mai fac despre nişte opţiuni deja existente, mai am două probleme de discutat şi doar una dintre ele cu propunere de implementare.

      Problema cu cifra 1, ori semnul ! sau litera i mare puse īn mod eronat de Abbyy īn loc de litera L mic lipit de cratimă nu va trebui implementată automat; īnlocuirile de acest gen se pot realiza foarte bine cu ajutorul dicţionarelor de "Īnlocuire multiplă", doar că prefer să discutăm situaţiile pe forum, pentru a realiza nişte dicţionare cāt mai bune.


      Īn afară de aceste situaţii, există cāteva zeci de cuvinte īntregi de cāte 2 litere, trei litere şi patru litere, care se pot īnlocui fără probleme automat; aceste cuvinte există īn limba romānă īntr-o singură variantă corectă aşa că nu pot apărea erori; dau cāteva exemple:
            - c eronat īn loc de e corect: cc, dc, lc, nc, pc, sc, tc;
            - ā eronat īn loc de ă corect: bā, cā, dā, fā, mā, sā;
            - alte cuvinte de 2, 3 sau 4 litere de acest gen.
      Aceste situaţii pot foarte bine să fie corectate cu ajutorul dicţionarelor de tip .imd pentru "Īnlocuiri multiple", dar dacă se pot implementa fără mare dificultate, atunci e foarte bine să fie implementate.
      Indiferent de modalitatea de rezolvare, voi pune şi această listă pe forum pentru a fi discutată şi completată, eventual retrase unele cuvinte pentru care există şi o altă formă corectă, şi īnlocuirea automată ar putea produce erori.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Daca implementez inlocuirea acestor cuvinte am doua intrebari:
- aceste dictionare sa fie bagate in fisierul exe sau ca dictionar separat?
- sa fie editabile in interfata (pentru a le mai imbunatati in timp) sau nu...?

PS: daca implementez aceste corectari sub forma de meniuri presupun ca necesita fiecare la pornire o mica fereastra de confirmare a actiunii; sau sa implementez fara?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Mă gāndeam ca mai īnainte să pun o listă cu aceste cuvinte pe forum pentru ca să vedem dacă lista poate fi completă, dar mai ales, dacă īn listă nu s.au strecurat cuvinte care pot avea mai multe forme;
     De exemplu: cuvāntul d a r este frecvent ocerizat īn forma c l a r, ori s t ā n g īn forma s t i n g sau l ā n g ă īn forma l i n g ă
     Aceste cuvinte nu pot fi īnlocite automat ci doar cu confirmare situaţie cu situaţie, deoarece există īn limba romānă ambele cuvinte pentru fiecare exemplu.
     De aceea prefer ca astfel de īnlociri să le fac īn Word prin Find & Replace cu confirmare. lista unor astfel de cuvinte cu două sau mai multe versiuni corecte este mai mare.

     ■ Mai īntāi toate aceste cuvinte e bine să fie īnlocuite īntr-o singură opţiune. Eu am dat exemplu mai sus de mai multe grupuri de erori, dar nu cred că trebuie să existe mai multe subopţiuni pentru fiecare grup de erori. Eventual aceste cuvinte por fi afişate īntr-un help mai detaliat la care suntem dispuşi să colaborăm pentru editarea lui.

     ■ Cred că ar fi bine să fie puse īn dicţionar separat, deoarece apar numai īn situaţia realizării OCR; nu sunt greşeli ce ar putea apărea la editare, ca urmare a faptului că tastele ar fi una lāngă alta.

     ■ Cu sau fără interfaţă? Īnclin să cred că fără.
     Dacă vor mai apărea cuvinte, īn timp, de acest gen se pot adăuga īn dicţionare de "Īnlocuire multiplă".
     Singura problemă este dacă ne scapă vreun cuvānt care ar trebui să fie scos mai apoi – vom īncerca să fim atenţi ca să nu se īntāmple aşa ceva.

     ■ Cu sau fără fereastră de confirmare?
     Poate că ar fi bine să fie o fereastră īn genul celei de la "Conversie text clasic īn contemporan", dar nu este neapărat necesară.
     Dacă meniul se organizează aşa cum am propus mai sus, atunci există deja un fel de atenţionare a utilizatorului că a intrat īntr-o zonă specială, dedicată OCR.
     Practic, depinde cātă muncă de programare necesită realizarea afişării acestor ferestre şi dacă ele fac programul mai greu de rulat.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Este arhicunoscută situaţia neplăcută īn care constatăm că o carte, uneori chiar corectată, conţine foarte multe cuvinte īn care īn locul literei L mic, găsesc cifra 1.
      Cei care nu au suficientă experinţă şi corectează cartea fără corectoare de limbă activate au neşansa să nici nu constate că īn loc de litera L mic, au īn carte foarte multe cuvinte scrise cu cifra 1.
      Dacă folosind fontul Arial este destul de uşor de constatat diferenţa dintre cifra 1 şi litera L mic, folosind fontul Bookman Old Style cele două semne arată identic.
      Pentru a corecta această eroare a lui Abbyy dar şi cāteva alte erori, am folosit de-a lungul timpului un dicţionar de tip "īnlocuiri multiple".

      Situaţiile īn care Abbyy recunoaşte īn mod eronat litera l [L mic] ca fiind cifra 1 ori semnul ! sau litera I [i mic], sunt reduse la cuvinte foarte scurte sau īn componenţa cuvintelor cu cratimă, cuvintele īn care litera L mic este lipită de cratimă [atāt īnaintea cratimei, cāt şi după cratimă].

      Am īntomcit 3 liste sub formă de tabel īn format doc şi pdf cu īnlocuirile propuse.
      Am urcat pe mediafire o arhivă care cuprinde lista īn format doc + pdf.
           Nume arhivă:    Īnlocuire cuvinte cu 1, ! şi I.rar
           Adresa:

     Vizualizare directă, aici: Listă Īnlocuire cuvinte cu 1, ! şi I

     Rog userii dispuşi să analizeze aceste cuvinte sau fragmente de cuvinte şi să vină cu propuneri de completare a listei sau de scoatere a īnregistrărilor pe care le consideră eronate.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Inca o intrebare: pentru fiecare din aceste functii Undo (sau Anulare pe romana) sa mearga la nivel de eroare corectata (de exemplu grup de majuscule schimbat in litere mici sau paragrafe unite) sau sa anuleze in "bloc" toate modificarile facute de functia respectiva?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Eu aş merge pe anulare ĪN BLOC a īntregii opţiuni.
     Īn principiu sunt multe modificări care se fac īn īn text la rularea automată a unei opţiuni şi verificarea/anularea fiecărei modificări īn parte ar necesita foarte mult timp.

     Existānd şi varianta alternativă a folosirii īnlocuirilor multiple, dacă ar apărea erori vizibile şi īn număr mare la rularea automată a unei opţiuni, se pot folosi dicţionarele de īnlocuiri multiple, dicţionare din care se poate elimina modificarea care bănuim că ar crea erori.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am modificat interfata pe meniuri.
De asemenea am implementat totusi si inlocuirea cuvintelor si bucatilor de cuvinte care au probleme cu L mic. Stiu, ramasese stabilit sa fie separate - daca totusi se va decide sa fie separata se va inlocui usor cu cealalta optiune (Corectarea cuvintelor foarte scurte reproduse eronat). Daca nu voi adauga usor si pe cealalta.
Cele 3 dictionare care mi le-ai trimis, Seven: S1 1 - Lmic.imd, S2 ! - Lmic.imd si S3 I - Lmic.imd se copie in "c:\Documents and Settings\Nume_User\Application Data\AutoCorect Contemporan\Dictionare".
In momentul cand rulezi optiunea AutoCorect le incarca pe toate 3 si face inlocuirile.
Faptul ca le-am lasat in forma originala, ca sunt la locatia obisnuita de incarcare dictionare imd si ca le incarca doar in momentul cand faci corectarea (nu la incarcarea programului) permite utilizatorului sa le editeze, salveze si utilizeze fara sa restarteze AutoCorect.
Am facut si Anulare in "bloc".

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat si "Corectare cuvinte foarte scurte reproduse eronat".
La cererea lui Seven, "Corectarea literei L mic, reprodusa eronat ca 1, ! si I" va incarca dictionarele L1.imd, L2.imd si L3.imd. "Corectare cuvinte foarte scurte reproduse eronat" va incarca S1.imd, S2.imd, S3.imd si S4.imd.
Link exe:


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Mulţumim Cosmin pentru bunăvoinţă şi promptitudine.

      Am o primă formă a dicţionarelor de tip IMD pe baza cărora rulează ultimele două opţiuni de corectare.
      Este vorba de:
            - L1.imd, L2.imd şi L3.imd – care folosesc la rularea opţiunii "Corectarea literei L mic, reprodusa eronat ca 1, ! si I"
            - S1.imd, S2.imd, S3.imd şi S4.imd – care folosesc la rularea opţiunii "Corectare cuvinte foarte scurte reproduse eronat"

      L1, L2, L3 se bazează pe tabelele urcate mai sus, la care am mai adăugat cāte 6 īnregistrări pentru cuvintele "dă-i" şi "fă-i".
     S1 este un dicţionar de cuvinte scurte cu cratimă sau care au īn componenţă alte semne decāt litere; de exemplu: §i se transformă īn şi.
     S2, S3 şi S4 cuprind cuvinte scurte formate din două, trei, respectiv patru litere.

     Dicţionarele se copiază īn calea de căutare explicată de Cosmin; ele se īncarcă īn program numai pentru funcţionarea opţiunilor amintite.
     Vizionarea conţinutului dicţionarelor se poate face prin deschiderea dicţionarelor cu opţiunea:
             "Editare —> Īnlocuire multipl㠗> Dictionare —> Deschide..."

     Am urcat o mică arhivă cu cele 7 dicţionare pe mediafire.
            Nume arhivă:     Dictionare IMD L1-L3, S1-S4 PLUS - 2011.09.30.rar
            Adrese arhivă: 
                                 

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am adaugat aceste modificari si la AutoCorect Clasic + am actualizat cele doua exe in prima postare din topic.
Seven, ai mentionat ceva de adaugat la Help. Daca mai intentionezi sa il modifici am sa iti trimit uneltele necesare.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am verificat valabilitatea dicţionarelor L1-L3 şi S1-S4 pentru versiunea AutoCorect Clasic.
     L1-L3 şi S1-S2 sunt valabile īn totalitate pentru ambele versiuni, dar S3 şi S4 conţin cāteva īnregistrări valabile doar pentru text contemporan;

     Voi revedea īn timp componenţa īnregistrărilor din dicţionare, pentru că e posibil ca unele modificări să nu mai fie necesare. De exemplu: există īnregistrări [modificări] pentru cuvinte īntregi, de genul rīs -> rās, sīn -> sān, care īn acest moment nu se mai justifică; Ele erau valabile pentru text clasic convertit īn text contemporan prin metoda "Īnlocuirilor multiple"

     La acest moment, am o īntrebare:
     Este vorba de cuvinte care conţin cratimă, precum dă-mi, ce-am, mi-au...
     Mă interesează cum sunt tratate īn opţiunea "Īnlocuiri multiple"; sunt considerate Cuvinte īntregi cuvintele cu cratimă īn componenţa lor sau sunt Cuvine īntregi doar cuvintele obişnuite, fără cratimă.


     Cosmin,
     Am spus şi sunt dispus să ajut la dezvoltarea Help, cu elemente privind noile opţiuni şi eventual cu explicaţii īn plus la cele mai vechi. Cānd spun "explicaţii īn plus" mă refer la explicaţii pentru unii utilizatori care au mai puţine cunoştinţe īn domeniu.
     De asemeni, pentru userii de pe forum, aş vrea să īncerc realizarea unui tutorial detaliat despre folosirea AutoCorect;
     Pe forum există un topic privind precorectura cărţilor, care trebuie reactualizat cu ultimele opţiuni pe care le oferă AutoCorect şi făcute mofidicările de rigoare;

     Practic toate acestea – help, tutorial, topic – se bazează pe aceleaşi informaţii, doar că īn cantităţi şi structuri diferite; cum tutorialul ar trebui să fie cel mai detaliat, el trebuie să cuprindă cele mai multe informaţii, cred că cel mai bine este să īncep cu el şi apoi să extrag informaţii pentru topic şi Help.

     Deocamdată nici īn mintea mea nu sunt stratificate toate informaţiile.
     Mai am nevoie de un pic de timp pentru testarea opţiunilor şi perfecţionarea dicţionarelor existente.
     Ba, mai mult, cred că două-trei zile mă ocup numai de corectură ca să mai schimb activitatea.
     Toate aceste informaţii, mai īntāi ţi le voi pune la dispoziţie prin intermediul mail şi numai după aceea voi proceda la "trecerea lor pe curat".

      Seven   


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cuvintele cu cratima sunt considerate cuvinte intregi.

pus acum 13 ani
   
menssana1984
Vizitator



Facut conversie text clasic > contemporan. Un cuvant ce nu vrea sa se schimbe.

dīră

A mai aparut vreo versiune noua de exe?

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Există o versiune lucrată azi după amiază, dar are modificări īn fereastra "Īnlocuiri multiple" şi se lucrează īncă, deci nu are legătură cu Conversia de la text clasic la contemporan.
     Cea mai nouă versiune [cu excepţia acesteia despre care vorbesc] este reactualizată īn prima postare a lui Cosmin.

     Am rugămintea să urci textul clasic pe care l-ai convertit, īn forma neconvertită. Trebuie văzut dacă acel cuvānt "dīră" nu conţine ceva ce nu se "vede"... şi care ar putea explica neconvertirea lui...


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Uite textul:

Am dat convertire, apoi am verificat ortografia, asa l-am gasit.

A... crezi ca ar fi o idee buna ca sa adaugam o optiune de convertire a tuturor liniutelor in text in cratima, cu exceptia celor de de tipul:

SpatiuCratimaSpatiu ce va deveni SpatiuEndashSpatiu

^pCratimaSpatiu ce va deveni ^pEmdashSpatiu

Ce zici?

Apropo, cat de ok e sa rulezi dictionarele pe un text care cam arata a 1.0?


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     1. Am făcut proba cu textul tău şi am găsit un singur cuvānt "dīră" neconvertit.
     Nu am căutat şi alte cuvinte, aşa că nu ştiu dacă la converire a mai "sărit" peste ceva.
     
     Am făcut o nouă īncărcare a textului iniţial şi de data asta am dar comanda de convertire de două ori. Noul text rezultat nu mai avea cuvāntul respectiv neconvertit.

     M-am nervozat şi am refăcut testarea de mai multe ori, marcānd cuvāntul respectiv pe original cu fond galben. De fiecare dată la prima convertire a rămas neschimbat acest cuvānt. Am verificat dacă au mai rămas şi altele şi sigur nu a mai rămas niciun cuvānt īn afară de acesta. Sunt convins că el a fost singurul, dar nu ştiu care e motivul pentru care nu econvertit prima dată, dar este a doua oară.


      2. Aşa... cu liniuţele... constat că ai o problemă cu liniuţele astea.
      Am īn lucru un dicţionar care se poate rula īn AutoCorect pentru problema cu liniuţele; mai īntāi vreau să mă ocup de liniile de dialog, adică de prima liniuţă dintr-un paragraf.
      După modificările făcute de Cosmin, acum īn dicţionarele de īnlocuiri multiple se poate indica faptul că o căutare cu īnlocuire se poate face doar la īnceputul sau sfārşitul paragrafului.
      Revenind... acest dicţionar va converti toate liniuţele de dialog, liniuţe de diferite forme, liniuţe care sunt lipite cu tot felul de răgălii, ba īn faţa liniuţei, ori după liniuţe.... toate acestea, doar la īnceput de paragraf să se transforme īn Em dash.
      Este vorba de ceea ce īn word ar fi cu semn de īnceput de paragraf: ^p

      După rularea acestui dicţionar, dar numai după, se poate rula un alt dicţionar care să rezolve liniuţele explicative şi cum se mai cheamă, adică cele care sunt de genul spaţiu-liniuţă-spaţiu... deoarece pot apărea şi īn forma spaţiu-liniuţă-virgulă, va trebui să prindem toate variantele - pe acestea le transformăm īn En dash.
     
     Liniuţele care trebuie să fie cratima clasică... practic aici eu nu am īntālnit [sau poate am īntālnit puţine situaţii şi le-am uitat] cratime scrise altfel. Nu-mi dau seama de ce ai altă liniuţă īn locul cratimei.

     Dacă aş avea astfel de situaţii, cred că aş proceda astfel: mai īntāi toate liniuţele le-aş transfirma īn cratimă, indiferent de poziţia pe care o au, după care aş rezolva mai īntāi dialogul, şi mai apoi liniuţa de pauză sau explicativă...
     Mai discutăm problema asta.
     

     3. Sincer eu nu aş rula nimic automat la versiunea [V1.0]; Atenţie! cānd zic [V1.0] mă refer la varianta RIF īn care [V1.0] īnseamnă că a fost corectată prin citire cap-coadă.
     Hai să mă exprim altfel. Aş face rulări automate, dacă după asta aş face eu corectură prin citire cap-coadă ca să recorectez eventualele erori rezultate din rulările automate, dar nu aş face rulări automate care nu vor fi verificate prin citire cap-coadă.

     Indiferent care ar fi rularea automată: cea cu convertirea text clasic īn contemporan, repararea rānduri rupte, rezolvare cifrei 1 sau cirectare cuvinte scurte... toate acestea se bazează pe nişte dicţionare făcute de nişte oameni. Cum vorbim despre o limbă cu reguli multe şi diverse, unele foarte complexe, dar şi excepţii... toate aceste dicţionare sunt bune, dar nu vor putea fi perfecte.
     Deci, din cauza asta militez pentru corecturi automate īnainte de corectura prin citire şi nu după. Sper că am reuşit să mă fac īnţeles... Eu scriu cam mult, şi nu foarte clar...

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, am gasit problema: era de la faptul ca textul dinainte era modificat neliniar (era scos un spatiu, spre deosebire de modificarile liniare care doar inlocuiesc caractere) si nu "vedea" bine urmatorul cuvant.
O sa repar imediat.

PS: am reparat si am actualizat link-ul exe de la prima postare... Situatiile de acest gen erau foarte rare dar e bine totusi ca ai semnalat menssana ca sa pot repara. Multumesc

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Seven, la asta ma refeream, corectura automata si apoi citire.

In privinta liniutelor, template-ul de exemplu iti transforma totul in cratima.
Iar apoi trebuie sa vii tu sa faci inlocuirile de geneul ^pCratimaSpatiu cu ^pEmdashSpatiu si tot asa pentru linia de pauza.
Dar daca zici ca situatia e un pic mai complexa de atat, astept dictionarele.

Cosmin, nu prea am inteles care era problema, dar daca zici ca s-a rezolvat...


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am modificat fereastra la Inlocuire Multipla astfel incat sa se poata incarca si salva dictionarele direct cu click pe buton (nu prin intermediul unui popup ca inainte).
Am actualizat ambele link-uri de exe modificat la primul post.


pus acum 13 ani
   
menssana1984
Vizitator



A...apropo se poate ca atunci cand se verifica ortografia sa se poata crea un dictionar nou si separat de cel default?
Adica un dictionar care sa contina aceleasi chestii ca cel normal, dar in care sa adaugam termeni specifici textului cu care lucram. Ideea e ca acel dictionar sa nu se piarda si sa ne permita sa il alegem doar atunci cand e nevoie. Termenii aceia sa nu "contamineze" dictionarul propriu-zis.
Iar la urma sa poata fi sters.

De exemplu, la Orwell se gaseste termenul NouaVorba sau ceva de genul, folosind optiunile existente din ortografie, se poate ca:
- sa fie ignorat odata sau mereu si adaugat aceasta actiune sau nu in dictionarul propriuzis.

Daca il adaugam in dictionarul normal, nu ne va mai semnaliza termenul daca e gasit in alte texte. Iar termenul tine strict de cartea lui Orwell.

Daca nu il adaugam in dictionar si doar il ignoram individual sau total in textul curent, data viitoare cand vom redeschide textul iarasi ne va fi semnalizat pentru ca nu a fost retinut de dictionar.

Poate ca atunci cand se face verificare ortografie ar fi bine sa fim intrebati daca dorim sa folosim dictionarul standard sau un dictionar particularizat. Iar daca exista deja un dictionar particularizat sa ne fie aratat impreuna cu un set de optiuni gen incarcare, stergere, etc.
Si totodata ar fi bine ca cuvintele adaugate in dictionarul standard sa fi inregistrate si in cel particularizat, dar nu si invers.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, stiu de aceste situatii.
E un pic dificil sa se implementeze un dictionar separat si e dificil sa fie facut unul care sa fie doar pentru un text.
Presupun ca mai vrei un buton pe care sa scrie ceva de genul "Ignora mereu in acest text".
Acest dictionar sa fie folosit numai la textele cu acest nume.

Sunt si altii interesati de asta...?

PS: la Ignora toate se foloseste un dictionar intern care nu e salvat pe HDD. Ce-ar fi sa fie salvat si incarcat pentru textul curent? In acest fel nu trebuie facute modificari la interfata si deci e mai usor de implementat. E bine asa...?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat:
Ca sa activezi, te duci la meniul Instrumente >> Configurare >> Ortografie si bifeaza "Memoreaza cuvintele de la "Ignora toate" pentru fiecare text in parte".
Vezi daca e ceea ce iti trebuie...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Ok. O sa imi bag nasul pe acolo.

E ok asa cum spui si tu. Important e sa avem acces la dictionarul propriu-zis, sa se salveze acei termeni si sa ii putem refolosi ori de cate ori dorim si sa nu amestecam cele doua tipuri de dictionare.

O curiozitate..

De ce apare cuvantul acelas subliniat? Vad treaba asta destul de des si mereu e vorba de josul paginii.


pus acum 13 ani
   
menssana1984
Vizitator



OK... am incercat.
Merge, nu mai ma bate la cap cu acele cuvinte cand incarc textul a doua oara.

Unde se salveaza acele cuvinte?


Am facut proba pe un docx importat, cuvintele ignorate nu se pastreaza cand il import a doua oara.

Pe rtf se mentin.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Salvarea o face in "c:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect Contemporan\Dictionare". Numele dictionarului e numele textului (inclusiv extensia) la care se adauga ".dic".
Deci e "legat" de numele textului - daca il schimbi nu il mai vede.
Cand importi un doc/docx sa dai o "Salvare ca" la textul importat si il numesti ca sa stie cu ce nume sa salveze la acel dictionar.
Asta inainte de a incepe corectarea.

PS: iar in ce priveste acea subliniere din imagine, cateodata selectarea textului trece cu 1 sau 2 pixeli in pagina precedenta, o sa caut sa rezolv desi nu e chiar asa de usor...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



A... daca nu e o problema, da-i dreacului de pixeli.

Iar cu dictionarul.... deci practic daca lucrez 100 de carti cu termeni unici, acolo o sa am 100 de dictionare ce vor fi folosite doar atunci cand voi deschide acele texte?

Si eventual le si mut de acolo pentru o utilizare ulterioara.

Asta ar fi ideea, da?


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, vor fi folosite doar pentru fiecare din acele texte.

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am mai facut o imbunatatire: in meniul de sugestii care apare cand dai Ctrl+Space pe un cuvant subliniat am adaugat Ignora (care e echivalent cu Ignora toate din Ortografie).

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
La cererea lui menssana1984 am mai implementat ca, atunci cand sugereaza "Sfarsit neterminat de propozitie" sa sublinieze cu linie rosie ultimul caracter din acea propozitie. In acest fel se poate "naviga" si catre aceste probleme utilizand butonul "Navigare suport" din toolbar, respectiv combinatiile de taste Ctrl+Up/Down..

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am mai facut cateva mici imbunatatiri la cod + am adaugat ultimele modificari si la versiunea clasica.
Am actualizat linkurile la exe modificat din prima postare...


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am luat şi eu la purecat dicţionarele pe care le aveam deja pentru īnlocuiri multiple.
      Unele īnregistrări erau marcate "Cuvānt īntreg" şi "Păstrează capitalizarea", dar şi cu "Potrivire perfectă", ceea ce era o aberaţie... Le-am mai aranjat un pic.

      Īncerc să găsesc īnregistrări care ar putea avea eventuale efecte secundare neplăcute... adică să facă modificări atāt la cuvintele pe care le doream modificate, dar şi la altele.
      Cel mai bine ar fi ca īnregistrările să fie pentru "Cuvānt īntreg" cu "Păstrează capitalizarea" şi nu pentru secţiuni de cuvinte. Totuşi, un dicţionar numai cu cuvinte īntregi este mult prea mare şi destul de greu de realizat.
      Īntre timp dicţionarele care erau valabile pentru cāte două-trei litere, le-am modificat astfel, īncāt să conţină litere care īncep cu o singură literă, deci dintr-un singur dicţionar care cuprindea cuvintele care īncepeau cu A, B şi C, am realizat cāte un dicţionar pentru fiecare literă īn parte.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Menssana1984, am discutat cu tine despre sugestiile de la punctuatie.
Ai fi vrut ca, atunci cand te duci la o zona subliniata utilizand "Navigare suport", programul sa iti spuna si care e problema (asa cum e prezentata in lista de sugestii de jos).
E cam dificil de implementat in aceasta forma si de aceea m-am gandit la alta solutie: utilizand 2 combinatii de taste sa activezi urmatoarea sugestie din lista respectiv pe cea anterioara. Ar fi ca si cum te-ai duce in lista de sugestii si ai da dublu click pe sugestia urmatoare sau anterioara.
In acest fel navigarea ar fi mai usoara.

Intrebarea e pentru toti: ce parere aveti, v-ar ajuta sa fie implementata si mai ales v-ar ajuta sa fie implementata in aceasta forma?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Pana auzi si alte pareri...



E vorba de "W.C.-ului" ori de cate ori rulezi punctuatia devine "W.C.- Ului", iar ortografia nu il semnaleaza.


Si inca o problema la convertire clasic > contemporan.


E vorba de cuvantul "incantatoare".


Si cum ar fi daca programul ar indica la punctuatie si locurile in care cratima e pusa gresit?
Adica doar doua cazuri din cate stiu eu:

v- am
v -am

Aceeasi chestie sa fie valabila si pentru Emdash, Endash.

Dar de fapt parca apare la ortografie, nu? Dar indica mereu sau doar in anumite cazuri?


Si inca o chestie: am importat un doc, am lucrat la el si am dat save. Dupa care mi-am dat seama ca era importat de fapt. Am vrut sa verific fisierul si l-am reimportat, mi-a zis ca docul are exensia gresita, ca e rtf si daca vreau sa redenumesc tipul de fisier ca rtf, am zis da si l-a importat.
Prin suprascrierea asta a docului importat, fisierul nu e afectat cu nimic, nu pateste nimic rau?

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ortografia n-are ce sa semnaleze deoarece dupa modificarea de la punctuatie devine un fel de inceput de propozitie.
Parerea mea e ca se scrie corect "WC-ului". Dar o sa incerc sa schimb punctuatia sa nu mai faca aceasta modificare...

Problema de convertire: in textul care mi l-ai trimis e scris gresit "īncāntātoare" (nu "īncāntătoare" asa cum e corect). Am verificat si singura modalitate prin care putea ajunge asa era daca in textul original era scris "īncīntītoare" sau "īncīntātoare" (ambele incorecte). Din cate am inteles Abby face cateodata confuzie intre ă si ā, deci n-ar fi fost de mirare sa fi fost scanat gresit "īncīntātoare".
Dar daca esti absolut sigur ca era scris corect in textul original, trimite-mi-l te rog ca sa verific - cu textul din link nu face asa daca il scriu "īncīntătoare" (deci versiunea corecta).

Cuvintele de tip v- respectiv -am sunt semnalate la ortografie.

La importare: probabil ai salvat prima data cu "nume.doc". Nu e problema ca ai dat suprascriere, la o adica nici nu trebuia sa dai din nou import ci doar sa modifici extensia din doc in rtf.
AutoCorect se ia de regula dupa ce gaseste in fisier, nu foloseste asa de mult extensia ca sa stie ce in fisier. Dar avertizeaza totusi + incearca sa o puna pe cea corecta deoarece exista programe de editat care daca ii dai un rtf cu extensie doc sau invers nu mai stiu sa-l incarce.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Nu am salvat cu nume doc. Eventual a suprascris Autocorectul, dar suprascrierea a avut loc in docul original.
In folderul ala aveam doar 2 docuri, dintre care unu a fost importat, salvat, importat din nou si semnalat ca fiind de fapt rtf.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Mai exact cum ai salvat? Ai selectat in dialogul de salvare documentul original si ai dat suprascriere?

pus acum 13 ani
   
menssana1984
Vizitator



Se poate. Acum am incercat aceeasi chestie si nu mai merge. Imi da salvare doar ca rtf.
In fine, las-o asa, era destul de tarziu cand am facut asta.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Bine.
Am modificat punctuatia:


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Eu m-am obişnuit să lucrez īn AutoCorect doar cu rtf-uri.
     Atāt timp cāt īn AutoCorect am prelucrat rtf-uri, nu am avut niciun fel de surprize neplăcute.
     Am impresia că e mai bine de salvat din Word īn varianta rtf şi apoi prelucrat īn AutoCorect.

     Nu am lucrat de prea multe ori doc-uri īn AutoCorect.
     Am īncercat importarea unui document Word care avea cuvinte [nume] īn grafie franceză şi am realizat că numele Annaļs a fost salvat īn rtf, drept Annad's.
     Am revenit īn Word, am salvat acelaşi document ca rtf, apoi l-am īncărcat īn AutoCorect pentru prelucrări şi rezultatele au fost excelente, fără niciun fel de problemă.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Pagini:  1 2 3 4 ... 13  

Mergi la