Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Lista de useri | Cauta | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
biancamaria229 pe Simpatie.ro
Femeie
24 ani
Bucuresti
cauta Barbat
24 - 37 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect versiune pentru Romania-Inedit Moderat de Seven, Stelevadris, cuculean, uncris  
Autor
Mesaj Pagini:  1 2 3 4 ... 52
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
AutoCorect 5 versiune pentru Romania-Inedit

Īmbunătăţiri faţă de versiunea precedentă:
- multe mici īmbunătăţiri la cod şi la dicţionare.

Aici găsiţi versiunea oficială (kit de instalare complet):

Contemporan:

Code:

http://www.mediafire.com/download.php?2l78535qwgg2upu

Clasic:

Code:

http://www.mediafire.com/?duq8w4hpktucmma





Exe modificat pentru AutoCorect OCR Plus:

        Īn folderul mediafire de tip deschis  de mai jos se află īntotdeauna ultima versiune a celor două exe:
AutoCorect Contemporan.exe şi AutoCorect  Clasic.exe
        Nume folder: 1. Executabile OCR Plus

Code:

http://www.mediafire.com/?f12mry259atv9

Instrucţiuni de instalare: descărcaţi kitul complet şi-l instalaţi normal.
Descărcaţi exe modificat, dezarhivaţi-l şi copiaţi peste original (locaţia implicită de instalare e "C:\Program Files\AutoCorect" ).

Ce are in plus faţă de versiunea oficială: funcţii de corectare automată a erorilor de scanare. Le găsiţi īn meniul OCR Plus. Necesită cateva dicţionare tip imd pe care le găsiţi la:

Code:

http://www.mediafire.com/?aozlgwpimcpqt

La locaţia "c:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect [Contemporan/Clasic]\Dictionare" pentru cei care au Windows XP, respectiv la "c:\Users\Nume_utilizator\AppData\Roaming\AutoCorect [Contemporan/Clasic]\Dictionare\" pentru cei cu Windows Vista/7, creati folderul OCR_DIC, dezarhivati arhiva descarcata si copiati acolo dictionarele.


Aştept părerile voastre, critici, sugestii etc. Dacă aveţi o idee de vreo īmbunătăţire ce va folosi şi altora, nu ezitaţi să o scrieţi; dacă e posibil, va fi implementată.

Modificat de ciuperca_cosmin (acum 8 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani

         ══════════════════════════════════════════════════════

         Dicţionarele  IMD care rulează automat īn meniul OCR_Plus vor fi reactualizate periodic şi urcate pe un folder mediafire deschis.

         Arhivele cu pachetele de dicţionare vor purta nume de genul: [2011.11.18] Dictionare_OCR_DIC.rar
         Arhivele vor avea la īnceputul numelui īn parantează dreaptă data reactualizării sub forma [2011.11.25] pentru a fi mai uşor de urmărit care este cea mai nouă arhivă.

            Nume folder mediafire:      AC OCR Plus V5.1 - 2012
            Adrese folder mediafire:
     http://www.mediafire.com/?x652lkxvqr5b6


         ══════════════════════════════════════════════════════




         ══════════════════════════════════════════════════════





      Salutare Cosmin,

      Cred că am să te agasez mai mult decāt ţi-ai dori.
      Īncerc să ridic problemele īntr-o anumită ordine, deşi nu ştiu dacă ea va fi ordinea cea mai bună.


     1. Opţiunea: Instrumente -> Ortografie...

      Abbyy dă uneori erori de recunoaştere, "foarte depărtate" ca formă de cea reală a cuvāntului corect.
      Īn plus, datorită faptului că īn beletristică există şi cuvinte străine nerecunoscute de dicţionarele romāneşti, dar şi cuvinte romāneşti īn forme care nu se regăsesc īn dicţionare... īn aceste situaţii, dar şi īn altele, cuvintele existente īn fereastra "Sugestii" sunt insuficiente.

      Sunt situaţii cānd cuvintele cu care ar trebui să fie īnlocuite, deşi există īn dicţionare, ele au o formă mult diferită faţă de cel "recunoscut" de către Abbyy, astfel că ele nu au fost prevăzute ca "Sugestii".
         
      Apare, astfel necesitatea editării, prin adăugarea unor cuvinte īn plus faţă de cele prevăzute la "Sugestii".

          ■ Deci, prima problemă: s-ar putea adăuga o facilitate īn acest sens? Există posibilitatea să se implementeze posibilitatea editării īn fereastra "Sugestii"

          ■ A doua problemă: Aceste cuvinte pe care le-ar putea adăuga utilizatorii, nu cred că trebuiesc adăugate īn dicţionarele existente īn AutoCorect, ci īntr-un dicţionar temporar, deoarece ele sunt valabile doar īn anumite situaţii şi la anume cărţi.

          ■ Se poate discuta despre cāt timp ar trebui să se păstreze acest dicţionar TEMP, dar mai īntāi să clarificăm dacă această posibilitate de editare a ferestrei "Sugestii" există.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
menssana1984
Vizitator



Daca nu gresesc, atunci cand modifici manual un cuvant in fereastra de deasupra listei de sugestii, trebuie sa apesi pe unul din butoane pentru a trece mai departe.
De nu ar merge apasat butonul de adaugat in dictionar?

Si chestia cu dictionarul temporar sau separat de cel normal e o idee buna.

Modificat de menssana1984 (acum 9 ani)


pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Da, stiu de Abby si de problemele care le are.
De asta la Configurare >> Ortografie exista si optiunea "Litere interpretate gresit la scanare (OCR)". E deci implementata dar, cum trebuie sa se descurce si cu celelalte probleme, nu e specializata 100% doar in OCR.
Pe de alta parte lista de sugestii poate fi oarecum modificata.
De exemplu cand cineva alege o sugestie care nu se afla pe primul loc sau cand editeaza manual textul in acea fereastra de sus (numai cuvantul) programul tine minte asta si afiseaza sugestia pe primul loc data viitoare cand intalneste din nou acel cuvant. Intr-un fel "invata"...
Unde le stocheaza: in "C:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect Contemporan\Dictionare\i.dic" respectiv "C:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect Clasic\Dictionare\i.dic".
Forma de stocare: pe liniile impare pune cuvantul scris gresit iar pe cele pare sugestia care va fi afisata prima. Sunt scrise Ansi, nu Unicode si doar cu litere mici (la cuvinte scrise cu majuscule face programul "paralela").
Ai putea sa faci un astfel de dictionar particularizat in care sa apara perechi ca:

dm
din
pc
pe

E bine asa sau vrei si mai "specializat"?

Am o rugaminte: daca ai putea sa-mi dai exemple de situatii intalnite mai des (spre exemplu anumite grupari de litere care in orice cuvant fac probleme) pentru a incerca sa le implementez.


Altceva, ce nu tine de ce mi-ai vorbit acum: de ieri incerc sa implementez o modalitate mai buna de a cauta si repara zonele de text "rupt" (alta decat cautarea si inlocuirea automata). Mai exact atunci cand Abby taie fraza la jumatate:

"Anul viitor vom
merge la mare si la munte"

In acest caz merge in cele mai multe situatii o cautare de genul [litera_mica][caracter_sfarsit_paragraf][litera_mica] si inlocuite automat cu [litera_mica][caracter_spatiu][litera_mica].
Dar sunt si cazuri cand strica:

"...
a)Text1
b)text2
c)Text3
..."

sau cand se recita ceva ca o poezie dar fara sa puna majuscula la inceput. Si mai sunt si alte situatii.
In concluzie, cautarea si inlocuirea automata ajuta mult la textele care au multe astfel de probleme dar ar strica textele care au putine.

Implementarea care am facut-o pina acum in AutoCorect contemporan: http://www.mediafire.com/?8eh6c855ph1z2zt
E ultimul buton din dreapta sus de pe toolbar (primul rand), dupa butonul cu -.
Daca va intereseaza poate o testati si ma ajutati cu critici si sugestii...

@menssana1984 am vazut ca ai scris dupa ce am pus mesajul (ai pus mesajul tau cu putin timp inainte si eu aveam deschisa editarea si n-am avut cum sa mai dau refresh)...
Butonul de adaugat in dictionar se dezactiveaza automat cand utilizatorul editeaza manual deoarece utilizatorul alege clar modificarea manuala si nu mai poate fi adaugat la dictionar in forma initiala. Am discutat cu Daniel acu cativa ani despre asta si amandoi am ajuns la concluzia ca e mai bine sa fie dezactivat in aceasta situatie.

Modificat de ciuperca_cosmin (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
     Privind problema Opţiunea: Instrumente -> Ortografie...

     Este perfectă posibilitatea editării īn dicţionarul temporar "i.dic".
     Am făcut cāteva testări şi este exact ceea ce voiam să propun.
     Ar mai fi o problemă. După cāte am constatat [e posibil să mă īnşel] dicţionarul este activ atāt timp cāt este activă opţiunea "Ortografie...", apoi el dispare.
     Mă gāndeam că dacă acest dicţionar ar avea o viaţă ceva mai lungă ar fi şi mai util. De exemplu, dacă acest dicţionar s-ar şterge la ieşirea din programul AutoCorect şi nu imediat la ieşirea din opţiune.
     Ideal pentru cei de pe forum ar fi să poată fi şters atunci cānd userul nu-l mai consideră necesar, adică după ce a terminat de rulat cartea prin AutoCorect, dar asta ar īncurca pe utilizatorii obişnuiţi.


     Privind problema rezolvării "ruperilor de rānd..."
     Am descărcat şi instalat [copiat executabil] ultima versiune şi am văzut opţiunea de rezolvare a acestei probleme.
     Momentan nu am fişiere cu probleme de acest gen, aşa că nu am avut pe ce să fac proba.

     E bine de ştiut că astfel de probleme apar īn Abbyy doar accidental, atunci cānd textul este salvat rtf Plain text. La problema asta trebuie să mai fac cāteva testări cu Abbyy ca să fiu sigur īn ce situaţii apar ruperile de rānd.

     Īn principiu, situaţia apare atunci cānd fişierul text rezultat īn Abbyy este salvat īn format Exact copy sau Editable copy, formate pe care eu nu le recomand din mai multe motive.
     Oricum, la salvarea īn format rtf - Plain text ele nu apar mai mult de cinci-şase la zece pagini...


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Zici ca dispare din locatia respectiva? Ciudat, nu l-am facut sa dispara ci sa ramana chiar si dupa ce AutoCorect e inchis...
Daca esti 100% sigur ca dispare trimite-mi te rog un text la care dispare si arata-mi pasii necesari ca sa apara problema...

PS: intrebare - ai editat cumva fisierul cand AutoCorect era deschis si mai ales cand era pornit pe ortografie...?

Modificat de ciuperca_cosmin (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
     Īmi cer scuze!
     N-am fost atent la calea de căutare pe care ai pus-o mai sus. M-am uitat īn subfolderul "Dictionare" din folderul de instalare.
     Da, e acolo unde trebuie. E perfect aşa.
     Am īnţeles şi cum se face editarea.

     Īn principiu, pentru cuvintele foarte scurte de două, trei sau patru litere, prefer dicţionare imd pentru īnlocuire multiplă.
     E mai complicat faptul că aceste dicţionare [imd] nu le pot indexa īn ordine alfabetică şi uneori sunt grupuri de cuvinte pe care nu ştiu dacă le-am pus sau nu.

     E adevărat că multe dintre ele ar putea fi implementate să ruleze automat pentru că de exemplu nu există cuvāntul īntreg "cc" ci doar "ce", ori "$i", ci doar "şi"... etc
     Am să fac o listă cu tot ce am, le supunem discuţiei [să vedem dacă mai apar şi altele] şi pot fi implementate īn genul opţiunii "Litere interpretate greşit la scanare (OCR)"

      Pe de altă parte, cei mai mulţi dintre noi fac precorectura folosind atāt AutoCorect, cāt şi Word sau alte editoare, īnlocuiri Find&Replace simple şi speciale, precum şi macrocomenzi.
      Deci editoarele īn acest caz sunt complementare.
      Īn unele e mai uşor de făcut un anume tip de corectură, īn altele altceva.
      [Cānd zic precorectură, mă refer la toate acţiunile de corectură automată şi semiautomată, care au loc īnainte de corectura prin citire cap-coadă - după corectura prin citire nu mai fac corecturi, decāt īn cazuri foarte rare, ca de exemplu o īnlocuire cu confirmare pentru fiecare situaţia īn parte].


      LE: Am uitat... Am văzut şi un alt dicţionar īn care am recunoscut cuvintele din textul meu.
      Acest dicţionar este "p.dic".
      Este vorba de cuvintele ignorate? Se pare că şi acesta ar putea fi editat cu NotePad, doar că nu se mai trec perechi de cuvinte, ci doar cuvāntul ce trebuie ignorat...

Modificat de Seven (acum 9 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Am sa adaug o sortare alfabetica la imd-uri. Poate chiar si o cautare...
p.dic este echivalentul lui custom.dic din Word - in care sunt stocate cuvintele adaugate la dictionar.

Modificat de ciuperca_cosmin (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
     Am īnţeles ce e cu p.dic.

     Opţiunea "Īnlocuirile multiple", din punctul meu de vedere este cea mai importantă opţiune; doar ea singură face cāt un program foarte puternic.
     Mai īntāi că nu cunosc să existe un editor care să permită mai multe īnlocuiri, AutoCorect fiind singurul care permite acest lucru. Deci, se pot face un număr nelimitat de īnlocuiri, īntr-un timp foarte scurt; faptul că aceste īnlocuiri pot fi salvate īn dicţionare şi folosite de cāte ori e nevoie şi de către oricine este deja un lucru excelent.

     Dacă se poate adăuga şi sortarea alfabetică la imd-uri, atunci această opţiune, a "Īnlocuirilor multiple" devine ceva cu totul şi cu totul special, foarte utilă şi foarte uşor de folosit.
     O serie de probleme pot fi rezolvate fără a adăuga opţiuni suplimentare la program.

     Personal, mie īmi este suficientă sortarea.
     Funcţia de căutare... nu este neapărat necesară, deoarece ne-am obişnuit deja cu dicţionare pe litere şi e mai uşor de constatat dacă un cuvānt este deja īnregistrat, deoarece īl caut īntr-un singur dicţionar.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Am implementat sortare la imd-uri: http://www.mediafire.com/?9956it7vtmlkll6

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
     Mulţumim Cosmin!
     Mulţumim foarte mult!

     Opţiunea de sortare a dicţionarelor de īnlocuire multiplă este foarte-foarte importantă şi foarte utilă.
     Sortarea astfel implementată, se face foarte rapid şi este uşor de realizat.
     Mulţumesc īncă o dată.
     
     Toată stima şi deosebit respect!
     Seven

      


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Cu placere.

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
Salutări Cosmin!
Am revenit.

      Am īnceput cu "Īnlocuiri multiple", deoarece această opţiune este de mare importanţă pentru mine.

      Acum aş vrea să purtăm discuţii şi să clarificăm modul de accesare şi funcţionare a altor opţiuni şi īncerc să le luăm īn ordinea īn care apar ele īn meniu.
      Sper că discuţia să folosească şi altor colegi de pe forum, deoarece după cum ai constatat nu mulţi sunt cei ce studiază helpul sau, poate că uneori, helpul nu le clarifică suficient problema a cărei rezolvare o caută.

      Īn măsura īn care eşti dispus aş vrea să intrăm mai īn amănunt īn discuţii despre anumite opţiuni.
      Şi acum să īncepem:

     
       Opţiunea: Editare ―> Conversie text clasic īn contemporan

      Mulţi useri, printre care mă număr şi eu, lucrăm īn varianta text contemporan, deşi OCR-ul rezultat din Abbyy este text clasic.
      Această opţiune devine foarte importantă pentru foarte mulţi dintre noi.

      Ţinānd cont de discuţiile pe care le-am mai purtat, şi anume, că īn textele literare apar frecvent cuvinte cu o formă intenţionat incorectă şi că ele trebuie să rămānă astfel şi să nu fie corectate īntr-o limbă literară corectă, se pune următoarea īntrebare: [Mă voi referi doar la īnlocuirea ī ―> ā, nefiind probleme la sīnt ―> sunt.]

      Rularea acestei opţiuni, face īnlocuirea lui ī din i cu ā din a, fără a face şi alte corecturi ale cuvintelor?...  sau, rulānd dicţionarele din componenţa AutoCorect se fac şi corecturi ale formelor cuvintelor?

      Să mă explic: pānă acum am folosit opţiunea "Īnlocuiri multiple" pentru trecerea de la text clasic īn text contemporan, din trei paşi.
      Pasul 1: Rulez un mic dicţionar doar pentru convertirea de cuvinte īntregi sīnt-sīntem-sīnteţi şi a erorilor de genul sint-sintem-sinteţi-sinteti… etc.
      Pasul 2: Īn continuare, ca să nu afectez textul am folosit un dicţionar cu peste 400 de īnlocuiri, practic fiecare īnlocuire fiind un grup de 3 litere cu litera ī la mijloc; īn acest mod am īnlocuit toate literele ī din interiorul cuvintelor, păstrānd neschimbate literele ī de la īnceputul şi sfārşitul cuvintelor.
      Pasul 3: Pentru corectarea cuvintelor compuse īn care litera ī din i apare īn mod corect īn interiorul cuvintelor am realizat un al treilea mic dicţionar, iar celelalte cuvinte necuprinse īn acest dicţionar, rămānānd īn număr mic, le corectam cu ocazia citirii cap-coadă a textului.

      Revenind,
      Mă interesează dacă folosind opţiunea „Editare ―> Conversie text clasic īn contemporan” obţin un rezultat comparabil cu cel obţinut prin varianta „Īnlocuiri multiple” sau apar şi corecţii īn plus faţă de cele prezentate de mine?

      Īmi pare rău dacă m-am exprimat cam īn multe cuvinte, dar am vrut să dau toate informaţiile pe care le-am crezut de cuviinţă.

      Cu stimă,
      Seven


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
menssana1984
Vizitator



Ideal ar fi sa se incerce, pe un text de 3-4 pagini, ambele optiuni.
Iar apoi sa se faca o comparatie.


pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
N-am mai lucrat cu metoda ta de conversie dar cred ca se obtin in ambele cazuri rezultate destul de apropiate de 100%.
La optiunea din meniu se transforma toate ī din interiorul cuvintelor in ā cu exceptia unor cuvinte dintr-un mic dictionar si a celor care incep cu aceste grupuri de caractere:

Code:

alt
anti
arhi
atoate
atot
auto
bine
bio
bun
cap
co
de
des
dez
ex
foto
hiper
micro
mini
mult
ne
nemai
non
piţ
piţi
prea
pre
pro
pseudo
răs
re
semi
sub
subt
super
supra
tele
tripla
ultra

Cum le-am gasit: am scanat toate cuvintele "compuse" ce aveau ī in mijloc. De regula oricare din acestea de mai sus + un cuvant ce incepe cu ī vor forma un cuvant care aproape intotdeauna va avea ī in mijloc.
Sunt putine exceptii dar majoritatea sunt incluse in acel mic dictionar mentionat mai sus.

Ambele metode au un punct slab: cum nu avem un dictionar cu toate cuvintele limbii romane (pe care bineinteles nimeni nu poate sa-l aiba - din motive obiective) vor exista cuvinte care vor ramane in format vechi sau vor fi modificate incorect.
Dar astea, cum ai spus, se rezolva la editarea manuala.

M-ai intrebat daca metoda din meniu merge la fel sau mai bine - nu pot sa ma pronunt 100% din moment ce nu am dictionarele folosite de tine ca sa pot face comparatie intre texte.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
      Īncerc să fiu mult mai scurt.

      Nu, nu la gradul de eficienţă mă refeream.
      E foarte clar că varianta mea cu "Īnlocuiri multiple", cel ăuţin īn acest moment, este mult mai slabă.
      Convertirea cu ajutorul "Īnlocuiri multiple" nu acţionează asupra cuvintelor scrise greşit.

      Īntrebarea era, dacă pe lāngă īnlocuirea lui ī cu ā, opţiunea "Editare ―> Conversie text clasic īn contemporan" face şi corectarea unor cuvinte pe care le consideră incorect scrise. Adică, dacă nu se face şi o corectare ortografică..

      Nu-mi vine la īndemānă un exemplu mai bun, dar... īncerc ceva.

      Să presupunem că īntr-un text apare cuvāntul scris intenţionat greşit bīrzīune.

      Pe mine mă interesează dacă după convertirea cu opţiunea: "Editare ―> Conversie text clasic īn contemporan", acest cuvānt va apărea scris bārzāune - ceea ce īmi convine, ori intră īn funcţiune şi anumite dicţionare şi se corectează īn bărzăune - chestie care nu-mi convine foarte tare.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Nu, nu sunt folosite si alte dictionare. E doar o conversie, nu corecteaza.

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
     Atunci e perfect, este excelent.

     Pentru că opţiunea "Conversie text clasic īn contemporan" este doar o conversie, rezultă că ea este mult mai bună decāt conversia prin metoda mea cu "īnlocuire multiplă", deoarece este mai eficientă, mai avantajoasă, din următoarele motive:

         - Opţiunea "Conversie text clasic īn contemporan" se face īntr-o singură etapă, pe cānd prin metoda "īnlocuirii multiple" se făcea īn 3 paşi;

         - Opţiunea "Conversie...." cuprinde mult mai multe excepţii la convertire pentru cuvintele compuse, deci corectitudinea este mai aproape de 100%; excepţiile la convertire din "Īnlocuiri multiple" cuprinde un dicţionar mult mai mic.


     Pentru userii care au folosit metoda īnlocuirilor multiple pentru trecerea de la text clasic la text contemporan, vă informez că este necesar să se elimine dicţionarele numite: "01 SĪNT-SUNT.imd"; "02 ī trece īn ā.imd"; "03 ā - ī.imd".

     Dicţionarul "11 Eliminare Spaţii.imd" se elimină şi el, deoarece lucrurile au fost rezolvate prin intermediul macrourilor din template-le pus pe forum, astfel că deocamdată primul dicţionar de īnlocuiri multiple ce rămāne de rulat este "12 L_l & 1_l.imd". Poate că īn curānd īn funcţie de discuţiile cu Cosmin, va putea fi eliminat şi el.


     Cosmin,
     deocamdată mă opresc aici, pānă săptămāna următoare.
     Īn timpul ce urmează am să-ţi trimit cele 3 liste cu propunerile mele de īnlocuire la cuvinte formate din două litere, cuvinte formate din 3, respectiv 4 litere.

     Avānd acum la dispoziţie funcţia de sortare īn ordine alfabetică, vreau să le mai revăd īnainte de a le pune la dispoziţie.

     Seven
                 


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
O intrebare: cum tu ai lucrat cu OCR-uri mai mult decat mine, spune-mi te rog cat de des apare situatia in care cratima din cuvinte e inlocuita gresit de Abby cu alt tip de liniuta (de exemplu cu cea de pauza)?

pus acum 9 ani
   
menssana1984
Vizitator



Destul de des. Si nu e singurul fel de liniuta inlocuit aiurea.
Din motivul asta de regula se converteste automat toate liniile in cratima, iar apoi inlocuim automat in functie de situatie (spatiu cratima spatiu > spatiu endash spatiu, ^p cratima > ^p emdash)


pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Aha, dar aceasta inlocuire de liniute se face inainte sau dupa conversie Clasic >> Contemporan?

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
***
      Cratima recunoscută incorect cu alte liniuţe...
      Practic nu se poate da un răspuns clar şi mai ales, un singur răspuns.
      Situaţia e diferită de la user la user, funcţie de cāteva setări ale Abbyy.

      Eu nu am astfel de probleme cu cratima, deoarece textul recunoscut de Abbyy īl salvez īn format rtf - Plain text. Īn această situaţie nu apar probleme la cratime, dar pot apărea probleme la liniile de dialog şi liniuţele de pauză

      Subliniez īncă o dată:
      Situatia in care cratima din cuvinte e inlocuita gresit de Abby cu alt tip de liniuta (de exemplu cu cea de pauza) - această situaţie īn cazul meu apare foarte rar sau nu apare de loc.
      Situaţia cānd linia de dialog sau linia de pauză sunt recunoscute eronat... - aici da, sunt frecvente astfel de situaţii.


      Aşa cum spune menssana, īn momentul cānd apar astfel de probleme, se pot rezolva īn procent foarte mare, relativ uşor cu Find&Replace din Word īn mai multe etape.

      Īntāi şi īntāi eliminăm toate spaţiile şi taburile de la īnceput de paragraf; după aceasta, practic linia de dialog ajunge să fie primul caracter la īnceput de paragraf.

      Mai apoi, facem īnlocuiri la linia de dialog, avānd posibilitatea să căutăm īn Word doar īnceputurile de paragraf.
      Urmează rezolvarea problemelor legate de linia de pauză; fiind īncadrată de regulă īntre pauze, iar uneori pauză linie virgulă ori alte formule... este destul de uşor de rezolvat īn marea majoritatea a acestora. ce rămāne nerezolvat se corectează la corectura prin citire.
      Ultimile se rezolvă cratimele [liniuţele de unire şi de despărţire], dacă este nevoie.

      Mai există nişte liniuţe care ne fac probleme: e vorba de liniuţele de despărţire a cuvintelor la capăt de rānd. Nu abordez īn acest moment problema lor; deocamdată am īncercat să răspund concret la īntrebarea privind cratimele.


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Da, multumesc pentru raspunsuri.
De ce am intrebat: conversia Clasic la Contemporan nu lua in considerare cazurile -ī respectiv ī- si le schimba in -ā respectiv ā- daca liniuta nu era cratima.
Am schimbat acu: http://www.mediafire.com/?9956it7vtmlkll6

Modificat de ciuperca_cosmin (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 10 ani
Am descărcat varianta de azi a AutoCorect, dar nu am lucrat īncă nimic cu el.

     Mai aduc īn discuţie o problemă. E vorba de majuscule accidentale īn interiorul cuvintelor.
     Practic nu am īnţeles exact dacă AutoCorect o rezolvă. Personal nu am văzut o opţiune specială īn acest sens.


     Există cāteva litere care au aceeaşi formă atāt ca majuscule cāt şi ca minuscule; le diferenţiază doar mărimea, iar Abbyy face confuzii.
     Este vorba despre: C-c, O-o, P-p, S-s, Ş-s, U-u, V-v, Z-z dar uneori şi despre [F-f, I-i, J-j, K-k].

     Datorită formei identice sau aproape identice a literelor, apar cuvinte īn care unele din aceste litere sunt scrise cu majuscule īn interiorul cuvāntului.
     Să zicem: aZur, reSPeCtiV, claSiC... etc... etc...

     Īntrebarea este: există deja implementată rezolvarea acestor gen de situaţii şi nu am remarcat-o sau īncă nu s-a pus o astfel de problemă?
     Subliniez că nu e vorba de situaţia īn care se foloseşte incorect Caps Lock, cum ar fi:
     sUBLINIEZ CĂ NU ESTE VORBA DE...

     Practic eu mă refer la situaţia cānd īntr-un cuvānt există o singură majusculă ori un grup de 2... poate că şi 3, dacă lui Abbyy nu i s-a făcut acomodarea şi antrenamentul corespunzător.

Modificat de Seven (acum 9 ani)


_______________________________________

     Oameni şi popoare īşi cată libertatea; după ce-o obţin, īşi caută stăpān.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 9 ani
Nu deocamdata nu e implementata.
Dar se poate implementa. Unde crezi ca ar fi potrivita - ca optiune separata care "niveleaza" literele in cuvant incepand cu a doua pozitie sau adaugata la una din cele deja implementate (si care)...?

PS: Eu ma gandesc sa o fac separata. Sa fie semiautomata si, prin clic pe un buton, sa mearga si automat. Ce parere ai...?

Modificat de ciuperca_cosmin (acum 9 ani)


pus acum 9 ani
   
Pagini:  1 2 3 4 ... 52    
Mergi la