Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
AlexandraPopa
Femeie
25 ani
Bucuresti
cauta Barbat
25 - 39 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect OCR Plus - continuare discuţii Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1 ... 2 3 4 5
tuf
Vizitator



Seven, este posibila vreo inlocuire de dictionar pentru situatia de jos:

„Vă rog să acceptați, domnule Capone, expresia regretului meu cel mai profund. Îmi pare rău, dar trebuie să vă anunț că planul meu a dat greș. Eu am dat greș. „
Gangsterul s-a ridicat încet în picioare.

E vorba de sfarsitul ghilimelelor.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Practic este uşor de rezolvat pentru situaţia în care acele ghilimele se află la sfârşit de paragraf.

      Dacă ele se află în interiorul paragrafului, teoretic este posibil, dar practic la căutare îţi va prezenta toate situaţiile de paranteză deschisă care nu e lipită de litera următoare...

      Cred că cel mai bine este să implementez prima situaţie în OCR_DIC, iar cea de-a doua situaţie într-un dicţionar CO_Vt1 - CO_Vt4

      Pentru prima situaţie am avea:
            minusculă_PUNCT_spaţiu_ghilimele - sfârşit de paragraf
unde PUNCT poate fi punct, semnul întrebării, semnul exclamării, elipsis, combinaţii ? sau ! urmat de elipsis.
     Aici trebuie puse condiţiile: "potrivire perfectă", "ignoră margine stânga 1 car", "sfârşit paragraf" plus "confirmare"

          ^l.^_„    >>    .„         Pp  Cli  Ps  Ims  In1

      Pentru a doua situaţie ar fi:
            minusculă_PUNCT_spaţiu_ghilimele_spaţiu_majusculă
      Condiţii: potrivire perfectă, "ignoră margine stânga 1 car", "confirmare"

          ^l.^_„^_^L    >>   .„^_       Pp  Cli  Ima  In1   

      În cazul ăsta doar practica ne va spune dacă înregistrările sunt eficiente sau nu.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Neah, cred ca e mai simplu sa fac un "dictionar" separat doar pentru cautarea acestor situatii, iar inlocuirea o fac manual, cu ochii pe scan.
Ma batea gandul de multa vreme oricum.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Am încercat să fac un dicţionar care se referă doar la situaţiile astea.
     Încearcă să vezi cum funcţionează. Îl cheamă "[00] Ghilimele noi.imd"

   

     Vezi dacă rezolvă ceva din problemele constatate.
     În mod sigur sunt situaţii pe care nu le "vede", adică alte tipuri de ghilimele. Eu am folosit ghilimele româneşti de forma 99, dar este posibil că vor fi şi alte situaţii.
     Spune-mi ce face şi ce nu şi voi încerca să-l îmbunătăţesc peste 3-4 zile.

     Încerc să urc azi şi celelalte dicţionare aşa cum sunt ele la momentul ăsta.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       Am mai adăugat două variante de ghilimele iniţiale.
       E vorba despre ghilimele sus sub forma 66 şi ghilimele drepte englezeşti.
       Am notat dicţionarul ca versiune [V2]
       Dacă mai apar şi alte situaţii, vă rog să mi le semnalaţi şi actualizez dicţionarul.

       Link:


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
        Cred că am ajuns la ultima versiune:
        Link:

        Avem în acest moment avem următoarele ghilimele iniţiale [eronate]:
             - ghilimele româneşti 99 jos;
             - ghilimele româneşti 66 sus;
             - ghilimele drepte verticale sus;
             - ghilimele drepte înclinate sus.

       Înregistrările din acest dicţionar-ciornă le voi adăuga într-un dicţionar OCR_DIC doar după ce verificăm cum se comportă aceste înregistrări.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



OK, descarcat. Revin de sunt probleme.

pus acum 9 ani
   
tuf
Vizitator



Seven, eu nu mai tin minte, noile dictionare OCR se ocupa si de problema ghilimelelor?
Ma refer la acel dictionar separat. De cand am pus noile dictionare OCR, problemele ghilimelelor au disparut, cu exceptia unei situatii legata de  ghilimele si puncte de suspensie la inceput de cuvant.

Cu dictionarul celalalt ai avut timp sa faci vreo ceva?


pus acum 9 ani
   
tuf
Vizitator



Fune > Pune la inceput de cuvant
Probabil ca trebuia sa fie cuvant intreg.


pus acum 9 ani
   
tuf
Vizitator



O recomandare de inlocuire:
cratima spatiu inlocuita cu nimic
spatiu cratima inlocuita cu nimic
Potrivire perfecta si confirmare la inlocuire

si pentru cazurile cuvintelor compuse

cratima spatiu cu cratima
spatiu cratima cu cratima

E vorba de cuvintele despartite la capat de rand. La cartile vechi stiu ca sunt destul de frecvente problemele.
"Ma chemase, deci m- am dus"


++++++++++++++++++++++++++++

O problema ciudata produsa de dictionare:

Ziceţi: ’Îl avem » Ziceţi: ’Âl avem

+++++++++++++++++++++++++++++++++

AC-ul, varianta OCR, functioneaza pe Ubuntu MATE. Atat ca instalare, cat si ca functionare.
De fapt cred ca functioneaza pe orice Linux ce poate rula Wine.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Poate n-ar trebui s-o spun pentru că deocamdată este doar un proiect sau şi mai exact o intenţie.
      Am în vedere 3 planuri de lucru:
            - Există intenţia ca macrourile lui @atari să fie cumulate într-un Template ceva mai deosebit care să cuprindă ceea ce a existat deja implementat într-un anumit template, dar şi alte opţiuni noi. Deocamdată aşteptăm ca el să intre într-o perioadă în care are mai mult timp liber spre a se apleca mai mult asupra unor macrouri.
            - În AutoCorect vreau să reduc timpul de rulare la maxim; o parte dintre opţiuni vor fi preluate de către macrouri, astfel ca AutoCorect să rămână în principal cu rularea dicţionarelor.
      Referitor la dicţionare, am trecut la faza la care reduc numărul de înregistrări, astfel încât timpul de rulare să fie mai scurt.
            - În al treilea rând am în vedere un utilitar separat, un fel de dicţionar cu confirmare în care utilizatorul să aibă un cuvânt la intrare cu 3 cuvinte la ieşire, astfel încât la o singură trecere, utilizatorul să aleagă varianta corectă. Dacă va fi posibil de implementat, poate că la ieşire pot fi chiar 4 sau 5 variante din care utilizatorul să aleagă. În acest mod se face o singură trecere prin text pentru o eroare cu mai multe variante.
      Exemplu: cuvântul "ou", poate fi în realitate "cu", "eu", "nu"... sau chiar "ou".
      Utilitarul ar trebui să-l găsească o singură dată şi să ofere cele 3 sau 4 variante. Utilizatorul alege varianta corectă şi merge mai departe. La momentul ăsta AutoCorect pentru cele 3 variante "ou >> cu", "ou >> eu", "ou >> nu" face 3 treceri prin tot textul şi asta cere şi timp şi îl plictiseşte şi pe utilizator.

      Pentru a eficientiza dicţionarele aş mai avea nevoie de nişte utilitare relativ simple, dar ar trebui să ne ajute nişte oameni cu pregătire în programare. Eu am pus în înregistrări şi cuvinte care apar mai rar, astfel că dicţionarele le caută chiar dacă astfel de cuvinte nu apar în text. M-ar interesa un utilitar care să numere succesiunile dintr-un text [adică cuvintele] şi să-mi facă o listă de 10-20 de cuvinte în ordinea descrescătoare a numărului de apariţii a succesiunii [cuvântului] în acel text. În felul acesta aş putea realiza un top 100 [sau top 500] al cuvintelor cu frecvenţă mare şi aş putea elimina înregistrările care referă la cuvinte care nu se regăsesc în listă.

      Deci, în principiu, undeva în viitor am putea peria un text folosind toate cele 3 instrumente: mai întâi rularea acelor macrouri dintr-un viitor posibil template, apoi continuând rularea unor opţiuni în AutoCorect şi apoi rularea în utilitarul cu o singură intrare şi mai multe ieşiri.

      Aşa cum am spus, e mai mult un gând decât un plan bine pus la punct.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
tuf
Vizitator



Uite o posibila problema legata de conversia din text clasic in text contemporan.

chestia asta: "niciuna, nici alta...", în loc de "nici una, nici alta"

Nu mi-a sarit in ochi pana acum, deoarece corectam manual inclusiv aceste cazuri. Dar este corect daca zic ca conversia de text se face in masa si indiferent de context?
Expresia de mai sus o gasesc problematica.
Dilema interesanta. Dar ce face AC-ul pare sa fie corect.
Oare sa fi dat de o exceptie de la regula prin intermediul acelei expresii?


pus acum 9 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
O întrebare: care este ultima versiune de Autocorect OCR Plus?

Eu am găsit două topicuri, unul de 52 de pagini soft + discuţii şi altul de 17 pagini de discuţii despre acest soft.
Pe situl dedicat versiunea este 4.1.5, iar pe aici am văzut că se vorbeşte de versiunea 5.

Poate n-am ştiut eu să caut sau poate ar trebui creat un topic pus sus cu referire doar la soft, fără nici un fel de discuţii, ceva de tipul: AC Plus - ultima versiune + ultimele dicţionare


pus acum 9 ani
   
tuf
Vizitator



Nu mai exista versiune finala de AC de mult timp.
Exista doar versiuni de dictionare.

1. Instalezi.
2. Inlocuiesti executabilul normal cu executabilul modificat.
3. Adaugi dictionarele in dosarul Roaming/AutoCorect Contemporan.
4. Daca folosesti dictionarele de la optiunea 9 din OCR+, trebuie sa dai calea catre ele.

Ai aici tot ce iti trebuie:

P.S.
Am vorbit deja cu Seven pentru realizarea unui subiect final de AC... dar na, zilele astea au fost cum au fost, plus ca nu intentioneaza sa mai faca vreo ceva cu AC-ul... pe moment cel putin.

Modificat de tuf (acum 9 ani)


pus acum 9 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 15 ani
Am priceput, mulţumesc pentru informaţii şi link.

După instalarea AutoCorect, conform indicaţiilor de mai sus oferite de @tuf, am descoperit
că mi-a dispărut opţiunea Text Document din meniul contextual New.
Analizînd registrul în cauză, am văzut că a fost modificat ca în imaginea 1 de mai jos.
Cheia ShellNew era neschimbată.



L-am readus la forma iniţială care trebuie să fie ca în imaginea 2.



Nu ştiu dacă a mai păţit cineva aşa ceva, dar dacă se întîmplă, poate că postarea aceasta îi va fi de ajutor.

Mai jos aveţi registrul .txt corect, salvat. Trebuie descărcat şi rulat.


Modificat de uciN (acum 9 ani)


pus acum 9 ani
   
Pagini: 1 ... 2 3 4 5  

Mergi la