Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
lovely_pink
Femeie
25 ani
Bucuresti
cauta Barbat
25 - 48 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect versiune pentru Romania-Inedit Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1 ... 3 4 5 6 7 8 9 ... 13
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Revin cu lista dicţionarelor necesare rulării opţiunilor.
      Am notat cu Bk pe cele realizate de BlankCd şi cu K7 pe cele realizate de mine, pentru ca să fie mai uşor de găsit cele care, eventual, lipsesc.

     Bk  1.   DApco.imd – dicţionar ştergere artefacte cărţi obişnuite
     Bk  2.   DApct.imd – dicţionar ştergere artefacte cărţi tehnice

     K7  3.   DE.imd – dicţionar suplimentar elipsis

     Bk  4.   DF.imd – dicţionar convertire majusculă în minusculă în dialog francez

     K7  5.   DGcl.imd – corectează cuvinte în care litera d este scrisă eronat c+d
     K7  6.   DGrn.imd – corectează cuvinte în care litera m este scrisă eronat r+n

     K7  7.   DLd.imd – corectează linii de dialog însoţite de artefacte
     K7  8.   DLp.imd – corectează linii de pauză însoţite de artefacte

     K7  9.   DMidp.imd – corectează minuscule la început de paragraf şi dialog

     K7  10.  L1.imd, L2.imd, L3.imd – corectează situaţii în care litera L mic este scrisă eronat 1, I şi !
     K7  11.  S1.imd, S2.imd, S3.imd, S4.imd – corectează cuvinte scurte scrise eronat

      Mă interesează dacă mai există vreun dicţionar netrecut în listă.
      Mie îmi lipseşte  DF.imd – convertire majusculă în minusculă în dialog francez şi nu ştiu dacă este cumva în lucru.


      PROBLEME ŞI ÎNTREBĂRI DESPRE DICŢIONARE:
      ■ La dicţionarul de convertire în majuscule la început de dialog şi început de paragraf [DMidp.imd] menţionez următoarele:
           ** La început de dialog: am înregistrat toate situaţiile în care apar următoarele litere: [c î j o p s u v z] cu literele [C Î J O P S U V Z] - dacă apar probleme de acest gen, rog să fie semnalate, pentru a le înregistra.
           ** La început de paragraf normal:
                    - litera î: am pus doar câteva cuvinte care încep cu litera Î, dar numai câteva, acele cu care m-am gândit că ar începe un paragraf.  Nu am pus înlocuirea tuturor î cu Î la început de paragraf, pentru a evita pe cât posibil scrierea cu majusculă a primului rând din pagină, care de fapt nu este paragraf nou, ci de cele mai multe ori este o continuare a paragrafului început pe pagina anterioară.
                    - litera I am înlocuit-o cu Î - deocamdată 18 înregistrări ca: Insă-Însă, Incă-Încă... - voi continua cu alte cuvinte pe măsură ce le descopăr în OCR-uri ca fiind nemodificate; menţionez că lucrez numai cu cuvinte întregi.
                    - alte litere nu am înregistrat pentru început de paragraf.
           ** Început de propoziţie în interiorul paragrafului sau mai exact "Punct_Spaţiu_LiterăMică" transformat în "Punct_Spaţiu_LiterăMARE" - nu am făcut încă nicio înregistrare, atât din lipsă de timp, dar şi pentru că am luat în calcul faptul că sunt multe cazuri de punct eronat în text, lucru ce ar face să apară înlocuiri acolo unde ele nu ar trebui să existe... încă sunt în dubiu aici.

      Întrebare:  Să fac înregistrări şi pentru situaţiile:
           1. pentru toate literele î la început de paragraf?
           2. pentru alte litere la început de paragraf [cîjopsuvz] cu [CÎJOPSUVZ]?
           3. pentru litera î în succesiunea "Punct_Spaţiu_LiterăMică"?
           4. pentru litera î după alt semn de punctuaţie, în succesiunea "Semn_Spaţiu_LiterăMică"?
           5. pentru alte litere în succesiunea "Punct_Spaţiu_LiterăMică"?

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani

BlankCd a scris:

--->

     @ lucifer76

   
      Aş vrea să ştiu stadiul completării dicţionarului la care lucrezi. Nu ştiu dacă ai adăugat în dicţionar ceea ce am scris în urmă cu câteva pagini.
     

Tocmai asta e problema, ai adaugat prea multe si ai facut treaba prea bine. La dictionarul meu nu prea am mai avut ce sa adaug, la ultimele 3 carti corectate nu am mai gasit decat 4 exemple care mai trebuiau adaugate dupa ce am rulat dictionarul tau. 


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, e bine asa, ma apuc sa implementez rularea automata.
Am sa numerotez optiunile in meniuri si in aceasta rulare automata.
Intrebare: sa fie tot un meniu sau sa fie buton pe una din cele doua bare?


pus acum 12 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 14 ani
--->

                                        Centralizator despre ce ar mai trebui făcut pentru îmbunătăţirea meniului OCR Plus:



     1. De adăugat la meniul actual "Marcare caractere" submeniul "consoane independente":
          1.1 - de marcat ŞI pentru literele CONSOANĂ MAJUSCULATE [acum evidenţiază numai minusculele]
          1.2 - şi consoanele - cu literă mare şi mică - care conţin diacritice: Ş, ş, Ţ, ţ, [atât cu cedilă cât şi cu virgulă – ca să meargă în ambele variaţii, sper că merge].
          1.3 - de marcat şi literele: Î, î precedate şi urmate de spaţiu
          1.4 - de marcat litera I literă mare în configuraţia "spaţiu""I""spaţiu" deoarece uneori ea este convertită greşit din semnul întrebării. Eroarea apare frecvent atunci când tiparul lasă spaţiu între ultima literă din cuvânt şi semnul mirării.

     2. De adăugat la meniul actual "Marcare caractere" pentru submeniurile atât pentru cărţi obişnuite cât şi pentru cele tehnice:
          - să marcheze caracterele « şi »

     3. Implementarea unui nou submeniu la meniul "Marcare Caractere" intitulat "Marcare cifre arabe" care să marcheze cifrele arabe: 0123456789.
     De ce? Pentru că:
          - la unele cărţi capitolele sunt doar cifre arabe fără titlu
          - în carte mai sunt ani care este posibil să fie eronaţi 1986 să fie 1966 – trebuie verificat cu pdf-ul, sau cifre care indică ora, longitudinea, greutatea etc.
          - există şi numerele de pagină care ne ghidează în corectare, mai ales atunci când numărul paginii nu este delimitat de un rând gol, ci efectiv numărul este amestecat cu textul.

     Exemplu:
     "Un murmur înăbuşit se ridică din toate colţurile sălii. J3e întâmpla atât de rar, era atât de extraordinar ca Fouquier să ceară achitarea cuiva, încât toată lumea credea că a înşelat-o auzul."

     4. Implementarea unui nou submeniu la meniul "Marcare Caractere" intitulat "Marcare cifre romane" care să marcheze cifrele romane care fac referire la secole dar şi la numerotarea capitolelor unei cărţi – XIII, LI, IX, XXI, XVIII etc. etc. care de obicei apar eronate.
     Cred că ar fi mai uşor marcarea literelor MAJUSCULATE aflate una lângă cealaltă – adică a grupurilor de litere care sunt majusculate.

     5. Implementarea unui nou submeniu la meniul "Marcare Caractere" intitulat "Marcare erori de punctuaţie" care să:
          5.1 marcheze erorile de punctuaţie:

          !..   ?..    :..   ;..   !?.   .?!   ;:   :!   ?:   ?;   ,!   ;,   !,.   ,.!   .,?   .,   -:   ;-   .!   ..
          .!.   .?.    .:.   .;.   ?!.   !.?   :;   ;!   :?   ,?   !,   ,:   ,!.   ..    ,.?   .:   :-   !.    ?.
          ..!   ..?    ..:   ..;   .!?   ?.!   !:   !;   ;?   ?,   ,;   :,   .,!   ,?.   ,.    :.   -;   ..,   .?

          5.2. marcheze "i…" (cu elipsis) dar în configuraţia "spaţiu""i""elipsis".

     Exemplu:
   "Desigur, de-ar fi văzut râsul ironic, din ultimul moment, ce-l avea pe buze Fouquier, n-ar mai fi fost atât de fericit şi încrezător i…"

     6. La meniul actual "Înlocuieşte toate liniile de pauză" nu este introdusă posibilitatea înlocuirii liniilor de pauză urmate de virgulă. Ar trebui introdusă.

     7. Problema liniilor de pauză de tip EmDash, EnDash şi Horizontal Bar mărginite de litere, NU şi cratima, ex.:
          7.1 - "pentru corector —un reper de pagină"
          7.2 - "pentru corector— un reper de pagină"
          7.3 - "pentru corector—un reper de pagină"

     Ar trebui ca în cazul în care linia de pauză este lipită de literă să introducă un spaţiu:
          - din "literă""spaţiu""linie de pauză""literă" în "literă""spaţiu""linie de pauză""SPAŢIU""literă"
          - "literă""linie de pauză""spaţiu""literă" în "literă""SPAŢIU""linie de pauză""spaţiu""literă"
          - "literă""linie de pauză""literă" în "literă""SPAŢIU""linie de pauză""SPAŢIU""literă"

     8. Eliminarea semnelor de punctuaţie care se află înaintea cuvintelor, dar numai acolo unde este precedată de "marcaj de sfârşit de paragraf".
     Secvenţa ar fi înlocuirea din: "marcaj de sfârşit de paragraf""semn de punctuaţie – oricare ar fi el""spaţiu" în "marcaj de sfârşit de paragraf".
     ATENŢIE! Meniul sau codul ar trebui să ruleze ULTIMUL după submeniul "Rupere rânduri care încep cu dialog aflate în interiorul paragrafelor". Dacă este pus mai sus ar putea da erori.

     Exemple:
     " — Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc.
     . Şi se plimba încolo şi încoace gânditor.
     Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"

     "— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc.
     , Şi se plimba încolo şi încoace gânditor.
     Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"

     "— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc.
     ; Şi se plimba încolo şi încoace gânditor.
     Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"

     "— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc.
     : Şi se plimba încolo şi încoace gânditor.
     Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"

     "— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc.
     ! Şi se plimba încolo şi încoace gânditor.
     Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"

     "— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc.
     ? Şi se plimba încolo şi încoace gânditor.
     Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"

     9. Unele paragrafe [sau propoziţii] la sfârşitul lor nu au semne de punctuaţie: punct, punct şi virgulă, semnul întrebării sau exclamării. Aceste paragrafe fie au o virgulă pusă eronat în locul punctului ori nu au nimic. Întrebare este posibil evidenţierea-marcarea ultimului cuvânt sau literă din paragraf? Şi evident evidenţierea virgulei de la sfârşitul paragrafului? Evident numai la paragrafele care se încheie fără semne de punctuaţie.

     Exemple:
     "— Să facem lucrurile bine, ca să nu ne scape puicuţa. În ultimul moment, murmură el. Eu o să mă postez la un colţ al străzii, tu la celălalt colţ; aşa, vom şti exact încotro se duce, şi nu vom risca să n-o prindem
     — Bravo ţie, măi frate! zise Samulon. Tu eşti un voinic fără seamăn!
     Pipin ţiganul avu un rîs satanic."

     "— Să facem lucrurile bine, ca să nu ne scape puicuţa. În ultimul moment, murmură el. Eu o să mă postez la un colţ al străzii, tu la celălalt colţ; aşa, vom şti exact încotro se duce, şi nu vom risca să n-o prindem,
     — Bravo ţie, măi frate! zise Samulon. Tu eşti un voinic fără seamăn!
     Pipin ţiganul avu un rîs satanic."

     10. Unele paragrafe încep cu puncte de suspensie urmate de spaţiu.

     Exemplu:
     "Trecu prin „spărtura” zidului, de unde se urcă pe scara secretă luminată ca ziua…
     … I se păru că aude o voce şi paşi de om.
     Scoase imediat creionul de fier din zăvor: în acelaşi moment, zidul se închise cu un zgomot înfundat, lugubru…
     … Dar Călăul se înşelase crezând că vocea venea din pivniţa secretă. O auzi acum mai tare, mai desluşit ca înainte."

     Am în vedere că "trei puncte" a fost deja convertit în elipsis. Secvenţa ar fi: înlocuieşte "marcaj sfârşit de paragraf""elipsis""spaţiu" cu "marcaj sfârşit de paragraf""elipsis". Ar trebui să arate aşa:

     "Trecu prin „spărtura” zidului, de unde se urcă pe scara secretă luminată ca ziua…
     …I se păru că aude o voce şi paşi de om.
     Scoase imediat creionul de fier din zăvor: în acelaşi moment, zidul se închise cu un zgomot înfundat, lugubru…
     …Dar Călăul se înşelase crezând că vocea venea din pivniţa secretă. O auzi acum mai tare, mai desluşit ca înainte."

     11. Problema sfârşit de pagină sau page break, şi sfârşit de secţiune, de eliminat – eventual cu bifare pentru a putea activa opţiunea atunci când avem un OCR, şi debifare atunci când avem un text la care nu dorim eliminarea sfârşitului de pagină sau sfârşit de secţiune. Ar putea fi implementat în "Convertiri preliminare".

     12. Problema rândurilor goale mă refer la 2 sau mai multe rânduri care ar trebui convertite într-un singur rând. Rândul gol pare la prima vedere o greşeală dar de obicei acest rând reprezintă trecerea de la o pagină la alta şi reprezintă pentru corector un reper de pagină. Acest rând gol îl va şterge corectorul în mod manual. În text rândul gol mai reprezintă şi graniţa între text şi strofe sau versuri. Ar putea fi implementat în "Convertiri preliminare".

     13. De implementat propunerea lui Cosmin mai complicată tehnic: "consi- deram", înlocuieşte cu  "consideram" prin scanarea textului de către cod… [rămâne la aprecierea lui Cosmin dacă se poate implementa]

     14. De implementat meniul "Convertire linii de dialog"

     15. De implementat meniul "Convertire ghilimele". Acest meniu ar trebui să convertească ghilimelele româneşti în tot felul de ghilimele, cred că sunt vreo 3-4 feluri de ghilimele.


     Am numerotat propunerile cu ce ar mai fi de făcut deoarece aşa este mai uşor de ţinut evidenţa.



     @ lucifer76 - o să actualizez eu acel dicţionar deoarece am mai strâns câte ceva.

     @ Cosmin - referitor la Rularea meniului OCR Plus în mod automat şi corect-cronologic, eu îl văd aşa - nu ştiu dacă se poate implementa: fiecare meniu şi submeniu ar trebui să aibă o pătrăţică pentru bifat iar la apăsarea butonului "Rulare dicţionare bifate" să ruleze numai meniurile bifate.

Modificat de BlankCd (acum 12 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

BlankCd a scris:

@ Cosmin - referitor la Rularea meniului OCR Plus în mod automat şi corect-cronologic, eu îl văd aşa - nu ştiu dacă se poate implementa: fiecare meniu şi submeniu ar trebui să aibă o pătrăţică pentru bifat iar la apăsarea butonului "Rulare dicţionare bifate" să ruleze numai meniurile bifate.


BlankCD, am discutat despre asta cu cateva zile in urma si am spus ca in meniurile standard nu se pot pune casute de bifare. Se pot bifa/debifa fara casute dar in acest caz se pierde rularea functiei din meniu.
Iar pe de alta parte utilizatorul nu va putea schimba ordinea de rulare a optiunilor (rularea automata le-ar rula in ordinea in care sunt in meniuri).

Daniel a facut un mic demo care exemplifica cum ne gandim sa implementam:
Se pot muta optiunile sus/jos cu mouse sau Shift+Sus/Jos + se pot bifa/debifa. Iar dupa ce se ajunge la un consens in privinta ordinii de rulare se poate implementa ca implicita.
Ce parere aveti?

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 14 ani
--->

     L-am deschis arată bine, dar nu l-am lipit în AutoCorect - nu ştiu dacă îl acceptă.
     Să ai în vedere posibilitatea bifării şi debifării atât a meniurilor cât şi a submeniurilor, pentru că unele meniuri vor rula doar cu anumite submeniuri nu cu toate bifate. Acelaşi lucru şi pentru meniuri: unele vor fi rulate unele nu.


     Am terminat de completat şi dicţionarul DF.imd, are acum 670 de intrări, Seven îl poţi pune în arhivă:
   

Modificat de BlankCd (acum 12 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
E un exe separat de AutoCorect - doar un exemplu.
Deci cum sa fie rulabila: tot un meniul in OCR Plus (primul poate) sau un buton pe una din bare?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Privind implementarea automată a rulării opţiunilor "Proiect1":
     Cred că poate fi prins ca prima opţiune în meniul OCR_PLUS, eventual separat cu linie de celelalte opţiuni.
     Deşi cred că mai necesită o singură modificare, principiul de funcţionare mi se pare foarte bun, deoarece permite activarea şi dezactivarea fiecărei opţiuni în parte, precum şi modificarea ordinii lor, ceea ce cred eu că înseamnă maximă flexibilitate.

     Propunere de modificare:
     În listă să apară numele fiecărei opţiuni în parte şi nu numai numele pachetului de opţiuni, astfel că în loc de opţiunea:
              "1. Convertiri preliminare",
ar fi mult mai convenabil dacă apar toate opţiunile pachetului sub forma:
              1.1. Convertire dialog bullets în dialog text
              1.2. Setare text la font şi mărime unică
              1.3. Eliminare tab şi spaţii multiple
              1.4. Eliminare spaţii la început de paragraf
              1.5. Repararea rândurilor rupte
              1.6. Rupere rânduri care încep cu dialog aflate în interiorul paragrafului.

     Numele unora dintre opţiuni poate fi scurtat în această listă, astfel încât lista să nu arate foarte stufos şi să rămână uşor de urmărit: de exemplu, în loc de "1.6. Rupere rânduri care încep cu dialog aflate în interiorul paragrafului", poate apărea în listă doar 1.6. Rupere rânduri...".


     Despre erori ale opţiunilor implementate:
     Din cauză că cele trei volume cu care am făcut textele nu conţineau linie de pauză urmată de virgulă, nu am văzut că nu se făcea modificarea şi în aceste situaţii.
     Practic s-a implementat succesiunile "Spatiu_LiniePauză_Spatiu" şi mai trebuie implementate şi succesiunile "Spatiu_LiniePauză_Virgulă_Spatiu".


     Privind alte implementări.
     Personal, aşa cum am subliniat de mai multe ori, am convingerea că programul trebuie finalizat în actuala formă, apoi testat, folosit şi răstestat şi răsfolosit şi doar după aceea să vedem ce anume este necesar a fi completat şi îmbunătăţit.

     Pentru a putea fi testat de cât mai mulţi utilizatori, programul trebuie să fie cât mai SUPLU şi uşor de înţeles şi folosit.

     AVEM DEJA la această oră PESTE 35 DE OPŢIUNI, dintre care unele cu setări complexe, astfel că eu cred că programul este suficient de PUTERNIC, COMPLEX şi chiar un pic STUFOS.
     Pe de altă parte, e posibil ca unele opţiuni să nu ruleze exact aşa cum ne dorim şi să mai dea erori, deoarece ori nu am gândit toate condiţiile, ori sunt probleme de implementare; pentru a putea constata astfel de eventuale-erori, aceste opţiuni trebuie să fie cât mai puţine pentru a putea fi urmărite relativ uşor.

     Orice adăugare de noi opţiuni, transformă programul în ceva greu de folosit şi mai ales, necesită multă muncă din partea programatorilor.
     Doar definitivarea lui poate permite folosirea de către mai mulţi useri, astfel încât doar atunci putem constata dacă toată această muncă a meritat sau nu.
     Dacă programul va fi folosit de mulţi utilizatori, înseamnă că tot efortul a meritat, dacă el nu va avea "priză", atunci nici implementarea altor ooţiuni nu se mai justifică.

     Personal sunt pentru definitivarea acestei versiuni a programului şi oprirea implementării oricăror alte opţiuni.

     După primele 1000 de mulţumiri ale utilizatorilor postate pe acest forum în semn de respect pentru munca depusă de Cosmin în realizarea acestui program, se poate continua perfecţionarea acestei versiuni.

     Toată stima şi toate cele bune!
     Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 14 ani
--->

     @ Seven   Nu este frumos să fluieri sfârşitul jocului şi să pui punct. Eu am anunţat că ar mai fi câte ceva de adăugat acum câteva zile, astăzi vii şi pui punct fără a consulta şi pe ceilalţi participanţi la dezvoltarea programului.
      Nu este fair-play din partea ta.
      Sincer am o amăreală că am pierdut atâta timp pentru asta, cu siguranţă aş fi avut altceva mai bun de făcut.
      Te las să continui dezvoltarea programului cum crezi de cuviinţă, eu am crezut că dau o mână de ajutor... şi când colo mă trezesc LOVIT cu linia peste mână şi fluierat că "s-a depăşit timpul acordat jocului."

Modificat de BlankCd (acum 12 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Probabil că asta am făcut.
     Recunosc că nu este fair-play, îmi cer scuze tuturor pentru asta.
     Topicul este o mult prea frumoasă iniţiativă a unor oameni pentru a-l transforma într-un topic de discuţii contradictorii, aşa că nu mai fac niciun comentariu.
     Cred că eu personal am profitat mult prea mult de bunăvoinţa, munca şi timpul lui Cosmin şi al lui Daniel.
     Mai cred că forumul m-a transformat în altceva decât ceea ce sunt, fapt pentru care fluier numai pentru mine sfârşitul jocului şi ieşirea din teren.
     Mii de mulţumiri şi toate cele bune!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat rularea automata.
Deocamdata in lista apar denumirile complete la meniuri si submeniuri dar daca intr-adevar va deranja asta voi cauta o solutie in viitor. Pe moment denumirile complete sunt necesare ca sa stie ce meniu sa ruleze.
E deocamdata in stadiu de testare - daca observati vreo problema nu ezitati sa scrieti despre ea si sa dati chiar un exemplu pentru a se intelege mai usor despre ce e vorba.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am adaugat arhiva cu dictionare imd in prima postare din topic. Daca cineva are sau va avea versiuni mai bune la aceste dictionare le voi adauga.

pus acum 12 ani
   
AutoCorect
Membru Puf

Inregistrat: acum 13 ani
fara mess

Modificat de AutoCorect (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am testat vânătorul de cerbi - 490 pagini obişnuite şi s.p. -  460 pagini format mare, în varianta cu activarea numai a opţiunilor obligatorii şi în varianta cu activarea tuturor opţiunilor prevăzute în program, a tuturor dicţionarelor şi în plus, a 20 de dicţionare uzuale.
      Timpii în care au rulat  toate opţiunile sunt cei redaţi în imaginea de mai jos.



      Sunt sigur, programul poate suporta multe modificări şi perfecţionări, dar cert este că avem la acest moment un puternic şi util instrument pentru digitalizarea cărţilor.
      Şi, din fericire, acesta este un program "pur sânge românesc".

      Cosmin şi Daniel,
      Sincere felicitări şi mii de mulţumiri!
      şi... Jos pălăria!

    Seven     


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator



Seven, nu am avut niciun fisier cu apostroafe.
I-am dat un ocr, lui Cosmin, cu o droaie de dialoguri prinse in ghilimele, dar cam atat.

Am o intrebare legata de acest dictionare personalizate.

Cum se poate afla daca acelasi dictionar nu contine cumva aceeasi inregistrare de mai multe ori? Un mesaj de atentionare ceva?

Treaba asta e, zic eu, la dictionarele normale (nume proprii, termeni care nu exista in dictionarul default, cuvintele scrise cu liniuta, etc).

Blanck, incearca sa nu iei lucrurile prea in serios. Ce zice Seven e una, ce face Cosmin si colegul lui e alta. E pacat ca tocmai acum cand lucrurile incep sa mearga bine sa te distantezi de proiect.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Menssana, la dictionarele i.dic si p.dic (daca despre ele vorbesti) codul AC incearca sa nu puna dubluri dar, daca exista totusi, nu afecteaza functionarea si deci nu cred ca e asa necesara atentionarea...

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
....iar la imd-uri, când încerci să salvezi o înregistrare, care deja există, apare o fereastră de avertizare:



Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Seven, am fost ocupat cu implementarea rularii automate si acum am timp sa ma ocup de ce ai mentionat:

Despre erori ale opţiunilor implementate:
     Din cauză că cele trei volume cu care am făcut textele nu conţineau linie de pauză urmată de virgulă, nu am văzut că nu se făcea modificarea şi în aceste situaţii.
     Practic s-a implementat succesiunile "Spatiu_LiniePauză_Spatiu" şi mai trebuie implementate şi succesiunile "Spatiu_LiniePauză_Virgulă_Spatiu".


E vorba de o functie care nu merge bine? Poate 9.3?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      E vorba de opţiunea ■ 7. Înlocuieşte toate liniile de pauză cu:   – EmDash  sau  – EnDash  sau – Horizontal Bar.

      Există două situaţii folosite în cărţile actuale
        "Spatiu_LiniePauză_Spatiu" şi
        "Spatiu_LiniePauză_Virgulă_Spatiu".

      Înlocuirea rulează doar pentru prima succesiune, dar nu şi pentru varianta când linia este urmată de virgulă.

      LE: Am refăcut testarea acum cu ultima variantă a executabilului şi problema există.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Bine, o sa adaug si situatia cu virgula.

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat si situatia cu virgula. In rest am mai reparat cateva mici erori + am adaugat un buton "Implicit" la rularea automata cu care se poate reveni rapid la ordinea si bifarea implicita.

Celor care au folosit rularea automata la versiunea anterioara le recomand sa stearga fisierul "c:\Documents and Settings\Nume_utilizator\Application Data\AutoCorect Contemporan\RulareAutomataOCRPlus.txt" in XP respectiv ""c:\Users\Nume_utilizator\AppData\Roaming\AutoCorect Contemporan\RulareAutomataOCRPlus.txt" in Vista/7.
Am schimbat numele unui meniu si ar putea genera probleme.

Cum merge cu testarea ordinii de rulare a optiunilor - ati gasit ordinea buna?

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     ■ Butonul implicit este foarte bun - mai ales pentru începători.
     ■ Ordinea opţiunilor pare bună până în prezent... vom constata dacă este corectă după mai multe setări.
     ■ Activările implicite - aici mai trebuie revizuit şi trebuiesc dezactivate câteva opţiuni.
     Avem două situaţii:
           - opţiuni ce nu pot rula împreună - este cazul opţiunilor ■ 7 şi ■ 8, deoarece se poate alege doar una dintre cele trei variante. Am marcat cu ■ opţiunile ce trebuie activate implicit, şi cu -- pe cele nectivate; propun să fie activate astfel:
         
              -- 7.1 Înlocuieşte toate liniile de pauză cu: >> EmDash
              ■  7.2 Înlocuieşte toate liniile de pauză cu: >> EnDash
              -- 7.3 Înlocuieşte toate liniile de pauză cu: >> Horizontal Bar

              ■  8.1 Înlocuieşte toate liniile de dialog cu >> EmDash
              -- 8.2 Înlocuieşte toate liniile de dialog cu >> EnDash
              -- 8.3 Înlocuieşte toate liniile de dialog cu >> Horizontal Bar

           - opţiuni ce trebuie să fie activate doar de către utilizatorii în cunoştinţă de cauză şi care vorr sigur să fie rulate opţiunile. Este vorba de opțiuni care șterg elemente de test și aici se încadrează toate opţiunile de la pachetele ■ 6, ■ 9 şi ■ 10.
      ■ 6. Ştergere caractere
      ■ 9. Eliminare linii de pauză exclusiv din Dialoguri - 3 opţiuni
      ■ 10. Elimină TOATE liniile de pauză din text - 4 opţiuni

      Tot inactivă ar trebui să fie şi opţiunea "11. Rulare grup de dicţionare înlocuire multiplă", deoarece aceasta ar putea să fie rulată separat şi nu neapărat în prima etapă de curăţare a OCR-ului.

      Deocamdată astea ar fi primele observaţii.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator



A... imediat ce considerati ca e ok... va rog ca in ultima postare sa ramana un link catre exe si restul dictionarelor.
Multumesc pentru munca depusa 


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am început perierea tuturor dicţionarelor care rulează automat, pentru a nu rămâne înregistrări care ar putea avea efecte secundare asupra textului.
      Am adăugat în dicţionarul S1.imd zece înregistrări care transformă diferite tipuri de apostrof în apostrof românesc.
     
      Varianta cea mai nouă a executabilului AutoCorect şi arhivele cu dicţionarele sunt postate şi vor fi reactualizate în prima şi a doua postare de pe topic.
      Cred că pe prima pagină a topicului sunt mult mai vizibile; ultima postare va fi mereu alta, aşa că aici ar fi mai greu de urmărit.


      LE: Am reactualizat dicţionarele şi le-am urcat pe mediafire
            A mai rămas de finisat [de pus condiţii de tipul Potrivire perfecta şi Cuvânt întreg] dicţionarul DF.imd. pe host există o variantă de dicţionar fără condiţii şi o variantă în lucru.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am debifat ce ai mentionat.
La sugestia lui BlankCD am adaugat butonul "Corectare OCR" la panelul din stanga. Deocamdata porneste "rularea automata".
In plus la Inlocuire multipla langa butonul de deschidere dictionar am adaugat altul cu care poti crea un dictionar nou respectiv poti accesa ultimele 5 dictionare pe care s-a lucrat.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
Pentru BlankCD, dictionarul meu
L-am lasat separat de al tau, nu stiu cate exemple sunt comune, dar sunt sigur ca sunt unele care lipsesc de la tine. La ultimele 2 carti facute, rulam dictionarul tau si le adaugam la mine pe cele gasite si dupa aceea.

Ideea cu ruleaza toate functiile e geniala.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am eliminat din Dicţionarul lui lucifer76 înregistrările care se regăsesc în acest moment în dicţionarul DF.imd urcat de BlankCd.
      Înregistrările care nu există în DF.imd se află în dicţionarul:
          [lucifer] corectare automata - redus.imd
         
      Aştept ca BlankCd şi lucifer76 să facă o periere a lui, după care, înregistrările rămase am să le adaug la dicţionarul DF.imd.

      Am completat dicţionarul DF.imd cu condiţia "Potrivire perfectă" şi sunt în curs de adăugare a codului pentru spaţiu după fiecare înregistrare; urmează să-l urc pe mediafire pentru teste.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am imbunatatit editarea inregistrarilor la dictionarele Inlocuire Multipla: se pot sterge mai multe deodata, se pot copia, decupa, lipi. Comenzile sunt cele uzuale (Ctrl+C/V/X sau in meniul contextual).

pus acum 12 ani
   
menssana1984
Vizitator



Cosmin, incerc sa fac un dictionar de cuvinte corecte, dar straine AC-ului, inclusiv cele cu liniuta.
Pot sa le pun pe toate la gramada intr-un singur fisier?
Ideea e sa le adaugi in timp in dictionarul default al programului de pe site.


pus acum 12 ani
   
menssana1984
Vizitator



Cosmin, ai implementat codurile cerute de Seven?
Adica ^s si restul?
Si daca da, pot fi folosite in fereastra de combinatii de taste?


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

menssana1984 a scris:

Cosmin, incerc sa fac un dictionar de cuvinte corecte, dar straine AC-ului, inclusiv cele cu liniuta.
Pot sa le pun pe toate la gramada intr-un singur fisier?
Ideea e sa le adaugi in timp in dictionarul default al programului de pe site.


Da, pune-le.



menssana1984 a scris:

Cosmin, ai implementat codurile cerute de Seven?
Adica ^s si restul?
Si daca da, pot fi folosite in fereastra de combinatii de taste?


Am implementat, atat la Inlocuire multipla cat si la functia ce seteaza combinatii de taste.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
menssana1984,
     Lucrezi la un dicţionar .imd, de înlocuiri multiple?
     Dacă răspunsul e "da", atunci poţi să le pui cum vrei şi le separ eu pe căprării, încercând să le pun în dicţionarele care rulează deja.

     Şi voiam să-ţi spun că am început şi eu un dicţionar cu două variante la fiecare cuvânt; deci, un dicţionar la care este pusă condiţia "Cu confirmare". Am înţeles că şi tu lucrezi un astfel de dicţionar... aşa că le putem combina, după ce punem ceea ce credem de cuviinţă fiecare.

      Tocmai am folosit noua funcţie Copy&Paste de înregistrări dintr-un dicţionar în altul pe care Cosmin tocmai a implementat-o, aşa că reorganizarea dicţionarelor, acum este floare la ureche. Am scăpat de editarea cuvânt cu cuvânt de până acum.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
lucibr
Membru Puf

Inregistrat: acum 13 ani
Stiti cumva unde gresesc de nu se pot incarca dictionarele de pe prima pagina? Am instalat programul de baza (contemporan), am inclocuit autocorect.exe si am pus dictionarele in C:\Users\*****\AppData\Roaming\AutoCorect Contemporan\Dictionare. Cand incerc sa rulez din OCR Plus imi da mesajul de eroare "Dictionarul L1.imd nu poate fi deschis". La fel si pentru restul

Multumesc


pus acum 12 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
In primul post scrie si de niste dictionare care trebuie puse in OCR_Dic.

Modificat de lucifer76 (acum 12 ani)


pus acum 12 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
Si o mica propunere: dupa ce se termina Ruleaza toate functiile, nu se poate sa apara si un mic log? Ca sa stim si ce a facut mai exact.

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, lucibr, trebuie sa creezi folderul OCR_DIC in C:\Users\*****\AppData\Roaming\AutoCorect Contemporan\Dictionare si sa le copii acolo.

lucifer76, ideea e buna. Deocamdata lucram la o modalitate mai buna de a arata progresul rularii automate respectiv de a se putea seta optiunile (in fereastra de rulare automata) la meniurile care au setare cand se pornesc direct...

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
lucibr,
        Poate că mai au şi alţi useri probleme de genul ăsta, aşa că reiau explicaţia lui Cosmin, folosindu-mă şi de imagini [poate sunt mai sugestive...].

        Dacă ai găsit folderul AutoCorect Contemporan, el trebuie să arate aşa:




        În folderul Dictionare se crează subfolderul OCR_DIC, în care vor fi copiate toate dicţionarele necesare rulării automate a AutoCorect.
        Se poate crea şi un subfolder suplimentar ["Alte dicţionare personale" sau cu alt nume] cu alte dicţionare, ce vor fi rulate la penultima opţiune.
        Folderul Dicţionare, trebuie să arate cam ca în imaginea următoare:




        Dicţionarele necesare rulării automate, şi care trebuiesc copiate în OCR_DIC sunt cele de mai jos.



_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
AutoCorect
Membru Puf

Inregistrat: acum 13 ani
fara mess

Modificat de AutoCorect (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Seven, inregistrarea 81 din Dld.imd ar trebui stearsa deoarece sunt unele situatii in care exista apostrof dupa liniuta de dialog:


- 'nteles!


Acea inregistrare scoate apostroful dar nu ar trebui s-o faca...

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
lucibr
Membru Puf

Inregistrat: acum 13 ani
Va multumesc de raspunsuri si in special de munca depusa. Intr-adevar din cauza asta nu mergea. Am creat directorul si acum totul functioneaza cum trebuie, fara eroare.
Recunosc ca scria clar calea unde trebuiau copiate dar  .... n-am remarcat. Poate ar fi bine sa specificati in primul post ca se creeaza directorul OCR_DIC in calea respectiva. Pentru unii se pare ca trebuie subliniat


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      AutoCoret,
      La cele mai multe dintre opţiuni nu merge schimbată ordinea, pentru că într-un fel sau altul opţiunile depind de cele din faţa lor.

      Mai trebuie ceva timp să vedem dacă apare necesitatea unor schimbări.
      La ora asta am o problemă cu curăţarea liniuţelor - oriunde s-ar afla în text [e vorba de DLp.imd, deci nu e vorba de linii de dialog care rulează cu DLd.imd].

      Pe de o parte, am impresia că ar fi mai bine să ruleze înaintea opţiunii "1.6 Ruperea rândurilor care încep cu linie de dialog...."

      Dacă se face curăţarea sumară a liniilor mai întâi, ar putea fi descoperite mai multe dialoguri în interiorul textului;
de exemplu, o linie de genul •— sau ■— nu poate fi interpretată corect la opţiunea Ruperea rândurilor, dar dacă este curăţată şi trasformată în Em dash, atunci ar putea îndeplini condiţiile.
      Nu ştiu sigur dacă ar fi bună schimbarea, pentru că am impresia că mai era ceva... o condiţie, un motiv pentru care am propus ordonarea lor astfel, iar acum îmi scapă acel motiv.

      Mai am probleme cu unele grupuri de linii, care nu se convertesc, deşi ele există în dicţionar... Una dintre ele este exact — –  despre care ştii... posibil să nu recunoască foarte bine pe a doua... alt grup de semne ar fi   ^—  care e posibil să fie deranjat de implementarea codurilor... zic şi eu... nu înţeleg ce se întâmplă.

      Rămân necovertite linii lipite de litere, dar cred că e bine să le lăsăm aşa.
      Am întâlnit cazuri, este adevărat destul de rare, când la cuvinte foarte scurte, apare Em dash în loc de cratimă, astfel:  şi—1, ţi—o, ni—1, mi—1...  Se pare că are legătură cu litera L mic şi litera O, pe care le consideră cifrele 1 şi 0... probabil de aceea cratima se transformă în linie mai lungă.
      Dacă adăugăm spaţiu în faţa lui Em dash lipit de litera din faţa sa, am putea da exact peste astfel de situaţii sau ceva asemănător.

      Cel mai bun lucru este să se menţioneze pe forum orice constatare, pentru a putea fi verificată şi să vedem în  ce mod se pot rezolva lucrurile.
      Oricum OCR_Plus trebuie să facă o "curăţare" a OCR şi, nu neapărat să rezolve tot... aşa că el este foarte bun.
     

      Cosmin,
      Am înţeles. Am şters 81 / Dld.imd.  Mă uit dacă nu apare ceva de genul ăsta şi în DLp - nu, nu este nimic.
      Am definitivat DF.imd - îl urc pe mediafire. DF.imd cuprinde înregistrările lui BlankCd, la care au fost adăugate cele ale lui lucifer

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ar mai fi o alternativa: la inregistrarea 81 sa fie setat "Cuvant Intreg". In acest fel va scoate apostroful numai daca nu are litera dupa el. Ar fi utila daca crezi ca 4.4 trebuie sa stearga aceste apostroafe independente, desi 6 oricum le sterge...
Daca nu, poti sa o lasi stearsa din dictionar...

Intre timp am mai reparat cateva mici probleme si am adaugat cateva noi setari la uniformizarea textului: spatierea randurilor, spatiul de dinainte si dupa paragraf. BlankCD mi-a atras atentia ca sunt necesare totusi la unele texte si chiar mi-a dat exemplu.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Deocamdată las înregistrarea 81 ştearsă... să vedem dacă sunt multe situaţii de acest gen; pe de altă parte, undeva mai înainte cu o opţiune, toate apostrofurile se transformă în apostrof românesc, aşa că înregistrarea era, cumva, depăşită.

     Am văzut noua versiune, dar nu am testat-o încă.
     N-am ştiut că umblaţi la formatare, pentru că mă gândisem şi eu la încă ceva: alinierea paragrafului; se pare că setarea de bază este alinierea spre stânga... m-ar fi interesat şi alinierea stânga+dreapta.

     Am constatat o problemă, dar actuala formatare, probabil o va rezolva.
     Este vorba de porţiuni de text expandat.
     Dintr-un motiv pe care nu mi l-am explicat și nu știu dacă are legătură cu formatarea din AutoCorect, am întâlnit porţiuni de text Expand 0,05. M-a uimit faptul că în mai multe texte valoarea era aceeaşi: Expand 0.05.
     
     Nu ştiu dacă a mai întâlnit cineva chestia asta sau ceva asemănător şi nu ştiu dacă depinde de formatarea AutoCorect sau de cu totul altceva...

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

Seven a scris:

N-am ştiut că umblaţi la formatare, pentru că mă gândisem şi eu la încă ceva: alinierea paragrafului; se pare că setarea de bază este alinierea spre stânga... m-ar fi interesat şi alinierea stânga+dreapta.


O sa incercam sa implementam si asta.


Seven a scris:

Am constatat o problemă, dar actuala formatare, probabil o va rezolva.
     Este vorba de porţiuni de text expandat.
     Dintr-un motiv pe care nu mi l-am explicat și nu știu dacă are legătură cu formatarea din AutoCorect, am întâlnit porţiuni de text Expand 0,05. M-a uimit faptul că în mai multe texte valoarea era aceeaşi: Expand 0.05.
     
     Nu ştiu dacă a mai întâlnit cineva chestia asta sau ceva asemănător şi nu ştiu dacă depinde de formatarea AutoCorect sau de cu totul altceva...


Daca nu rezolva arata-mi te rog un mic text care are problema pe o bucata respectiv rezolvata pe alta bucata.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am adaugat si alinierea paragrafului.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
menssana1984
Vizitator



Seven, pe prima pagina ai un link ce duce la 4 dictionare aparent diferite.
Care trebuie luat si care nu?

Daca se iau toate, poti da un pic mai multe detalii despre fiecare in parte cu exceptia celui de Ocr?


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Cred că te referi la asta:
                [2011.11.23] Dictionare OCR_DIC.rar
                [2011.11.26] DF.imd
                Descriere dicţionare OCR_DIC.doc
                Dictionare UZUALE suplimentare [2011.11.23].rar

      Să i luăm în ordinea în care apar ele indexate în folder.

      [2011.11.23] Dictionare OCR_DIC.rar
      Sunt dicţionarele obligatorii care funcţionează în meniul OCR_Plus, aşa cum le aveam eu la data de 2011.11.23.
      Dacă vor apăre mai multe arhive cu acelaşi nume, adică ""Dictionare OCR_DIC.rar", data din faţa arhivei are rolul să arate care sunt cele mai noi, deci cele mai proaspăt reactualizate.

      [2011.11.26] DF.imd
      Dicţionarul DF.imd care se referă la opţiunea "4.7 Conversie majusculă în minusculă în dialog francez" a fost completat faţă de cel din arhiva din prima poziţie.
      Practic acest dicţionar a fost urcat pe data de 26.11 faţă de arhivă care a fost urcată la 23.11, deci e mai nou decât fratele său urcat în arhivă. Ştiu, era mai corect să refac arhiva, dar m-am grăbit să-l urc doar pe el, pentru că era singurul la care apăruseră modificări.

      "Descriere dicţionare OCR_DIC.doc"
      Pentru început este un mic document word, în care se explică foarte pe scurt ce reprezintă fiecare dicţionar în parte - se face referire doar la dicţionarele cu care rulează OCR_Plus.

      "Dictionare UZUALE suplimentare [2011.11.23].rar"
      Sunt nişte dicţionare suplimentare, pe care eu personal le folosesc pentru rularere suplimentară.  Ele sunt în plus faţă de dicţionarele obligatorii cu care rulează OCR_Plus şi pot fi rulate în grup cu opţiunea 11.


      În concluzie, este foartă importantă data scrisă sub forma [2011.11.23] la începutul sau sfârşitul documentului, pentru a alege ceea ce e mai nou.
      M-am gândit că dacă fac o îmbunătăţire şi fac doar o înlocuire a fişierului, mulţi useri nu se vor prinde că e vorba de un fişier nou şi nu-l vor lua în considerare... aşa, fiind mai multe fişiere cu acelaşi nume şi dată diferită, userul va putea să se întrebe "Ce-a mai urcat ăsta aici?..." şi astfel îşi va îmbunătăţi versiunile.

       După ce vom mai face o serie de testări, voi lăsa un fel de fişiere finale, dar atât timp cât ele se tot modifică, deoarece unele înregistrări produc efecte negative colaterale şi trebuiesc şterse, alte cazuri de erori constatate trebuie înregistrate... deci, atât timp câr docţionarele se modifică, cred că e mai bine să fie urcate însoţite de dată...


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator



A... ok... ma abtin pe moment sa imi bat capul cu ele.... cand o sa am ocazia sa le rulez revin cu noi intrebari.
Pana atunci testez exe-ul.


pus acum 12 ani
   
menssana1984
Vizitator



Revin cu o chestie...
Ultima operatie facuta in ocr nu ar trebui sa fie stabilirea tipului de diacritice si de text, contemporan sau nu?


pus acum 12 ani
   
menssana1984
Vizitator



Am sarit un cod important: ghilimele romanesti, de inceput si de sfarsit.
Seven, stii care sunt codurile word de la ele?

Eventual si cele frantuzesti, folosite in interiorul ghilimelelor.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
Ghilimele româneşti...
    Nu cred că au un cod în word...
    În plus, se pare că e o problemă cu ele... am senzaţia că [cel puţin în Word, dar cred că şi în alte editoare] se face confuzie între cele de început şi cele de sfârşit.
    În Word, dacă le înlocuiesc cu Find&Replace, chiar dacă pun ghilimele de sus [de sfârşit], se face înlocuirea şi a celor de început.
    Mai mult, dacă fişierul este rtf, atunci când încerc să corectez ghilimele de sfârşit, ele nu se duc sus, aşa cum ar trebui, ci rămân jos ca şi cele de deschidere...
    Cred că ghilimele sunt ceva mai greu de rezolvat.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator



Ziceam doar de de adaugarea lor in combinatii de taste.
Nu stiu cat de bine se aplica ele la inlocuiri automate. Sunt 4 tipuri de ghilimele in lista de coduri.
Vezi pe la 8220, 8221, 8222



Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
Leaveyou
Membru Puf

Din: Madrid
Inregistrat: acum 13 ani
Ghilimele de deschidere:
alt+0132
Ghilimele de inchidere:
alt+0148
avand NumLock activat.

Modificat de Leaveyou (acum 12 ani)


_______________________________________
Always be brief.

pus acum 12 ani
   
menssana1984
Vizitator



Nu sunt aceleasi ca in imagine?

pus acum 12 ani
   
Leaveyou
Membru Puf

Din: Madrid
Inregistrat: acum 13 ani
Ba da, daca ai font Bookman Old Style selectat.

_______________________________________
Always be brief.

pus acum 12 ani
   
menssana1984
Vizitator



E bine atunci. Codurile mele sunt cele din AC si merg folosite la COmbinatii Taste.

Daca ma puteti ajuta si cu cele frantuzesti, ar fi perfect.
Dar sa ii aratati lui Cosmin ce sunt alea.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       Probabil cauţi aşa ceva:  «   »
          Alt+0171   «
          Alt+0187   »
       Menţionez că e vorba de tasta Alt din stânga, şi nu de Alt Gr, care se află în dreapta.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator



Cosmin, sa imi zici echivalentele lor in AC.
Eu nu am NumPad.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Menssana1984, aceasta metoda cu Alt+codul pe Numpad merge in practic orice program de editare in Windows, nu tine doar de Word. Mai exact e o functie in Windows, nu in editoare. Deci va merge si in AutoCorect.
Daca zici ca nu ai Numpad o alta modalitate de a le obtine e sa te duci in meniul Inserare >> Inserare Simbol.
La Font setezi fontul curent sau unul apropiat iar la Set de caractere setezi Central European.
Pe urma le cauti folosind aceste coduri:

Ghilimele de deschidere:
alt+0132 = 132
Ghilimele de inchidere:
alt+0148 = 148

Alt+0171   « = 171
Alt+0187   » = 187

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am mai facut cateva mici imbunatatiri:
- functia Insert Simbol din meniu se deschide acum cu Fontul deja setat la fontul curent respectiv cu Setul de caractere deja la Central European; nota: daca fontul respectiv nu e instalat pe calculator (cum ar putea fi "bookman old style") va folosi unul apropiat;
- codurile de caractere (^=, ^+, ^s etc) sunt acum implementate si la Cautare respectiv Cautare si Inlocuire (pina acum erau doar la Inlocuire Multipla si Combinatii de taste);
- la Inlocuire Multipla se pot muta inregistrarile folosind drag'n'drop mouse.


Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
menssana1984
Vizitator



Cool... merci

pus acum 12 ani
   
menssana1984
Vizitator



Am inceput sa testez si eu programul folosind versiunea de exe de mai sus si dictionarele afisate de Seven pe prima pagina.
Revin cu detalii daca e cazul.


Intrebare: rularea functiei de OCR elimina sau nu formatarea italic si bold a textului?


pus acum 12 ani
   
menssana1984
Vizitator



Si revin....

Seven, unde e seria de dictionare L1, L2, etc.
Apar in descrierea de pe Mediafire dar nu e urma de ele prin arhive si tocmai imi dadu eroare AC-ul ca nu le gaseste.

Nevermind.... erau puse in afara folderului Dictionare. Stupid me.
Vreau raspuns la intrebarea legata de italic si bold.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
Dupa rularea dictionarului lui BlankCD, si a unei versiuni mai vechi a dictionarului meu, au mai ramas urmatoarele:

@menssana1984, e vorba de dictionare pentru dialog francez.

Modificat de lucifer76 (acum 12 ani)


pus acum 12 ani
   
menssana1984
Vizitator



What? Ce e in linkul ala? E pentru Cosmin?


Celor care au lucrat la dezvoltarea programului pe acest topic!
SA VA FIE RUSINE!
NU IMI VINE SA CRED CA ATI FACUT ASTA!


Era o chestie care imi statea pe creier si Cosmin ma lasase sa inteleg ca nu se poate rula decat ca macro.


Rezultatul prezent al colaborarii e un program excelent.
Eu nu m-am bagat peste meniul OCR decat acum, dar arata profesional in draci.
Felicitari celor implicati.


pus acum 12 ani
   
menssana1984
Vizitator



Ok. O prima chestie ramasa dupa rularea ocr-ului.

Gura -o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă.

Daca nu gresesc ar trebui sa apara ca sugestie la punctuatie totusi.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
menssana1984,
      Constatez cu profundă durere în suflet că nu ai activat în profilul domniei tale  jmecheria asta:
                  □ Activati daca doriti sa vizualizati semnaturile userilor.
                  □ Afiseaza semnaturile userilor
      Dacă ai avea chestiile astea activate, ori ai umbla pe forum şi nelogat, ai putea vedea că m-am riscat şi am pus în semnătura mea un link către dicţionare.
      Dacă nu vezi semnătura, atunci în prima pagină, postarea 2, adică a subsemnatului, începe exact cu adresa folderului mediafire care conţine dicţionarele OCR_DIC.
      Despre faptul că zici că acolo nu se află L1-L3.imd... nu mai zic nimic... dar te rog să insişti.

      Mă bucur că-ţi place noul AutoCorect OCR_Plus şi-ţi mulţumesc pentru că l-ai convins pe Cosmin să vină pe forum... pen'că dacă nu făceai asta... Cosmin şi Daniel nu aveau habar de faptul că ne-ar putea ajuta.


      lucifer76,
      Am o întrebare, dar mai întâi să explic ce am făcut în legătură cu dicţionarele de dialog francez, ca să-ţi dai seama dacă mai există înregistrări de făcut.

              - mai întâi am eliminat din dicţionarul tău înregistrările care se aflau deja în dicţionarul lui BlankCd şi a rezultat dicţionarul "[lucifer] corectare automata - redus 2.imd"
              - din acest dicţionar "redus 2" am eliminat nişte înregistrări care nu aveau şi un verb în formulare, ci erau pronume simple, ca de exemplu: Îi, Îl, Îşi, Le, O, Se etc. Am considerat că aceste înregistrări ar putea afecta şi dialoguri în care vorbitorul continuă mesajul, deci nefiind vorba de dilog francez. Dicţionarul rezultat l-am numit "ultra-redus"
              - în faza următoare am mărit numărul de înregistrări din acest "ultra-redus" astfel ca fiecare expresie să se regăsească atât după semnul "!" cât şi după "?", adică cumva le-am dublat - au rezultat aproximativ 44 de înregistrări.
              - în ultima fază, acest dicţionar l-am adăugat la cel realizat de BlankCd, astfel că de la 670 înregistrări iniţiale cât avea iniţial dicţionarul lui BlankCd, s-a ajuns la 714, cât are actualul DF.imd.

       Acum vine întrebarea: există şi alte înregistrări în dicţionarul urcat astăzi în afara celor ce erau la data respectivă şi care trebuie adăugate? menţionez că nu am păstrat dicţionarele în forma lor temporară şi nu-mi dau seama decât dacă acum fac comparaţia cu cele 714 înregistrări din DF.imd.
       

       LE: menssana, am uitat...
       Opţiunea de formatarea din OCR_Plus păstrează fontul regular, italic şi bold;
       ea converteşte text tăiat cu linie, text subliniat, exponenţi şi baze... iar bold-italic îl transformă în italic.
       deci, se păstrează fontul italic şi bold.
       Seven

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
Seven, de obicei, dupa Îi, Îl, Îşi, Le, O, urmeaza si verbul. De exemplu: ....! Îi, zise. Sau ......... ? Le intreba. Intradevar, nu mereu, dar in 99% din cazuri asa se intampla. Si e mai usor sa rectifici manual acel 1 caz, decat sa nu il treci in dictionar si sa trabuiasca rectificat manual de 99 ori.
     Sa nu uiti sa pui si DF.imd-ul modificat pe mediafire, ca sa il rulez in viitor si sa vad ce mai lipseste. Si ca sa iti fie mai usor, o sa fac un dictionar nou, nu o sa mai adaug la celexistent facut de mine ca sa te complici cu eliminarea inregistrarilor deja existente.
     Alte inregistrari nu mai exista, momentan, pentru ca dictionarul pus azi e rezultat dupa rularea DF.imd-ului din postul nr 2. Dar oricum, o sa mai corectez si in continuare, si ce mai gasesc ca trebuie adaugat o sa adaug.


pus acum 12 ani
   
menssana1984
Vizitator



Seven, am lamurit problema cu dictionarele intr-una din postarile de mai de sus.
Daca ai schimbat iar continutul dictionarelor, sa ma anunti.

Am inaintat o "problema" gasita dupa rularea ocr-ului:

Gura -o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă.

Si trebuie sa ma lamuriti si pe mine care e diferenta dintre atentionarea de la punctuatie si inlocuirea semi-automata din OCR la dialog francez.

Am inteles ca in OCR atentionarile se fac in baza unui dictionar de termen. Daca termenul nu e in dictionar, atentionarea nu apare.

Dar rularea punctuatiei mi-a aratat intotdeauna (sper sa nu gresesc) toate cazurile de dialog francez real.

Asa ca aici ma cam scarpin in cap.
Dupa rulare OCR nu se intentioneaza rularea celor 3 procese de baza a AC-ului?
Sau sunt 2 verificari de dragul acuratetii?


De asemenea vreau sa stiu daca absolut toate dictionarele de pe Mediafire sunt rulate automat prin apasarea butonului OCR (presupunand ca sunt acele optiuni bifate) si ca nu a mai ramas niciunul care trebuie incarcat manual in meniul de Inlocuiri Automate.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Rularea optiunii 4.7 din OCR Plus se face pe baza unui dictionar si a ceva cod. Codul e facut sa ruleze dictionarul si, pe baza a ce gaseste in text si pe ce are in dictionar, intreaba daca sa puna majuscula.
Lucreaza diferit de codul din punctuatie dar rezultatele sunt in mare parte aceleasi. Oricum la punctuatie doar atentioneaza, la OCR Plus inlocuieste mare parte fara sa intrebe si apoi, la cazurile incerte, mai intreaba.


pus acum 12 ani
   
menssana1984
Vizitator



Ok. Inteles.
Deci e ABSOLUT NECESAR ca dupa rularea functiei de OCR sa se treaca la rularea Punctuatiei, Ortografiei si a Diacriticelor.
Astea sunt retusurile finale.

Aveti aici un clip cu setarile necesare ca nu cumva sa va dea textul peste cap atunci cand rulati punctuatia:





Il puteti folosi si ca tutorial daca va e necunoscut programul.
Clipul nu prezinta executabilul cu functia de OCR implementata.
Puneti pauza pentru a putea citi tentativele mele de explicatii 


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
       menţiune: Fişierul din folderul mediafire numit "[2011.11.26] DF.imd" este cel care are 714 înregistrări, deci cel mai complet în acest moment.

       Am o mică reţinere asupra frecvenţei situaţiilor de dialog francez ale lui Îi, Îl, Îşi, Le, O şi propun să facem două variante de dicţionar "DF.imd", ca să împăcăm şi pe optimiştii şi pe sceptici, astfel:
       – notăm "DF.imd" un dicţionar cu toate îmbunătăţirile ce vor urma, exceptând aceste 10 situaţii... sau câte vor rezulta - şi acesta va fi dicţionarul ce va rula pentru toţi utilizatorii care nu fac modificări.
       – notăm "DF_plus.imd" un dicţionar cu toate îmbunătăţirile, inclusiv aceste 10 înregistrări. Utilizatorul care îşi va dori să-l folosească pe acesta, va putea să-i schimbe numele şi să-l pună în locul celui care rulează în mod obişnuit sau va putea să-l ruleze separat.
       – în fişierul "Descriere Dicţionare OCR_DIC", facem menţiunea cu privire la cele două dicţionare, astfel încât fiecare utilizator să poată alege. Mai mult decât atât, în arhivele următoare voi introduce şi acest document [Descriere Dicţionare OCR_DIC] pentru a atrage mai uşor atenţia celor ce fac downloadul dicţionarelor.

       Personal mă gândesc că e mai bine să oferim posibilitatea ca utilizatorul AutoCorect să poată alege ce consideră că este mai bine.


       menssana: fişierul Dictionare UZUALE suplimentare [2011.11.23].rar, conţine alte dicţionare decât cele care sunt rulate automat. Acestea sunt nişte dicţionare ale mele personale, organizate pe litere, unde pun cuvinte ce le întâlnesc scrise greşit prin diferite OCR-uri [bineînţeles, aceeaşi greşeală trebuie să fie frecventă, altfel cu o consder atât de importantă pentru a fi trecută în dicţionar].
       Ele se pot rula toate sau o parte din ele cu opţiunea 11. Rulare grup de dicţionare de înlocuire multiplă...

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Seven, un detaliu: la Ocr Plus Punctuatia rulata la 2.1 sa aiba setarile standard sau unele sa fie modificate?
Iar daca cineva a facut modificari la setarile implicite din Punctuatie, cand se ruleaza in Ocr Plus sa treaca pe setarile standard sau sa lasam cum vrea utilizatorul?


pus acum 12 ani
   
menssana1984
Vizitator



Sa nu treaca pe cele standard. Iti strica dialogul francez.

pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Cred că cel mai bine este să poată fi modificate şi să rămână pe setările personale.
     
     În AutoCorect putem vorbi de două lucruri, oarecum diferite:

           - Corectarea textului în AutoCorect, aşa cum a arătat menssana... adică, în afara de rularea meniului OCR_Plus, utilizatorul continuă corectarea textului folosindu-se de opţiunile clasice; în acest caz, utilizatorul bifează cam toate opţiunile din punctuaţie, urmăreşte si rezolvă propunerile din lista de sugestii creată de AutoCorect...  etc. etc...

           - Curăţarea automată a OCR în AutoCorect. În acest caz, utilizatorul nu are nevoie de toate opţiunile pe care i le oferă AutoCorect, pentru că erorile le va corecta prin citire în alte Editoare, fie Libre, Word sau OpenOfice. Acest utilizator va intra în program, va încărca fişierul va accesa rularea automată a OCR_Plus şi va ieşi din program. Pe un astfel de utilizator nici nu-l interesează lista de sugestii de la punctuaţie... etc., pentru că el face o curăţare sumară... şi apoi face adevărata corectură în editorul de text cu care s-a obişnuit.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
AutoCorect
Membru Puf

Inregistrat: acum 13 ani
fara mess

Modificat de AutoCorect (acum 12 ani)


pus acum 12 ani
   
menssana1984
Vizitator



Da si nu.
Si nu prea are importanta daca rulezi functia de OCR si nici versiunea de text pe care lucrezi (ocr brut sau versiuni avansate gen 2.0).

AC-ul are doar doua optiuni care pot face modificari nedorite (si pentru incepatori, nestiute) asupra unui text:
- functia de diacritice, daca se aplica inserarea lor complet automata sau cea cu atentionare la variantele incerte. Eu o folosesc pe cea complet manuala le iau pe rand.

- functia de Punctuatie ale carei reguli nu prea se aplica la textele literare.
In principal e vorba de acel dialog francez, regulile normale de punctuatie fac din litere mici litere mari... chiar daca inainte s-a rulat functia de OCR si acele cuvinte existente in dictionar au capatat litera mica cuvenita.

Atunci cand se lucreaza cu texte literare, indiferent de numarul de versiune, optiunea de "Arata posibilele cazuri de dialog francez ca sugestii" trebuie sa fie mereu bifata daca se intentioneaza rularea Punctuatiei.
Eu am busit o serie intreaga de carti din cauza asta si toate erau versiuni superioare le-am curatat de cuvinte incorecte si punctuatii gresite, dar le-am stricat pe alta parte, si le-am stricat intr-un mod corect

P.S.
E relativ absurd sa folosesti functia de OCR a AC-ului si apoi sa ignori celelalte 3 functii. Dupa rularea OCR-ului e absolut necesara rularea lor deoarece textul este practic ALTUL.

De exemplu, rularea Punctuatiei pe un ocr brut va rezolva 30 de probleme, apoi se va rula OCR-ul si apoi iar Punctuatia, care de data asta va rezolva 60 de probleme.
E lipsit de sens sa ignori aceste functii si sa te muti in alt editor de texte pentru a face corectura. Word-ul nu are functie de punctuatie si nici de diacritice, iar dictionarele sale lasa de dorit.
Ideal ar fi sa se epuizeze toate functiile AC-ului si abia apoi sa se mute textul in alt editor care sa isi incordeze si el muschii asupra textului, iar abia apoi sa urmeze corectura vizuala a textului.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

ciuperca_cosmin a scris:

Seven, un detaliu: la Ocr Plus Punctuatia rulata la 2.1 sa aiba setarile standard sau unele sa fie modificate?
Iar daca cineva a facut modificari la setarile implicite din Punctuatie, cand se ruleaza in Ocr Plus sa treaca pe setarile standard sau sa lasam cum vrea utilizatorul?

      Eu am vrut să spun că la opţiunea 2.1 Punctuaţie din meniul Ocr_Plus propun să nu fie rulate setările standard.
      Dacă utilizatorul a făcut setări personale la Setările punctuaţiei, aceste setări să rămână valabile şi la rularea Ocr_Plus.

      Despre cât de multe opţiuni rulăm în AutoCorect... aceasta depinde de experienţa utilizatorului, depinde dacă se va face corectura pe calculator sau eReader, depinde dacă aceeaşi persoană va executa şi corectura pentru versiunea V1.0 sau o altă persoană va face această corectură… şi, mai ales depinde de obişnuinţa userului…
      E greu de convins cineva că ceea ce s-a obişnuit să facă nu este corect şi că trebuie să facă o schimbare mai mult sau mai puţin radicală.

      Corectura pentru versiunea V1.0 se face având în partea stângă a monitorului o fereastră cu pdf-ul din imagini, iar în dreapta o fereastră cu documentul de corectat. Comparaţia textului de corectat cu pdf-ul se face în funcţie de experienţă, la început foarte des, cu ochii când în text, când în pdf… iar pe măsură ce câştigăm experienţă, pdf-ul va fi citit din ce în ce mai rar şi doar atunci când „simţim” că textul nu sună firesc… nu are înţeles… pare întrerupt…

       Dacă se continuă corecturile în AutoCorect, ar fi foarte bine să se poată verifica şi originalul, adică pdf-ul din imagini, pentru că e posibil ca o anume modificare, deşi e corectă din punctul de vedere al limbii române, să nu fie tocmai corectă pentru limbajul folosit în carte. Iar despre numele străine… până nu verificăm numele în pdf în mai multe locuri şi, eventual, verificat şi într-un text în limba originală… ca să alegem numele corect, ei bine nu m-aş aventura să-l adaug la dicţionar.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator



De acord cu tine in cazul setarilor optiunii 2.1, dar utilizatorul trebuie anuntat, intr-un fel sau altul, asupra efectelor optiunii de Dialog Francez.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
menssana1984
Vizitator



Si revin cu alta postare ca sa fiu sigur ca mesajul ajunge la toti.

AC-ul are o problema destul de serioasa, ca sa se merite vorbit despre ea oleaca, atunci cand se ruleaza cele 3 optiuni de baza (de fapt doar ultimele 2, Punctuatia nu prea are problema asta).

Lucrez acum la rtf de 506 pagini. Diacriticele si Ortografia se fac semi-automat in cel mai rau caz. Dar asta dureaza si nu prea se reuseste finalizarea operatiilor doar intr-o singura tura.
Prin absurd, daca e sa consideram ca exista doar 2 cuvinte posibil incorecte pe fiecare pagina, asta inseamna ca vom avea 1012 atentionari in AC. Si asta dureaza destul de mult.

Daca functiile de Diacritice si Ortigrafie ar avea posibilitatea "tinerii minte" a locului unde au ramas atunci cand au fost rulate pe acel text ar fi perfect.
O simpla optiune cu bifa sub cele deja existente sub butonul propriu-zis.
"Reluati de la ultima rulare" sau ceva de genul asta.
Dar odata ce programul va afisa fereastra de sfarsit a rularii optiunii, cea cu " S-au facut x modificari" sau cum o fi (nu am acces la program acum), sa fie eliminat "bookmark-ul" acelei optiunii, sa se debifeze si sa nu mai poata fi bifata. DAR SA FIE VIZIBILA! Ca sa putem distinge textele pe care nu s-a rulat niciodata de cele pe care s-a rulat pana la capat. Eventua sa nu mai fie disponibila optiune de rulare de la primul rand, sa fie facuta invalida, dar asta cred ca ar putea duce la anumite probleme in caz de ne razgandim si din x motiv vrem sa o luam de la capat.
In fine, ceva de genul 

Eu nu reusesc sa duc o corectura pana la capat mereu, de aceea ies din fereastra functiei cu pricina si trantesc o marcare cu rosu in text ca sa stiu unde am ramas. Dar nu mereu tin minte asta si uneori trec de locul ala sau iau treaba de la inceput.

In principal programul ar trebui sa se pozitioneze la inceputul ultimei linii pe care a intrat acea optiune. Totodata ai sti ce optiune ai rulat ultima oara.

Daca pe text nu s-a rulat nimic, atunci optiunea cu bifa sa nu apara.

Cred ca ar fi de ajutor genul de abordare pe care a avut-o Cosmin cu dictionare personalizate pe fiecare text in parte. Un fisier cu numele textului care sa contina ultimele date ale textului.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Nu cred ca poate fi denumita "problema destul de serioasa" deoarece nu afecteaza functionarea pe ansamblu.
Sa explic ceva: daca adaugi diacritice sau rulezi ortografia, cand le opresti (fara sa termine) cursorul in text ramane la pozitia in care a ajuns scanarea. Cum adaugarea de diacritice si ortografia de obicei (re)pornesc de la pozitia cursorului, e usor sa le repornesti daca ai ramas acolo.
Dar daca cineva a bifat "Incepe cu primul rand", normal ca nu mai reincepe de acolo. Bifarea "Incepe cu primul rand" e utila doar daca vrei neaparat sa o (re)iei de la inceput. Eu personal n-o folosesc niciodata, deoarece cand deschizi un text cursorul se duce la inceput sau e foarte usor sa ma duc manual la inceputul textului.
Daca nu e vorba ca ai bifat "Incepe cu primul rand" - adica opresti scanarea si te duci in alta zona de text ca sa faci altceva, atunci da se poate spune cat de cat ca ar fi de folos asa ceva dar e cam greu de implementat.
Functiile de acest gen de regula sunt facute sa mearga continuu de la inceput pina la sfarsit nu sa faci modificari in alte zone de text intre timp.
De exemplu sa opresti pe moment, corectezi manual ceva in acea zona de text si reiei - asta poate face. Dar mai mult nu e atat de fezabil sa implementezi.
Dar daca si altii ne-o vor cere, ne vom gandi la o implementare.


pus acum 12 ani
   
menssana1984
Vizitator



Cand zic ca nu corectez tot odata e vorba de oprirea programului si rularea in alta zi pe acel text.
1000 de posibile probleme dureaza ceva sa fie sortate, iar in cazul in care faci si verificare cu pdf-ul de scanare timpul se dubleaza lejer.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, pe undeva te inteleg, la asemenea texte mari e greu sa il faci de la inceput pina la sfarsit fara pauza.
Eu de regula utilizez adaugarea de diacritice pe automat, il editez manual si la sfarsit rulez ortografia.
Cand il editez manual, cateodata ma opresc si copii fraza curenta intr-un text numit "ramas.txt" langa documentul principal.
Cand vreau sa reiau caut fraza aceea in document. Cum stiu aproximativ si pozitia unde am ramas, e usor s-o gasesc cu functia de cautare.

O sa discut cu Daniel despre implementarea unui "semn de carte" care sa te duca unde ai ramas.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am şters ultima arhivă cu dicţionare, urcată ieri pentru că în dicţionarul DLd.imd a scăpat o mare eroare: prima înlocuire făcea înlocuirea tuturor cratimelor cu Em dash.
      Am văzut că s-au făcut doar două downloaduri, dar e bine de verificat.
      Cu scuze şi plecăciune,
      Seven


      LE: Alarmă falsă...
      DLd.imd se referă la linii de dialog, deci nu face înlocuirea tuturor cratimelor, ci doar a celor ce ţin loc de linie de dialog - aşa că era bine.
      Ceva nu merge prea bine şi am constatat că e vorba de opţiunea 4.4 Corectare linii de pauză și linii de dialog. Problema se pare să nu fie la dialoguri, ci la dicționarul DLp.imd, care rulează foarte-foarte greu...
      Încerc să aflu care e înregistrarea ce îl încetineşte în felul ăsta.
      Cu alte scuze şi încă o plecăciune.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Stai linistit Seven ca nu-i mare problema
Sa-mi spui si mie ce ai gasit, poate rezolvam cumva...


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Am găsit... tot o prostie... şi, biensur tot a mea.

      În dicţionarul DLp.imd am transformat toate liniile şi combinaţiile de linii şi răgălii în Em dash, dar scris cu cod, deci  " ^+ ".

      Doar că am scăpat şi o linie mai lungă, ce era chiar Em dash.
      În concluzie, liniuţa Em dash se înlocuia cu ea însăşi, doar că modificare era " — " înlocuieşte cu " ^+ "
      Cum aveam OCR-ul de la Ninja II, de vreo 670 de pagini... erau nişte mii de liniuţe de înlocuit.

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator




ciuperca_cosmin a scris:

Da, pe undeva te inteleg, la asemenea texte mari e greu sa il faci de la inceput pina la sfarsit fara pauza.
Eu de regula utilizez adaugarea de diacritice pe automat, il editez manual si la sfarsit rulez ortografia.
Cand il editez manual, cateodata ma opresc si copii fraza curenta intr-un text numit "ramas.txt" langa documentul principal.
Cand vreau sa reiau caut fraza aceea in document. Cum stiu aproximativ si pozitia unde am ramas, e usor s-o gasesc cu functia de cautare.

O sa discut cu Daniel despre implementarea unui "semn de carte" care sa te duca unde ai ramas.

Si eu apelez la o metoda asemanatoare.
Oricum e o sugestie si e bine de stiut ca nu sunt singurul care are "problema" asta 

Seven, cand crezi ca ai ajuns la o finalitate de moment cu dictionarele, sa imi zici ca sa le iau din nou. Ma refer doar la OCR_DIC.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani

menssana1984 a scris:

Seven, cand crezi ca ai ajuns la o finalitate de moment cu dictionarele, sa imi zici ca sa le iau din nou. Ma refer doar la OCR_DIC.

     Mai pigulesc un pic la ele si le pun în seara asta, pentru că mâine dispar din nou pentru aproape o săptămână.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
menssana1984
Vizitator



Revin cu problema la care nu mi s-a raspuns:

Gura -o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă.

As dori sa apara la Punctuatie genul asta de situatie.


pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

menssana1984 a scris:

Revin cu problema la care nu mi s-a raspuns:

Gura -o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă.

As dori sa apara la Punctuatie genul asta de situatie.


La sugestii...?


pus acum 12 ani
   
menssana1984
Vizitator



Offtopic... Seven cum stai cu corectura la Hollgersson?

Da, daca consideri ca situatia cu cratima lipita de litera apare si normal, atunci sa apara la sugestii. Oricum acolo ori e vorba de un artefact, ori de un cuvant despartit ori de linie pauza/dialog recunoscuta gresit.

Modificat de menssana1984 (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Cred că am mari probleme... cu percepţia...
      La dicţionarele de înlocuire multiplă, am fost convins până acum că sortarea dicţionarelor se face după coloana "Caută";
      Acum văd că se face după coloana "Înlocuieşte cu"... şi totuşi, parcă nu numai...

      Întrebarea este: care coloană de cuvinte este luată în calcul la indexare?

Modificat de Seven (acum 12 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Seven, sortarea se face dupa "Cauta".
Dar daca crezi ca ai observat vreo problema, da-mi te rog un exemplu de dictionar imd care nu se sorteaza astfel.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     E vorba de DMidp.imd la care lucrez acum.
     El pare să fie singurul care se sortează după "înlocuieşte cu.."
        l-am urcat la:

     Voiam să adaug şi înlocuirea cu majuscule a minusculelor după punct urmat de spaţiu, în interiorul paragrafelor şi am constatat că s-a sortat altfel decât stiam eu.

     Oricum, deocamdată acest dicţionar rezolvă foarte puţine cazuri... am pus toate literele care se aseamănă [ C Î J O P S U V Z ] la început de dialog, dar am pus doar litera Î la început de paragraf şi după punct urmat de spaţiu.

      De ce aşa?
      la OCR-uri există o situaţie specifică: paragraful care începe la sfârşitul unei pagini şi se continuă pe pagina următoare se rupe şi se inserează numărul de pagină, respectiv paragraf gol, astfel că primul rând la început de pagină apare cu codul paragraf nou, deşi el în realitate este un rând din interioarul paragrafului.

      Dacă toate începuturile de paragraf le voi seta să fie scrise cu literă mare, toate aceste începuturi de pagină vor avea majusculă în mod eronat.
      Din acest motiv am pus doar modificarea lui î cu Î, ca să nu apară prea multe erori.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Intrebare: mi l-ai trimis cum l-a sortat la tine pe calculator?
La mine am apelat sortarea si l-a sortat bine.

PS: uite asa l-a sortat la mine:

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Răspuns: da, l-am trimis aşa cum s-a sortat la mine pe calculator.

      Ău... am mai încercat cu nişte dicţionare personale... constat că sortarea nu este de fapt o sortare nici după "caută", nici după "înlocuire"... iese ceva aiurea rău!...

      În momentul ăsta urc nişte pdf-uri mari exact pe mediafire şi nu fac download, de frică să nu se supere mediafire şi să-mi dea eroare la upload... mediafire mai face chestii din astea la arhive... apoi am să dau o curăţare şi restart. Probabil ceva l-a deranjat pe computerul meu.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am schimbat totusi functia care sorteaza - sper sa mearga si la tine.

Modificat de ciuperca_cosmin (acum 12 ani)


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
      Habar nu am de ce a luat-o aiurea sortarea. Am scanat tot... n-am găsit nimic... rebut.. clean... nimic-nimic...
      E adevărat, am schimbat şi versiunile de AutoCorect instalând vreo două cu doi trei paşi mai vechi şi tot nimic.
      Culmea este că habar nu am de ce şi-a revenit... şi am constatat asta exact pe acelaşi dicţionar...
      Ău... am şters vreo două înregistrări care mi s-au părut a fi duble... înregistrările duble să fi avut vreo influienţă?... Atunci când se duc înregistrări din alt dicţionar, nu mai avertizează faptul că sunt înregiastrări duble, cum se întâmplă la editarea bucată cu bucată.


       Acum o întrebare:
       După câte ştiu nu este implementat la punctuaţie ca două virgule consecutive să se transforma în ghilimele de început.
       Dacă într-un dicţionar [de exemplu S1, care are tot felul de înregistrări atipice] pun două virgule să se transforme în Alt+0132?
       Ar putea apărea efecte secundare în funcţionarea programului?
       Şi întrebare secundară: există o singură virgulă, nu?... sau există mai multe?

       Între timp testez versiunea de Ziua natională a AutoCorect.
       Apropo, de ce nu-l denumiţi versiune 5? Cred că are arhisuficiente îmbunătăţiri ca să merite o versiune superioară.?


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, acolo nu am mai pus verificare deoarece e o functie semiautomata spre deosebire de adaugarea unei inregistrari care e 100% manuala. Dar daca crezi ca intr-adevar ar folosi am s-o adaug.

In OCR Plus e deja implementata conversia de la virgule duble la ghilimele in 2.2
Daca vrei sa o faci cu un imd teoretic n-ar trebui sa fie mare diferenta.

Din cate cunosc e o singura virgula.

O sa ne gandim daca o sa trecem la 5.

Ce modificari mai are acest ultim exe:
- la dictionarele imd cu un nr de inregistrari >= 1000 se mareste automat coloana ce arata numarul ca sa nu apara "taiat" + arata progresul la salvare in bara de stare a ferestrei principale.
Am inceput sa fac de asemenea si o fereastra ce arata progresul la rularea automata dar nu e terminata - inca nu functioneaza corect 100%.


pus acum 12 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
***
     Nu cred că trebuie avertizare de înregistrare dublă la Copy&Paste; pur şi simplu trebuie să fim noi mai atenţi când facem reorganizări de dicţionare... dar asta se va întâmpla destul de rar.


     Am văzut că există op. 2.2, dar am avut senzaţia că rămân ghilimele duble neconvertite şi mă gândeam că poate e în lucru... eu am trecut în S1 o astfel de înregistrare şi m-am gândit că nu poate intra în conflict... aşa cum şi la elipsis există ceva suplimentar.
     Luni-marţi când revin, am să fac teste mai atente să văd dacă există o problemă reală la această convertire, ori am avut eu OCR curăţat fără opţiunea asta...


     Uau!... Acum am văzut!... E tare de tot fereastra cu progresul de rulare!...
     Arată si opţiunea şi timpul de rulare şi modificările făcute...
     Nu văd ce ar mai putea arăta. E mult mai mult decât mi-aş fi dorit.

     Cel puţin în perioada testelor, se simţea nevoia unei ferestre care să arate progresul de rulare... dar mă gândeam că ar fi suficient şi ceva simplu; de exemplu dacă într-o mică fereastră din bară ar apărea numărul opţiunii - chiar şi atât ar fi fost foarte bine.

     Din cauza acelei înregistrări în care Em dash se modifica cu ea însăşi, la un moment dat cursorul se bloca la 27% şi mă gândeam că trebuie să fie o problemă, dar nu realizam cam la ce opţiune era. A trebuit să o iau pas cu pas, făcând tot rulare automată dar bifând doar câte un pachet, iar după ce l-am găsit am luat fiecare opţiune în parte.
     Fereastra asta face tot....
     Mii de mulţumiri şi sincere felicitări!
     Seven


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 12 ani
   
Pagini: 1 ... 3 4 5 6 7 8 9 ... 13  

Mergi la