Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Reguli | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
Angelina20 pe Simpatie.ro
Femeie
19 ani
Cluj
cauta Barbat
24 - 55 ani
Forum Romania Inedit / Totul despre cărți - About e-books / AutoCorect versiune pentru Romania-Inedit Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1 ... 4 5 6 7 8 9 10 ... 13
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Cu placere.
Una din micile probleme care mai trebuiesc rezolvate e sa vad ce fac cu fereastra asta atunci cand 4.7 va cere confirmare daca sa schimbe in majuscule la textul din spatele ferestrei. Ma gandesc s-o ascund pe moment si s-o fac sa reapara cand termina...


pus acum 13 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
@ciuperca_cosmin, mi-ai luat vorba din gura  . Mai ales ca fereastra aia nici nu se poate muta. E mai bine, ori sa fie mutabila, ori sa apara doar la urma.

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat complet fereastra ce arata progresul rularii automate.

Seven, deocamdata transformarea a 2 virgule in ghilimea jos se face numai daca le gaseste intre cuvinte; sa extind la 2 virgule indiferent unde le gaseste?

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



What?
Noua versiune de exe si dictionare?
Le fac update?


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Dictionare eu n-am pus noi. Doar exe. Il descarci si-l copii in locatia de unde il rulezi de obicei.
Seven vad ca a pus dictionare noi - ia-le si pe acelea...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Seven, care e treaba cu acele dictionare uzuale suplimentare?
Are vreo importanta ordinea in care sunt rulate?


pus acum 13 ani
   
Sauron
Membru Senior

Inregistrat: acum 14 ani
Am si eu o mica problema cu optiune de convertirea a textului din clasic in contemporan. Nu stiu daca este o problema de word sau a Autocorectu-lui totusi postez aici... deci am docul cu textul setat normal pe limba romana, il salvez in rtf, limba ramane romana in continuare, il incarc in Autocorect si rulez conversia din clasic in contemporan. Acum textul rezultat are limba engleza si ii dispare optiunea de-al schimba in romana, pur si simplu nu-mi mai da voie decat cuvant cu cuvant sa-i schimb limba nicidecum cand selectez tot textul. Ma poate ajuta cineva cu chestia asta?

Scuze, gata am rezolvat, in optiuni in word la reviziuire - limba - selectezi romana. Off butonasele astea bata-le-ar vina.

Modificat de callu (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am testat si intr-adevar la textul salvat de AutoCorect nu poti schimba limba in Word. Dar cand pornesc ortografia in Word se vede ca e setata pe Romanian.
Ce versiune de Word ai si ce Windows?
Eu am Office 2010 si Windows XP.
Ai setat in Word ca limba principala de editare sa fie romana (cu "Microsoft Office 20xx Language Preferences")? Nu vorbesc de limba in care apar meniurile...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Sauron
Membru Senior

Inregistrat: acum 14 ani
Tot Office 2010 si Windows XP am si eu, si intr-adevar era setata limba engleza, am modificat si activat romana ca limba principala in optiuni si s-a rezolvat 

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am mai facut 2 imbunatatiri:
- bifele de la "1.5 Repararea randurilor rupte" sunt salvate acum cand AutoCorect e restartat;
- functiile din OCR Plus care au configurare (de exemplu "1.2 Setare text la font si marime unica") se pot seta acum si in fereastra de rulare automata - se da clic pe textul Optiuni de langa numele functiei.
La mine nu merge mediafire deocamdata asa ca am pus pe altul:

PS: vad ca merge acum si mediafire:

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Nu uita de cratima aia

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, stiu dar din pacate, cum ti-am spus pe messenger - nu reusesc sa vorbesc cu Daniel (email sau messenger) de cateva zile ca sa discutam despre asta si despre altele...

pus acum 13 ani
   
menssana1984
Vizitator



Alta situatie:

- Ba dal Titus a ridicat-o!

A-ul e urmat de semn de exclamare ce a fost considerat L de Abby.

Se poate ca in ocr sa se tina seama de situatiile astea sau sa ne fie indicate intr-un fel sau altul?

La Ortografie, am vazut ca programul e destul de destept. Uneori imi recomanda ca sugestie "da!", de regula cand e urmat de litera mare. Dar nu mereu.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Situatia asta apare doar cand ai "a!" sau si cu alte litere?
Daca e a doua - da-mi te rog exemple ca sa gasesc un "tipar".


pus acum 13 ani
   
menssana1984
Vizitator



Ignorati problema de mai sus. E rezolvata.

Blank, eu si Cosmin vrem sa bagam o regula noua, o sugestie, la Punctuatie legat de cazul asta:

Gura -o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă.

Eu consider ca nu ar trebui sa fie optionala, adica bifabila.
In afara cazului in care autorul scrie asa ca vrea el, eu nu pot sa imi imaginez situatii in care sa apara situatia asta si sa fie corecta.
Iar daca sunt, e doar o simpla sugestie, nu face rau.

Tu ce zici?


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Menssana mi-a cerut sa specific ceva pentru cei care vor sa editeze simultan cu vizualizarea pdf-ului: panel-ul cu optiuni de corectare din stanga se poate ascunde pe moment cu butonul triunghiular negru din marginea stanga a barei de stare, respectiv se poate ascunde permanent cu debifarea optiunii "Arata-mi mereu panoul cu Optiuni Corectie" din Configurare >> General.
In acest fel va incape mai mult text pe orizontala.


pus acum 13 ani
   
menssana1984
Vizitator



Exemplu de lucru cu ocr-ul si cu scanul de control in AC.



pus acum 13 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
Am facut un mic dictionar si pentru expresiile mai "controversate" din dialogul francez. De genul:
" - Haide! Am zis eu" in loc de " - Haide! am zis eu." cum e corect.
Nu e chiar asa de simplu, pentru ca nu e bine sa confunde "Am" cu "Amurg", si ca sa nu apara probleme o sa fie cu confirmare la inlocuire.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

lucifer76 a scris:

Am facut un mic dictionar si pentru expresiile mai "controversate" din dialogul francez. De genul:
" - Haide! Am zis eu" in loc de " - Haide! am zis eu." cum e corect.
Nu e chiar asa de simplu, pentru ca nu e bine sa confunde "Am" cu "Amurg", si ca sa nu apara probleme o sa fie cu confirmare la inlocuire.


E bun ca le-ai adaugat si pe astea


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am implementat ideea lui Menssana - sa arate sugestie la punctuatie cand intalneste cratima la marginea cuvantului: [litera mica][cratima][spatiu][litera mica] respectiv [litera mica][spatiu][cratima][litera mica].

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani
--->

    Meniul OCR Plus face următorul lucru cred că la opţiunea 6:

     - "spaţiu""cratimă" înlocuit cu "nimic"
     - "cratimă""spaţiu" înlocuit cu "nimic"

    Teoretic mensanna1984 nu ar trebui să aibe cratime şi spaţii alăturate.
    Eroarea cred că o reprezintă faptul - mi-e lene să verific în paginile anterioare - că setările default nu au bifată opţiunea 6 din meniu.
    Atât opţiunea 5 cât şi 6 au fost gândite spre a fi bifate default.
    Pentru a face teste pentru ce zic eu că este setare default-Basic, este necesar să avem aceleaşi setări Basic.
    Setările Basic-default ar fi: bifare meniuri de la 1 până la 6 inclusiv şi 9.2.
   
    Cred că nu mă înşel când spun ca spaţiul de după linia de dialog este convertit în spaţiu neseparator de către 3 meniuri actuale: 4, 8 şi 12.1.


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, dar:
- stergerea cratimelor la 6 nu e activata implicit si nu rezolva decat daca cuvintele sunt "taiate". Daca cratima era de fapt o linie de pauza (nu se intampla des dar se mai intampla), mai mult strica.
- Punctuatia e si pentru texte normale nu numai OCR-uri si aceasta functie ar folosi si acolo.
Oricum asta n-a fost greu de implementat si nici nu ingreuneaza tare punctuatia.

Ca veni vorba, poate ar trebui discutate care din optiunile de la 5 si 6 ar trebui actvate implicit. La momentul cand am discutat cu Seven despre ele a ramas sa fie deocamdata dezactivate implicit dar poate e mai bine ca unele sa fie activate...

In ce priveste propunerea ta pentru ce meniuri sa fie bifate, da pentru teste pare bine.

8 nu inlocuieste cu spatiu neseparator.
La 4.4 am implementat eu ca sa maresc viteza pe ansamblu, din moment ce toata lumea era de acord sa fie pus spatiu neseparator dupa linia de dialog. In acest caz rularea 12 pare nefolositoare dar e bine cred sa fie lasata.


pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani

ciuperca_cosmin a scris:


Ca veni vorba, poate ar trebui discutate care din optiunile de la 5 si 6 ar trebui actvate implicit. La momentul cand am discutat cu Seven despre ele a ramas sa fie deocamdata dezactivate implicit dar poate e mai bine ca unele sa fie activate...


   Seven a dorit implementarea default la preferinţele sale, dar a uitat că setarea Basic se adresează userilor novici.
   La 5 şi la 6 trebuiesc bifate toate mai puţin ultima. Adică nebifată ultima de la 5 şi nebifată ultima de la 6.



ciuperca_cosmin a scris:


8 nu inlocuieste cu spatiu neseparator.


    Ai dreptate, rămăsesem "setat" pe propunerea mea de meniu care la acest meniu trebuia să schimbe spaţiul cu spaţiul neseparator. Încă o dovadă că dau semne serioase de ramolire...


ciuperca_cosmin a scris:


La 4.4 am implementat eu ca sa maresc viteza pe ansamblu, din moment ce toata lumea era de acord sa fie pus spatiu neseparator dupa linia de dialog. In acest caz rularea 12 pare nefolositoare dar e bine cred sa fie lasata.


    Nu o scoate, las-o acolo.


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani
--->

     Încă ceva.
     La dicţionarul la care lucrez acum, el este util-activ doar la limbaj contemporan. Pe limbajul vechi, va merge doar cuvintele care care nu conţin â.
     Întrebare: poţi "clona" din .imd DOAR cuvintele actuale de tipul "comportându-se" care conţin "â" pe care să le converteşti în "comportîndu-se". Aceste ultime cuvinte-clonă modificate le putem adăuga la dicţionar, astfel avem un dicţionar mixt care va lucra pe ambele limbaje. Mă gândesc că va fi util celor care vor avea texte vechi...
     Aş putea să introduc manual dar dicţionarul are câteva mii de intrări...
     Sau ar fi util un dicţionar separat pentru limbaj vechi...? Mă gândesc să nu devină prea aglomerat dicţionarul mixt, dar asta ar însemna ca userul să ştie ce vrea, adică să-şi aleagă dicţionarul potrivit în funcţie de text.

Modificat de BlankCd (acum 13 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
menssana1984
Vizitator



Pai de ce nu bagi totul in AC si rulezi conversia de text?

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Da, pot clona acele inregistrari dar cred ca cel mai indicat ar fi sa se utilizeze dictionar separat pentru limbaj vechi. Adica dictionarul actual pentru AutoCorect Contemporan si dictionarul cu acele inregistrari modificate (â >> î) pentru AutoCorect Clasic.
Da, Menssana, poate fi editat direct asa dar problema e ca dupa salvare nu mai poate fi incarcat bine de Inlocuirea Multipla. Dictionarele imd au un format special care se pierde cand sunt editate astfel.

PS: am sa modific butonul Implicit de la fereastra de rulare automata astfel incat sa seteze si optiunile ferestrelor de uniformizare font, reparare randuri rupte, marcare si stergere.
La "Setare text la font si marime unica" sunt bune valorile implicite setate? In versiunea actuala poti vedea care sunt prin stergerea AutoCorect.ini inainte de a rula exe.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ar exista o alta modalitate. A aparut de cand am adaugat Copiere/Taiere/Lipire la inregistrari in Inlocuire Multipla. In momentul cand se selecteaza una sau mai multe inregistrari si se da Copiere sau Taiere, sunt puse in Clipboard intr-un format care se poate utiliza la editare si salvare.
Cum poti face: deschizi dictionarul in Inlocuire Multipla in AutoCorect Contemporan. Selectezi toate inregistrarile si dai Copiere/Taiere. Inchizi AutoCorect Contemporan si deschizi AutoCorect Clasic. Dai copiere acolo in zona de text nu in Inlocuire Multipla. Rulezi conversia in clasic. Selectezi tot textul si dai Copiere.
Inchizi AutoCorect Clasic si redeschizi AutoCorect Contemporan. La Inlocuire Multipla generezi un dictionar nou fara inregistrari, dai Lipire si apoi salvezi dictionarul.

Cu aceasta metoda poti face si alte tipuri de modificari dar trebuie sa ai grija sa nu strici formatul textului (de exemplu numarul si pozitia taburilor si a ruperilor de rand). Deci nu utilizati Word pentru editare. Si sa verificati dupa fiecare operatie de Lipire in Inlocuire Multipla ca totul e bine.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Sugestie.

S-ar putea adauga un meniu care sa permita accesul la acele litere speciale (franceza. germana, etc.) sortate pe limbi?


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
E o idee interesanta dar as fi curios sa stiu si parerea altora despre necesitatea ei si despre modalitatea de implementare pentru a fi cat mai usor de folosit...

pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani

ciuperca_cosmin a scris:

E o idee interesanta dar as fi curios sa stiu si parerea altora despre necesitatea ei si despre modalitatea de implementare pentru a fi cat mai usor de folosit...


   Cred că un buton în bara de sus ar fi bine. La accesarea lui ar trebui să se deschidă o fereastră care să cuprindă acele semne-caractere speciale. Exact cum este meniul "Insert Symbol" din Word.
   A doua variantă ar fi plasarea în meniul contextual acela cu click-dreapta. Nu ştiu cât este de posibil tehnic. Oricum aşa cum am spus meniul contextual va avea noi funcţii pe care le voi spune la momentul oportun.

Modificat de BlankCd (acum 13 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
Equinox
VETERAN

Inregistrat: acum 14 ani
Nu credeti ca acest post ar trebui mutat in Totul despre carti? :D

_______________________________________
Urăsc prostia!
Star Wars - Banda desenata tradusa in limba romana

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
A fost acolo dar a fost mutat aici ca sa fie accesat de mai multi

pus acum 13 ani
   
Equinox
VETERAN

Inregistrat: acum 14 ani
Adica avem un forum PREA FRUMOS, DE ACEEIA MA AFLU PRINTRE VOI

Saw edit: ATENTIE LA CUVNTELE CARE LE FOLOSESTI, NIMENI NU ARE NEVOIE DE TINE AICI, MULTUMESTE-TE PENTRU MUNCA CARE O FAC ALTII PENTRU TINE


_______________________________________
Urăsc prostia!
Star Wars - Banda desenata tradusa in limba romana

pus acum 13 ani
   
menssana1984
Vizitator



Dude.... deci meniul cu literele alea bengoase....


- intai trebuie sa identificam literele si codurile corecte pentru franceza, germana si.... ahhh... habar nu am.... parca astea sunt de regula prin carti, nu?

- sa vedem daca exista in AC.

- iar daca exista eu zic ca se poate rezolva doar din COmbinatii Taste. In principal, sunt litere normale cu bazdaganii deasupra. Dar avem nevoie fie de codul corect din AC, fie de un cod personalizat daca nu apare in AC.

Este valabila si ideea cu butonul, exact cum e cel de acum de la Diacritice, cred ca il stiti nu?
Dar ingreuneaza munca oleca.
Iar daca mergem pe combinatii taste, in principal, CTRL+A e o litera straina... dar e si comanda de selectare totala a textului
Intelegeti?
Inmultim cam mult combinatiile de taste si riscam sa intram prin alte parti.
Eu in momentul asta am activate 6 combinatii. Daca mai adaug inca 4 sa zicem cred ca termin tastatura.

Equinox, nu e un forum varza. Topicul a fost mutat aici de la Totul despre carti pentru a permite celor de aici sa afle de topic. Asa cum esti tu


pus acum 13 ani
   
Equinox
VETERAN

Inregistrat: acum 14 ani
ACESTA ESTE UN AVERTISMENT. TINE BINE DE EL

_______________________________________
Urăsc prostia!
Star Wars - Banda desenata tradusa in limba romana

pus acum 13 ani
   
menssana1984
Vizitator



Inseamna ca AC-ul, mai nou, e un program dedicat corectarii cartilor si nu ar strica sa fie pus la vedere pentru a ajuta la dezvoltarea sa.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
jullien_alphonse
Pe lista neagra

Inregistrat: acum 18 ani
simplu, fara combinatii de taste
scoateti iconitza din CHARACTER MAP in TASKBAR jos.

START - All PROGRAMS - Accesories - System Tools -
- CHARACTER MAP contine foarte multe simboluri /litere.


pus acum 13 ani
   
menssana1984
Vizitator



Ideea era sa fie accesibile direct din program, sortate pe limbi si sa fie vizibile doar cele importante.
Nu sunt prea multi cei care se descurca in mormanul ala de simboluri si cu atat mai putini sunt cei care sunt siguri ca au ales simbolul potrivit si nu unul asemanator.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      1. Două virgule se transformă în ghilimele.
      Am verificat în text şi am descoperit care erau situaţiile neconvertite. Este vorba de virgule duble la început de paragraf; era normal să nu fie convertite, dacă exista condiţia ca ele să se afle între cuvinte. Da, cred că se poate extinde convertirea pentru toate situaţiile; nu văd în acest moment ce efecte secundare eronate ar putea rezulta din extinderea conversiei la toate situaţiile.


      2. menssana1984 a scris:
S-ar putea adauga un meniu care sa permita accesul la acele litere speciale (franceza. germana, etc.) sortate pe limbi?

      Vrei altceva decât ceea ce face opţiunea Inserare – Simbol, care este deja implementat? Nu ar fi suficient ca iconul acestei opţiuni să fie urcat în bară?
      "Sortate pe limbi si sa fie vizibile doar cele importante... " - cred că implementarea în acest mod cere prea multă muncă din partea prietenilor noştri programatori, pe care, trebuie să recunoaştem, i-am stresat destul de mult.


      3. menssana1984 a scris:
(…) Gura -o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă. (…)
      Părerea mea personală este că acea cratimă lipită este pur şi simplu o linie de pauză/explicativă clasică.
      Textul ar putea fi scris sub forma:
      „Gura (o prăpastie neagră de anxietate), urla la uşa lipsită de viaţă.”
      Într-adevăr, în Meniul OCR Plus, opţiunea 6.1 Ştergere cratimă semi-independentă face următoarele două înlocuiri:
                      - "spaţiu""cratimă" înlocuit cu "nimic"
                      - "cratimă""spaţiu" înlocuit cu "nimic"
      Dacă această opţiune va fi setată default activ, atunci după rularea automată vei obţine următorul text:
      „Gura o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă.”

      Cam genul ăsta de situaţii m-au făcut să propun ca opţiunile care fac ştergeri de caractere să fie inactive default.
      M-am gândit că pentru începători e mai bine să nu se şteargă caractere, decât să fie sterse, iar ei să nu ştie mare lucru despre acest lucru; majoritatea răgăliilor înlocuiesc un caracter real, doar o parte dintre ele sunt recunoaşteri false a unor pete, umbre ori defect de textură a hârtiei.


      4. Despre dicţionarele OCR_DIC
      La această oră sunt urcate în folderul de la adresa:
dicţionarele reactualizate la data de a Decembrie 2011.
      Toate îmbunătăţirile pe care le voi mai face vor fi urcate în acest folder, pe care voi continua să-l ţin activ.



Equinox a scris:
Nu credeti ca acest post ar trebui mutat in Totul despre carti?
Equinox a scris:
Adica avem un forum varza.
Equinox a scris:
Inseamna ca aici ar trebui mutate toate topicurile sa auda lumea de ele. Varza de forum, sincer.

       Vrei să întrebi ceva sau să contribui la îmbunătăţirea programului AutoCorect OCR_Plus?
       Dacă răspunsul este „Da”, atunci poţi pune întrebarea sau face propunerea cu toată încrederea şi întrebarea va primi răspuns iar îmbunătăţirea adusă va putea folosi multor useri.
       Dacă nu te interesează programul – nu-i nicio problemă – nu e neapărat nevoie să încalci regulamentul, postând off topic, făcând aprecieri jignitoare cu notă arogantă, doar de dragul de a-ţi da cu părerea.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Felul in care cratima semi-independenta a fost rezolvata ofera mai multa flexibilitate. In acel loc poate sa fie orice fel de linie, de la cratima la dialog sau un simplu artefact sau un alt simbol interpretat gresit.

Eu nu prea lucrez cu texte cu cuvinte uschite, dar indexarea si apoi sortarea pe limbi a caracterelor speciale aferente unor limbi si introducerea lor, intr-un fel sau altul, in  interfata programului ar fi un pas inainte. Vedeti colegii ce s-au ocupat de Dumas.
Dracia aia de tabel cu caractere contine un pic cam multe. Eu unul, nu m-am descurcat absolut niciodata cu el, iar daca mai adaug la asta si felul in care variaza infatisarea literei in functie de fontul ales.....


Acum, ca o fi usor, ca o fi greu... na.
Asta e treaba lui Cosmin si a lui Daniel. Ei decid lucrurile astea.
Omul propune, Dumnezeu dispune.
Scopul principal al acestui topic e strangerea de sugestii ce pot imbunatati programul si in masura in care timpul si resursele permit, implementarea lor.


Seven, vreau sa stiu in ce stadiu sunteti cu corectura la Hoolgersson (un alt text cu caractere ciudate parca)


Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Alfabet polonez

Francez, german-scandinav, spaniol, italian, portughez.

FRENCH

133 à (0224)
131 â (0226)
135 ç (0231)
130 é (0233)
138 è (0232)
136 ê (0234)
137 ë (0235)
140 î (0238)
139 ï (0239)
    œ (0156)
147 ô (0244)
151 ù (0249)
150 û (0251)
183 À (0192)
182 Â (0194)
128 Ç (0199)
212 È (0200)
144 É (0201)
210 Ê (0202)
211 Ë (0203)
215 Î (0206)
216 Ï (0207)
    Œ (0140)

SPANISH

160 á (0225)
130 é (0233)
161 í (0237)
164 ñ (0241)
162 ó (0243)
163 ú (0250)
129 ü (0252)
    Á (0193)
144 É (0201)
    Í (0205)
165 Ñ (0209)
    Ó (0211)
    Ú (0218)
154 Ü (0220)
168 ¿ (0191)
173 ¡ (0161)

French Continued

226 Ô (0212)
235 Ù (0217)
234 Û (0219)
174 « (0171)
175 » (0187)

ITALIAN

133 à (0224)
138 è (0232)
141 ì (0236)
149 ò (0242)
151 ù (0249)
183 À (0192)
212 È (0200)
      Ì (0204)
      Ò (0210)
      Ù (0217)

PORTUGUESE
    ã (0227)
    Ã (0195)
135 ç (0231)
128 Ç (0199)
149 ò (0242)
    Ò (0210)
162 ó (0243)
    Ó (0211)
    õ (0245)
    Õ (0213)

Polish

GERMAN/SCANDINAVIAN

132 ä (0228)
134 å (0229)
145 æ (0230)
    ð (0240)
137 ë (0235)
148 ö (0246)
155 ø (0248)
225 ß (0223)
    þ (0254)
129 ü (0252)
152 ÿ (0255)
142 Ä (0196)
143 Å (0197)
146 Æ (0198)
    Ð (0208)
    Ë (0203)
153 Ö (0214)
157 Ø (0216)
    Þ (0222)
154 Ü (0220)

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am modificat astfel incat sa fie inlocuite cele 2 virgule indiferent de pozitia in text.
As avea totusi o sugestie: ca inlocuirea lor sa se faca inainte de a se rula Punctuatia obisnuita.
2 motive:
- nu are neaparata nevoie sa fie rulata dupa, deoarece daca Abby intr-adevar a confundat ghilimeaua jos cu 2 virgule nu cred ca vreodata le va pune cu un spatiu sau rupere de rand intre ele - ceva care sa necesite "interventia" Punctuatiei obisnuite (dar poate altii au vazut asta, corectati-ma daca gresesc);
- Punctuatia obisnuita de obicei trateaza altfel grupul de 2 virgule - in unele cazuri chiar sterge una din ele.

Mensanna, inca nu ne-am hotarat 100% daca implementam (inca astept parerea lui Daniel, a revenit in oras abia ieri seara dar era obosit asa ca am lasat pe azi). Lista pare in regula, multumesc, dar totusi e maricica si in consecinta fereastra va fi si ea. O modalitate ar fi sa fie facuta cu taburi (asa cum e facuta fereastra de configurare la AutoCorect de exemplu).

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani

Seven a scris:

Cam genul ăsta de situaţii m-au făcut să propun ca opţiunile care fac ştergeri de caractere să fie inactive default.


       Seven cu toţii ştim că FRECVENT avem situaţii de genul ăsta în texte: "Maria era recunoscută ca fiind o mamă denatu -rată." Unde pauza şi cratima nu au ce căuta. Eroarea apare mai ales la despărţirea în silabe de la capătul rândului.
       Situaţii de genul lui mensanna1984 sunt MULT mai rare.
       Părerea mea este alta privitor la problemă, textul este:
       "Gura -o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă."

        Şi va deveni aşa, pentru că va elimina şi SPAŢIUL şi CRATIMA:
       "Gurao prăpastie neagră de anxietate – urla la uşa lipsită de viaţă."

        Problema aste se rezolvă cu activarea Ortografiei apoi cu click-dreapta apoi ulterior verificat obligatoriu cu pdf-ul de control întrucât are în text o singură linie de pauză şi mai ales că textul ar putea fi şi aşa:
       "Gura-i, o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă." sau aşa:
       "Gura, o prăpastie neagră de anxietate – urla la uşa lipsită de viaţă."
       
       De obicei liniile de pauză vin în perechi. De altfel efectul ăsta secundar a fost prevăzut de mine atunci când am propus asta. Se poate verifica în topic. Şi chiar am spus că trebuie să fie default nu opţional.
        De asemenea şi înlocuirea virgulelor duble dă erori. Voi uitaţi că textul este un OCR. Virgulele duble pot fi şi "două puncte de suspensie" unde al treilea punct poate fi lipsă adică să nu fi fost recunoscut de OCR sau pot fi 2 fibre din hârtie convertite greşit de OCR ca fiind virgule duble DAR pot fi şi ghilimele. Nu spun că eliminarea convertirii virgulelor duble este necesară. Ea trebuie să fie aşa cum este.
        NOI trebuie să bifăm default ceea ce dă un text mai bun, adică avantajele să fie net mai mari decât dezavantajele.
        TOT ce am introdus în meniul OCR Plus, dă erori mici pe unele texte particularizate, DAR lucrurile acestea ni le asumăm pentru că beneficiile sunt mult mai net superioare.

Modificat de BlankCd (acum 13 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
menssana1984
Vizitator



Seven, poate gresesc eu, dar nu vad ce rost are sa rulam odata o optiune din OCR si apoi sa cautam cu alta din Ortografie.
Punctuatia arata toate situatiile direct, fara etape intermediare si de transformare a problemei initiale in alta, si se accepta interventia manuala.

Bine. Eu nu ma pricep la ce ati facut voi in OCR, asa ca poate ce zic eu e gresit.

Cosmin, acele coduri enumerate de mine mai sus, sunt identice cu cele din AC? Ajung acasa abia diseara si nu am cum sa verific.
Chestia asta nu e prioritara si nici urgenta, cu atat mai putin implementarea ei.
E doar o sugestie, sper, utila. Avem destule de lucrat si testat acum.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani

menssana1984 a scris:

Seven, poate gresesc eu, dar nu vad ce rost are sa rulam odata o optiune din OCR si apoi sa cautam cu alta din Ortografie.
Punctuatia arata toate situatiile direct, fara etape intermediare si de transformare a problemei initiale in alta, si se accepta interventia manuala..


   Etapele OBLIGATORII rulării unui OCR în AutoCorect sunt:
         
        1. Rularea meniului OCR Plus în setare default. Aici nu vorbim de preferinţele noastre ci de faptul că userul nou trebuie să scoată un text cât mai bun. El nu ştie că în text litera l este înlocuită cu cifra 1... şi multe alte asemenea. El nu ştie dacă are rânduri rupte, el nu ştie că are tab-uri în text etc etc. De altfel i-am propus lui Cosmin ca după rularea meniului OCR Plus să apară o fereastră care să-i spună userului că următorul pas în corectarea OCR-ului este activarea funcţiei Ortografie.
        2. După rularea OCR Plus trebuie obligatoriu rulată opţiunea Ortografie, unde se corectează grosier cuvintele incerte.
        3. Se corectează textul - fie în Word fie în AutoCorect - prin verificarea-compararea pdf-ului de control pentru a obţine un v1.0


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Menssana, la fiecare caracter ai pus 2 coduri: primul e folosit in texte setate doar pe acea limba - cum noi folosim texte setate pe romana sau, mai rar, mixte, nu ne folosesc. Al doilea (cel dintre paranteze) e universal. Il gasesti la Insert Simbol daca setezi Set de caractere ca Unicode.

autocorect versiune pentru menssana, fiecare caracter pus coduri: primul folosit texte setate doar

52.4KB


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      Două virgule convertite în ghilimele de început.

      Dacă apreciaţi că opţiunea convertirii produce mai mult rău decât bine, putem renunţa la ea. Cine va dori, totuşi, să facă convertirea are suficiente posibilităţi de înlocuire şi o va putea face personal.
      Pentru orice eventualitate, propun convertirea numai în următoarele două situaţii:
            - două virgule la început de paragraf - în cazul acesta virgulele duble sunt în majoritatea situaţiilor ghilimele de început.
            - între cuvinte, dar cu condiţia să urmeze după spaţiu, pentru a evita posibilitatea ca virgulele să fie în realitate puncte de suspensie.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani

Seven a scris:

***
      Două virgule convertite în ghilimele de început.

      Dacă apreciaţi că opţiunea convertirii produce mai mult rău decât bine, putem renunţa la ea. Cine va dori, totuşi, să facă convertirea are suficiente posibilităţi de înlocuire şi o va putea face personal.
      Pentru orice eventualitate, propun convertirea numai în următoarele două situaţii:
            - două virgule la început de paragraf - în cazul acesta virgulele duble sunt în majoritatea situaţiilor ghilimele de început.


      De acord DAR, în centralizatorul făcut de mine am propus ca semnele de punctuaţie care se află la începutul paragrafului - cred că am spus să fie şterse. Trebuie văzut cum va funcţiona dacă la începutul paragrafului avem 2 virgule. În meniul propus de mine este DOAR o virgulă... va elimina doar una probabil, iar alta va rămâne. Trebuie văzut şi locaţia meniului propus de tine adică înaintea meniului propus de mine sau după. Sigur vor apărea incompatibilităţi. Trebuie gândit bine.


Seven a scris:

***
            - între cuvinte, dar cu condiţia să urmeze după spaţiu, pentru a evita posibilitatea ca virgulele să fie în realitate puncte de suspensie.

     
       Din câte ştiu eu meniul Punctuaţie SCOATE spaţiul de dinaintea virgulelor. Deci în text este posibil să nu existe "spaţiu""virgulă".
       Trebuie verificat ce spun eu.

Modificat de BlankCd (acum 13 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
     Cosmin a propus ca această opţiune să ruleze înaintea punctuaţiei.
     Dacă va rula înainte de punctuaţie, atunci eliminarea spaţiului aflat înaintea virgulei va rula corect, deoarece avem deja ghilimele; ştergerea răgăliilor nu va afecta nici ea, deoarece deja convertirea este făcută şi la acel moment.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Menssana, am implementat salvarea automata a pozitiei cursorului in text. Vezi ca e un buton nou la marginea din dreapta a primului toolbar. Dai bifa la meniul butonului, inchizi rtf-ul, il redeschizi si dai click pe buton.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Ok. Testez.

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Momentan functia e semiautomata dar poate fi facuta complet automata sau manuala. Fiecare din cele 3 are avantaje si dezavantaje.
Ca sa fie automata as putea sa o pun ca optiune bifabila in Configurarea AutoCorect.
Ca sa fie manuala ar trebui sa adaug butoane/meniuri care sa salveze respectiv sa stearga manual pozitia salvata.

Oricum poate deja ai bagat de seama ca, dupa ce ai activat optiunea, te intreaba de salvare text de fiecare data cand inchizi textul sau AutoCorect - chiar daca nu ai modificat textul. Asta pentru ca informatia despre ultima pozitie a cursorului e salvata in chiar fisierul rtf.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
     Cosmin,
     Pentru o mai comodă aranjare pe ecran a pdf şi document de corectat în Autocorect am două întrebări, deocamdată doar cu scop informativ:
           - fereastra "Confirmare" de la înlocuire multiplă ar putea să rămână fixă într-o poziţie pe care ar stabili-o utilizatorul undeva în afara textului de corectat? Asta dacă nu implică multă muncă şi dacă mai sunt şi alţi useri care consideră acest lucru folositor.
           - formatul paginii în corectat ar putea fi modificat?
     În momentul când am pe ecran două ferestre [pdf din imagini şi document de corectat] personal folosesc la documentul de corectat un format custom mai îngust decât A4 [între 7,4" şi 6,6"] şi cu margini laterale foarte mici, de 0,1" ÷ 0,2".


     LE: În legătură cu formatul de pagină.... am spus o prostie... de fapt, AutoCorect păstrează formatul paginii încărcate, aşa că se poate formata oricum dorim înainte de a încărca în AutoCorect.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

Seven a scris:

- fereastra "Confirmare" de la înlocuire multiplă ar putea să rămână fixă într-o poziţie pe care ar stabili-o utilizatorul undeva în afara textului de corectat? Asta dacă nu implică multă muncă şi dacă mai sunt şi alţi useri care consideră acest lucru folositor.


Probabil intrebi daca e posibil sa implementez ceva ca la Diacritice - unde poti muta fereastra de confirmare si ramane acolo, nu?
Daca asta e, atunci da, se poate si nu necesita chiar atat de multa munca. O sa incerc sa adaptez codul de la Diacritice - probabil vrei si o metoda ca acolo de a reveni la pozitionarea ferestrei sub cuvant, nu?


Seven a scris:

- formatul paginii în corectat ar putea fi modificat?


Mai exact in ce moment - ca in mod obisnuit cu meniul Fisier >> Setare pagina se poate modifica...


pus acum 13 ani
   
AutoCorect
Membru Puf

Inregistrat: acum 13 ani
fara mess

Modificat de AutoCorect (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Eu folosesc un A5 cu margini de 0,5 si un font de 22 pentru lucrul cu pdf-ul.
Cum e si in screenshot.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
AutoCorect
Membru Puf

Inregistrat: acum 13 ani
fara mess

Modificat de AutoCorect (acum 13 ani)


pus acum 13 ani
   
lastiz
Membru Gold

Inregistrat: acum 15 ani
Cosmin, vezi MP.

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      1. Fereastra "Confirmare" de la înlocuire multiplă
      Da, exact ca la Diacritice - să se poată muta fereastra de confirmare si să ramână acolo.

      2. Despre formatarea paginii.
      Îmi cer scuze! A fost o confuzie de moment în mintea mea. Problema nu trebuie luată în seamă.

      3. Am în acest moment un foarte-foarte mic dicţionar care trebuie rulat doar cu confirmare.
      Este vorba de cuvinte care există şi în forma corectată, dar şi în forma eronată, doar că frecvenţa este în favoarea celor ce trebuiesc corectate, ca de exemplu:
      c l a r  -  d a r;   s t i n g - s t â n g;   l i n g ă - l â n g ă ....
      Cuvintele corecte ar fi:  d a r,   s t â n g,   l â n g ă...
dar, există în text şi cuvintele c l a r,   s t i n g,   l i n g ă....
      Problema ar fi simplu de rezolvat cu un dicţionar suplimentar de către cei ce ştiu de aceste situaţii. pentru cei neavizaţi, mă gândesc că ar fi bine ca dicţionarul să fie unul dintre cele obligatorii...
      Credeţi că acest aspect merită atenţie?


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

Seven a scris:

***
      1. Fereastra "Confirmare" de la înlocuire multiplă
      Da, exact ca la Diacritice - să se poată muta fereastra de confirmare si să ramână acolo.

      2. Despre formatarea paginii.
      Îmi cer scuze! A fost o confuzie de moment în mintea mea. Problema nu trebuie luată în seamă.

      3. Am în acest moment un foarte-foarte mic dicţionar care trebuie rulat doar cu confirmare.
      Este vorba de cuvinte care există şi în forma corectată, dar şi în forma eronată, doar că frecvenţa este în favoarea celor ce trebuiesc corectate, ca de exemplu:
      c l a r  -  d a r;   s t i n g - s t â n g;   l i n g ă - l â n g ă ....
      Cuvintele corecte ar fi:  d a r,   s t â n g,   l â n g ă...
dar, există în text şi cuvintele c l a r,   s t i n g,   l i n g ă....
      Problema ar fi simplu de rezolvat cu un dicţionar suplimentar de către cei ce ştiu de aceste situaţii. pentru cei neavizaţi, mă gândesc că ar fi bine ca dicţionarul să fie unul dintre cele obligatorii...
      Credeţi că acest aspect merită atenţie?



1. O sa incerc sa implementez atunci.
3. Da, ar merita sa fie adaugate dar nu stiu daca sa fie obligatorii. Asta pentru ca utilizatorul obisnuit prefera un rezultat rapid si usor, nu sa dea confirmare. Mai tarziu, cand va vrea ceva mai mult, o va activa. Ca veni vorba, tocmai din acest motiv nu am activat implicit confirmarea la diacritice.
Chiar si la 4.7 nu sunt 100% de acord cu acea confirmare la dialog francez dar totusi acolo e o situatie un pic mai "speciala"...
Asta e parerea mea - dar daca ajungeti la consens ca ar ajuta totusi, o s-o implementez sa fie rulata obligatoriu.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Intre timp am mai rezolvat mici probleme.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
     În legătură cu dicţionarul cu două variante, cred că ai dreptate.
     Când va mai fi completat, îl pot urca separat de celelalte dicţionare şi în "Descrierea dicţionarelor OCR_DIC" am să fac o referire la el, recomandând ca cei interesaţi să-l ruleze suplimentar.

      Pe de altă parte avem mult de testat şi de verificat ca să vedem cât de bine funcţionează în OCR-ul real ceea ce deja s-a implementat.

     Mulţumim pentru versiunea de azi. Am s-o testez mai târziu.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Ce am vrut sa spun e ca cred ca poate fi adaugata la meniu in OCR Plus dar nu cred ca e bine sa fie bifata implicit in rularea automata.

Altceva: dupa cateva discutii am ajuns la concluzia ca s-ar merita adaugarea de setari de pagina si de aliniere la 1.2
Exista texte care au probleme de acest gen si uniformizarea textului (si) in aceasta privinta (mai ales la aliniere) ar duce la o corectare manuala ulterioara mai usoara.
Ce parere aveti...?


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
       - Dicţionar cu două variante.
      Nu, nici vorbă să fie implicit, poate foarte bine să fie rulat la 12.Setări finale.
      Ai dreptate, e mai bine să fie prins în OCR_Plus pentru că un începător nu bănuieşte că într-un OCR e posibil ca toate cuvintele "dar" să fie recunoscute eronat de Abbyy drept cuvântul "clar". Există şi OCR-uri în care nu vor exista astfel de probleme. De altfel, eu nu am constatat astfel de erori de genul "c+l = d" până la ultimele volume din Karl May... sau poate au existat, dar neavând la dispoziţie un produs de curăţat OCR, rămâneau prea multe erori şi nu ieşeau în evidenţă în mod special.

       - Formatare text. Orice nouă implementare este mai mult decât binevenită şi ne scuteşte de multă muncă, doar că nu voiam să abuzăm în mod exagerat de bunăvoinţa voastră.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani
--->

     Referitor la dicţionare, mă refer la cele intitulate Uzuale din arhiva lui Seven: este să luăm o hotărâre după ce vom implementa ce este în centralizator. Aceste dicţionare pot fi completate până atunci apoi vom hotărî cum vor fi rulate: automat unele altele opţional în funcţie de particularităţile fiecăruia.
     Eu lucrez la un dicţionar care va pune cratimă la cuvintele care nu au cratimă, dicţionarul are 2800 de intrări, acum îl perfecţionez.
     Îl voi pune pe forum la momentul potrivit.


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani

Seven a scris:

***
       - Dicţionar cu două variante.
      Nu, nici vorbă să fie implicit, poate foarte bine să fie rulat la 12.Setări finale.
      Ai dreptate, e mai bine să fie prins în OCR_Plus pentru că un începător nu bănuieşte că într-un OCR e posibil ca toate cuvintele "dar" să fie recunoscute eronat de Abbyy drept cuvântul "clar". Există şi OCR-uri în care nu vor exista astfel de probleme. De altfel, eu nu am constatat astfel de erori de genul "c+l = d" până la ultimele volume din Karl May... sau poate au existat, dar neavând la dispoziţie un produs de curăţat OCR, rămâneau prea multe erori şi nu ieşeau în evidenţă în mod special.


Bine, il implementez ca 12.2. Cum sa se numeasca optiunea si ce nume are dictionarul?


Seven a scris:

       - Formatare text. Orice nouă implementare este mai mult decât binevenită şi ne scuteşte de multă muncă, doar că nu voiam să abuzăm în mod exagerat de bunăvoinţa voastră.


O sa adaug atunci - dar trebuie discutate valorile implicite respectiv care din ele sa fie utilizabile direct si la care sa pui cu bifa - respectiv care sa fie bifate sau debifate implicit.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani

ciuperca_cosmin a scris:

Bine, il implementez ca 12.2. Cum sa se numeasca optiunea si ce nume are dictionarul?
     M-ai prins pe picior greşit.
     Nu-mi trece prin cap cum ar trebui să sune opţiunea ca să fie cât mai sugestivă...
     Deocamdată o prindem cumva în Meniu ca să n-o uităm, poate ar trebui să nici n-o implementăm deocamdată, ci doar să apară în meniu inactivă.
     Trebuie cugetat mai mult la această opţiune...
     Ştiu că şi menssana are un dicţionar de genul ăsta, poate mai au şi alţii... şi trebuie să mai vedem ce şi cum...

     Mai mult, ar putea fi o opţiune cu mai multe variante, aşa cum este la marcarea sau ştergerea de răgălii, în sensul că se poate pune un dicţionar care cuprinde doar cuvinte de mare frecvenţă, şi un altul... ori altele cu alte grupuri de frecvenţă mai mică.
     Nume dicţionar?... ar putea fi numit "Duble.imd" - sau dacă ar fi mai multe pot fi Duble1.imd - Duble4.imd" - asta sună destul de sugestiv şi nici nu e o denumire mult prea lungă.
     
     Despre formatare:
     Alinierea rândurilor - eu propun să fie bifată default varianta "Stânga-dreapta"

     Format pagină... aici e mai complicat, dar cred că ar fi bine să plecăm de la format A5.
     Dacă vom continua corectura în AutoCorect avem nevoie de un format mai mic, pentru a fi văzut bine pe o jumătate de ecran, cealaltă jumătate fiind ocupată de pdf.

     Mulţi de pe forum folosesc pentru varianta finală corectată un format A5 cu următoarele margini:
               Sus = Jos = Stânga = Dreapta = 0,4”
               Header = Footer = 0,15”

     Poate pentru a fi şi mai vizibil pe ecran, putem folosi iniţial nişte margini şi mai mici, cum ar fi 0,2". În acest caz, ar putea fi folosit A5 cu următoarele margini:
               Sus = Jos = Stânga = Dreapta = 0,2”
               Header = Footer = 0,15”
      Am dat doar un exemplu... discuţia este complet liberă şi nu susţin una sau alta dintre variante; pot fi de acord cu orice propuneri şi justificări.

      Menţionez că valorile în milimetri pentru marginile de mai sus sunt următoarele:
               0,15” =  3,8 mm               0,2”  =  5,1 mm
               0,4” = 10,2mm                 0,5   =  12,7mm


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Un moment.

Dictionarele la care lucrez, din cand in cand, eu, nu au treaba cu ocr-ul.
Doar indexez cuvintele cu forma corecta ce ortografia le indica ca posibile probleme si eventual diferitele lor conjugari. In special cuvintele cu cratima.

Dictionarul acesta il predau direct lui Cosmin. Nu are treaba cu Ocr-ul.

Eventual mai adaug la ele si ciudateniile ce raman dupa ce s-a rulat Ocr-ul si cele 3 functii si nu sunt remediate/semnalizate de program.
Sau cuvintele ce au sugestii incorecte.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      menssana1984,
      Mii de scuze! Înseamnă că nu am fost atent. Ai spus ceva despre dicţionare cu confirmare şi am crezut că te referi la aşa ceva.
      Despre formatul de pagină ai un comentariu?

     
      Cosmin şi AutoCorect,
      Aş avea nevoie de un ajutor mai complicat...
      Exemplu: am întâlnit cuvântul "cu" scris "Cu", deci cu majusculă în interiorul propoziţiei. Dacă pun în dicţionarul cu confirmare:
Caută  "spaţiu-Cu-spaţiu" şi înlocuieşte cu "spaţiu-cu-spaţiu", atunci vor fi propuse spre modificare şi cuvintele "Cu" aflate la început de frază în interiorul paragrafului.

      Dacă s-ar putea scrie ceva de genul:
Caută "orice_literă-spaţiu-Cu-spaţiu-orice_literă" şi înlocuieşte cu "orice_literă-spaţiu-cu-spaţiu-orice_literă" - asta ar fi mai bine... doar că habar nu am dacă se poate implementa aşa ceva şi dacă "orice_literă" nu face ca la înlocuire să poată apărea cu adevărat oricare literă în locul celei iniţiale, astfel încât "cozonaci Cu nuci" să se transforme în "cozonacw cu kuci"...

       Am uitat să menţionez că acest lucru aş vrea să-l pot face în dicţionarul cu confirmare despre care am vorbit mai sus.
      Credeţi că sunt pe ale mele?... sau am luat-o razna rău?...

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
AutoCorect
Membru Puf

Inregistrat: acum 13 ani
fara mess

Modificat de AutoCorect (acum 13 ani)


pus acum 13 ani
   
menssana1984
Vizitator



Tu si politetea ta

Dictionarele cu confirmare ar trebui sa fie doar la Dialog Francez si la anumite cuvinte gen clin/din.

Formatul de pagina default ce ramane dupa OCR, e irelevant. Utilizatorul oricum si-l poate seta dupa voia lui.

Sunt curios sa vad raspunsul lui Cosmin. Dar suna nitel cam complicat, mai ales daca vrei sa o faci in dictionar.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am inteles, vrei sa faci ceva de genul ^$ din Word.
E posibil de implementat dar nu chiar asa de usor... O sa incerc dupa ce termin ce m-am apucat acu...


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Fereastra de setari pentru uniformizarea textului ar arata asa:



Cum am spus trebuie stabilite valori implicite pentru aceste setari, respectiv care sa fie bifate/debifate implicit.
Pentru pagina Seven a dat 2 seturi dar vad ca altii nu au spus nimic despre asta.
Oricum, daca nu se pot gasi valori care sa multumeasca cel putin pe majoritatea poate macar se pot seta valori care sa rezolve cat de cat problema.
In acest sens am sa sugerez o solutie mai "neortodoxa": sa scot setarea de format de pagina iar marginile sa nu se mai seteze in unitati de masura ci in procente (din marimea paginii). De exemplu 5%. In acest fel se seteaza o suprafata utilizabila medie potrivita oricarui format de pagina si se poate corecta acceptabil.
Ce parere aveti..?
Daca nu va place nu-i bai, e doar o idee...

PS: sau puteti alege un format standard care sa fie setat implicit - ca sa usureze corectarea ulterioara. Dupa aceea fiecare isi poate seta ce considera potrivit.

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
       1. Fereastra de setari pentru uniformizarea textului
       Cred că acestea ar trebui să fie valorile implicite.
       Valoarea de 1cm a marginilor la format A5 este practică şi comodă pentru utilizatori, inclusiv pentru cei neexperimentaţi; cei ce au mai multă experienţă şi au alte preferinţe îşi vor putea seta pagina cum doresc şi setarea va fi salvată astfel pentru celelalte documente.
       Cred că la această opţiune s-a făcut tot ceea ce trebuia făcut şi putem să o declarăm finalizată.


       2. Dicţionare UZUALE
       Dicţionarele urcate de mine cu acest nume sunt doar un exemplu şi au fost puse la dispoziţie doar pentru a putea face testarea opţiunii 11.

       Dicţionarele obligatorii [adică cele ce rulează automat în primele 10 opţiuni] conţin un număr foarte mic de cuvinte sau secvenţe de cuvinte şi am încercat să pun doar acele modificări ce nu produc efecte secundare. Mai mult decât atât respectivele dicţionare conţin doar cuvinte scurte de până la 4 litere şi doar foarte-foarte puţine cuvinte mai lungi de 4 litere.
       Am considerat că fiecare utilizator poate simţi nevoia realizării unor dicţionare proprii pentru a corecta anumite cuvinte ce pot apărea la o serie de volume şi care nu se corectează prin rularea meniului OCR_Plus. Practic acestea sunt nişte dicţionare personale.

       Am realizat că este greoaie metoda rulării acestor dicţionare bucată cu bucată cu ajutorul opţiunii "Editare / Înlocuire multiplă...", făcând o mulţime de paşi pentru rularea fiecărui dicţionar. De multe ori trebuie reluată rularea unui anumit dicţionar, deoarece pe timpul corecturii pot di adăugate noi înregistrări.

       Din acest motiv am explicat lui Cosmin că implementarea unei opţiuni care să permită rularea unui grup de dicţionare, altele decât cele obligatorii, ar fi foarte utilă.
       Personal, în acel moment lucram la dicţionare de transformare a limbajului interbelic în limbaj contemporan şi aveam 20 de dicţionare ce trebuiau rulate de foarte multe ori, pentru a constata ce modificări noi trebuiesc adăugate.
       Astfel a apărut această opţiune nr.11

       Deci la opţiunea 11, fiecare îşi va putea rula dicţionarele sale personale atunci când va simţi nevoia şi va crea astfel de dicţionare. Actualele dicţionare UZUALE pe care le-am urcat pe mediafire vor fi şterse, ele producând efecte doar asupra unor volume, în timp ce la altele nu fac nicio modificare.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani
--->

     Despre formatul paginii.

     Părerea mea este că sunt 2 probleme distincte a formatului paginii, în funcţie de etapa corectării OCR-ului:

     1. Când avem un OCR acesta poate veni într-o infinitate de variante, cu margini de diferite valori, pot veni cu page break după fiecare pagină etc etc. Rularea meniului OCR Plus ar trebui să uniformizeze toate aceste erori în format, eu aş spune A4 [poate fi şi alt format] pe care eu îl folosesc preponderent, deoarece trebuie să vedem textul cât mai bine, fiindcă avem de făcut confirmări la înlocuirile cu confirmare. Şi mai avem şi corectarea grosieră care se face cu activarea Ortografiei unde este musai necesar să avem textul aerisit pentru o corectare uşoară. Un alt motiv pentru păstrarea formatului standard este şi faptul că unii useri noi nu vor ştii dacă s-au adus modificări formatului standard de pagină A4 sau A5.
         În acest sens eu sunt pentru păstrarea formatului standard A4 sau A5 cu setările marginilor aferente aşa cum este setat default în Word. Pentru ele - sper să nu greşeşc este de - valoarea este de 2,5. În acest sens indiferent care este formatul ales A4 sau A5 el sa fie setat default.

     2. Formatul paginii atunci când facem corectarea OCR-ului prin verificarea cu pdf-ul de control pentru v1.0 este cu totul altul decât pentru rularea OCR-ului în OCR Plus şi corectarea grosieră cu activarea funcţiei Ortografie, adică atunci când avem 2 ferestre deschise, este diferit în funcţie de ce fel de monitoare avem, de preferinţele fiecăruia. Acest lucru îl face fiecare cum cred de cuviinţă. Nu cre că se poate impune un standard.


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
        BlankCd, ca să nu pară că suntem într-o situaţie fără ieşire, hai să stabilim câteva aspecte:
        1. posibilitatea serării paginii în opţiunea 1.2 este benefică sau nu?
                Eu cred că e foarte bună - atunci propun să rămână implementată.

        2. există un format universal valabil ca să ne mulţumească în orice situaţie?
                Eu cred că nu, pentru că aşa cum spui, depinde de ceea ce facem în AutoCorect, adică dacă vom face şi intervenţii care necesită accesarea ferestrei de vizualizare a pdf-ului sau nu... etc. etc.
                În cazul ăsta propun ca niciun parametru al formatării de pagină să nu fie activ default şi fiecare va seta ceea ce crede că îi este folositor.


        LE: Revin în 2-3 ore şi vă propun să facem un fel de analiză a opţiunilor existente, în ideea de a constata dacă mai este nevoie de modificarea vreuneia dintre ele, astfel încât să apreciem ca un pachet de opţiuni este gata, la alt pachet mai avem de muncă etc., după care să vedem ce alte propuneri faţă de opţiunile implementate mai sunt.

        Aş propune ca după o primă revizuire să încercăm să cooptăm pentru testări şi utilizatori de Linux pentru a constata cum funcţionează OCR_Plus sub acest sistem, deoarece sunt mulţi useri de pe secţiune care lucrează cu sisteme de operare din gama Linux.
        Dacă până la implementarea OCR_Plus au fost câţiva useri care mi-au transmis personal sau pe forum că dicţionarele AutoCorect de înlocuire multiplă rulau fără probleme, după implementarea OCR_Plus nu am decât foarte puţine informaţii; practic, doar naid a spus ceva din care rezulta că rulează, dar cu probleme.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani

Seven a scris:

***
        BlankCd, ca să nu pară că suntem într-o situaţie fără ieşire, hai să stabilim câteva aspecte:
        1. posibilitatea serării paginii în opţiunea 1.2 este benefică sau nu?
                Eu cred că e foarte bună - atunci propun să rămână implementată.


        Este benefică fără discuţie.


Seven a scris:


        2. există un format universal valabil ca să ne mulţumească în orice situaţie?
                Eu cred că nu, pentru că aşa cum spui, depinde de ceea ce facem în AutoCorect, adică dacă vom face şi intervenţii care necesită accesarea ferestrei de vizualizare a pdf-ului sau nu... etc. etc.
                În cazul ăsta propun ca niciun parametru al formatării de pagină să nu fie activ default şi fiecare va seta ceea ce crede că îo este folositor.


         Eu sunt pentru bifarea în default, nu aşa cum am spus anterior, a oricărui format A4 sau A5 cu setări ale marginilor de cât o fi... de 1, de 0,5... etc
         Numai să cădeţi mai mulţi de acord că acest lucru este benefic. Personal îmi este indiferent cum este setat default - eu am setări atipice, dar ar trebui ceva setat ca default pentru userii care nu ştiu.
         Stabiliţi formatul şi marginile şi acela va fi default.


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
lucifer76
Membru Junior

Inregistrat: acum 14 ani
O mica nelamurire. Nu ati gasit pana acum nici un rtf care sa ingreuneze AC-ul? Adica sta si 10 secunde sa adaug un cuvant in disctionar la Ortografie, cand la alte fisiere se face instantaneu. Nu e mare, are 350 de pagini. Si NU e de la PC, am incercat pe 3 si exact la fel se misca. Singura solutie a fost sa spart fisierul in bucati de cate 50 de pagini.

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Poti te rog sa pui rtf-ul pe un site ca mediafire si sa postezi link-ul?
Multumesc.


pus acum 13 ani
   
menssana1984
Vizitator



Apropo de dictionare.

Atunci cand se adauga o inregistrare noua in ele sau dorim sa vedem cum functioneaza una veche, ar fi foarte util ca in dictionar sa aplicam o setare ce culoare. Adica:

Spatiu sange Spatiu > Spatiu Sânge Spatiu

Asta ar fi o inlocuire normala, cuvantul nu e prea bun de exemplu dar nu conteaza.

Dar daca s-ar putea seta:

Spatiu sange Spatiu > ^rSpatiu Sânge Spatiu^r

^r ducand la colorarea in rosu a rezultatului inlocuirii.

Comanda sa fie optionala si sa fie folosita doar pentru o vizualizare rapida a efectelor unei inlocuiri intr-un text.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      Să justific ceea ce propusesem mai devreme.
      Din mesajele primite, rezultă că sunt mulţi useri care sunt interesaţi de ceea ce se întâmplă pe acest topic, dar le este deja greu să urmărească tot ceea ce se discută.
      Adevărul este că nici noi, cei ce-l frecventăm zilnic nu reuşim să citim tot ce s-a scris, astfel că mai picăm din când în când pe lângă... 28 de pagini de topic este ceva destul de serios şi greu de urmărit!...
      Au mai spus că s-a intrat deja în chestii de înaltă fineţe şi că ei sunt cumva depăşiţi şi asta înseamnă că în cârca noastră rămâne cam toată răspunderea, dar că aşteaptă versiunea finală ca să poată şi ei lucra cu noul AutoCorect.

      Buuun! Deci, aceşti prieteni ai mei nu au priceput că AutoCorect OCR_Plus este funcţional şi ei cred că e cumva ca la construcţia unei case ce nu poate fi locuită până nu se termină lucrarea. Ei nu s-au prins că noi suntem deja la aranjarea mobilei...
      Săracii, aşteaptă finalizarea ca să poată începe să lucreze. Iartă-i, Doamne că sunt neştiutori!...

      De aceea mă gândeam că ar fi bine să facem o revizuire a pachetelor de opţiuni, începând cu "Conversii preliminare" şi să vedem dacă şi ce îmbunătăţiri mai trebuiesc făcute şi cam ce mai avem noi de lucru concret - bineînţeles mă refer şi la ceilalţi, care nu ne pricepem la programare şi care mai avem de muncă la dicţionare etc...
      Fiecare dintre noi s-a implicat mai mult într-o zonă a opţiunilor, dar e bine să ne punem de acord cu toate, pas cu pas.
      Dacă reuşim să facem o revizuire şi un fel de "recepţie a lucrării", atunci să putem spune "Gata, prieteni! Luaţi AC şi lucraţi cu el!"
      Pentru continuarea perfecţionării programului, ar putea beneficia de mai mulţi utilizatori participanţi la discuţii şi am putea găsi soluţiile optime mai uşor.

      Asta ar fi propunerea mea!


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
menssana1984
Vizitator



Pe partea mea e totul relativ ok. Pe partea de exe adica.
La voi, arata bine, dar nu prea sunt in masura sa dau verdicte. Am folosit OCR-ul doar pe texte scurte si a fost ok.

Seven, Cosmin, Blank, ar prinde bine optiunea de care zic mai sus? E utila? Marcare cu rosu a unei inlocuiri?

Seven, ce faci cu Nills? In ce stadiu esti cu corectura?

Tinand cont de faptul ca se termina anul si vin sarbatorile, eu sunt de acord cu finisarea finala a optiunilor din AC.
Este timp si la anul pentru alte idei. Topicul poate tine loc de secretara si sa stranga sugestiile facute de useri pana atunci.
Recomand sa se lucreze doar la ultimele detalii din OCR. Poate de Craciun avem o suita de optiuni finalizate.
Oricum doar eu vin de regula cu sugestii pe partea de exe, asa ca voi aveti mana libera cu OCR-ul.

Modificat de menssana1984 (acum 13 ani)


pus acum 13 ani
   
BlankCd
MEMBRU DE BAZA

Inregistrat: acum 15 ani
--->

    Din punctul meu de vedere OCR Plus este funcţional dar mai sunt anumite aspect de completat:

    1. Sunt multe propuneri în centralizatorul de la pagina 21 care nu s-au implementat.
    2. Nu am discutat cu voi problema subsolurilor şi anteturilor care pot veni în variante numeroase aşa cum vin şi formatele de pagină. Am vorbit cu Cosmin despre această problemă, cred că ar trebui şi aici o setare default.
    3.1 Problema alinierii stânga a liniilor de dialog, unele sunt în paragraf altele nu - Cosmin studiază problema.
    3.2 Problema alinierii incorecte se întâlneşte şi în interiorul textului, problema asta pare a proveni de la ruperea rândurilor - i-am arătat lui Cosmin.
    4. Lucrez la un dicţionar care va pune cratima la cuvintele care nu au.
    5. Mai am propuneri dar nu le-am spus pentru că sunt deja multe propuneri neimplemenate şi nu am dorit aglomerarea topicului cu noi propuneri.

    Mai este mult de muncă, nu vă grăbiţi să trageţi concluziile.
   
    Aşa cum este OCR Plus ACUM, din punctul meu de vedere a ceea ce s-a implementat este funcţional cu anumite erori minore.
    Mai sunt multe de finisat exact ce am enumerat mai sus.
    Nu uitaţi că dacă voi nu mai aveţi propuneri, poate că alţii au. Ar trebui ascultaţi şi ei.

Modificat de BlankCd (acum 13 ani)


_______________________________________
--->  "Eu nu am regrete,
         Iar dac-ai să-ntrebi ce-a rămas la mine,
         În inimă am urme de tine
         Regrete, eu nu am regrete..."

pus acum 13 ani
   
menssana1984
Vizitator



Eu nu am zis sa punem Stop. Doar sa ii permitem lui Cosmin sa ajunga cu munca la zi.
Simplul fapt ca nu este timp pentru o optiune, nu inseamna ca trebuie trecuta sub tacere.
Notati-o pe topic si va veni si vremea ei.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Scuze, menssana, am fost plecat cateva ore.
Ideea poate ar ajuta in unele situatii pe cei care corecteaza carti. Dar de regula ar fi pentru profesionisti, nu pentru utilizatorii obisnuiti.
Deci daca acestia vor considera ca ii ajuta ma voi gandi la o implementare pe viitor.

La setare pagina deci cum a ramas...?
Iar la setarile de Alineat (primul rand, stanga, dreapta) ce setari implicite sa pun? Momentan cum vedeti toate 3 au 0.

Am gasit care era problema la textul lui lucifer76 (mi l-a trimis) - fiecare diacritica romana divizeaza textul intr-o noua zona de formatare (chiar daca vizual n-o arata). Cum textele in limba romana au ceva diacritice pe cuvant, textul e impartit in extrem de multe zone de formatare si de aceea Ortografia il acceseaza greu.
Voi incerca sa gasesc o rezolvare.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      Setări pagină: pentru că nu există valori universal-valabile, şi discuţiile nu au dus la un rezultat foarte concret, atunci rămânem pe următoarele date:

      Alineat:       Alineat primul rând = 5 mm [0,5 cm] - apropo, aici nu ştiu în ce se măsoară...
                        Alineat stânga = 0          Alineat dreapta = 0

      Aliniere paragraf = stânga-dreapta

      Pagina = A5            Margini - peste tot = 1 cm

      Toate acestea să fie bifate în default.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Bine, am sa le implementez deocamdata asa si mai vedem ce iese din teste.
A, deja am modificat fereastra de confirmare la Inlocuire Multipla ca sa poata fi mutata.
Daca ai nevoie in acest moment de aceasta modificare pot sa pun exe; daca nu, voi  pune exe cand voi termina cu uniformizarea textului (e ceva de lucru).


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      Nu, nu e nevoie acum să urci un exe.

      Mai era ceva în zona primului pachet de opţiuni.
      Discutasem de convertirea a două virgule în ghilimele de început şi am ajuns la acordul comun că trebuie implementată undeva în acest pachet, ca să fie înainte de punctuaţie. Mai stabilisem că poziţia lor să fie între cuvinte şi la început de paragraf.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
O sa o mut la 1.7 atunci.
Am o intrebare totusi: ai vreun exemplu in care 2 virgule consecutive - indiferent de locatia in text - nu ar trebui sa fie transformate in ghilimea jos? Ca eu n-am gasit deocamdata...

PS: intreb deoarece ai spus sa implementez doar in acele situatii. Dar pe de o parte e mai greu sa modific codul sa mearga numai in acele situatii, iar pe de alta parte vor fi inlocuite mai putine. Deci daca nu exista cazuri multe inafara acestor situatii in care nu ar trebui inlocuit, probabil ar trebui setat sa inlocuiasca in orice situatie...

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      A fost o discuţie cu BlankCd în care s-a menţionat că ar putea apărea în loc de puncte de suspensie.

      Mă gândeam la o variantă, dar poate părea o adevărată încurcătură.
      Încerc să fiu coerent.
      Dacă la o opţiune care funcţionează pe bază de cod se poate adăuga şi o comandă ca la sfârşit să ruleze şi un dicţionar "imd", atunci

           1. La actuala opţiune "2.3 Conversie 3 puncte în elipsis" care rulează pe bază de cod, ai putea adăuga să ruleze şi dicţionarul "DE.imd" care rulează la 4.5 Corectare suplimentară elipsis"
      În acest caz introduc cele două situaţii exact în acel dicţionar cu elipsis, pentru că ar fi doar două situaţii:
               "spaţiu_virgulă-virgulă" - potrivire perfectă
               şi "virgulă-virgulă" - la început de paragraf.

         2. Rămâne opţiunea în pachetul Punctuaţie, dar facem reordonarea opţiunilor la punctuaţie astfel încât Punctuaţie / Funcţii obişnuite să ruleze ultima.

         3. Eliminăm opţiunea 4.5 în forma ei actuală şi vedem dacă dicţionarul la care lucrează BlankCd de corectare a cuvintelor cu cratimă... ar putea fi implementată la 4.5 ca să nu stricăm ordinea. 

         Îmi pare rău dacă pare o mare ameţeală, dar în capul meu pare că ar fi o mişcare posibilă.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
     ...sau
     la Punctuaţie rămân codurile exact ca până acum, dar aducem acel 4.5 aici şi facem ordonarea astfel:
           - "2.3. Conversie elipsis... " urcă la 2.1
           - "2.2 Conversie virgule..." rămâne pe loc
           - "4.5 Conversie suplimentară elipsis.. " vine la 2.3
           - "2.1" Funcţii obişnuite" coboară la 2.4


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Am terminat de modificat si uniformizarea textului.
Cum BlankCD a mentionat si de header/footer, am adaugat si setare pentru pozitia lor. Deocamdata e activata implicit si are 1,2 cm la fiecare.

Deocamdata n-am modificat meniul - ma gandesc totusi sa implementez convertirea virgulelor duble in ghilimele tot modificand codul actual, nu folosind dictionar.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
      Am văzut noua fereastră de formatare. Cuprinde toate formatările de text, paragraf şi pagină.  Nu cred că mai trebuie implementat ceva în plus, deoarece este deja destul de complexă.

      Am o singură menţiune:
      Header şi Footer trebuie să fie mai mici decât marginea de sus şi cea de jos a paginii.
      Dacă la margini avem 1 cm, pentru Header şi Footer propun 0,5 cm, valoare care este aproximativ egală cu 0,2" şi care este folosită frecvent în setările de pe forum pentru A5.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 16 ani
Urmăresc de cîtva timp activitatea şi discuţiile purtate cu entuziasm pe acest topic.
Vreau să-i felicit pe realizatorii programului Autocorect, şi pe toţi cei care contribuie
la dezvoltarea acestui proiect.

Sînt începător în lucrul cu programul, aşa că vă rog să fiţi indulgenţi.
Voi face doar o observaţie şi anume:
pentru mine ca începător, faptul că programul lucrează ceva, este aproape insesizabil
în sensul că bara de progres are o culoare care aproape că se confundă cu fundalul.
Ar fi, zic eu, mai nimerit un albastru sau verde, ceva care să sară în ochi.
Sigur, dacă se poate şi nu-i prea mult de muncă la implementare.


pus acum 13 ani
   
menssana1984
Vizitator



Afiseaza si procentele totusi... sau gresesc eu?

pus acum 13 ani
   
uciN
MEMBRU VIP

Inregistrat: acum 16 ani
Aşa este prietene, de aceea am zis „aproape”.
Eu mă refer la următoarea situaţie: să zicem că faci şi
altceva prin casă, nu stai numai cu ochii în monitor, şi din
cînd în cînd mai arunci o privire să vezi „stadiul lucrărilor”.
Vezi mai bine bara decît procentele, dar e doar un moft, uitaţi de el şi continuaţi.
Scuze pentru deranj.


pus acum 13 ani
   
menssana1984
Vizitator



Daca te referi la acea bara de jos, sa stii ca pe la 66% parca, pare sa se blocheze, dar nu e asa. E ceva normal ca sa zic asa.
Mi-a dat Cosmin o explicatie, dar nu o mai tin minte.


pus acum 13 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 15 ani
***
       Nu se blochează la 66%, ci doar întârzie puţin în poziţia respectivă. Cred că explicaţia era că în acel moment este încărcat fişierul în totalitate, dar arată doar 66% pentru că arunci face salvarea şi... practic "încărcare + salvare = 100%"

       uciN s-a referit la bara de jos a programului şi la cursorul care arată progresul procesării unei opţiuni.


       Dacă partea procesată de 38% ar fi mai vizibilă [verde sau albastru] s-ar vedea mai bine şi de la distanţă, decât se vede acum când este gri mai închis pe fundal gri deschis..
       Propunerea este foarte bună, dar aşa cum spune si el, este chestie de finete, ce poate sta putin în aşteptare până ce se mai rezolvă din problemele mai urgente, astfel încât de Crăciun să putem avea o versiune AutoCorect OCR_Plus finalizată drept cadou de sărbători.
       Trec peste faptul că e posibil ca treaba asta să fie în zona de lucru a lui Daniel si nu a lui Cosmin.

Modificat de Seven (acum 13 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Multumesc, uciN.
O sa cautam o modalitate de a evidentia mai mult progresul dar trebuie sa avem grija sa nu fie prea "strident" pentru utilizatorul care sta aproape de monitor.

Seven, la 66% nu face salvare ci doar trece intr-o alta "faza" a incarcarii, care momentan nu e capabila sa miste bara de progres. Deci lucreaza intern, dar nu afiseaza vizual.


pus acum 13 ani
   
ciuperca_cosmin
VETERAN

Din: Bacau
Inregistrat: acum 13 ani
Modificari:
- culoare mai inchisa la progres;
- header/footer au valori implicite 0,5 cm (se vad de exemplu cand se da click pe butonul Implicit de la Rulare Automata);
- convertirea a doua virgule in ghilimea merge numai in cele 2 situatii;
- la uniformizarea textului din OCR Plus unitatea de masura e cea setata la Configurarea AutoCorect (cm implicit).

Modificat de ciuperca_cosmin (acum 13 ani)


pus acum 13 ani
   
Pagini: 1 ... 4 5 6 7 8 9 10 ... 13  

Mergi la