Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
|
Lista Forumurilor Pe Tematici
|
Forum Romania Inedit | Reguli | Inregistrare | Login
POZE FORUM ROMANIA INEDIT
Nu sunteti logat.
|
Nou pe simpatie: Georgiana69 pe Simpatie
| Femeie 24 ani Arad cauta Barbat 24 - 47 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Parerea mea e ca totusi ar trebui sa dea avertizare/sugestie, nu sa stearga automat. Daca totusi se vrea sters automat, se poate face si cu cod.
Iar in ce priveste fereastra de configurare punctuatie OCR Plus, lucrez la ea dar sunt si mici probleme:
De exemplu sunt 2 texte prea lungi: Majusculă la început de frază – doar după punct urmat de spaţiu 1 Tab sau mai multe trec într-unul singur spaţiu (nu la începutul liniei)
Se vede in imagine ca nu prea incap. Trei solutii, toate cu probleme: - sa incercam sa scurtam textul dar pastrand cat mai mult din "intelesul" optiunii; - sa incerc sa pun textul pe 2 linii dar la acest tip de componente e greu de facut + va fi "inghesuit" pe verticala; - sa incerc sa fac intreaga fereastra mai mare dar va genera probleme in alte parti.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** 1. La pachetul „Aplică principiile de bază ale punctuaţiei” în loc de: □ Elimină spaţiu dintre grupul de caractere !? ?! !... ?... ...! ...? deşi opţiunea va rezolva toate situaţiile, putem lăsa doar patru grupuri de caractere în fereastră, astfel:
□ Elimină spaţiu dintre grupul de caractere !? ?! !... ?...
2. Cred că e posibil să mai apară şi alte opţiuni în viitor, fapt pentru care aş mai lăsa ceva loc liber în partea dreaptă. De aceea aş aduce în partea din stânga două opţiuni: □ Em dash „—” aflată între litere mici se transformă în cratimă. □ Tilda „~” aflată între litere mici se transformă în cratimă. cu menţiunea că le-aş reformula astfel:
□ — [Em dash] între litere mici trece în cratimă. □ ~ [Tilda] între litere mici trece în cratimă.
3. Aş grupa opţiunile privind majuscularea într-un pachet, care să aibă un Titlu, dar un Titlu simplu, fără fereastră de activare, nu un Titlu-opţiune. În acest titlu aş strecura explicaţia abrevierii folosite în continuare la numele opţiunilor. Acest pachet ar putea să apară cam aşa:
------- Majusculă la început de... (Mj.înc.) -------- □ Mj.înc. Dialog [inclusiv dialog cu ghilimele]. □ Mj.înc. Paragraf – [orice literă – orice paragraf] □ Mj.înc. Paragraf – [numai paragraf întreg] □ Mj.înc. Paragraf – [numai litera Î - paragraf întreg] □ Mj.înc. Frază – doar după punct urmat de spaţiu. □ Mj.înc. Frază – după ! şi ? urmat de spaţiu.
4. Următoarele două opţiuni □ 2 spaţii sau mai multe trec într-unul singur (nu la începutul liniei) □1 Tab sau mai multe trec într-un singur spaţiu (nu la începutul liniei) propun să fie reformulate, mai scurt, astfel:
□ 2 Spaţii (mai multe) trec într-unul singur □ 1 Tab (mai multe) trec într-un singur Spaţiu Nu cred că e importantă menţiunea „(nu la începutul liniei)”, deoarece, în meniul OCR_Plus se vor elimina şi spaţiile şi taburile de la început de paragraf.
Cam acestea ar propunerile mele.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Cosmin, nu se poate adauga in OCRPlus sau ceva de genul, deci nu neaparat sa modifici Punctuatia, o fereastra in care sa scrii ceva si mai apoi sa iti apara sub forma de avertizari ca la punctuatie toate locurile cu pricina?
Tocmai pentru ciudatenii de astea ce nu pot fi rezolvate automat si necesita vizualizarea locala a problemei. Si pentru a evita adaugarea a n optiunii si butoane. Sa fie ceva configurabil strict pentru exceptii sau chestii ce nu pot fi rezolvate automat.
Seven, vreau si de al tine o parere. Pentru mine nu e un capat de lume lipsa acestei optiuni.
P.S. Cosmin, se poate face o scurtatura de taste pentru lansarea ortografiei? Ar fi utila la rularea ei cu scanarea deschisa alaturi.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
@Seven Multumesc, o sa incerc sa vad ce merge.
@utilitasetveritas Parca suna cam la fel cu propunerea anterioara de la punctuatie...
Ortografia are de ceva ani o scurtatura de taste: F7.
31.2KB
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Să vedem dacă am înţeles bine: Vrei o opţiune de căutare, dar care să nu te deplaseze în document din căutare în căutare, ci să afişeze o listă cu locaţiile unde se află respectivele situaţii, aşa cum se face lista de sugestii la punctuaţie... Ceva în sensul ăsta? Caută: "Doamna Łsther $tevenson" iar rezultatul să fie, cam aşa: 1. pagina 1 linia 1 2. pagina 7 linia 15 3. pagina 11 linia 9 4. pagina 19 linia 21 5. pagina 27 linia 15 6. pagina 41 linia 8
Apoi, apăsând pe fiecare linie din afişaj să fii trimis la locaţia respectivă.....
Sau poate vrei ceva şi mai complex... Un fel de caută/înlocuieşte, dar după ce se afişează lista...
Oricare dintre variante m-ar interesa şi pe mine. Cred că – dacă se poate implementa – cel mai indicat este să apară ca o opţiune independentă de tipul OCR_Plus. Prin "opţiune independentă" înţeleg o opţiune care nu trebuie să fie inclusă în Rularea automată.
Această opţiune s-ar putea numi cumva în genul "Caută şi afişează locatiile" şi ar putea fi localizată în meniu sub linia de sub opţiunea 12. Un singur lucru: deocamdată să o trecem la "Să ţinem minte" şi să aşteptăm să termine Cosmin cu Punctuaţia.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Pe mine ma intereseaza doar o lista de tipul celei de la Punctuatie.
1. pagina 1 linia 1 2. pagina 7 linia 15 3. pagina 11 linia 9 4. pagina 19 linia 21 5. pagina 27 linia 15 6. pagina 41 linia 8
Scrii in fereastra orice iti trece prin cap, iar apoi vezi lista cu locatii. Si nu e vorba de o rulare automata, dar poate sa fie inclusa in Ocr_Plus ca optiune de sine statatoare. Sau in alta parte, asa cum s-a procedat cu alte optiuni.
In genul asta de situatii e clar ca nu vorbim de o problema care sa fie rezolvata automat, ci de o indexare a locatiilor cu posibile probleme si confruntarea lor cu scanul original. Asta asa ca idee generala, ideea poate fi folosita si in alte scopuri.
Merci de scurtatura, Cosmin. Atunci cand lucrezi cu scanul deschis si AC-ul, in AC se elimina rigla, meniul stanga etc. pentru a obtine mai mult spatiu util. Chestia e ca atunci gasesc ceva ce necesita neaparat confruntarea cu scanul, fie trebuie sa repozitionez fereastra de ortografie, fie sa o inchid. Si cum meniul stanga e ascuns, trebuie sa revin la normal din 2-3 miscari. Dar daca pot accesa Orotgrafia in lipsa meniului e superb atunci
Cosmin, problema de la ortografie nu a mai aparut pe textul asta. Cea cu stagnarea adica.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Dacă mai avem nevoie de spaţiu [de rânduri]…. …la pachetul „Aplică principiile de bază ale punctuaţiei” putem reduce două rânduri, cuplând explicaţiile 1 cu 3 şi 2 cu 4, adică, în loc de: Adaugă spaţiu după caracterele . : , ; ? ! ... Elimină spaţiu înainte de caracterele . : , ; ? ! ... Adaugă spaţiu după caracterele ) ] } ” » Elimină spaţiu înainte de caracterele ) ] } ” » se poate scrie:
Adaugă spaţiu după caracterele . : , ; ? ! ... ) ] } ” » Elimină spaţiu înainte de caracterele . : , ; ? ! ... ) ] } ” »
Dacă cele două explicaţii rezultate sunt prea lungi, atunci putem renunţa la cuvântul „caracterele”, iar explicaţiile să fie reformulate astfel:
Adaugă spaţiu după . : , ; ? ! ... ) ] } ” » Elimină spaţiu înainte de . : , ; ? ! ... ) ] } ” »
Notă: la acest pachet, lipseşte şi trebuie adăugată explicaţia: Adaugă spaţiu înainte de caracterele ( [ { „ «
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Multumesc Seven, o sa vad cum modific...
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Scuze ca n-am mai facut multe intre timp dar am ceva probleme in viata personala...
O sugestie de schimbare la configurare punctuatie OCR Plus. Nu o luati decat ca sa vedeti cum arata, nu e functionala efectiv, pentru corectare folositi tot exe-ul precedent.
E divizata pe tab-uri. In acest fel se pot pastra denumirile lungi (care sunt un pic mai sugestive) respectiv exista acu spatiu in plus daca se mai adauga si altele in viitor. Pe de alta parte unora din utilizatori poate nu le va place ca e prea "impartit"...
Ce parere aveti...?
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Si eu sunt de acord cu Seven.
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Poftim o problema ce nu o vede Ac-ul:
formă,..
promisiunea mântuirii. O.geană
formă,.. Învârti
Atat punctuatia cat si ortografia sunt oarbe la ele.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Versiune în taburi: Modificări şi completări La tabul "Punctuatie de bază" - lipseşte o setare ce trebuie adăugată: Adaugă spaţiu înainte de caracterele ( [ { „ «
La tabul "Diverse" - trebuie corectat astfel: în loc de: 1 Tab sau mai multe trec într-unul singur spaţiu (nu la începutul liniei) se modifică în: 1 Tab sau mai multe trec într-un singur spaţiu (nu la începutul liniei)
Deocamdată să corectăm aceste setări.
Ar mai fi o problemă. Aş prefeera ca la tabul "Punctuatie de bază" să apară o opţiune separată cu posibilităţi de activare/dezactivare, referitoare la Crearea listei de sugestii punctuaţie.
Ideea este următoarea: e posibil ca un text să fie trecut de mai multe ori prin OCR_Plus şi nu are nevoie de fiecare dată de această listă; e posibil ca altcineva să dorească să facă doar o curăţare sumară a textului şi, din nou, să nu aibă nevoie de lista de sugestii; deoarece crearea listei necesită un consum de timp suplimentar, cred că ar fi bine - dacă e posibil din punct de vedere al programării - ca această listă să nu se realizeze automat la rularea ""Punctuatiei de bază", ci doar dacă opţiunea de creare a listei este activată.
LE: utilitasetveritas, problema de aici: formă,.. o rezolvă deocamdată opțiunea 2.3 Corectare suplimentară elipsis opțiunea rezolvă situaţii de genul: ... ,.. .,. .., ,., . . . .... ,... .,.. ..,. ..., toate aceste variante le transformă în elipsis. deocamdată nu am ajuns la discuţia dacă opţiunea va rămâne la OCR_Plus ori se poate implementa la punctuaţie. constat că dicţionarul pote fi îmbunătăţit şi cu alte aranjamente de punct şi virgulă, chiar şi în formula luate câte 3 sau câte 4.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Esti sigur? Am rulat si Ocr_Plus pe textul asta, de ce mai apar erorile astea?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven a scris:
*** Ar mai fi o problemă. Aş prefeera ca la tabul "Punctuatie de bază" să apară o opţiune separată cu posibilităţi de activare/dezactivare, referitoare la Crearea listei de sugestii punctuaţie.
Ideea este următoarea: e posibil ca un text să fie trecut de mai multe ori prin OCR_Plus şi nu are nevoie de fiecare dată de această listă; e posibil ca altcineva să dorească să facă doar o curăţare sumară a textului şi, din nou, să nu aibă nevoie de lista de sugestii; deoarece crearea listei necesită un consum de timp suplimentar, cred că ar fi bine - dacă e posibil din punct de vedere al programării - ca această listă să nu se realizeze automat la rularea ""Punctuatiei de bază", ci doar dacă opţiunea de creare a listei este activată.
|
Momentan Sugestiile sunt puse ca tab separat. Da, din moment ce configurarea se deschide implicit pe "Punctuatia de baza" inteleg de ce vrei sa fie pusa acolo optiunea pentru activare/dezactivare creare lista de sugestii. Din punctul de vedere al programarii se poate, doar ca e un pic ciudat sa aiba tab propriu dar sa fie totusi activata/dezactivata din alt tab.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Până la urmă... locul de afişare al opţiunii poate fi oricare... faci cum crezi că e mai bine... Mie mi s-a părut important ca Lista de sugestii să nu se realizeze automat la activarea opţiunii principale, ci să existe posibilitatea ca userul să stabilească dacă vrea sau nu să fie creată această listă.
*** Altă problemă, deocamdată doar ca întrebare, fără intenţie imediată de implementare. În Word la opţiunea Find&Replace, pachetul "Special", există posibilitatea ca un număr de "break-uri" să fie convertite în Paragraph Mark.
a. Astfel "Section Break" poate fi convertit în "Paragraph Mark", acest lucru însemnând că forţarea la pagină nouă se transformă în paragraf gol pe aceaşi pagină. b. Cred că ar fi valabilă şi pentru "Column Break" trece în "Paragraph Mark"
c. Ar mai fi problema reducerii paragrafelor goale multiple. De exemplu, trei gânduri goale se pot marca cu 4 semne de sfârşit de paragraf ["Paragraph Mark"], astfel: ^p^p^p^p - pentru cine nu ştie trebuie să reamintim că un ^p arată sfârşitul paragrafului normal, care cuprinde text, şi celelalte 3 ^p, corespund fiecărui paragraf gol; în cazul nostru 1 paragraf gol = 1 rând gol. Mă gândeam că ar fi bine să putem reduce numărul de paragrafe goale succesive. Ar fi două variante de luat în calcul: - trei sau mai multe rânduri goale se reduc la două rânduri goale; - două rânduri goale se reduc la un singur rând gol. Personal folosesc două rânduri goale înaintea numelui de capitol, aşa că aş prefera ca să nu se facă reducerea direct la un singur rând gol, ci acest lucru să se realizeze în două trepte.
Deocamdată mă interesează dacă aceste lucruri se pot implemnenta în AutoCorect. Locul implementării şi metoda pot fi discutate ulterior.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
jullien_alphonse
Pe lista neagra
Inregistrat: acum 17 ani
|
|
-----------două rânduri goale înaintea numelui de capitol-------------?
Stie Autocorect UNDE este NUMELE - sau NUMARUL de inceput al capitolului ?
Ce te faci cu randurile - (enter) cu care ne captusim dupa eliminarea notelor de subsol ramase in text (ne-OCR-izate corespunzator), cand pot ramane si doua-trei-patru randuri goale - paragraph.
Aceste randuri RUP *de fapt) propozitiile de dinainte si de DUPA NOTA.
Desigur, Notele vor trebui lucrate INSERT FOOTNOTE + copy-paste in subsol iar randurile goale vor trebui sterse INTEGRAL, pt a continua fraza corect.
Propun fara 2 enter... adica enspe (4,3,2,1) paragraph mark - sa mearga direct intr-UN SINGUR PARAGRAPH.
De ce?!
1. RUPEREA RANDURILOR nu se mai face cum trebuie daca ramanem cu un RAND GOL intre fraze.
2. Caz particular, Cu optiunea MAJUSCULA LA INCEPUT DE RAND, randurile RAMASE rupte AIUREA la jumatatea frazei, se vor transforma in INCEPUT MAJUSCUL DE PROPOZITIE.
Comic, dar ... Restul nevoilor ti le poti face in... word.
Adaugi 20 de enteruri inainte de 20 de capitole.
Sau 20 de MANUAL PAGE BREAK, si astfel CAPITOLUL incepe pe pag. noua.
Modificat de jullien_alphonse (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Reformulez, pentru că probabil nu am fost suficient de clar. Prima: mă interesa dacă în AutoCorect se pot implementa astfel de convertiri. Formula concretă rămâne în discuție.
** În legătură cu reducerea rândurilor goale... cred că merge în 3 pași fără a deranja pe nimeni, pentru că fiecare poate alege ceea ce doreşte: a. Trei sau enşpe rânduri goale se reduc la două rânduri goale, ceea ce în Word ar fi ^p^p^p^p.... ^p se înlocuieşte cu ^p^p^p b. Două rânduri goale se reduce la un singur rând gol: ^p^p^p se înlocuieşte cu ^p^p c. Orice rând gol se elimină: ^p^p se înlocuieşte cu ^p
Dacă fiecare pas este o opţiune, fiecare user va putea activa doar pe prima, pe primele 2 sau pe toate 3, după dorinţă. Astfel pot rămâne două rânduri goale acolo unde au fost mai multe... poate rămâne doar un singur rând sau se pot elimina toate dacă cineva va dori asta.
*1* Cu RUPEREA RANDURILOR ... sunt multe probleme... mai este mult de lucru. La ora asta am constatat că se fac ruperi false, acolo unde apar liniuţe de pauză, pe care AC le "vede" linii de dialog şi rupe textul în mod eronat, creând paragrafe de tip dialog, deşi nu era dialog. Dacă ai cazuri de rupere eronată, te-aș ruga să ne dai exemple ca să vedem ce se poate face... Oricum, opţiunea la acest moment nu rulează bine, dar e nevoie de timp ca să vedem ce "prostii" face.
De fapt cred că tu te referi la repararea rândurilor rupte... şi mergi pe varianta în care nu se păstrează numărul de pagină în text. În situaţia asta ar putea să se "lipească" cele două bucăţi de frază de la sfârşit de pagină cu bucata de la început de pagină... atunci când nu mai există rânduri goale. În acest caz, trebuie să se elimine toate rândurile goale, iar opţiunea "1.5 repararea rândurilor rupte" să fie mutată astfel încât să ruleze imediat după punctuaţie şi nu înaintea punctuaţiei.
*2* MAJUSCULA LA INCEPUT DE RAND Încă se lucrează la asta. Sper că aceste cazuri să fie cât mai puţine. Dacă se activează opţiunea "Majusculă început paragraf – [orice literă – orice paragraf]" atunci, sigur se va întâmpla cum spui. De aceea am pus încă două opţiuni care fac majuscularea în mai puţine cazuri.
În principiu, după ce se termină fereastra de Setări punctuaţie într-o primă formă funcţională... am să renunţ la orice proiect de digitalizare, ca să mă pot ocupa doar de testări AutoCorect, ca să putem descoperi la timp eventualele probleme.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
jullien_alphonse
Pe lista neagra
Inregistrat: acum 17 ani
|
|
Am speculat un pic capacitatile diverselor programe cu care lucrez.
1. La prelucrarea in ACDSEE verific DACA AM TOATE PAGINILE in scan, ca mai sunt parasutisti care scaneaza DIN AVION.
2. In general, INCA din scan tailor tai pagina, si NU pastrez nr. paginii.
3. Chiar daca las nr. paginii NEATINS, Abbyy nu imi scoate nr. de pagina in Doc OCR, intrucat Folosesc OCR/salvare ca EDITABLE COPY, cu Keep Header BIFAT. Astfel, Abbyy scoate NR PAG in header. Elimin headerul in word, IMPLICIT scap si de nr. paginii.
4. La prima trecere In Autocorect NU folosesc majuscula la inceput de rand, nici la inceput de propozitie, si nici dupa LINIE de dialog. Dar:
5. Imediat dupa Prima Trecere, (PUNCTUATIE si DIACRITICE) Rezolv MAI INTAI , manual, TOATE PROBLEMELE gasite de autocorect DUPA executare PUNCTUATIE, astfel ca totodata dau BOLD la TITLUL de CAPITOL si separ randurile cu ENTER unde e cazul. - (ORICUM iau ''la mana'' toate SFARSITURILE NETERMINATE de propozitie) - rezolv si cratimele parasite, transformandu-le in EnDASH.
6. ABIA APOI dau OCR PLUS - Ruleaza toate functiile, CU FOLOSIRE MAJUSCULE PESTE TOT unde se poate. Si... iar il iau la puricat.
Combinat cu rularea Template-ului ebook.ro.ri.dot, ANTERIOARA Autocorect, obtin un v.0.9.9 = BEST (Mai ales daca NU a fost un scan mizerabil).
La urma, fac un scan de control pdf - redus, optimizat, CE CONTINE TOTUSI nr. paginii, din pag. brute, neprelucrate, netaiate.
Simplu, hein?!
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven a scris:
*** Altă problemă, deocamdată doar ca întrebare, fără intenţie imediată de implementare. În Word la opţiunea Find&Replace, pachetul "Special", există posibilitatea ca un număr de "break-uri" să fie convertite în Paragraph Mark.
a. Astfel "Section Break" poate fi convertit în "Paragraph Mark", acest lucru însemnând că forţarea la pagină nouă se transformă în paragraf gol pe aceaşi pagină. b. Cred că ar fi valabilă şi pentru "Column Break" trece în "Paragraph Mark"
c. Ar mai fi problema reducerii paragrafelor goale multiple. De exemplu, trei gânduri goale se pot marca cu 4 semne de sfârşit de paragraf ["Paragraph Mark"], astfel: ^p^p^p^p - pentru cine nu ştie trebuie să reamintim că un ^p arată sfârşitul paragrafului normal, care cuprinde text, şi celelalte 3 ^p, corespund fiecărui paragraf gol; în cazul nostru 1 paragraf gol = 1 rând gol. Mă gândeam că ar fi bine să putem reduce numărul de paragrafe goale succesive. Ar fi două variante de luat în calcul: - trei sau mai multe rânduri goale se reduc la două rânduri goale; - două rânduri goale se reduc la un singur rând gol. Personal folosesc două rânduri goale înaintea numelui de capitol, aşa că aş prefera ca să nu se facă reducerea direct la un singur rând gol, ci acest lucru să se realizeze în două trepte.
Deocamdată mă interesează dacă aceste lucruri se pot implemnenta în AutoCorect. Locul implementării şi metoda pot fi discutate ulterior. |
La Inlocuire Multipla nu e imposibil de implementat, doar deocamdata dificil deoarece codul actual nu a fost facut sa suporte cautarea de ^p. Pentru asta ar trebui sa fie modificat substantial. In viitor ne vom gandi la asta daca va fi "cerere" mare. Pe moment se pot face functii obisnuite care sa converteasca orice numar de ^p in orice numar de ^p.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am inteles. Intre timp continui lucrul la configurarea punctuatiei OCR Plus. Unul din motivele pentru care merge greu e ca nu pot doar sa scriu un cod de genul "daca gasesti un caracter ce necesita spatiu dupa si nu are, adauga spatiu". Trebuie sa ma gandesc si la situatiile exceptie. Asta e unul din lucrurile ce au fost "cizelate" timp de cateva luni cel putin la punctuatia documentelor obisnuite. N-o sa reusesc oricum sa le cuprind pe toate, unele se vor vedea doar in testele ulterioare dar sper ca va merge mai repede pe ansamblu - probabil saptamani in loc de luni.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Pentru cei care s-au plicisit asteptand uite o versiune de test. Sunt implementate deocamdata tab-urile conversii si punctuatia de baza. N-o folositi pentru corectarea efectiva a textelor ci doar pentru testarea a ce s-a implementat. Doar dupa ce e sigur ca merge bine utilizati-o la corectarea textelor. A, deoarece se utilizeaza partial configurarea anterioara din ini, recomand sa dati clic pe butonul Implicit sau sa bifati/debifati manual optiunile deoarece e posibil sa nu fie pe bifarea/debifarea implicita.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am ajuns la tab-ul Majuscule. Drept sa spun cand m-am uitat pe acel [C9] Configurare PUNCTUAŢIE OCR_Plus [V1.1].doc totul parea clar. Dar stii vorba romanului "socoteala de acasa nu se potriveste cu cea din targ" Cand sa ma apuc efectiv de implementare apar mici probleme de lamurit... De exemplu: 1. "Majusculă la început de dialog (inclusiv dialog cu ghilimele)." e vorba numai de dialogurile care incep cu EmDash sau orice liniuta? Si e probabil vorba nu numai de dialogurile de la inceputul paragrafului ci de toate, nu? 2. Inca nu m-am lamurit pe deplin cum sa fac sa diferentiez eficient paragrafele "intregi" de cele "neintregi"... Asta daca se poate... Daca se poate sa ma mai ajuti cu ceva exemple de cat mai multe situatii din amandoua... Multumesc anticipat.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Ai dreptate. Apar multe probleme... şi nu sunt chiar mici...
Să le luăm pe rând şi să începem cu DIALOGURILE!
Când am propus opţiunea m-am gândit doar la dialoguri în paragraf nou, deoarece dialogurile la mijlocul paragrafului sunt relativ puţine şi pot fi corectate manual. Majuscularea dialogurilor interioare cred că ar produce multe efecte secundare nedorite, aşa că nu vom interveni asupra lor, pentru că am crea o problemă nouă similară cu cea de la dialog francez.
Deci, era vorba de doar Paragraf nou de tip Dialog şi credeam că e suficient să se ia în calcul doar Em dash; raţionamentul e greşit pentru că la momentul când rulează punctuaţia, liniuţele de dialog sunt însoţite de răgălii şi au diferite forme, astfel că Em dash este insuficient.
Mă gândesc la următoarea variantă, dar trebuie văzut dacă nu apare altă chestie secundară... Dacă în OCR_Plus, opţiunea "4.5 Corectarea linii de pauză şi linii de dialog" o mutăm, ducând-o în faţa "2.4 Punctiaţie obişnuită", atunci lucrurile ar sta aşa: Toate [majoritatea] liniilor de dialog ar fi Em dash.
În cazul ăsta condiţiile s-ar reduce, pentru că am avea mai puţine situaţii a. paragraf nou: "Em dash" - "spaţiu" - "literă" b. paragraf nou: "Em dash" - "spaţiu" - "ghilimele româneşti" - "literă" c. paragraf nou: "Em dash" - "spaţiu" - "ghilimele de tip «" - "literă"
Nu ştiu cum ar trebui în situaţia în care ghilimele ar fi în faţa liniei de dialog... Zic "nu ştiu" pentru că nu am luat în calcul curăţarea unei astfel de linii de dialog - toate eliminările de răgălii şi convertire în Em dash au fost făcute doar pentru cazurile în care paragraful-dialog începe cu liniuţă. Poate ar mai trebui luate în calcul două situaţii: d. paragraf nou: "Ghilimele româneşti" - "Em dash" - "spaţiu" - "literă" e. paragraf nou: "Ghilimele de tip «" - "Em dash" - "spaţiu" - "literă"
Deci, şi la aceste două situaţii am pus doar varianta Em dash. Eventual, am putea lua în calcul şi variantele cu En dash şi Horizontal bar... dar nu ştiu dacă ar fi prea bine... În cazul ăsta apar şi următoarele 4 situaţii:
f. paragraf nou: "Ghilimele româneşti" - "Horizontal bar" - "spaţiu" - "literă" g. paragraf nou: "Ghilimele de tip «" - "Horizontal bar" - "spaţiu" - "literă"
h. paragraf nou: "Ghilimele româneşti" - "En dash" - "spaţiu" - "literă" i. paragraf nou: "Ghilimele de tip «" - "En dash" - "spaţiu" - "literă"
Mă gândesc că e mai bine să corectăm mai puţin dar fără efecte secundare, decât să facem multe înlocuiri care produc un lanţ de alte înlocuiri, aşa că aş merge doar pe primele 3 situaţii de mai sus.
Dacă cineva constată că ar mai fi şi alte sitauţii, îi rog să le semnaleze cât de repede se poate.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Ce bine va intelegeti voi doi
Eu deja ma uit la voi ca boul la poarta noua. Nu va dati batuti, va tin pumnii.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Asa e. Ar fi dragut daca topicul ar beneficia si de atentia altor veterani.
Exprimarea nu e aiurea E vorba de un bou ce pleaca la pascut, in lipsa lui se schimba poarta, iar el nu mai recunoaste casa/curtea
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Posibil sa mearga cu mutarea 4.5 dar cum ai spus si tu trebuie verificat sa nu genereze alte belele... Nu sunt sigur ca impartirea in 2 optiuni pentru cele 2 tipuri de ghilimele e justificata 100% - doar daca sunt ceva texte in care dialogul de dupa ele e tratat diferit. Iar in ce priveste Horizontal Bar si EmDash - codul daca gaseste oricare din ele la inceput de paragraf ar putea pune majuscula dupa. Si la acestea nu stiu daca e justificata impartirea in 2 optiuni... Dar as vrea sa aud si opinia altora - de exemplu de la cei care utilizeaza Horizontal Bar...
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am inteles. Ma apuc s-o implementez asa daca altii nu obiecteaza... Ghilimelele franceze cred ca sunt utilizate foarte rar oricum in aceste situatii. Intre timp am facut si cele din tab-ul Diverse.
PS: sa tin cont si de cazurile cand paragrefele incep cu un numar variabil de spatii goale?
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Pina la urma am implementat toate cele 4 situatii Ce s-a modificat: - implementat "Majuscula la început de dialog (inclusiv dialog cu ghilimele)." - implementat tab-ul Diverse - 4.5 mutata la punctuatie 2. - 2.1 si 2.2 scoase deoarece acu sunt deja implementatate in "Functii obisnuite".
La "Majuscula la început de dialog (inclusiv dialog cu ghilimele)." lucreaza asa: [spatii/taburi][EmDash/Horizontal Bar][spatii/taburi][litera mica] >> [spatii/taburi][EmDash/Horizontal Bar][spatii/taburi][litera mare] [spatii/taburi][inceput ghilimele romanesti/franceze][spatii/taburi][EmDash/Horizontal Bar][spatii/taburi][litera mica] >> [spatii/taburi][inceput ghilimele romanesti/franceze][spatii/taburi][EmDash/Horizontal Bar][spatii/taburi][litera mare]
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Tocmai voiam să postez un răspuns şi am constatat că a "dispărut" forumul!.... Uff!... am crezut că ne-a sunat ceasul.
Acuma... nu mai ştiu ce-am vrut să postez... dar încerc să-mi adun gândurile....
Deci, Au fost scoase de la OCR_Plus două opţiuni: "2.1. Conversie trei puncte de suspensie în elipsis orizontal" şi "2.2. Conversie virgule duble în ghilimele" pentru că au fost implementate la Punctuaţie. Corect şi logic.
Mergem mai departe: 1. Convertirea în apostrof românesc a fost implementată deja în punctuaţie? Eu am încă în dicţionarul L1.imd circa 8 înregistrări. Trebuie să ştiu dacă le scot. Am pus acolo toate caracterele care seamănă cu apostroful 2. Opţiunea "2.1 Corectare suplimentară elipsis" rulează pe bază de dicţionar. După câte am mai spus acolo sunt aranjamente de virgule şi puncte, luate câte 3 şi câte patru. Întrebarea este: există vreo logică de cod care ar putea face acest lucru sau rămânem la varianta dicţionar?
Acum ceva mai special, deşi ar putea fi o problemă falsă: Am o problemă la La "Majuscula la început de dialog (inclusiv dialog cu ghilimele)" Deci tu spui aşa: [spatii/taburi][EmDash/Horizontal Bar][spatii/taburi][litera mica] >> [spatii/taburi][EmDash/Horizontal Bar][spatii/taburi][litera mare]
Probabil că e corect aşa [nu mă pricep la logica programării], dar eu m-am gândit să nu cumva să fie o problemă... La pachetul 1 din OCR_Plus, la opţiunile "1.3. Eliminare tab şi spaţii multiple" şi "1.4. Eliminare spaţii la început de paragraf" au fost eliminate spaţiile şi taburile la început de paragraf, deci, în momentul în care rulează Punctuaţia nu mai există spaţii/tab la început de paragraf. De aceea eu aş fi crezut că în cod ar fi fost mai nimerită formula: [EmDash/Horizontal Bar][spatii/taburi][litera mica] >> [EmDash/Horizontal Bar][spatii/taburi][litera mare]
Ca să nu spun prostii, nu merg mai departe, până nu aflu cum e cu problema asta.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, si eu ma speriasem nitel
Da, convertirea in apostrof romanesc a fost deja implementata la tab-ul Conversii. Am folosit acel doc facut de tine si pus pe mediafire unde ai enumerat tipurile. Referitor la "2.1 Corectare suplimentară elipsis" - m-am uitat in dictionar si nu vad deocamdata o logica care sa-mi permita sa simplific codul ca sa nu pun manual in el toate inregistrarile din dic. Pe moment cred ca e bine sa ramana asa, poate in viitor imi va veni o idee. Referitor la [spatii/taburi]: probabil felul acesta de "prezentare" n-a fost cel mai inspirat deoarece nu arata ca sunt suportate si situatiile in care sunt de numar 0. Deci merge tinand cont ca acele spatii de la inceput au fost sterse deja. Daca totdeauna vor fi rulate 1.3 si 1.4 inainte, faptul ca merge la orice numar de spatii inainte nu ajuta cu nimic, poate chiar fi scoasa; doar daca ne gandim ca poate cineva nu ruleaza acele optiuni inainte am putea s-o lasam. Ce parere ai - o lasam sau o scoatem...?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Bun: - scot înregistrările cu apostrofuri din dicţionar - asta e simplu si fără alte implicaţii; - dicţionarul Corectară suplimentară pentru Elipsis rămâne, dar va trebui să facem niste modificări în ordinea de rulare a optiunilor, astfel că va trebui mutată opţiunea "Corectare suplimentară elipsis" de pe poziţia 1 pe poziţia 3, asrfel încât să ruleze după Punctuaţie [FUNCTII OBISNUITE]: În loc de: 2.1 Corectare suplimentară elipsis 2.2 Corectare linii de pauză şi linii de dialog 2.3 FUNCTII OBISNUITE va fi: 2.1 Corectare linii de pauză şi linii de dialog 2.2 FUNCTII OBISNUITE 2.3 Corectare suplimentară elipsis
Sper că ordinea asta să nu dea efecte secundare. La o primă analiză pare ordinea optimă.
Mai departe; referitor la [spatii/taburi] O lăsăm aşa - este mult mai bine că poate funcţiona în orice situaţie; rămâne aşa cum ai implementat; eu mă gândeam să nu aibă o zonă redusă de actiune, când de fapt, adevărul este că are o zonă mult mai mare decât mă aşteptam. E perfect aşa.
O problemă secundară: la folosirea ultimului executabil am constatat o problemă care nu stiu dacă ţine de AC sau de Win. Când vreau să deschid un Dictionar de Înlocuiri multiple, fereastra de deschidere nu mă duce în folderul Dicţionare, ci în folderul deschis ultima dată [adică în cel în care s-a aflat fişierul RTF încărcat în AC].
Şi ultima... cred că acum trebuie să dezvoltăm discuţiile pentru Majuscularea la început de paragraf... Cred că ar fi bine să începi tu ce vrei să fie clarificat, pentru ca să nu reiau eu niste lucruri pe care le-am mai spus.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am modificat ordinea.
In ce priveste folderul in care porneste dialogul de deschidere fisiere, problema e mai de demult. In general un program are un singur folder asociat si deci dac-ai deschis un anumit fisier dintr-un anumit folder data viitoare te duce la aceeasi locatie. Cateodata se poate "jongla" intern cu aceste foldere, alteori nu. Am vazut cazuri cand sistemul de operare lua "controlul" si desemna un anumit folder indiferent ce setai intern in program. O sa incerc sa vad ce pot face dar nu pot sa promit ca se va rezolva 100%. Cel mult se va ameliora...
"Majuscularea la incepurt de paragraf" - am inteles de ce vrei sa imparti tipul de paragrafe in 2: oricare paragraf respectiv paragraf intreg. Problema este ca trebuie sa gasesc o modalitate cat mai aproape de 100% la eficienta (in cod adica, ca in gandul nostru e usor) in a le diferentia astfel incat sa avem cat mai putine "rateuri". Mai poti te rog sa-mi dai (cat mai multe) exemple din ambele cazuri pentru a putea gasi un "tipar"?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** ... privind folderul care porneşte dialogul de deschidere fişiere; n-am fist atent şi n-am constatat asta până acum. Pe de altă parte nici nu e o problemă entru utilizatorii obişnuiţi care nu accesează decât foarte rar dictionarele. În ce mă ptiveşte... mă descurc cu calea de căutare, aşa că nu trebuie insistat pe rezolvarea problemei.
"Majuscularea la început de paragraf" Înţeleg că în principiu ai înţeles la ce mă refer, dar încerci să cauzi "logica" codului.
Pentru "pretenţioşi" trebuie subliniat că nu avem şanse să găsim o formulă de rezolvare universal valabilă, ci încercăm să găsim niste variante care să încerce să rezolve cât mai multe situaţii fără a provoca efecte secundare nedorite.
Să stabilim nişte denumiri pe care le-am folosit şi pe care le voi folosi în continuare: - "Paragraf Întreg" sau "Paragraf normal" este paragraful care îndeplineşte toate condiţiile, inclusiv pe aceea de a se termina cu un semn de punctuaţie corect. - "Paragraf Gol" este rândul gol, care nu conţine niciun caracter, ori... poate eventual ar cuprinde un spaţiu gol. - "Paragraf Cifre" se referă la paragrafele care cuprind numărul de pagină; acestea cuprind un număr de o singură cifră [sau 2 cifre sau trei sau maxim 4 cifre]; nenorocirea este că uneori printre cifre pot apărea şi răgălii. - "Paragraf Răgălii" – există mai rar situaţii când într-un paragraf apare una sau mai multe dintre caracterele: ■, ♦ şi încă două trei caractere. Rombul negru "♦" este cel mai des întâlnit.
- "Paragraf Întrerupt" - aici este mult de discutat. Avem paragrafele care încep la sfârşit de pagină şi se continuă pe pagina următoare: aceste paragrafe sunt întrerupte în diverse moduri; încerc să redau mai jos câteva elemente distinctive: - paragraful de la sfârşit de pagină este întrerupt cu/fără semn de punctuaţie - urmează DA/NU note de subsol - urmează rând gol şi rând număr de pagină sau în ordine inversă, ori doar una dintre ele; aceste paragrafele numite mai sus "Paragraf Gol" şi "Paragraf Cifre" - urmează continuarea paragrafului la început de pagină scanată. Acesta va fi numit "Paragraf Fals" Acestea sunt paragrafele la care nu aş dori să se facă majuscularea.
Să încercăm să găsim ceva condiţii pentru „Paragraful Fals”: ■ „Paragraful Fals” urmează după un "Paragraf Gol". ***Notă: Tot după un paragraf gol poate urma şi primul paragraf de după titlul unui capitol, dacă s-a lăsat un rând gol… Astfel de cazuri [cele de după numele capitolului] sunt mai puţine, astfel că le vom ignora. ■ „Paragraful Fals” urmează după un "Paragraf Cifre". E vorba de rândul în care apare numărul de pagină. Aici nu cred că sunt alte cazuri care să necesite discuţii. ■ „Paragraful Fals” urmează după un "Paragraf Răgălii".
Nu ştiu dacă aceste caracteristici folosesc la ceva; sunt conştient că sunt condiţii „NU” şi că ţie îţi trebuie condiţii „DA”.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Multumesc pentru explicatii - o sa incerc sa vad ce pot face...
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
E complicat dar deocamdata nu asa de complicat. Problema e doar ca in ultimul timp am ziua plina (munca) si ajung acasa obosit mort. Pentru a lucra eficient la AutoCorect trebuie sa am cel putin 90% din energie ca sa ma pot concentra la ce fac, dar de multe ori nici 50% nu am. O sa incerc totusi sa fac cu optiune in config iar varianta cu dictionare cu confirmare s-o pastram deocamdata in "rezerva" - nu ca nu ar fi bun ce sugerezi, dar cred ca ar trebui recurs la ele doar cand intr-adevar n-ai de ales - din moment ce va "stresa" utilizatorul in plus.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Sa incerc definirea "paragraf intreg" de la "Majuscula început paragraf – [numai paragraf întreg]" respectiv "Majuscula început paragraf – [numai litera Î paragraf întreg]": paragraful anterior sa nu fie gol, sa nu aiba numai cifre, sa nu aiba numai ragalii + sa se termine corect in punct, semn de intrebare sau semn de mirare (poate si elipsis). Sunt bune toate aceste conditii impreuna?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
Equinox
VETERAN
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
@Seven Acu, despre "ragalii": din punct de vedere vizual ne e usor sa ne dam seama ca e "ragalie" sau nu dar sunt ceva dificultati in a "defini" in cod ce inseamna "ragalie". Pina acum vad 3 metode, toate cu probleme: 1. Unicode are 65 536 de caractere; ar putea fi impartite manual in 2 categorii: caractere bune si "ragalii". Problema e cine are energia si rabdarea sa faca asta de 65 536 ori Plus ca unele caractere sunt "duale" - langa unele caractere sunt "ragalii", langa altele sunt "normale". 2. Codul ar putea face o "captura" de imagine si s-o analizeze; problema e cum sa faci calculatorul sa-si dea seama ca e "ragalie" sau caracter bun + s-o faca si rapid. E dificil sa programezi calculatorul sa aiba gandirea umana... 3. Asa cum ai facut acele dictionare imd care au curatat mare parte din "ragalii", se pot cauta in texte si colecta toate combinatiile de ragalii respectiv combinatiile de caractere normale cu ragalii apoi stocate intr-un dictionar intern sau extern si folosite in cod. Problema e ca colectarea va fi dificila si rezultatul ma indoiesc ca va merge pentru un procent mare din situatii. Dar tu stii mai bine decat mine cum e situatia in texte si care e probabilitatea de reusita...
@Equinox Poti te rog sa dai exemplu de propozitii/fraze in care e nevoie de asa ceva? Multumesc anticipat.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Cosmin, astăzi mi-am dat si eu seama cam ce aberaţii am scris ieri în legătură cu "răgăliile". Ba, mai mult, am dat niste exemple în care nici măcar nu era vorba de "răgălii". Caracterele cratima si paranteză date ca exemplu nu pot fi categorisite astfel.
Revin asupra răgăliilor: încerc să fac o listă cu câteva semne care apar mai des pe lângă numărul de pagină... ele vor fi într-un număr redus... nu mai mult de zece cazuri. Mai există 10 cifre... plus maxim 10 răgălii... ar fi un total de 20 de caractere. În acest caz poţi găsi o formulare în care un paragraf să conţină doar aceste caractere, fie ele separate [numai cifre sau numai răgălii] sau combinate cifre cu răgălii?
Poate şi lungimea acestui tip de paragraf ar trebui să o mai reducem... Am propus maxim 10 caractere, pe considerentu că avem deja exemple de cărţi cu peste 1000 de pagini, deci cu 4 cifre la numărul de pagină, la care dacă se adaugă un spaşiu sau o răgălie devin deja 5 caractere. Numărul "5" mi se pare cam mic, dar parcă şi "10" e cam mare... poate ceva între 5 şi 10 ar fi mai bine.
Equinox, eu cred că am înţeles despre ce înregistrare e vorba: cuvântul "înjur" scris legat să fie înlocuit cu "în jur" scris dezlegat. În cazul ăsta nu e o înlocuire universal valabilă, deoarece există cuvântul "înjur" din exemplul "eu mai înjur din când în când". Propunerea mea este ca înregistrarea să fie una cu confirmare şi poate fi pusă într-unul din dicţionarele care rulează la opţiunea "12.2 Dicţionare cu variante". E vorba de dicţionarele DVar1.imd - Dvar4.imd... sau mai exact CO_DVar1.imd - CO_Dvar4.imd pentru varianta AC Contemporan sau CL_DVar1.imd - CL_Dvar4.imd pentru varianta AC Clasic.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Iui > lui - merge la S3.imd cu condiţiile "Cuvânt întreg" + "Potrivire perfectă"; Cum nu există cuvântul "Iui" se poate face modificarea automat. Văd că eu o am... probabil am mai îmbunătăţit pe parcurs dicţionarul. la fel şi Ioc > loc [Ci + Pp]
Celelalte cuvinte care seamănă cu situaţiile de mai sus, dar care au ambele sensuri, precum: Ia > la, I-a > l-a... Tot în dicţionarele cu variante, deocamdată. Deocamdată... pentru că trebuie aşteptat până la definitivarea punctuaţiei...
Cazurile de mai sus se vor rezolva mult mai uşor când se va omplementa la "Înlocuiri multiple" o confiţie despre care am mai discutat... este vorba despre cea cu margini care rămân nemodificate
Când vom putea face înregistrare de genul: Caută: literă_mică - spaţiu - Ia - spaţiu - litera_mică Înlocuieşte cu: literă_mică - spaţiu - la - spaţiu - litera_mică atunci înlocuirea se va face automat, fără confirmare. E valabil şi pentru Cu > cu, Ca > ca, Se > se.... si multe altele
Cred că ar fi bine ca la topicul de înlocuiri multiple să încep un fel de tutorial despre editarea dicţionarelor de "Înlocuire multiplă"... deoarece, în acest moment fereastra de editare este destul de complexă şi stufoasă şi probabil, unii useru de feresc să-şi facă dicţionare proprii, din intenţia de a nu greşi ceva.
Indiferent câte dicţionare s-ar pune la dispoziţie sunt necesare si dictionarele proprii care să rezolve nişte situaţii temporare, care apar numai la anumite volume... mai ales dacă avem o serie de volume cu aceleaşi caracteristici. Iată un exemplu: "Război şi pace" - 4 volume... sau "Cântec de gheaţă şi foc" - 9 volume... dacă la primul volum omul se chinuie si-si face un dicţionar TEMP cu simţ de răspundere, acest dicţionar este valabil la 4 volume, respectiv la 9...
Din astfel de motive, cred eu că e bine ca fiecare user să fie dispus să creeze dicţionare atunci când are nevoie.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven a scris:
Revin asupra răgăliilor: încerc să fac o listă cu câteva semne care apar mai des pe lângă numărul de pagină... ele vor fi într-un număr redus... nu mai mult de zece cazuri. Mai există 10 cifre... plus maxim 10 răgălii... ar fi un total de 20 de caractere. În acest caz poţi găsi o formulare în care un paragraf să conţină doar aceste caractere, fie ele separate [numai cifre sau numai răgălii] sau combinate cifre cu răgălii? |
Nu pot sa fiu 100% sigur decat daca incerc dar daca cunosc ce caractere intra in compozitia acestor paragrafe pot sa spun ca probabilitatea de reusita creste mult.
Seven a scris:
Poate şi lungimea acestui tip de paragraf ar trebui să o mai reducem... Am propus maxim 10 caractere, pe considerentu că avem deja exemple de cărţi cu peste 1000 de pagini, deci cu 4 cifre la numărul de pagină, la care dacă se adaugă un spaşiu sau o răgălie devin deja 5 caractere. Numărul "5" mi se pare cam mic, dar parcă şi "10" e cam mare... poate ceva între 5 şi 10 ar fi mai bine. |
Punem media 7,5 7 sau 8 e bine, te las pe tine sa decizi ca tu ai experienta mai multa cu asa ceva. Oricum dupa implementare se pot face niste teste si se poate "regla fin"....
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** 7,5? Dacă e după mine... n-aş putea alege niciodată opt, ci doar şapte... cum ar fi ca unul pe care-l cheamă "şapte" să aleagă numărul "opt"?...
Lista cu răgălii va cuprinde câteva caractere de genul: ■ ♦ Trebuie să mai umblu prin nişte OCR brut să văd ce mai apare... Probabil cel mai bine este să le trec într-un fişier "doc" sau "txt"
Ar mai fi o soluţie... În urmă cu câteva zile am stabilit că dacă se pune la "Înlocuiri multiple" un caracter cu condiţiile "Început paragraf" + "Sfârşit paragraf" şi la "înlocuieşte cu" nu punem nimic, în final va rezulta un rând gol, deci un paragraf gol.
E posibil să scăpăm de câteva situaţii de paragrafe care conţin răgălii, dacă înainte de Punctuaţie rulăm un dicţionar cu astfel de paragrafe foarte scurte care conţine numai răgălii şi care se vor transforma în paragrafe goale.
Acest dicţionar nu va necesita un timp prea lung de rulare, pentru că va avea puţine înregistrări şi va face foarte puţine modificări. Practic va dura mai mult scanarea textului decât înlocuirile ce vor fi făcute.
În această situaţie "paragraful întrerupt, va fi unul care vine după un "Paragraf Gol" sau un "Paragraf Cifre"... şi vedem ce facem şi cu cele răgălii...
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
Equinox
VETERAN
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
@Equinox Poti te rog sa dai exemplu de propozitii/fraze in care e nevoie de asa ceva? Multumesc anticipat. |
Cam injur de 15 lei. Cam in jur de 15 lei.
Cel putin in ultimele 3 carti pe care le-am corectat am intalnit aceasta eroare.
_______________________________________ Urăsc prostia! Star Wars - Banda desenata tradusa in limba romana
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am inteles, Equinox.
Seven, daca esti sigur ca va merge mai bine cu dictionar facem asa... O sa bag cele 2 conditii respectiv si conditia ca textul obisnuit in paragraful anterior sa se termine cu .?! si elipsis.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am implementat toate optiunile. Cred ca ar fi bine sa fie testat temeinic si abia dupa aceea, daca totul e in ordine, pus in topicul principal...
Intrebare: acum ca punctuatia implicit nu mai schimba dialogurile franceze, mai e necesara "4.5 Conversie majuscula in minuscula la dialog francez"?
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Teoretic nu.
Dar e mai bine sa ramana in ambele locuri.
Odata la Punctuatie pentru se lucreaza si cu texte ce nu necesita rularea Ocr_Plus-ului, a doua oara (inutila pentru mine ) pentru ca POATE cei ce ruleaza OCr_Plus fac tot atunci si Punctuatia. Oricum pe un ocr, dupa rularea Ocr_Plus-ului, a Punctuatiei si a Ortografiei, o sa fie nevoie iarasi de o rulare a Punctuatiei pentru ca s-au facut schimbari maricele in text.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, trebuie sa ramana si 4.5 dar ma gandeam sa fie totusi debifata implicit. Intre timp am mai facut cateva mici ajustari la exe, ca de exemplu redenumirea 4.6 in 4.5. Am si debifat implicit 4.5 pentru a se testa. Daca se decide totusi bifarea implicita e usor de modificat inapoi.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven, cum sa fie denumita optiunea care scoate acele ragalii inainte de punctuatie, cum sa se denumeasca dictionarul si pe ce pozitie sa fie pusa..?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Debifate implicit: 4.5 - Da - Să fie devifat implicit. 1.6 - Rupere rânduri... - mai trebuie testat, dar deocamdată pare să rupă acolo unde n-ar trebui. Abbyy pune Em dash în locul unora dintre liniile de pauză, iar AC face rupere acolo, crezând că linia de pauză este un dialog. Să rămână şi el implicit debifat.
Opţiunea care scoate răgălii... Poziţia în meniu. Cred că prima poziţie la pachetul 2 despre punctuaţie e cel mai bine. Numele?... Cam dificil... "Eliminare paragraf-artefact" - ar fi o denumire scurtă, dar nu ştiu dacă e suficient de sugestivă. Nume dicţionar: DEPA sau DArtef... ceva de genul ăsta... parcă DArtef ar părea mai sugestiv un pic. E bine să aibă un nume astfel ca la indexare să fie printre primele.
Deci, "2.1 Eliminare paragraf-artefact", rulează dicţionarul CO_DArtef.imd / CO_DArtef.imd [sau CO_DEPA.imd / CO_DEPA.imd].
Mai sint câteva aspecte de discutat la meniul OCR_Plus... unele mai simple, altele mai complicate... dar am aşteptat să definitivăm punctuaţia.
Cea mai simplă dintre ele, dar necesară, este o modificare la "1.2. Setare text la font şi mărime unică" Avem acolo o bifă pentru Font Bold+Italic = Font Italic... Cred că înţelegi la ce mă refer. Se simte nevoia a încă unei opţiuni de genul ăsta şi anume: Font Bold = Font Drept. Fontul Bold apare în multe locuri unde Abbyy nu a fost foarte sigur pe recunoaştere, dar şi pe la numere de pagină etc. ceea ce este destul de enervant... Cu toate acestea uneori poate fi folositor, aşa că nu aş înclina spre eliminarea definitivă din formatarea finală, ci doar în posibilitatea de păstrare sau nu.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
4.5 ramane debifata. 1.6 e facuta cu cod si nu cu dictionar. Cand determina ca e dialog nu se uita la tipul liniutei ci la ce e in jurul liniutei. Poti te rog sa-mi dai exemple de situatii in care nu "rupe" bine? De preferat sa-mi arati paragrafele nu doar fraza. Am sa adaug "2.1 Eliminare paragraf-artefact" ce ruleza CO_DArtef.imd.
As inclina totusi ca denumire spre "Bold >> Normal". La cealalta e mai usor de inteles ca se aduna si rezulta Italic, la asta din '=' se intelege mai mult "egalitate". Iar optiunea va fi debifata implicit. PS: vrei ca bold-ul sa fie scos numai din formatarile ce au doar bold sau vrei sa fie scos din formatarile ce au ori numai bold ori bold + altele?
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Vreau sa cer si eu nelamurire
Exista sau nu o optiune care sa transforme toate tipurile de linie orizontala in cratime simple?
Daca toate liniile s-ar face cratime, din 3-4 inlocuiri simple am rezolva o droaie de probleme.
^pCratimaSpatiu > ^pEmDash^s
SpatiuCratimaSpatiu > SpatiuEndashSpatiu
SpatiuCratimaVirgulaSpatiu > SpatiuEndashVirgulaSpatiu
Si cred ca s-ar rezolva si problema ruperii de randuri.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** utilitasetveritas, Te nelămuresc eu, ca să fie o nelămurire completă. Nu există o astfel de opţiune, cel putin deocamdată. Eu mă tot gândesc la un ceva ce ar mai rezolva din cuvintele despărtite la sfârsit de rând si care apar în OCR scrise cu cratimă. Ca să fie un număr mai mic de căutări, aş prefera să existe pentru căutare doar cratimele initiale; dacă transformăm toate liniuţele în cratime, s-ar mări numărul de situaţii la căutare şi cred că ar fi mai complicat de găsit cuvintele ce trebuie "unite". E doar un punct de vedere, dar pot renunţa dacă e nevoie si găsim un argument solid.
Despre ruperea eronată a rândurilor... Am constatat asta la cărţile lui James Fenimore Cooper. Cărţile folosesc în mod abundent linii de pauză, în foarte multe situaţii: atât în dialog pentru introducerea comentariului de autor de genul "zise, spuse, zbieră, şopti X", dar şi în interiorul frazelor spuse de personaje, pentru că personajele mai fac câte i paranteză în dialog.
N-am făcut o analiză a situaţiilor constatate... doar le-am corectat si am trecut mai departe. Cum mai am câteva volume bune de corectat, voi "nota" situaţiile, ca să poată fi analizate.
Cosmin, Despre bold... Da, e mai bine semnul > în loc de egalitate. Deci, initial m-am gândit că ar fi bine să păstrăm 3 fonturi: Drept, Italic şi Bold simplu, fără alte combinaţii. Mai departe am propus ca Bold+Italic să rămână Italic simplu... iar acum am constatat că si Bold simplu dă mult de lucru.
Repet, nu cred că ar trebui renunţat definitiv la bold, dar e bine să putem avea posibilitatea ca la unele texte să renunţăm.
Într-o variantă de formatare aş vrea să renunţăm la toate bildurile, fie ele simple sau în combinaţii. În principiu, avem următoarele variante de bold: - Bold simplu >> Drept simplu - Bold+Italic >> Italic simplu - Bold plus orice altceva în afară de italic >> Drept simplu. În final ar rămâne doar Drept şi Italic.
Ştiu... e o problemă cu exponenţii de la notele de subsol, dar Abbyy transforma în indice si exponent mult text obişnuit pentru că i se "părea" lui că e mai mic. Cred că e mult mai bine ca să păstrăm doar "Drept" şi "Italic", iar atunci când avem neapărat nevoie să putem păstra şi "Bold", respectiv "Bold+Italic".
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
A... inteleg. Sutam la porti diferite.
Eu ma gandeam la o metoda de uniformizare a liniilor din text. Dar asta nu avea legatura cu liniile tale de la cap de rand.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Cosmin, Mă gândeam să te las să mai iei o pauză după definitivarea punctuaţiei... Acum că ai terminat treaba asta, mă gândesc să nu-ţi ieşi din ritm şi, că, poate ar trebui să te ţinem în tensiune ridicată...
Am două probleme: una personală şi una pentru marele public.
Încep cu cea personală: Mi-ai făcut un utilitar de căutare cuvinte şi secvenţe de cuvinte în dicţionarele încărcate de AutoCorect. L-am folosit la maxim şi mi-a fost de mare folos. Dacă aş putea căuta cu un astfel de utilitar secvenţe doar la început de cuvânt sau doar la sfârşit de cuvânt căutările făcute de mine ar fi mult uşurate. M-ar interesa dacă s-ar putea face un astfel de utilitar. Mă descurc şi acum, doar că duc toate rezultatele de la o căutare într-un document word, le indexez şi apoi încep să şterg ceea ce nu mă interesează, ca să-mi rămână doar căutările care îndeplinesc condiţia "la început" sau "la sfârşit" de cuvânt.
A doua problemă are legătură cu astfel de dicţionare de înlocuire secvenţe. Trebuie să-i găsim un loc la o astfel de opţiune. Aici am doar o întrebare: undeva în pachetul 4 ar fi posibilă o opţiune similară cu cea de la 11. Rulare grup de dicţionare? Adică, ar fi mult mai uşor dacă aceste dicţionare nu ar trebui să le numesc într-un mod anume. Aş vrea ca numele să cuprindă secvenţa respectivă ca să fie mai uşor de modificat.
Apăi... deocamdată e suficient. Nu-i nicio grabă; dacă se poate, e bine atunci când se poate.
Cu stimă, Seven
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Ce s-a mai facut: - implementare "Bold >> Normal"; - optiune "2.1 Eliminare paragraf-artefact" ce ruleza CO_DArtef.imd; - am debifat 1.6 implicit pe moment pina imi dai cateva exemple ca sa pot incerca sa o imbunatatesc.
O sa incerc sa imbunatatesc acel utilitar.
Probabil in 4 ar merge. Dar vrei exact o fereastra ca la 11 (sa poti adauga/scoate)? Vrei ca utilizatorul sa aleaga ce sa ruleze manual si sa dea click pe "Ruleaza"? Eu ma gandesc la ceva semiautomat, unde utilizatorul are de ales dintr-o lista predefinita de dictionare + poate chiar cand alege sa se si ruleze automat... E doar o idee... O intrebare: sunt situatii in care se vor utiliza doar o parte din aceste dictionare? Daca da, cum va sti utilizatorul care din ele sa le utilizeze..?
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** O clipă... să "probez" noul executabil şi revin. Pentru ca să poată rula tot meniul OCR_Plus, m-am grăbit să editez dicţionarul necesar, în cele două variante: pentru AC Contemporan şi AC Clasic. Am urcat cele două dicţionare CL_DArtef.imd şi CO_DArtef.imd, la adresa cunoscută, în folderul:
După ce am să mai fac nişte îmbunătăţiri la aceste dicţionare şi la cele de cuvinte scurte, am să urc o arhivă actualizată.
Despre opţiunea nouă de la pachetul 4... Problema nu mi-e foarte clară nici mie deocamdată, pentru că sincer nu m-am preocupat în special cum ar fi mai bine pentru utilizator. Despre ce e vorba? Am început de mai mult timp editarea unor dicţionare de Înlocuiri multiple care realizează înlocuiri de secvenţe de câte 3-4 litere, atât din interiorul cuvintelor, cât şi dintr-o margine... de regulă de la sfârşit, deci terminaţii de cuvinte. Aceste dicţionare sunt realizate deocamdată pe tipuri de secvenţe; de exemplu pentru transformarea lui "c" aflat între consoane în "e" şi "l" aflat între consoane în "i", am 36 dicţionare a circa 20-25 înregistrări. După ce aceste secvenţe vor fi verificate şi paraverificate, vor rămâne doar două dicţionare sau chiar unul pentru aceste secvenţe. Până la definitivare, lucrez cu foarte multe. Atunci când mai apare o situaţie în textul pe care-l corectez, caut dicţionarul văd dacă se poate adăuga înregistrarea... Dacă dicţionarele au nume suficient de sugestive pot căuta, respectiv edita mai uşor. Dacă aş nota câteva dicţionare Secv1, Secv2 ... SecvX... ar fi foarte greu de verificat prin ele.
În concluzie, deocamdată... [şi va mai dura o lună-două pentru că mai am foarte multe secvenţe de verificat şi editat] m-ar interesa o funcţie cât mai apropiată de cea de la 11, adică exat asta: să pot adăuga şo şterge dicţionare.
Varianta semiautomată o putem lăsa pentru momentul când aceste dicţionare vor fi gata. Ideea este ca în final, TOATE aceste dicţionare să fie rulate automat, aşa cum rulează cel ce corectează litera L în loc de 1... deci utilizatorul nu va avea prea mult de ales...
Pentru acest moment, dacă ţi se pare mai bine, putem duce opţiunea şi în afara meniului, aşa cum este cea de demarcare, iar când va fi gata va ajunge la pachetul 4.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am modificat acel programel: Referitor la adaugarea unei optiuni in 4 asemanatoare celei din 11: de curiozitate, daca tot zici ca va fi temporar, de ce nu incarci momentan dictionarele in 11 si le rulezi de acolo? Daca conteaza si locatia - sa fie rulat neaparat pe la 4, atunci il poti chiar muta acel 11 mai sus in Rularea automata (mouse drag'n'drop sau taste Shift + sageti sus/jos). Daca crezi ca totusi e intr-adevar necesar sa se faca separat o sa incerc sa implementez.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Săru'mâna pentru executabilul de căutare. Mi-e mult mai uşor să fac acum căutări de secvenţe doar la început sau doar la sfârşit de cuvânt.
Opţiunea înlocuiri secvenţe de cuvânt. Ea va trebui implementată şi locul cel mai nimerit e în pachetul 4. În final va cuprinde un număr redus de dicţionare şi cu nume clar stabilite.
Ceea ce am vrut să spun este că nefiind definitivată nu pot să spun acum câte dicţionare vor rula şi cum s-ar numi ele, astfel încât să fie implementată într-o formă finală. Aş putea să spun că am nevoie de 10 dicţionare şi să le cheme Secv1.imd... Secv10.imd, doar că asta mă încurcă foarte tare acum pe timpul editării.
Îmi este mult mai simplu să mă folosesc de denumiri care încep cu SI_ SM_ şi SF_ pentru secvenţe de început, de mijloc si finale, la care adaug chiar numele secvenţei. În timp ce fac înregistrări în legătură cu secvenţele finale -mi-le, -mi-se ori -mi-te verific dacă o anume situaţie este valabilă şi la secvenţele finale -ţi-le, -ţi-ne ori -ţi-se; verific dacă am prins astfel de înregistrări şi adaug atunci când este cazul. Atât timp cât ele sunt în dicţionare separate, găsesc mai uşor înregistrările. În plus mă pot folosi de Cop&Paste între dicţionare şi apoi o reeditare sumară...
Da, la acest moment lucrez cu opţiunea de la 11, doar că am 2 variante de ListaDictionare.txt şi trebuie să activez câte una dintre liste pentru o curăţare completă şi cealaltă listă pentru testele de secvenţe. Oricum având posibilitatea de căutare la început de cuvânt şi mai ales la sfârşit, cred că va dura mult mai puţin timp până la definitivare.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Scuze Seven ca n-am raspuns mai repede dar am intrat iar intr-o perioada in care am mai putin timp liber Adaugarea acelei optiuni nu e asa de usoara ca modificarea programului de cautat secvente dar daca inca iti mai trebuie doar spune si o sa incerc...
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Nu e o problemă.
Între timp am mai cugetat şi eu... şi m-am gândit că: - Setarea punctuaţiei este perfect funcţională în forma actuală şi nu e cazul să mai intervenim la ea decât peste un timp mai lung şi, numai dacă vom considera că se mai poate adăuga ceva pentru perfecţionare. Deci, problema asta o putem considera închisă, cel puţin temporar.
- Meniul OCR_Plus: va fi necesar ca în viitor [dar nu în viitorul imediat] să se mai facă niste implementări şi modificări. Voi reveni cu niste propuneri.
- Înlocuiri multiple: Rămâne de văzut dacă se va putea implementa condiţia aia cu "marginile" despre care s-a făcut discuţie în urmă cu ceva timp. După câte îmi amintesc era zona lui Daniel, deci putem să mai aşteptăm, până va avea timp să lucreze la această opţiune. Cred că aceasta va fi ultima îmbunătăţire ce mai poate fi făcută la capitolul ăsta.
- Promovarea programului AutoCorect OCR_Plus: este cea mai importantă problemă acum. După atâta efort depus pentru realizarea unui instrument foarte util, este necesar să fie utilizat de cât mai mulţi useri. În fond, asta ar fi cea mai bună recompensă pentru munca făcută timp de peste 6 luni. La momentul ăsta încerc să pregătesc tutoriale... am deschis un topic special pentru prezentarea programului....
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Acum să revin la ceea ce cred că mai poate fi avut în vedere la Meniul OCR_Plus: ■ IMPLEMENTĂRI NOI: - va trebui implementată opţiunea de modificare secvenţe - dar aici nu e nicio grabă, deoarece mai am de lucru încă foarte mult la editarea dicţionarelor. Cred că cel mai bine ar fi dacă se face un cod în care se spune că se rulează dicţionarele următoare: "......." Dacă se poate implementa opţiunea astfel încât cu efort minim să se permită adăugarea în timp a dicţionarelor atunci ar fi cea mai bună variantă. Adică: adun într-un singur dicţionar secvenţele care au dicţionarele gata şi îi dau numele SMed1.imd sau SM_cl.imd pentru că se referă la secvenţe care modifică literele c şi l. Implementăm opţiunea care va rula acest dicţionar. Pe parcurs mai lucrez nişte dicţionare cu secvenţe la început de cuvânt şi realizez un nou dicţionar numit SIni1.imd sau altfel. Dacă se poate face modificarea codului foarte uşor şi se poate să se adauge şi acest dicţionar la cod, astfel ca în acest moment să ruleze ambele dicţionare... atunci ar fi perfect. Problema este că în timp s-ar putea ajunge la mai multe modificări. Nu ştiu dacă dicţionarele respective vor fi în număr de 5 ori 7 sau 10, dar oricum nu vor fi mai puţine de 3 şi nici mai multe de 10. Trebuie văzut care ar fi codul care să permită adăugarea de noi dicţionare cu cât mai puţine modificări de cod.
Să mergem mai departe: ■ MODIFICĂRI DE OPŢIUNI: - trebuie studiată problema 1.6 Rupere rânduri... Deocamdată am doar o constatare: problemele pe care le-am găsit eu au apărut în situaţii care sunt atipice şi puţin folosite în literatură; este vorba de linie de pauză între propoziţii, în cazul meu e vorba de propoziţii care se termină în ! sau ?; deci linia de pauză apărea după ! sau ?, iar Ac a considerat că e linie de dialog. Mai trebuie studiată problema... poate găsim o soluţie similară cu cea de la repararea rândurilor, procedând la setarea diferitelor situaţii.
- la 1.2 Setare text la font si mărime unică. Am constatat că transformarea Bold în Drept consumă foarte mult timp la rulare. Problema eliminării formatărilor bold se poate face în 3 secunde în Word, aşa că nu e o problemă foarte importantă... Mă gândesc dacă în viitor se poate găsi o altă abordare a conversiei.... E o problemă care trebuie studiată mai mult.
- e posibil să există o problemă la demarcare text [ultima opţiune din meniul OCR_Plus]. Nu sunt foarte sigur, dar am avut un OCR care arăta că textul are fundal alb, deşi ar fi trebuit să nu aibă niciun fel de fundal. Mai mult decât atât, nu am reuşit în word să scap de o astfel de problemă.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
AutoCorect
Membru Puf
Inregistrat: acum 13 ani
|
|
2002 - 2012 = 10 ani.
10 ani din viaţa mea pentru AutoCorect, pentru a fi ce este acum, pentru un start, un colac de salvare ce va salva pe ici pe colo pe unu şi pe altul...
Acum, eu renunţ complet la ce înseamnă AutoCorect, las moştenire tot ce înseamnă AutoCorect colaboratorului şi prietenului meu Cosmin Ciuperca cu care am petrecut momente deosebite dezvoltând aplicaţia mai sus menţionată, chiar dacă nu ne-am întâlnit niciodată face-to-face.
Doresc şi voi trece în uitare aşa cum am început dezvoltarea AC, în linişte, fără susţinători.
Succes în continuare Cosmin, de acum tot greul va fi pe umerii tăi. Sună ciudat, dar îmi este inima grea, simt că mă despart de ceva drag... cu bine..., tuturor.
Daniel Morlova.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven a scris:
Înlocuiri multiple: Rămâne de văzut dacă se va putea implementa condiţia aia cu "marginile" despre care s-a făcut discuţie în urmă cu ceva timp. După câte îmi amintesc era zona lui Daniel, deci putem să mai aşteptăm, până va avea timp să lucreze la această opţiune. Cred că aceasta va fi ultima îmbunătăţire ce mai poate fi făcută la capitolul ăsta. |
Probabil te referi sa nu inlocuiasca marginile cuvantului ci doar in interior - asta imi amintesc ca se discutase...
Seven a scris:
- va trebui implementată opţiunea de modificare secvenţe - dar aici nu e nicio grabă, deoarece mai am de lucru încă foarte mult la editarea dicţionarelor. Cred că cel mai bine ar fi dacă se face un cod în care se spune că se rulează dicţionarele următoare: "......." Dacă se poate implementa opţiunea astfel încât cu efort minim să se permită adăugarea în timp a dicţionarelor atunci ar fi cea mai bună variantă. Adică: adun într-un singur dicţionar secvenţele care au dicţionarele gata şi îi dau numele SMed1.imd sau SM_cl.imd pentru că se referă la secvenţe care modifică literele c şi l. Implementăm opţiunea care va rula acest dicţionar. Pe parcurs mai lucrez nişte dicţionare cu secvenţe la început de cuvânt şi realizez un nou dicţionar numit SIni1.imd sau altfel. Dacă se poate face modificarea codului foarte uşor şi se poate să se adauge şi acest dicţionar la cod, astfel ca în acest moment să ruleze ambele dicţionare... atunci ar fi perfect. Problema este că în timp s-ar putea ajunge la mai multe modificări. Nu ştiu dacă dicţionarele respective vor fi în număr de 5 ori 7 sau 10, dar oricum nu vor fi mai puţine de 3 şi nici mai multe de 10. Trebuie văzut care ar fi codul care să permită adăugarea de noi dicţionare cu cât mai puţine modificări de cod.
|
Poate e de vina ora tarzie si oboseala acumulata dar n-am inteles prea bine despre ce e vorba. Vrei totusi o noua optiune 11 bagata la 4 sau altceva...?
Seven a scris:
- la 1.2 Setare text la font si mărime unică. Am constatat că transformarea Bold în Drept consumă foarte mult timp la rulare. Problema eliminării formatărilor bold se poate face în 3 secunde în Word, aşa că nu e o problemă foarte importantă... Mă gândesc dacă în viitor se poate găsi o altă abordare a conversiei.... E o problemă care trebuie studiată mai mult. |
Am gasit metoda sa scot Bold in bloc, in loc sa o scot din zonele de formatare pe rand una cate una. Am pus exe nou in topicul principal.
Seven a scris:
- e posibil să există o problemă la demarcare text [ultima opţiune din meniul OCR_Plus]. Nu sunt foarte sigur, dar am avut un OCR care arăta că textul are fundal alb, deşi ar fi trebuit să nu aibă niciun fel de fundal. Mai mult decât atât, nu am reuşit în word să scap de o astfel de problemă. |
Cand demarcarea textului arata ca acesta are culoare la fundal, nu e vorba de un fundal propriuzis (imagine) bagat in doc. Ca sa dau un exemplu: acest forum are o imagine de fundal dar demarcarea arata ca culoare de fundal gri-ul sau maro-ul nu imaginea respectiva. Da, in Word e cam dificil sa le scoti dar cu AutoCorect n-ar trebui sa fie probleme. Daca totusi mai apar probleme de demarcare trimite-mi te rog textul.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Înlocuiri multiple. Da despre condiţia aia era vorba. Mă gândeam dacă o astfel de condiţie s-ar putea folosi pentru corectarea lui Se şi Cu scrise cu majuscule, din exemplu de mai jos: "Cătanele mai vechi Se pregăteau de drum Cu un calm care dispreţuia orice semn de pripeală;" dacă am pune la caută: litera_mică - spaţiu - Cu - spatiu - litera_mică se înlocuieşte cu: litera_mică - spaţiu - cu - spatiu - litera_mică şi s-ar face înlocuirea lui "Se", respectiv "Cu" fără a afecta literele mici de la cuvintele din faţa şi de după aceste cuvinte...
Despre problemele de demarcare Am constatat că există un fundal, deoarece eu lucrez cu stiluri în Word şi mi-a apărut un stil secundar care "zicea" că are fundal alb, chit că nu se vedea nimic. Am încercat să modific acel stil... a încercat şi cu Clear Formatting, dar n-am reuşit să scap de el. E adevărat, nu am încercat să mai rulez cu o opţiune sau două prin AutoCorect să văd dacă se întâmplă ceva... Deocamdată nu e o problemă, pentru că pot scăpa de formatări încârcând textul în WordPad. Am să văd dacă mai apre problema si-ţi trimit textul în varianta rulat si nerulat prin AC.
Despre opţiunea de la 4. Nu cred că voi fi mai explicit acum. Să luăm opţiunea 4.3. Corectare cuvinte foarte scurte. Într-un fel sau altul în cod se spune ca programul să ruleze dicţionarele S1.imd, S2.imd, S3.imd şi S4.imd. [fiind ele cu particula CO_ sau CL_] M-ar interesa o opţiune similară, doar că acum nu ştiu câte dicţionare vor fi şi cum le va chema. Pot da doar numele primului dictionar care se va numi SM_celi.imd, ceea ce înseamnă că este vorba de secvenţe de la mijlocul cuvântelor [de aceea SM - secvenţă mijloc] si fac înlocuirile C > E şi L > I, între două consoane. Peste o săptămână aş mai putea adăuga un dicţionar care se va numi SF_mi.imd, ceea ce înseamnă că va cuprinde secvenţe de la sfârşitul cuvântului, adică de final [SF - secvenţă finală] şi se va ocupa de cuvintele scrise cu cratimă plus pronumele mi în forma -mi sau -mi-. Problema era următoarea: Se poate implementa opţiunea acum cu un singur dicţionar şi pe măsură ce mai termin unul sau dpouă să fie adăugate şi ele în cod. Altfel spus, modificarea codului pentru adăugarea de dicţionare este complexă? ori se face foarte uşor? Dacă modificarea este una foarte simplă, atunci putem să facem implementarea în trei-patru zile, pentru că voi definitiva primul dicţionar. Dacă modificarea implică mai multă muncă, atunci asteptăm până definitivez toate dictionarele. Acestea vor fi în număr de maxim 10.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven a scris:
*** Înlocuiri multiple. Da despre condiţia aia era vorba. Mă gândeam dacă o astfel de condiţie s-ar putea folosi pentru corectarea lui Se şi Cu scrise cu majuscule, din exemplu de mai jos: "Cătanele mai vechi Se pregăteau de drum Cu un calm care dispreţuia orice semn de pripeală;" dacă am pune la caută: litera_mică - spaţiu - Cu - spatiu - litera_mică se înlocuieşte cu: litera_mică - spaţiu - cu - spatiu - litera_mică şi s-ar face înlocuirea lui "Se", respectiv "Cu" fără a afecta literele mici de la cuvintele din faţa şi de după aceste cuvinte... |
Da, cu 3 "completari": 1. la "se inlocuieste cu" nu va fi nevoie de pus "litera_mica" la inceput si sfarsit deoarece, daca optiunea e bifata, va "sti" sa inlocuiasca doar in mijloc; 2. optiunea sa aiba "grosimea" marginilor fixa de cate un caracter sau variabila (poate chiar independente una de alta)? 3. trebuie gasit si un nume pentru aceasta optiune, ai vreo sugestie...?
Seven a scris:
Despre opţiunea de la 4. Nu cred că voi fi mai explicit acum. Să luăm opţiunea 4.3. Corectare cuvinte foarte scurte. Într-un fel sau altul în cod se spune ca programul să ruleze dicţionarele S1.imd, S2.imd, S3.imd şi S4.imd. [fiind ele cu particula CO_ sau CL_] M-ar interesa o opţiune similară, doar că acum nu ştiu câte dicţionare vor fi şi cum le va chema. Pot da doar numele primului dictionar care se va numi SM_celi.imd, ceea ce înseamnă că este vorba de secvenţe de la mijlocul cuvântelor [de aceea SM - secvenţă mijloc] si fac înlocuirile C > E şi L > I, între două consoane. Peste o săptămână aş mai putea adăuga un dicţionar care se va numi SF_mi.imd, ceea ce înseamnă că va cuprinde secvenţe de la sfârşitul cuvântului, adică de final [SF - secvenţă finală] şi se va ocupa de cuvintele scrise cu cratimă plus pronumele mi în forma -mi sau -mi-. Problema era următoarea: Se poate implementa opţiunea acum cu un singur dicţionar şi pe măsură ce mai termin unul sau dpouă să fie adăugate şi ele în cod. Altfel spus, modificarea codului pentru adăugarea de dicţionare este complexă? ori se face foarte uşor? Dacă modificarea este una foarte simplă, atunci putem să facem implementarea în trei-patru zile, pentru că voi definitiva primul dicţionar. Dacă modificarea implică mai multă muncă, atunci asteptăm până definitivez toate dictionarele. Acestea vor fi în număr de maxim 10. |
Am inteles acum, asta e simplu de implementat si de modificat ulterior. Uite exe de test: Deocamdata am denumit-o "4.6 Înlocuire secvenţe cuvinte", ii putem gasi un nume mai potrivit mai tarziu cand va fi terminata.
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Seven, Cosmin... Rularea punctuatiei in cadrul OCR_Plus pe setarile default, nu pare sa tina seama de setarile punctuatiei din cadrul configurarii executabilului.
Am inteles ca s-a dorit aparent ca cele 2 functii sa fie setate separat, nu? Punctuatia din program sa fie independenta de punctuatia din Ocr_Plus ca setari.
Dar optiunea "Majuscula la inceput de fraza - urmat de ?! urmat de spatiu" strica exact ceea ce avertizarea de dialog francez putea sa repare.
Exemplu:
"Domnul Enfield și avocatul treceau de cealaltă parte a străduței, și când ajunseră în dreptul intrării, primul îşi înălță bastonul arătând într-acolo. — Ai remarcat vreodată ușa aceea? întreba el, iar când însoțitorul său îi răspunse afirmativ, adăugă: Se leagă, în mintea mea, de o poveste foarte stranie. — Zău? spuse domnul Utterson, cu o ușoară schimbare a vocii. Și despre ce anume este vorba?"
va deveni:
"Domnul Enfield și avocatul treceau de cealaltă parte a străduței, și când ajunseră în dreptul intrării, primul îşi înălță bastonul arătând într-acolo. — Ai remarcat vreodată ușa aceea? Întreba el, iar când însoțitorul său îi răspunse afirmativ, adăugă: Se leagă, în mintea mea, de o poveste foarte stranie. — Zău? Spuse domnul Utterson, cu o ușoară schimbare a vocii. Și despre ce anume este vorba?"
Setarea "Majuscula la inceput de fraza - urmat de ?! urmat de spatiu" trebuie dezactivata implicit, pentru a lasa mana libera functiei de dialog francez. Celelalte setari din tabul Majuscula nu mai permit AC-ului sa ne avertizeze asupra situatiilor in care lipseste majuscula la inceput de rand. Avertizarea aceasta putea indentifica zonele cu text rupt, a notelor de subsol si a dialogurilor franceze.
P.P.S. Dupa ce am dezactivat primele 3 functii din tabul Majuscule, se pare ca nu le mai pot pune la loc. Ultima se bifeaza/debifeaza normal, dar primele 3 isi plimba bifa de la una la alta.
P.P.P.S. Am revazut tutorialele lui Seven. E lamurita treaba, dar de ce nu se pot pune setarile default ca in tutorialul lui Seven? Executabilul meu a deschis tabul de Majuscule cu toate bifele puse si de asta imi facea figuri.
Seven, am atras de multa vreme de faptul ca marcarile din AC par sa fie imposibil de scos din Word. Muta textul in Wordpad.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
La un moment dat am avertizat utilizatorii sa puna manual configurarea punctuatiei OCR Plus pe setarile implicite deoarece vor fi probleme cu setarile stocate in AutoCorect.ini. Poate asta se intampla la tine - seteaza-le pe implicite, daca mai fac probleme spune-mi...
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Un înger.cu patru brațe plutea lângă mine; deasupra mea, stelele.
Ignora "înger.cu"
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Multumesc ca mi-ai aratat, am rezolvat.
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Si mai este chestia cu 2 puncte:
Am plecat.. Am venit,..
Cazurile astea nu apar in punctuatie.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Se poate sa fi fost rulat pe dictionarele vechi. Dar nu e vorba de inlocuirea lor.
Exista sau nu in ortografia corecta acele situatii? Ma refeream doar la faptul ca Punctuatia din AC ignora situatiile cu pricina.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Daca semnalizeaza situatii de genul !? sau de genul ., de ce nu ar semnaliza si 2 puncte cu virgula intercalata? E adevarat ca asta apare doar la ocr-uri, totusi.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Ca să clarificăm: Discutăm numai despre OCR, fie Punctuaţie OCR_Plus, fie meniul OCR_Plus.
Eu nu am spus că nu trebuie semnalizate astfel de situaţii, ci doar că nu au fost ÎNCĂ implementate. Mai sunt câteva situaţii la care trebuie să cugetăm cum ar putea fi implementate, ca de exemplu: "două_puncte"-"punct"-"punct" adică :.. ar putea fi "două puncte"-spaţiu"-"ghilimele de început" adică : „ De fapt sunt mai multe situaţii: :.. :,. :., ce pot deveni : „
Iată un exemplu: Când se gândea la Sonia, el îşi zicea:..O să găsesc eu timp de dragoste şi mai târziu......” Când se gândea la Sonia, el îşi zicea:.,O să găsesc eu timp de dragoste şi mai târziu......” Când se gândea la Sonia, el îşi zicea:,.O să găsesc eu timp de dragoste şi mai târziu......”
Corect ar fi: Când se gândea la Sonia, el îşi zicea: „O să găsesc eu timp de dragoste şi mai târziu......”
Mă gândesc că astfel de situaţii nu sunt 100% sigure la corectat, deci nu ar trebui făcută modificarea automat, ci cumva cu aprobarea userului. Uneori succesiunea :.. ar putea fi chiar !... şi nu : „ Din cauza asta, mă gândesc eu, nu ar trebui făcute modificări automate.
Alte situaţii: !. >> ! >> !+spaţiu .! >> ! >> !+spaţiu ?. >> ? >> ?+spaţiu .? >> ? >> ?+spaţiu
Cred că aceste 4 situaţii pot fi implementate la Setări Punctuaţie OCR_Pus, tabul 2 Punctuaţia de bază, ca opţiune separată şi opţională.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven a scris:
*** Ca să clarificăm: Discutăm numai despre OCR, fie Punctuaţie OCR_Plus, fie meniul OCR_Plus.
Eu nu am spus că nu trebuie semnalizate astfel de situaţii, ci doar că nu au fost ÎNCĂ implementate. Mai sunt câteva situaţii la care trebuie să cugetăm cum ar putea fi implementate, ca de exemplu: "două_puncte"-"punct"-"punct" adică :.. ar putea fi "două puncte"-spaţiu"-"ghilimele de început" adică : „ De fapt sunt mai multe situaţii: :.. :,. :., ce pot deveni : „
Iată un exemplu: Când se gândea la Sonia, el îşi zicea:..O să găsesc eu timp de dragoste şi mai târziu......” Când se gândea la Sonia, el îşi zicea:.,O să găsesc eu timp de dragoste şi mai târziu......” Când se gândea la Sonia, el îşi zicea:,.O să găsesc eu timp de dragoste şi mai târziu......”
Corect ar fi: Când se gândea la Sonia, el îşi zicea: „O să găsesc eu timp de dragoste şi mai târziu......”
Mă gândesc că astfel de situaţii nu sunt 100% sigure la corectat, deci nu ar trebui făcută modificarea automat, ci cumva cu aprobarea userului. Uneori succesiunea :.. ar putea fi chiar !... şi nu : „ Din cauza asta, mă gândesc eu, nu ar trebui făcute modificări automate.
|
Cred ca ar merge ca sugestii. Sa spuna "Succesiune incorecta de caractere" ca la altele sau sa cautam alt mesaj?
Seven a scris:
Alte situaţii: !. >> ! >> !+spaţiu .! >> ! >> !+spaţiu ?. >> ? >> ?+spaţiu .? >> ? >> ?+spaţiu
Cred că aceste 4 situaţii pot fi implementate la Setări Punctuaţie OCR_Pus, tabul 2 Punctuaţia de bază, ca opţiune separată şi opţională. |
Probabil ar merge si acestea - la care dispare punctul...
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Cred ca e mai simplu sa fie puse toate doar ca atentionare in Punctuatia AC-ului sub mesajul "Succesiune incorecta de caractere".
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Deci ramane o optiune pentru "combinatiile de ?! si punct trec in ?! si spatiu"? Denumirea poate ar merge, desi unii posibil vor crede ca vor exista ? ! simultan in unele situatii... Sa pun si cele cu virgula - separat sau tot la aceeasi optiune?
Acele sugestii sa aiba optiune de bifat/debifat sau sa fie rulate implicit?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
N-am specificat unde anume, poate sa fie la Punctuatie OCR Plus, poate sa fie in meniul OCR Plus. Dar de fapt, daca ma gandesc bine, inclin putin spre meniu, deoarece tine un pic mai mult de erorile diin OCR si nu de punctuatia propriuzisa. Pe de alta parte, faptul ca ii trebuie fereastra separata pentru bife complica nitel setarea pentru utilzatorul obisnuit. Dar pe ansamblu cred ca e bine asa, in meniu cu fereastra.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Bun, asa facem.
La sugestii cum ramane - vor fi aratate implicit sau trebuie o optiune pentru ele la Config Punctuatie OCR Plus? Si daca e cu bifa, sa fie una singura pentru toate mentionate sau separate pentru fiecare? Sa fie bifate implicit sau debifate?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Nu sunt de acord cu introducerea ei la OCR. AC-ul poate fi rulat si pe texte ce nu necesita rularea OCR_Plus si a caror formatare nu se doreste pierduta. Si nu trebuie sa fie inlocuire, ci doar o trimitere la acel loc, asa cum e dialogul francez.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Deocamdata am sa introduc acea fereastra in meniu si vedem mai tarziu cu sugestiile... Oricum parca totusi ar merge mai bine sa fie puse la punctuatia obisnuita...
|
|
pus acum 12 ani |
|