Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
|
Lista Forumurilor Pe Tematici
|
Forum Romania Inedit | Reguli | Inregistrare | Login
POZE FORUM ROMANIA INEDIT
Nu sunteti logat.
|
Nou pe simpatie: Profil Ela 22 Cluj
| Femeie 22 ani Cluj cauta Barbat 22 - 48 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am mai implementat cateva meniuri + am mai facut cateva mici imbunatatiri la cele deja existente:
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Salutări tuturor! Cosmin, acum am văzut că ai postat o nouă versiune, aşa că nu am apucat să văd modificările.
Aveam o propunere pentru Opţiunea 7 şi voiam să-i cer părerea lui BlankCd.
În schema noastră ea apărea sub forma: ■ 7. Convertire linii de pauză 7.1. Înlocuieşte toate liniile de pauză: EmDash, EnDash, Horizontal Bar şi cratima în configuraţia "spaţiu""cratimă""spaţiu" - cu excepţia celor puse ca linie de dialog ["marcaj sfârşit de paragraf""linie dialog"] în EmDash. Adică din"spaţiu""linie de pauză - oricare ar fi ea""spaţiu" sau "spaţiu""cratimă""spaţiu" în "spaţiu""EmDash""spaţiu. 7.2. Înlocuieşte toate liniile de pauză: EmDash, EnDash, Horizontal Bar şi cratima în configuraţia "spaţiu""cratimă""spaţiu" - cu excepţia celor puse ca linie de dialog ["marcaj sfârşit de paragraf""linie dialog"] în EmDash. Adică din"spaţiu""linie de pauză" – oricare ar fi ea"spaţiu" sau "spaţiu""cratimă""spaţiu" în "spaţiu""EnDash""spaţiu". 7.3. Înlocuieşte toate liniile de pauză: EmDash, EnDash, Horizontal Bar şi cratima în configuraţia "spaţiu""cratimă""spaţiu" - cu excepţia celor puse ca linie de dialog ["marcaj sfârşit de paragraf""linie dialog"] în EmDash. Adică din"spaţiu""linie de pauză – oricare ar fi ea""spaţiu" sau "spaţiu""cratimă""spaţiu" în "spaţiu""Horizontal Bar""spaţiu". Mă gândeam că ceea ce scrie la 7.1, 7.2 şi 7.3 sunt de fapt explicaţii şi cerinţe, dar meniul poate apărea prescurtat, sub forma: ■ 7. Convertire linii de pauză: 7.1. Înlocuieşte toate liniile de pauză cu "EmDash" 7.2. Înlocuieşte toate liniile de pauză cu "EnDash" 7.3. Înlocuieşte toate liniile de pauză cu "Horizontal Bar".
Simplificând şi mai mult, se poate ajunge la o singură opţiune cu 3 variante de setare şi ar putea fi rescrisă sub forma: ■ 7. Înlocuieşte toate liniile de pauză cu: □ "EmDash" □ "EnDash" □ "Horizontal Bar"
Eu aşa am înţeles opţiunea şi sper că am înţeles bine. Aş vrea să ştiu părerea lui BlankCd despre această modalitate de interpretare.
Revin după ce mă documentez în legătură cu ultima versiune de AutoCorect.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Hmm, ciudat, poti te rog sa-mi trimiti acel text?
PS: am incercat chiar si cu rtf de 6 MB, se incarca in mai putin de 5 secunde. Sunt curios cum va merge cu acel text care l-ai mentionat.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Multumesc. Am testat cu Test1. Da, la acest fisier se incarca foarte greu. E ciudat fisierul: am incercat sa-l deschid in Office2010; l-a deschis greu si are 2 pagini din care una cu text si alta goala. 6,7 MB pentru o pagina de text? Daca nici Office nu mi-l deschide bine o fi ceva in neregula cu el, cine stie.. Sau o fi avand un format nonstandard...
Acu am testat si cu Wordpad - il deschide bine. Concluzia e ca are ceva in el (la partea de formatare) care face ca Office si AutoCorect sa le deschida greu si sa nu le vada bine dar la programele care ignora o parte din formatare se incarca bine.
PS: si o alta chestie ciudata: toate documentele care le primesc in acest topic Word mi le deschide in mod protejat.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am observat si altceva: in textele care se incarca normal sunt cateva mii de zone de formatari, in acest text sunt 73 000 de zone. E foarte "fragmentat". O sa incerc sa facem ceva ca acest text sa fie prelucrat mai rapid dar pina atunci poate ar fi mai bine sa fie utilizate texte mai simple pentru testare... Intre timp am rezolvat cu mesajul de eroare la salvare - dura asa de mult incarcarea ca se declansa salvarea automata dar nu avea ce sa salveze...
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Dupa ce am trecut acest text prin "Setare text la font si marime unica" a mers mult mai usor salvarea si incarcarea...
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
Am observat si altceva: in textele care se incarca normal sunt cateva mii de zone de formatari, in acest text sunt 73 000 de zone. E foarte "fragmentat". (.......) |
De fapt, la astfel de formatări ne refeream când am propus opţiunea 1.2. Setare text la font şi mărime unică, regular + italic + bold. Când vorbeam de diferite tipuri de spaţieri ne refeream la spaţierea caracterelor şi nu la spaţiul dintre rânduri.
Practic, noi parcurgeam următoarele etape înainte de rularea prin AuroCorect: - salvare din Abbyy în format RTF - Formatted text; - deschis RTF-ul în Word şi salvat în format DOC - această salvare reducea mărimea fişierului [în cazul de faţă de la 6 MO la 2 MO]. - deschis fişierul DOC în Word şi anulat formatări Superscript, Superscript, Underline şi de multe ori şi Bold, prin mişcarea: Select All, apoi acţionând de câte două ori butonul Superscript, mai întâi pentru setarea întregului text ca Superscript, apoi pentru anularea întregii formatări. Practic prin cele două comenzi dispăreau zonele de text scrise cu Superscript. În același mod scăpam și de Superscript, Underline şi eventual de Bold. După toate acestea salvam din nou în format RTF. - deschis fişierul RTF cu WordPad şi formatat tipul fontului şi mărimea lui, apoi salvat în format RTF, dar sub un nume nou; cu această ocazie dispar toate acele formatări de font expandat la diferite valori, ori condensat.... etc.
De abia acest ultim rtf era acela pe care începeam să-l prelucrăm în AutoCorect. Cred că deocamdată trebuie menţinută ordinea acelor etape.
LE: N-am văzut ultima postare. Trebuie să recunosc faptul că nu am folosit această opţiune, dar încer acest lucru din nou.
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
A, inca n-am pus vizualizare progres "Setare text la font si marime unica" deci va sta deocamdata ceva timp fara sa para ca face ceva pentru acest text ca sa-l "uniformizeze".
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
O sa implementez asta atunci...
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Nu prea ar fi o diferenta efectiva dar e posibil sa para mai "suportabila" de catre utilizator. Deocamdata alt detaliu: in meniul de la AutoCorect intra putin in Font >> Interval si vezi care optiuni de acolo trebuie sa fie implementate in conversie pentru ca textul sa iasa cat mai uniform. Deja am implementat "Interval" (e spatierea ce se seteaza in pixeli in AutoCorect) si iese textul mai bine.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am adaugat acestea, dar am lasat deocamdata doar intervalul sa fie setat in interfata, celelalte sunt setate intern automat pe acele valori. Daca crezi ca la celelalte va fi vreodata nevoie sa fie setate in interfata le voi adauga.
Veste buna: am reusit sa rezolv problema cu viteza de incarcare la acel rtf: acum la mine il incarca in cateva secunde in loc de cateva minute. S-a accelerat si "uniformizarea" textului - acu lucreaza in cateva secunde pe acel rtf. Poti te rog sa testezi daca merge bine si la tine? Multumesc.
PS: am uitat sa mentionez ca am facut si transformarea marcatorilor de tip dialog in EMDash.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Downloadat, instalat, probat... Merge excelent. Am probat un OCR brut extras direct din Abbyy, fără niciun fel de prelucrare şi rulează foarte bine. Cel mai tare m-a surprins viteza la de la opţiunea de formatare. Ieri, chiar voiam să propun renunţarea la opţiune, pentru că am crezut că va merge foarte greu să reformateze mii de zone de de text... Am văzut că s-a rezolvat şi transformarea marcatorilor de tip dialog-bullets in EMDash.
Acum... nu ştiu la ce v-aţi gândit voi că ar trebui să fie următorul pas... Practic, la implementarea opţiunilor legate de liniile de pauză, eu nu am prea multe idei, speranţa în detalii la aceste opţiuni este la BlankCd şi menssana, care au avut propuneri şi iniţiative de mai mult timp în zona asta...
Eu sunt în faza în care încerc dă actualizez structura opţiunilor şi să urc ultima variantă a "MENIU OCR_PLUS", un fel de versiune 0.4 M-am gândit şi la o regrupare a opţiunilor, astfel încât acestea să se împartă în 4 sau 5 grupuri de opţiuni şi nu în 10 sau 11 câte erau. Mă gândeam ca meniul final să nu fie unul cu o singură comandă şi foarte multe setări, ci unul în care se dă o singură comandă pentru un astfel de grup de opţiuni. Patru sau cinci comenzi nu ar fi multe şi ar fi mai uşor de structurat.
Problema este următoarea: O nouă restructurare a opţiunilor mai este posibilă? sau ar da peste cap munca de programare făcută până acum? asta ca să ştiu dacă mai e cazul să mai abordez problema...
Toate cele bune! Seven
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Nu e asa mare problema - oricum stiam ca se va mai discuta si vor mai fi facute modificari la acestea. Discutati intre voi si cand veti ajunge la un consens in privinta 0.4 voi modifica. Pina atunci v-as ruga sa testati si functiile deja implementate pentru a "rafina" codul. Daca gasiti vreo problema respectiv daca aveti vreo idee de imbunatatire ar fi bine sa dati chiar un exemplu ca sa ma pot lamuri mai repede despre ce e vorba.
O sa ma apuc si sa implementez cele care au mai ramas: - Convertire linii de pauza; BlankCD, esti de acord cu denumirile care le-a dat Seven? - transformare "Marcare ghilimele cu rosu" in "Marcare caractere cu rosu" - daca toti vor fi de acord ca va fi folositoare.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
|
pus acum 13 ani |
|
|
Sugestii:
AC-ul ar trebui sa dea un mesaj de eroare... pe undeva pe acolo... legat de prezenta in text a ambelor tipuri de diacritice. Poate fi pusa ca eroare la punctuatie sau ca fereastra de eroare separata ON TOP ce apare la rularea optiunii de ortografie. AC-ul nu zice nimic de existenta celor doua, deoarece ambele sunt corecte pentru el. Si desi solutia e la un clik distanta, optiune de convertire diacritice, daca nu stim de existenta problemei tindem sa o ignoram solutia.
Optiunile legate de liniute, pe care le discutati mai sus, sper sa fie personalizabile. Daca eu vreau sa folosesc in loc de Horizontal Bar EmDash, sa nu trebuiasca sa inlocuiesc inca odata, ci doar sa bifez optiune cu pricina dintre cele 3,4 sau cate or fi.
Cosmin, la Word 2010, orice document ce nu provine de pe sistemul tau, e deschis doar in Read Mode si trebuie sa ii dai Enable Editing. Fisierul are provenienta necunoscuta si din motive ce tin de securitate Word-ul actioneaza asa.
Modificat de menssana1984 (acum 13 ani)
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Mesaj de eroare cred ca e prea mult, mai degraba un mesaj de atentionare. AutoCorect le considera bune pe amandoua deoarece deocamdata ambele sunt considerate bune. Nu cred ca e corect ca noi, programatorii care l-am facut, sa impunem folosirea unui tip sau a altuia. E cam dificil de gasit o functie la care sa "atasam" acst mesaj. Nu are legatura cu punctuatia si nici nu cred ca ar avea legatura cu ortografia (care e depre altceva). Recomandarea mea e, daca se decide ca trebuie sa fie musai un anumit tip de diacritice, sa fie rulata intodeauna functia de conversie in butonul ce va rula functiile de la OCR Plus.
Da, vor fi personalizabile, la fiecare in lista de functii (in acel buton ce le ruleaza pe toate) se va putea bifa sau debifa.
|
|
pus acum 13 ani |
|
|
Nu trebuie sa se forteze folosirea unui anumit tip de diacritice. Ci doar atentionarea utilizatorului care va fi liber sa foloseasca functia de convertire deja existenta. Un mesaj de atentionare imediat dupa incarcarea textului e suficient.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
menssana1984, Vrei neapărat ca AC să facă verificarea tipurilor de diacritice şi să-ţi dea un mesaj din care să rezulte ce fel de diacritice a găsit? Sau... ar putea exista si varianta în care să zicem că a "n" opţiune ar fi ceva care s-ar putea numi: "Stabileste format diacritice: □ cu sedila □ cu virgula " şi la această opţiune să fii obligat să alegi una dintre variante?
În acest mod s-ar executa praxtic convertirea tuturor diacriticeleor într-un format sau altul, după dorinţa fiecăruia dintre utilizatori. Aceste funcţii există deja în AutoCorect şi am face doar o trimitere din interfaţa meniului OCR_PLUS. Posibil să spun vreo prostie prin argumentaţia asta... eu cu programarea... mai slăbuţ... doar la stomatalog şi la cardiolog mă programez din când în când, dar nu merg niciodată... Lăsând gluma deoparte, cred că varianta asta ar fi mai uşor de implementat... mergând pe paralelismul cu punctuaţia care deja există, dar mai apare şi în meniul "OCR_PLUS", probabil în acelaşi mod ar putea fi adusă şi comanda de convertire diacritice şi poate că ar merge adăugată chiar la primul grup de opţiuni "Convertiri preliminare".
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
Silva
Moderator
Inregistrat: acum 18 ani
|
|
Mutat la cerere!
_______________________________________ "In politica, prostia nu este un handicap". - Napoleon Bonaparte
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Unde se găseşte şi ce este AutoCorect? Se găseşte pe pagina: softset.ro şi el este un program gratuit, foarte puternic, specializat în corectarea textelor. Multe detalii despre programul AutoCorect găsiţi aici .
Ce este AutoCorect versiune pentru Romania-Inedit? De aproape trei luni, autorii programului au venit pe forumul nostru cu intenţia de a dezvolta programul AutoCorect, astfel încât el să ajute cât mai mult pe cei ce participă la digitalizarea cărţilor. Astfel a apărut AutoCorect versiune pentru Romania-Inedit. Între timp au fost realizate peste 25 de versiuni de AutoCorect speciale pentru forum, fiecare versiune aducând îmbunătăţiri faţă de precedenta. Menţiune specială: cele mai noi versiuni ale AutoCorect apar mai întâi pe forum şi mult mai târziu pe Site-ul programului.
Ce face AutoCorect versiune pentru Romania-Inedit? Cel mai simplu răspuns: prelucrează un OCR BRUT [aşa cum rezultă el din programul Abbyy], astfel încât după rularea opţiunilor special implementate, rezultă ceea ce numim pe forum "OCR-ul perfect" sau OCR versiune [V0.9]. Practic, la varianta consacrată a programului AutoCorect s-a adăugat un meniu special, numit OCR_Plus, care cuprinde un număr de pachete de opţiuni, astfel cum se vede în următoarea imagine:
Să detaliem puţin opţiunile, deşi denumirea lor este în majoritatea cazurilor suficient de sugestivă:
■ Pachetul de opţiuni nr.1 - CONVERTIRI PRELIMINARE - vezi imaginea de mai jos - cuprinde opţiunile: Convertire dialog bullets în dialog text Setare text la font şi mărime unică [setează tot textul cu font şi mărime unică, păstrând stilurile regular, italic şi bold; uniformizează toate formatările de text expandat şi text condensat la text normal; opţiunea face şi alte formatări] Eliminare spaţii la început de paragraf
■ Pachetul de opţiuni nr.3 - PUNCTUAŢIE Acest pachet de opţiuni rulează meniul clasic al Punctuaţiei şi în plus faţă de acesta alte opţiuni; iată submeniul: Funcţiile obişnuite Convertire virgule duble în ghilimele Convertire trei puncte de suspensie în elipsis orizontal Marcare ghilimele cu roşu
■ Pachetul de opţiuni nr.5 - CORECTARE RÂNDURI - cuprinde două opţiuni Repararea rândurilor rupte Rupere rânduri care încep cu dialog aflate în interiorul paragrafului.
■ Pachetul de opţiuni nr.6 - CORECTARE CARACTERE REPRODUSE ERONAT Acest pachet, cuprinde o serie de opţiuni care corectează diferite erori pe care le face Abbyy în procesul de recunoaştere a caracterelor şi realizarea OCR.
Pachetele de opţiuni nr.7, 8 şi 9 sunt în curs de implementare. Alte opţiuni, care nu conţin submeniuri nu au fost prezentate, deoarece numele lor este suficient de sugestiv. De altfel, şi o parte dintre opţiunile sumar prezentate, au la dispoziţie o serie de setări despre care nu am făcut vorbire.
Autorii programului, Cosmin şi Daniel, intenţionează ca după implementarea tuturor opţiunilor, acestea să fie rulate automat la o singură comandă ori a unui număr de 4-5 comenzi, câte una pentru fiecare pachet de opţiuni. Intentionăm ca opţiunile implementate în structura actuală să fie reorganizate, astfel încât în meniul OCR_Plus să rămână mai puţine pachete, care să cuprindă fiecare dintre ele un număr de opţiuni mai mare decât acum. Deocamdată atât. Toate cele bune!
A!... şi o menţiune foarte importantă: programul AutoCorect - varianta din 16.11.2011, postată de Cosmin pe pagina anteriaoră a topicului, nu este funcţională în forma în care se instalează. O parte dintre opţiuni funcţionează prin rularea unor dicţionare de "Înlocuire multiplă", care au fost lucrate pe forum... şi este necesar să le dezvoltăm împreună... dar, despre asta discutăm mâine, pentru că şi mâine mai este o zi...
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
- Convertire linii de pauza; BlankCD, esti de acord cu denumirile care le-a dat Seven?
|
Da sunt de acord cu redenumirea, dar mai am si alte propuneri, mai exact condensarea/comprimarea unor submeniuri - pentru a scapa de multitudinea de submeniuri.
- meniul 6 mai exact comprimarea submeniurilor 6.1 pana la 6.8 inclusiv tot sub numele meniului adica "CORECTARE CARACTERE REPRODUSE ERONAT". Nu are rost sa avem atâtea submeniuri mai ales că aceste submeniuri de la 6.1 pana la 6.8 se vor rula automat în pachetul "Basic".
- meniul 9 mai exact TOATE submeniurile trebuiesc comprimate sub meniul "Elimină TOATE liniile de pauză din text - cu excepţia liniilor de dialog."
Dacă sunteţi de acord, înseamnă ca acest lucru reprezintă primul pas pentru uşurarea folosirii meniului OCR_PLUS. Înainte de a comprima este bine ca Cosmin să scrie undeva într-un fişier word, ce şi cum funcţionează aceste meniuri, care este rolul lor, pentru ca ulterior să-i vina uşor să modifice ceva şi mai ales pentru că va trebui scris în Help-ul programului ce face fiecare meniu al meniului OCR_PLUS. Explicarea această din Help va trebui făcută amănunţit pentru a lămuri eventualele dubii ale userilor. Deocamdată nu am făcut teste, am ceva probleme personale de rezolvat.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
lastiz
Membru Gold
Inregistrat: acum 14 ani
|
|
Se poate şterge.
Modificat de lastiz (acum 13 ani)
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
lastiz, ataseaza te rog fisierul ca sa pot testa si sa vad care e problema.
|
|
pus acum 13 ani |
|
lastiz
Membru Gold
Inregistrat: acum 14 ani
|
|
Se poate şterge.
Modificat de lastiz (acum 13 ani)
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Multumesc. Din ce vad eu sunt niste marcatori mai ciudati care sunt afisati corect doar in Word (in Wordpad sunt vazuti ca cerculete pline, nu liniute). O sa investigam sa vedem daca este vreo solutie.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Când m-am referit la reorganizarea sau la restructurarea meniului pe pachete de opţiuni, aveam în vedere aspectele pe care le sesizează BlankCd, adică simplificarea, comprimarea meniului...
Concret, la actualul meniu 6 "CORECTARE CARACTERE REPRODUSE ERONAT", mă gândeam că e bine să rămână toate submeniurile, dar comanda să fie unică; să se realizeze cu o singură apăsare pe butonul "Execută".
Am încercat să redau ceva aproximativ în imaginea de mai jos; nu ştiu în ce măsură se vor vedea detaliile, dar după afişarea imaginii, am să revin în postare şi, eventual, să explic ceea ce nu se vede suficient de clar.
E clar... nu se văd detaliile. Am vrut ca fiecare obţiune din submeniu să aibă un buton de activare, care poate fi activat sau nu. În imagine toate erau activate, dar culoarea verde pe care am folosit-o ca bifă este aproape invizibilă. Practic după activarea sau nu a fiecărei opţiuni, prin apăsarea butonului execută, ar putea ca tot pachetul de opţiuni să fie rulat. Cred că este important ca această fereastră să existe şi în continuare... şi nu să se reducă tot pachetul doar la o singură opţiune de meniu fără detalii. Părerea mea.
Important este de ştiut un lucru: AotoCorect pleacă de la setări default sau poate salva setările de meniuri şi submeniuri folosite de un user? Eu am constatat că la Punctuaţie păstrează exact ceea ce am setat eu, dar nu ştiu sigur dacă acest aspect este valabil în tot programul...
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
La componentele de programare care trebuie sa le folosim nu putem pune decat meniuri standard. Cele nonstandard sunt oricum si greu de facut si/sau costa (nu sunt la liber) Adica nu se poate implementa o bifare/debifare fara sa dai click pe tot meniul. Iar daca dai click pe tot meniul se va activa functia din acesta. Deci ori se ramane pe felul cum e implementat acu si se face un buton ce va afisa o fereastra cu lista de meniuri si poti alege ce sa ruleze si in ce ordine, ori transformam in meniuri bifabile, renuntam la rularea functiilor din ele cand dai click direct, dar cand se da click pe acel buton special va rula functiile asociate cu meniurile bifate.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
(.....) Deci ori se ramane pe felul cum e implementat acu si se face un buton ce va afisa o fereastra cu lista de meniuri si poti alege ce sa ruleze si in ce ordine, ori (.....) |
Bineînţeles că asta e varianta cea mai bună şi pe asta o alegem.
Îmi cer scuze!... Credeam că e o chestie care se poate face ca la fereastra cu setările de la repararea rândurilor rupte... Nu m-am gândit că e de fapt cu totul şi cu totul altceva... Asta e... Ce să-i faci?... Moşu' şi programarea = Baba şi boxu'.
Oricum, şi în cazul ăsta, cred că se mai pot organiza un pic opţiunile pe pachete, deoarece unele opţiuni sunt obligatorii pentru toată lumea, iar altele la alegere... şi, pe de altă parte ordinea rulării este foarte importantă.
Am încercat să mai grupez un pic din opţiuni, care au cât de cât o legătură logică între ele, aşa că revin la aspectul ăsta. Mă gândeam că opţiunea cu repararea rândurilor ar fi una obligatorie pentru fiecare utilizator [mă refer la ambele obţiuni, atât repararea rândurilor rupte, cât şi ruperea rândurilor eronat lipite]. În plus trebuie făcută undeva la începutul procesării. De aceea mă gândeam că ar putea fi încadrate în primul pachet "Convertiri preliminare", ca opţiunile numărul 1.4 şi 1.5
Pe de altă parte mă gândisem să grupăm într-un singur pachet, numit "Setări linii de pauză" toate opţiunile care apărea la opţiunile 7, 8 şi 9, deoarece toate aceste opţiuni sunt cumva legate de linia de pauză.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
lastiz, cum ai obtinut acei marcatori? Erau pusi de Abby cand ai scanat textul, textul respectiv a fost modificat de altcineva sau i-ai adaugat tu...?
|
|
pus acum 13 ani |
|
lastiz
Membru Gold
Inregistrat: acum 14 ani
|
|
Se poate şterge.
Modificat de lastiz (acum 13 ani)
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am inteles. Am discutat cu un specialist in formatare doc-uri si a mentionat ca astfel de marcatori sunt nonstandard si rar folositi. Functia din meniul respectiv are deja implementati marcatorii standard; o sa incercam in viitor sa implementam si pe acestia nonstandard dar oricum nu va fi usor...
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
Meniul "Convertire linii de dialog" propus de mine este in lucru? Nu l-am vazut inca in OCR_PLUS.
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
|
Seven, ceea ce spui tu are sens doar in cazul unui ocr. Nu cred ca daca ai avea un text la 2.0 te-ai apuca sa rulezi optiunile de ocr pe el, sau ai face-o? Mmmm.... afecteaza formatarea cumva?
In fine, dupa cum am zis, solutia la problema exista, dar nu cred ca sunt prea multi cei care atunci cand deschid un text in AC sa ruleze pentru orice eventualitate optiunea de convertire a diacriticelor. Chestia asta e doar un mic pas pentru perfectionarea textului.
Nu consider asta o prioritate. Poate fi adaugata in cadrul meniului de ocr, asa e, dar eu aveam in vedere acele documente trecute de stadiul de ocr.
Legat de problema ce se discuta mai sus...
In teorie, pe un ocr pe care s-a inlocuit toate liniutele cu cratima, linia de dialog s-ar obtine asa:
^p cratima spatiu
inlocuit cu
^p Emdash^S
Dar... nu este neaparat ca semnul de dupa cratima sa fie spatiu simplu, asa cum se obtine din Space. Am avut multe documente la care inlocuirea era zero din cauza ca dupa cratima era cine stie ce simbol obscur. Problema o rezolva cu copy/paste a cratimei si a spatiului de dupa, in felul asta inlocuirea avea loc.
Modificat de menssana1984 (acum 13 ani)
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
BlankCD, probabil vorbesti de 6.6 Corectare linii de dialog, nu? Daca da, am discutat cu Seven sa fie utilizat acolo Dld.imd (care pina acum e la 2) iar la 2 sa mai fie discutat cate ceva.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Subiectul discuţiei: Opţiunea 2. Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text
Practic, dicţionarul care rula la această opţiune era cel lucrat pentru opţiunea 6.6 "Convertire linii de dialog", deoarece eu am pus la toate înregistrările ca AC să caute doar la început de paragraf. În concluzie opţiunea 6.6 "Convertire linii de dialog" va fi funcţională la următoarea versiune; Cosmin a făcut modificările de rigoare. Aici e rezolvată. Pe parcurs vom mai adăuga în dicţionar eventuale exemple care nu au fost înregistrate până acum.
Rămâne de diacutat opţiunea 2. Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text. Ea este în realitate neimplementată. Problema este următoarea: când zicem ".... şi din text" ne referim la liniuţe în afara celor de dialog, adică la liniuţele de pauză? în sensul că cele de dialog sunt la începutul paragrafului, deci nu în text, iar linuţele de pauză sau explicative sunt în interiorul textului? ...Sau trebuie înţeles că trebuie eliminate "răgăliile" din tot textul, indiferent unde s-ar afla, şi nu doar cele aflate lângă diferite liniuţe? Altfel spus, să ştergem absolut toate artegactele din text?
Sunt două probleme: - una se referă la modul de rezolvare; dacă vorbim doar de linii de dialog sau de pauză, problema este rezolvabilă în procent rezonabil prin rulare de dicţionare de tip imd. Dacă vrem să diapară toate artefactele, indiferent unde s-ar afla, atunci este nevoie de cod, şi după câte am discutat, este vorba de un cod complex.
- a doua problemă se referă la oportunitatea stergerii sau nu a artefactelor în totalitate; aici părerile sunt împărţite...
Din aceste motive supun discuţiei problema complexităţii opţiunii cu eliminarea răgăliilor... cât de mult să ştergem dintre ele.
LE: Am urcat o nouă variantă de meniu, dar nu ştiu dacă mai e prea bună... MENIU OCR_PLUS - PRESCURTAT [V0.4].doc
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
O intrebare despre 7.3 in varianta de meniu 0.31 (care a devenit 5.3 in varianta 0.4): Horizontal Bar va fi pusa ca "Horizontal Bar" pur si simplu sau ca marcator ce include "Horizontal bar"? Indiferent ce se alege, se poate arata un mic exemplu intr-un doc? Multumesc.
|
|
pus acum 13 ani |
|
lastiz
Membru Gold
Inregistrat: acum 14 ani
|
|
Se poate şterge.
Modificat de lastiz (acum 13 ani)
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
lastiz, BlankCD a facut acest text cu exemple de marcatori care trebuie inlocuiti: Deocamdata aceste 4 tipuri prezentate sunt implementate. Daca textul care l-ai mentionat are tipuri standard care nu au fost implementate inca, le voi adauga rapid, asta e usor...
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Multumesc, Seven. Am implementat si 7 (care acum e 5):
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
Am făcut un mini test pe un OCR - Vanatorul de cerbi - acelasi OCR pe care a testa si lastiz. Probleme observate:
1. Liniile de dialog au dupa ele "spatiu" sau Tab. Corect este: "marcaj de sfârşit de paragraf""linie de dialog""spatiu NESEPARATOR"
2. Am evidentiat cu roşu răgăliile din text care ar trebui şterse automat, sunt peste 500 de astfel de răgălii.
Aici este fişierul:
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
BlankCd a scris:
---> 1. Liniile de dialog au dupa ele "spatiu" sau Tab. Corect este: "marcaj de sfârşit de paragraf""linie de dialog""spatiu NESEPARATOR |
Despre ce anume functie e vorba, cumva "Convertire dialog bullets in dialog text"? Nu e greu sa o fac sa inlocuiasca cu "[linie de dialog]^s".
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
Nu ştiu de unde a apărut problema, efectiv am rulat toate opţiunile şi la final am văzut rezultatul. Probabil codul nu modifică din "linie de dialog""tab" în "linie de dialog""spaţiu neseparator"
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Inteleg, dar calea logica de rezolvare e sa verifici intai daca inainte nu le avea iar dupa aceea sa rulezi fiecare functie (care ar avea potential sa genereze asemenea problema) separat si sa vezi daca apare. La "Convertire dialog bullets in dialog text" nu implementasem deoarece nu am vazut precizat undeva sa fie spatiu neseparator.
Acum am vazut ce ai modificat: de regula nu modific tab-ul sau spatiul obisnuit in spatiu neseparator decat daca se specifica expres sa fie facut asta. Motivul este ca nu vreau sa stric "apele" celor care vor tab sau spatiu obisnuit acolo, e alegerea lor.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
Tabul de după linia de dialog există şi în textul netrecut prin OCR_PLUS, asta înseamnă că tabul a trecut prin toate etapele fără a fi convertit în spaţiu neseparator. Pentru o bună estetică a textului, după linia de dialog trebuie să existe spaţiu neseparator. Dacă după linia de dialog este doar spaţiu, atunci acest spaţiu este fluctuant, mai mic sau mai mare, în funcţie de câte cuvinte sunt pe rând. Tab-urile si spaţiile de după linia de dialog ar trebui înlocuite cu spaţiu NESEPARATOR.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, asa cum am spus AC face conversie doar daca se specifica expres asta. Daca se ajunge la un consens ca una sau mai multe functii din OCR Plus sa o faca, o voi implementa.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** 1. Mă gândesc că ar fi bine ca undeva la începutul procesării, toate taburile, indiferent de poziţia lor în text, să fie transformate în spaţii. Din testele făcute pe parcurs, rezultă că multe probleme constatate la rularea unora dintre opţiuni, au fost legate într-un fel sau altul de existenţa taburilor.
2. Aş vrea să propun ca spaţiul neseparator [bănuiesc că se face referire la cel numit şi Nonbreaking Space] să nu fie luat în calcul în etapa de curăţare a OCR, deoarece ar fi nevoie ca multe comenzi şi dicţionare să fie revizuite.
Personal folosesc convertirea linilor de dialog urmată de spaţiu în Em dash urmat de Nonbreaking Space, dar acest lucru îl fac undeva după terminarea corecturii pentru versiunea [V1.0]. Deoarece pe timpul acestei corecturi manuale, mai apar situaţii în care se vor adăuga linii de dialog la paragrafe la care Abbyy nu a făcut recunoaşterea... etc... etc... la sfârşitul corecturii, vor exista oricum situaţii de dialoguri ce trebuiesc convertite, chiar dacă acest lucru s-a făcut încă din faza precorecturii OCR.
Din acest motiv, propun ca deocamdată să nu fie luat în calcul Nonbreaking Space în etapele de curăţare a OCR. Pentru cine doreşte să facă această convertire înainte de corectură, comanda de înlocuire este simplă; de altfel, după ce se termină procesarea tuturor opţiunilor din OCR_Plus, vor rămâne încă multe înlocuiri ce trebuie făcute cu confirmare pentru fiecare caz în parte... aşa că încă o comandă în plus, contează foarte puţin.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
@ Seven s-ar putea implementa înlocuirea tab-urilor cu spaţii în meniul "Convertire linii de dialog" încă neimplementat, adică meniul acela care converteşte linia de dialog EmDash în Horizontal bar.... Meniul este pus de mine în propunerea mea de meniu OCR în urmă cu vreo 2-3 pagini.
SAU
O altă soluţie este înlocuirea tab-ului cu spaţiu în meniul actual "Convertiri preliminare". Ulterior la implementarea "meniului Convertire linii de dialog" - care va fi pus undeva la sfârşitul OCR_PLUS - spaţiul de lângă linia de dialog va fi schimbat în spaţiu neseparator.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Mă gândeam că înlocuirea "Tab = Spaţiu" ar trebui făcută cât mai la începutul procesării. E foarte bine de făcut la "Înlocuiri preliminare" Aici avem trei opţiuni: 1.1. Convertire dialog bullets în dialog text 1.2. Setare text la font şi mărime unică 1.3. Eliminare spaţii la început de paragraf Cu primele două nu are nicio legătură şi cred că nici nu le afectează în vreun fel.
Mă gândesc dacă nu s-ar putea implementa în cea de-a treia; de altfel, ca această opţiune să ruleze perfect, ar trebui ca prima ei comandă să fie acestă convertire şi mai apoi cea de ştergere a spaţiilor aflate la început de paragraf.
LE: Dacă la prima opţiune "Convertire dialog bullets în dialog text" în cod se ia în calcul atât caracterul bullets cât şi tipul de spaţiu ce urmează după el, atunci poate că ar trebui ca mai înainte să fie implementat aici "Tab = Spaţiu"
Oricum, sunt două aspecte de clarificat: ■ primul aspect: suntem cu toţii de acord că Taburile trebuie transformate în Spaţii, indiferent unde s-ar afla în text şi că acest lucru trebuie făcut cât mai la începutul procesării? Este foarte important de ajuns la comun acord cu acest aspect, pentru ca, în continuare Cosmin şi Daniel să poată face modificarea.
■ al doilea aspect: implementarea depinde de Cosmin şi Daniel: ei ştiu cel mai bine cât de greu se face această implementare şi unde ar fi mai indicat să fie făcută.
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
Cam aşa, nu?:
1.1. Convertire dialog bullets în dialog text 1.2. Setare text la font şi mărime unică 1.3. Convertire tab în spaţiu 1.4. Eliminare spaţii la început de paragraf
sau comprimarea 1.3 cu 1.4 în care "Convertire tab în spaţiu" să ruleze primul apoi "Eliminare spaţii la început de paragraf"
L.E. Seven este de la sine înţeles că nu poţi avea şi tab şi spaţiu într-un text - aşa cum am arătat în fişierul pus anterior, amândoi ştim ca tab-urile nu au ce căuta într-un astfel de text - ba mai mult este posibil ca la convertirea în alte formate tab-urile să aducă erori. Meniul OCR_PLUS trebuie să înlocuiască tab-urile cu spaţiu.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Ca sa ma lamuresc cum sa implementez: toate tab-urile din orice parte a textului sa fie transformate in spatii neseparatoare?
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
Ca sa ma lamuresc cum sa implementez: toate tab-urile din orice parte a textului sa fie transformate in spatii neseparatoare? |
NU. Trebuiesc transformate in spatiu. Ulterior meniul "Convertire linii de dialog va înlocui spatiul de după linia de dialog în spaţiu NESEPARATOR.
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Bine, voi implementa asa. Acum, cu privire la "forma" de implementare: parerea mea e ca e mai bine sa fie pus ca meniu separat deoarece cei care vor utiliza OCR Plus vor intelege mai bine ce va face.
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
Bine, voi implementa asa. Acum, cu privire la "forma" de implementare: parerea mea e ca e mai bine sa fie pus ca meniu separat deoarece cei care vor utiliza OCR Plus vor intelege mai bine ce va face. |
Păi unii nici nu ştiu ce-s alea tab-uri, d'apoi alte meniuri din OCR_PLUS. Trebuiesc automat scoase taburile si inlocuite cu spatii in mod automat. Cine va dori tab-uri le poate introduce în Word dacă i se pare mai "cool". Depinde de tine dacă doreşti să implemetezi meniu separat.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Cosmin, Procedezi aşa cum crezi că e mai uşor. Da, poţi să creezi o opţiune separată, pentru că poate fi rulată şi separat, pentru orice eventualitate... sau pur şi simplu inserată comanda într-una din opţiunile existente, fără a mai crea o nouă opţiune separată. Oricum în OCR, nimeni nu are şi nu trebuie să aibă nevoie de taburi.
BlankCD,
În legătură cu liniile de dialog de care ai amintit mai sus: Avem două opţiuni care seamănă întrucâtva între ele: "Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text." şi CORECTARE CARACTERE REPRODUSE ERONAT / "Corectare linii de dialog"
Eu am făcut un dicţionar cu care rulează cea de-a doua. Practic, toate modificările se referă doar la linii de dialog, pentru că am pus condiţia ca AC să caute doar la început de paragraf. Practic, toate tipurile de linii la început de paragraf, însoţite sau nu de diferite caractere parazite, le-am transformat în Em Dash. După câte am constatat, din teste, sunt rezolvare situaţiile în proporţie de peste 90% dintre variantele de combinaţii şi nu din numărul de dialoguri. Numărul de dialoguri este rezolvat în proporţie mult mai mare. Mai rămân unele, pe care nu mă încumet să le trec în dicţionar, pentru că ele sunt de genul: j— ; I— ; l— ... adică au imediat înainte de linia de dialog una dintre literele cu format fusiform, de bară... mă rog, cred că înţelegi ce vreau să spun... la astfel de exemple m-am abţinut să fac modificări, din frica de a nu apărea efecte secundare - de exemplu să nu fie vorba de linie de dialog, ci de un rând rupt eronat....
La opţiunea "Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text" avem o problemă şi am vrut s-o ridic pe forum. Ce trebuie să înţelegem prin opţiunea asta? - că eliminăm artefactele aflate lângă liniile de dialog şi liniile de pauză sau explicative [deci linii care s-ar afla în text]? - sau, că eliminăm toate artefactele din text, indiferent unde s-ar afla ele, atât lângă linii de orice fel, dar şi din orice zonă a textului?
Dacă ne referim la răgălii doar aflate lângă linii de orice fel, atunci opţiunea este parţial implementată, pentru că poate rula tot pe bază de dicţionar şi deja am realizat unul. Dacă ne referim la TOATE artefactele din text, atunci opţiunea se poate realiza doar prin cod, şi după câte am vorbit cu Cosmin, codul este destul de stufos, pentru că trebuie trecut în cod fiecare caracter în parte care trebuie eliminat, cu condiţii... mă rog, nu mă pricep, dar am înţeles că este destul de complicat.
Trebuie să clarificăm şi această problemă între noi userii, pentru ca să ştie cei doi [Cosmin şi Daniel] ce anume trebuie făcut.
Deocamdată atât. Revin şi cu alte probleme ce trebuiesc clarificate între noi, pentru ca Daniel şi Cosmin să nu fie puşi în situaţia în care programează ceva şi apoi trebuie să revină aszpra codului. În fond, asta e foarte important, ca noi să cădem în mod clar de acord, asupra fiecărei situaţii în parte.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Ai dreptate BlankCD dar totusi pentru utilizarea OCR Plus ar fi necesar totusi un minimun de cunostinte...
Seven, eu doar am sugerat dar voi face cum cadeti voi de acord.
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
Seven a scris:
*** La opţiunea "Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text" avem o problemă şi am vrut s-o ridic pe forum. Ce trebuie să înţelegem prin opţiunea asta? - că eliminăm artefactele aflate lângă liniile de dialog şi liniile de pauză sau explicative [deci linii care s-ar afla în text]? - sau, că eliminăm toate artefactele din text, indiferent unde s-ar afla ele, atât lângă linii de orice fel, dar şi din orice zonă a textului? |
Ştiu la ce te referi. Când am propus meniul "Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text" îl vroiam comun adică ca eliminare răgălii din liniile de dialog cât şi ca eliminare răgălii din text. Mare parte răgăliile de lângă liniile de dialog sunt rezolvate de tine cu dicţionarele acelea. Poate ar trebui redenumit "Elimină răgălii din text", şi ar putea fi mutat în "Convertiri preliminare". Exemple de răgălii care ar trebui scoase din text le-am evidenţiat cu roşu în fişierul pus anterior. Cred că se poate face un dicţionar în care răgăliile să fie înlocuite cu "nimic".
@ Cosmin Ai dreptate, fă un meniu totuşi.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am implementat. Dupa ce ajungeti la consens cu 0.4 sa implementati modificarile in 0.41 si ma voi apuca sa schimb in AutoCorect.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Am revenit. Este o problemă la convertirea liniilor de pauză din LiniePauză [oricare ar fi ea] în linie de pauză de tip: "Em dash" sau "En dash" sau "Horizontal bar". Textul de prelucrat avea majoritatea liniilor de pauză ca Em dash şi am ales converirea în En dash. Am constatat că se modifică în En dash doar prima LiniePauză, dar nu şi a doua în fiecare paragraf. Cred că aici s-a făcut o confuzie: iniţial Blank a zis să fie convertite toate LiniePauză de orice tip.... cu excepţia linilor de dialog şi, cred, că s-a implementat convertirea tuturor LiniePauză cu excepţia celor din dialoguri, deci din paragrafele care încep cu dialog. Probabil condiţia impusă în cod, să fie cea care face posibilă doar convertirea primei liniuţe.
Părerea mea este că ar trebui să poată fi convertite toate LiniePauză, indiferent dacă se află în paragrafe care încep cu dialog sau paragrafe cu text obişnuit, pentru că oricum pentru LiniePauză la paragrafe care încep cu dialog, mai există nişte opţiuni speciale, care nu sunt afectate de forma liniilor de pauză. Deci să poată fi modificate toate LiniePauză. Bineînţeles nu trebuie să fie incluse aici liniile de dialog, deci linie la început de paragraf.
Şi... da, BlankCd ai dreptate... Opţiunile tale privind liniile de dialog erau mai complexe; cuprindeau convertirea lor... eu doar am scos răgăliile şi le-am transformat pe toate în Em dash. Practic opţiunile respective rămân de implementat.
Aici am o propunere: undeva înainte de convertirea liniuţelor şi a spaţiului de după linia de dialog în linie de dialog "X" şi spaţiu neseparator, ar trebui făcut ceva de genul: mai întâi adaugă spaţiu după toate liniile de dialog [pentru eventualitatea în care unele sunt lipite de text], apoi transformarea a două spaţii după linia de dialog în un singur spaţiu după linia de dialog şi în faza următoare trasformarea spaţiului [obişnuit] în spaţiu neseparator.
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Poti sa dai te rog un exemplu de astfel de paragraf in care nu e inlocuita linia?
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
Seven a scris:
*** Am revenit. Este o problemă la convertirea liniilor de pauză din LiniePauză [oricare ar fi ea] în linie de pauză de tip: "Em dash" sau "En dash" sau "Horizontal bar". Textul de prelucrat avea majoritatea liniilor de pauză ca Em dash şi am ales converirea în En dash. Am constatat că se modifică în En dash doar prima LiniePauză, dar nu şi a doua în fiecare paragraf. Cred că aici s-a făcut o confuzie: iniţial Blank a zis să fie convertite toate LiniePauză de orice tip.... cu excepţia linilor de dialog şi, cred, că s-a implementat convertirea tuturor LiniePauză cu excepţia celor din dialoguri, deci din paragrafele care încep cu dialog. Probabil condiţia impusă în cod, să fie cea care face posibilă doar convertirea primei liniuţe. |
Secvenţa ar trebui să fie aşa: înlocuieşte "spaţiu""EmDash""spatiu" cu "spaţiu""EnDash""spatiu". Atenţie! A nu se face confuzie cu EmDash ca linie de dialog pentru că acolo secvenţa cuprinde şi "marcaj sfârşit de paragraf". Adică la liniile de dialog secvenţa este aşa: "marcaj sfârşit de paragraf""EmDash""spaţiu". Sesizaţi diferenţa, nu?
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Ciudat, la mine nu face, daca caut acea liniuta marcata cu rosu dupa inlocuire n-o mai gaseste in tot textul. Dar am mai pus totusi niste masuri de siguranta...
BlankCD, da, o sesizez.
In fine uite exe-le dupa ca am implementat si transformarea tab in spatiu:
|
|
pus acum 13 ani |
|
|
Nu mai folositi spatiu normal la linia de dialog. Folositi ^s
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
Seven a scris:
*** Cred că eu am o problemă... Unele opţiuni fac doar o parte din modificări la prima rulare şi dacă rulez a doua oară aceeaşi opţiune face şi celelalte modificări. Exact aşa se întâmplă la opţiunea asta, dar şi la punctuaţie... Cu constatări de la noua versiune, revin peste 2-3 ore. Toate cele bune! |
Problema cu linia de pauză care nu e convertită o am şi eu, dar am zis ca e de vina PC-ul... Problema puctuaţie este că semnele ? ! :; au spaţiu înainte? Dacă da atunci aşa e şi la mine.
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Problema de la punctuatie e posibil sa apara deoarece deocamdata apelarea din OCR Plus nu se face pentru tot textul ci depinde de bifa de sub buton din panel-ul din stanga. Am modificat acum ca, atunci cand e apelata din OCR plus, sa ruleze pentru tot textul indiferent daca e bifat acolo sau nu si indiferent de pozitia cursorului in text.
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
O să încerc ultimul exe, dar să ştii că am bifată căsuţa din pan-elul din stânga, chiar am bifat-o şi debifat-o crezând că este blocată. O să mai testez şi îţi spun.
Altele:
Parcă şi Seven observase chestia asta, exemplu:
—E chiar aşa cum mi-am închipuit— rosti în cele din urmă Pripitul, punând deoparte ocheanul —cât e frumos afară lui moş Tom îi place să hoinărească pe lac cât mai aproape de ţărmurile dinspre miazăzi, lăsându-şi castelul în voia soartei.
Se observă că atât linia de dialog cât şi linia de pauză este lipită de literă mai exact lipseşte spaţiul. Ar trebui introdus spatiu acolo unde lipseste. Cred ca se poate face aşa: - pt. linii de dialog din "marcaj sfârşit de paragraf""linie de dialog""literă" în "marcaj sfârşit de paragraf""linie de dialog""SPAŢIU""literă"
-pt. linii de pauză: 1. din "literă""linie de pauză""spaţiu" în "literă""SPAŢIU""linie de pauză""spaţiu" 2. din "literă""spaţiu""linie de pauză""literă" în "literă""spaţiu""linie de pauză""SPAŢIU""literă"
Ar trebui introdus la "Convertiri preliminare" Nu ştiu dacă merge cu un dicţionar.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
lastiz
Membru Gold
Inregistrat: acum 14 ani
|
|
Se poate şterge.
Modificat de lastiz (acum 13 ani)
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
BlankCD, daca mai face probleme cu spatiul dinaintea :;?! sa-mi dai te rog un exemplu.
Da, e cam greu de facut asa ceva cu dictionar. La punctuatie de regula se rezolva spatiul de dupa linia de dialog dar la pauza din mijlocul frazei e cam greu de facut un cod care sa mearga bine intr-un procent cat mai apropiat de 100% de cazuri - si de aceea nu a fost implementata la punctuatie. Dar daca zici ca inlocuirea va ajuta mai mult decat va strica voi implementa asa cum ai aratat.
Multumesc, lastiz, pentru ajutorul la testare.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
Ai aici 2 fişiere unul brut şi unul trecut prin OCR_PLUS: Pe lângă problema spaţiilor de dinaintea semnelor : ; ! ? mai este şi problema ghilimelelor unde cele deschise sunt de un fel cele inchise de alt fel - este bifata casuta ghilimelelor din Punctuatie. Altă problemă observată este multitudinea de spaţii consecutive de 3-4-5-6.
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am rezolvat cu spatiul dinainte (problema de fapt era de la altceva). Au mai ramas foarte putine care mai au spatiu dinainte dar numai in situatii in care nu se stie ce se poate face. De exemplu cand ai ; dupa virgula.
In ce priveste ghilimelele despre care functie de la Punctuatie vorbesti: cumva "Converteste ghilimele obisnuite in ghilimele romanesti"? Daca da, atunci de obicei cand deschizi ghilimele sunt de un fel, cand le inchizi sunt de alt fel, e normal. Daca e alta problema da-mi te rog un exemplu pe un text mai mic ca acesta e prea mare.
Cu spatiile consecutive la Punctuatie nu se poate face ceva - cu ceva timp in urma am mai discutat asta cu Seven si a fost si el de acord ca nu se poate interveni in modul in care utilizatorul pune spatii multe in text. Dar se poate face o functie la OCR Plus care sa le scoata...
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
Cu spatiile consecutive la Punctuatie nu se poate face ceva - cu ceva timp in urma am mai discutat asta cu Seven si a fost si el de acord ca nu se poate interveni in modul in care utilizatorul pune spatii multe in text. Dar se poate face o functie la OCR Plus care sa le scoata... |
Cred că ar merge cu dicţionare: Ex.: din 10 spaţii consecutive in 1 singur spaţiu consecutiv din 9 spaţii consecutive in 1 singur spaţiu consecutiv la fel cu 8, 7, 6, 5, 4, 3, 2 spaţii în 1 singur spaţiu
Later Edit: Am făcut dicţionarul, poate îl implementezi într-un meniu, poate chiar în "Convertiri preliminare"
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, se poate dar as face eu mai repede cu cod pentru orice numar de spatii. Cum sa se numeasca functia si in ce meniu "parinte" de la OCR Plus sa faca parte?
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
ciuperca_cosmin a scris:
Da, se poate dar as face eu mai repede cu cod pentru orice numar de spatii. Cum sa se numeasca functia si in ce meniu "parinte" de la OCR Plus sa faca parte? |
Am făcut şi eu unul, l-am pus în postul anterior, dacă este mai comod cu cod atunci este foarte bine. Ar trebui intitulat "Înlocuire spaţii multiple cu spaţiu" şi cred că ar sta bine în meniul "Convertire preliminară" - sper că Seven este de acord cu mine.
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Am testat şi eu ultima versiune. Înainte de această versiune, toate problemele semnalate de Blank erau valabile şi la mine: spaţii în faţa semnelor de punctuaţie şi tot ce a mai zis... Cu ultima versiune toate LiniePauză s-au convertit corespunzător, au dispărut spaţiile din faţa semnelor de punctuaţie şi s-au convertit ghilimele în ghilimele româneşti cu câteva excepţii la ghilimele de închidere... ceea ce s-a spus.
Despre spaţii: - mai întâi: eu nu am implementat nimic în legătură cu spaţiile de după liniile de dialog până în prezent, aşa că vor apărea probleme; ceea ce am spus mau sus cu adăugare spaţiu, reducere 2 spaţii la unul şi apoi convertit în spaţiu neseparator, trebuie să fie ultimele înregistrări din dicţionar... şi cum ele [dicţionarele] nu sunt finalizate, am lăsat acest lucru pentru mai târziu. - deocamdată nu pot să pun cod pentru spaţiu neseparator în dicţionare... dar acest lucru despre coduri am convenit cu Cosmin să-l discutăm pe forum, dacă să se implementeze folosirea codurilor sau nu... deocamdată să clarificăm problemele mai dificile... şi apoi ne ocupăm şi de coduri.
- SPAŢIILE MULTIPLE Da, am mai discutat asta; şi eu sunt pentru eliminarea spaţiilor multiple. În prelucrarea OCR n-au ce să caute spaţii multiple. În editarea de documente personale este altă problemă, fiecare lucrează cum preferă.
Deci, DA, trebuie să se implementeze o astfel de funcţie. UNDE? În ce opţiune? Eu aş zice că în opţiunea "Convertire tab în spaţiu", pe care s-o redenumim în "Eliminare tab si spaţii multiple" Asta ca să nu mărim numărul de opţiuni, care este destul de mare... Mi se pare că cele două chestii sunt suficient de legate una de alta. Practic, ele fac "curăţenie" printre spaţii.
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
O intrebare: sa rezolve numai spatii obisnuite, nu si spatii neseparatoare sau combinatii?
PS: cred ca ar merge Seven sa fie grupate impreuna.
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
Seven a scris:
*** Despre spaţii: - mai întâi: eu nu am implementat nimic în legătură cu spaţiile de după liniile de dialog până în prezent, aşa că vor apărea probleme; ceea ce am spus mau sus cu adăugare spaţiu, reducere 2 spaţii la unul şi apoi convertit în spaţiu neseparator, trebuie să fie ultimele înregistrări din dicţionar... şi cum ele [dicţionarele] nu sunt finalizate, am lăsat acest lucru pentru mai târziu. - deocamdată nu pot să pun cod pentru spaţiu neseparator în dicţionare... dar acest lucru despre coduri am convenit cu Cosmin să-l discutăm pe forum, dacă să se implementeze folosirea codurilor sau nu... deocamdată să clarific problemele mai dificile... şi apoi ne ocupăm şi de coduri. |
Aşa cum am mai spus spaţiul de după linia de dialog va fi convertit în spaţiu NESEPARATOR atunci când va fi implementat meniul "Convertire linii de dialog" - care va fi pus la sfârşitul OCR_PLUS. O să vedem atunci ce probleme vor apărea şi vom face modificări dacă trebuie.
Seven a scris:
*** Eu aş zice că în opţiunea "Convertire tab în spaţiu", pe care s-o redenumim în "Eliminare tab si spaţii multiple" Mi se pare că cele două chestii sunt suficient de legate una de alta. Practic, ele fac "curăţenie" printre spaţii. |
De acord.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
Seven a scris:
*** Eu zic că ar fi bine să fie toate modificate. Nu mă pricep foarte bine, dar dacă ar fi eliminate doar spaţiile obişnuite şi s-ar afla un spaţiu obişnuit lângă unul separator, funcţia nu ar rula şi, cu toate astea ar exista două spaţii unul lângă altul. Deci eu zic că toate tipurile de spaţii, inclusiv combinaţii. |
Nu am văzut un OCR care să aibă şi spaţiu şi spaţiu neseparator.
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
BlankCd a scris:
Nu am văzut un OCR care să aibă şi spaţiu şi spaţiu neseparator. | Nici eu nu am văzut, dar cred că e mai bine ca să fie codul complet chiar de la început. Am văzut şi implementarea noii funcţii, dar nu am avut taburi în OCR la îndemână.
Bun. Mergem mai departe cu purecatul meniului sau ne oprim? Să presupunem că răspunsul ar fi Da. Avem în acest moment următoarele opţiuni: 2. "Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text". şi 4.6. Corectare linii de dialog Ele rulează pe baza dicţionarelor DLp.imd şi DLd.imd
Propunere: – Să se elimine definitiv opţiunea 2 "Eliminarea "răgăliilor" din vecinătatea liniilor de dialog şi din text". – Să modificăm actuala opţiune 4.6 sub numele "Curăţare linii de pauză şi linii de dialog" sau, şi mai simplu "Curăţare linii de pauză şi dialog" – Opţiunea să funcţioneze prin rularea în următoarea ordine a dicţionarelor: – DLp.imd – curăţă artefacte indiferent de poziţia liniei în text – DLd.imd – curăţă artefacte suplimentare doar la liniilede dialog – DLs.imd – [inexistent în acest moment] va pune spaţiu după linia de dialog, va scoate spaţiile duble după linia de dialog şi [eventual] va înlocui spaţiul de după linie cu spaţiu neseparator. Dicţionarele pot rămâne sub acest nume sau, ar fi şi mai bine dacă ar fi redenumite în: DL1.imd, DL2.imd şi DL3.imd
Propunerea nu trebuie implementată. E doar o discuţie pentru a putea completa noua variantă de MENIU OCR_PLUS - PRESCURTAT [V0.41]
Modificat de Seven (acum 13 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, ar merge, in acest fel OCR Plus ar fi ceva mai compact.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, cred ca si astea pot fi combinate.
|
|
pus acum 13 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, daca BlankCD e de acord cu aceasta varianta ma apuc s-o implementez...
|
|
pus acum 13 ani |
|
BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
M-am uitat în propunerea lui Seven. De acord cu Seven, cu nişte menţiuni: - şi submeniurile de la punctul 7 trebuiesc comprimate - şi submeniurile de la punctul 6 trebuiesc comprimate - cred că aşa este mai simplu - a mai rămas de implementat meniul "Convertire linii de dialog" - a mai rămas meniul "Marcare Ghilimele" de modificat titlul şi ar trebui să marcheze cu roşu sau altă culoare - excepţie vocalele A. E, I, O, U - toate consoanele care sunt precedate şi urmate de spaţiu. De obicei acestea sunt erori date de hârtie sau de vocale precedate şi urmate de spaţiu [reproduse eronat de OCR]: ex. "a fost" devine "b fost" - aş mai propune pt. punctul 9 posibilitatea convertirii ghilimelelor, sunt vreo 3-4 feluri de ghilimele. Dăm astfel posibilitatea ca userul dacă doreşte să poată alege tipul de ghilimele. Parcă în urmă cu câteva pagini mensanna a prezentat nişte ghilimele.
Ar mai fi câte ceva dar să le vedem pe astea implementate şi apoi mai vorbim.
L.E.: Titlul meniului 7: "Elimină TOATE liniile de pauză din text - cu excepţia liniilor de dialog" ar trebui scurtat aşa: "Elimină TOATE liniile de pauză din text".
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|
pus acum 13 ani |
|
lucifer76
Membru Junior
Inregistrat: acum 14 ani
|
|
Am directorul c:\Users\Administrator\AppData\Roaming\AutoCorect Contemporan\. In el este L1.imd. Si totusi cand incerc sa folosesc "corectarea literei l ...." imi zice ca dictionarul nu poate fi deschis. De ce?
|
|
pus acum 13 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Pentru dictionarele imd folosite la OCRPlus trebuie creat acolo in \Dictionare un folder numit "OCR_DIC" si mutate in el. Deci numele folderului in care vor trebui mutate e "c:\Users\Administrator\AppData\Roaming\AutoCorect Contemporan\Dictionare\OCR_DIC".
Modificat de ciuperca_cosmin (acum 13 ani)
|
|
pus acum 13 ani |
|
lucifer76
Membru Junior
Inregistrat: acum 14 ani
|
|
Ai dreptate, merge . Scria si in primul post, dar eu ma uitasem doar la ultimile pagini din topic.
|
|
pus acum 13 ani |
|