Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
|
Lista Forumurilor Pe Tematici
|
Forum Romania Inedit | Reguli | Inregistrare | Login
POZE FORUM ROMANIA INEDIT
Nu sunteti logat.
|
Nou pe simpatie: ag30rox la Simpatie.ro
| Femeie 25 ani Arges cauta Barbat 32 - 46 ani |
|
xtybyx
MEMBRU VIP
Inregistrat: acum 13 ani
|
|
Documentul l-am trecut prin AC, ce e cu rosu e problema.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
jullien_alphonse
Pe lista neagra
Inregistrat: acum 17 ani
|
|
Seven, cand ai timp, te rog, actualizeaza si dictionarele din folderul mediafire, cu ultimii termeni/secvente, adaugati.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Îmi cer scuze dacă vă provoc oarece neplăceri. Am câteva propuneri pentru un fel de variantă finală a acestei etape de lucru.
1. Implementare o nouă opţiune. Loc: pachetul 4. Corectare caractere reproduse eronat Nume: „Corectare cuvinte întregi şi expresii” Dicţionare de rulat = 5 Nume dicţionare: CO_CImf1, CO_CImf2, CO_CImf3 - pentru cuvinte întregi cu frecvenţă mare CO_Expr1, CO_Expr2 - pentru expresii şi grup cuvinte 2. Finalizare opţiune existentă: „4.6. Înlocuire secvenţe cuvinte” Dicţionare de rulat = 6 Nume dicţionare: Dicţionare încep cu „CO_S” [Contemporan_Secvenţe], la care se adaugă „Inc” [început de cuvânt] sau „Med” [secvenţe mediane] ori „Ter” [terminare cuvânt, secvenţe de final]: CO_SInc1.imd + CO_SInc2.imd – pentru secvenţe aflate la început de cuvânt CO_SMed1.imd + CO_SMed2.imd – pentru secvenţe mediane, aflate în interiorul cuvintelor CO_STer1.imd + CO_STer2.imd – pentru secvenţe finale [terminare cuvânt] Actualul dicţionar SM_celi va deveni CO_SMed1.imd
3. Modificare opţiune existentă: „12.2. Dicţionare cu variante” Va fi suficient un singur dicţionar în loc de 4 câte rulează acum. Am redus la maxim numărul de înlocuiri care necesită confirmare
4. Dacă nu este mult prea mult de lucru pentru Cosmin, aş propune şi o simplificare a numelor unor dicţionare care încep cu litera D [de la dicţionar] prin eliminarea acelui D, ca în exemplele: CO_DApco.imd >> CO_Apco.imd CO_DApct.imd >> CO_Apct.imd CO_DArtef.imd >> CO_Artef.imd ....... Dacă este posibil acest lucru, voi expune şi celelalte propuneru de midificare a numelor de dicţionare.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Dacă se poate implementa, atunci încerc să propun un termen şi o metodă. Mă gândeam ca termenul să fie de o săptămână, deci pentru 3 aprilie sau undeva între 3 şi 5 aprilie. Lista cu toate modificările de nume de dicţionare a voi face în format doc şi o pun pe forum. Ca metodă, propun ca eu să dau adresa dicţionarelor lui Cosmin, iar atunci când este gata executabilul să fie puse atât adresa executabilului cât şi a dicţionarelor în aceeaşi postare, astfel ca userii să le găsească la pachet sau să nu le găsească de loc.
Şi o ultimă propunere: Mă gândesc că cineva vrea să ruleze Meniul OCR_Plus fără a sta în faţa computerului în această perioadă... poate îşi face o cafea [cu lapte]... poate ia o pauză... Am reorganizat astfel dicţionarele ca toate confirmările să apară numai la ultima opţiune 12.2 Dicţionare cu confirmare. Deci programul se opreşte după ce a rulat toate opţiunile, cu excepţia ultimei. Apare totuşi o problemă: dacă userul activează opţiunile care ţin de dialogul francez, atunci computerul se opreşte la opţiunea "4.5 Conversie majusculă în minusculă la dialog francez" care se află undeva la mijlocul timpului de rulare.
Întrebarea ar fi cam aşa: ar deranja dacă această opţiune ar fi adusă şi ea în pachetul 12, astfel ca primele 11 opţiuni să ruleze automat şi să nu necesite prezenţa userului în faţa computerului? Asta ar fi ultima problemă. personal nu mai am niciun fel de propunere de modificare.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Pai de ce ar necesita aprobare? Acele situatii ar trebui sa apara in lista de probleme indicata de Punctuatia OCR. Adica ar trebui ignorate si prezentate doar ca sugestii.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** utilitasetveritas, ai dreptate. În mintea mea dicţionarul de la Dialog Francez era cu confirmare... m-am uitat şi e corect ceea ce spui: dicţionarul rulează automat, aşa că opţiunea nu deranjează cu nimic - aşa că e foarte bine să rămână acolo unde este.
Cosmin, dacă implementarea se poate face, atunci termenul poate fi oricare, cu menţiunea că eu nu pot finaliza înainte de 3 aprilie... cel mai devreme 2... Despre modificarea dicţionarelor. Am urcat un tabel în format doc, ca să se poată lucra pe el, aici: şi pentru vizualizare directă pentru cei interesaţi, Vizualizează aici M-am cam întins şi la alte modificări de nume... Nu ştiu câtă muncă implică aceste modificări, dar am vrut să fac astfel încât numele sp fie un pic mai sugestive. Astfel am avea 3 dicţionare la care nu se modifică nimic, unele [10 dicţionare] la care se elimină doar acel "D", altele [9 dicţionare] la care se modifică numele mai mult decât doar eliminarea acelui "D" şi un număr de 10 dicţionare complet noi. Am renunţat la eliminarea dicţionarelor cu variante, deoarece s-a discutat pe forum despre corectarea unor despărţiri de cuvinte la capăt de rând care apar în OCR cu cratimă la mijlocul rândului. M-am gândit că pot fi puse în dicţionarele cu variante.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Cosmin, crezi ca ai putea aranja un pic Paste-ul din AC? Sa fie asemanator celui din Word. Atunci cand faci Paste intr-un document sa poti: - insera textul in Clear Format, adica text simplu. - sa se transforme automat in fontul si marimea textului din locul in care e plasat cursorul. - sa se pastreze formatarea sursei.
Cu memorarea ultimului font folosit cum a ramas?
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
utilitasetveritas a scris:
Cosmin, crezi ca ai putea aranja un pic Paste-ul din AC? Sa fie asemanator celui din Word. Atunci cand faci Paste intr-un document sa poti: - insera textul in Clear Format, adica text simplu. - sa se transforme automat in fontul si marimea textului din locul in care e plasat cursorul. - sa se pastreze formatarea sursei. |
Stai ca ce ai spus se cam bat cap in cap unele cu altele. Text simplu sau cu formatare? "Sa pastreze formatarea sursei" >> formatarea include si fontul. Drept sa spun n-am folosit niciodata aceasta functie din Word Poti sa-mi arati te rog unde o gasesc...?
In ce priveste amintirea ultimului font folosit: am facut ceva teste cu Word si am constatat ca de fapt nu e memorat in document (cum ar fi fost normal) ci undeva prin Windows (setarile Word din registry ori din Application Data). Asta nu e prea bine, deoarece cand te duci cu documentul pe alt calculator nu mai tine minte. Pe de alta parte AutoCorect e un program de corectat texte deja scrise, nu de scris texte de la 0. Asta inseamna ca utilizatorul va corecta texte ce au deja formatare definita si deci rar le va schimba fontul. Dar daca vor fi mai multi care vor cere asta atunci ma voi gandi la o implementare.
Altceva: am corectat cateva probleme de la Monitorizare Clipboard (aparute in ultimul timp datorita schimbarilor din restul codului). Exe:
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
E in regula atunci. Lasa-le asa pana cand va fi momentul. Chestia cu Paste si memorare font folosit ultima oara e utila pentru momentele in care se face copy/paste dintr-o sursa externa. Dar de fapt duc la acelasi rezultat... in cazul meu adica.
Caz concret: Sunt unele expresii in franceza ce apar fara ciudateniile alea de semne, intrucat nu stiu cum se scrie corect acea expresie o iau de pe Gugle si o bag in text. Problema e ca e introdusa cu fontul/marimea/culoarea/underline-ul/hyperlink-ul etc sursei.
Daca marimea textului e accesibila usor, de regula e undeva intre 10-18, nu la fel sta cu fontul. Palatyno de exemplu e pus tocmai pe la coada listei.
Vorbind de functia de Word 2010: - cand intr-un document deja formatat, faci un paste dintr-un alt document formatat diferit. Il faci cu Ctrl+V sau cu meniul contextual in care ai 3 optiuni:
When you do this you will then see 3 buttons offering the following options: Keep Source Formatting – this option retains the formatting used on the source document you copied. This means that text will be displayed using the same fonts and other attributes like the line height of text will be retained too. Images are inserted with the same vertical and horizontal spacing. Merge Formatting – the pasted elements will adopt the formatting currently in use in the destination Word 2010 document. Keep Text Only – using this option will discard certain things that were present in the source, such as images and formatting. Only plain text will be pasted so headings, for example, will lose their size and bolding.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
NaeChioru
Membru Puf
Inregistrat: acum 13 ani
|
|
@Seven
@utilitasetveritas are dreptate, varianta propusa de tine nu este o varianta a unui program profesionist. Cel mai bine ar fi sa apara o fereastra plutitoare dupa apasarea combinatiei de Paste (CTRL+V) cu 2,3,4 butoane in care sa sugereze cum sa se faca lipirea, cu/fara formatare, cu/fara poze, etc...
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, se poate face si asa dar pe de alta parte asta va agasa pe cei care utilizeaza mult lipirea obisnuita - pentru ca ii va obliga de fiecare data sa aleaga. Trebuie gasita o cale de "mijloc" - de aceea care impaca si capra si varza
|
|
pus acum 12 ani |
|
NaeChioru
Membru Puf
Inregistrat: acum 13 ani
|
|
Microsoft Office Word 2010 asa are, iar aceasta optiune vine din office 2007, cred ca daca erau multe plangeri o scoteau ei..., se merita optiunea, mai ales ca este testata de useri si acceptata, iar lumea este deja obisnuita cu ea.
@ciuperca_cosmin felicitari pentru ce faci.
Modificat de NaeChioru (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
O sa ma gandesc la o solutie dar deocamdata sa vad cum fac cu modificarile mentionate de Seven...
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Chill. Pe moment programul e bun si asa. Cred ca pe partea de beletristica ar merge o "fortare" a fontului in functie de documentul tinta. Dar asta ar nemultumi pe altii si inca nu e cazul sa specializam programul doar pe baza ideilor/preferintelor catorva utilizatori. Daca ideile enuntate pe aici sunt interesante, utile si posibile ca realizare sunt sigur ca vor fi puse in practica in masura posibilitatilor. Cand Cosmin o sa ramana fara ocupatie probabil ca o sa rasfoaisca topicul si o sa vada ce ar mai putea fi facut in baza sugestiilor mele sau a altora.
Pe moment, astept cu nerabdare o finalizare "sezoniera" a Ocr_Plus-ului.
Cosmin, bookmark-ul ala de document e inserat in documentul deschis sau in acel document personalizat din Roaming/aplicatio Data ce poarta numele fisierului? Sa stii ca inca gasesc situatii de genul "punct spatiu litera mica" ce nu apar la Punctuatie si nu pricep de ce.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Bookmark-ul (semnul de carte) e inserat in documentul deschis. In ce priveste situatiile "punct spatiu litera mica" probabil nu pot fi rezolvate eficient (situatii ambigue); "coleacteaza-le" totusi si cand ai mai multe trimite-mi-le ca sa verific...
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Deci daca formatez, schimb Windows-ul si pun un AC nou, acesta va gasi acel bookmark fara probleme?
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Da, cum am spus - acel semn de carte e inserat in document si deci nu tine de Windows sau de reinstalare AutoCorect...
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Din casuta cu Caractere Speciale lipseste una dintre diacritici scrisa cu litere mici.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Corect, multumesc ca mi-ai aratat, am rezolvat. Noul caracter va apare la cei care au caracterele romanesti implicite in fereastra de caractere speciale sau la cei care instaleaza prima data AutoCorect. Exe nu pot sa pun deocamdata pe forum deoarece e modificat sa lucreze cu noile nume de dictionare (i l-am trimis deja lui Seven de cateva zile).
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Mai am nevoie de maxim 48 de ore pentru definitivarea dicţionarelor. Am reactualizat denumirile, am făcut teste pe toate opţiunile şi nu am constatat probleme. Programul poate fi definitivat în forma actuală, incluzând problema cu diacriticele, cu două amendamente:
Amendamentul 1. La pachetul de opţiuni nr.4, cred că ar fi bine ca opţiunea "Convertire majusculă în minusculă în dialog francez" să fie trecută ultima în cadrul pachetului. Ar fi mai uşor pentru utilizator la activarea opţiunilor ce trebuiesc rulate; Toate celelalte opţiuni trebuie activate obligatoriu, iar această opţiune depinde de setarea din punctuaţie. Amendamentul 2. La pachetul "12. Setări finale", opţiunea "12.2 Dicţionare cu variante" avem 4 dicţionare [CO_Var1.imd ÷ CO_Var4.imd]. Am redus la maxim înlocuirile cu confirmare, astfel că în acest moment doar dicţionarul CO_Var1.imd mai conţine înlocuiri cu confirmare. M-am gândit să profit de faptul că există implementate încă 3 dicţionare şi în acestea am pus înregistrări care au rolul de a elimina cratima care apare la despărţirea cuvintelor la sfârşit de rând.
Am înregistrat în "CO_Var2.imd" o serie de situaţii care apar la finalul gerunziului verbelor, cum ar fi: vorbin-du-i >> vorbindu-i; -du-l >> du-l; -du-le >> du-le; -du-mă >> du-mă; -du-mi >> du-mi; -du-ne >> du-ne; -du-se >> du-se; -du-şi >> du-şi; -du-te >> du-te; -du-ţi >> du-ţi; -du-vă >> du-vă... şi alte situaţii pentru verbele la gerunziu, cum ar fi despărţirea cu o silabă mai spre începutul cuvântului: vor-bindu-i >> vorbindu-i... Am înregistrat în "CO_Var3.imd" câteva cuvinte cu 2 şi 3 silabe de frecvenţă mare; Am înregistrat în "CO_Var4.imd" câteva cuvinte la care am luat în calcul o parte dintre sufixele folosite în limba română; practic despărţirea cuvintelor la capăt de rând se face mai des spre partea finală a cuvintelor decât la începutul lor şi am considerat că este bine de luat în calcul despărţirea în zona de compunere cu sufixe. Toate aceste trei dicţionare pot şi trebuie să fie îmbunătăţite pe parcurs.
Problema ar fi că numele opţiunii nu mai este suficient de corect şi sugestiv. Eu consider că opţiunea trebuie să rămână implementată exact aşa cum este acum, dar mă gândeam dacă nu ar fi bine ca numele opţiunii să fie modificat, astfel încât să utilizatorul să înţeleagă mai bine ce anume face această opţiune. În acest moment nu am o propunere pentru schimbarea numelui.
Şi ultimul aspect. Pentru mine personal este mult mai uşor să lucrez la acest moment doar pentru varianta Contemporan, iar după definitivarea dicţionarelor pentru Contemporan, să fac conversiile necesare pentru varianta Clasic.
LE: Am urcat o arhivă care cuprinde dicţionarele aflate în lucru: CO_DVar2.imd ÷ CO_DVar4.imd. Dicţionarele pot fi vizualizate direct din meniul Editare --> Înlocuiri multiple, dar pot rula şi automat deoarece au numele nemodificat, astfel încât să poată rula cu executabilul urcat pe forum. Adresa arhivei:
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Amendamentul 1 - nu vad nicio problema in mutare. Amendamentul 2 - da, trebuie o denumire mai buna. Dar pe moment nu gasesc nici eu una mai buna
Uite un exe nou (doar pentru tine, Seven - ceilalti nu-l luati ca n-o sa mearga cu dictionarele actuale): Am o surpriza: uita-te pe bara de unelte, primul rand, ultimul buton din dreapta...
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Mulţumesc frumos pentru icon! E foarte comod de accesat fereastra de înlocuiri multiple folosind un icon, mai ales pentru cineva ca mine, care închide şi deschide fereastra de foarte multe ori într-o sesiune de lucru. Bun. Terminat cu distracţia.
Să trecem la lucruri serioase. Până dimineaţă am să urc pe mediafire pe un folder separat de cel vechi, o formă finală a tuturor dicţionarelor care rulează automat în meniul OCR Plus. Dicţionarele vor avea noile denumiri şi pot rula cu executabilul de mai sus.
Am adăugat la dicţionarele CO_Var.imd, dicţionare care fac "lipirea" cuvintelor rupte la capăt de rând încă o serie de înregistrări. Este vorba de cuvinte care se termină la Genitiv-Dativ în "lor" şi "lui". Numărul de cuvinte este imens... de multe zeci de mii de cuvinte, astfel că am blocat computerul... rezultatul căutării a apărut după multe minute... la copiere s-a blocat word şi excel... ăsta din urmă zicea că are doar 65536 rânduri şi că sunt mai multe cuvinte... M-am gândit că dacă există atâtea cuvinte care por avea finalul "lui" atunci merită câteva înregistrări pentru corectarea cuvintelor rupte [despărţite la capăt de rând]. Am luat în calcul repararea ruperii de la ultimei silabă şi a ruperii ultimelor două silabe. Am încercat să prind şi înregistrări cu ultimele 3 silabe, dar rezulta un număr foarte mare de situaţii. Ca orice elefant ce se plimbă printre bibelouri, am mai stricat ordinea de până acum şi am făcut o schimbare: pentru ca dicţionarul cu confirmări să ruleze la sfârşitul programului, am dus înregistrările cu confirmare exact în ultimul dicţionar pe care-l rulează programul, şi anume în CO_Var4.imd.
Prractic, la acest moment mai am de verificat dicţionarele pentru eliminarea "semnelor de carte"; este vorba de rânduri de asterixuri pe care le folosesc pentru a marca zona de lucru în dicţionare.
Referitor la denumirea ultimei opţiuni: cea în care corectăm cuvintele despărţite la capăt de rând... Mă gândeam la termenul de "cuvânt rupt"; dacă avem rânduri rupte şi opţiune de reparare a rândurilor rupte... oare, n-am putea folosi şi termenul de "cuvinte rupte" şi "corectare a cuvintelor rupte"? Ar fi sugestivă o opţiune care s-ar numi "Corectare cuvinte rupte şi înlocuiri cu confirmare"?
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Ma gandeam si la "Unire bucati cuvinte rupte" dar e cam lung. "Corectare cuvinte rupte" e mai bun (oricum altceva decat unire nu se poate face si deci se va subintelege asta). Dar in privinta "si inlocuiri cu confirmare" nu sunt 100% sigur. O alternativa: la dictionarele care au inregistrari cu confirmare s-ar putea adauga (conf) sau (confirmare) in numele optiunii; eventual chiar explicat in Help... Ce parere aveti...?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Dicţionare cu confirmare Au fost 4 înregistrări în dicţionarul CO_L3.imd şi le-am mutat în ultimul dicţionar [CO_Var4.imd] pe care-l rulează meniul OCR Plus. Mai erau 6 înregistrări de înlocuiri cu confirmare la dicţionarul CO_DFr.imd [dialog francez]. M-am gândit că pot fi şi ele mutate în ultimul dicţionar [CO_Var4.imd] şi în acest fel, toate confirmările apar doar la acest ultimul dicţionar. Dicţionarele care elimină răgălii [CO_Apco.imd şi CO_Apct.imd] rulează automat, deci nici ele nu au confirmări. Practic singurul dicţionar la care este nevoie de confirmare, rulează în parte finală a meniului.
Dacă zici că numele opţiunii "12.2 Corectare cuvinte rupte şi înlocuiri cu confirmare" este cam lung... atunci putem pune şi o formulare mai scurtă... cu prescurtări. Eu m-am uitat la lungimea opţiunii "12.1 Înlocuire spaţiu după linia de dialog cu spaţiu neseparator " şi m-am gândit că fiind în acelaşi pachet ar merge şi ceva cu nume mai lung, deoarece ferestra este deja realizată pentru o opţiune cu nume lung... ... sau e vorba de numele opţiunii şi nu de lungimea numelui? numele sub care am propus-o nu sună prea bine?... Adevărul este că sunt două opţiuni într-una singură, dar nu ar fi meritat efortul implementării separate... zic şi eu...
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
E si numele ca-i lung un pic, e si ca suna un pic ciudat.
Se poate si cu numele mai lung, nu-i problema mare. Ideea este ca in programe de calculator (si nu numai) totdeauna trebuie sa te straduiesti sa pui nume cat mai scurte dar care "spun"cat mai multe. Asta evident - unde este posibilitate... Daca se ajunge la concluzia ca numele lung ajuta mai mult, atunci lasam numele lung...
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Optiunea "Conversie majuscula in minuscula la dialog francez" e acum pe ultima pozitie in pachetul 4. Am redenumit 12.2 in "Corectare cuvinte rupte si inlocuiri cu confirmare". Exe:
Acum cam ar fi fost timpul sa implementez ultimele modificari din Contemporan si in Clasic, pentru ca Seven sa poata actualiza dictionarele pentru clasic. Se pare ca va mai intarzia putin, deoarece am gasit o mica problema la ortografie. Precum va amintiti, acum cateva luni am optimizat ortografia sa fie si mai rapida pe texte mari (cum sunt cartile). Daniel a descoperit recent ca sunt unele texte aparte la care nu afiseaza corect cuvantul subliniat. Vestea buna e ca se intampla rar si nu face pe rtf-uri de carti, vestea proasta e ca daca nu gasesc o solutie buna va trebui sa revin la metoda veche (inceata). E un fel de "buturuga mica rastoarna carul mare". Deocamdata lucrez sa gasesc o solutie care sa mearga in toate situatiile si sa fie totusi rapida. Dar nu pot estima cand o voi gasi. Poate fi cateva ore sau cateva saptamani...
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Te ajut eu. Pana acum tutorialele postate au fost ok.
Hai ca poate avem noroc si cu alt utilizator AC.
|
|
pus acum 12 ani |
|
jullien_alphonse
Pe lista neagra
Inregistrat: acum 17 ani
|
|
Semnalez ca AUTOCORECT expandeaza dimensiunea fisierului in megabytes, in cazul fisierelor ce contin ilustratii jpg in doc.
Astfel, prelucrarea cu Autocorect a unui fisier de 10,5 MB, docx, cu zeci de ilustratii, determina ca RTF-ul sa ajunga la 685 MB, fisierul devenind INOPERABIL (nici wordul si nici AUTOCORECTUL nu il mai pot deschide).
Se poate implementa o functie care SA NU EXPANDEZE dimensiunea in mega a pozelor/fisierelor?
Nota Pentru fisierele mai mici, de 100-200 mega rtf, ce contin poze, fisiere PE CARE LE POATE DESCHIDE wordul, pacaleala aplicata de mine consta in re-conversia rtf (corectat cu Autocorect) in pdf, si apoi RECUNOASTEREA OCR a pdf-ului astfel obtinut cu PDF TRANSFORMER, operatie care reduce dimensiunea fisierului - in urma re-compresarii de catre ABBYY PDF TRANSFORMER a pozelor.
Modificat de jullien_alphonse (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Scuze ca n-am mai intrat pe aici de o vreme dar am avut, pe langa problema mentionata ultima oara la AutoCorect, si cateva probleme personale. Forumul de obicei nu ma mai anunta ca am mesaje noi in aceste topicuri... In plus Mozilla Firefox imi interzice acu sa intru pe acest forum zicand ca "ataca". Am fost fortat sa utilizez Google Chrome. Chiar acu am vazut ca si Google Chrome ma ia cu acelasi mesaj cand am dat click pe "Postati raspuns". Nu cred sa fie malware pe forum dar acu il accesez din VirtualBox...
@jullien_alphonse Da, deocamdata AutoCorect are setata salvarea imaginilor ca bmp-uri deoarece am constatat ca unele editoare de text nu vad imaginile jpg/png/gif. Dar pe de alta parte inteleg de ce e problema cu cartile. Ca o paranteza, Word nu poate deschide documente asa mari pentru ca e limitat la asa ceva, nu pentru ca AutoCorect i-ar da un format incorect de text. Cu AutoCorect n-am avut probleme in a redeschide texte de aceasta marime. Dar, evident, depinde si de Ram-ul calculatorului... O sa ma gandesc la o solutie.
@Seven De la bun inceput marcarea a fost facuta nu pe dictionar ci pe intreaga "Inlocuire multipla". Cata vreme e bifat va marca modificarile la culoarea selectata curent. Cand am implementat-o (la vremea respectiva) am mentionat acest lucru.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am adaugat o noua optiune la configurarea AutoCorect. Acum imaginile care erau jpg sunt salvate tot ca jpg iar restul ca png.
27.1KB
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Cum se descurca AC-ul cu punctele de suspensie?
Situatii intalnite: - doua puncte in loc de 3, lipite sau nu de cuvant. - 3 puncte normale, dar uneori cu spatiu la inceput si la sfarsit, alteori cu una din parti lipite de cuvant.
Niciuna din situatii nu e semnalata la Punctuatie sau corectata de Ocr.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Nimic? Nimeni? Sunt ambele corecte sau ce?
Atâtea specimene nealterate și, ca un făcut, niciunul care să poată sluji cercetărilor sale persecutate! … Eram teribil de surmenați, iar uriașul efort psihic și nervos îi producea prietenului meu o stare de visare morbidă.
Atâtea specimene nealterate și, ca un făcut, niciunul care să poată sluji cercetărilor sale persecutate!… Eram teribil de surmenați, iar uriașul efort psihic și nervos îi producea prietenului meu o stare de visare morbidă.
Cosmin, crezi ca e posibil sa se faca un dictionar particularizat care sa contina diverse forme gresite ale cuvintelor care sa fie adaugate acolo de utilizator?
Si inca ceva... este posibil ca AC-ul sa arate page break-urile atunci cand vizualizam formatarea textului?
Totodata am rulat OCR-ul pe mai multe texte (1.0, 2.0) nu strica prea multe cata vreme se face o corectare prin citire dupa. Un lucru foarte bun e faptul ca pastreaza notele de subsol. Singurul efect asupra lor e faptul ca isi pierd proprietatea de suprascript, dar in rest sunt neatinse.
Deci daca aveti texte ce contin macro-uri sau diverse stiluri ciudate, e suficient sa mutati textul in AC si sa salvati si o sa scapati de chestiile nedorite.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
@utilitasetveritas, 1. Elipsis... Ceva îmi aparţine.. În dicţionarul CO_Elips.imd care face conversie suplimentară Elipsis am adăugat două înregistrări şi anume: punct_spaţiu_punct_punct trece în Elipsis punct_punct_spaţiu_punct trece în Elipsis Înregistrările sunt valabile, indiferent dacă primul punct este lipit sau nu de ultima literă a cuvântului din faţa sa.
2. Corect este ca situaţia < ! ... > să treacă în < !... >, adică fără spaţiu între Semnul exclamării şi Elipsis; Acelaşi lucru se întâmplă şi cu ? ... Aceste situaţii le rezolvă Punctuaţia generală, în urma setării din Configurare Punctuaţie OCR Plus, ultima de la tabul doi, care se numeşte "Elimină spaţiu dintre grupul de caractere !? ?! !... ?... ...! ...?" Astfel de situaţii ar trebui să fie corectate. Nu înţeleg de ce nu a corectat.
@ciuperca_cosmin, Ultima setare pusă la Configurare Punctuaţie referitoare la compresia imaginilor... apare afişată peste celelalte taburi... Cred că e o eroare pe undeva... Am senzaţia că se doreşte a fi un tab separat... Oare nu ar merge să fie doar o opţiune la tab 4. Diverse? Nu cred că ar fi o problemă.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Ai dreptate. Este activata optiunea cu pricina, dar nu le-a corectat pe toate. La unele a eliminat spatiul, la altele nu.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
@utilitasetveritas O sa ma gandesc la o solutie pentru cazurile cand sunt doar 2 puncte de suspensie.
"dictionar particularizat care sa contina diverse forme gresite ale cuvintelor care sa fie adaugate acolo de utilizator" = teoretic s-ar putea implementa dar la ce ar folosi efectiv...? Sa se vada page break-urile - o sa vad daca e posibil.
Da-mi te rog cateva exemple in care optiunea nu a corectat cazurile cu ! ? ...
@Seven Multumesc ca mi-ai spus, o sa corectez.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am corectat problema la configurare si am modificat punctuatia sa arate sugestie de adaugare al treilea punct atunci cand intalneste doar doua.
PS: utilitaetveritas, dar butonul de pe bara de unelte sus mijloc nu e bun pentru ce vrei tu..? Adica acesta:
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Dictionarul ala de cuvinte sau forme naspa ale unor cuvinte, imi foloseste la adaugarea manuala a lor. Inca gasesc in texte forme complet gresite ale unor cuvinte pe care AC-ul nu le baga in seama. Cele care o liniuta pusa prin ele sunt cele mai multe. Totusi adaugarea lor nu cred ca e indicata, sunt prea multe posibilitati si cred ca ar ingreuna programul. Dar raman altele mai unice oarecum.
Si chestia asta nu o poti rezolva din fereastra de ortografie, pentru a ajunge cuvantul acolo, mai intai trebuie sa fie recunoscut ca fiind gresit.
Ar fi foarte usor pentru utilizator daca ar selecta cuvantul gresit nedetectat si apoi sa il "declare" gresit (implicit inscris in acel dictionar) cu ajutorul meniului contextual. Ar fi un fel de anti-DEX Dar daca e munca multa, un simplu fisier text al carui continut, daca se regaseste in text, sa apara in fereastra de Ortografie, chiar daca nu are variante. Evident ca asta ti-ar prinde bine si tie. Eu o sa incep sa pastrez dictionarele de la cuvintele adaugate in dictionar manual si cel de mai sus. Acestea vor ajunge la tine, iar tu vei putea integra continutul lor direct in program apoi. Tot asa cum faceai cu listele alea de cuvinte pe care ti le dadeam inainte.
P.S. De butonul ala e vorba ) Chestia e ca atunci cand il folosesc pentru vizualizarea formatarii, Page Break-urile nu apar de nicio culoare, e doar un simbol de paragraf si atat.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Intai trebuie sa fii foarte sigur ca acele cuvinte sunt 100% gresite in orice context. Sunt unele cuvinte care si mie imi par gresite la prima vedere dar cand le pun in contextul adecvat merg. Apoi, vezi tu, as putea pune o comanda in meniul contextual pentru asta. Dar sunt 2 lucruri de avut in vedere: - nu multi o vor utiliza, deoarece de regula ii intereseaza sa corecteze textul nu sa "colecteze" asemenea cuvinte pentru a mi le trimite; - in meniul contextual, barele de unelte, meniul principal etc. de regula trebuie puse comenzile mai des utilizate, altfel vor deveni "stufoase" si nu vor fi utilizate cu placere de cei mai multi utilizatori...
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
Cosmin, N-aş vrea să te supăr, dar aş avea două comentarii: - prima: la ultimul executabil, cel postat astăzi, eu nu mai văd în Configurare Punctuaţie OCR Plus opţiunea aia cu compresia imaginilor... neam, deloc, de nicio culoare. Mă refer la cea pe care a reclamat-o Jullien şi care apărea afişată peste fereastra de setare. N-am fost atent... ai scos-o ca să o implementezi mai târziu? ori ar trebui să fie aici şi nu se vede?...
- a doua... scuze, da' asta e mai aiurea şi trebuie să mă explic. Mulţi useri au început să-i atribuie lui AutoCorect însuşiri pe care nu le are. Unii dintre aceştia, au descoperit relativ recent programul şi-l foloses pentru "finisări" texte corectate, ceea ce ştim foarte bine că este o mare eroare.
Deşi am postat multe avertismente în care arătam că după rularea AutoCorect este musai corectura manuală, foarte mulţi useri au senzaţia că-mi dau şi eu cu părerea aşa de dragul conversaţiei şi au început să ruleze dicţionarele AutoCorect peste versiuni corectate... am văzut chiar cărţi V3.0 rulate în AutoCorect şi postate ca versiune superioară... M-am gândit că ar fi mai credibilă avertizarea dacă ar veni direct de la programul AutoCorect şi nu de la un user...
Eu am o idee, dar nu ştiu dacă se poate implementa şi câtă muncă ar implica implementarea ei. Mă gândeam la introducerea unei ferestre de avertizare la începutul rulării.
La acest moment rularea automată se realizează astfel: 1. Userul accesează din meniul principal opţiunea "OCR Plus >> Rulează toate funcţiile" 2. În acest moment se deschide fereastra numită "Rulare automată OCR Plus" în care se face activarea şi setare opţiunilor de rulare automată.
Propun modificarea astfel: 1. Userul accesează din meniul principal opţiunea "OCR Plus >> Rulează toate funcţiile" 2.În acest moment se va deschide o Fereastră de Avertizare care va informa utilizatorul că AutoCorect face o precorectură a OCR care trebuie urmată în mod obligatoriu de corectură manuală princi citire şi că folosirea lui în cazul versiunilor corectate [poate] produce erori. Textul de avertizare îl vom stabili ulterior dacă propunerea se poate implementa. În partea de jos a ferestrei propun să existe două butoane: "Continuă" şi "Renunţă" Doar dacă acţionăm butonul "Continuă", atunci va apărea fereastra "Rulare automată OCR Plus" şi cele cunoscute. Dacă se acţionează butonul "Renunţă", atunci programul revine la fereastra principală.
Cred că este mult de muncă, mai ales că apar elemente grafice. E chiar aşa cumplit ceea ce am propus?
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
O sa-ti raspund deocamdata doar la prima ca-s cam obosit acu. La cealalta ma mai gandesc nitel pina maine... Optiunea nou implementata am intentionat de prima data s-o bag la Configurare >> General >> Documente, asa cum apare si in acea imagine acu cateva postari... Acolo o gasesti...
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Poate se adauga si cele 2 optiuni cu convertirea de diacrtitice prin lista aia de optiuni OCR
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
@Seven
Referitor la a doua parte a mesajului tau. Cred ca se pate implementa, da, cu o mica modificare: ferestra respectiva sa aiba si un loc de pus bifa ca sa nu mai apara data viitoare. Nu e necesar sa plictisim utilizatorul cu acest mesaj de fiecare data, e suficient cred sa-l facem sa-l citeasca cel putin o data. Adica in stilul mesajului cand se incearca adaugarea de diacritice pe automat. I se aduce la cunostinta ca mai e ceva de facut dupa, stie acum si poate sa dezactiveze mesajul.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
jullien_alphonse
Pe lista neagra
Inregistrat: acum 17 ani
|
|
Sugestie pt gasirea unei solutii de implementare in AC a CORECTURII AUTOMATE, (fara aprobare de catre user, si fara sugerare de catre AC) a punctelor de suspensie.
Am testat azi pe text, si am vazut ca AUTOCORECT sugereaza CORECT adaugarea unui pct langa cele 2 puncte ratacite.
SUGESTIA AC se poate transforma direct in OPERATIE AUTOMATA.
Recapitulez ideile... o parte din ''metodologia'' de mai jos CRED CA este deja rezolvata)
1. in Tabla de Materii, Cuprins (CONTENTS) documente, intalnim multe puncte (sa le spunem ''de suspensie''), ca in exemplul de mai jos:
Introducere .............................. pag. 8 Cuprins.................................... pag 13 Incheiere................................. pag. 217
- propunere:
Reducerea numarului punctelor de suspensie la STRICT trei puncte, adica:
. . .
Nu ne intereseaza pastrarea numarului paginii, intrucat NOI vom determina acest numar, functie de formatul A4, A5, in care FORMATAM documentul final.
Plus ca formatarea CUPRINSULUI se poate face ulterior manual /automat din word.
2. Transformarea TUTUROR secventelor .,. ,., (SI desigur, si a combinatiilor de 4, sau 5 sau ''en-şpe'' puncte si/sau virgule ) in STRICT TREI PUNCTE DE SUSPENSIE.
Atentionare. La convertirea in Elipsis ni se transforma gruparea de trei puncte separate in ELIPSIS.
DAR nu NI se vor transforma in ELIPSIS 4 sau mai multe puncte.
Personal, consider CA elipsis ne incurca un pic.
Pentru simplificare, propun eliminarea notiunii si operatiilor de convert IN elipsis din ''portbagajul'' AUTOCORECT, intrucat complica SI corectura automata ulterioara in word.
3. Dupa terminarea (corectura automata) primelor 2 etape, si deci, DUPA reducerea nr. punctelor la STRICT 3, trebuie rezolvate situatiile = oricare din combinatiile . si ,
- de ex., combinatia Anyletter.,Spatiu poate ramane ASA, intrucat este foarte des intalnita. etc., obs., op. cit., O.K.,
- combinatia INVERSA AnyLetter,.SPATIU se poate transforma automat (cu bune rezultate) in simpla VIRGULA-spatiu, AC eliminand automat punctul, iar litera urmatoare (minuscula / majuscula) ramanand NESCHIMBATA, si in plus, AUTOCORECT semnaland automat o eventuala combinatie , ENTER care e corectabila la ELIMINARE RANDURI RUPTE.
Daca hotarati ca secventa AnyLetter,.SPATIU sa o transformati in SIMPLU PUNCT, e foarte posibil ca litera urmatoare SECVENTEI sa se transforme in majuscula (datorita setarilor userilor), iar un eventual ENTER/Paragraph sa consfinteasca TERMINAREA paragrafului (uneori in mod eronat).
NOTA ulterior userul va adauge SIMBOLUL POTRIVIT/CORECT, manual, la corectura FINALA dupa original.
4. Dupa rezolvarea acestor probleme la final, acolo UNDE MAI RAMAN doua puncte (''ratacite'') . . SPATIU AUTOCORECT POATE INTRODUCE AUTOMAT TREI puncte de suspensie in loc de doua. Si sunt convins ca nu va gresi prea mult.
Modificat de jullien_alphonse (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Jullien, trebuie să mai "rumeg" un pic fiecare din situaţiile prezentate. În principiu, sunt de acord cu o parte dintre propuneri, dar mă cam încurcă o altă parte dintre propuneri. Cred că va trebui să găsim o formulă de compromis. Deocamdată, doar două probleme.
Prima problemă: Renunţarea definitiv la opţiunea cu convertirea în Elipsis ar atrage după ea nefuncţionarea în parametrii corecţi a altor opţiuni.
Dacă această convertire încurcă la corectarea în Word [în acest moment nu-mi dau seama în ce situaţii ar încurca, dar nu neg acest lucru] putem face la sfârşitul programului o reconvertire din Elipsis în trei puncte.
Să mă explic: Dacă nu s-ar face mai întâi conversia punctelor de suspensie în Elipsis, atunci la opţiunea de majusculare la început de frază care urmează după punct urmat de spaţiu, s-ar majuscula şi frazele [propoziţiile] care încep după punctele de suspensie. După câte ştim, în beletristică, în cele mai multe cazuri, majuscularea după punctele de suspensie nu trebuie făcută. Am făcut mai întâi conversia punctelor de suspensie în Elipsis exact din acest motiv, pentru ca ultimul punct de la punctele de suspensie să nu fie confundat cu un simplu caracter "punct". Acum, când activăm opţiunea Majusculă la început de frază care urmează după punct, nu se va face majuscularea frazelor care urmează după Elipsis, ci doar a acelora care urmează după un simplu punct. Bineînţeles că mai sunt erori, deoarece alte câteva forme de aranjamente de puncte şi virgule se corectează în Elipsis, doar la următoarea opţiune, numită "2.4 Corectare suplimentară Elipsis". Opţiunea asta rulează pe baza dicţionarului CO_Elips.imd. şi în acest dicţionar putem adăuga orice altă grupare care nu este înregistrată încă. Eu deocamdată am prins în dicţionar aranjamente de 3 şi 4 caractere formate din puncte şi sau puncte şi una sau maxim două virgule. În dicţionar se poate adăuga orice grupare care ne este de folos.
În principiu nu am fost de acord ca doar două caractere fie punct+punct sau punct+virgulă să fie convertite în Elipsis; astfel de situaţii sunt doar semnalate dar nu am propus înlocuire nici automată, nici cu confirmare, pentru că mi s-a părut corect ca le să fie corectate atunci când se face compararea cu originalul.
A doua problemă: Multe puncte de suspensie [precum cele de la cuprins] să se transforme în doar 3 puncte. E corect ceea ce spui. La cuprins fac şi eu exact acest lucru. Mai există însă o situaţie în care avem multe puncte de suspensie care trebuie să rămână în aceeaşi formă; este vorba de puncte de suspensie dintre diferite frahmente al cărţii, care marchează lipsă de text faţă de original sau transferarea subiectului în timp sau/şi spaţiu. Din acest motiv, mă gândesc că transformarea unui număr mare de puncte în doar 3 puncte trebuie să se facă cu confirmarea utilizatorului şi nu în mod automat. Modificarea asta s-ar putea face în ultimul dicţionar al programului, numit CO_Var4.imd... doar că există o problemă.... trebuie să găsim soluţia ca toate aceste situaţii să fie convertite, ori numărul de puncte poate fi diferit, astfel că ar fi nevoie de multe înregistrări... dar ne vom mai gândi la soluţie...
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Marc > Mare
Inlocuirea asta ar trebui sa fie cu confirmare. Atunci cand e cu litera mare cel putin.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Multumesc Seven.
Am implementat afisarea mesajului:
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Ai dreptate, ar arata mai bine cu un rand gol intre cele 2 parti.
Altceva: stiu ca pentru profesionisti "OCR brut" are sens dar pentru un novice s-ar putea sa fie mai greu sa inteleaga ca e vorba de un text obtinut dupa scanarea unei carti. Nu e rau nici scris asa dar poate gasim o exprimare mai "generala" care sa fie un pic mai pe intelesul tuturor...
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Eu ma gandeam la un termen si mai general precum "texte obtinute prin scanare cu programe OCR" (e doar un exemplu, nu zic sa-l utilizam in aceasta forma). Dar merge si asa, e ceva mai bine.
PS: si cred ca acordul ar trebui facut cu "tip" nu cu "texte"... E ca si cum spui "texte de tip OCR brute"... Sau ar merge "texte necorectate de tip OCR".
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Cred că ai dreptate... Trebuie o formulare mai clară, dar şi mai detaliată.
Eu m-am gândit că atenţionarea trebuie să se adreseze celor ce digitalizează cărţi dar care e posibil să nu cunoască foarte bine funcţiile şi opţiunile programului. Pentru aceştia atenţionarea propusă ar fi putut fi suficientă.
Am uitat însă că implementarea meniului în programul standard va face ca toţi utilizatorii "clasici" ai AutoCorect să poată accesa meniul OCR Plus, fără ca aceştia să ştie ce înseamnă OCR, fie el brut sau necorectat.
În cazul ăsta, cred că atenţionarea ar trebui să înceapă cu o frază suplimentară, suficient de clară, din care să rezulte că meniul OCR Plus este destinat/creat special pentru utilizatorii care digitalizează cărţi. Privind situaţia din acest punct de vedere, cred că expresia "texte obtinute prin scanare cu programe OCR" este mult mai clară decât "OCR necorectat".
Cred că trebuie să găsim o nouă formulare pentru atenţionare, astfel încât să fie suficient de clară şi pentru cei ce nu ştiu ce este acela un OCR şi care nu cunosc nimic despre digitalizare.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Cred ca e suficient de clar, da...
O mica sugestie de modificare: "lb. română, dar pot realiza şi modificări nedorite asupra cuvintelor".
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Nu e suficient: Nu rulati aceasta optiune pe un text deja formatat si corectat! Rezultatele variaza!
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Este foarte bine. Paragrafele sunt suficient de "aerisite", iar informaţiile par că vin în trepte... ceva de genul: "dacă ai înţeles până aici, atunci citeşte mai departe pentru a afla o informaţie în plus." Pare destul de scurt, dar şi suficient de clar. Eu cred că e destul de bine aşa. Sper că şi utilizatorii să fie de aceeaşi părere.
LE: utilitasetveritas, Să-mi fie cu iertare! nu sunt de acord cu tine, deşi, probabil sună destul de răutăcios ceea ce scriu, dar e părerea mea sinceră. Nu cred că trebuie oferit totul pe tavă, deşi s-a făcut asta din plin. Sunt convins că e de datoria fiecăruia să se documenteze asupra programului. Dacă cineva ignoră avalanşa de informaţii despre AutoCorect de pe acest forum, dacă nu se deranjează să citească nimic despre el, ci pur şi simplu se apucă direct de prelucrat texte corectate şi formatate... atunci chiar merită să obţină ce va obţine.
Sunt destule informaţii în limba română pe forum; trebuiesc doar citite. Sunt mulţi useri care s-au chinuit cu programe complet necunoscute, cu meniuri în limbi străine, inclusiv în rusă şi nu numai... şi, dacă aceştia şi-au dorit cu adevărat să afle cum funcţionează programul, au încercat şi reîncercat şi iar au încercat... poate de sute de ori, până au reuşit.
Nu mai suntem ca acum 3 ani şi ceva, când nu aveam nici cea mai mică informaţie despre digitalizare, când cotrobăiam tot netul ca să aflăm ceva informaţii folositoare, când încă făceam OCR cu Abbyy 6 ori crop cu Photo Edit de la Ms Office 2000 şi când Scan Tailor începea să dea primele semne de viaţă sub forma lui Split Tailor 3.1... dar asta mult mai târziu. Acum, dacă cineva îşi doreşte să facă un lucru de calitate va găsi suficiente informaţii chiar pe acest forum, ca să afle cum se ajunge la calitate...
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Si o ultima sugestie de modificare: e adevarat ca marea majoritate a modificarilor asupra textului in OCR Plus se fac prin intermediul dictionarelor imd (mare parte facute de tine) dar utilizatorul obisnuit se uita, vede numai meniuri/functii/optiuni nicidecum dictionare - si va fi cam nedumerit. De aceea zic ca trebuie explicat pe undeva (aici, in Help sau altundeva) legatura dintre meniuri/functii/optiuni si dictionarele imd aferente dar totusi, acest mesaj fiind prima informatie pe care o vede utilizatorul cand acceseaza OCR Plus, cred ca ar fi indicat ca prima referire sa fie "meniuri/functii/optiuni" (pe urma se "dezvolta" despre dictionare).
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Nu stiu daca ne-am inteles. Ziceam ca poate considerati suficient ca in acea fereastra sa scrie doar:
Nu rulati aceasta optiune pe un text deja formatat si corectat! Rezultatele variaza!
Mergand pe ideea ca deja cine e interesat stie, cine nu o sa afle, doar are de unde.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Daca te folosesti de Helpul deja existent in program, nu ar trebui sa iti vina chiar asa de greu. Ai deja categoriile facute. Ceea ce ar trebui sa faci e sa iei pe rand fiecare optiune noua si sa o adaugi in categoria ei deja existenta sau sa ii creezi una noua, in speta Ocr_Plus. Iar aici nu o sa mai fie probleme cu numarul de caractere folosit, o sa ai loc sa te desfasori in voie.
Modificat de utilitasetveritas (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Seven a scris:
*** Cosmin, În legătură cu ceea ce ai spus... Eu cam aşa am încercat să explic fiecare opţiune în parte în topicul AC AutoCorect OCR_Plus – Instructiuni de folosire. La fiecare opţiune în parte am specificat dacă rulează pe bază de cod şi/sau pe bază de discţionar, care e dicţionarul, cam ce conţine şi în final recomandare de activare fără probleme a opţiunii, ori activarea cu pridenţă şi după ceva experienţă.
|
Da, si ai facut o treaba foarte buna. Dar trebuie sa tii cont si de situatiile cand utilizatorul nu consulta Help-ul online si/sau Help-ul AutoCorect ci porneste direct programul. In acest caz informatiile din acest mesaj ar trebui sa fie cat mai potrivite cu ceea ce "vede" el, urmand ca pe urma sa "descopere" Help-ul (online/offline). Asta e parerea mea dar daca se ajunge la concluzia ca trebuie scris "dictionare" in acest mesaj atunci lasam asa, nu-i mare problema...
|
|
pus acum 12 ani |
|
jullien_alphonse
Pe lista neagra
Inregistrat: acum 17 ani
|
|
Autocorect poate face SI corectura TEXTELOR SCRISE FARA DIACRITICE (de catre incepatori in editare text). Aceste texte nu se incadreaza la categoria OCR desi sunt aproximativ la fel de ''corecte''.
Pentru precizie, s-ar putea folosi expresia ''Texte dactilografiate / OCR, NECORECTATE"
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Cred că acum am înţeles. Vrei ca în mesajul de avertizare să nu folosim cuvântul "dicţionarele", ci o formulare de genul meniu/opţiuni... Perfect de acord. Eu "am dat vina" pe bietele dicţionare, pentru că ele vor modifica în mod sigur câteva cuvinte. Sunt de acord cu modificarea. Eu am propus doar o formulare aşa cum mi-a picat la momentul respectiv. E nirmal că poate fi modificată şi remodificată.
A... Şi... fără nicio legătură cu fereastra.... Am prelucrat de curând ceva cam mărişor şi aproape că a murit computerul la opţiunea 2.2. Corectare linie de pauză şi dialog. Am văzut că a durat foarte mult timp mesajul "caut Em dash". Când am rulat 12.1, opţiunea cu schimbarea spaţiului de după linia de dialog în spaţiu neseparator, am constata că a făcut zero înlocuiri. Înţeleg că această convertire a spaţiunui în spaţiu neseparator a rămas implementată şi la opţiunea 2.2, aşa cum a fost ea iniţial.
Mă gândeam dacă nu ar fi mai bine ca această convertire să se facă doar la 12.2, unde poate fi activată sau nu. Consumă ceva timp această convertire şi poate că unii useri ar prefera să o dezactiveze, pentru a o rula mai târziu sau pur şi simplu ar dori să facă modificarea în Word la finalul corecturii.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
La momentul respectiv da, am combinat inlocuirea cu EMDash si spatiu neseparator pentru a micsora timpul de prelucrare pe total. Asta deoarece inlocuirea propriuzisa ia mare parte din timp, indiferent ca inlocuiesti un caracter sau doua caractere consecutive. Deci daca inlocuiesti de 2 ori timpul se dubleaza.
Daca zici ca EMDash-urile sunt scanate bine (si deci codul nu va avea ce inlocuiri sa faca) respectiv spatiul neseparator dupa EMDash sa nu fie folosit implicit atunci dezactivarea manuala a 12.1 sau chiar transformarea 12.1 in optiune neactivata implicit va micsora timpul de procesare pe ansamblu.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Eu mă gândeam aşa: – la opţiunea "2.2 Punctuaţie >> Corectare linii de PAUZĂ şi linii de dialog" să lăsăm opţiunea aşa cum este acum, dar scoţând din ea convertirea din spaţiu obişnuit în spaţiu neseparator. – la opţiunea "12.1 Setări finale >> Înlocuire spaţiu după linia de dialog cu spaţiu neseparator - nu facem nicio modificare.
Practic la 2.2, dicţionarul care rulează înaintea codului, face foarte multe modificări, convertind toate tipurile de liniuţe [însoţite sau nu de alte caractere] în Em dash; Dacă partea de cod ar face doar convertirea liniuţelor, atunci timpul de rulare ar fi scurt, deoarece majoritatea convertirilor sunt deja făcute. Eu cred că rularea acestei opţiuni durează foarte mult pentru că partea de cod trebuie să reia absolut toate liniuţele şi să facă convertirea spsţiilor. Personal cred că dacă 2.2. se modifică astfel, timpul de rulare al 2.2 + 12.1 nu ar fi mai mare decât cel necesar pentru 2.2 în actuala formă. Dacă luăm în calcul faptul că 12.1 am putea alege să nu ruleze, atunci timpul de rulare total se poate reduce.
Nu contest că e posibil ca ipotezele şi judecata mea să fie eronate, dar cred că merită să fie luată în calcul.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
In acest mod, daca 12.1 e activata iar codul are si de inlocuit liniute cu EMDash, pe ansamblu timpul de procesare va fi mai lung deoarece va face mai multe inlocuiri consecutive. Daca 12.1 e dezactivata manual, da, se micsoreaza timpul de procesare. Dar daca utilizatorul va folosi setarile implicite atunci doar cand nu e de inlocuit nicio liniuta cu EMDash se va obtine acelasi timp, in rest va dura mai mult.
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Nu, nu toate convertirile de liniute la 2.2 se fac cu dictionar, se fac si cu cod. Acu cateva luni era problema ca se faceau inlocuri cu EmDash foarte incet si atunci le-am facut in cod + am combinat cu conversia spatiului normal cu cel neseparabil si a mers mai rapid.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am o idee mai neortodoxa: daca 12.1 e activata sau dezactivata sa influenteze si daca sa puna sau nu spatiu neseparator dupa EMDash la 2.2. In acest fel se impusca 2 iepuri: se obtine viteza maxima in orice situatie iar utilizatorul are control daca sa puna sau nu spatiu neseparator dupa EMDash. Ce parere aveti
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Adică 12.1 să fie un fel de opţiune de setare pentru 2.2 ?... Dacă se poate aşa ceva, mie chiar îmi place. E un fel de "unde dai şi unde crapă".
Foarte serios vorbind, ortodoxă sau neortodoxă la rularea automată a întregului meniu, varianta asta este doar o chestie de cod, invizibilă pentru utilizator. Practic, rezultatul este exact cel aşteptat de utilizator, doar că procesarea nu se petrece unde crede el, ci în alt loc. Marele câştig este că 12.1 poate fi dezactivată manual. Cine o dezactivează înseamnă că ştie şi de ce o face.
Am, totuşi, o întrebare sau chiar două: - dacă rulăm 12.1 în mod independent, adică accesăm numai această opţiune? asta înseamnă că va rula 2.2 cu convertirea spaţiilor ori nu se întâmplă nimic? - dar dacă rulăm independent 2.2...
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Daca le rulam independent (nu cu rularea automata) atunci nu vor avea legatura una cu alta.
Bine, daca la rularea automata se decide ca 12.1 sa influenteze 2.2, la rularea independenta a 2.2 probabil ca ar trebui dezactivata convertirea spatiilor normale de dupa EmDash in neseparabile. Ce parere ai?
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Bine, atunci maine dimineata ma apuc sa implementez...
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
M-am apucat de implementat, e deja facuta pe jumatate cand din teste a iesit ceva ciudat. Am o linie de test care incepe asa: - cuvant. Dupa rularea 2.2 arata asa: — - cuvant. Am facut ceva teste si inlocuirea primului spatiu se face de catre inregistrarea 110 din CO_LinD.imd: spatiu obisnuit e trecut in EmDash la inceput de paragraf + potrivire perfecta. Probabil cand se ruleaza intr-un OCR brut nu apar situatii de acest gen dar oricum poti sa verifici te rog Seven...? Ca o paranteza: vad ca in acest dictionar folosesti mult "Pp" (potrivire perfecta) desi nu ai litere. Potrivirea perfecta are sens sa fie utilizata numai ca sa se faca diferenta intre majuscula si minuscula.
PS: se pare ca problema apare doar la rularea 2.2 nu si la rularea automata. Totusi poate ar trebui oleaca optimizate functiile/dictionarele si pentru rulare independenta - in caz ca cineva le ruleaza asa.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Am terminat de implementat. Uite o versiune de test.
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Da. Înregistrarea 110 din Co_LinD.imd [CO_LinD.imd] produce această modificare. Această înregistrare trebuie eliminată din cele două dicţionare.
În legătură cu condiţia Pp. Între timp am înţeles că la acest dicţionar această condiţie nu este necesară, dar m-am gândit că nu va produce efecte negative; de aceea nu am mai eliminat-o. Dacă există posibilitatea ca ea să producă efecte negative, atunci am să modific dicţionarul şi am să o elimin condiţia Pp.
Cred că explicaţia pentru efectul de mai sus are legătură cu implementarea codurilor [ ^_ ^+ ^= ^a ^l ^L ^t ].
Înregistrarea voia să înlocuiască succesiunea acestor două caractere ^_ cu EmDash, atunci când se aflau la început de paragraf. După implementarea codurilor, această succesiune a devenit codul pentru spaţiu obişnuit şi programul, în realitate caută spaţiu şi nu respectiva succesiune de caractere.
Efectul negativ al înregistrării a fost descoperit tocmai acum, deoarece la rularea automată în opţiunile din primul pachet sunt şterse spaţiile de la început de paragraf; pe de altă parte, înregistrarea nu are şi un efect pozitiv - deci trebuie ştearsă pentru că nu se mai justifică.
Caracterul ^ însoţit de alte caractere mai apare şi în alte câteva înregistrări. Voi verifica dacă nu există situaţii similare în care succesiunea este interpretată ca fiind cod.
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
*** Caracterul ^ la început de rând trebuie rezolvat cumva pentru că el apare în două mari situaţii, dar trebuie să mă mai gândesc la un mod de rezolvare care să nu producă efecte secundare.
Am constatat în ultimul rând, în special la Abbyy 11, o eroare frecventă în care sunt recunoscute şi reproduse astfel de caractere la început de rând. Când pe cartea tipărită litera Î mare are o mărime mai mare decât celelalte caractere, practic "căciula" lui Î se află cumva deasupra rândului. Din această cauză Abbyy face mai întâi o recunoaştere separată a acestor "căciuli", astfel că vom obţine rânduri formate din unul sau mai multe caractere ^ după numărul de litere Î mare care se află pe rândul respectiv, după care Abbyy face pe rândul următor recunoaşterea textului, doar că acum Î mare este văzut ca I mare, deoarece "căciula" a fost deja recunoscută. La antrenamentul Abbyy nu am găsit posibilitatea de întindere a încadrării caracterului astfel încât să cuprindă toată litera, astfel că singurul lucru ce poate fi făcut în acest moment este să se elimine rândurile care conţin doar un caracter ^sau mai multe.
A doua situaţie era când caracterul ^ apare la începutul unui rând care conţine text, de regulă în zona apropiată a liniei de dialog. Cred că se poate elimina separat numai acest caracter la început de paragraf şi scoase din dicţionarul de mai sus combinaţiile cu el, pentru a evita interpretarea unui cod.
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Vorbesti de ^_ adica de spatiu obisnuit, nu? In ce sens trebuie rezolvat..?
PS: a, acum am vazut editarea ulterioara facuta de tine la postare...
Modificat de ciuperca_cosmin (acum 12 ani)
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
jullien_alphonse
Pe lista neagra
Inregistrat: acum 17 ani
|
|
Referitor la erori de recunoaştere ABBYY - caciulite Î, etc un pont :
- Daca scanarea e ok smecheria principala pt obtinere OCR de CALITATE este
RESIZE jpg la peste 4700 pixeli verticala, 600 dpi.
Adancimea dpi obisnuita de 300 rezultata din scanare se poate converti la DPI de 600 sau chiar 1200 cu IRFAN, odata cu prelucrarea Resize sau cu SCAN TAILOR (dubland LA SALVARE rezolutia jpg introduse)
- NUMAI pt jpg continand text -
dati resize jpg cu IRFAN sau ACDSEE lăţind imaginea pe orizontala cu 25 %, fara a păstra proporţia FIXA între dimensiunile verticala si orizontala - jpg.
Ex: unui jpg cu proportia de 17x24 ii mariti DOAR latimea (17) cu 25 la suta imaginea dv ajungand la proportia de 21 X 24.
Acuratetea creste semnificativ, mai ales in cazul NOTELOR de subsol.
Pt caciulitza lui Î, daţi resize VERTICALEI cu +25 la sută, pastrand orizontala neschimbata.
|
|
pus acum 12 ani |
|
ciuperca_cosmin
VETERAN
Din: Bacau
Inregistrat: acum 13 ani
|
|
Cum n-au aparut probleme la testare, ultimul exe poate fi folosit de toti:
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|
utilitasetveritas
Pe lista neagra
Inregistrat: acum 12 ani
|
|
Nu se pot ignora cazurile de genul asta:
???
|
|
pus acum 12 ani |
|
Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
|
pus acum 12 ani |
|