BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
Centralizator despre ce ar mai trebui făcut pentru îmbunătăţirea meniului OCR Plus:
1. De adăugat la meniul actual "Marcare caractere" submeniul "consoane independente": 1.1 - de marcat ŞI pentru literele CONSOANĂ MAJUSCULATE [acum evidenţiază numai minusculele] 1.2 - şi consoanele - cu literă mare şi mică - care conţin diacritice: Ş, ş, Ţ, ţ, [atât cu cedilă cât şi cu virgulă – ca să meargă în ambele variaţii, sper că merge]. 1.3 - de marcat şi literele: Î, î precedate şi urmate de spaţiu 1.4 - de marcat litera I literă mare în configuraţia "spaţiu""I""spaţiu" deoarece uneori ea este convertită greşit din semnul întrebării. Eroarea apare frecvent atunci când tiparul lasă spaţiu între ultima literă din cuvânt şi semnul mirării.
2. De adăugat la meniul actual "Marcare caractere" pentru submeniurile atât pentru cărţi obişnuite cât şi pentru cele tehnice: - să marcheze caracterele « şi »
3. Implementarea unui nou submeniu la meniul "Marcare Caractere" intitulat "Marcare cifre arabe" care să marcheze cifrele arabe: 0123456789. De ce? Pentru că: - la unele cărţi capitolele sunt doar cifre arabe fără titlu - în carte mai sunt ani care este posibil să fie eronaţi 1986 să fie 1966 – trebuie verificat cu pdf-ul, sau cifre care indică ora, longitudinea, greutatea etc. - există şi numerele de pagină care ne ghidează în corectare, mai ales atunci când numărul paginii nu este delimitat de un rând gol, ci efectiv numărul este amestecat cu textul.
Exemplu: "Un murmur înăbuşit se ridică din toate colţurile sălii. J3e întâmpla atât de rar, era atât de extraordinar ca Fouquier să ceară achitarea cuiva, încât toată lumea credea că a înşelat-o auzul."
4. Implementarea unui nou submeniu la meniul "Marcare Caractere" intitulat "Marcare cifre romane" care să marcheze cifrele romane care fac referire la secole dar şi la numerotarea capitolelor unei cărţi – XIII, LI, IX, XXI, XVIII etc. etc. care de obicei apar eronate. Cred că ar fi mai uşor marcarea literelor MAJUSCULATE aflate una lângă cealaltă – adică a grupurilor de litere care sunt majusculate.
5. Implementarea unui nou submeniu la meniul "Marcare Caractere" intitulat "Marcare erori de punctuaţie" care să: 5.1 marcheze erorile de punctuaţie:
!.. ?.. :.. ;.. !?. .?! ;: :! ?: ?; ,! ;, !,. ,.! .,? ., -: ;- .! .. .!. .?. .:. .;. ?!. !.? :; ;! :? ,? !, ,: ,!. .. ,.? .: :- !. ?. ..! ..? ..: ..; .!? ?.! !: !; ;? ?, ,; :, .,! ,?. ,. :. -; .., .?
5.2. marcheze "i…" (cu elipsis) dar în configuraţia "spaţiu""i""elipsis".
Exemplu: "Desigur, de-ar fi văzut râsul ironic, din ultimul moment, ce-l avea pe buze Fouquier, n-ar mai fi fost atât de fericit şi încrezător i…"
6. La meniul actual "Înlocuieşte toate liniile de pauză" nu este introdusă posibilitatea înlocuirii liniilor de pauză urmate de virgulă. Ar trebui introdusă.
7. Problema liniilor de pauză de tip EmDash, EnDash şi Horizontal Bar mărginite de litere, NU şi cratima, ex.: 7.1 - "pentru corector —un reper de pagină" 7.2 - "pentru corector— un reper de pagină" 7.3 - "pentru corector—un reper de pagină"
Ar trebui ca în cazul în care linia de pauză este lipită de literă să introducă un spaţiu: - din "literă""spaţiu""linie de pauză""literă" în "literă""spaţiu""linie de pauză""SPAŢIU""literă" - "literă""linie de pauză""spaţiu""literă" în "literă""SPAŢIU""linie de pauză""spaţiu""literă" - "literă""linie de pauză""literă" în "literă""SPAŢIU""linie de pauză""SPAŢIU""literă"
8. Eliminarea semnelor de punctuaţie care se află înaintea cuvintelor, dar numai acolo unde este precedată de "marcaj de sfârşit de paragraf". Secvenţa ar fi înlocuirea din: "marcaj de sfârşit de paragraf""semn de punctuaţie – oricare ar fi el""spaţiu" în "marcaj de sfârşit de paragraf". ATENŢIE! Meniul sau codul ar trebui să ruleze ULTIMUL după submeniul "Rupere rânduri care încep cu dialog aflate în interiorul paragrafelor". Dacă este pus mai sus ar putea da erori.
Exemple: " — Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc. . Şi se plimba încolo şi încoace gânditor. Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"
"— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc. , Şi se plimba încolo şi încoace gânditor. Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"
"— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc. ; Şi se plimba încolo şi încoace gânditor. Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"
"— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc. : Şi se plimba încolo şi încoace gânditor. Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"
"— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc. ! Şi se plimba încolo şi încoace gânditor. Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"
"— Bine, bine! zise Fouquier; m-ai învins – trebuie să mărturisesc. ? Şi se plimba încolo şi încoace gânditor. Soldaţii veneau cu o nouă trupă de nenorociţi, pentru a-i prezenta în sala de şedinţă. Înainte de execuţie…"
9. Unele paragrafe [sau propoziţii] la sfârşitul lor nu au semne de punctuaţie: punct, punct şi virgulă, semnul întrebării sau exclamării. Aceste paragrafe fie au o virgulă pusă eronat în locul punctului ori nu au nimic. Întrebare este posibil evidenţierea-marcarea ultimului cuvânt sau literă din paragraf? Şi evident evidenţierea virgulei de la sfârşitul paragrafului? Evident numai la paragrafele care se încheie fără semne de punctuaţie.
Exemple: "— Să facem lucrurile bine, ca să nu ne scape puicuţa. În ultimul moment, murmură el. Eu o să mă postez la un colţ al străzii, tu la celălalt colţ; aşa, vom şti exact încotro se duce, şi nu vom risca să n-o prindem — Bravo ţie, măi frate! zise Samulon. Tu eşti un voinic fără seamăn! Pipin ţiganul avu un rîs satanic."
"— Să facem lucrurile bine, ca să nu ne scape puicuţa. În ultimul moment, murmură el. Eu o să mă postez la un colţ al străzii, tu la celălalt colţ; aşa, vom şti exact încotro se duce, şi nu vom risca să n-o prindem, — Bravo ţie, măi frate! zise Samulon. Tu eşti un voinic fără seamăn! Pipin ţiganul avu un rîs satanic."
10. Unele paragrafe încep cu puncte de suspensie urmate de spaţiu.
Exemplu: "Trecu prin „spărtura” zidului, de unde se urcă pe scara secretă luminată ca ziua… … I se păru că aude o voce şi paşi de om. Scoase imediat creionul de fier din zăvor: în acelaşi moment, zidul se închise cu un zgomot înfundat, lugubru… … Dar Călăul se înşelase crezând că vocea venea din pivniţa secretă. O auzi acum mai tare, mai desluşit ca înainte."
Am în vedere că "trei puncte" a fost deja convertit în elipsis. Secvenţa ar fi: înlocuieşte "marcaj sfârşit de paragraf""elipsis""spaţiu" cu "marcaj sfârşit de paragraf""elipsis". Ar trebui să arate aşa:
"Trecu prin „spărtura” zidului, de unde se urcă pe scara secretă luminată ca ziua… …I se păru că aude o voce şi paşi de om. Scoase imediat creionul de fier din zăvor: în acelaşi moment, zidul se închise cu un zgomot înfundat, lugubru… …Dar Călăul se înşelase crezând că vocea venea din pivniţa secretă. O auzi acum mai tare, mai desluşit ca înainte."
11. Problema sfârşit de pagină sau page break, şi sfârşit de secţiune, de eliminat – eventual cu bifare pentru a putea activa opţiunea atunci când avem un OCR, şi debifare atunci când avem un text la care nu dorim eliminarea sfârşitului de pagină sau sfârşit de secţiune. Ar putea fi implementat în "Convertiri preliminare".
12. Problema rândurilor goale mă refer la 2 sau mai multe rânduri care ar trebui convertite într-un singur rând. Rândul gol pare la prima vedere o greşeală dar de obicei acest rând reprezintă trecerea de la o pagină la alta şi reprezintă pentru corector un reper de pagină. Acest rând gol îl va şterge corectorul în mod manual. În text rândul gol mai reprezintă şi graniţa între text şi strofe sau versuri. Ar putea fi implementat în "Convertiri preliminare".
13. De implementat propunerea lui Cosmin mai complicată tehnic: "consi- deram", înlocuieşte cu "consideram" prin scanarea textului de către cod… [rămâne la aprecierea lui Cosmin dacă se poate implementa]
14. De implementat meniul "Convertire linii de dialog"
15. De implementat meniul "Convertire ghilimele". Acest meniu ar trebui să convertească ghilimelele româneşti în tot felul de ghilimele, cred că sunt vreo 3-4 feluri de ghilimele.
Am numerotat propunerile cu ce ar mai fi de făcut deoarece aşa este mai uşor de ţinut evidenţa.
@ lucifer76 - o să actualizez eu acel dicţionar deoarece am mai strâns câte ceva.
@ Cosmin - referitor la Rularea meniului OCR Plus în mod automat şi corect-cronologic, eu îl văd aşa - nu ştiu dacă se poate implementa: fiecare meniu şi submeniu ar trebui să aibă o pătrăţică pentru bifat iar la apăsarea butonului "Rulare dicţionare bifate" să ruleze numai meniurile bifate.
Modificat de BlankCd (acum 12 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|