Seven
Moderator
Din: Ţara Perfectului Simplu
Inregistrat: acum 14 ani
|
|
■ 12. SETĂRI FINALE
12.1. – Înlocuire spaţiu după linia de dialog cu spaţiu neseparator 12.2. – Corectare cuvinte rupte şi înlocuiri cu confirmare
12.1. – Înlocuire spaţiu după linia de dialog cu spaţiu neseparator Opţiunea este implementată prin cod, iar numele său este suficient de sugestiv. Programul înlocuielte spaţiul obişnuit de după fiecare linie de dialog cu spaţiu neseparator [Nonbreaking Space]. Rolul înlocuirii este unul estetic.
Este important de reţinut că această opţiune se poate rula separat [fără accesarea întregului meniu OCR Plus], şi în cazul textelor corectate. Prin corectarea manuală este posibil să mai introducem linii de dialog în text, acolo unde nu au fost recunoscute de Abbyy, iar aceste linii de dialog să fie urmate de spaţiu obişnuit. Dacă vom avea un text rtf corectat şi accesăm în mod independent numai această opţiune, textul nu va suferi alte modificări, ci se vor face doar înlocuirile spaţiilor obişnuite de după linia de dialog şi doar în poziţiile în care este cazul.
Sunt câteva opţiuni care se pot accesa separat în orice moment al etapei de corectură şi chiar după corectură, fără a afecta structura textului şi fără a produce modificări ce ar trenui verificate manual. De cele mai multe ori este necesară o rulare suplimentară a unora dintre aceste opţiuni după corectarea textului; aceste opţiuni sunt următoarele: 1.1 Conversii preliminare >> Conversie dialog bullets în dialog text 1.3 Conversii preliminare >> Eliminare tab şi spaţii multiple 1.4 Conversii preliminare >> Eliminare spaţii la început de paragraf 12.1 Setări finale >> Înlocuire spaţiu după linia de dialog cu spaţiu neseparator
În afara de aceste 4 opţiuni se mai pot rula cu oarece atenţie şi opţiunile din pachetele 7 şi 8. 7. Înlocuieşte toate liniile de pauză cu >> EmDash / EnDash / Horizontal Bar 8. Înlocuieşte toate liniile de dialog cu >> EmDash / EnDash / Horizontal Bar
12.2. – Corectare cuvinte rupte şi înlocuiri cu confirmare Opţiunea se bazează pe rularea a 4 dicţionare de înlocuire multiplă şi a suferit de-a lungul timpului mai multe modificări, fapt pentru care pare atipică, deoarece are două părţi: ■ partea care corectează "cuvintele rupte", adică acele cuvinte care apar scrise în mod eronat cu cratimă, ca urmare a faptului că în cartea pe hârtie cuvintele erau despărţite [rupte] la capăt de rând; corectarea acestor cuvinte se bazează pe rularea dicţionarelor CO_Var1.imd ÷ CO_Var3.imd. ■ partea care face înlocuiri cu confirmare şi care rulează dicţionarul CO_Var4.imd.
Corectare cuvinte rupte În cartea pe hârtie, respectiv în imaginea scanată a unei pagini, o serie de cuvinte sunt despărţite la capăt de rând. În aceste cazuri avem 3 elemente: prima parte a cuvântului, cratima şi a doua parte a cuvântului. După cum este şi normal, prima parte a cuvântului se află la sfârşit de rând şi este însoţită de cratima care marchează faptul că se face "ruperea" cuvântului; partea a doua a cuvântului ocupă prima poziţie pe rândul următor şi nu este însoţit de cratimă. Atunci când Abbyy face extragerea OCR, textul îşi schimbă structura rândurilor, în sensul că rândurile pot fi, de regulă, mai lungi decât cele din cartea originală, astfel că unele dintre cuvintele rupte se vor afla undeva la mijlocul rândului şi în mod corect ele trebuie să fie complete şi fără cratimă, deoarece Abbyy este instruit să lipească cele două părţi ale cuvântului rupt la capăt de rând şi să elimina cratima care marchează despărţirea. Abbyy face recunoaşterea corectă a unora dintre aceste cuvinte, în sensul că în OCR cuvântul apare întreg şi fără cratimă; în acelaşi OCR unele recunoaşteri se fac în mod eronat, astfel că respectivele cuvinte apar în text cu cratimă; uneori cratima este lipită de ambele litere, alteori cratima este lipită doar de o parte a cuvântului şi apare inserat un spaţiu între cratimă şi cealaltă parte a cuvântului.
Să presupunem că pe cartea tipărită, fraza următoare, în care apare cuvântul "trebuincioase", este scrisă astfel: "În urma acestei propuneri se apucară amândoi să pregătească cele trebuin- cioase pentru prânzul zilnic."
Cuvântul "trebuincioase" poate fi recunoscut de către Abbyy în mod corect, adică în forma: "În urma acestei propuneri se apucară amândoi să pregătească cele trebuincioase pentru prânzul zilnic." sau poate fi recunoscut eronat în varianta cu cratima lipită de ambele părţi ale cuvântului trebuin-cioase, ori în varianta în care cratima este lipită de o parte a cuvântului dar are inserat spaţiu între cratimă şi cealaltă parte a cuvântului, adică sub forma trebuin- cioase sau sub forma trebuin -cioase.
Până la acest moment, cele trei dicţionare corectează cuvinte rupte în care cratima este lipită de ambele părţi ale cuvântului; deocamdată nu se fac corecţii pentru cuvinte la care este inserat şi spaţiu lângă cratimă. Numărul de înregistrări este încă destul de mic; corecţiile care se fac sunt structurate astfel:
■ Cu dicţionarul CO_Var1.imd se fac în principal corecţii ale unor verbe în forma de gerunziu; s-a luat în calcul despărţirea între ultima şi penultima silabă şi despărţirea între penultima şi antepenultima silabă. Astfel, pentru cuvinte precum: necăjindu-i, rotunjindu-le, vrăjindu-ne... s-au făcut înregistrări cu condiţiile "Cuvânt întreg la sfârşit" + "Potrivire perfectă" -du-l du-l Ci Sc Pp -du-le du-le Ci Sc Pp -du-ne du-ne Ci Sc Pp
sau înregistrarea de mai jos care are doar condiţia "Potrivire perfectă" -jindu- jindu- Pp
■ Dicţionarul CO_Var2.imd corectează cuvinte care au frecvenţă mare în text şi s-au luat în calcul toate posibilităţile de despărţire; Condiţiile sunt " dum-neavoastră dumneavoastră Ci Pc dumnea-voastră dumneavoastră Ci Pc dumneavoas-tră dumneavoastră Ci Pc
De regulă, la acest dicţionar au fost puse condiţiile: "Cuvânt întreg la ambele capete" + "Păstrează capitalizarea", ceea ce înseamnă că se vor face înlocuiri ale cuvintelor întregi care pot fi scrise atât cu minusculă, cât şi cu majusculă
■ Dicţionarul CO_Var3.imd face corecţii pentru cuvinte compuse cu sufixe şi care sunt rupte în zona finală, deci la sfârşit de cuvânt, cum ar fi exemplele de mai jos: -bilor bilor Ci Sc Pp -cilor cilor Ci Sc Pp -dilor dilor Ci Sc Pp Ca şi în cazul primului dicţionar, condiţiile folosite sunt "Cuvânt întreg la sfârşit" + "Potrivire perfectă".
Înlocuiri cu confirmare Dicţionarul CO_Var4.imd, care este şi ultimul ce rulează în cadrul meniului OCR Plus, execută numai modificări cu confirmare. Pentru fiecare situaţie găsită în text de computer care îndeplineşte condiţiile şi poate fi modificată, este necesar acceptul sau refuzul utilizatorului. Înregistrările sunt prevăzute cu condiţii speciale, care reduc căutările la situaţii foarte concrete. Astfel, unele căutări se vor face doar între cuvinte scrise cu orice literă minusculă, dar nu şi cifre etc... Aceste condiţii puse înregistrărilor vor fi analizate în mod special atunci când vom discuta modul de editare a dicţionarelor de înlocuire multiplă.
În principiu, au fost mutate în acest dicţionar toate înregistrările care necesitau confirmare, chiar dacă unele înregistrări ar fi trebuit să ruleze la alte opţiuni. Scopul mutării înregistrărilor a fost acela de a evita întreruperea rulării programului la diferite opţiuni pentru obţinerea confirmărilor; s-a considerat că este mai comod pentru utilizator ca programul să ruleze în mod continuu şi toate intervenţiile utilizatorului să fie făcute în partea finală a procesării.
Există patru categorii de modificări cu confirmare înregistrate în dicţionar, astfel:
– cuvinte foarte scurte scrise eronat cu majusculă iniţială sau finală în interiorul frazei: Cu >> cu, CU >> cu, Şi >> şi, Un >> un, aI >> al, aI >> ai, Ia >> la, I-a >> l-a, ou >> cu, ou >> eu. Aceste situaţii este posibil să nu apară în anumite texte, dar pot exista în altele, în funcţie de calitatea OCR.
– patru înregistrări ce ţin de corectarea cifrei 1 cu litera L mic şi a cifrei 0 cu litera O mic; cifrele 1 sau 0 trebuie să fie lipite de o cratimă, care la rândul ei este lipită de orice literă mică, dar nu şi de o cifră. Înregistrările au fost mutate din dicţionarele care rulau la opţiunea 4.2 pentru a nu opri rularea programului la acea opţiune pentru cererea confirmărilor. —1 >> -l, -1 >> -l, —0 >> -o, -0 >> -o Teoretic, înlocuirea cifrelor 1 şi 0 cu literele L mic şi O mic sunt rezolvate în totalitate la opţiunea 4.2. Aceste înregistrări au fost puse pentru situaţii excepţionale, ca o măsură de siguranţă în plus, astfel că în mod normal ele nu ar trebui să apară la rularea opţiunii.
– perechi de cuvinte asemănătoare ca formă [paronime], care nu pot fi modificate fără confirmare deoarece este posibil ca în text să fie valabilă oricare dintre cele două forme ale cuvântului. clacă >> dacă, clar >> dar, clin >> din, clădea >> dădea, lot >> tot, lotul >> totul, miner >> mâner, minerul >> mânerul. Mai mult ca sigur o parte dintre aceste înregistrări, dacă nu chiar toate, vor găsi în text situaţii care îndeplinesc condiţiile căutate, astfel că utilizatorul va trebui să confirme sau să infirme modificările propuse de program.
– elemente scurte ce ţin de dialogul francez, care nu se pot modifica fără acceptul utilizatorului şi care au fost mutate din dicţionarul de la opţiunea 4.7 pentru a nu întrerupe programul pentru cereri de confirmare. ! I >> ! i, ! Le >> ! le, ! O >> ! o, ! Se >> ! se, ? I >> ? i, ? Le >> ? le, ? O >> ? o, ? Se >> ? se. Aşa cum am arătat la opţiunea 4.7, utilizatorii care nu au activat opţiunea 4.7, pentru aceste 8 înregistrări, în fereastra de confirmare vor acţiona butonul "Renunţ" pentru ca programul să renunţe la căutări şi înlocuiri.
Recomandare personală: setare ACTIVĂ
Modificat de Seven (acum 12 ani)
_______________________________________
Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.
| TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK | | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA | | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY | | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |
|
|