BlankCd
MEMBRU DE BAZA
Inregistrat: acum 14 ani
|
|
--->
@ Seven - stai liniştit, deocamdată suntem la faza de căutare probleme, propunere rezolvare probleme, încercare rezolvare probleme şi implementarea lor etc. etc. Cu cât se înaintează cu meniurile cu atât vor apărea probleme care vor da peste cap meniurile actuale, se vor comprima unele meniuri [sper să nu mă înjure ciuperca_cosmin], altele vor necesita adăugiri-corectări; din cauza numărului mare de meniuri care trebuiesc rulate, apare problema ergonomiei meniurilor [adică uşurinţa rulării lor - o să revin mai jos cu observaţii] etc. Deci mai este mult de muncă... şi de testare.
@ colegi de topic
Alte observaţii: Precizare: toate aceste observaţii personale, pe care încerc să le spun, nu sunt "structurate" în mintea mea ca un tot unitar-coerent-cronologic, ele sunt spuse de mine oarecum haotic - în funcţie de ce observ - şi reprezintă mai mult un sumar al problemelor ce ar trebui rezolvate. Este posibil să revin cu modificări asupra meniurilor realizate de ciuperca_cosmin.
Propuneam anterior marcarea cu roşu a apostrofului, a unor combinaţii de semne de punctuaţie - am început eu o listă pe care am postat-o în pagina anterioară a acestui topic -, este bine ca acestea să fie rulate împreună cu marcarea cu roşu a ghilimelelor. Ar mai trebui marcate cu roşu următoarele: paranteze rotunde deschise şi închise, paranteze pătrate deschise şi închise, acolade închise şi deschise, semnele / şi \ , «, şi » precum şi _ , la care aş mai adăuga: < adică less-than sign > adică greater-than sign › adică single right-pointing Angle Quotation Mark ‹ adică single left-pointing Angle Quotation Mark Toate aceste semne ar trebui rulate cu meniul actual "Marcare ghilimele cu roşu" [sper că nu am uitat vreun semn]. Evident toate aceste semne colorate vor fi recolorate cu culoarea "Automat", de către corector MANUAL.
O altă problemă MAJORĂ încă nediscutată: este vorba de bullets sau pe româneşte spus, marcatorii pe care în mod accidental OCR-ul le pune în locul liniilor de dialog... sau care sunt puse intenţionat de useri. Am identificat 4-5 astfel de posibili "inamici": cratima, EmDash, EnDash, Horizontal Bar şi Symbol: 190 [adică tot un fel de EmDash]. Nu ştiu dacă AutoCorectul poate converti aceste tipuri de bullets cu obişnuitul EmDash. S-ar putea?
Problema ergonomiei meniurilor: Acum sunt 11 meniuri [sunt şanse să mai crească] care trebuiesc rulate. Rularea lor corectă-cronologic, depinde de user sau de factorii ambientali care pot influenţa acest lucru sau de combinaţia useri + factorii ambientali. Prin factori ambientali denumesc orice acţiune accidentală sau nu, care întrerupe userul - la un moment dat - în timp ce rulează dicţionarele. Să spunem că userul a rulat deja 3 meniuri, meniul 4 rulează şi în acest moment sună telefonul, sau vine iubita să-l sărute de dimineaţă, cu drag... El este distras de acest lucru şi se gândeşte doar la cum o va duce pe iubita lui în pat... După 2-3 minute îşi aduce aminte că trebuie să se întoarcă la AutoCorect. Acesta a terminat rularea meniului şi a anunţat printr-o fereastră că a terminat. ATENŢIE! În fereastra apărută nu spune CARE meniu a fost rulat, fereastra "AutoCorect" spune doar că a terminat. Userul distras, a uitat unde a ajuns cu rularea meniurilor, acum el poate crede - eronat, evident - că a rulat TOATE meniurile, sau poate crede că mai are de rulat doar un meniu... Cine poate ştii ce este în capul lui? Acum începe să ruleze cine ştie ce meniuri în cine ştie ce ordine... Rezultatul este că va avea un text mai prost decât crede el. În faza asta - parcă am mai spus - este util ca meniurile din OCR_PLUS să aibă fiecare câte o căsuţă de bifare - majoritatea meniurilor vor fi bifate default - iar sub ultimul meniu să fie butonul "Rulează dicţionare bifate" care va rula dicţionarele bifate. Cu acest lucru se rezolvă: - problema userului "boboc" sau "avansat", care foloseşte "haotic" şi nu cronologic-ordonat, meniul "OCR_PLUS" - problema userului distras de factorii ambientali - problema userului "uituc" sau "cu capul în nori" - problema userului nou, care nu cunoaşte AutoCorectul, el putând astfel rula complet şi corect programul, rezultând un text acceptabil şi mult mai bun - lasă posibilitatea userilor mai avansaţi să poată bifa ce anume vor să folosească - aici mă gândesc la preferinţele userilor în ceea ce priveşte formatare liniilor de dialog şi a liniilor de pauză, care vor putea fi bifate în orice configuraţie; şi altele. - lasă posibilitatea userilor mai avansaţi - Ex.: care au un text care nu necesită rularea completă a meniului OCR_PLUS - să bifeze doar "Marcare ghilimele cu roşu", deoarece a observat că în textul său lipsesc ghilimele de deschidere la unele propoziţii. Astfel AutoCorectul va fi un program adaptabil pentru orice fel de user mai avansat sau începător, care va mulţumi pe toată lumea. Momentan am făcut eu o schiţă provizorie care ar arăta cam cum ar trebui să arate meniul OCR_PLUS, cu meniurile bifate şi cu butonul "Rulare dicţionare bifate".
Altă problemă, tot majoră aş spune, este prezenţa în OCR-uri a cuvintelor care au în componenţa lor 2 cratime!!! Una din ele este eronată şi va trebui scoasă. Exemplu cuvântul "spunân-du-se" [teoretic TOATE cuvintele ar putea avea 2 cratime]. Ar trebui ca AutoCorectul - nu ştiu dacă merge cu "Înlocuire cu confirmare" - ca acolo unde există 2 cratime într-un cuvânt, programul să arate cratimile din acesta şi în funcţie de cuvânt să poţi elimina MANUAL una din cratime. Apoi AutoCorectul ar trebui să arate următorul cuvânt cu două cratime... s.a.m.d.
L.E.: Rugăminte:
Aş avea nevoie de un OCR cât mai mizerabil cu putinţă, cu multe erori, artefacte de OCR etc., pentru a testa AutoCorectul. Dacă vreun user are un astfel de OCR îl rog să mi-l pună la dispoziţie.
Modificat de BlankCd (acum 13 ani)
_______________________________________ ---> "Eu nu am regrete, Iar dac-ai să-ntrebi ce-a rămas la mine, În inimă am urme de tine Regrete, eu nu am regrete..."
|
|