Forum Romania Inedit
Romania Inedit - Resursa ta de Fun
Lista Forumurilor Pe Tematici
Forum Romania Inedit | Inregistrare | Login

POZE FORUM ROMANIA INEDIT

Nu sunteti logat.
Nou pe simpatie:
dela_dela la Simpatie.ro
Femeie
25 ani
Bucuresti
cauta Barbat
24 - 48 ani
Forum Romania Inedit / Totul despre cărți - About e-books / RIF2/2015 Standard versionare eBook Moderat de Seven, Stelevadris, cuculean, naid, uncris
Autor
Mesaj Pagini: 1
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

       STANDARDUL DE VERSIONARE RIF2 - IANUARIE 2016



       În mai 2010 s-au realizat timp de o lună de zile dezbateri pentru realizarea unui standard de versionare a cărţilor care s-a finalizat cu stabilirea standardului RIF1.
       Aceste discuţii pot fi urmărite pe topicul Initiativa de reglementare a Cartilor electronice – mai 2010
       În baza acestui topic am realizat un Extras care a fost postat pe topicul RIF1 2010 Standard versionare

       Mai întâi trebuie menţionat că Standardul RIF nu este obligatoriu pe forum, el nu este o regulă, ci doar cumulează un pachet de convenţii pentru a ne putea înţelege între noi cu privire la starea tehnică şi de calitate a cărţilor postate.
       Cine nu doreşte să lucreze după standardul RIF, este liber să o facă, cu condiţia să posteze informaţiile necesare cu privire la fişierele pe care le postează.

       Deoarece lucrurile au evoluat între timp, cred că este necesară o reluare a discuţiilor privind modificarea şi îmbunătăţirea standardului RIF.

       Voi reda mai jos Standardul RIF1, pentru a avea un punct de pornire pentru a realiza un nou standard RIF2 / 2015.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

                  ═══════════════════════════════════════════

                  CODIFICAREA VERSIUNILOR CĂRŢILOR ELECTRONICE

                                    STANDARD: 
R.I.F. 1 / 2010 
                  ═══════════════════════════════════════════


    Codificarea versiunilor cărţilor electronice, în funcţie de etapa de realizare în care se află sunt arătate mai jos.
    Aceste coduri se trec la sfârşitul numelui cărţii, exact ca în cazul versiunilor unui program de calculator. De subliniat că ele se înscriu în paranteză pătrată sau rotundă.
      Notă: Schimbarea formatului unui text prin convetirea de la un format la alt format (rtf -> doc -> pdf etc) nu înseamnă că s-a făcut o versiune superioară - versiunea se referă la corectură şi nu la format, versiunea se păstrează indiferent de format.


                  ═════════ CORECTURI AUTOMATE ŞI SEMIAUTOMATE ═════════

    NC sau V0.1  = înseamnă "necorectat", adică OCR brut, aşa cum este el extras de programul Abbyy sau alt program de tip recognito. Se poate folosi şi expresia  [OCR]  sau  [OCR_brut]

    V0.2÷ V0.8  = este un OCR asupra căruia s-au făcut o serie de îmbunătăţiri: corecturi automate sau semiautomate, scoaterea  artefactelor (imagini eroare, pete, linii, caractere nonalfabetice şi noncifrice etc.) Aceste versiuni arată un OCR perfectibil.
    Stabilirea versiunilor V0.2 ÷ V0.8 este la dispoziţia persoanei care face aceste corecturi sau a echipei din care face parte şi are rolul de a evidenţia îmbunătăţirile făcute asupra textului, atunci când ele nu sunt făcute în totalitate.

    V0.9  = este OCR-ul "perfect", asupra căruia s-au făcut un număr maxim de corecturi şi înlocuiri automate şi semiautomate, dar nu s-a făcut corectură prin citire; această versiune păstrează numerele pagină;
      Notă: numerele de pagină au rol de coordonate, pentru o mai uşoară orientare concomitentă în text şi pdf-ul din imagini.
      Atenţie: Această versiune arată un OCR PERFECT; ea nu trebuie acordată cu uşurinţă oricăror texte asupra cărora s-au făcut câteva intervenţii.



                  ══════ CORECTURI MANUALE PRIN CITIREA TEXTULUI CAP-COADĂ ══════

    V1.0  = corectura de fond sau corectura de conţinut este o corectură amănunţită, prin citirea+corectarea cuvânt cu cuvânt, pagină cu pagină a textului, prin compararea cu originalul (cartea pe hârtie sau pdf_img). Versiunea [V1.0] implică formatarea textului, evidenţierea capitolelor etc.
      Notă: nu se recomandă despărţirea pe silabe în această fază, ci după versiunea finală, eventual după sau pentru convertirea în diferitele formate pentru e-readere.

    V2.0; V3.0; V4.0. Atunci când altcineva mai ia o dată cartea la citit+corectat, mai adaugă o unitate la versiune. Se referă la corecturi privind semnele de punctuaţie, litere lipsă sau în plus etc. Acestea sunt corecturi de formă a textului, fără a mai face confruntarea cu originalul.
      Din practică rezultă că şi aceşti corectori trebuie să aibă acces la original, pentru că uneori pot să apară situaţii critice, care necesită confruntarea obligatorie cu originalul şi, eventual, cu alte ediţii.
      Notă: Este obligatoriu ca fiecare versiune de la [V1.0] la [V5.0] să fie făcută de câte o altă persoană. Prima cifră a versiunii arată şi numărul de persoane care au făcut corectura prin citire de la cap la coadă a cărţii.
      Recitirea+corectarea de mai multe ori a textului de către aceeaşi persoană nu va majora versiunea textului decât cu o zecime de unitate, astfel că o versiune V1.0 poate deveni V1.1; V1.2... V1.9, dar, sub nici o formă, nu va deveni versiunea V2.0.
       
    V5.0  = cartea corectată şi formatată la o calitate care i-ar permite să plece la tipografie.

      La cărţile electronice ultima etapă este convertirea într-un format de tip pdf sau formate speciale, care nu se mai pot sau nu ar mai trebui să poată fi modificate (editate).


                  ══════ FORMATĂRI ESTETICE, PROFESIONALE ŞI ÎN FORMATE SPECIALE ══════

      Formatări estetice: În funcţie de preferinţe, după executarea corecturilor se pot face formatări speciale cu scop estetic, prin:
      - adăugarea de ornamente topografice alb-negru sau color:
      - adăugarea de imagini alb-negru sau color;
      - adăugare de fundaluri (background de tip gradient, texture, pattern sau picture) ori borduri (borders).
      - Formatarea cu fonturi artistice a capitolelor ori a altor părţi din text etc. etc...


                  ═════════════════════════════════════════════════════════════════


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
       Din punctul meu de vedere sunt necesare câteva modificări şi completări:

           • ar trebui reorganizată partea care se referă la versiunile necorectate - de la OCR BRUT la [V0.9].
       Am constatat că foarte mulţi useri au folosit aproape exclusiv notarea [V0.9] pentru a versiona un OCR. Chiar dacă noi am definit versiunea [V0.9] ca fiind "OCR-ul perfect", deci un OCR către care se tinde, dar la care nu se poate ajunge, foarte mulţi au considerat în mod justificat că au atins perfecţiunea, deşi postau de cele mai multe ori un simplu OCR brut.

           • cred că ar trebui clarificate câteva lucruri privind corecturile fără scan control şi a versiunilor "oficiale"

           • de asemenea, cred că în afara versiunilor, se poate adăuga la acest standard şi câteva reguli de postare a cărţilor; mai exact, minimul necesar de informaţii care trebuzie să însoţească linkul unei cărţi.

       Probabil sunt multe alte lucruri ce se pot discuta, aşa că aştept din partea tuturor propuneri ce ne pot ajuta să îmbunătăţim calitatea postărilor pe forum.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
modificat

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 15 ani

Seven a scris:

***
      [V0.2] sau [OCR_AC+] = este un OCR care a fost rulat prin AutoCorect OCR Plus, s-au rulat toate dicţionarele OCR_DIC şi Uzuale, dar nu s-au făcut confirmările de la dicţionarele finale [CO_Var5.imd - CO_Var7.imd].

     
      [V0.4] sau [OCR_AC+] = este un OCR care a fost rulat complet în AutoCorect OCR Plus, şi la care s-au făcut corecturi pe diagonală şi/sau formatări de text.


Cred ca trebuie sa corectezi ceva aici, apare OCR_AC+ in ambele cazuri.


pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Postare mutată de pe topicul Colaborări...

     @Seven a scris:

     Eu cred că cel mai bine ar fi sănu modificăm nicio versionare la cărţile postate anterior.
     Data postării ne spune singură ce standard a fost luat în calcul.
     Dacă începem să facem modificări, nu vom mai şti ce standard am folosit.

     Referitor la chestia cu [V0.9]:
     eu mă gândeam ca de acum să nu mai punem versiunea [V0.9], care este oricum falsă; [V0.9] nu există pentru că el este un OCR la care s-au făcut toate pregătirile posibile şi nu se mai poate îmbunătăţi nimic, doar că n-a fost citit; de aceea a fost numit OCR-ul perfect; el nu poate fi obţinut pentru că se tinde spre perfecţiune, dar ea nu se atinge niciodată.
     Eu cred că pentru cel mai prelucrat OCR este suficientă o versionare [V0.5].

     Practic, atunci când am pornit discuţiile despre versionare, voiam să propun ca versiunile necorectate, deci cele sub [V0.9] să le numim cu litera "N" de la "necorectat", dar m-am gândit că  complicăm prea mult lucrurile.
     Cred că trebuia să insist pentru că adeseori văd un OCR [V0.2] şi mă gândesc la o versiune corectată [V2.0]. Dacă am avea [N0.1], [N0.2]... [N0.5] n-ar mai confunda nimeni.


     Referitor la versiunile corectate "FS" şi "V"
     M-am gândit că "FS" poate ţine locul lui "V" din [V1.0], [V2.0], [V3.0], [V4.0], [V5.0] şi asta înseamnă că s-a făcut corectura prin citire cuvânt cu cuvânt, că nu s-au constatat cuvinte sau fragmente lipsă, că totul pare OK, dar nu am avut un scan-control pentru confruntare.

     Trecerea de la "FS" la "V" se poate face oricând, atunci când vom face o confruntare.
     Dacă vom corecta un "FS" cu confruntare, rezultatul va fi un "V" la nivelul următor.
     Mai exact, dacă avem un [FS 1.0] şi-l vom corecta cu confruntarea originalului, cartea va avea versiunea [V2.0]. După corectarea cu confruntare a unui [FS 2.0] vom obţine un [V3.0] şi tot aşa.

     Atenţie! Au existat două variante de versionare; cel mai vechi, se scria între paranteze rotunde şi cu cu litera "v" minusculă , iar vechea (v1.0) era de fapt carte pregătită la perfecţie, dar necorectată, ceea ce mai târziu a însemnat [V0.1 - V0.9].
     Deci standardul RIF se scrie între paranteze drepte şi cu "V" majusculat, iar cel mai vechi sistem se scria între paranteze rotunde şi cu "v" minusculă.

     Ca să nu încurcăm lucrurile, cel puţin o perioadă de timp ar fi bine să scriem alături de versiune şi standardul folosit.
     Astfel, am putea avea o carte notată astfel:

             Zaharia Stancu – Şatra   [V1.0] – standard RIF2.

     Încă o dată, vă propun şi vă rog să nu refacem standardizarea la cărţile vechi, pentru că ne vom încurca mai rău.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 9 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Postări preluate de pe topicul Colaborări...

     @tuf a scris:

Deci:

Seven: "M-am gândit că "FS" poate ţine locul lui "V" din [V1.0], [V2.0], [V3.0], [V4.0], [V5.0] şi asta înseamnă că s-a făcut corectura prin citire cuvânt cu cuvânt, că nu s-au constatat cuvinte sau fragmente lipsă, că totul pare OK, dar nu am avut un scan-control pentru confruntare.
     Trecerea de la "FS" la "V" se poate face oricând, atunci când vom face o confruntare."

OK.
Dar cum ramane cu cartile la care nu a existat scan de control, corectura s-a efectuat dupa o editie straina, ba s-a mai tradus si o pagina doua?
Raman tot in zona FS?


Legat de [V1.0] si subunitatile sale:
- ocr-ul pregatit de corectura finala e notat ca [V0.5]
- ocr-ul brut e notat ca [V0.1]
- iar stadiile intermediare nu prea conteaza.
Asta ar fi ideea?


Ai mai sus o lista de carti a autorului japonez. Consideri ca versionarea ar trebui sa ramana asa cum a fost gasita? Cu exceptia cartilor care au fost corectate recent, pe sectiune?


In topicul de autor se adauga orice material ce are legatura cu autorul, orice material corectat pe sectiune cu sau fara scan-control sau orice material lizibil fara scan de control preluat de pe net?


Totodata cred ca cerinta de a avea minim 3 carti de autor pentru a crea un topic e problematica. Duce la crearea topicurilor gen Literatura Romana si Universala. Sunt tentat sa zic ca o singura carte e destul pentru a deschide un topic de autor, cata vreme se respecta regula linkului unic.


P.S.
Apropo de japonez si pagini lipsa.
Cosimo are cam toate cartile de sus pe raft. Poate face poze la cerere a acelor pagini lipsa. Asa ca luati legatura cu el si spuneti-i unde e buba.
Intru-cat aveti interes asa de mare fata de autor, o sa incerc sa il caut pe la biblioteca.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Postări preluate de pe topicul Colaborări...

     @sebastianmihail a scris:


Seven a scris:

     Atenţie! Au existat două variante de versionare; cel mai vechi, se scria între paranteze rotunde şi cu cu litera "v" minusculă , iar vechea (v1.0) era de fapt carte pregătită la perfecţie, dar necorectată, ceea ce mai târziu a însemnat [V0.1 - V0.9].
     Deci standardul RIF se scrie între paranteze drepte şi cu "V" majusculat, iar cel mai vechi sistem se scria între paranteze rotunde şi cu "v" minusculă. [/b]


Ăăăă, cred că m-ai bulversat. Nu ştiu dacă am ţinut cont întotdeauna de chestia asta, din cauză că nu întotdeauna îmi plac parantezele pătrate. Chestie de estetică. Sau să scriu cu V mare.
Asta schimbă cu totul paradigma.
Deja mi se pare că noi complicăm prea mult lucrurile. Pînă şi versionările pentru filmele de pe torenţi sunt mai puţine.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     @sebastianmihail, nu cred că este vreo problemă că nu ai ţinut cont de tipul de notare a parantezelor. Fii convins că cei mai mulţi nu au ţinut cont de acest lucru. Cei care s-au obişnuit să pună versiunea între paranteze drepte sunt cei care au urmărit discuţiile din 2010.

     Eu am menţionat acest lucru doar pentru a sublinia faptul că nu e bine sp facem o corectare a versiunilor la cărţile postate deja. Şi, în plus, am vrut să arăt că despre versiuni se tot discută de circa 6 ani.
     De fapt, ţin să subliniez că standardul de versionare nu este obligatoriu şi nu poate fi obligatoriu.
     Acest standard este doar o convenţie între cei care doresc să aibă un limbaj comun pe forum.

     De ce a apărut chestia cu versionare?
     Pe forum erau tot felul de cărţi, de la OCR brut la corecturi de înaltă calitate, aşa cum erau cele "semnate Gux".
     Ca să ştim dacă o carte este corectată şi poate fi citită,ori dacă este un simplu OCR cu toate răgăliile [artefactele] sau unul cu răgpliile şterse dar tot necorectat, am simţit nevoia să menţionăm acest lucru direct pe forum la cărţile pe care le postam.
     Unul dintre cei mai vechi useri, dar şi cu mare experienţă în digitalizare,ne-a spus ceva despre versionare. Astfel am aflat că o carte poate conţine informaţia despre corectură chiar în titlu.
     Cum ne aflam în faza în care deja se corectau cărţi pe forum, personal am fost foarte interesat de versionare şi l-am întrebat pe acel prieten despre regulile de versionare. El mi-a pus la dispoziţie adresele câtorva saituri [străine - dacă mai e nevoie să subliniez] pe care erau postate astfel de reguli şi luând nişte informaţii de ici, altele de colo, am schiţat un proiect de standard pe care cei ce corectau l-au însuşit relativ repede.

     De ce s-a modificat modul de versionare?
     Aşa cum am spus, foloseau versionarea userii care corectau... La acelmoment corectorii nu depăşeau numărul de degete de la două mâini.
     Deşi primele idei de standardizare au apărut pe forum, primul standard complet a fost adoptat pe primul grup de pe forum.
     Între timp versionarea a fost preluată de alţi useri de pe forum...

     În 2010 împreună cu Aleph am deschis discuţia şi am încercat să facem sistemul de versionare ceva mai logic şi mai simplu, aşa că am adoptat o variantă puţin diferită de cea adoptată pe grupul Tigri.
     Discuţia a ţinut o lungă perioadă de timp şi la final am propus standardul RIF1.
     Practic, Aleph şi cu mine am încercat să propunem un standard mai simplu, dar nu speram că el va fi preluat de userii de pe forum, mai ales că multe persoane erau ferm împotriva folosirii versionării şi spuneau acest lucru pe forum în mod deschis şi chiar cu o anume violenţă.
     Timpul a dovedit că iniţiativa a fost mult mai importantă decât am crezut noi şi versionarea a fost acceptată de majoritatea userilor.

     Eu cred că orice lucru este perfectibil şi poate fi oricând perfecţionat.
     Referitor la standarde deorice fel, cred că se impune respectarea unei reguli simple: să nu se aplice retroactiv şi să nu se distrugă nimic din ceea ce afost făcut la un moment dat.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani

      PROPUNERI DE MODIFICARE


      VERSIONAREA TEXTELOR NECORECTATE

      Propun renunţarea la notaţiile [V0.1] ÷ [V0.9] şi în mod special la versiunile [V0.6] ÷ [V0.9].
      Notaţia [V0.9] a fost folosită în exces şi fără justificări, de multe ori în spatele unei notaţii [V0.9] fiind un OCR_BRUT.
      Dacă a mai făcut cineva o îmbunătăţire a unui fişier notat astfel, a apărut aberanta notaţie [V0.9.9] sau chiar [V.0.9.9.9].
      Dacă vom prelucra un OCR notat cu [V0.9xxx], îl putem reversiona după principiile de mai jos.


      Pentru simplificarea notaţiei OCR-urilor am avut în vedere două lucruri:
           – folosirea literei N de la "necorectat" în locul literei V de la "versiune", pentru a elimina complet confuzia între versiunile OCR şi versiunile corectate.
           – faptul că în prelucrarea unui OCR sunt posibile următoarele etape de lucru:
                – etapa I – extragerea OCR
                – etapa a II-a – rulare automată prin AutoCorect OCR Plus;
                – etapa a III-a – rulare Completă în AC OCR+, cu confirmarea tuturor înregistrărilor din dicţionarele [Var1 ÷ Vt4]; plus alte dicţionare personale;
                – etapa a IV-a – perieri în Word: alte înlocuiri Find&Replace, corectură pe diagonală...
                – etapa a V-a – formatarea minimală a textului: scoaterea în evidenţă a titlurilor, subtitlurilor, redimensionarea imaginilor inserate în text [dacă este cazul]... crearea de Index de nume specifice şi dicţionar "dic" suplimentar [dacă e cazul], alte formatări, inclusiv formatare pe stiluri [dacă userul lucrează cu stiluri]. Practic în această etapă se pot face toate prelucrările posibile cu scopul de a uşura corectura.

      În conformitate cu cele de mai sus, am putea avea următoarea versionare pentru textele necorectate:

      OCR_BRUT sau [N0.1] = înseamnă "necorectat", adică OCR brut, aşa cum este el extras de programul Abbyy sau alt program de tip recognito.
      Recomand folosirea expresiei [OCR_BRUT] sau  [BRUT]deoarece aceste formulări sunt mult mai sugestive decât [N0.1] şi nu se pot produce niciun fel de confunzii.

      [N0.2] sau [OCR_AC] = este un OCR care a fost rulat prin AutoCorect OCR Plus, dar s-au rulat doar dicţionarele OCR_DIC şi Uzuale, cu rulare automată, dar fără a face confirmările de la dicţionarele finale [CO_Var5.imd - CO_Var7.imd].

      [N0.3] sau [OCR_AC+] = este un OCR care a fost rulat prin AutoCorect OCR Plus, s-au rulat toate dicţionarele automate, dar şi cele cu confirmare [CO_Var5.imd - CO_Var7.imd], s-au făcut alte înlocuiri automate şi semiautomate.

      [N0.4] este un OCR la care după ce a fost rulat COMPLET prin AutoCorect OCR Plus, s-a făcut în plus o periere pe diagonală prin vizionarea completă sau parţială a textului.

      [N0.5] = este un OCR rulat complet în AC, plus corecturi pe diagonală şi în plus s-au făcut formatări de text, cu evidenţiere cap capitole etc... Practic acesta este un text OCR la care s-au făcut maxim de îmbunătăţiri.



      VERSIONAREA TEXTELOR CORECTATE FĂRĂ CONFRUNTAREA CU UN SCAN_CONTROL

      Legat de versionarea textelor corectate fără confruntarea cu un scan_control, propunerea mea este următoarea:

      Pentru astfel de texte propun folosirea abrevierii FS [abreviere de la "fără scan"] în locul abrevierii V [abreviere de la "versiune"].
      Cifrele care urmează sunt aceleaşi ca în cazul versionării RIF1, cifre corespunzătoare versiunilor [V1.0] ÷ [V5.0].

      Practic am putea avea:
      [FS1.0] pentru corectura prin citire cap-coadă de o primă pesoană...
      [FS2.0] pentru corectura prin citire cap-coadă făcută de o a doua pesoană...
      [FS3.0] pentru corectura prin citire cap-coadă făcută de o a treia pesoană...

      Dacă pe parcurs apare un scan-control şi o persoană face corectura prin confruntarea cu originalul, versiunea corectată şi confruntată va purta codul clasic de versiune, revenindu-se la codarea cu [V....], adică:
      Dacă avem un text [FS1.0] pe care îl corectăm şi confruntăm cu scanul, atunci textul obţinut va purta versiunea [V2.0]

      Practic, V arată că s-a făcut confruntarea cu originalul, iar FS arată că s-a făcut corectura fără scan_control, timp în care cifra care urmează arată câte persoane au făcut corectura manuală.

      În mod excepţional, dacă la confruntarea cu scanul vom găsi foarte multe erori [ori cuvinte sau fragmente lipsă de text], putem să notăm noua versiune cu cifre mai mici, inclusiv [V1.0]. Acest lucru îl poate aprecia doar cel care face corectura cu confruntarea textului.

      Mare atenţie la ediţiile după care a fost făcut OCR şi ediţia după care facem confruntarea: de multe ori, două ediţii diferite pot avea diferenţe de text. De aceea este foarte important ca atât OCR cât şi scanul să conţină câte informaţii esenţiale: numele traducătorului, editura şi anul apariţiei, eventual numărul ediţiei, atunci când cartea este reeditată. În acest fel vom şti sigur că un text este confruntat chiar cu cartea din care a fost extras; în caz contrar putem avea surprize neplăcute [putem chiar şterge fragmente corecte pentru faptul că facem confruntarea cu o ediţie mai veche, care ulterior a fost modificată şi îmbunătăţită].

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
stelus
Online
VETERAN

Inregistrat: acum 12 ani
Personal nu inteleg de ce e nevoie de 3 chestii. OCR (chiar nu stiu de unde vine numele, dar nu importa) il trec prin AC in vederea corectarii de catre mine. O data sau de 2 ori am apelat la useri pe aici de a-mi trece un OCR prin AC pentru a continua corectarea. Pentru mine a trece un OCR prin AC si a-l pune aici e un non-sens. Si este versionarea cea mai subiectiva, fiindca fiecare avem un mod propriu de a trece un OCR prin AC, cu mai multa sau mai putina rabdare.

Da, chestia corecturii fara scan am facut-o si inca mult, inainte de a ajunge aici, si chiar si apoi. E utila o versionare, dar cred ca e mai utila mentionarea alaturi. Stiu, problema e mai apoi, cind X l-a pus, eu il iau si nu mai pun nota alaturi.
Si cred ca mentiunea FS e mai utila, in sensul diferentierii intre ce a fost corectat cu un scan si ce e corectat fara un scan.

Parte off-topic versionare.
In a da o fata uniforma forumului si postarilor cred ca aici ar trebui sa se manifeste rolul moderatorilor. Ei pot edita mesajele noastre si da o forma unitara.
Deja au inceput acest lucru si gasesc ca este un lucru tare, tare bun.


pus acum 8 ani
   
tuf
Vizitator



@stelus
OCR= optical character recognition, adica ceea ce face Abby
Moderatorii sunt aici pentru a tine lucrurile intr-o oarecare ordine. Ei nu sunt aici ca sa simuleze ordinea prin editarea postarilor ce nu corespund nu stiu carei reguli.
Nu te agita prea mult cu discutia asta. Lucrurile tind sa fie mai simple intotdeauna. Acum e doar o discutie, un moment in care ne facem cunoscute parerile.

@Seven
FS include si cartile corectate dupa ALTE editii decat cele ale ocr-ului, in speta cele straine?

O idee legata de 0.1-0.9...
Notarea de ocr perfect poate ramane, fie ca 0.9, fie ca 0.5. Nu are importanta care dintre ele.
Orice alta versionare ce se afla sub acel ocr perfect, eu zic ca e mai bine sa renuntam la ea complet. Fara versiune.
Practic, sunt 2 versiuni concrete: cea a ocr-ului brut, cea a ocr-ului perfect.
Tot ce este cuprins intre ele este cat se poate de subiectiv si lipsit de importanta.
Cel mai simplu ar fi sa notam ocr-urile perfecte si versiunile superioare.
Orice corector serios care preia un ocr, fie el si 0.8, va proceda ca si cum l-ar fi luat de la zero. Ba unii fac asta chiar si cu faimoasele ocr-uri perfecte.

Am citit si partea in care incerci sa separi ocr-urile pe baza prelucrarii suferite (ca a fost in AC pana la optiunea 7, apoi altul a fost in Word dotat cu clopotei etc.)... e prea mare bataia de cap, prea specifica versionarea.
Eu as putea sa o urmez fara prea multe probleme, dar la altii ar fi complicat, daca nu chiar enervant.

Eu propun ca orice text aflat sub 0.9/0.5 sa nu mai fie versionat. Se va anunta pe forum ca textul a fost semicorectat si atat, iar membrii vor descarca noua versiune, care o va suprascrie pe cea deja existenta pe hard.
Puncte slabe in ideea de mai sus?


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      În fapt sunt două variante de versionare a fişierelor corectate: cu [FS] şi cu [V].

      Referitor la OCR.
      OCR este un textul obţinut prin tehnica de Recunoașterea Optică a Caracterelor [Optical Character Recognition].
      Numele OCR vine de la iniţialele numelui în engleză, Optical Character Recognition.
      Extragerea unui OCR se face cu un soft specializat pe tehnica Optical Character Recognition.
      Cel mai folosit pe forum este Abbyy, dar se folosesc şi OmniPage sau IRIS Readiris.
      Sunt şi alte softuri foarte puternice precum AdobeAcrobat, Creaceed Prizmo, CVision Maestro etc.
      Există şi softuri free şi online. Noi ne-am obişnuit cel mai mult cu Abbyy.

      Este cunoscut că cel mai bun OCR se obţine în Abbyy din imagini Gray la rezoluţia 300 dpi.
      Pe de altă parte, pe forum încercăm să postăm scanuri-control cu dimensiunea cât mai mică, astfel că la PDF/DjVu postate pe forum nu vom mai avea nici rezoluţia optimă, iar cele mai multe sca-control sunt alb-negru.
      Ei bine, dintr-un PDF/DjVu alb-negru sau gray dar cu rezoluţii reduse până la 96 dpi... nu se va mai obţine în vecii vecilor calitatea unui OCR ca cel obţinut din imagini 300 dpi gray sau color.
      Din acest motiv, userii care fac scanarea,dar nu corectează postează un scan-control redus plus un OCR obţinut la rezoluţia iniţială.
      La un astfel de OCR se pot pune versiunile corespunzătoare.
   
      În cazul lucrului în echipă, pot apărea situaţii de genul:
          - persoana A [Alin] poate face scanarea şi extrage OCR, dar n-are timp sau chef de corectură;
          - persoana B [Barbu] vrea să corecteze, dar nu are AC şi nici nu se pricepe să lucreze cu el.
          - persoana C [Costică] este un tip maileneş [nu-i place să scaneze, dar nici să corecteze] în schimb poate să prelucreze OCR-ul şi să-l pregătească astfel încât prietenul lui Barbu să aibă o muncă mai uşoară.
      În astfel de cazuri se poate folosi sistemul de versionare al OCR-urilor.
       
      Dacă versionarea propusă mai sus pare greoaie, atunci în echipă pot folosi orice metodă ca să seştie că un fişier este mai curăţat decât un altul.


      La o adică avem 3 variante de litere: N - necorectat, FS - fără scan şi V - versiune.
      Mai sunt câte 5 cifre care arată numărul etapei de lucu în cazul OCR sau numărul de persoane care au corectat textul în cazul textelor corectate.

      Dacă e prea complicat, pentru mine este suficient ca un user să spună că a făcut corectura sau conversia după fişierul lui X.

      Singurul lucru care mă deranjează este acel link în legătură cu care nu se spunenimic decât titlul cărţii şi nu-ţi dai seama cam despre ce e vorba decât după ce ai downloadat şi deschis fişierul şi ai şi defilat cu atenţie prin câteva zeci de pagini.
      Aş prefera ca userul să spună "găsit pe net şi habar n-am ce e acolo..." decât să nu ştie ce e acolo,dar să scoată o versiune din burtă...


      Şi NU. Moderatorii NU TREBUIE să intervină şi să editeze în postările oamenilor decât în două cazuri cu totul şi cu totul speciale: pentru actualizarea unui link mort al unui user care nu mai activează pe forum sau pentru a-l atenţiona pe un user...

      În rest, moderatorii se ocupă de bunul mers al secţiunii, prin toate metodele pe care i le oferă moderea, dar nu are voie şi nu trebuie sub nicio formă să reediteze postări ale userilor pentru că nimănui nu-i place să i se "pună în gură" ceva ce n-a spus
.

      Pentru că moderatorii nu au voie să editeze postări ale userilor,şe forum funcţionează funcţia de CENZURĂ. Aceasta este un fel de Find&Replace în care un cuvând necuvenit postat de un user este înlocuit cu un alt cuvânt.
      De exemplu, dacă un user postează o adresă spre o pagină interzisă [sau la care se face reclamă neautorizată] prin funcţia de cenzură adresa respectivă returnează adresa acestui forum... Sau... anumite cuvinte obscene pot returna "cuvinte paşnice". Ar fi foarte simplu ca moderatorul să şteargă direct linkul din postare sau expresiile indecente, dar foloseşte funcţia de cenzură pentru a evita să editeze postarea cuiva,iar apoi acela să arate că nu el a scris porcăriile respective, ci chiar moderatorul pentru că-i voia răul...

      Dacă astăzi sunt viu şi activ, atunci îl rog pe moderator să-mi spună ce să modific în postarea mea, iar dacă eu nu modific mă poate pedepsi,inclusiv prin ştergerea topicului.
      Atunci când nu mai sunt, da poate pune un link la locului lui pentru ca să-l vadă mai bine userii, dar sub nicio formă sănu-mi modifice cuvintele din text.

      Iată de ce fiecare user trebuie să-şi asume răspunderea pentru ceea ce postează.
      Atât ceea ce postează userul cât şi eventuala modificare a moderatorului pot fi folosite împotriva lor.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator




Seven a scris:

Singurul lucru care mă deranjează este acel link în legătură cu care nu se spunenimic decât titlul cărţii şi nu-ţi dai seama cam despre ce e vorba decât după ce ai downloadat şi deschis fişierul şi ai şi defilat cu atenţie prin câteva zeci de pagini.
      Aş prefera ca userul să spună "găsit pe net şi habar n-am ce e acolo..." decât să nu ştie ce e acolo,dar să scoată o versiune din burtă...

Asta este si opinia mea.
Totodata ceea ce se lucreaza pe sectiune trebuie separat pe cat posibil de ceea ce "pluteste" aiurea pe net, indiferent de cat de bine arata acel fisier. Un ocr+scan RI va avea mereu prioritate fata de un 5.0 luat cine stie de unde.

Atunci cand se lucreaza intr-o echipa, versionarea (in cadrul echipei) devine inutila, de regula. Fiecare membru stie ce a facut sau nu a facut celalalt. Exista un oarecare Null tehnologic.
Dar avem nevoie de ea pe forum. Intrebarea e in ce forma? Mai complexa sau mai simpla?

O sa ii trimit linkul si lui Aleph, poate are ceva idei proaspete.


pus acum 8 ani
   
cuculean
Moderator

Inregistrat: acum 14 ani
Si care ar fi castigul utilizarii lui "N"??? Unde este simplificarea???
Vorbesc din perspectiva celui care utilizeaza versionarea actuala de ceva timp, si vad doar ca se complica lucrurile prin aparitia lui N, a lui FS....

Parerea mea este ca se poate pastra V si la versiunile necorectate. Eventual V0.1 - V0.5 pentru indicarea etapei de prelucrare in care se afla materialul...

Oricum, daca cineva aduce imbunatatiri materialului, pot aparea la un moment dat notatii de genul N0.5.x exact ca si in cazul V0.9.x


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Îmi cer scuze! Mi s-a cerut părerea şi am făcut prostia să mi-o spun.
      Am crezut că e vorba de o discuţie în care se fac mai multe propuneri şi în timp se va alege varianta cea mai bună.
      Eu aşteptam propunerile altor colegi... dar, constat că pe topic nu se fac propuneri, ci se face doar o judecată a propunerii mele.
      Sunt de acord că propunerea mea este o propunere proastă... de fapt, foarte-foarte proastă, că nu trebuie luată-n seamă, aşa că eu renunţ definitiv la ea şi aştept propunerile şi hotărârea Domniilor Voastre şi apoi am să mă supun şi eu celor stabilite.     


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Aleph
MEMBRU DE BAZA

Inregistrat: acum 13 ani
Câteva păreri subiective – nu vă împiedicaţi de ele, vă rog:

tuf a scris:

Totodata cred ca cerinta de a avea minim 3 carti de autor pentru a crea un topic e problematica.

Aş face topic de autor şi cu o singură carte, cu condiţia să existe şanse să citesc şi altceva de acelaşi autor.

Seven a scris:

sebastianmihail, nu cred că este vreo problemă că nu ai ţinut cont de tipul de notare a parantezelor.

Nici mie nu-mi place cum arată parantezele drepte în numele fişierului   E (subliniez) doar chestie de gust.

Seven, partea cea mai grea eeste conceperea unei păreri (material, lucrare) noi şi coerente, că după aia e simplu ca ceilalţi să-şi dea cu părerea şi să zică „asta-i bine, ailaltă nu-mi place”. Mă gândesc totuşi că nu există alte propuneri pentru că poate nu e nevoie să modificăm sistemul de notare. Personal prefer metoda KISS (nu-ţi spun de la ce vine acronimul ), în ideea de a păstra lucrurile cât mai simple.

Mu ştiu dacă renunţarea la v0.9 e bine argumentată. Dacă dau cu tot ce pot într-un OCR, astfel încât erorile rămase să nu poată fi descoperite altfel decât prin citire, de ce să nu-i zic 0.9? Nu mai sunt pe forum versiuni 0.9.9.9 şi, prin grija moderatorilor, probabil că nici nu vor mai apărea. Pe de altă parte, nu toată lumea foloseşte Autocorectul, iar notaţiile care fac referire la el pot fi păstrate ca opţionale, cred.

Referitor la versionarea cărţilor corectate cu exemplarul tipărit în faţă sau cu varianta în limba în care a fost scrisă cartea, aş rămâne tot la notarea cu litera V, pentru că este exact acelaşi lucru cu a avea scanarea. Singura chestie care adaugă o informaţie ce-mi este utilă e notarea FS.


_______________________________________
Dacă vreunul dintre linkurile mele nu este valid, vă rog să mă anunţaţi prin MP.
Versiunile cartilor electronice - Standardul RIF1
Caractere romanesti in EPUB  De la versiunea 0.1 la versiunea 0.9 cu Word 2003 for Windows
PDF-uri foarte mici din fisierele grafice Scan Tailor  *  Clasificarea scanurilor in format DjVu

pus acum 8 ani
   
cuculean
Moderator

Inregistrat: acum 14 ani
@Seven,

Ne cunoaştem de atâta vreme, ca nici o clipă nu mi-am închipuit că intervenţia mea va fi altfel interpretată decât ca o discuţie a propunerii tale - îmi pare tare rău şi îmi cer scuze dacă ai perceput-o altfel.

Nici pe departe nu am vrut vrut să judec propunerea ta, pur si simplu, plecând de la ea, mi-am exprimat opinia că, mie personal, mi se pare că introducerea altor notaţii ar complica lucrurile în loc să le simplifice, şi totodată am făcut propunerea păstrării lui V şi pentru versiunile necorectate.

Din punctul meu de vedere mi s-ar părea mai simplă următoarea versionare:

[V0.1] = OCR brut, adica materialul extras cu programul Abbyy.
[V0.2] = este un [V0.1] care a fost rulat prin AC+, dar s-au rulat automat doar dicţionarele OCR_DIC şi Uzuale.
[V0.3] = este un [V0.2] , la care s-au rulat şi dicţionarele cu confirmare şi s-au făcut alte înlocuiri automate şi semiautomate.
[V0.4] = este un [V0.3] , plus o periere pe diagonală prin vizionarea completă sau parţială a textului.
[V0.5] = este un [V0.4] , plus corecturi pe diagonală, formatări de text (evidenţiere capitole etc...) Practic acesta este un text OCR la care s-au făcut maxim de îmbunătăţiri.

[V1.0] = corectura amănunţită a unei versiuni [V0.x] , prin citirea+corectarea cuvânt cu cuvânt, pagină cu pagină a textului, prin compararea cu originalul (cartea pe hârtie sau SCAN).
[V2.0], [V3.0], [V4.0] = versiuni superioare realizate succesiv prin citirea+corectarea unei versiune inferioare de către alte persoane - posibil să necesite compararea cu originalul - Se referă la corecturi privind semnele de punctuaţie, litere lipsă sau în plus etc. Acestea sunt corecturi de formă a textului.

      Notă: Este obligatoriu ca fiecare versiune de la [V1.0] la [V5.0] să fie făcută de câte o altă persoană. Prima cifră a versiunii arată şi numărul de persoane care au făcut corectura prin citire de la cap la coadă a cărţii.
      Recitirea+corectarea de mai multe ori a textului de către aceeaşi persoană nu va majora versiunea textului decât cu o zecime de unitate, astfel că o versiune V1.0 poate deveni V1.1; V1.2... V1.9, dar, sub nici o formă, nu va deveni versiunea V2.0.
       
[V5.0]   = cartea corectată şi formatată la o calitate care i-ar permite să plece la tipografie.

Folosirea parantezelor drepte sau rotunde este discutabila... eu le prefer pe cele rotunde.

Utilizarea [FS] ar putea sa induca in eroare, deoarece corectarea poate fi făcută cu cartea fizică în faţă, fapt ce nu-i scade "valoarea". In cazul lipsei scanarii precum si in cazul corectării după cartea în limba originala, poate ar trebui specificat acest lucru în clar.


pus acum 8 ani
   
tuf
Vizitator



Pot fi de acord si cu ce spune Aleph. Chiar si in privinta topicului de autor cu o singura carte. Dar pe moment asta e alta discutie.

Problema standardului vechi nu a fost utilizarea greoaie, ci faptul ca a fost utilizat aiurea. Adica acele ocr-uri notate ca 0.9 de persoane care nu prea intelegeau ce fac. Cam asta am inteles din ceea ce a zis Seven. (corecteaza-ma daca am inteles gresit).

Ceea ce conteaza e sa se faca distinctia intre un ocr brut si un ocr imbunatatit (total sau partial), si distinctia intre versiunile superioare.

Versiunile inferioare cuprinse intre 0.2 si 0.8 au limitari destul de evidente.
In primul rand sunt subiective.
In al doilea rand daca se incearca stabilirea unor "norme" pentru 0.2, 0.3 etc. ne lovim de problema modului de lucru individual (unii lucreaza in AC, altii in Word, altii in Librre Office si naiba mai stie ce).
In al treilea rand, daca stabilim niste "norme" legate de efectele finale ale operatiunilor efectuate in fiecare versiune inferioara... nu o sa stea nimeni sa verifice daca intr-un 0.4 chiar s-au inlocuit liniile de pauza cu linii de dialog. O sa fie descarcat doar pentru ca cineva a zis ca e o versiune imbunatatita. Eu cel putin nu am verificat niciodata. La fel si in cazul in care cineva adauga un 1.0, apoi dupa 2-3 saptamani adauga un 1.1.
Sunt destul de sigur ca notarea inferioara o sa ramana complet subiectiva, ca si pana acum, pentru majoritatea membrilor, indiferent de RIF1, RIF2, RIF3 etc. Eventual toata lumea o sa isi versioneze textul ca fiind 0.1. indiferent de ceea ce au facut sau nu in el.
In al patrulea rand, acest gen de versiune inferioara e lipsit de importanta pentru un corector, va fi tratata mereu ca ocr brut. Exceptii pot fi doar in cazul in care uploaderul e de incredere. Este posibil ca unii sa se bata cu caramida in piept pe sectiune, ca ei au facut un 0.4, desi nu e asa. Dar asta e relativ lipsit de importanta. Uploaderul nu castiga puncte pentru asta.

De abia la 0.9 in sus cred ca incepe lumea sa se mai uite si la ceea ce a descarcat, si daca e intr-adevar bun de corectura prin citire.

Versionarea FS are valoare practica reala. Dar:
- un FS facut cu editia fizica CORECTA pe genunchi,ar trebui notat direct V (FS inseamna ca nu a existat materialul necesar confruntarii textului digital cu originalul, nu ca avem o carte adaugate pe forum fara scan)

- un text complet lizibil si care dupa citire pare intreg, dar care nu are scan si nu a necesitat pe durata corecturii scan, este FS intr-adevar.

Apoi, si aici cred ca avem ceva diferit de FS:
- avem carti corectate dupa editii straine, ba se mai adauga in textul roman si 2-3 pagini traduse de cel care face corectura. Ce fel de carti sunt acestea?
- cartile in romana corectate dupa o alta editie a textului, eu le consider o greseala.

@all
Discutia este importanta, parerile difera. So what?
E discutie, nu duel, nu trebuie sa moara nimeni de pe urma ei. Daca nu o ducem pana la capat, nu o sa stim daca discutia poate ajunge sau nu la tinta.

Totodata ar fi dragut daca si alti corectori de pe sectiune ar aparea aici. Poate batem cu totii campii si vine altcineva cu o idee mai buna.

P.S.
Intru-cat standardul RIF nu este o masura coercitiva si retroactiva, eu sunt dispus sa il sustin pe Seven in ideea lui. De la ultima discutie pe aceasta tema, lucrurile s-au schimbat destul de mult pe sectiune. Chiar era cazul unei verificari/actualizari a standardului.
Dar discutia are cateva puncte in care e nevoie de clarificari. Standardul nou trebuie sa fie practic, altfel degeaba il stabilim, lumea o sa il evite pe cat posibil.

@Seven
RIF-ul poate include si versionarile inferioare, nu e bai. Doar nu cred ca o sa fie realmente folosite de majoritate.
Discutia FS si cea a corectarii dupa editii straine, pe de alta parte, e foarte importanta. E un aspect care nu a fost luat in considerare la momentul elaborarii standardelor anterioare.


pus acum 8 ani
   
dewlight
Membru Senior

Inregistrat: acum 12 ani
Eu sunt curios de-o chestie. Ce păţeşte acela care nu respectă codificarea, versionarea, catalogarea, notarea sau cum s-o numi ceea ce se afla între paranteze (drepte, ca să rănească retina lui Aleph şi Sebastian)? Că eu, care sunt interesat şi urmăresc ce se propune, deja m-am pierdut în discuţiile de mai sus. Sunt, vorba filmului, „Lost in translation”.  Ce se va întâmpla în cazul unui binevoitor – dar nepus la curent - care nu scrie în paranteze ce „trebuie” să scrie? Sau folosim regulile astea doar pentru cei care citesc cu sfinţenie tot ceea ce se discută pe RI?

pus acum 8 ani
   
tuf
Vizitator




Seven a scris:


       Mai întâi trebuie menţionat că Standardul RIF nu este obligatoriu pe forum, el nu este o regulă, ci doar cumulează un pachet de convenţii pentru a ne putea înţelege între noi cu privire la starea tehnică şi de calitate a cărţilor postate.
       Cine nu doreşte să lucreze după standardul RIF, este liber să o facă, cu condiţia să posteze informaţiile necesare cu privire la fişierele pe care le postează.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Bun. Am schimbat scuze, să mergem mai departe.

     Prin CONFRUNTAREA cu ORIGINALUL eu mă refer la mai mult decât la confruntarea cu un scan FIZIC postat pe forum sub formă de PDF, DjVu sau o arhivă de imagini.
     O confruntare este la fel de bună şi cu "cartea pe genunchi", adică având textul de corectat pe computer şi cartea tipărită lângă computer.
     Deci confruntarea cu cartea fizică mi se pare perfect echivalentă cu confruntarea unui scan.
     De fapt, multe dintre primele cărţi corectate pe forum sunt corectate în acest mod. Cineva lua un OCR de pe forum şi pentru că avea cartea în bibliotecă trecerea la corectura "cu cartea pe genunchi".

     În altă ordine de idei, multe cărţi de pe forum au avut scan deşi el nu este sau nu mai este postat pe forum din diverse motive.
     Printre aceste motive enumăr:
             - eu personal [dar poate mai sunt şi alţii], cu ani în urmă am scanat personal câteva cărţi, dar n-am ştiut să salvez imaginile şi să realizez un PDF, aşa că am făcut corectura şi confruntarea direct în Abbyy şi am salvat doar textul.
             - de regulă, cel care scanează este cel care cumpără cărţile de pe diverse anticariate, dar mai ales librării virtuale; când cumperi de pe un sait oferi toate datele personale acelei librării sau edituri. Dacă apare vreo problemă, editura caută pe cel care a cumpărat şi a scanat şi nu pe cineva care a preluat cartea şi a corectat-o. Din acest motiv, sunt useri care pentru a preveni eventualele necazuri cu editurile nu au mai postat scanurile direct pe forum, dar le-au transmis celor ce corectau, deci corecturile s-au făcut cu confruntarea originalului, dar scanurile nu sunt postate.
             - alte scanuri pur şi simplu s-au pierdut [au fost şterse de hosturi din lipsă de download, au fost pe hosturi desfinţate etc... etc...
             - şi mai sunt o serie de cărţi care au fost preluate de pe digibox şi alte comunităţi [astăzi dispărute] unde cărţile erau corectate, dar nu se postau scanurile ci doar fişierele text. Un timp ştiam ce fel de corectură avem urmărind în proprietăţile documentului cine este userul care a corectat cartea. Printre cărţile corectate "perfect" erau cele semnate Gux dar şi alţii.

     Referitor la traducerea a una-două pagini lipsă.
     Dacă acele câteva pagini sunt traduse cu oarece răspundere şi talent, respectând stilul traducerii, atunci nu cred că versiunea are o problemă, faţă de o carte cu pagini complete.
     Ideea este ca traducerea acelor câteva pagini să nu fie doar o simplă convertire cu un translator, ci să fie cât de cât şlefuită în stilul şi spiritul traducerii.

     Despre corectarea unui text în română [la care nu avem originalul în nicio formă] cu confruntarea cu originalul în altă limbă...
     Asta este o chestie destul de delicată şi nu ştiu ce să spun.
     În cazul ăsta vorbim de două cărţi: una este originalul, iar cea de-a doua nu este o traducere robotică, cuvânt cu cuvânt, ci este o rescriere a cărţii în limba română, aşa că cele două versiuni pot fi sau pot părea destul de diferite.
     Apropo de chestia asta! Am văzut uneori comentarii în care este criticată dur o traducere de cineva care a constatat că există diferenţe între originalul [de regulă în limba engleză] şi traducerea românească. Din nou este o situaţie delicată şi şi trebuie cugetat mult înainte de a face astfel de critici.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



@Seven
presupunand ca eram inclus si eu in primele tale cuvinte...

In cazul asta FS-ul este delimitat destul de clar.

In privinta adaugarii textului lipsa prin traduceri personale, sau chiar corectarea traducatorului (asa cum a fost la seria G. Martin), daca traducerea e ok sau corectura justificata, e ok si aici.
Ideal ar fi ca in cazul corectarii traducerii unei carti, sa se anunte chestia asta in fisier. In fine, sa se anunte pe aici, pe undeva, ca nu o sa corespunda cu originalul tiparit si de ce.

Inca ceva, FS-ul propriu-zis trebuie neaparat marcat si in interiorul fisierului. Sau cel putin, asa ar trebui, ca sa evitam posibile incurcaturi legate de versiuni pe viitor. Multa lumea redenumeste fisierul descarcat de aici, mai ales cand denumirea e criptica, unii ar putea sa stearga si partea cu FS si sa readuca cartea ulterior aici.
Chiar daca scanul apare ulterior pe forum, daca FS-ul ajuns la 2.0 sa zicem, slabe sanse sa mai fie confruntat cu scanul. Adaugarea unei note in text mareste sansele confruntarii cu scanul.

Eu sunt lamurit cu FS-ul. Partea cu traduceri and stuff e delicata intr-adevar. Ramane de vazut cat de des apare.

A... mai este de lamurit si versiunea corectata integral dupa editia in alta limba. Apoi putem lamuri si chestia cu versiuni inferioare.


@Dewlight
Ti-am raspuns mai sus in locul lui Seven.

@all
Dupa ce se finalizeaza discutia FS si versiuni inferioare...
Luati in calcul si ideea topicurilor de autor pentru o singura carte.
La biblioteca nu se refuza adaugarea unei singure carti la raft, pe motiv ca e nevoie de minim 3.
Iar adaugarea lor in megatopicuri e o idee cam proasta. Ca si evitarea postarii ei deoarece nu se gaseste un topic unde sa se potriveasca.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     A... am uitat ceva...
     Am constatat că deşi se postează scanuri pe forum, cei mai mulţi useri fac download doar la fişierele text. dacă printr-o întâmplare nefericită cel ce a făcut scanul a pierdut fişierul şi a fost şters de pe host, sunt slabe speranţe sămai fie repostat de altcineva.
     Concret, eu am prelucrat scanurile şi am postat PDF pe forum pentru "GD Roberts - Shantaram". Pentru că am pus numele în clar şi au fost reclamaţii, hostul a şters fişierele. Eu am avut neşansa să-mi crape un HDD pe care păstram toate cărţile şi aşa am pierdut scanul acestei cărţi şi multe-multe altele. Am rugat pe topic de mai multe ori ca cineva care are scanul să-l reposteze, dar nimeni n-a postat acel scan.

     Referitor la confruntarea unui OCR scos din scanarea cunoscută versus confruntarea unui text luat de pe net.
     De-a lungul timpului am făcut atât prima corectură, cât şi corecturi superioare, la cărţi scanate.
     Indiferent cât de prost este un OCR, dacă ai multă voinţă îl corectezi, chiar dacă trebuie să faci multe corecturi sau chiar editări de fragmente întregi.
     Chiar dacă OCR-ul are foarte multe răgălii, acele răgălii te obligă să faci confruntarea şi nu poţi sări cuvinte sau fragmente de text, aşa că uşor-uşor îi dai de cap primei corecturi.

     Am încercat şi o corectare a unui text luat de pe net şi periat foarte-foarte bine.
     Menţionez că în textul găsit nu erau notate nici editura, nici anul apariţiei, aşa cănu eram sigur dacă textul respectiv corespunde cu cartea fizică pe care o aveam eu.
     Textul luat de pe net părea că e foarte bun... curgea foarte bine şi părea OK. La o urmărire foarte atentă a cărţii tipărite am constatat deja din prima pagină că în text lipsea o propoziţie foarte scurtă,deşi textul părea perfect. În primele 10 pagini am constatat că aproape în fiecare pagină lipseau câteva cuvinte [celmai adesea lipseau cuvinte din enumerări, dar şi de alt gen].
     Pentru că era foarte dificilă confruntarea cu cartea tipărită, am scanat cartea şi am pus pe ecan scanul şi textul pentru ca să pot face confruntarea mai uşor.
     După 50 de pagini am obosit, m-am enervat şi am renunţat definitiv.
     Din acest motiv prefer un OCR prost, dar despre care să ştiu sigur că este făcut după aceeaşi carte cu scanul. În acest mod ştiu exact ceea ce fac. Corectând un text dintr-o sursă necunoscută pot să cred că am făcut o corectură bună şi în realitate să fie ceva departe de adevăr,fără ca eu săştiu asta.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
dewlight
Membru Senior

Inregistrat: acum 12 ani

Seven a scris:

***
    Apropo de chestia asta! Am văzut uneori comentarii în care este criticată dur o traducere de cineva care a constatat că există diferenţe între originalul [de regulă în limba engleză] şi traducerea românească. Din nou este o situaţie delicată şi şi trebuie cugetat mult înainte de a face astfel de critici.


Pe mine m-ar ajuta niste exemple concrete, ca sa inteleg mai bine ceea ce ai vrut sa sugerezi. Asta bineinteles daca acele exemple nu contondeaza orgoliul celui care a a facut comentariile de care pomeneai. Nu d-alta dar, uneori, situatia este delicata fix pentru traducator si nu pentru cel care face niste critici intemeiate.


pus acum 8 ani
   
tuf
Vizitator



@dewlight
Seria lui George Martin a fost tradusa de mai multe persoane (posibil sa fac o confuzie cu alta serie) care au folosit expresii si denumiri diferite ale aceluiasi termen sau ale aceleiasi expresii din engleza.
Cei care au lucrat la editia digitala au observat diferenta si au incercat sa ofere o traducere unitara a intregii serii.
Uite:


Foarte amuzant ca a treia postare iti apartine
Putem da vina pe traducator, pe corector sau pe editor. Ideea ramane aceeasi, foarte posibil sa trebuiasca sa intervenim.
Cosimo are destule exemple pe tema asta, cand a adus o editie in romana mai aproape de originalul in engleza.

@Seven
Un scan si un ocr marca RI ar trebui sa aiba intotdeauna prioritate fata de un FS perfect.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     @dewlight,
     Eu am spus doar că astfel de situaţii sunt delicate... sunt perfect de acord că de multe ori partea delicată este fix pentru traducător. Am şi eu cel puţin un exemplu concret în acest sens. Este vorba de o poveste foarte cunoscută de pe tărâm australian. Lectura cărţii m-a obosit. Erau nişte paragrafe de cel puţin o juma de pagină, întortocheate şi răsucite că păreau ecuaţii. Poate că traducerea o fi fost bună, dar eu n-am putut citi cartea.
     Exemple concrete nu-ți pot da pentru că cei la care mă refeream nu erau nişte useri cunoscuţi pe forum. De altfel, poate că aveau dreptate... poate că nu.... Eu doar am vrut să spun că lucrurile sunt delicate. De altfel ştiu sigur că şi tu ai văzut postări pe forum în care câte un user crede că o carte se poate traduce cu Gogu sau alt translator.

      Şi aş vrea să mai subliniez o chestie: sunt un număr de useri pe forum [poate 20... poate un pic mai puţini sau mai mulţi] la care le i-au cărţile fără să mă mai uit la versiunea cărţii, pentru că numele lor este suficient ca să ştiu că voi citi o carte lucrată foarte bine.
      Din acest motiv tu, @dewlight, dar şi alţi câţiva, puteţi să puneţi sau să nu puneţi vreo versiune, puteţi pune doar linkul fără titlu pentru că eu ştiu la ce să mă aştept şi dacă am timp şi poftă să citesc îţi voi downloada cartea chiar dacă nu are nicio informaţie alături.
       
      Ceea ce încerc eu să clămpănesc aici are ca ţintă pe cei care sunt un pic în ceaţă şi n-au aflat cam câtă muncă şi investiţie se află în spatele unei cărţi postate pe forum.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



Notarea FS se refera la:
- un text ce nu a necesitat, pe durata corecturii, confruntarea cu materialul original (care nu exista nici in format digital, nici in format fizic, in posesia corectorului) din care provine textul digital. Bine de mentionat acest aspect in interiorul fisierului pentru a evita incurcaturi pe viitor.

Notarea FS nu se refera la:
- un text digital ce este confruntat cu "cartea pe genunchi" de catre corector. Foarte important sa fie aceeasi editie in limba romana. Acest text devine versiune superioara V.X.0.
Daca nu e aceeasi editie a cartii, nu e recomandat acest gen de corectura. Daca se vrea cu orice pret, e bine de adaugat acest detaliu in fisier.

In problema traducerilor:
- mai bine sa discutam problema pe forum, inainte de a face modificari majore ale textului. Situatie delicata.

In problema unei carti corectata integral dupa editia engleza, banuiesc ca nu e nicio problema. Dar e fi bine sa fie mentionat in interiorul fisierului acest lucru.

Cam astea sunt concluziile legate de FS si editii straine?
Daca da, atunci putem trece la versiunile inferioare si oricare alte probleme mai gasim.

@all
Legat de garantia calitatii la unii sau la altii, e o discutie interesanta. Dar sa le luam in ordine.
Mai intai RIF-ul, apoi putem sa o scaldam si cu alte chestii.
Daca nu sunteti de acord cu ce am zis, continuati discutia pe tema traducerii.
Dar se deviaza cam mult de la discutia initiala.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      La versiunile inferioare am cam greşit eu explicaţiile, pentru că m-am limitat la AC OCR+.
      În fond există alternative la AC şi ele pot fi pachete de macrouri, Template, combinaţii de astfel de unelte etc...
      Personal şi eu folosesc o combinaţie de macrouri şi apoi o rulare cu mai puţine opţiuni în AC. Practic în AC mă limitez la rularea dicţionarelor pentru că primele 3 pachete de opţiuni le rezolv cu un pachet de macrouri.

      În fond, în cazul unui OCR ar fi vorba de vreo 4 variante principale:
             - OCR-ul brut aşa cum rezultă el din Abbyy sau alte softuri;
             - OCR periat automat sau semiautomat fără vizualizarea textului; printr-o astfel de periere înţeleg atât rularea în AC OCR+, dar şi diverse macrouri sau template, scheme personale de înlocuiri Find&Replace... etc... deci orice fel de înlocuiri automate sau semiautomate, eliminare de taburi, spaţii multiple, spaţii înaintea semnelor de punctuaţie etc. principalele înlocuiri ale cifrelor 1 şi 0 sau ale grupurilor cl=d şi rn=m...
             - OCR periat prin vizualizarea concretă a paginilor, cu corectare pe diagonală şi înlocuiri la constaterea concretă a unor tipuri de erori.
             - OCR formatat sau nu pe stiluri, la care s-a făcut evidenţierea capitolelor, subcapitolelor etc.

      Este adevărat că putem stabili decât două variante: brut şi periat.
      Chestia asta merge la un OCR obţinut din scanul foarte bun al unei cărţi noi.

      Dacă avem de-a face cu o scanare slabă, avem o carte veche, facem extragerea scanului dintr-un PDF/DjVu cu rezoluţie redusă care a mai fost salvat şi în alb-negru, ei bine atunci fazele intermediare de periere sunt mult mai importante.

     Caz concret: am extras un OCR dintr-un DjVu AN al unei cărţi vechi. În varianta AN multe litere par lipite unele de altele astfel că Abbyy "vede" legături aiurea, unele litere au anumite părţi mai şterse...şi cum-necum, în OCR-ul obţinut peste 3/4 [eu cred că vreo 90%] dintre literele <e> au fost văzute ca <c>, jumătate din <î> sunt <t> sau <i>, multe <s> sunt caracterul "<"... etc... etc... aşa că fără o periere intermediară foarte importantă, OCR-ul ar fi fost imposibil de corectat.
      Am acordat câteva ore bune acestor perieri, dar acum corectura merge şnur.
      Din cauza asta cred că nu e bine să ne grăbim să extragem un OCR şi să-l notăm ca şi când ar fi OCR-ul perfect.

      Chiar nu ştiu dacă este posibil să stabilim un sistem de notare a OCR-urilor pe forum, dar dacă voi lucra în echipă pe un proiect, eu am să le ofer colegilor de echipă OCR-uri periate şi notate în acest mod, pentru ca să ştie cam la ce să se aştepte.

      Cunosc multe persoane care preferă să facă corectură dikrect pe un OCR brut. Pe de o parte ele "simt cu adevărat" că fac corectură pentru faptul că au multe erori pe care le corectează, pe de altă parte n-au încredere în instrumentele de periere automată.
      Ei bine, după ce la aceste persoane le-am oferit câte un OCR bine periat, părerea lor a început să se schimbe.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



OK.
Dar esti de acord cu faptul ca desi exista sau ca poate fi facuta o "standardizare" a operatiilor de corectura automata si a programelor cu care se fac aceste operatiuni, nimeni nu poate sa stea sa verifice daca un 0.3 este cu adevarat un 0.3?
De asta ziceam ca desi putem face si partea cu versiuni inferioare, cu exceptia a catorva persoane care inteleg ideea asta pana la capat, restul or sa versioneze dupa puterile lor.
Va fi un ocr imbunatatit (sper), dar nu va rezista la confruntarea cu "standardul" de versiune inferioara.
De asta zic ca e relativ subiectiva aceasta versionare inferioara. Daca corectorul stie ce face, atunci are sens. Daca nu, atunci speram ca a stiut, sau ca cel putin nu a stricat textul.

Esenta e ca versiunile inferioare pot fi adaugate in RIF ca puncte de orientare (desi tot RIF-ul e un "punct" de orientare), dar de cele mai multe ori nimeni nu o sa verifice sau corectorul o sa faca atat cat poate (mai ales cei nou-veniti).


pus acum 8 ani
   
_Cosimo_
Membru Senior

Inregistrat: acum 12 ani
Am fost somat de tuf "să-mi mişc curul" aici şi să-mi dau cu părerea, chiar dacă mi-am mai spus deja părerea de o mie de ori pe tema asta în trecut şi mi-e lehamite de mor: pentru mine, nu există decât două tipuri de e-bookuri, două versiuni posibile: corectate şi necorectate. Chestia cu numerotarea versiunilor - pe care o fac şi eu, ca să fiu în rândul lumii - e nesigură. Ar fi ideal dacă te-ai putea baza pe ea, dar mi se pare o utopie. Din moment ce văd versiuni 2.0 - ca la seria "Sfârşit de mileniu" a lui Radu Tudoran - care au peste 500 de greşeli, mai are vreo relevanţă versionarea? Deisgur, se poate argumenta că versiunea 0.9 avea 5.000 de erori şi versiunea 1.0 avea şi ea 2.000 de erori, implicând că de la 0.9 la 2.0 s-a depus deja o muncă enormă - şi e foarte plauzibil să fie aşa -, dar pentru mine, o carte cu 500 de erori tot "necorectată" este.
Şi îţi poţi da repede seama în ce categorie intră cartea, dacă a fost corectată sau nu. La "nu" pot intra foarte uşor şi versiuni 2.0 sau 5.0.

Dar aveţi toată admiraţia mea dacă reuşiţi să faceţi ordine în povestea asta a versionării.

Pe de altă parte, mie cea mai simplă formă de versionare mi se pare să treci ÎN INTERIORUL CĂRŢII data la care ai terminat corectura, cum trec eu de ani de zile la cărţile lucrate de mine: "e-book: octombrie 2015". În felul ăsta ştii clar ce versiune e mai nouă. Şi mai scriu uneori în paranteză, pentru mine, (versiune în lucru) sau (versiune definitivă, ca să nu mă încurc printre fişiere. Uneori a rămas "versiune definitivă" şi în cartea pusă pe RI, ceea ce nu e rău. Prin "versiune definitivă" înţeleg o carte care are tot cam atât de puţine greşeli ca una tipărită, adică o carte "corectată".

Şi o idee bună ar fi să se menţioneze în interiorul e-bookului după ce ediţie a cărţii tipărite a fost realizat acesta, anul şi editura. Şi întotdeauna traducătorul, dacă e traducere. Contează mult, ediţiile fiind foarte diferite între ele uneori, chiar dacă e trecut acelaşi traducător.


tuf a scris:

@dewlight
Putem da vina pe traducator, pe corector sau pe editor. Ideea ramane aceeasi, foarte posibil sa trebuiasca sa intervenim.
Cosimo are destule exemple pe tema asta, cand a adus o editie in romana mai aproape de originalul in engleza.


De fapt, nu e deloc aşa. Eu mă feresc pe cât posibil să intervin asupra traducerii şi la drept vorbind nu-mi aduc acum aminte decât de două cazuri când am corectat nişte greşeli strigătoare la cer: la o traducere infectă a unei cărţi de Brussolo a lui Mihnea Columbeanu - un traducător ireal de slab, un adevărat măcelar, dar foarte prolific într-o vreme - şi la "The City & The City", a lui Mieville, iarăşi o traducere foarte slabă, care ar trebui oricum refăcută de la zero.
În rest, m-am abţinut să intervin în traducere, şi nici nu ar fi fost nevoie, pentru că am tendinţa să citesc traduceri bune, cam ştiu la ce să mă aştept când încep o carte tradusă de unul sau altul. Dacă ştiu că traducătorul e slab, nu mă apuc de cartea aia.
Sau am mai tradus câte un mic fragment care lipsea în cartea tipărită, din varii motive. Uneori se întâmplă să găseşti erori de tipar, un rând cules de două ori şi altul lipsă etc. xtybyx m-a rugat o dată să traduc o pagină dintr-un roman apărut la RAO - în carte era o pagină culeasă de două ori şi numerotată diferit, lipsind practic din traducere o pagină întreagă în toată ediţia tipărită. Se mai întâmplă, fie din vina tehnoredactorului, fie a tipografiei.

Dar altminteri nu-mi trece deloc prin cap să-mi bag eu nasul în traducerile altora. Şi nu sfătuiesc pe nimeni să intervină, pentru că riscul să faceţi o prostie e mai mare decât v-aţi putea imagina.
Ceea ce fac eu într-adevăr mai des e să corectez greşelile de limbă română, greşeli de exprimare, gramaticale... Asta ţine de redactare, nu de traducere. A nu se confunda planurile


pus acum 8 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 15 ani
Scuze tuf, ai dreptate, nu am fost atent.

Modificat de ZVONACFIRST (acum 8 ani)


pus acum 8 ani
   
tuf
Vizitator



Era vorba de versiunile superioare.

pus acum 8 ani
   
sebastianmihail
Membru Gold

Inregistrat: acum 11 ani
Am eu un exemplu la o carte SF scrisă de Greg Egan. ) Nu daţi prea tare cu pietre, că n-am bani de pus geamuri acum.


Modificat de sebastianmihail (acum 8 ani)


pus acum 8 ani
   
stelus
Online
VETERAN

Inregistrat: acum 12 ani
Primele mele corectari le-am facut dupa OCR-uri mai bune sau mai rele. Dar in general cautam pe net pina gaseam fisiere relativ OK. Dar am facut corectura prin citire. In materie de gramatica am probleme vis-a-vis de noile norme cu "nicio" si familia, dar incerc sa invat.
Am si acum un OCR rau pe care nu-l pot corecta neavind un SCAN. Oricit l-am periat are zone ciudate in el si altul m-ai bun n-am gasit. Poate voi avea norocul sa dau de carte, dar...
La corectarea cu scan de control aproape totdeauna (o singura exceptie) am trecut eu OCR prin AC si apoi m-am apucat de treaba, cu jumatate de ecran word si cealalta jumatate scanul, aruncind cit mai des ochii in scan. Personal zic ca am corectat bine, dar n-a zis nimeni nici da, nici nu. (De asta am obiectat la versionarea OCR. In plus, Eu cind il trec prin AC il trec prin toate optiunile de acolo... Si nu mereu am timpul de a aproba sau nu schimbarile propuse...Apoi ma apuc de corectat.
E buna ideea spusa de Cosimo de a scrie in document data corectarii, caci va da o idee mai buna asupra datei de corectare.
Cred ca e buna distinctia pusa de Seven intre FS si V. Daca va fi facuta vei sti de la bun inceput despre ce e vorba.

Legat de propunerea de topice cu o carte, cred ca e bine, dar cu un pic de moderatie. Desi stiu, din momentul unei exceptii vor apare discutiile de ce pentru unul se poate si pentru altul nu.
Sunt scriitori care au scris numai o carte (Margaret Michell, de ex.) sau numai o carte de succes (Eric Knight- Mai presus de toate), sau pina acum au numai o carte  tradusa in limba romana (n-am exemplu)...
Sau este un titlu corectat [V1.0] si mai sunt 2 sau 3 scanuri de control.
Desi mai usor de cautat intr-o lista cu autori decit intr-un topic cu de toate.
Si asa cum am auzit pe aici useri mai de demult, un topic de autor cu 1-2-3... 15 carti este o pierdere mult mai mica decit un topic tematic sters.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Zvona, acum ai înţeles de ce mă gândeam eu ca la versiunile inferioare să punem "N" în loc de "V"?
     Exact acest lucru mi s-a întâmplat şi mie... am crezut că un OCR [V0.2] este o versiune corectată [V2.0].

      Legat de topicuri care încep cu 3 cărţi.
      Întotdeauna m-am referit doar la topicurile de autor şi umai şi numai la topicuri de autor.
      Este uşor de căutat numele unui autor într-un catalog şi aşa ajunge foarte uşor orice user la topicul respectiv.
      Dacă, Doamne fereşte! se întâmplă să dispară un topic de autor, topicul este mai uşor de recuperat decât unul tematic pentru că există câţiva useri pasionaţi de opera acelui autor şi pot reface topicul, chiar dacă nu se va mai respecta ordinea în care au fost postate cărţile iniţial. Sunt convins că foarte mulţi useri au salvate în computere cărţile pe autori, aşa că eea ce lipseşte este uşor de găsit şi în computer.

      Referitor la ce a amintit @stelus: la faptul că sunt câţiva autori care au scris doar o carte sau două sau cărora li s-au tradus doar una sau două cărţi.
      M.Michell are o singură carte, L.Charriere are 2 [Papillon şi Banco], S.Larsson are una [Millennium], G.D.Roberts - una [Shantaram], Tadeusz Dolega Mostowicz - una [Vraciu], E.Voynich - una [Tăunul] etc... etc... dar cred că fiecare dintre aceşti autori merită pe deplin topicul lor special. Şi... cu excepţia Margaretei Michell, toţi ceilalţi au topic de autor; Doar pe "Aripile vântului" este pe undeva pe forum într-un megatopic... Dumnezeu ştie pe unde!

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



Un topic de autor, fie si cu o singura carte, e cea mai buna abordare.
Combinam aceasta idee cu curatarea topicurilor de upload de conversatii, cu desfasurarea conversatiilor in locuri special amenajate (care pot fi ignorate daca apar la cautare) si ne apropiem de niste rezultate de cautare destul de relevante.
(De asta am precizat pe topicul de Request ca cererile vor fi sterse din cand in cand, ca sa nu dea rezultate false la cautare. De asta doresc sa alegem, din cand in cand, un autor si sa facem o cheta cu tot ce gasim de la el. Pana acum avem pe japonez, pe Vargas si pe K. Dick, dar astept finalizarea discutiilor de aici)

P.S.
Pentru toti cei care citesc discutia... O mica intamplare de azi... pune-ti intotdeauna scanul de control pe forum. Indiferent de cat de mare vi se pare, indiferent de cat de prost credeti ca este facut. In cel mai rau caz, cere-ti ajutor pentru finalizarea lui. Lasati-i pe cei care descarca sa hotarasca daca le poate fi util sau nu.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Pentru userii vechi nu e nevoie de indicaţii pentru deschiderea unui nou topic de autor.
     Userii mai noi, de frică să nu greşească, se feresc să deschidă topicuri noi, chiar dacă au mai multe cărţi ale aceluiaşi autor şi preferă să pună cărţile în acel "hangar" care suportă orice.

      S-ar putea să spun o prostie şi să pară o variantă complicată, dar mă gândeam la o variantă:
      Un user NOU [sau unul mai vechi, dar care se fereşte să deschidă topicuri] care are în vedere să posteze cel puţin 3 volume ale aceluiaşi autor, să deschidă un topic nou după următoarea metodă:

         - Deschide topicul nou dar nu pe secţiunea "Cărţi în limba română", ci pe "Totul despre cărţi", iar în faţa numelui autorului adaugă cuvântul Proiect. Dacă vrea să deschidă un topic cu cărţile autorului Marin Sorescu, topicul se va numi "Proiect - Marin Sorescu"
         - moderatorii şi alţi useri care se pricep pot să-i mai dea ceva sfaturi până topicul ajunge într-o fază corespunzătoare, apoi topicul poate fi periat, redenumit [adică se şterge acel cuvânt "Proiect", poate fi înregistrat în catalog şi apoi mutat pe secţiunea "Cărţi în limba română".
         - dacă proiectul eşuează, atunci moderatorii îl mută pur şi simplu la "coşul de gunoi".

      Aşa cum am spus, pare destul de greoi, dar în felul ăsta moderatorii ar avea un control mai mare asupra topicurilor noi şi s-ar putea deschide doar topicuri care respectă toate regulile stabilite de moderatori.
      Cred că aplicarea unei astfel de variante de lucru depinde doar de moderatori, pentru că ei au mai mult de lucru.
      Personal nu aş fi deranjat dacă eu ar trebui să deschid un topic trecând prin fazele de mai sus.
      Ce ziceţi? E o idee interesantă sau doar o nouă aiureală?   


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



E ok. Pare mai practic decat sa avem discutii-proiect pe topicul de colaborare. Acum nu stiu cat de multi urmaresc ceea se intampla pe "Totul despre carti".
Oricum ar fi, cine vrea si nu se descurca sa ceara ajutor si cu asta basta. Vedem noi ce si cum facem.


pus acum 8 ani
   
onlyra
Membru Junior

Inregistrat: acum 10 ani
Personal mi se pare o practica foarte buna ca macar primul post al unei carti (V0.x sau 1.0) sa contina in acelasi link si scanul, preferabil al editiei dupa care s-a facut OCR-ul. Asta ajuta la duplicarea/raspandirea lui si la realizarea versiunilor superioare. Deoarece scopul acestui standard este de a oferi un cadru comun de lucru, mai ales pentru membrii puf/juniori care vor sa lucreze, e importanta incurajarea sau chiar obligativitatea aparitiei scanului in postare daca foloseste notarea cu V.

Va admir daca, pentru a aduce la (V1.0), reusiti sa faceti o corelare a unui text gasit, cu cel din cartea de pe genunchi, dar cred ca am degete poate la o mana pentru a-i numara pe cei ce o fac constiincios, propozitie cu propozitie pe 300-400 de pagini... uau, @tuf daca faci asa corectura atunci acea carte va ramane totusi la V(1.0) deoarece nu mai poate altcineva sa consulte scan-ul pentru o versiune superioara. De aceea cred ca la v0.x sau 1.0 ar trebui sa se ajunga doar daca e un scan alaturi de textul corectat. Repet, cred asta doar pentru ca sunt putini care o pot face si atunci standardul e mai degraba pentru restul acestei comunitati. Nu cred ca notarea FS ar scadea cu ceva valoarea unei carti electronice dar pe termen lung important ar trebui sa fie lucrul la cartile facute dupa un scan, scan deja verificat de cei ce au publicat cartea.


Sunt deja multe pareri si rumeg si eu particularitatile fiecareia, dar standardul, cred eu, pentru a fi aplicat ar trebui sa fie simplu.

Versionarea OCR-urilor, cum spunea si @tuf, ar trebui sa aiba doar doua variante:
OCR_brut si OCR_prelucrat sau Necorectat_brut si Necorectat_prelucrat care e destul de clar (cu numere, 0.1 si 0.2, va exista intotdeauna tendinta de a creste versiunea pentru modificari minore). Daca cineva reposteaza cu o noua prelucrare apare oricum mai jos in topic, deci e vizibila. Deoarece cartea e in lucru persoana care o posteaza, poate, va detalia in post ce a facut dar oricum cel care o preia in lucru trebuie sa verifice in ce stadiu este textul. Nu poate stii cat de constiincios e @onlyra care posteaza din an in pasti   si cat de bine a aplicat AC+. Eu personal nu il folosesc. Fac pagina cu pagina o precorectare in ABBYY la tot ce imi apare marcat cu alta culoare sau subliniat, avand scan-ul textului original si apoi in Word inlocuiesc cu 'Find and Replace' erorile de recunoastere sesizate in experienta mea de pana acum.

Versionarea cartilor corectate ramane ca si pana acum V(1.0)... si eu prefer parantezele rotunde.

Cartile fara scan indiferent de situatie ar trebui sa aiba FS urmat de versiune si aici intra si cele corectate dupa editiile in alte limbi.

Aceste notatii trebuie sa apara si in numele fisierelor Docx, epub, mobi, pdf... si mi se pare o ideea buna sa apara in textul cartii si data cand a fost prelucrata.

In toate cazurile in post-ul cartii trebuie sa apara autorul, numele cartii, editura si anul aparitiei, eventual modificarile facute de cel care a prelucrat-o si o descriere a cartii, chiar si una scurta.

Modificat de onlyra (acum 8 ani)


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Cred că ar fi cazul să dau o explicaţie.
     Notaţiile pe care le-am amintit la începutul topicului, eu chiar le folosesc în computerul meu, ca să ştiu exact în ce stadii se află diversele fişiere.
     Ba uneori folosesc notaţii cu două zecimale, pentru că revin cu alte perieri în cadrul aceleiaşi etape.
     Simt nevoia să fac acest lucru pentru că în afară de cărţile la care lucrez personal, mai mereu ajut pe câte cineva; de regulă persoana respectivă îmi trimite imaginile şi eu fac prelucrări, realizez fişiere scan şi-i trimit OCR gata pregătit pentru corectură. Uneori colaborez cu mai mulţi, aşa că în acelaşi timp am o carte la care pregătesc PDF/Djvu, o alta este în curs de prelucrate în ScanTailor, alta are deja OCR-ul extras... 

     Mai mult decât atât, eu păstrez OCR pentru testarea în AC şi ca să nu le încurc trebuie să le am marcate cumva, aşa că simt nevoia să am un sistem de versionare.

     Dacă mă gândesc bine, colegii de pe forum nu au de ce să păstreze OCR-uri în computer, şi de regulă lucrează câte o carte, aşa că nu sunt loc de confuzii, fapt pentru care nu este nevoie nici de versionări ale OCR.

*****************

     Fără să fac glume proaste, cred că discuţia despre OCR-uri am luat-o prea în serios şi am dezvoltat-o mai mult decât merită.

     În practică sunt două situaţii:
          1. Când cineva postează scanul şi OCR fără să ştie cine şi când va corecta cartea; e varianta cea mai des întâlnită pe forum.
          2. Când o persoană îi pregăteşte unui coleg de echipă sau unui prieten un OCR; deci în cazul ăsta ştim exact cine va corecta, deci cine va fi beneficiarul şi în funcţie de asta vom stabili cât de mult periem.


     În primul caz cred că cel mai bine ar fi să fie postat un OCR BRUT, fără nicio intervenţie.
     Mi-e greu să cred că cineva pierde câteva ore ca să pregătească un OCR perfect fără să ştie cine va beneficia de asta la corectură... şi fără să ştie dacă va exista cineva care va face o corectură.
     Persoana care va dori să facă prima corectură va şti exact ce să facă cu acel OCR BRUT sau va cere sprijinul unui prieten.
     Şi la o adică, mi se pare mult mai corect aşa. Fiecare are încredere într-o metodă de periere şi o va folosi pe aceea. Iar dacă e unul care nu crede în nimic şi preferă să facă mii de corecturi manuale la citire... e treaba lui.... n-are decât să bibilească fiecare eroare din text.

     În al doilea caz, atunci când o persoană pregăteşte un OCR special pentru altcineva, cei doi se vor descurca între ei, şi e doar problema lor.

     Deci, la modul serios, clasificarea OCR chiar nu e o chestie de mare importanţă.
     Dacă cel ce postează scanul postează şi un OCR BRUT mi se pare foarte bine.
     Rugămintea este ca acel OCR să fie făcut ca lumea... din imagini la 300 dpi şi gray, pe cât posibil, pentru că Abbyy face citirea optimă de pe imagini gray 300 dpi.

     Mai important mi s-ar părea alt aspect: să stabilim în ce format să fie salvat OCR şi cu ce setări. De pildă eu prefer RTF Exact Copy, cu evidenţiarea Header/Footer şi a sfârşitului de pagină, dar sunt convins că fiecare are preferinţele lui.

*****************

     LE: Ghicitoare:

     «111 21Ua aia 1111 voiam 5-0 vadă acel 0111.»

     Fragment de comentariu sportiv?... sau fragment de OCR?

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



@Seven
As zice ca e fragment de ghicitoare despre un comentariu sportiv sau un ocr

Sa iti arunci un ochi la ultimele postari de aici:
Sa imi spui daca e ok. Tu aveai deja ceva inceput pe tema asta. Eu am observat de abia aseara ca faimoasa cautare nu e inca adaugata. Desi o adaugasem ca link in regulament si pe Request

Tu spuneai ieri ca scrii cum scrii din cauza tastaturii. Eu am observat (la citiri ulterioare ale comentariilor mele), dar mi s-a si atras atentia pe tema asta, ca de ceva timp scriu aiurea (de la litere si cuvinte de legatura lipsa pana la iubirea vietii mele, cratima buclucasa). Acest lucru se intampla din cauza oboselii... asa ca nu dati cu pietre ca s-ar putea sa ma treziti din somn.

Si da, chestiunea versiunilor inferioare era mult prea gogonata fata de cat e in realitate.
Putem vorbi si despre forma cea mai practica in care trebuie salvat ocr-ul din Abby. Eu, daca nu uit, folosesc varianta RTF, apoi mai adaug o versiune trecuta prin AC.

Ideea cu topicul de autor, linkul unic de descarcare si megatopicurile ar trebui sa functioneze cam asa:
Topic de autor cu o carte sau mai multe, topicul de autor contine linkurile unice de descarcare.
Topicurile tematice vor adauga cartea, dar linkul de descarcare va face trimitere la topicul de autor.
Topicurile personale (il dau pe a lui Cosimo ca exemplu, altul nu imi amintesc acum) vor trebui sa "desfaca" pe autori si sa dispara sau sa ramana, dar sa nu se mai adauge carti in ele. Nu am idee cat topicuri de genul asta sunt, dar mai mult ca sigur ca nimeni nu va aplica ideea asta retroactiv.
Eventual in cazul unor membri valorosi, pot ramane topicurile personale, dar linkul de download va face trimitere tot catre topicul de autor.
Ideea asta trebuie discutata mai intai. Asa ca tineti cont de ea, dar nu dati cu pietre.



onlyra a scris:

Cartile fara scan indiferent de situatie ar trebui sa aiba FS urmat de versiune si aici intra si cele corectate dupa editiile in alte limbi.

Complet de acord. Nu stiu de ce naiba nu mi-a trecut prin cap.


pus acum 8 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 15 ani

Seven a scris:

***
     Zvona, acum ai înţeles de ce mă gândeam eu ca la versiunile inferioare să punem "N" în loc de "V"?
     Exact acest lucru mi s-a întâmplat şi mie... am crezut că un OCR [V0.2] este o versiune corectată [V2.0].


Asta imi era destul de clar. Eu nu intelegeam de ce doreste @cuculean sa utilizam atatea versiuni inferoare (ma refer la v.01 ÷ v.0.5.
Eu as fi de acord doar cu v.0.1 si v.0.5, si argumentez:
  - v.0.1 (ocr brut) - in ipoteza ca cineva care nu stie sa extraga ocr roaga pe altcineva care stie. As propune totusi ca aceste conversatii, inclusiv transferul fisierelor, sa se desfasoare in privat.
  - v.0.5 - deoarece este normal ca cineva sa faca toate operatiile necesare atingerii acestei versiuni. Versiunile intermediare pot de asemenea circula in privat. Se pot face grupuri de lucru, pe proiecte, asa cum de altfel se obisnuieste de mult timp, si nu ma refer acum la agele grupuri... stiti voi, cei mai cu vechime.
  - toate operatiunile, incepand de la scanare si pana la v.1.0, pot fi realizate fara probleme de aceeasi persoana, fara sa posteze versiuni intermediare, ci direct v.1.0 + scan ctrl.
Am evita incarcarea forumului cu versiuni inutile. Eu urmaresc abumite discutii si primesc avertizari. Fiecare postare cu avertizarea ei. E acelasi lucru cu, daca va amintiti, acele "multumiri" care ma agasau intr-o vreme si am scris ceva pe forum care mi-a atras atunci critici dure. Sper sa fiti mai blanzi acum. 

Modificat de ZVONACFIRST (acum 8 ani)


pus acum 8 ani
   
cuculean
Moderator

Inregistrat: acum 14 ani
Plecasem de la propunerea initiala a lui Seven, si de la vechiul RIF.
Personal, in practica, nu folosesc niciodata acea versionare atat de rafinata pentru ca nu este cazul.

In general utilizez doua tipuri de OCR (exact cele mentionate de tine @ZVONACFIRST):
- OCR BRUT -  aşa cum este el extras de programul Abbyy
- OCR PRELUCRAT - OCR BRUT rulat prin AC cu rularea automata a dicţionarelor OCR_DIC şi Uzuale + alte înlocuiri automate şi semiautomate + formatări de text


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     În cazul ăsta, am putea concluziona ceva de genul?

     Pe forum se postează <OCR BRUT>, menţionat chiar aşa.
     Dacă userul care a extras OCR a făcut şi oarecare prelucrări, i se recomandă să le menţioneze.

     În comunicarea personală în cadrul unei echipe se poate folosi şi varianta detaliată [N01] ÷ [N05].


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



Adica "Mihail Sadoveanu - Moartea lui Charlie Chaplin <OCR BRUT>.docx"?

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      La o adică, nu mă deranjează deloc dacă renunţăm complet la chestia
      "În comunicarea personală în cadrul unei echipe se poate folosi şi varianta detaliată [N01] ÷ [N05].

      Mă gândesc să o lăsăm dintr-un singur motiv. În 2010 în mod concret doar eu şi Aleph am crezut într-un astfel de standard, toţi ceilalţi erau sceptici şi mulţi împotrivă.
      În timp sistemul a fost preluat de mulţi useri, astfel că la un moment dat a fost generalizat.
      E posibil ca pentru unii useri clasificarea versiunilor inferioare să li se pară de o aoarecare utilitate.

      Deci putem lăsa acea menţiune sau o putem şterge.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
      Legat de formatul "docx" aş comenta puţin.
      Sunt pe forum oameni [atât dintre cei ce downloadează, dar şi dintre cei ce corectează] care au o stare materială destul de subţire, aşa că încă au Win XP şi Word 2003.
      Alţii, din diverse motive folosesc Linux cu editoarele Libre sau OpemOffice care "văd" şi pot salva în  format "doc"

     Toate Word superioare au opţiunea de a salva fişierele şi în varianta "Word 97-2003 Document (*.doc)".
     Cu toate astea majoritatea colegilor postează frecvent în format "docx" şi mulţi useri mai sărăcuţi nu accesează documentele sau le accesează mai greu.
     Ştim deja că toate utilitarele care convertesc "docx" în "doc" dau erori şi că doar un Word superioar poate converti "docx" în "doc" în mod corect.

     Dacă cineva doreşte ca versiunea lui să fie preluată de altcineva pentru a fi corectată la nivel superior, cred că ar putea să se gândească şi la aspectul ăsta.
     Eu am instalate atât Word 2010 RO cât şi Word 2003 RO, care este mai mic şi se mişcă mai repede. Îl folosesc când pe unul când pe altul, dar corectura de bazţ o fac în Word 2003.
     Am setat în Word 2010 ca salvarea să se facă în varianta "Word 97-2003 Document (*.doc)" şi nu mi se pare că am pierdut ceva.

     Noi spunem că suntem caracterizaţi de altruism, că suntem o comunitate care ne ajutăm unii pe alţii şi că dorim să colaborăm şi să ne preia şi alţii cărţile şi să contribuie cu o corectură.
     Sincer, a salva "docx" când se poate salva "doc", adică a opri mulţi useri să preia cartea, mi se pare mai degrabă individualism decât altruism... sau poate doar indiferentism...
     Fiecare este liber să salveze cum vrea, dar dacă doreşte cu adevărat să-i fie continuată munca, atunci poate că n-at fi rău să se gândească şi la acest aspect.

     Bineînţeles că nu mi se pare binevenită nici postarea fişierelor "odt", realizate cu Libre, OO sau Lotus.
     Chestiile aste mă duc cu gândul la fabula cu Vulpea şi Barza... parcă ne facem că oferim, dar nu vrem să beneficieze prea mulţi de oferta noastră.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
tuf
Vizitator



Nu cred ca este o problema pentru RIF felul in care isi versioneaza cei din cadrul unui proiect textele. Conteaza doar ceea ce se ofera in linkul final de descarcare.
Ca idee generala, in regulament scrie ca coordonatorii de proiecte sunt cei care decid felul in care se desfasoara lucrurile pe proiectul lor. Cu conditia ca linkul final de download sa fie clar.
Moderatorii intervin doar la cerere sau pentru a mai "rade" din discutiile care lungesc topicul prea mult. Sunt deja unele topicuri kilometrice din acest motiv.

DOCX vs. DOC?
Nu am auzit, cred, niciodata problema asta. A, ba da, la Cosimo e si el fan Word 2003
Oricum ar fi, nu e o cerinta dificila sau consumatoare de timp. Save as... si gata.

De restul formatelor nici nu vreau sa aud (Lotus, odt and so on. Chit ca si Open Office poate salva in doc parca)


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Exact asta vreau să spun: "DOC", şi bineînţeles "RTF", sunt formate universale, le poate accesa oricine şi pot fi salvate în orice editor.
     "RTF"-ul nu-l recomand decât pentru OCR, deoarece multe setări din Word le pierde pentru că nu le poate salva. În plus un fişier "RTF" este mult mai mare [mai ales dacă conţine imagini" decât un "DOC".


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
onlyra
Membru Junior

Inregistrat: acum 10 ani
Nu am vreo preferinta pentru format doc sau docx, dar cei care au Office 2000-2003 pot instala de la Microsoft 'Pachetul de compatibilitate pentru Microsoft Office pentru formatele de fişiere din Word, Excel şi PowerPoint' si apoi pot deschide, edita si salva in docx. Nu am observat vreo problema cu acest pachet in 4-5 ani de cand il folosesc.

https://www.microsoft.com/ro-ro/downloa ... .aspx?id=3

Modificat de onlyra (acum 8 ani)


pus acum 8 ani
   
mitikut
Membru Gold

Inregistrat: acum 11 ani
Cred ca lucrurile cu cat sunt mai simple, cu atat sunt mai usor de aplicat.
Pentru versiunile necorectate, OCR brut si OCR v 0.9. Pentru versiunile corectate, versionarea v 1.0, v 2.0... cred ca este destul de explicita si practica.
Pentru corectarea fara scan de control sau carte fizica, cred ca este foarte buna solutia cu notarea FS si versionarea v 1.0, v 2.0...
La ambele variante de corectare trebuie sa apara elementele de identificare a cartii: titlu carte, autor, editura, anul apariritiei si traducator (daca este cazul).
In ceea ce priveste formatul doc sau docx, exista intr-adevar pachetul de compatibilitate pentru Microsoft Office si am vazut ca si Libre Office poate citi docx-urile cu bune rezultate.


pus acum 8 ani
   
tuf
Vizitator



Eu zic ca ne-am cam lamurit cu versionarile.
De acord, Seven?

Daca raspunsul este da... Am deschis un topic-proiect pe "Totul despre carti". Sa incercam sa aplicam aceste versionari cartilor de acolo. Una singura a fost lucrata dupa scan/carte fizica, daca nu gresesc.
Consider totusi ca, daca o carte nu e nici FS si nu are nici scan-control, nu are ce cauta pe topicul de autor. Locul ei e in topicul destinat fisierelor lizibile luate de pe aiurea.

Am colorat problemele care necesita clarificare:

Poate gasim si o prezentare unitara pentru topicurile de autor. Nu sunt prea incantat cu a mea.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Despre versiuni, să mai oferim şi altora [dacă mai sunt] o zi sau două ca să-şi exprime părerile [ şi apoi fac modificare în prima postare... sau dacă credeţi că e mai bine, poate deschide un moderator un topic care să conţină doar noile versiuni, iar pe acesta îl închidem.

     Referitor la Proiectul deschis de tine: să înţeleg că topicul ăla este şi unul de discuţii despre tropicuri, ori este chiar ceea ce pare la vedere?

     În al doilea caz cred că n-ar fi rău să deschidem o discuţie despre topicuri.
     Cu cât discuţia va dura mai mult, cu atât vor fi mai mulţi useri care vor urmări mai mult sau mai puţin discuţiile.
     În altă ordine de idei, cred că o discuţie despre topicuri este chiar cea mai interesantă discuţie de pe forum.
     E timpul să avem o viziune ceva mai clară. Chestia cu prea multă libertate şi faptul că sistemul se autoreglează nu a făcut să avem un forum mai bun.


     LE:
     Despre acest topic...
     Cel mai bine este să fie deschis un topic pe care să se pună modul de codare, iar la sfârşit să fie o notă de genul: cei interesaţi pot urmări discuţiile despre versionare pe topicul ____ " şi link către acest topic.
     Când va apărea unul deranjat de versionare, poate să ajungă pe acest topic, ca să vadă că a existat o discuţie şi să vadă ceea ce s-a discutat. Bineînţeles acest topic va fi închis ca să poată fi vizitat dar să nu poată fi editat.

     ... Şi... LE2
    Eu cred că un topic pe care se poartă discuţii [deci nu unul cu discuţiile îngheţate de mai mult timp] este mai vizibil dacă "rămâne jos".
    Pentru foarte mulţi, inclusiv pentru mine, topicurile "puse sus" sunt mai puţin vizibile, pentru că ochii se duc de regulă la primul topic pus jos pentru că acolo caută noutăţile.

Modificat de Seven (acum 8 ani)


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
ZVONACFIRST
MEMBRU DE BAZA

Din: Bucuresti
Inregistrat: acum 15 ani
In disputa doc - docx vor pierde doar cei indragostiti de formatari mai pretentioase. Eu am Ofiice 2013 si imi place sa ma joc cu tot felul de efecte. Dar ce fac eu in particular e una, ce postez e alta, daca e doc, doc ramane.

Modificat de ZVONACFIRST (acum 8 ani)


pus acum 8 ani
   
tuf
Vizitator



Daca doresti, versionarea poate sa fie discutata pana la inceputul anului viitor. Nu e graba. La fel si cu restul chestiilor care s-au mai perindat pe aici.
Dar sa ne punem de acord asupra felului in care o sa sune ca sa avem pe ce lucra, sa avem ce arata la intarziati, fara a fi nevoie sa citeasca 10 pagini de topic ca sa priceapa.

Topicul japonezului este un experiment cu mai multe scopuri:

- sa vedem daca ne punem de acord asupra versionarii in practica (cartile din el sunt destul de dificil de versionat).

- sa stabilim conditiile minime DE CALITATE in baza carora o carte poate fi adaugata pe topicul de autor (iarasi avem exemple excelente in topicul japonezului).

- sa stabilim ce se intampla cu cartile ce nu intrunesc conditiile minime de adaugare pe topicul de autor.

- sa vedem daca e nevoie sa gasim o forma unitara si placuta ochiului pentru topicul de autor.

- sa fie si loc de discutii pentru orice problema care poate aparea in decursul crearii unui topic de autor ce se bazeaza atat pe fisiere RI cat si pe fisiere de pe net.

- totodata, si aici va atentionez de pe acum, unii membri VP nu doresc sa isi vada scanul, ocr-ul sau versiunea proprie pe aici. In fine, asta va fi mai mult sarcina lor de a vedea ce e RI si ce e VP, dar va zic de pe acum ca sa nu apara plangeri ulterioare.
Daca stiti ca e de pe VP, vorbiti cu cel care a produs fisierul (si da, stiu, e dificil, nu a tinut nimeni evidenta originii fisierelor). Alminteri cartea se retrage de pe RI.
Si asta e un aspect ce trebuie discutat.

Daca topicul va fi finalizat cu succes, va fi mutat pe sectiunea de carti.
Apoi trecem la autorii Vargas si K. Dick. Tot la fel, cu pasi marunti. Daca aceste 3 topicuri sunt mutate cu succes pe sectiune, eu zic ca am lamurit cam toate problemele.


Iar la final...

Seven a scris:

LE:
     Despre acest topic...
     Cel mai bine este să fie deschis un topic pe care să se pună modul de codare, iar la sfârşit să fie o notă de genul: cei interesaţi pot urmări discuţiile despre versionare pe topicul ____ " şi link către acest topic.
     Când va apărea unul deranjat de versionare, poate să ajungă pe acest topic, ca să vadă că a existat o discuţie şi să vadă ceea ce s-a discutat. Bineînţeles acest topic va fi închis ca să poată fi vizitat dar să nu poată fi editat.

Aici o sa te las pe mana celorlalti moderatori sau pe mana membrilor cu initiativa. Nu cred ca o sa mai am timp de asa ceva pana in weekend.

Acesta va ramane topicul de discutii RIF si pe tema topicurilor. Daca e nevoie, puteti faceti topicuri separate.
Problemele care apar pe topicul japonezului pot fi discutate acolo direct. Oricum, in baza lor, vor avea loc si discutii ulterioare pe aici.


pus acum 8 ani
   
Seven
Moderator

Din: Ţara Perfectului Simplu
Inregistrat: acum 13 ani
***
     Ca să nu ne ieşim din mână şi ca să nu se răcească subiectul, am deschis un topic de discuţii pe marginea structurii topicurilor, unde am postat deja o variantă.
     Este pur şi simplu de o variantă şi aştept în primul rând alte variante ale colegilor de pe forum şi mai puţin contraargumente la ceea ce am postat eu.


_______________________________________

     Oameni şi popoare îşi cată libertatea; după ce-o obţin, îşi caută stăpân.


     | TORENTE | Tăunul | ROCAMBOLE+ | FLORIS | VRACIU | Victor HUGO | J.F. COOPER | PAPILLON | POLDARK |
     | Dictionare Lba RO | | Gramatica RO | D. Stănoiu | Zaharia STANCU | H.Y. STAHL | V.CORBUL & E.BURADA |
     | Ultimul regat | Millennium | Shantaram | Pearl BUCK | Anchee MIN | Amy TAN | C. LÄCKBERG | Ph.GREGORY |
     | Extraterestrii şi Intraterestrii | RUFOR | Demonul Roşu | Vraja milioanelor | Cărţi audio |

pus acum 8 ani
   
Anahoret
Online
Membru Senior

Inregistrat: acum 3 ani
Pentru a veni în ajutorul celor care (re)pornesc machetarea cărţilor de la zero, vin în ajutor cu material bibliografic. STAS-urile de mai jos încă mai sunt valabile.
În literatura de specialitate mai veche o să găsiţi pătrişorul ca unitate de măsură tipografică. Acesta este echivalentul unităţii de măsură em în DTP.

SR ISO 8 – Documentare • Prezentare redacţională a publicaţiilor periodice
STAS 8660-82 – CĂRŢI ŞI BROŞURI • PREZENTARE REDACŢIONALĂ
STAS 2106-84 – CĂRŢI ŞI BROŞURI • REGULI GENERALE DE PAGINAŢIE

Modificat de Anahoret (acum 3 ani)


_______________________________________
Acum citesc: nimic, deocamdată.

pus acum 3 ani
   
Pagini: 1  

Mergi la