|
Formatare cu Stiluri: “Natural”, Word-ul e orientat pe “stiluri”, ceea ce inseamna ca orice paragraf din text are asociat un stil (in cazul in care nu-l definesti tu, il defineste Word implicit ca “Normal”). “Are asociat un stil” inseamna ca Word tine minte numele stilului si foloseste elementele de formatare (fontul, dimensiune, identare, etc) definite in acel stil. Atunci cand salvam in format html, paragraful va arata ceva de genul:
<p classMsoNormal> <span lang=RO> Paragraf de test 1</span></p> | -> classMsoNormal e “legatura” cu stilul folosit, in cazul nostru e stilul “Normal”
Formatare directa: Orice modificam prin formatare directa (font, culoare, dimensiune, identare, etc) va fi memorat de Word individual, in sensul ca va crea descriptori aditionali ai paragrafului pentru fiecare element de formatare (-> petice diferite). Aceste valori sunt prioritare celor definite in stil, in sensul ca daca sunt prezente, acestea sunt folosite iar cele din stil sunt ignorate (au rol de petic peste textura originala).
Exemplu: Formatez direct fontul unui paragraf la Arial. Atunci cand salvez in html, paragraful va arata ceva de genul:
<p class=MsoNormal><span lang= RO style='font-family:"Arial","sans-serif"'>Paragraf de test 1</span></p> | -> S-a adaugat ('font-family:"Arial","sans-serif"') la codul initial (“MsoNormal”)
Mai schimb si marimea fontului, tot prin formatare directa:
<p class=MsoNormal><span lang= RO style='font-size:12.0pt;font-family:"Arial","sans-serif"'>Paragraf de test 1</span></p> | -> Am mai adaugat cod ('font-size:12.0pt'), langa cel existent.
In cazul in care mai multe paragrafe sunt formatate direct (selectez o portiune de text, de exemplu), descriptorii aditionali vor fi creati pentru fiecare paragraf in parte. In exemplul de mai sus, daca selectatam tot textul, fiecare paragraf din document va primi un descriptor aditional style='font-family:"Arial","sans-serif". -> fiecare paragraf va primi noul sau cod.
Deci, cu cat facem mai multe formatari directe, cu atat devin mai “stufosi” descriptorii de formatare ai paragrafelor.
Cum prelucreaza Calibre campurile astea? La conversie in epub, Calibre adauga clase aditionale de “stiluri” (“CalibreX” – nu sunt stiluri in sensul stilurilor Word, dar le numesc asa pentru simplificare). Cu asta simplifica printre altele si formatarile directe din html-ul folosit la intrare. In principiu, se uita la toti descriptorii, gaseste elementele comune si creaza clase noi css. Apoi inlocuieste sirul de elemente din descrierea sirului cu clasa corespunzatoare.
Rezultatul e un cod html mult mai compact in epub-ul generat. Exemplu:
<p class="MsoNormal"><span lang="RO" class="calibre6">Paragraf de test 1</span></p> |
"Bun, dar codul generat de Atlantis e totusi si mai compact" Asa este, iar asta e pentru ca Atlantis a ales sa simplifice formatarile directe intr-un alt mod: La conversie in epub, Atlantis modifica stilul paragrafului folosit, pentru a ingloba formatarile directe. Deci genereaza cod nou, in loc sa mentina textura originala + petic. Cel mai folosit cod in text este declarat ca implicit, de aceea la majoritatea paragrafelor nu apare nimic aditional ca si atribute de formatare. Rezultatul e un cod html si mai compact in epub-ul generat.
Exemplu:
<p>Paragraf de test 1</p> |
<p class="p2">Paragraf de test 2</h1> |
Destul de interesant facut, si se preteaza foarte bine la carti, unde avem un numar foarte mare de paragrafe de text normal si un numar mic de paragrafe formatate altfel (Titluri, motto-uri, etc)
”Pe mine unul ma deranjeaza teribil cum arata formatarile astea directe in Word HTML filtrat“ In cazul nostru, rolul lui html_filtrat din Word este de fisier intermediar, folosit intre Doc si Epub (un capat al procesului e doc-ul, celalalt capat e epub-ul). Echivalentul lui in cazul folosirii Atlantis-ului, ar fi un fisier temporar, folosit intern doar de Atlantis la conversia din Doc in Epub.
”Bun, si cam ce-ar trebui sa facem acum? Formatam totul cu stiluri si nimic direct, ca sa avem fisiere html mici? Formatarile directe nu sunt neaparat gresite, nu e nimic gresit in a le folosi moderat. E adevarat, reprezentarea interna e mai stufoasa (ne-optimala), se pierde posibilitatea reformatarii unitare prin modificarea stilului, fisierele salvate vor fi mai mari. “Atat timp cat soft-ul se descurca cu ele” depinde in acest caz de cat de moderat folosim formatarea directa.
Mai pe scurt: - pentru producerea unui epub/mobi de calitate este necesar un cod html cat mai curat posibil, acest cod html depinde foarte mult de formatarea documentului din care se obtine. Pentru a intelege mai bine despre ce este vorba va prezint 2 imagini: - imaginea 1 prezinta codul html dintr-un epub facut dupa prima metoda. - imaginea 2 prezinta codul html dintr-un epub facut dupa a doua metoda.
|
|