Kiel fari TTT-paghojn

Specialaj signoj

Kiam oni skribas XHTML-kodon kaj uzas la signokodon Unikodo, oni principe povas skribi chiajn ajn signojn rekte per Unikodo, kaj la TTT-legiloj principe devas ilin montri ghuste (se la signokodo estas ghuste anoncita - alie la TTT-legilo ne povas scii, kiu signokodo estas uzata en la pagho). Sed praktike povas tamen esti problemoj vere entajpi iujn specialajn signojn. Eble la tekstoredaktilo, kiun oni uzas, ne plene regas Unikodon. Eble la klavaro, kiun oni uzas, ne havas klavojn por chiuj bezonataj signoj.

Numeraj signoreferencoj

Se oni havas problemon rekte skribi iun signon, oni povas helpi sin per XHTML-aj signoreferencoj, kiuj indikas la celitan signon per numero. Ekz.:

Δ = la Greka litero “delto” (Δ)
∞ = infinito-signo (∞)
♥ = kero-signo (♥)
€ = euro-signo (€)

Tiaj signoreferencoj chiam komencighas per kaj-signo (&) kaj numersigno (#), kaj finighas per punktokomo (;). Inter la numersigno kaj la punktokomo oni skribas la Unikodan numeron de la celita signo.

Tiajn signoreferencojn oni povas enmiksi en ordinaran tekston, ekzemple jene:

<p>La Greka litero &#916;, estas tre bela, sed
pli bela estas la signo &#8734;. Plej belas tamen
la kartluda signo &#9829;.</p>

Provu tion en testa XHTML-pagho. Espereble via TTT-legilo sukcesos montri chiujn tri specialajn signojn.

Dekume au deksesume

En la chi-antauaj ekzemploj la numeroj estas skribitaj dekume (kiel normalaj numeroj), kaj tio estas la rekomendinda skribomaniero. Sed principe oni ankau rajtas skribi la numerojn deksesume (per sistemo, kiu uzas 16 ciferojn anstatau la kutimaj 10 ciferoj). Tiam oni aldonu “x” (nepre minuskle) post la numersigno, ekzemple: &#x394;, &#x221E;, &#x2665; kaj &#x20AC; (tiuj estas la deksesumaj respondajhoj al la kvar ekzemplaj signoj). Sed iuj TTT-legiloj ne komprenas la deksesumajn numerojn.

Se oni ne scias la Unikodan numeron de iu signo, kiun oni bezonas uzi, oni devas serchi la numeron ekzemple en ia listo de Unikodaj signoj au en manlibro pri Unikodo. Tiam tre ofte oni trovas nur la deksesumajn numerojn, kaj devas mem rekalkuli ilin kiel dekumajn numerojn (en multaj komputiloj estas kalkulilprogramo, per kiu oni povas tion tre facile fari). Se oni skribas deksesume en la XHTML-kodo, oni riskas, ke iuj legiloj ne komprenas, kiun signon oni celas.

Simbolaj nomoj «

Numeraj signoreferencoj estas sufiche fidindaj (la TTT-legiloj ilin komprenas sufiche bone), sed ili povas esti maloportunaj por la paghoverkanto. Ne estas facile memori tiajn numerojn, kaj se oni akcidente skribas ekzemple “8363” anstatau “8364”, oni ne tuj facile rimarkas la eraron.

Tiam oni povas anstataue uzi simbolajn signonomojn, ankau nomatajn entoj. En tiaj kodajhoj uzighas mallonga kodvorto anstatau numero:

&Delta; = &#916;, la Greka majuskla litero “delto” (Δ)
&infin; = &#8734;, infinito-signo (∞)
&hearts; = &#9829;, kero-signo (♥)
&euro; = &#8364;, euro-signo (€)

Tiam oni skribas kaj-signon (&) antau la simbola nomo, kaj punktokomon (;) poste.

Jen la chi-antaua ekzemplo kun simbolaj signonomoj anstatau numeraj signoreferencoj:

<p>La Greka litero &Delta;, estas tre bela, sed
pli bela estas la signo &infin;. Plej belas tamen
la kartluda signo &hearts;.</p>

La prezento en TTT-legilo estu tute la sama. &Delta; estas tute sinonima kun &#916;.

Ne por chiuj Unikodaj signoj ekzistas tia simbola nomo. Tiujn simbolajn nomojn, kiuj ja ekzistas, vi povas trovi en miaj paghoj pri signokodoj, precipe en la paghoj “Latino 1” kaj “Kiel skribi signojn en HTML”.

Aliaj signokodoj

Nuntempe estas forte konsilinde chiam uzi Unikodon por chia teksto, sed oni ankau povas uzi aliajn signokodojn.

Tre ofta signokodo estas Latino 1 (Latin 1, ISO-8859-1). Iuj malnovaj tekstoredaktiloj komprenas nur Latinon 1, kaj tute ne povas skribi Unikode.

Latino 1 enhavas multe malpli da signoj ol Unikodo, kaj se oni uzas Latinon 1 por la normalaj signoj (tiuj, kiujn oni skribas rekte), oni devas uzi signoreferencojn au simbolajn signonomojn pli ofte. Sed rimarku, ke numerajn referencojn oni chiam skribas kun la Unikodaj numeroj de la signoj. Numeraj signoreferencoj estas tute sendependaj de la signokodo, kiun oni uzas por rekte skribi signojn.

Ekzemple en la signokodo “windows-1252” la euro-signo havas la numeron “128”. Se oni uzas “windows-1252” kiel signokodon en XHTML-pagho, oni povas rekte skribi eurosignon per bitoko kun la numero 128 (la tekstoredaktilo tiam simple montras euro-signon - oni skribas la signon rekte). Sed se oni tiam volas skribi euro-signon per signoreferenco, oni ne povas skribi “&#128;”. En Unikodo tute ne ekzistas signo kun la numero “128”. Oni devas tiam uzi la Unikodan numeron de la euro-signo, “8364”, skribante &#8364;.

Noto: Se oni tamen provas uzi “&#128;”, povas esti, ke la TTT-legilo montras la celitan euro-signon, sed principe ghi povas montri chion ajn. En Unikodo ne estas difinita ia signo por kodpozicio 128, kaj chio ajn povas okazi. Eble hazarde la afero funkcias en tiu legilo, per kiu oni kontrolas, sed oni ne povas scii, chu aliaj legiloj kondutos same. Se oni nepre volas uzi la kodon “windows-1252” por euro-signo, oni skribu la euro-signon rekte lau tiu kodo. Tiam chio estas ghusta. Se oni uzas Latinon 1, oni devas skribi euro-signon per numera referenco au per simbola nomo, char en Latino 1 la euro-signo tute ne ekzistas.

Indiko de signokodo

Jam en la komenca leciono pri Formalajhoj vi lernis, kiel indiki per meta-elemento, kiu signokodo estas uzata en la pagho. Ene de la head-elemento, prefere kiel unua elemento ene de head estu la jena indiko:

<meta http-equiv="Content-Type"
content="text/html; charset=utf-8" />

Kompreneble, se oni uzas alian signokodon ol “utf-8” (unu speco de Unikodo), oni devas indiki tiun signokodon anstatau “utf-8”. Se oni uzas Latinon 1, oni skribu jene:

<meta http-equiv="Content-Type"
content="text/html; charset=iso-8859-1" />

Tamen ne chiam funkcias

Se oni uzas “ekzotikajn” signojn, kaj skribas chion tute ghuste, lau chiuj reguloj, povas tamen esti, ke la signoj ne ghuste aperas por chiuj legantoj. Ne chiuj komputiloj havas tiparojn kun chiuj strangaj signoj, kaj ne chiuj TTT-legiloj estas agorditaj por uzi tiparojn kun la bezonataj signoj.

Ghenerale tiuj signoj, kiuj enestas en la signokodo “Latino 1” estas sekuraj. Pri ili oni tute ne bezonas timi. Sed aliaj signoj povas esti iom riskaj. Ghenerala konsilo estas uzi nur tiajn specialajn signojn, kiujn oni vere bezonas. Se oni skribas tekston en la Rusa, oni ja devas uzi Rusajn literojn, kaj se oni skribas tekston en la Araba, oni devas uzi Arabajn literojn. Tiam la specialaj signoj estas neeviteblaj.

Helpi per tiparindikoj

Per stilfolioj eblas indiki (proponi) al TTT-legilo, kiun tiparon ghi uzu por montri tekston. Estas do pripenseble provi eviti problemojn pri specialaj signoj per indikado de tiparo, kiu supozeble enhavas la bezonatajn signojn. Tio estas nuntempe apenau bezonata, char la hodiauaj TTT-legiloj (au la hodiauaj operacisistemoj) scias cherpi la bezonatajn signojn el alia tiparo, se ili mankas en la ordinara tiparo uzata en la pagho. Legu plu pri tiu temo en miaj paghoj pri Esperantaj literoj.

Esperantaj literoj kun supersignoj

La Esperantaj literoj kun supersignoj (ch, gh, hh, jh, sh kaj u) klare estas ekzemploj de specialaj signoj. Sed se oni faras XHTML-paghojn en Esperanto, oni ja bezonas ilin uzi.

Se oni uzas Unikodon, kaj se la tekstoredaktilo, per kiu oni kreas la paghojn, regas Unikodon, kaj se oni aranghis tiel, ke oni povas ghuste tajpi tiujn literojn per la klavaro, oni povas rekte skribi tiujn signojn en la XHTML-kodo, kaj chio devas bone funkcii.

Alie oni povas uzi numerajn signoreferencojn. Jen la numeraj referencoj de la supersignaj Esperantaj literoj:

LiteroPriskriboNumera referenco
CHMajuskla C kun cirkumflekso&#264;
chMinuskla c kun cirkumflekso&#265;
GHMajuskla G kun cirkumflekso&#284;
ghMinuskla g kun cirkumflekso&#285;
HHMajuskla H kun cirkumflekso&#292;
hhMinuskla h kun cirkumflekso&#293;
JHMajuskla J kun cirkumflekso&#308;
jhMinuskla j kun cirkumflekso&#309;
SHMajuskla S kun cirkumflekso&#348;
shMinuskla s kun cirkumflekso&#349;
UMajuskla U kun hoketo&#364;
uMinuskla u kun hoketo&#365;

Jen ekzemplo, kiun vi povas aldoni al testa XHTML-pagho, kaj provi en TTT-legilo:

<p>
E&#293;o&#349;an&#285;o &#265;iu&#309;a&#365;de.
E&#292;O&#348;AN&#284;O &#264;IU&#308;A&#364;DE.
</p>

Se oni volas skribi pli longajn tekstojn, estas tamen preferinde uzi tekstoredaktilon, kiu regas Unikodon, kaj aranghi taugan manieron rekte tajpi tiujn signojn.

Kiel lasta elturnigho, oni povas skribi surogate, ekzemple per la H-skribo (“ehhoshangho chiujhaude”) au per la X-skribo (“ehxosxangxo cxiujxauxde”), sed tiam uzu surogatan sistemon, kiun plej multaj jam bone konas (ne eksperimentu per malmute konataj sistemoj, nek kreu propran flikajhon).

Pli detalajn klarigojn vi povas trovi en miaj paghoj pri Esperantaj literoj en TTT.

Klarigojn, kiel aranghi klavaron, per kiu eblas rekte tajpi Esperante lau Unikodo, vi povas trovi en miaj paghoj pri “Esperanto en Linukso” kaj “Esperanto en Vindozo”. Tie estas ankau kelkaj konsiloj pri taugaj programoj, ekzemple tekstoredaktiloj, kiuj bone komprenas Unikodon. Se vi uzas alispecan komputilon, mi bedaurinde ne povas konsili.

Al la sekva leciono