Esperantaj literoj en TTT

Unikodo

Kiam oni faras Unikodan TTT-paghon, oni au povas skribi la Esperantajn supersignajn literojn rekte per la kodprezento UTF-8, au oni povas uzi numeran skribon. (Ekzistas ankau aliaj kodprezentoj ol UTF-8, sed nur UTF-8 estas vere rekomendinda por normala uzo.)

Unikodo lau UTF-8 «

En UTF-8 chiuj signoj, kiu ne estas en simpla Askio (ASCII), estas kodita per du au pli da bitokoj. La Esperantaj literoj estas chiuj skribataj per po du bitokoj. Jen tabelo, kiu montras la dekumajn numerojn de tiuj bitokoj, kiuj reprezentas la Esperantajn supersignajn literojn en UTF-8:

Majuskla C kun cirkumflekso 196+136
Minuskla c kun cirkumflekso 196+137
Majuskla G kun cirkumflekso 196+156
Minuskla g kun cirkumflekso 196+157
Majuskla H kun cirkumflekso 196+164
Minuskla h kun cirkumflekso 196+165
Majuskla J kun cirkumflekso 196+180
Minuskla j kun cirkumflekso 196+181
Majuskla S kun cirkumflekso 197+156
Minuskla s kun cirkumflekso 197+157
Majuskla U kun hoketo 197+172
Minuskla u kun hoketo 197+173

Sed normale oni ja ne bezonas scii pri tiuj teknikajhoj. Oni simple uzu tekstoredaktilon, kiu regas UTF-8-on. Tia redaktilo estas ekzemple “Vim” (ekde versio 6).

Unikodo - numera skribo «

Se oni ne havas tekstoredaktilon, kiu regas Unikodon, oni povas en HTML (kaj ankau en XML) anstataue skribi chiun Unikodan signon per ghia numero. Plej bone funkcias skribi la numerojn dekume: Ĉ ĉ Ĝ...

Jene oni skribas la Esperantajn supersignajn literojn numere en HTML:

Majuskla C kun cirkumflekso Ĉ
Minuskla c kun cirkumflekso ĉ
Majuskla G kun cirkumflekso Ĝ
Minuskla g kun cirkumflekso ĝ
Majuskla H kun cirkumflekso Ĥ
Minuskla h kun cirkumflekso ĥ
Majuskla J kun cirkumflekso Ĵ
Minuskla j kun cirkumflekso ĵ
Majuskla S kun cirkumflekso Ŝ
Minuskla s kun cirkumflekso ŝ
Majuskla U kun hoketo Ŭ
Minuskla u kun hoketo ŭ

Por kelkaj signoj ekzistas en HTML ankau nomaj kodoj: π σ..., sed ankorau ne por la Esperantaj literoj.

Rudimenta ekzemplo

Jen sekvas ekzempla kodo de rudimenta Esperanta TTT-pagho kun numeraj indikoj de la Unikodaj Esperantaj literoj. Post la kodo estas ligo al pagho tiel verkita. Iru al tiu pagho por vidi, kio rezultighas el la kodo. Rimarku, ke la kodo estas lau HTML5, la nova formo de HTML.

<!DOCTYPE html>
<html>
<head>
<title>Pa&#285;o pri la Esperantaj literoj</title>
</head>
<body>

<h1>La Esperantaj literoj</h1>

<p>
Jen iom da teksto:
E&#293;o&#349;an&#285;o &#265;iu&#309;a&#365;de.
E&#292;O&#348;AN&#284;O &#264;IU&#308;A&#364;DE.
</p>

</body>
</html>

Jen kiel prezentighas (por vi) la chi-antaua ekzemplo.

Jen tiu sama ekzemplo, sed kun Esperantaj literoj lau UTF-8.

Komentoj «

  • Por ke la Esperantaj signoj efektive aperu en legebla formo sur ekrano (au surpapere) tamen necesas, ke tiparoj kun tiuj signoj estas uzataj de la TTT-legilo. Antaue mi konsilis chi tie, ke oni nepre lasu la elekton de tiparo al chiu leganto mem, kaj ke oni ne uzu indikojn pri specifaj tiparoj (nek per kodoj kiel <font face="...">, nek per stilfolio), char principe ne eblas scii, chu tiu tipara versio, kiun la leganto havas en sia komputilo, enhavas Esperantajn literojn. Nuntempe tamen praktike chiuj ordinaraj tiparoj instalitaj en komputiloj – chu Vindozaj, chu Linuksaj, chu Makintoshaj, chu alispecaj – enhavas la supersignajn literojn de Esperanto. Tial nuntempe oni kredeble ne plu bezonas atenti pri tiu konsilo, almenau se oni indikas uzon de tiparoj, kiuj estas vaste uzataj.

    Krome nuntempe eblas en stilfolioj uzi indikojn de specialaj tiparoj, kiujn la TTT-legilo aparte elshutu por uzado en la koncerna TTT-pagho. Oni tiam uzas la stilfolian kodajhon @font-face, kiu estas parto de versio 3 de la stilfolia lingvo CSS. Se oni uzas tiun eblon, oni povas scii ekzakte, kiujn signojn la tiparo enhavas. Sed oni zorge kontrolu la signorepertuaron, char multaj TTT-ejoj, kiuj disponigas tiajn tiparojn, prezentas por senkosta elshutado tiparojn, en kiuj niaj supersignaj literoj mankas! Tio estas tute komprenebla: Tiparoj elshutataj por uzo en TTT-paghoj prefere ne estu tro grandaj. Ideale ili enhavu nur tiujn signojn, kiuj estas efektive uzataj en la TTT-pagho. Plej multaj TTT-paghoj ne uzas Esperantajn literojn, almenau statas tiel ankorau en 2011 (eble kiam vi legos tion chi, estos alie...).

  • Kiam oni uzas UTF-8-on, oni ankau povas enmiksi numere skribitajn signojn (&#264; &#265;...) kaj nomkodojn (&ouml; &eacute; &pi;...).

    Kiam oni skribas lau UTF-8, oni ne povas enmiksi unubitokajn signojn lau ekzemple Latino 1. Chiujn signojn ekster baza Askio (kun numeroj pli altaj ol 127) oni tiam devas au skribi UTF-8-e (per po du au pli da bitokoj), au skribi nomkode, au skribi numere (&Auml; &ntilde;... &#196; &#241;...).

  • Se oni uzas UTF-8-on, oni devas iel anonci al la TTT-legilo, ke tiu kodo estas uzata. Tion oni prefere faru per la tiel nomata HTTP-chapo. Tio estas informoj pri la pagho, kiujn la servilo sendas al la TTT-legilo antau ol ghi sendas la efektivan paghon. Por anonci, ke aperos HTML-pagho kodita lau UTF-8, la servilo sendu la jenon:

    Content-type: text/html; charset=UTF-8

    (Nepre estu malplena linio post tiu HTTP-chapo!)

    Se oni ial ne havas eblon au rajton agordi la servilon, ke ghi faru tian anoncon pri UTF-8, oni povas anstataue fari la anoncon en meta-elemento ene de la HTML-pagho. Jen ekzemplo:

    <!DOCTYPE html>
    <html>
    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <title>Pagho pri la Esperantaj literoj</title>
    </head>
    <body>
    [...]

    Oni povas fari la anoncon en ambau manieroj samtempe. Efektive tia anonco en meta-elemento povas esti utila, se oni legas HTML-paghon loke (ne tra reta servilo). Tial povas esti konsilinde chiam inkluzivi tian meta-elementon, se oni uzas UTF-8-on.

    Efektive oni povas uzi ankau aliajn signokodojn ol Unikodo, ekzemple Latinon 1, Latinon 2 au KOI-8-R, kaj tamen enmiksi Esperantajn literojn. Tiam oni skribu la Esperantajn literojn chiam nur numere. Efektive en HTML-pagho oni povas chiam skribi chiun ajn signon, kiu ekzistas en Unikodo, per tia numera indiko (au per nomkodo), sendepende de la uzata signokodo de la pagho. Tiam la numeroj chiam sekvu Unikodon, neniam la signokodon uzatan en la pagho. Jen pli da informoj pri signokodoj.

  • Lau la normo HTML-dokumento devas komencighi per informo pri la dokumenta tipo (<!DOCTYPE ...>). Tia deklaro montras, kiu versio de HTML estas uzata en la dokumento. La DOCTYPE-deklaro en la chi-tieaj ekzemploj montras, ke estas uzata HTML5. Antaue neniu TTT-legilo vere atentis pri la anoncita dokumentotipo, sed nuntempe kelkaj legiloj ja atentas. Tiuj legiloj elektas surbaze de tiu deklaro (au manko de deklaro), chu prezenti la paghon (kiom ili povas) lau la ekzistantaj normoj por HTML kaj CSS (stilfolioj), au chu imiti la prezentokapricojn kaj prezentoerarojn de malnovaj legiloj. Iafoje la prezento de pagho povas draste shanghighi se oni shanghas la dokumentotipan deklaron. La deklaro, kiun mi montris chi-antaue, igas tiujn legilojn (provi) sekvi la normojn, kaj estas tial bona elekto.

    Estas chiam rekomendinde kontroli per tiucela programo, chu la pagho estas valida (= ghuste verkita): validumi la paghon. En validumado dokumento-tipa deklaro estas necesa. Bona servo por validumi HTML-paghojn ekzistas che <http://validator.w3.org/>.

  • Kelkaj malnovaj TTT-legiloj, kiuj ghenerale subtenas Unikodon, kaj kiuj povas montri Esperantajn supersignajn literojn, tamen havas problemojn pri tiaj signoj en iuj specialaj kuntekstoj. Problemoj povas aperi pri teksto en <title>-elementoj, alternativa teksto de bildoj (alt-atributo ene de img-marko), teksto en la statusa strio, kaj teksto en dialogujoj (kiujn oni povas aperigi ekz. per Javaskripto). Tiuj problemoj plejparte nun malaperis, sed ankorau indas aparte kontroli la efektivan rezulton en tiaj specialaj kuntekstoj en diversaj TTT-legiloj.