Kial uzi la tekstoŝanĝilo

Kio estas ĉi-tio? Kaj kial?

Mi faras esperantajn retpaĝojn. Sed estas problemon: nordamerikaj komputiloj ne konas la ses esperantajn literojn, kiu surhavas ĉapeletojn. Ne estas problemon; mi simple devas fari miajn paĝojn uzante de la Latina-3-a signaron, aŭ la Unikodan signaron, kiu enhavas ilin. En la reto, multaj esperantaj retpaĝoj uzas ilin, almenaŭ Unikodo estas la preferata signaro de la teknika retregistaro, la W3C.

Sed miaj retpaĝredaktadaj iloj (Dreamweaver, ktp) ne povas trakti unikodajn signojn, eĉ en la UTF-8 speco, kaj mi ne povas tajpi unikode en ilin. Se mi volas, ke miaj retpaĝoj enhavas unikodajn literojn, mi devas aldoni la ĝustajn HTML-ajn kodojn al ilin permane... ĉi-tio vere ne estas bona. Kion faru?

Nu, estas kelkaj sistemoj kiu reprezentas la ĝustajn esperantajn signojn per aroj de bazaj senĉapeletoj latinaj signoj (kiun komputistoj konas je "ASCII-aj" signoj). Zamenhof uzis la "H-sistemo", en kiu ĉ, ĝ, ĥ, ĵ, kaj ŝ iĝas ch, gh, hh, jh, kaj sh. La ŭ simple iĝas u. Esperanton tekston nun povas reprezenti pere de latina-signaro-uzantaj iloj.

Ĉi-tio sistemo estas legebla, certe, sed kun la komputilo aperis neevidenta problemo. Kio okazas, kiam ni volas aŭtomate ŝanĝi la neesperantan signojn kontraŭ esperantaj signoj? Ĉar la H-sistemo uzas literon, kiu estas en la esperanta alfabeto, indiki la kunĉapeletajn literojn, la H-sistema teksto estas ambigua. Ĉu la grupo de signoj "gh", ekzemple, indikas "ĝ", aŭ simple "gh"?

Do, la komputistoj kreis aliajn sistemojn reprezenti la kunĉapeletajn literojn en la ASCII-a signaro. Ĉi-tiu sistemoj uzas signoj, kiuj ne estas en la esperanta alfabeto, indiki la esperantajn signojn. Ekzemple estas la "X-sistemo", en kiu ĉ, ĝ, ĥ, ĵ, kaj ŝ iĝas cx, gx, hx, jx, kaj sx; la ŭ iĝas ux. Estas aliaj sistemoj.

Nun, ne estas dubo pri la signogruopj en la neesperanta teksto; nun povas aŭtomate ŝanĝi neesperantan tekston malambigue kontraŭ esperantan tekston.

La esperanta teksto estas la dua parto de la problemo. Certe, oni volas uzi esperantan tekston en la TTT. Sed foliumiloj alie uzas ASCIIan signaron defaŭlte.

Estas du sistemoj, per kiun oni povas montri la kunĉapeletojn signojn enrete: la Unikodo signaro kaj la Latina-3 signaro. Ambaŭ bezonas, ke oni uzas arojn de signoj en la fonta HTML-teksto de retpaĝoj, kaj indiki la signaro en la HTML. Oni poste povas vidi la ĝustajn esperantajn literojn en la foliumilo.

La HTML-a signaro enhavas la du signojn "&#", poste la dekuman indikaĵon de la kodpunkto de la signo, kaj fine la punktokomon ";". Ekzemple, la HTML-a signaro por indiki la esperanta signo "ĉ" estas "ĉ" laŭ la Unikoda signaro, kaj "æ" laŭ la latina-3-a signaro. Estis ĉi-tiuj signaj aroj, kiujn mi devis enmeti permane en miaj esperantaj retpaĝoj.

La sekvanta tabelo enhavas la kunĉapeletojn literojn, kaj la senĉapeletojn literojn kiuj indikas ilin, kaj la Latina-3-ajn kaj Unikodajn kodpunktojn:

Esperanto-Litero
Metodo de literumado ASCII-a de la Esperanto-litero
Latina-3-a
Kodpunkto
Unikoda
Kodpunkto
Laŭ
H-Sistemo
Laŭ
X-Sistemo
Laŭ
X-Sistemo kun "vx"
Laŭ
Malapostrofa-
Sistemo
Laŭ
Post-
Ĉapeleto-
Sistemo
Laŭ
Antaŭ-
Ĉapeleto-
Sistemo
Laŭ
Post-
Ĉapeleto-
Sistemo kun Tildo
Laŭ
Antaŭ-
Ĉapeleto-
Sistemo kun Tildo
bazo-10
bazo-16
bazo-10
bazo-16
Ĉ
Ch
CX, Cx
CX, Cx
C`
C^
^C
C^
^C
0198
C6
0264
0108
ĉ
ch
cx
cx
c`
c^
^c
c^
^c
0230
E6
0265
0109
Ĝ
Gh
GX, Gx
GX, Gx
G`
G^
^G
G^
^G
0216
D8
0284
011C
ĝ
gh
gx
gx
g`
g^
^g
g^
^g
0248
F8
0285
011D
Ĥ
Hh
HX, Hx
HX, Hx
H`
H^
^H
H^
^H
0166
A6
0292
0124
ĥ
hh
hx
hx
h`
h^
^h
h^
^h
0182
B6
0293
0125
Ĵ
Jh
JX, Jx
JX, Jx
J`
J^
^J
J^
^J
0172
AC
0308
0134
ĵ
jh
jx
jx
j`
j^
^j
j^
^j
0188
BC
0309
0135
Ŝ
Sh
SX, Sx
SX, Sx
S`
S^
^S
S^
^S
0222
DE
0348
015C
ŝ
sh
sx
sx
s`
s^
^s
s^
^s
0254
FE
0349
015D
Ŭ
U
UX, Ux
VX, Vx
U`
U^
^U
U~
~U
0221
DD
0364
016C
ŭ
u
ux
vx
u`
u^
^u
u~
~u
0253
FD
0365
016D

Al la Ŝanĝilon