Ještě k Unicodu a XML 1.1

23. 11. 2007 13:48 (aktualizováno) Petr Cimprich

V komentářích k mému včerejšímu postu Splynou XML 1.0 a 1.1? zaznělo několik zajímavých názorů, ke kterým bych se rád vrátil. Některé připomínky mě překvapily a rád bych si ujasnil, jak to s Mongoly, Etiopany a Khméry doopravdy je.

Mongolové možná dnes píšou hlavně azbukou, to nevím. Každopádně Unicode 5.0 obsahuje sadu mongolských znaků (1800–18AF), které napohled vypadají spíše jako písmo příbuzné tibetskému. Ani tyto znaky, ani etiopské (1200–137F), ani khmérské (1780–17FF) jsem při letmém pohledu do databáze znaků Unicodu 2.0 nenašel. Řekl bych, že v roce 1998 žádný z těchto rozsahů ještě nebyl používán. Nevyznám se ale dostatečně v historii Unicodu – třeba by někdo uměl vše uvést na pravou míru.

Pokud je to tak, jak si myslím, není možné použít uvedená písma v XML 1.0 nejen v názvech elementů a atributů, ale ani v textu. Nevím ani do jaké míry jsou tato písma stále používaná a živá, ale pravděpodobně je někdo používat bude. Všechno jsou to písma hodně stará, mají za sebou slavné historické epochy a musí v nich být zapsáno hodně informací. Nemohou-li používat XML 1.0, je to nepochybně škoda.

Nicméně, pořád si nemyslím, že je dobrý nápad vnutit XML 1.1 uživatelům proti jejich vůli, jako revizi XML 1.0. Až se Mongolové a ti ostatní rozhodnou, že chtějí v XML psát svým písmem, je tu pro ten účel připravené XML 1.1. Že nejsou parsery? Nepodceňujme Mongoly. Když budou chtít parser XML 1.1, tak si ho napíšou. Mimochodem, vzít jeden z mnoha open-source parserů XML 1.0 a vyrobit z něj klon pro XML 1.1 není nic složitého. V zásadě by mělo stačit upravit tabulky povolených znaků. Až vznikne reálná poptávka, někdo se toho rád ujme.

Sdílet