Odpověď na názor

Odpovídáte na názor ke článku Čeština? Jdi mi k šípku!.

  • 13. 5. 2008 22:15

    Ondrej 'SanTiago' Zajicek (neregistrovaný)

    73> tar sice budou zdánlivě fungovat, ale pokud archiv ze svého počítače jedoucího v UTF-8 rozbalíte u mě (a já pojedu 8859-2)

    Coz je ovsem plne v souladu se specifikaci a formatem taru. Vzhledem k tomu, ze format taru je dany normou POSIX, tak se s tim moc delat neda, leda pouzivat jiny format ci nestandardni rozsireni.

    73> Ušetřil byste převod pouze ve chvíli, kdy dostanete z libc název souboru v UTF-8, pak na něj už nijak nesaháte (ani ho nezobrazujete), a jen byste ho hned použil. Takových situací asi nebude moc.

    Navrhovany postup take nemel za cil usetrit prevod, ale zajistit robustnost programu. Pokud do syscallu operacniho systemu budu davat ten objekt, ktery jsem od operacniho systemu predtim dostal, tak to proste bude fungovat, at je ten objekt cokoliv (a nejsem ve Windows :–) ). Pokud ho mezitim zkonvertuji tam a zpatky, tak se to muze snadno rozbit, protoze zobrazeni UCS2_to_UTF(UT­F_to_UCS2(X)) neni identita pro vsechny posloupnosti bytu na vstupu a asi ta zobrazeni nepujde dodefinovat tak, aby to identita byla. Pokud uz bych mermomoci chtel mit nejakou jednotnou vnitrni reprezentaci a na ni vsechno prevadet tam a zpatky, tak z tohoto hlediska je lepsi UTF8, nebot UTF_to_UCS2(UC­S2_to_UTF(X)) uz identita je pro vsechny posloupnosti dvoubajtu, ale ani to neni idealni, nebot UTF_to_UCS4(UC­S4_to_UTF(X)) uz identita neni pro vsechny posloupnosti ctyrbajtu (i kdyz snad by to slo dodefinovat).