Šokující titulek, datum vydání prvního dubna. To vypadá jako aprílový žert. Kéž by…
Tímto zápiskem bych rád navázal na předchozí zápisek o tom, kterak je možné e-knihu pro Kindle rozebrat, opravit a znovu sestavit. K jeho napsání mě vyprovokoval nákup e-knihy Robert Galbraith − Volání Kukačky od nakladavatelství Plus, kterou jsem zakoupil v obchodě eReading.cz. Uvedená kniha byla vysázena neproporcionálním fontem malé velikosti, což mě samo o sobě donutilo k obrácení se na podporu eReadingu. Ta slíbila, že zajistí nápravu a informuje mě o tom, kdy si budu moci opravenou verzi stáhnout. Od této reakce z 20. února 2014 se nic dalšího nestalo.
Font knihy jsem si tedy opravil sám a dal se do čtení. První co mě praštilo do očí, bylo podivné používání teček, například:
„Je to. jste v pořádku?” zeptal se Strike a dal si záležet, aby nepohlédl do míst pravděpodobného zranění.„No… já vlastně… chtěl bych… jestli by se nedalo jen zkontrolovat. já myslím, že my dva se už známe.” „Opravdu?”
Pohled do PDF verze e-knihy, která vypadá, že na rozdíl od ostatních vznikla ze stejného zdroje, jako podklad pro tiskárnu papírové knihy, odhalí, kde je problém:
Došel jsem k závěru, že se musí jednat o nějaký omyl při exportování HTML verze knihy, kde došlo k nahrazení znaku výpustky (…) za znak tečky. Nahradil jsem tedy všechny výskyty tečky, za kterou následuje malé písmeno, znakem výpustky.
Některé odstavce e-knihy se lámou uprostřed věty. Pohled do PDF ukazuje, že jde o stránkový zlom:
„Promiňte… moc se omlouvám,” ozval se přerývaně Bristow, když se dveře zavřely. „To je… já normálně ne… už jsem se vrátil do práce, jednám s klienty…” Několikrát se zhluboka nadechl. Se zarudlýma očima se teď'podobal ještě víc albínskému králíkovi. Pravé koleno mu pořád cukalo, poskakovalo nahoru a dolů.
Zatímco oba předchozí problémy by se teoreticky daly vysvětlit i nějakým problémem během exportu textu ze sázecího systému do HTML, další vady už dokládají něco, co by mě ani ve snu nenapadlo, totiž je originální e-kniha vznikla pomocí technologie převodu obrazu na text. Dá se toho všimnout už v předchozí ukázce, na konci prvního odstavce, kde za slovem „teď“ následuje ještě nadbytečný apostrof. Další výživné ukázky je možné najít všude tam, kde v tištěné knize použili speciální font nebo řez. U ukázky jsem naschvál nechal viditelné i HTML značky, aby bylo vidět, jak se střídají styly po jednotlivých znacích (jak typické pro OCR):
DUFFIELD NA NÁVŠTĚVĚ u SMRTELNÉHO LOŽE LTJLINY MATKY
a Bestiguiových chyběly. První záznam Wilson učinil v 9.10 při příchodu pošťáka; další v 9.22, to dorazila <span class=„t10“>Donáška kv</span><span class=„t10“>ě</span><span class=„t10“>tin do bytu</span> <span class=„t10“>č.</span> <span class=„t10“>2</span><span class=„t7“>;</span> a konečně v 9.50 <span class=„t7“>Securibeí</span>í. U záznamu kontrolora alarmů nebyl doplněný žádný čas odchodu.
Možná nejlepší by bylo namísto prostého požadavku na podporu v daném případě poslat regulérní reklamaci a žádat opravení vad. Budete-li neoblomní, získáte od prodejce přinejmenším refundaci formou kreditu na další nákup (jako v komentáři 17 pod sada patchů, kterou jsem aplikoval na zdrojové HTML soubory. Kromě toho jsem text projel známým nástrojem vlna, který nahradil mezery po jednopísmenných předložkách za nedělitelné. Tenhle patch jsem ale ze sady radši vyřadil, protože změn bylo tolik, že by to mohlo být nad rámec zákonné licence pro citaci.
Tento zápisek berte prosím také jako otevřený dopis nakladatelství, které se dokonce zaštiťuje legendární značkou Albatros. Způsob, jakým se chová k české verzi světového bestselleru je krajně neuctivý. Možná by nebylo od věci informovat o problémech původní nakladatelství a doporučit, aby zvážilo další poskytování exkluzivních licencí tomuto nakladatelství.
Mnohá PDF se skutečně ženou přes OCR, protože nakladatelé u knih často ani nic jiného nemají. A některá PDF jsou tak mizerně masterovaná, že text nejde extrahovat či hůře jsou v textu PDF takové chyby (diakritika, chybějící sekce, písmena, ...), že se to nevyplatí opravovat a sjet to OCR-only i s následnou korekturou je efektivnější.
Nevyjadřuji se ale ke konkrétnímu nakladateli, distributorovi ani obchodu, situace taková obecně je a je to celkem problém, který pak e-knihy (jako celek) dost prodražuje.
Nejak tomu nerozumiem. Vyrobca deklaroval, ze sa e-kniha vyraba nejakym postupom (nie OCR) a oklamal ta? Ja osobne hodnotim tri bodky miesto trojbodky a apostrof naviac v slove „teď“ ako drobne kvalitativne vady.
Podla mna nepotrebujes ani refundaciu formou kreditu, ani skusat dookola nove verzie knihy a hlasit v com je problem. Vyspi sa s niekym a uvidis to v inom svetle.
[3] To bych chápal, kdyby to zároveň nebylo nakladatelství, které zajišťovalo překlad. To přeci musí mít k dispozici rukopis ve strojově zpracovatelné formě.
[6] Nejde o „tri bodky namísto trojbodovky,“ jde o jednu bodku namísto trojbodovky, což při čtení působí dost nepříjemně, stejně jako Securibeíí namísto Securibell a LTJLINY namísto Luliny. Je mi upřímně jedno, jakým způsobem knihu vyrobí, když je výsledek v pořádku. Když je výsledkem zmetek, snažím se zjistit, co k tomu zmetku vedlo.
Ve velmi výjimečných případech se dělají ePUBy z PDF a pokud je ten, kdo to dělal hovado (nebo mu za to platěj tak málo, že se mu nevyplatí nad tim trávit čas) a neopraví to ručně, tak z toho pak lezou hrozný věci. (opravdu nakladatel občas nemá nic jiného, než to pdf)
Ale i z podkladů pro sázecí programy (InDesign, Quark,...) občas padaj šílenosti - většinou kvůli hovadům "typografům" (trojtečka, stránkové zlomy, lámání uprostřed slov,špátné české znaky jsou typické případy). Střídání stylů několikrát během slova není neobvyklé u exportu z InDesignu (já to vždy opravuju, ale většina co sem viděl to tam nechává).
Další varianta může být převod z nějakého sázecího programu do jiného a pak až export Quark->InDesign->ePUB.
Bohužel kvalita e-knih je taková jaká je, protože to nakladatelé neřešej nebo řešej jen aby to bylo, ale kvalitu vesměs moc nehlídaj. A za ty peníze, který za převody jsou to spousta lidí odflákne - začarovaný kruh. (Dělám e-knihy pro nakladatelství)
[4] OCR se dělá přímo z PDF, ale i tak je to samozřejmě drahé a zdlouhavé, protože to generuje dost chyb. Přidejte k tomu formátovací onanii a převod do e-knihy se třeba nikdy nezaplatí a dělá se jen proto, aby byla kompletní série, splnila se smlouva příp. to vypadalo dobře v číslech. Jakou péči tomu pak lidé věnují...
[7] S komunikací problém nebývá, nakladatelé dají, co mají, ale problém je, že často nemají. U starších knih už třeba existuje pouze (!) to PDF. Tam, kde mají alespoň InDesign taky není vyhráno, protože kniha třeba vypadá dobře na papíře (proto byla tvořená), ale že by si někdo lámal hlavu s nedělitelnými mezerami, odsazením a třebas i návazností bloků. Viděl jsem i experty, kteří dvousloupcovou vazbu psali "ručně" tabelátorem!
Situace se pomalu lepší, protože si už nakladatelé uvědomují, že musí s e-booky počítat už během tvorby knihy a jakmile existuje kvalitní podklad, je radost s takovou knihou pracovat (rychle, levně, kvalitně). Zatím to jsou ale spíš vlaštovky než naopak. Pro zajímavost, situace je v některých případech tak smutná, že se pro tvorbu e-knihy raději použije OCR verze z warez fóra, protože je kvalitnější než originál, který má nakladatel.
[6] Čemu tady nejde porozumět? Koupila jsem si knihu, ve které jsou tak závažné chyby, že nejde pořádně číst. Tak jsem ji reklamovala. U papírové bych udělala totéž. Už jsem e-knih koupila dost, ale s něčím tak mizerným, jako byla ta Kukačka, jsem se ještě nesetkala. Vyspat se s někým nepomohlo. ;)
[11]. Je možné, že knihu mezitím trochu opravili. Já si ji teď stáhnul znovu a porovnávám proti sadě patchů:
Kniha je stále vysázena monospacem titěrné velikosti (což osobně považuji za nejhorší chybu; a přitom stačí opravit CSS)
Opravdu, jednotečky byly opraveny na tři tečky.
Odstavcový zlom uprostřed věty tam je stále.
Novinový titulek stále zní: „DUFFIELD NA NÁVŠTĚVĚ u SMRTELNÉHO LOŽE LTJLINY MATKY“
Bezpečnostní firma se stále jmenuje „Securibeíí“.
Dalších pět náhodně vybraných problémů ze sady patchů je neopravených.
Shrnuto: Za více než měsíc, během kterého jsem byl schopen tempem 20 minut denně knihu přečíst a vyznačit chyby, bylo nakladatelství/prodejce schopno pouze opravit problém výpustek. Smutné.
Mozna proto e-knizka muze byt i drazsi, nez vazane vydani. Ted jsem na to ziral na Amazonu: http://www.amazon.com/The-Storied-Life-A-Fikry/dp/1616203218
Chtěl jsme u http://eReading.cz/ koupit jinou knihu, ale po zkušenosti popsané v blogu jsem se nejprve na podpoře e-mailem dotázal, zda byla zkontrolována kvalita té mnou požadované knížky. Nešlo mi ani tak o nějakou odpověď, jako hlavně o to, aby si uvědomili, že si informaci o prodávaném šmejdu lidé mezi sebou řeknou.
Asi u eReading.cz slaví hodně dlouhé svátky, protože zatím jediná reakce byla 3.4. automatická odpověď „odpovíme nejpozději následující pracovní den“.
Takže u mne osobně jde eReading.cz na blacklist.
Co o sobě napsat? Absolvent ČVUT FEL, linuxák, síťař. Mimo to se zajímám o elektrotechniku, elektroniku a speciálně elektrické pohony.
Přečteno 57 271×
Přečteno 15 946×
Přečteno 15 857×
Přečteno 15 156×
Přečteno 13 127×