Mnohá PDF se skutečně ženou přes OCR, protože nakladatelé u knih často ani nic jiného nemají. A některá PDF jsou tak mizerně masterovaná, že text nejde extrahovat či hůře jsou v textu PDF takové chyby (diakritika, chybějící sekce, písmena, ...), že se to nevyplatí opravovat a sjet to OCR-only i s následnou korekturou je efektivnější.
Nevyjadřuji se ale ke konkrétnímu nakladateli, distributorovi ani obchodu, situace taková obecně je a je to celkem problém, který pak e-knihy (jako celek) dost prodražuje.
Co o sobě napsat? Absolvent ČVUT FEL, linuxák, síťař. Mimo to se zajímám o elektrotechniku, elektroniku a speciálně elektrické pohony.
Přečteno 57 276×
Přečteno 15 946×
Přečteno 15 859×
Přečteno 15 160×
Přečteno 13 129×