Odpovídáte na názor ke článku OCR v linuxu II - co dnes opravdu můžeme používat.
Docela by se mi hodilo neco, co veme 60MB velky PDF (plny JPEGu) stazeny odnekud z netu a zOCRkuje ho (zase zpatky do OCR). Nektery warezaci se s tim totiz moc nese*ou a nez aby premejsleli o OCR, tak radsi uploadnou 50-500MB (ano opravdu i 500MB se najdou) velky PDF...
Dokonce jsem i videl dokonale ripnutou knihu, kde z normalniho scanu byly automaticky odstraneny okraje, vyrovnany zakrivene tvary, vsechno pismo bylo zOCRkovano a byl automaticky pouzit nejpodobnejsi font, zaroven veci, co se nepodarilo vyresit pomoci OCR byly nahrazeny puvodnim obrazkem (u textu se to stalo snad na jedinem miste v cele knize...). A byly k dispozice 2 verze - text pres obrazek (kde je zarucena 100% vernost) a text-nebo-obrazek, kde se v miste s textem obrazky vynechaji (nezaznamenal jsem temer zadny propad kvality proti prvni moznosti). A tak byl udelan velice kvalitni scan cele knihy (ale par veci nasvedcovalo tomu, ze to skutecne scan je). Nevite nekdo neco o takovem zazracnem softwaru?
Jan Kulhánek pracuje jako psycholog a psychoterapeut, prací s počítači si přivydělával hlavně při studijích. Do světa Linuxu začal více pronikat asi před třemi lety (2007), kdy si nainstaloval Ubuntu jako druhý systém. U této distribuce už zůstal i když rád experimentuje a občas zkouší různé novinky. Je „běžný“ uživatel desktopu, od kterého chce, aby byl user-friendly pro každodenní použití. Občas si skládá muziku, dělá trochu grafiku hlavně pro různé webové projektíky, stříhá video. Počítače jsou dlouhodobým koníčkem.
Přečteno 30 248×
Přečteno 26 693×
Přečteno 26 438×
Přečteno 25 331×
Přečteno 24 094×