HADOOP : Kdy už má cenu o něm uvažovat a kdy ještě

HADOOP versus SPARK: Srovnání výkonnosti pro různé ETL úlohy
Vilém Řezníček

Spekuloval jsem před časem o výhodách nasazení HADOOP řešení jako náhradě za několik existujících a velmi pomalých ETL úloh. Výsledky experimentu je možné najít zde - v minulém článku. Jestli otázkou tehdy bylo, zda tehdejší úlohy je vhodné nahradit řešením HADOOP/MR nebo nikoliv, nyní experimenty už vedly k ověřování jak by dále zpracování urychlil SPARK. Tzn…

22. 3. 2020 16:08 (aktualizováno)
Analýza sentimentu - databáze českých slov s polaritou (AFINN.CZ]
Vilém Řezníček

Pro několik experimentů jsem potřeboval dostatečně rozsáhlý soubor českých slov pro vyjádření sentimentu mluvčího v psaném textu. Na internetu se lze dopátrat podobných databází, nevyhovovaly ale svým poměrně malým rozsahem, nebo kvalitou klasifikace jednotlivých slov. Po několika pokusech se dostatečně rozsáhlou databázi podařilo sestavit…
14. 7. 2018 19:58 (aktualizováno)

analýza sentimetu

databáze českých slov

negativní sentiment

pozitivvní sentiment

sentiment analysis
HADOOP : Kdy má cenu o něm uvažovat, kdy ještě ne.
Vilém Řezníček

Otázkou experimentu, získat představu o rychlosti zpracování dat s využitím technologie Hadoop a srovnání s „klasickým způsobem”, jsem se zabýval už velmi dlouho. Vše začalo, když jsem se poprvé s Hadoopem seznámil a viděl výrazně delší dobu zpracovávání dat v nesprospěch Hadoopa. V době publikace článku už od té doby uplynuly více jak čtyři roky. Za tu dobu se mi nepodařilo narazit na nějaké srovnání, nebo se setkat s někým, kdo měl z této oblasti nějakou konkrétní zkušenost…
1. 4. 2020 7:57 (aktualizováno)

analýza sentimetu

BI

bigdata

Cloudera

hadoop

hdfs

Hortonworks

map

map side join

mapreduce

reduce

reduce side join

zpracování dat

1–3 / 3

HADOOP versus SPARK: Srovnání výkonnosti pro různé ETL úlohy

Analýza sentimentu - databáze českých slov s polaritou (AFINN.CZ]

HADOOP : Kdy má cenu o něm uvažovat, kdy ještě ne.

Vilém Řezníček

Poslední názory

Témata

HADOOP : Kdy už má cenu o něm uvažovat a kdy ještě

HADOOP versus SPARK: Srovnání výkonnosti pro různé ETL úlohy

Analýza sentimentu - databáze českých slov s polaritou (AFINN.CZ]

HADOOP : Kdy má cenu o něm uvažovat, kdy ještě ne.

Vilém Řezníček

Poslední názory

Témata

Dále u nás najdete

WordPress 7 přináší integraci AI a vylepšený editor Gutenberg

Česko šláplo na plyn v adopci AI, tisíce úředníků ji využívají v praxi

Česko chce vytvořit náhradu WhatsAppu či Signalu

Proč se AI v Česku nedaří?

Výběry z bankomatů zahraniční kartou v Česku: Kde zaplatíte víc?

Tichá hrozba s reálnými dopady? Kybernetické útoky na obce

Gamingu zdar, trh monitorů táhnou vzhůru herní modely

Vyhledávače v roce 2026: čím nahradit Google?

Jak se zdravotníci připravili na pacienta s podezřením na ebolu

Na zaplacení daně z nemovitostí zbývá týden. Kde se změnila?

V Česk vzniká „startupová mafie“ a je to dobrá věc

Novela posílí práva velkých developerů na úkor spotřebitelů

Test: Kia K4 vypadá moderně, ale vzpomíná na staré dobré časy

Jednotné hlášení: Stát si zatím vytěžuje data, náklady nesou firmy

Nova následuje Primu a zakazuje přetáčení reklam

Útoky na domácí routery: staré chyby a nepozornost uživatelů

Starlink v Evropě zrychlil o 45 %, v Česku konkuruje fixním sítím

Reakce okolí byly až neskutečné, vzpomíná pacientka s rakovinou

Jak bude vypadat a fungovat EET 2.0? Přinášíme podrobný přehled

Legendární Kachna jako EV s cenou pod 360 tisíc korun