Nejsem tak zběhlý v R, takže úplně nechápu tuhle %>% notaci.
Tedy, tohle je mi jasné:
covid_data$date = covid_data$date %>%
mdy()
Odpovídá:
covid_data$date <- mdy(covid_data$date)
Ale co si mám představit pod tímhle: ?
covid_data <- data %>%
select(-"Province/State", -Long, -Lat) %>%
gather(date, cases, -"Country/Region") %>%
rename(country = "Country/Region") %>%
group_by(country, date) %>%
summarize(confirmed = sum(cases))
Mohl by to někdo prosím přepsat do více srozumitelné formy?
@PH: %>%
je pipe operator, vizte https://cran.r-project.org/web/packages/magrittr/magrittr.pdf . Vlastně přebírá výsledek předchozího a vkládá jej jako první parametr do další funkce. Něco jako unixová pipeline.
Hmm tak to tedy asi opravdu funguje,
covid_data <- summarize (group_by(rename(gather(select( data,-"Province/State", -Long, -Lat),date, cases, -"Country/Region"),country = "Country/Region"),country, date),confirmed = sum(cases))
Ale mam z toho %>% zpusobu zapisu takovy ambivalentni pocit, vypada to prehledne, usporne, ale mam obavu, ze v pripade chyby to nedokazu rozklicovat.
Obdobne to mam s temi + na konci radku u ggplot.
Jinak diky za pekny priklad a zdroj dat pro aktualni situaci...
Ten operátor není přímo z R. Je z knihovny magrittr a ta je zase součástí Tidyverse, stejně jako ggplot2 nebo knihovny pro manipulaci s daty dplyr a tidyr. Tidyverse představuje poměrně specifický přístup k práci s daty v R a ne každému se líbí.
Mně to smysl dává. Líbí se mi funkcionální nástroje, zpracování dat v několika krocích pomocí pipeline, spojování komponent pro definici grafu. Ale je to další vrstva, se kterou se člověk musí trochu učit.
Přečteno 54 891×
Přečteno 43 020×
Přečteno 39 944×
Přečteno 34 752×
Přečteno 31 892×