Detail kurzu

Programovací jazyk R III. - Modelovanie

IT LEARNING SLOVAKIA, s.r.o.

Popis kurzu

Modelovanie predstavuje zvyčajne poslednú a najzaujímavejšiu časť v procese analýzy dát. Počas kurzu si na konkrétnych datasetoch ukážeme širokú škálu rôznych modelov. Kurz predpokladá základné znalosti programu R (dátové typy, funkcie, podmienky) ako aj základné znalosti na manipuláciu a vizualizáciu dát. Počas kurzu si ukážeme najdôležitejšie štatistické ukazovatele (priemer, medián, kvartily, rôzne korelačné koeficienty, hypotézy a intervaly spoľahlivosti), techniky na redukciu premenných (faktorová analýza), identifikáciu klastrov v dátach (metódy kmeans, DBSCAN), ako aj modely na prediktívne modelovanie (regresia, klasifikácia) a prácu s časovými radmi. Počas kurzu pracujeme s niekoľkými datasetmi a najmodernejšími nástrojmi, akými sú napríklad prostredie RStudio a balíky dplyr, ggplot2, caret, prophet.

Obsah kurzu

==Jednorozmerné dáta - nominálne, ordinálne, a numerické dáta - miery polohy - priemer, modus, medián, kvartily - miery variability - vizualizácia jednorozmerných dát ==Dvojrozmerné dáta - práca s dvojrozmernými dátami - Pearsonov, Spearmanov, a Kendallov koeficient - MIC koeficient - vizualizácia dvojrozmerných dát ==Testovanie hypotéz - dôvody na štatistické testy - predpoklady štatistického testu - interpretácia výsledku testu - p-hodnota - najpoužívanejšie testy - t-test, ANOVA, korelačný test, chí-kvadrát test - intervaly spoľahlivosti ==Redukcia premenných - dôvody a vhodné dáta na redukciu premenných - určenie optimálneho počtu nových premenných - redukcia dimenzie pomocou faktorovej analýzy - vizualizácia a interpretácia výsledkov faktorovej analýzy ==Analýza zhlukov (segmentovanie, klastrovanie) - koeficienty podobnosti dvoch objektov - zhlukovanie vs redukcia premenných - určenie optimálneho počtu zhlukov - porovnanie rôznych zhlukovacích algoritmov - zhlukovanie metódou k-means ==Prediktívne modelovanie - základné typy predikcií - regresia, klasifikácia - prediktívne modely - krížová validácia - meranie presnosti predikcie - predpovedanie na nových dátach ==Časové rady - úvod do časových radov - rôzne typy časových radov - zobrazenie priebehu časového radu - vyhladzovanie radu - dekompozícia radu - predpovedanie budúcich hodnôt

Cieľová skupina

mierne pokročilý
Hodnotenie




Organizátor