Detail kurzu

Splunk for Analytics and Data Science

EDU Trainings s.r.o.

Popis kurzu

Tento 13,5hodinový kurz je pro uživatele, kteří chtějí dosáhnout úrovně provozní inteligence 4 (obchodní statistiky) a pokrývá implementaci analytických a datových vědeckých projektů pomocí statistik Splunk, strojového učení, vestavěných a vlastních vizualizačních schopností.

Obsah kurzu

Modul 1 – Pracovní postup analýzy

Definujte pojmy související s analytikou a datovou vědou
Popište pracovní postup analýzy
Popište běžné scénáře použití
Navigace v sadě Splunk Machine Learning Toolkit

Modul 2 – Průzkumná analýza dat

Popište účel průzkumu dat
Identifikujte příkazy SPL pro průzkum dat
Rozdělte data pro testování a školení pomocí příkazu sample

Modul 3 – Předvídání číselných polí s regresí

Odlišení předpovědí od odhadů
Identifikujte predikční algoritmy a předpoklady
Popište příkazy přizpůsobení a použití
Model numerických predikcí v MLTK a Splunk Enterprise
K vyhodnocení modelů použijte příkaz score

Modul 4 – Čištění a předzpracování dat

Definujte předzpracování a popište jeho účel
Popište algoritmy, které předzpracovávají data pro použití v modelech
Použijte FieldSector k výběru relevantních polí
Ke snížení rozměrů použijte PCA a ICA
Normalizujte data pomocí StandardScaler a RobustScaler
Předzpracování textu pomocí Imputer a NPR, TF-IDF, HashingVectorizer a příkaz clusteru

Modul 5 – Clusterová data

Definujte shlukování
Identifikujte metody shlukování, algoritmy a případy použití
Ke shlukování dat použijte Smart Clustering Assistant
Vyhodnoťte shluky pomocí skóre siluety
Ověření soudržnosti shluků
Popište osvědčené postupy shlukování

Modul 6 – Detekce anomálií

Definujte detekci anomálií a odlehlé hodnoty
Identifikujte případy použití detekce anomálií
Použijte nástroj Splunk Machine Learning ToolKit Smart Outlier Assistant
Detekujte anomálie pomocí algoritmu funkce hustoty
Optimalizujte detekci anomálií pomocí místního odlehlého faktoru
Prohlédněte si výsledky pomocí vizualizace Distribuční graf

Modul 7 – Odhad a předpověď

Odlišení predikcí od předpovědí
Použijte Smart Forecasting Assistant
Použijte algoritmus StateSpaceForecast
Prognóza dat s více proměnnými
Zohledněte periodicitu v každé časové řadě

Modul 8 – Klasifikace

Definujte klíčové klasifikační pojmy
Používejte klasifikační algoritmy
Automatická předpověď
Logistická regrese
SVM (podpora vektorových strojů)
RandomForestClassifier
Vyhodnoťte kompromisy klasifikátorů
Vyhodnoťte výsledky více algoritmů
Certifikát Na dotaz.
Hodnotenie




Organizátor