Článek
Serverless - „bezserverový“
Data science a ML by se měly koncentrovat na výpočet a tak je použitý serverless přístup, data jsou dány do fázi výstavby, trénované na datasetu a řízené podle jejich zdroje a relevance různými ML technikami.
Nástroje
Notebooks
Notebook je základním nástrojem pro ML převzetý z aplikace Jupyter - doporučuji hledat videa - Jupyter
Vytvoř a spusti AutoML Experiment
Pro běh experimentu je použita No-code automatizace. Čili jde to na pozadí a nemusíte se tím zabývat - něco jako použi smartphone a nestarej se jak funguje
Kroky AutoML UI v pipeline:
pipeline čili roura - to je datový proud který se nakonfiguruje.
OML AutoML UI Interactive Learning
Roura funguje tedy jako posloupnost - Datový zdroj - Auto ML experiment - typ predikce- výběr ML modelu - výběr algoritmu - adaptivní vzorkování - sampling /pro urychlení feature selection/ - feature selection - výběr podsetu features které jsou pro daný model-cíl nejprediktivnější - opakuji, feature je obvykle sloupec pro datový soubor významný - cílem je redukovat počet features pro future sampling - model tuning - cíl zvýšit kvalitu modelu v závislosti na vybrané metrice - vliv - impact - na feature prediction.
Znovu opakuji - počet features je potřeba omezit pro zamezení tzv. overfittingu tj. situace kdy model sleduje „hluk = noise“, kterého se právě chceme zbavit.
Vytvoř AutoML UI Experiment
Pro použití Oracle Machine Learning AutoML UI začneme vytvořením experimentu. Na experimentu - minimálně specifikujete datový zdroj, prediction target, prediction typ. Když experiment běží úspěšně, prezentuje vám seznam ML modelů v pořadí jejich kvality dle vybrané metriky, čili znovu automatizace v praxi . Můžete vybrat jakýkoliv model anebo generovat notebook. Ten obsahuje Python kód za použití OML4Py - aplikace Oracle ML for Python a specifikuje nastavené AutoML použité pro produkci modelu.
V schema column vyberete schéma. Momentálně se tedy pohybujeme v konzoli kde vybíráme features, sloupce and jejich příslušné schémy.
Schema je v Oracle rovna pojmu user=uživatel
Note: Pří výběru datového modelu jsou zobrazeni statistiky ve Features grid - konzoli naspodu experimentální stránky.
V Predict drop-down seznamu vyberte sloupec z vybrané tabulky - to je target pro vaši predikci. Tj. stále vybíráme neboli selektujeme features, korigujeme jejich výběr, počet dle požadavek modelu.
V políčku Prediction Type je výběr automatický v závislosti na data definici. Můžete však změnit prediction type z drop-down menu, když to typ dat dovoluje.
Zhrnutí - tohle je pohled JAK konzole funguje - pro pochopení ML je spíše zásadní makropohled, tj. pochopit co je to feature a proč je overfitting škodlivý.