Hlavní obsah
Internet a technologie

Umělá inteligence a machine learning 16

Médium.cz je otevřená blogovací platforma, kde mohou lidé svobodně publikovat své texty. Nejde o postoje Seznam.cz ani žádné z jeho redakcí.

Umělá inteligence a machine learning 16 - serverless, notebook.

Článek

Serverless - „bezserverový“

Data science a ML by se měly koncentrovat na výpočet a tak je použitý serverless přístup, data jsou dány do fázi výstavby, trénované na datasetu a řízené podle jejich zdroje a relevance různými ML technikami.

Nástroje

Notebooks

Notebook je základním nástrojem pro ML převzetý z aplikace Jupyter - doporučuji hledat videa - Jupyter

Vytvoř a spusti AutoML Experiment

Pro běh experimentu je použita No-code automatizace. Čili jde to na pozadí a nemusíte se tím zabývat - něco jako použi smartphone a nestarej se jak funguje

Kroky AutoML UI v pipeline:

pipeline čili roura - to je datový proud který se nakonfiguruje.

OML AutoML UI Interactive Learning

Roura funguje tedy jako posloupnost - Datový zdroj - Auto ML experiment - typ predikce- výběr ML modelu - výběr algoritmu - adaptivní vzorkování - sampling /pro urychlení feature selection/ - feature selection - výběr podsetu features které jsou pro daný model-cíl nejprediktivnější - opakuji, feature je obvykle sloupec pro datový soubor významný - cílem je redukovat počet features pro future sampling - model tuning - cíl zvýšit kvalitu modelu v závislosti na vybrané metrice - vliv - impact - na feature prediction.

Znovu opakuji - počet features je potřeba omezit pro zamezení tzv. overfittingu tj. situace kdy model sleduje „hluk = noise“, kterého se právě chceme zbavit.

Vytvoř AutoML UI Experiment

Pro použití Oracle Machine Learning AutoML UI začneme vytvořením experimentu. Na experimentu - minimálně specifikujete datový zdroj, prediction target, prediction typ. Když experiment běží úspěšně, prezentuje vám seznam ML modelů v pořadí jejich kvality dle vybrané metriky, čili znovu automatizace v praxi . Můžete vybrat jakýkoliv model anebo generovat notebook. Ten obsahuje Python kód za použití OML4Py - aplikace Oracle ML for Python a specifikuje nastavené AutoML použité pro produkci modelu.

V schema column vyberete schéma. Momentálně se tedy pohybujeme v konzoli kde vybíráme features, sloupce and jejich příslušné schémy.

Schema je v Oracle rovna pojmu user=uživatel

Note: Pří výběru datového modelu jsou zobrazeni statistiky ve Features grid - konzoli naspodu experimentální stránky.

V Predict drop-down seznamu vyberte sloupec z vybrané tabulky - to je target pro vaši predikci. Tj. stále vybíráme neboli selektujeme features, korigujeme jejich výběr, počet dle požadavek modelu.

V políčku Prediction Type je výběr automatický v závislosti na data definici. Můžete však změnit prediction type z drop-down menu, když to typ dat dovoluje.

Zhrnutí - tohle je pohled JAK konzole funguje - pro pochopení ML je spíše zásadní makropohled, tj. pochopit co je to feature a proč je overfitting škodlivý.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít psát. Ty nejlepší články se mohou zobrazit i na hlavní stránce Seznam.cz

Doporučované

Načítám