Hlavní obsah

Umělá inteligence a machine learning 19

Tlačítkem Sledovat můžete odebírat oblíbené autory a témata. Najdete je v Moje sledované na tomto webu nebo na Seznam.cz.

25. 7. 13:48

Umělá inteligence a machine learning 19 - statistické metody

Článek

Podporované Prediction Types - typy předpovědí jsou:

Klasifikace: pro nenumerické datové typy, vybrána defaultně, tj. jako předvolené.

Regrese: pro numerické - default.

Maximum Top Models: Vyber maximální počet top modelů které se mají vytvořit. Default je 5. Můžete redukovat počet top models na 2 anebo 3 aby tuning modelů pro získání algoritmů trval co nejméně. Když chcete získat počáteční výsledky ještě rychleji, uvažujte jenom o top algoritmu který vám je doporučen a nastavte počet na Maximum Top Models 1.

Maximální délka běhu: doba po kterou bude experiment moci běžet - default 8 h.

Database Service Level: to je připojení k db nastavení paralelizmu query - dotazu. Default - předvolený je Low co je no parallelism a vysoký runtime limit. Můžete vytvořit mnoho db připojení s Low database service level. Nebo můžete zvolit database service level Medium nebo High.

High level umožňuje největší paralelizmus no značne limituje počet konkurenčních připojení - jobs.

Medium dovoluje paralelizmus no dovoluje větší concurrency pro zpracování jobu.

Model Metriky: Vyberte metriku pro vybrání vítězného modelu. Nasledovné metriky jsou podporovány :

Pro klasifikaci:

Balanced Accuracy

ROC AUC

F1 (s váženými možnostmi - vážené, binární a macro.

Precision (s váženými možnostmi )

Recall (with weighted options)

Pro regresi:

R2 (default)

Negative mean squared error

Negative mean absolute error

Negative median absolute error

Algoritmus: Podporovaný algoritmu závisí od Typu předpovědi který jste vybrali. Vyberte korespondující algoritmus. Defaultně jsou vybrány všechny kandidátske algoritmy. Podporované algoritmy:

Predikční typy:

Pro klasifikaci, podporované algoritmy jsou:

Decision Tree

Generalized Linear Model

Generalized Linear Model (Ridge Regression)

Neural Network

Random Forest

Support Vector Machine (Gaussian)

Support Vector Machine (Linear)

Pro regresi:

Všeobecný Linear Model

Všeobecný Linear Model (Ridge Regression)

Neural Network

Support Vector Machine (Gaussian)

Support Vector Machine (Linear)

Poznámka: Můžete sami vybrat algoritmus - anebo odstranit algoritmus z možností - když máte specifické preference anebo požadavky. Například když je zásadní transparence modelu, vyloučení modelů jako Neural Network dává smysl. Každý algoritmus má jinou náročnost na výpočetní výkon. Naïve Bayes a Decision Tree jsou obvykle rychlejší jako Support Vector Machine anebo Neural Network.

Rozšiřte konzoli pro Features aby jste videli statistiky vybrané tabulky. Podporované statistiky jsou Distinct Values - tj. výběr vždy jenom jedné z opakovaných hodnot, Minimum, Maximum, Mean a Standard Deviation. Datové typy jsou tables, views, analytic views. Cílový sloupec který jste vybrali v Predict je tady zvýrazněn. Po dokončení běhu Features grid zobrazí dodatečnou důležitost sloupce. Feature Importance indikuje celkovou úroveň senzitivity - citlivosti pro danou feature - črtu.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Reklama

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít psát. Ty nejlepší články se mohou zobrazit i na hlavní stránce Seznam.cz