Článek
Podporované Prediction Types - typy předpovědí jsou:
Klasifikace: pro nenumerické datové typy, vybrána defaultně, tj. jako předvolené.
Regrese: pro numerické - default.
Maximum Top Models: Vyber maximální počet top modelů které se mají vytvořit. Default je 5. Můžete redukovat počet top models na 2 anebo 3 aby tuning modelů pro získání algoritmů trval co nejméně. Když chcete získat počáteční výsledky ještě rychleji, uvažujte jenom o top algoritmu který vám je doporučen a nastavte počet na Maximum Top Models 1.
Maximální délka běhu: doba po kterou bude experiment moci běžet - default 8 h.
Database Service Level: to je připojení k db nastavení paralelizmu query - dotazu. Default - předvolený je Low co je no parallelism a vysoký runtime limit. Můžete vytvořit mnoho db připojení s Low database service level. Nebo můžete zvolit database service level Medium nebo High.
High level umožňuje největší paralelizmus no značne limituje počet konkurenčních připojení - jobs.
Medium dovoluje paralelizmus no dovoluje větší concurrency pro zpracování jobu.
Model Metriky: Vyberte metriku pro vybrání vítězného modelu. Nasledovné metriky jsou podporovány :
Pro klasifikaci:
Balanced Accuracy
ROC AUC
F1 (s váženými možnostmi - vážené, binární a macro.
Precision (s váženými možnostmi )
Recall (with weighted options)
Pro regresi:
R2 (default)
Negative mean squared error
Negative mean absolute error
Negative median absolute error
Algoritmus: Podporovaný algoritmu závisí od Typu předpovědi který jste vybrali. Vyberte korespondující algoritmus. Defaultně jsou vybrány všechny kandidátske algoritmy. Podporované algoritmy:
Predikční typy:
Pro klasifikaci, podporované algoritmy jsou:
Decision Tree
Generalized Linear Model
Generalized Linear Model (Ridge Regression)
Neural Network
Random Forest
Support Vector Machine (Gaussian)
Support Vector Machine (Linear)
Pro regresi:
Všeobecný Linear Model
Všeobecný Linear Model (Ridge Regression)
Neural Network
Support Vector Machine (Gaussian)
Support Vector Machine (Linear)
Poznámka: Můžete sami vybrat algoritmus - anebo odstranit algoritmus z možností - když máte specifické preference anebo požadavky. Například když je zásadní transparence modelu, vyloučení modelů jako Neural Network dává smysl. Každý algoritmus má jinou náročnost na výpočetní výkon. Naïve Bayes a Decision Tree jsou obvykle rychlejší jako Support Vector Machine anebo Neural Network.
Rozšiřte konzoli pro Features aby jste videli statistiky vybrané tabulky. Podporované statistiky jsou Distinct Values - tj. výběr vždy jenom jedné z opakovaných hodnot, Minimum, Maximum, Mean a Standard Deviation. Datové typy jsou tables, views, analytic views. Cílový sloupec který jste vybrali v Predict je tady zvýrazněn. Po dokončení běhu Features grid zobrazí dodatečnou důležitost sloupce. Feature Importance indikuje celkovou úroveň senzitivity - citlivosti pro danou feature - črtu.