types machine learning
Tento výukový program vysvětluje typy strojového učení, tj. Supervidované, nekontrolované, vyztužené a částečně supervizované učení, s jednoduchými příklady. Dozvíte se také rozdíly mezi supervizovaným a nekontrolovaným učením:
V Předchozí výukový program , jsme se dozvěděli o strojovém učení, jeho fungování a aplikacích. Také jsme viděli srovnání Machine Learning Vs Artificial Intelligence.
Machine Learning je vědní obor, který se zabývá výukou počítačových programů pomocí zkušeností a předpovídáním výstupů.
Hlavním rysem ML je učení se ze zkušeností. K učení dochází, když systém napájený tréninkovými vstupními daty provede změny ve svých parametrech a upraví se tak, aby poskytoval požadovaný výstup. Výstupem je cílová hodnota definovaná v tréninkových datech.
=> Přečtěte si celou sérii školení o strojovém učení
Co se naučíte:
jak používat torrentový soubor
- Druhy strojového učení
- Reálný příklad učení pod dohledem a bez dohledu
- Rozdíl mezi supervizovaným a nekontrolovaným učením
- Částečně kontrolované učení
- Závěr
Druhy strojového učení
Programy strojového učení jsou rozděleny do 3 typů, jak je znázorněno níže.
- Pod dohledem
- Bez dozoru
- Posílení učení
Rozumíme každému z nich podrobně !!
# 1) Kontrolované učení
Kontrolované učení probíhá za přítomnosti školitele, stejně jako učení prováděné malým dítětem s pomocí jeho učitele. Když je dítě vyškoleno v rozeznávání ovoce, barev, čísel pod dohledem učitele, je tato metoda pod dohledem učení.
V této metodě každý krok dítěte kontroluje učitel a dítě se učí z výstupu, který má vyprodukovat.
Jak supervidované učení funguje?
V supervizovaném ML algoritmu je výstup již známý. K dispozici je mapování vstupu s výstupem. Proto pro vytvoření modelu je stroj napájen spoustou tréninkových vstupních dat (se známým vstupem a odpovídajícím výstupem).
Tréninková data pomáhají dosáhnout úrovně přesnosti vytvořeného datového modelu. Postavený model je nyní připraven k podávání nových vstupních dat a předpovídání výsledků.
Co je označená datová sada?
Datová sada s výstupy známými pro daný vstup se nazývá označená datová sada. Například, je znám obrázek ovoce spolu s názvem ovoce. Když se tedy zobrazí nový obrázek ovoce, porovná se s tréninkovou sadou pro předpověď odpovědi.
Kontrolované učení je mechanismus rychlého učení s vysokou přesností. K supervizovaným problémům s učením patří regresní a klasifikační problémy.
Některé z kontrolovaných algoritmů učení jsou:
- Rozhodovací stromy,
- K-nejbližší soused,
- Lineární regrese,
- Podpora Vector Machine a
- Neuronové sítě.
Příklad supervidovaného učení
- V prvním kroku se tréninková datová sada přivádí do algoritmu strojového učení.
- S tréninkovou datovou sadou se stroj sám upraví provedením změn v parametrech k vytvoření logického modelu.
- Vytvořený model se poté použije pro novou sadu dat k předpovědi výsledku.
Druhy supervidovaných učebních algoritmů
- Klasifikace: U těchto typů problémů předpovídáme reakci jako konkrétní třídy, například „ano“ nebo „ne“. Pokud jsou přítomny pouze 2 třídy, nazývá se to Binární klasifikace. Pro více než 2 hodnoty tříd se nazývá klasifikace více tříd. Predikované hodnoty odezvy jsou diskrétní hodnoty. Například, Je to obraz slunce nebo měsíce? Algoritmus klasifikace odděluje data do tříd.
- Regrese: Problémy s regresí předpovídají odezvu jako spojité hodnoty, jako je predikce hodnoty, která se pohybuje od-nekonečno do nekonečna. Může to mít mnoho hodnot. Například, algoritmus lineární regrese, který je použit, předpovídá náklady na dům na základě mnoha parametrů, jako je poloha, blízké letiště, velikost domu atd.
# 2) Neomezené učení
K učení bez dozoru dochází bez pomoci nadřízeného, stejně jako se ryba učí plavat sama. Jedná se o nezávislý proces učení.
V tomto modelu, protože neexistuje žádný výstup mapovaný se vstupem, jsou cílové hodnoty neznámé / neoznačené. Systém se musí sám naučit ze vstupu dat do něj a detekovat skryté vzory.
Co je datová sada bez štítku?
Datová sada s neznámými výstupními hodnotami pro všechny vstupní hodnoty se nazývá neoznačená datová sada.
Jak funguje bezobslužné učení?
Protože neexistují žádné známé výstupní hodnoty, které lze použít k vytvoření logického modelu mezi vstupem a výstupem, používají se některé techniky k těžbě datových pravidel, vzorů a skupin dat s podobnými typy. Tyto skupiny pomáhají koncovým uživatelům lépe porozumět datům a najít smysluplný výstup.
Napájené vstupy nemají podobu správné struktury, jako jsou tréninková data (v supervizovaném učení). Může obsahovat odlehlé hodnoty, hlučná data atd. Tyto vstupy jsou společně přiváděny do systému. Při trénování modelu jsou vstupy organizovány do klastrů.
Algoritmy učení bez dozoru zahrnují klastrové a asociační algoritmy, jako například:
- A priori,
- K znamená shlukování a další algoritmy těžby asociačních pravidel.
Když jsou do modelu vložena nová data, bude předpovídat výsledek jako označení třídy, ke kterému vstup patří. Pokud štítek třídy není k dispozici, vygeneruje se nová třída.
Zatímco prochází procesem objevování vzorů v datech, model sám upravuje své parametry, proto se také nazývá samoorganizující se. Klastry budou vytvořeny zjišťováním podobností mezi vstupy.
Například, při nákupu produktů online, pokud je do košíku vloženo máslo, pak je doporučeno koupit chléb, sýr atd. Model bez kontroly zkoumá datové body a předpovídá další atributy, které jsou s produktem spojeny.
Příklad nekontrolovaného učení
Typy nekontrolovaných algoritmů
- Shlukovací algoritmus : Metody hledání podobností mezi datovými položkami, jako je stejný tvar, velikost, barva, cena atd., A jejich seskupení do podoby klastru, je klastrová analýza.
- Detekce odlehlých hodnot : V této metodě je datová sada hledání jakéhokoli druhu odlišností a anomálií v datech. Například, systém detekuje transakci vysoké hodnoty na kreditní kartě za účelem detekce podvodu.
- Těžba pravidel sdružení : U tohoto typu těžby zjistí nejčastěji se vyskytující položky nebo asociace mezi prvky. Sdružení jako „produkty často nakupované společně“ atd.
- Autoencoders: Vstup je komprimován do kódované formy a je znovu vytvořen, aby se odstranila hlučná data. Tato technika se používá ke zlepšení kvality obrazu a videa.
# 3) Posílení učení
V tomto typu učení se algoritmus učí mechanismem zpětné vazby a minulými zkušenostmi. Vždy je žádoucí, aby každý krok v algoritmu byl učiněn k dosažení cíle.
Takže kdykoli je třeba učinit další krok, obdrží zpětnou vazbu z předchozího kroku spolu s poučením ze zkušenosti, aby předpověděl, co by mohlo být dalším nejlepším krokem. Tento proces se také nazývá proces pokusů a omylů k dosažení cíle.
Posílení učení je dlouhodobý iterativní proces. Čím větší je počet zpětných vazeb, tím přesnější je systém. Základní posilovací učení se také nazývá Markovův rozhodovací proces.
Příklad učení o posílení
Příkladem Reinforcement Learning jsou videohry, kde hráči dokončují určité úrovně hry a získávají body odměny. Hra poskytuje hráči zpětnou vazbu prostřednictvím bonusových tahů, které zlepšují jeho výkon.
Reinforcement Learning se používá u tréninkových robotů, aut s vlastním pohonem, automatické správy zásob atd.
Některé populární algoritmy učení výztuže zahrnují:
- Q-učení,
- Deep Adversarial Networks
- Časový rozdíl
Na následujícím obrázku je popsán mechanismus zpětné vazby učení o posílení.
otázky a odpovědi na rozhovor pro zkušené
- Vstup sleduje agent, kterým je prvek AI.
- Tento agent AI působí na životní prostředí podle rozhodnutí.
- Odpověď prostředí je zaslána do AI ve formě odměny zpět jako zpětná vazba.
- Stav a akce provedené v prostředí se také uloží.
[obraz zdroj ]
Reálný příklad učení pod dohledem a bez dohledu
Pro kontrolované učení:
# 1) Vezměme si příklad koše zeleniny s cibulí, mrkví, ředkvičkami, rajčaty atd. A můžeme je uspořádat do skupin.
#dva) Vytváříme tabulku tréninkových dat, abychom porozuměli supervizovanému učení.
Tabulka tréninkových dat charakterizuje zeleninu na základě:
- Tvar
- Barva
- Velikost
Tvar | Barva | Velikost | Zeleninový |
---|---|---|---|
Je to přesnější než učení bez dozoru, protože vstupní data a odpovídající výstup jsou dobře známy a stroj potřebuje pouze předpovědi. | Má menší přesnost, protože vstupní data jsou neoznačená. Stroj tedy musí nejprve porozumět a označit data a poté předpovědět. | ||
Kolo | Hnědý | Velký | Cibule |
Kolo | Síť | Střední | Rajče |
Válcový | Bílý | Velký | Ředkev |
Válcový | Síť | Střední | Mrkev |
Když se tato tabulka s tréninkovými daty přenese do stroje, sestaví logický model pomocí tvaru, barvy, velikosti zeleniny atd., Aby předpověděl výsledek (zelenina).
Jakmile je do tohoto modelu vložen nový vstup, bude algoritmus analyzovat parametry a vydávat název ovoce.
Pro učení bez dozoru:
V učení bez dohledu vytváří skupiny nebo klastry na základě atributů. Ve výše uvedeném ukázkovém datovém souboru jsou parametry zeleniny:
# 1) Tvar
Zelenina je seskupena podle tvaru.
jak napsat příklad testovacího případu
- Kolo: Cibule a rajče.
- Válcový: Ředkvičky a mrkev.
Vezměte další parametr, například velikost.
# 2) Velikost
Zelenina je seskupena podle velikosti a tvaru:
- Střední velikost a kulatý tvar: Rajče
- Velká velikost a kulatý tvar: Cibule
V učení bez dozoru nemáme žádnou tréninkovou datovou sadu a proměnnou výsledku, zatímco v supervizovaném učení jsou tréninková data známá a používají se k trénování algoritmu.
Rozdíl mezi supervizovaným a nekontrolovaným učením
Pod dohledem | Bez dozoru |
---|---|
V algoritmech učení pod dohledem je znám výstup pro daný vstup. | V algoritmech učení bez kontroly je výstup pro daný vstup neznámý. |
Algoritmy se učí z označeného souboru dat. Tato data pomáhají při hodnocení přesnosti tréninkových dat. | Algoritmus je poskytován s neoznačenými daty, kde se pokouší najít vzory a asociace mezi datovými položkami. |
Jedná se o techniku prediktivního modelování, která přesně předpovídá budoucí výsledky. | Jedná se o techniku deskriptivního modelování, která vysvětluje skutečný vztah mezi prvky a historií prvků. |
Zahrnuje klasifikační a regresní algoritmy. | Zahrnuje algoritmy učení shlukování a asociačních pravidel. |
Některé algoritmy učení pod dohledem jsou Linear Regression, Naïve Bayes a Neural Networks. | Některé algoritmy pro učení bez dozoru jsou k- means clustering, Apriori atd. |
Tento typ učení je poměrně složitý, protože vyžaduje údaje označené štítkem. | Je to méně složité, protože není třeba data chápat a označovat. |
Jedná se o online proces analýzy dat a nevyžaduje lidskou interakci. | Toto je analýza dat v reálném čase. |
Částečně kontrolované učení
Přístup učení s částečným dohledem bere vstup označených i neoznačených údajů o tréninku. Tento typ učení je užitečný, když je obtížné extrahovat užitečné funkce z neoznačených dat (přístup pod dohledem) a odborníci na data považují za obtížné označit vstupní data (přístup bez dohledu).
Pouze malé množství označených dat v těchto algoritmech může vést k přesnosti modelu.
Příklady učení s částečným dohledem zahrnují CT a MRI, kde může lékařský odborník označit několik bodů ve skenech u jakékoli nemoci, zatímco je obtížné označit všechny snímky.
Závěr
Úkoly strojového učení jsou obecně rozděleny na úkoly s dohledem, bez dozoru, s částečným dohledem a výzbroj.
Kontrolované učení je učení pomocí označených dat. Algoritmy ML jsou napájeny tréninkovou datovou sadou, ve které je pro všechna vstupní data známý výstup, aby bylo možné předpovědět budoucí výsledky.
Tento model je vysoce přesný a rychlý, ale jeho sestavení vyžaduje vysokou odbornost a čas. Tyto modely také vyžadují opětovné sestavení, pokud se data změní. Úkoly ML, jako je regrese a klasifikace, se provádějí v kontrolovaném výukovém prostředí.
Učení bez dozoru probíhá bez pomoci školitele. Vstupní data přiváděná do ML algoritmů jsou neoznačená, tj. Pro každý vstup není znám žádný výstup. Algoritmus sám zjistí trendy a vzorce ve vstupních datech a vytvoří asociaci mezi různými atributy vstupu.
Tento typ učení je užitečný pro hledání vzorů v datech, vytváření shluků dat a analýzu v reálném čase. Úkoly, jako je shlukování, algoritmy KNN atd., Podléhají nekontrolovanému učení.
Výukové úkoly s částečným dohledem jsou výhodou algoritmů pod dohledem i bez dohledu tím, že předpovídají výsledky pomocí označených i neznačených dat. Posílení učení je typ mechanismu zpětné vazby, kdy se stroj učí z neustálé zpětné vazby od prostředí k dosažení svého cíle.
V tomto typu učení agenti AI provádějí některé akce s daty a prostředí poskytuje odměnu. Posílení učení využívají hry pro více hráčů pro děti, auta s vlastním řízením atd.
Zůstaňte naladěni na náš nadcházející výukový program a dozvíte se více o strojovém učení a umělé neuronové síti!
=> Navštivte zde exkluzivní sérii strojového učení
Doporučené čtení
- Data Mining vs. Machine Learning vs. Artificial Intelligence vs. Deep Learning
- 11 nejpopulárnějších softwarových nástrojů pro strojové učení v roce 2021
- Výukový program pro strojové učení: Úvod do ML a jeho aplikací
- Datové typy Pythonu
- Datové typy C ++
- Druhy rizik v softwarových projektech
- Typy testování migrace: S testovacími scénáři pro každý typ
- 15 nejlepších systémů pro správu učení (LMS roku 2021)