complete guide artificial neural network machine learning
Tento výukový program vysvětluje, co je umělá neurální síť, jak funguje ANN, struktura a typy architektury ANN a neuronových sítí:
V tomhle Školení strojového učení pro všechny , prozkoumali jsme vše kolem Druhy strojového učení v našem předchozím tutoriálu.
Zde v tomto kurzu probereme různé algoritmy v Neural Networks spolu s porovnáním mezi strojovým učením a ANN. Než se naučíme, jak ANN přispívá k strojovému učení, musíme vědět, co je to umělá neurální síť, a stručné znalosti o strojovém učení.
Prozkoumejme více o strojovém učení a umělé neurální síti !!
=> Přečtěte si celou sérii školení o strojovém učení
Co se naučíte:
- Co je to strojové učení?
- Co je to umělá neuronová síť?
- Struktura biologické neurální sítě
- Srovnání biologických neuronů a umělých neuronů
- Vlastnosti ANN
- Struktura ANN
- Aktivační funkce
- Co je umělý neuron?
- Jak funguje umělý neuron?
- Základní modely ANN
- Architektura neuronových sítí
- Příklad sítě umělých neuronů
- Srovnání mezi strojovým učením a ANN
- Neuronové sítě a hluboké učení
- Aplikace umělých neuronových sítí
- Omezení neuronových sítí
- Závěr
- Doporučené čtení
Co je to strojové učení?
Machine Learning je vědní obor, který umožňuje počítačům učit se a jednat bez výslovného programování. Je to podpole umělé inteligence.
Co je to umělá neuronová síť?
ANN je nelineární model, který je široce používán ve strojovém učení a má slibnou budoucnost v oblasti umělé inteligence.
Umělá neurální síť je analogická s biologickou neurální sítí. Biologická neurální síť je struktura miliard propojených neuronů v lidském mozku. Lidský mozek se skládá z neuronů, které odesílají informace do různých částí těla v reakci na provedenou akci.
Podobně jako tato je umělá neurální síť (ANN) výpočetní síť ve vědě, která se podobá charakteristikám lidského mozku. ANN lze modelovat jako původní neurony lidského mozku, proto se části zpracování ANN nazývají Umělé neurony.
ANN se skládá z velkého počtu vzájemně propojených neuronů, které jsou inspirovány fungováním mozku. Tyto neurony mají schopnost učit se, zobecňovat tréninková data a odvozovat výsledky z komplikovaných dat.
Tyto sítě se používají v oblastech klasifikace a predikce, identifikace vzorů a trendů, optimalizačních problémů atd. ANN se učí z tréninkových dat (známý vstupní a cílový výstup) bez jakéhokoli programování.
Naučená neuronová síť se nazývá expertní systém se schopností analyzovat informace a odpovídat na otázky konkrétního oboru.
Formální definice ANN daná Dr. Robertem Hecht-Nielsonem, vynálezcem jednoho z prvních neuro počítačů, je:
„… Výpočetní systém složený z řady jednoduchých, vysoce propojených prvků zpracování, které zpracovávají informace svou dynamickou stavovou reakcí na externí vstupy“.
Struktura biologické neurální sítě
Biologická neurální síť se skládá z:
- Soma: Toto se také nazývá tělo buňky. Je to místo, kde se nachází buněčné jádro.
- Dendrity: Jedná se o stromové sítě, které jsou připojeny k tělu buňky. Je vyroben z nervového vlákna.
- Axon: Axon nese signál z těla buňky. Rozděluje se na prameny a každý pramen končí žárovkovou strukturou zvanou synapse. Elektrické signály jsou předávány mezi synapse a dendrity.
(obraz zdroj )
Srovnání biologických neuronů a umělých neuronů
Biologický neuron | Umělý neuron |
---|---|
ML se používá v eCommerce, zdravotnictví, doporučení produktů atd. | ANN se používá v oblasti financí, strojového učení a umělé inteligence. |
Je vyroben z buněk. | Buňky odpovídají neuronům. |
Má dendrity, což jsou propojení mezi tělem buňky. | Váhy připojení odpovídají dendritům. |
Soma přijímá vstup. | Soma je podobná čisté vstupní hmotnosti. |
Axon přijímá signál. | Výstup ANN odpovídá axonu. |
Vlastnosti ANN
- Nelinearita: Mechanismus generování vstupního signálu, který je uveden v ANN, je nelineární.
- Kontrolované učení: Vstup a výstup jsou mapovány a ANN je trénován s datovou sadou školení.
- Neřízené učení: Cílový výstup není uveden, takže se ANN naučí sám objevením funkcí ve vstupních vzorcích.
- Adaptivní povaha: Váhy připojení v uzlech ANN jsou schopné se samy upravit, aby poskytly požadovaný výstup.
- Biologická neuronová analogie: ANN má strukturu a funkčnost inspirovanou lidským mozkem.
- Odolnost proti chybám: Tyto sítě jsou vysoce tolerantní, protože informace jsou distribuovány ve vrstvách a výpočet probíhá v reálném čase.
Struktura ANN
Umělé neuronové sítě jsou prvky zpracování buď ve formě algoritmů nebo hardwarových zařízení modelovaných podle neuronální struktury mozkové kůry lidského mozku.
Tyto sítě se také jednoduše nazývají Neuronové sítě. NN je tvořen mnoha vrstvami. Několik vrstev, které jsou vzájemně propojeny, se často nazývá „Vícevrstvý perceptron“. Neurony v jedné vrstvě se nazývají „uzly“. Tyto uzly mají „aktivační funkci“.
ANN má 3 hlavní vrstvy:
- Vstupní vrstva: Vstupní vzory jsou přiváděny do vstupních vrstev. Existuje jedna vstupní vrstva.
- Skryté vrstvy: Může existovat jedna nebo více skrytých vrstev. Zpracování, které probíhá ve vnitřních vrstvách, se nazývá „skryté vrstvy“. Skryté vrstvy vypočítají výstup na základě „vah“, což je „součet vážených synapse připojení“. Skryté vrstvy zpřesňují vstup odstraněním nadbytečných informací a odesílají informace do další skryté vrstvy k dalšímu zpracování.
- Výstupní vrstva: Tato skrytá vrstva se připojuje k „výstupní vrstvě“, kde je zobrazen výstup.
Aktivační funkce
Aktivační funkce je vnitřní stav neuronu. Je to funkce vstupu, kterou neuron přijímá. Aktivační funkce se používá k převodu vstupního signálu na uzlu ANN na výstupní signál.
Co je umělý neuron?
Umělá neurální síť se skládá z vysoce propojených prvků zpracování, které se nazývají uzly nebo neurony.
Tyto neurony pracují paralelně a jsou organizovány v architektuře. Uzly jsou navzájem propojeny spojovacími spoji. Každý neuron nese váhu, která obsahuje informace o vstupním signálu.
Jak funguje umělý neuron?
Umělý neuron přijímá vstup. Tyto vstupy mají váhu zvanou „synapse“. Tyto neurony (nazývané také uzly) mají „aktivační funkci“. Tato aktivační funkce pracuje na vstupu a zpracovává jej, aby poskytl výstup.
Vážený součet vstupů se stává vstupním signálem do aktivační funkce, aby poskytl jeden výstup. Tyto vstupní váhy jsou nastavitelné, takže neurální síť může upravit své parametry tak, aby poskytovaly požadovaný výstup.
Několik běžných aktivačních funkcí, které se používají v umělé neuronové síti, je:
# 1) Funkce identity
Může být definován jako f (x) = x pro všechny hodnoty x. Toto je lineární funkce, kde je výstup stejný jako vstup.
# 2) Funkce binárního kroku
Tato funkce se používá v sítích s jednou vrstvou pro převod síťového vstupu na výstup. Výstup je binární, tj. 0 nebo 1. T představuje prahovou hodnotu.
(obraz zdroj )
# 3) Bipolární kroková funkce
Funkce bipolárního kroku má bipolární výstupy (+1 nebo -1) pro čistý vstup. T představuje prahovou hodnotu.
# 4) Sigmoidální funkce
Používá se v sítích backpropagation.
Je dvou typů:
- Funkce binárního sigmoidu: Nazývá se také jako unipolární sigmoidní funkce nebo logistická sigmoidní funkce. Rozsah sigmoidální funkce je 0 až 1.
- Bipolární sigmoid: Bipolární sigmoidální funkce se pohybuje od -1 do +1. Je to podobné jako u hyperbolické tangensové funkce.
(obraz zdroj )
# 5) RampFunction
The vážený součet vstupů znamená „součin hmotnosti vstupu a hodnoty vstupu“ sečtený společně pro všechny vstupy.
Nechť I = {I1, I2, I3… In} je vstupní vzor pro neuron.
Nechť W = {W1, W2, W3… Wn} je váha spojená s každým vstupem do uzlu.
jaký je nejlepší software pro převod textu na řeč
Vážený součet vstupů = Y = (? Wi * Ii) pro i = 1 až n
Základní modely ANN
Modely umělé neuronové sítě se skládají ze 3 entit:
- Váhy nebo synaptická spojení
- Pravidlo učení použité k úpravě vah
- Aktivační funkce neuronu
Architektura neuronových sítí
V ANN jsou neurony propojeny a výstup každého neuronu je spojen s dalším neuronem pomocí vah. Architektura těchto propojení je důležitá v ANN. Toto uspořádání je ve formě vrstev a spojení mezi vrstvami a uvnitř vrstvy je architektura neuronové sítě.
Nejběžněji známé síťové architektury jsou:
- Jednovrstvá síť Feed-Forward
- Vícevrstvá síť pro předávání dopředu
- Jeden uzel s vlastní zpětnou vazbou
- Jednovrstvá rekurentní síť
- Vícevrstvá opakující se síť
Podívejme se na každou z nich podrobně.
datastage rozhovor otázky a odpovědi pdf
# 1) Jednovrstvá síť vpřed
Vrstva je síť tvořená neurony. Tyto neurony jsou spojeny s ostatními neurony další vrstvy. Pro jednu vrstvu existují pouze vstupní a výstupní vrstvy. Vstupní vrstva je připojena k uzlům výstupní vrstvy s váhami.
Všechny vstupní uzly jsou připojeny ke každému z výstupních uzlů. Termín zpětná vazba označuje, že z výstupní vrstvy do vstupní vrstvy není odeslána žádná zpětná vazba. Tím se vytvoří jednovrstvá síť předávání dopředu.
(obraz zdroj )
# 2) Vícevrstvá síť pro předávání
Vícevrstvá síť se skládá z jedné nebo více vrstev mezi vstupem a výstupem. Vstupní vrstva pouze přijímá signál a ukládá jej do vyrovnávací paměti, zatímco výstupní vrstva zobrazuje výstup. Vrstvy mezi vstupem a výstupem se nazývají skryté vrstvy.
Skryté vrstvy nejsou v kontaktu s vnějším prostředím. S větším počtem skrytých vrstev je výstupní odezva efektivnější. Uzly v předchozí vrstvě jsou připojeny ke každému uzlu v další vrstvě.
Vzhledem k tomu, že k vstupní nebo skryté vrstvě není připojena žádná výstupní vrstva, vytváří vícevrstvou síť předávání dopředu.
# 3) Jeden uzel s vlastní zpětnou vazbou
Sítě, kde se výstup výstupní vrstvy odesílá zpět jako vstup do vstupní vrstvy nebo jiných skrytých vrstev, se nazývají Feedback Networks. V jednouzlových zpětnovazebních systémech existuje jedna vstupní vrstva, kde je výstup přesměrován zpět jako zpětná vazba.
# 4) Jednovrstvá opakující se síť
V jedné vrstvě rekurentní sítě tvoří zpětnovazební síť uzavřenou smyčku. V tomto modelu přijímá jeden neuron zpětnou vazbu pro sebe nebo pro ostatní neurony v síti nebo pro oba.
# 5) Vícevrstvá opakovaná síť
Ve vícevrstvé opakující se síti existuje několik skrytých vrstev a výstup je přesměrován zpět do neuronů předchozích vrstev a dalších neuronů ve stejných vrstvách nebo ve stejném neuronu samotném.
Příklad sítě umělých neuronů
Vezměme si níže uvedenou síť s daným vstupem a vypočítáme čistý neuron vstupu a získáme výstup neuronu Y s aktivační funkcí jako binární sigmoidální.
Vstup má 3 neurony X1, X2 a X3 a jeden výstup Y.
Váhy spojené se vstupy jsou: {0,2, 0,1, -0,3}
Vstupy = {0,3; 0,5; 0,6}
Čistý vstup = {x1 * w1 + x2 * w2 + x3 * w3}
Čistý vstup = (0,3 * 0,2) + (0,5 * 0,1) + (0,6 * -0,3)
Čistý vstup = -0,07
Výstup pro binární sigmoidální:
X je -0,07
Výstup vyjde na 0,517
Srovnání mezi strojovým učením a ANN
Strojové učení | Umělá neuronová síť |
---|---|
Machine Learning se učí ze vstupních dat a objevuje zajímavé vzory výstupních dat. | ANN se používají v algoritmech strojového učení k trénování systému pomocí synapsí, uzlů a spojovacích odkazů. |
ML je podmnožinou oboru umělé inteligence. | ANN je také součástí oblasti vědy umělé inteligence a podmnožinou strojového učení. |
Algoritmy ML se učí z dat přiváděných do algoritmu pro účely rozhodování. Některé z těchto algoritmů jsou klasifikace. Klastrování, asociační dolování dat. | ANN je věda o hlubokém učení, která analyzuje data pomocí logických struktur jako lidé. Některá z učebních schémat ANN jsou hebbština, perceptron, zpětná propagace atd. |
Algoritmy ML mají schopnost samoučení, ale pokud by byl výsledek nepřesný, vyžadoval by lidský zásah. | Algoritmy ANN mají schopnost přizpůsobit se pomocí váh připojení, pokud se ukáže, že výsledek je špatný. |
Algoritmy ML vyžadují programátorské dovednosti, datovou strukturu a znalost databáze velkých dat. | ANN rovněž vyžaduje silné dovednosti v matematice, pravděpodobnosti, datových strukturách atd. |
Programy ML mohou předvídat výsledek pro naučenou sadu dat a přizpůsobit se novým datům. | ANN se může učit a inteligentně se rozhodovat o nových datech, ale je to hlubší než strojové učení. |
Učení pod dohledem a bez dohledu spadají pod strojové učení. | Učení jako Kohenen, radiální zkreslení, dopředná neuronová síť spadají pod ANN. |
Některé příklady ML jsou výsledky vyhledávání Google atd. | Některé příklady ANN jsou rozpoznávání obličeje, rozpoznávání obrázků atd. |
Neuronové sítě a hluboké učení
Sítě Deep Learning obsahují několik skrytých vrstev mezi vstupem a výstupem. Tyto sítě se vyznačují hloubkou skrytých vrstev v nich. Před zobrazením výstupu prochází vstupní data několika kroky.
Tyto sítě se liší od dřívějších NN, jako je perceptron, který měl jednu skrytou vrstvu a nazýval se mělkými sítěmi. Každá skrytá vrstva v síti hlubokého učení trénuje data pomocí určitých funkcí na základě výstupu předchozí vrstvy.
Data procházejí mnoha vrstvami nelineární funkce v uzlu. Čím větší je počet vrstev, tím komplexnější prvky lze rozpoznat, protože další vrstva provede agregaci prvků z předchozích vrstev.
Více skrytých vrstev v síti zvyšuje složitost a abstrakci. Tato hloubka se také nazývá hierarchie funkcí. Díky tomu jsou sítě hlubokého učení schopné zpracovat vysoce dimenzionální data.
Některé příklady sítí hlubokého učení zahrnují shlukování milionů obrázků na základě jeho charakteristik a podobností, filtrování e-mailových zpráv, použití filtrů na zprávy v CRM, identifikace řeči atd.
Sítě hlubokého učení lze trénovat jak na označených, tak na neoznačených souborech dat. U neoznačeného souboru dat sítě, jako jsou Boltzmannovy selekční stroje, provádějí automatické získávání funkcí.
Síť se učí automaticky analýzou vstupu prostřednictvím vzorkování a minimalizací rozdílu ve výstupu a distribuci vstupu. Neuronová síť zde nachází korelace mezi rysy a výsledky.
Sítě hlubokého učení trénované na označených datech lze použít na nestrukturovaná data. Čím více tréninkových dat se do sítě přivede, tím přesnější budou.
Schopnost sítě učit se z neoznačených dat je výhodou oproti ostatním algoritmům učení.
Aplikace umělých neuronových sítí
Neuronové sítě byly úspěšně použity v různých řešeních, jak je uvedeno níže.
# 1) Rozpoznání vzoru: ANN se používá při rozpoznávání vzorů, rozpoznávání obrázků, vizualizaci obrázků, psaní rukou, řeči a dalších podobných úlohách.
# 2) Problémy s optimalizací: Problémy, jako je nalezení nejkratší trasy, plánování a výroba, kde je třeba uspokojit omezení problému a je třeba dosáhnout optimálních řešení, jsou používání NN.
# 3) Předpověď: NN může předvídat výsledek situace analyzováním minulých trendů. Aplikace jako bankovnictví, akciový trh, předpovědi počasí používají Neural Networks.
# 4) Řídicí systémy: Řídicí systémy, jako jsou počítačové produkty, chemické produkty a robotika, používají neuronové sítě.
Omezení neuronových sítí
Níže jsou uvedeny některé nevýhody neuronových sítí.
- Tyto sítě jsou pro uživatele černé skříňky, protože uživatel nemá žádné role kromě krmení vstupu a sledování výstupu. Uživatel neví o tréninku probíhajícím v algoritmu.
- Tyto algoritmy jsou poměrně pomalé a vyžadují přesné iterace (také nazývané epochy). Důvodem je, že CPU počítá váhy, aktivační funkce každého uzlu samostatně, čímž zajišťuje, že spotřebovává čas i prostředky. Také to způsobuje problém s velkým množstvím dat.
Závěr
V tomto tutoriálu jsme se dozvěděli o umělé neuronové síti, její analogii s biologickým neuronem a typy neuronové sítě.
ANN spadá pod strojové učení. Jedná se o výpočetní model složený z více neuronových uzlů. Tyto uzly přijímají vstup, zpracovávají vstup pomocí aktivační funkce a předávají výstup do dalších vrstev.
Vstupy jsou spojeny s váhami spojovacích spojení, které se nazývají synapse. Základní ANN se skládá ze vstupní vrstvy, vah, aktivační funkce, skryté vrstvy a výstupní vrstvy.
Aktivační funkce se používají k převodu vstupu na výstup. Některé z nich jsou binární, bipolární, sigmoidální a rampové. Na základě počtu skrytých vrstev a mechanismů zpětné vazby existují různé typy ANN, jako je jednovrstvý předávací kanál, vícevrstvý předávací kanál, opakované sítě atd.
ANN s mnoha skrytými vrstvami mezi vstupem a výstupem tvoří síť pro hluboké učení. Sítě hlubokého učení mají vysokou složitost a úroveň abstrakce, díky nimž jsou schopné počítat vysoce dimenzionální data s tisíci parametrů.
ANN se používá v oblasti předpovídání, zpracování obrazu, řídicích systémů atd. Tyto byly úspěšně použity jako řešení řady problémů ve vědě.
Doufáme, že tento tutoriál vysvětlil vše, co potřebujete vědět o umělých neuronových sítích !!
=> Navštivte zde exkluzivní sérii strojového učení
Doporučené čtení
- Data Mining vs. Machine Learning vs. Artificial Intelligence vs. Deep Learning
- Testování zabezpečení sítě a nejlepší nástroje pro zabezpečení sítě
- Druhy strojového učení: Supervised Vs Unsupervised Learning
- 11 nejpopulárnějších softwarových nástrojů pro strojové učení v roce 2021
- Výukový program pro strojové učení: Úvod do ML a jeho aplikací
- Průvodce po masce podsítě (podsítě) a kalkulačce podsítě IP
- Průvodce hodnocením a správou zranitelnosti sítě
- 15 nejlepších nástrojů pro síťové skenování (síťový a IP skener) z roku 2021