Neurális hálózatok alapjai: Kézzel írott számok felismerése egyszerűen

Bevezetés a neurális hálózatokba

A videó egy egyszerű példán keresztül mutatja be, hogyan képes az emberi agy és a mesterséges neurális hálózat felismerni kézzel írott számokat 28×28 pixeles képekből. Bár az agy könnyedén azonosítja a számjegyeket, egy program megírása, amely ugyanezt teszi, bonyolult feladat.

A neurális hálózat alapjai

Neuronok: Egyszerű egységek, amelyek 0 és 1 közötti számokat (aktivitásokat) tartalmaznak.
Bemeneti réteg: 784 neuron, mindegyik egy pixel szürkeárnyalatát reprezentálja.
Kimeneti réteg: 10 neuron, mindegyik egy számjegyet jelöl, aktivitásuk alapján történik a felismerés.
Rejtett rétegek: Két réteg, egyenként 16 neuronnal, amelyek a bemeneti és kimeneti réteg között helyezkednek el.

Hogyan működik a rétegek közötti kapcsolat?

Minden neuron a következő réteg neuronjainak aktivitását befolyásolja súlyok és torzítások segítségével.
A súlyok meghatározzák, hogy mely pixelminták aktiválják a neuront (pl. élek, hurkok).
A torzítás egy küszöbérték, amely alatt a neuron nem aktiválódik.
Az aktivitásokat egy szigmoid (logisztikus) függvény alakítja 0 és 1 közé.

A súlyok és torzítások szerepe

A hálózatban összesen kb. 13 000 súly és torzítás van, amelyek finomhangolják a működést.
Ezek beállítása a tanulási folyamat lényege, amely során a hálózat megtanulja felismerni a számjegyeket.

Aktivációs függvények: szigmoid és ReLU

A szigmoid függvény korábban általánosan használt, de nehéz vele tanítani mély hálózatokat.
A ReLU (korrigált lineáris egység) egyszerűbb és hatékonyabb, ezért a modern hálózatokban elterjedt.

A neurális hálózat mint függvény

A hálózat egy bonyolult, paraméterezett függvény, amely 784 bemeneti értéket (pixelek) alakít át 10 kimeneti értékké (számjegyek valószínűsége).
A működés alapja a mátrixszorzás és az aktivációs függvények alkalmazása.

Összegzés

Ez a videó alapvető betekintést nyújt a neurális hálózatok működésébe, különösen a képfelismerés területén. Megérthetjük, hogyan kapcsolódnak össze a neuronok, hogyan hatnak egymásra a rétegek, és milyen matematikai eszközökkel dolgozik a hálózat. A következő részben a tanulási folyamatról lesz szó, amely megmutatja, hogyan állítja be a hálózat a súlyokat és torzításokat a felismeréshez.