Elektronické počítače, systémy a sítě. Katedra výpočetních strojů, systémů a sítí

Toto nastavení vám umožní filtrovat veškerý obsah webu podle univerzity: vzdělávací programy, speciality, profese, články. Zrušením tohoto nastavení se můžete vrátit k úplnému obsahu webu.

Toto nastavení umožní filtrování veškerého obsahu stránek podle univerzity.

Vyšší ekonomická škola
Vyšší ekonomická škola National Research University
IGSU
Ústav veřejné služby a managementu
SHFM
Vyšší škola financí a managementu
RPGUP
Ruská státní univerzita spravedlnosti
IBDA
Institute of Business and Business Administration
VSHKU
Postgraduální škola správy a řízení společností
RGUTIS
Ruská státní univerzita cestovního ruchu a služeb
Moskva Poly
Moskevská polytechnická univerzita
RSSU
Ruská státní sociální univerzita
MGRI-RGGRU je. Sergo Ordzhonikidze
Ruská státní geologická průzkumná univerzita pojmenovaná po Sergovi Ordzhonikidzeovi
IFLA
Moskevská univerzita financí a práva
Moskevský institut psychoanalýzy
Moskevský institut psychoanalýzy
IGUMO a IT
Ústav humanitního vzdělávání a informační technologie
MIPT
Moskevský institut fyziky a technologie (Státní univerzita)
OCEŇTE je. G.V. Plechanov
Ruská ekonomická univerzita pojmenovaná podle G.V. Plechanov
MGIMO
Moskevský státní institut mezinárodních vztahů (univerzita) MZV Ruska
Diplomatická akademie ruského ministerstva zahraničí
Diplomatická akademie Ministerstva zahraničních věcí Ruská Federace
NRNU MEPhI
Národní výzkumná jaderná univerzita „MEPhI“
RANEPA
Ruská akademie národního hospodářství a veřejné správy za prezidenta Ruské federace
VAVT Ministerstvo hospodářského rozvoje Ruska
Všeruská akademie zahraničního obchodu Ministerstva hospodářského rozvoje Ruska
Moskevská státní univerzita pojmenovaná po M.V. Lomonosov
Moskevská státní univerzita pojmenovaná po M.V. Lomonosov
Stát IRYA je. TAK JAKO. Puškin
Státní institut ruského jazyka. TAK JAKO. Puškin
MGMSU je. A.I. Evdokimova, ministerstvo zdravotnictví Ruska
Moskevská státní univerzita medicíny a zubního lékařství pojmenovaná po A.I. Evdokimova
RNIMU
Ruská národní výzkumná lékařská univerzita pojmenovaná po N.I. Pirogov
MSLU
Moskevská státní lingvistická univerzita
Finanční univerzita
Finanční univerzita pod vládou Ruské federace
RGAIS
Ruská státní akademie duševního vlastnictví
Literární institut pojmenovaný po A.M. Gorky
Literární institut pojmenovaný po A.M. Gorky
PMGMU je. IM Sečenov
První Moskevská státní lékařská univerzita. JIM. Sečenov
Ruská celní akademie
Ruská celní akademie
Ruská státní univerzita ropy a zemního plynu I.M. Gubkina
Ruská státní univerzita ropy a zemního plynu pojmenovaná po I.M. Gubkin
VSUYU (RPA Ministerstva spravedlnosti Ruska)
Všeruská státní univerzita spravedlnosti (RPA Ministerstva spravedlnosti Ruska)
MSTU je. N.E. Bauman
Moskevská státní technická univerzita pojmenovaná po N.E. Bauman
RSUH
Ruská státní univerzita pro humanitní obory
MISIS
Národní výzkumná technologická univerzita „MISiS“
GAUGN
Státní akademická univerzita humanitních věd při Ruské akademii věd
RAM je. Gnesins
Gnessin Ruská akademie hudby
MGAVMiB je. K. I. Skryabin
Moskevská státní akademie veterinárního lékařství a biotechnologie pojmenovaná po K.I. Skriabin
RUDN
Ruská univerzita přátelství národů
IPCC
Moskevský státní institut kultury
RKhTU je. DI. Mendělejev
Ruská univerzita chemické technologie pojmenovaná po D.I. Mendělejev
GUU
Státní univerzita managementu
AGP RF
Akademie generálního prokurátora Ruské federace
Moskevská konzervatoř P.I. Čajkovskij
Moskevská státní konzervatoř pojmenovaná po P.I. Čajkovskij
MGPU
Moskevská pedagogická univerzita
MIET
Národní výzkumná univerzita "MIET"
MGUTU je. KG. Razumovský
Moskevská státní univerzita technologie a managementu. KG. Razumovský

Základní pojmy Systém zpracování dat (informační systém) - soubor technických a softwarové nástrojeurčeno pro informační servis osob a technických předmětů. Třídy informačních systémů: výpočetní stroje (VM) výpočetní systémy (VS) výpočetní komplexy (VK) Sítě VM jsou navrženy tak, aby řešily širokou škálu problémů uživatelů pracujících v různých oborech. Hlavní jednotkou virtuálního počítače je procesor. Procesor inicializuje a řídí proces provádění programu. VK je několik virtuálních počítačů, které se navzájem informačně vztahují. Kromě toho každý virtuální počítač nezávisle ovládá své vlastní výpočetní procesy. Výměna informací mezi složitými virtuálními počítači je méně intenzivní (ve srovnání s interakcí informací mezi procesory v systémech s více procesory). VC jsou široce používány v systémech řízení informací.

Základními koncepty letadla jsou informační systém konfigurovaný k řešení problémů v konkrétní oblasti použití, tj. má hardwarovou a softwarovou specializaci. BC často obsahuje několik procesorů, mezi nimiž dochází k intenzivní výměně informací v procesu provozu a které mají jedinou kontrolu nad výpočetními procesy. Takové systémy se nazývají víceprocesorové systémy. Dalším běžným typem letadel jsou systémy založené na mikroprocesorech. Jsou konstruovány buď pomocí mikroprocesoru (MP), nebo mikrokontroléru nebo specializovaného procesoru digitálního signálu. Tři metody ke zlepšení výkonu systému: Vylepšení základna prvku, strukturní metody, matematické metody. Paralelní výpočetní systémy jsou fyzické počítačové systémy i softwarové systémy, které tak či onak implementují paralelní zpracování dat na mnoha výpočetních uzlech.

Flynnova klasifikace Klasifikace je založena na konceptu proudu, který odkazuje na posloupnost prvků, instrukcí nebo dat zpracovaných procesorem. Čtyři třídy architektur: SISD, MISD, SIMD, MIMD. SISD (single stream stream / single data stream) je jediný proud instrukcí a jeden datový proud. Tato třída zahrnuje klasické sekvenční stroje (stroje typu von Neumann). V takových strojích existuje pouze jeden proud příkazů, všechny příkazy se zpracovávají postupně jeden za druhým a každý příkaz inicializuje jednu operaci s jedním proudem dat. SIMD (single stream stream / multiple data stream) - jeden proud instrukcí a více datových proudů. Stream příkazů obsahuje na rozdíl od SISD vektorové příkazy. To umožňuje provádět jednu aritmetickou operaci s mnoha daty najednou - vektorové prvky. MISD (vícenásobný proud instrukcí / jediný datový proud) - vícenásobný tok instrukcí a jediný datový proud. Definice předpokládá, že v architektuře existuje mnoho procesorů, které zpracovávají stejný datový proud. Na tomto principu zatím neexistuje žádný skutečný výpočetní systém. MIMD (vícenásobný proud instrukcí / více datových proudů) - vícenásobný proud instrukcí a více datových proudů. V počítačovém systému existuje několik zařízení pro zpracování příkazů kombinovaných do jednoho komplexu a každé pracuje se svým vlastním proudem příkazů a dat (systémy s více procesory).

Výpočetní systémy třídy SIMD Výpočetní model: na velkém bloku dat se provádí jedna operace. Dva typy: vektorový potrubní a maticový systém. Vektorové dopravníkové systémy (počítače PVP) Dva principy v architektuře procesorů: pipeline organizace toku instrukcí; zavedení do systému instrukcí pro sadu vektorových operací, které umožňují provoz s celými datovými poli. Pipelining je efektivní pouze tehdy, když je zatížení dopravníku téměř plné a rychlost posuvu nových operandy odpovídají maximálnímu výkonu kanálu. Vektorové operace poskytují ideální příležitost k úplnému načtení výpočetního kanálu. Při provádění vektorového příkazu se na všechny prvky vektoru použije stejná operace.Vektorové příkazy fungují na celých polích nezávislých dat, tj. příkaz jako A \u003d B + C znamená přidání dvou polí, nikoli dvou čísel.

Výpočetní systémy třídy SIMD V systému vektorového potrubí existuje několik jednoho nebo více procesorů potrubí, které provádějí vektorové instrukce zasíláním vektorových prvků do kanálu s intervalem rovným době trvání jedné fáze zpracování. Vektorové zpracování zvyšuje rychlost a efektivitu zpracování díky skutečnosti, že zpracování celé sady (vektoru) dat se provádí v jednom příkazu. Vektorové procesory by měly mít mnohem složitější strukturu a ve skutečnosti by měly obsahovat mnoho aritmetických zařízení. Typická organizace vektorového výpočetního systému zahrnuje: jednotku zpracování instrukcí, která volá a dekóduje instrukce, vektorový procesor, který provádí vektorové instrukce, skalární procesor, který provádí skalární instrukce , paměť pro ukládání programů a dat. Délka současně zpracovávaných vektorů v moderních vektorových počítačích je zpravidla 128 nebo 256 prvků.

Maticové systémy Maticové systémy jsou nejvhodnější pro řešení problémů charakterizovaných paralelismem nezávislých objektů nebo dat. Maticový systém se skládá z většího počtu zpracovatelských prvků (PE), uspořádaných takovým způsobem, že provádějí vektorové příkazy nastavené společným ovládacím zařízením pro všechny, a každý PE pracuje se samostatným vektorovým prvkem. PE jsou připojeny prostřednictvím spínacího zařízení s vícemodulovou pamětí. Provedení vektorového příkazu zahrnuje čtení vektorových prvků z paměti, jejich distribuci mezi procesory, provedení dané operace a odeslání výsledků zpět do paměti. Ukázalo se tedy, že výkon systému se rovná součtu výkonu všech prvků zpracování.

Výpočetní systémy třídy MIMD Architektury MIMD se liší v závislosti na tom, zda má procesor vlastní lokální paměť a přistupuje k dalším blokům paměti pomocí přepínací sítě, nebo zda přepínací síť připojuje všechny procesory k veřejné paměti. Systolické výpočetní systémy Systolické systémy jsou vysoce specializované počítače a jsou vyráběny pro konkrétní úkoly. Úkol sestavit systolickou kalkulačku ve skutečnosti spočívá v budování hardwarového kanálu, který má dostatečně dlouhou dobu na získání výsledku (tj. Velký počet kroků), ale zároveň relativně krátkou dobu mezi sekvenčním výstupem výsledků, protože v různých krocích kanálu je zpracováván značný počet mezilehlých hodnot ... Jednotné výpočetní struktury nebo prostředí (HBC) zpravidla patří k typu MIMD a představují pravidelnou mřížku stejného typu prvků zpracování (PE). Každá PE má algoritmicky úplnou sadu operací, stejně jako operace výměny nebo interakce s jinými PE. OBC je implementováno na bázi mikroprocesorů.

Základní principy konstrukce systolických architektur 1. Systole je síť vzájemně propojených výpočetních buněk, obvykle jednoduchá; 2. Každá buňka obsahuje vstupní registr vyrovnávací paměti pro data a kalkulačku pracující s obsahem tohoto registru. Výstup z kalkulačky lze přenést na vstupy jiných buněk; 3. Operace v systole se provádějí podle typu zpracování dopravníku; 4. Výpočty v systole jsou regulovány společným hodinovým signálem;

Základní principy konstrukce systolických architektur Hlavní charakteristiky systolického VA: homogenita pole procesoru, pravidelnost (stálost) meziprocesorových připojení, synchronní fungování prvků procesoru. V každém okamžiku se provádějí stejné operace nebo stejné výpočetní moduly. Těmito moduly mohou být: moduly pro zpracování dat a výpočetní moduly odpovědné za externí komunikaci. Každý ze dvou typů těchto modulů se provádí ve vlastní fázi zpracování. Fáze systolického zpracování VA: K: externí komunikace mezi PE; Otázka: výpočty v PE; W: správa výpočetní techniky a komunikace (velmi krátká).

Fáze zpracování systolického VA Komunikační fáze. Během tohoto časového intervalu dochází k výměně dat mezi PE v celé síti procesorů. Interval by měl odpovídat délce nejdelší komunikační operaci v síti. Fáze výpočtu. Provádí výpočty a zpracování informací. Doba trvání této fáze musí odpovídat nejdelšímu výpočetnímu modulu. Kontrolní fáze. Provádí operace na začátku a na konci práce pole procesoru (odpovídá začátku a konci každé výpočetní operace). Zastavení zpracování procesů kdykoli před dosažením výsledku. Použití systolického VA: akcelerátory zabudované do PC a implementace specifických výpočetních algoritmů (maticové operace, řešení systémů lineárních algebraických rovnic, rozpoznávání vzorů, třídění atd.). V tomto případě je procesorová deska použita jako koprocesor. Doba výpočtu se sníží o 1 - 3 řády. systolické procesory zabudované do technických systémů, které se používají pro digitální zpracování v reálném čase. Například algoritmus digitálního filtrování atd.

Masivně paralelní počítače (MPP) s distribuovanou pamětí Systém se skládá z homogenních výpočetních uzlů, včetně: jednoho nebo více centrální procesorové jednotky (obvykle RISC), lokální paměť (přímý přístup do paměti jiných uzlů není možný), komunikační procesor nebo síťový adaptér někdy pevné disky a / nebo jiná I / O zařízení Do systému lze přidat speciální I / O a řídicí uzly. Uzly jsou připojeny přes určité komunikační médium (vysokorychlostní síť, přepínač atd.) Používají se dvě varianty provozu operačního systému (OS) na strojích s architekturou MPP: plnohodnotný operační systém (OS) funguje pouze na řídicím stroji, na každém jednotlivém modulu funguje silně ořezaná verze OS, která zajišťuje provoz pouze větve paralelní aplikace v ní umístěné. každý modul provozuje plnohodnotný operační systém podobný systému UNIX, který je nainstalován samostatně.

Masivně paralelní počítače (MPP) s distribuovanou pamětí Celkový počet procesorů v reálných systémech dosahuje několika tisíc. Výhodou systémů s distribuovanou pamětí je dobrá škálovatelnost: ve strojích této třídy má každý procesor přístup pouze ke své lokální paměti, a proto není potřeba hodinová synchronizace procesorů. Nevýhody: nedostatek sdílené paměti výrazně snižuje rychlost meziprocesorové výměny. Vyžaduje speciální programovací techniky k implementaci meziprocesorových zpráv; každý procesor může využívat pouze omezené množství lokální paměťové banky; kvůli těmto nevýhodám je třeba vyvinout značné úsilí k maximalizaci využití systémových prostředků. To určuje vysokou cenu software pro masivně paralelní systémy se samostatnou pamětí.

Shared Memory Computers (SMP) SMP (symetric multiprocessing) je symetrická architektura více procesů. Hlavním rysem systémů s architekturou SMP je přítomnost společné fyzické paměti sdílené všemi procesory. Paměť se používá k přenosu zpráv mezi procesory, zatímco všechny výpočetní zařízení při přístupu mají stejná práva a stejné adresování pro všechny paměťové buňky. Proto se architektura SMP nazývá symetrická. Systém SMP je postaven na bázi vysokorychlostní systémové sběrnice, do slotů, ke kterým jsou připojeny funkční bloky následujících typů: procesory (CPU), vstup / výstup (I / O) subsystém atd. Celý systém pracuje pod jediným OS. OS automaticky (během provozu) distribuuje procesy do procesorů, ale někdy je možná i explicitní vazba.

Počítače se sdílenou pamětí (SMP) Hlavní výhody systémů SMP jsou: jednoduchost a univerzálnost programování: model paralelní větve se obvykle používá, když všechny procesory pracují nezávisle na sobě. Je však možné implementovat modely, které používají meziprocesorovou komunikaci. Využití sdílené paměti zvyšuje rychlost takové výměny; uživatel má také přístup k celému objemu paměti najednou. snadnost použití. Systémy SMP obvykle pro usnadnění údržby používají vzduchem chlazený klimatizační systém; poměrně nízká cena... Nevýhody: Systémy sdílené paměti nemají dobré měřítko. Tato významná nevýhoda systémů SMP neumožňuje, aby byly považovány za skutečně slibné. Důvodem špatné škálovatelnosti je, že sběrnice je schopna zpracovávat pouze jednu transakci najednou. souběžný přístup více procesorů ke stejným oblastem sdílené fyzické paměti vytváří problémy s řešením konfliktů. Všechny procesory sdílejí společnou paměť, obvykle prostřednictvím sběrnice nebo hierarchie sběrnice. V idealizovaném modelu může jakýkoli procesor za stejnou dobu přistupovat k libovolnému umístění paměti. V praxi má škálovatelnost této architektury obvykle za následek nějakou formu hierarchie paměti. Pro překlenutí mezery v rychlosti procesoru a hlavní paměti je každý procesor vybaven rychlou vyrovnávací pamětí (cache), která běží rychlostí procesoru. V tomto ohledu je v multiprocesorových systémech založených na takových mikroprocesorech porušena zásada rovného přístupu k libovolnému paměťovému bodu a nastává nový problém - problém koherence mezipaměti.

Počítače se sdílenou pamětí (SMP) Chcete-li zajistit soudržnost mezipaměti, existuje několik možností: použít mechanismus sledování požadavků na sběrnici, ve kterém mezipaměti sledují proměnné předávané kterékoli z centrálních procesorových jednotek a v případě potřeby upravují své vlastní kopie těchto proměnných; přidělit speciální část paměti odpovědnou za sledování platnosti všech použitých kopií proměnných. Hlavní výhodou SMP systémů je relativní snadné programování. Protože všechny procesory mají stejné rychlý přístup k OP není otázka, který procesor bude provádět které výpočty, tak zásadní a významná část výpočetních algoritmů vyvinutých pro jednoprocesorové počítače může být urychlena v multiprocesorových systémech pomocí paralelizujících a „vektorizujících“ překladačů. Systémy SMP jsou dnes nejběžnějším typem paralelních letadel. Ve skutečných systémech lze použít maximálně 32 procesorů. Systémy MPP umožňují vytvářet systémy s nejvyšším výkonem. Uzly těchto systémů jsou často systémy SMP.

Počítače s virtuální sdílenou (sdílenou) pamětí (NUMA - systémy) Architektura NUMA (nerovnoměrný přístup k paměti) kombinuje výhody systémů SMP (relativní jednoduchost vývoje programu) a MPP (dobrá škálovatelnost - schopnost zvýšit počet uzlů procesoru v systému). Jeho hlavním rysem je nejednotný přístup do paměti. Jde o speciální organizaci paměti. Paměť je fyzicky distribuována napříč různými částmi systému, ale logicky je sdílena, takže uživatel vidí jeden adresní prostor. Každý z homogenních modulů se skládá z malého počtu procesorů a paměťového bloku. Moduly se připojují pomocí vysokorychlostního přepínače. Je podporován jeden adresní prostor, přístup do vzdálené paměti je podporován hardwarem, tj. do paměti ostatních modulů. Současně se přístup k místní paměti provádí několikrát rychleji než ke vzdálené paměti. V podstatě je architektura NUMA architekturou MPP (masivně paralelní), kde se uzly SMP (symetrická víceprocesorová architektura) berou jako samostatné výpočetní prvky. Přístup k paměti a výměna dat v rámci jednoho uzlu SMP se provádí prostřednictvím místní paměti uzlu a probíhá velmi rychle a existuje také přístup k procesorům jiného uzlu SMP, ale pomaleji a prostřednictvím složitějšího adresovacího systému.

Klastrové systémy Klastr jsou dva nebo více počítačů (uzlů) propojených síťovými technologiemi založenými na architektuře sběrnice nebo přepínači, které jsou pro uživatele jediným informačním a výpočetním prostředkem. Jako uzly clusteru lze vybrat servery, pracovní stanice a dokonce i ty běžné. osobní počítače... Uzel se vyznačuje tím, že spouští jednu kopii operačního systému. Zdravotní přínos klastrování se projeví v případě selhání uzlu, což umožní jinému uzlu v klastru převzít zatížení neúspěšného uzlu a uživatelé si nevšimnou přerušení přístupu. Škálovatelnost klastrů umožňuje dramaticky zvýšit výkon aplikací pro více uživatelů architektury sběrnice nebo technologií přepínačů. Takové superpočítačové systémy jsou nejlevnější, protože jsou sestavovány na základě standardních komponent, procesorů, přepínačů, disků a externích zařízení.

Klastrové systémy Klastrové typy Třída I. Třída strojů je postavena výhradně ze standardních dílů prodávaných mnoha dodavateli počítačových komponentů (nízké ceny, snadná údržba, hardwarové komponenty dostupné z různých zdrojů). Třída II. Systém má exkluzivní nebo ne příliš rozšířené podrobnosti. Tím lze dosáhnout velmi dobrého výkonu, ale za vyšší cenu. Způsob, jakým jsou procesory navzájem propojeny, určuje jeho výkon více než typ procesorů, které používá. Kritickým parametrem je vzdálenost mezi procesory (určuje míru výkonu takového systému). Proto je někdy účelnější vytvořit systém s levnějšími počítači než s méně nákladnými. Klastry používají oSstandard pro pracovní stanice (např. freeware Linux, FreeBSD), spolu se speciální podporou paralelního programování a vyvažování zátěže. Pro připojení počítačů v klastru je v současné době nejrozšířenější technologie Fast Ethernet (snadné použití a nízké náklady na komunikační zařízení).

Amdahlův zákon a jeho důsledky Nárůst počtu procesorů nevede k proporcionálnímu zvýšení výkonu. Důvody 1. Nedostatek maximálního paralelismu v algoritmu a / nebo nerovnováha v zatížení procesoru. 2. Swapy, konflikty paměti a načasování. Předpokládejme, že ve vašem programu je zlomek operací prováděných postupně f, kde 0

Neurocomputational architektura Ke zlepšení výkonu počítače je nutné přejít od von Neumannovy principy k paralelnímu zpracování informací. Paralelní počítače se přesto z několika důvodů dosud nerozšířily.Jednou z možností implementace tříd architektury výpočetních systémů je neuropočítač. Neuropočítač je výpočetní systém s architekturou MIMD, což je sbírka velmi jednoduchých prvků zpracování jednoho typu (neuronů), spojených více připojeními. Hlavní výhody neuropočítačů jsou spojeny s masivním paralelismem zpracování, což vede k vysokému výkonu s nízkými požadavky na parametry elementárních uzlů. Stabilní a spolehlivé neurální systémy mohou být vytvořeny z málo spolehlivých prvků s velkým rozšířením parametrů.Kterýkoli neuro-počítač ve své struktuře je neurální sítí (neurální sítí). Neuronová síť je síť s konečným počtem vrstev, skládající se z prvků stejného typu - analogů neuronů s různými typy komunikace mezi vrstvami. Elementárním stavebním kamenem neuronové sítě (NN) je neuron, který provádí vážený součet signálů přicházejících na jeho vstup. Výsledek této sumace tvoří mezilehlý výstupní signál, který se aktivační funkcí převede na výstupní signál neuronu.

Úkoly k řešení Úkoly úspěšně vyřešené NN v této fázi jejich vývoje: tvorba modelů a různých nelineárních a matematicky obtížně popsatelných systémů, předpovídání vývoje těchto systémů v čase: řídicí a regulační systémy s predikcí; ovládání robotů a dalších složitých zařízení; různé stroje s konečným stavem: systémy čekání a přepínání, telekomunikační systémy; rozpoznávání vizuálních, zvukových obrazů; vyhledávání asociativních informací a tvorba asociativních modelů; syntéza řeči; formování přirozeného jazyka; rozhodování a diagnostika v oblastech, kde neexistují jasné matematické modely: v medicíně, soudním lékařství, financích;

Struktura a vlastnosti umělého neuronu Neuron se skládá ze tří typů prvků: multiplikátorů (synapsí), sčítače a nelineárního převaděče. Synapsy provádějí komunikaci mezi neurony, vynásobí vstupní signál číslem, které charakterizuje sílu spojení (váha synapsí). Sčítačka provádí sčítání signálů procházejících synaptickými spoji z jiných neuronů a externích vstupních signálů. Nelineární převodník implementuje nelineární funkci jednoho argumentu - výstupu sčítače. Tato funkce se nazývá aktivační funkce nebo přenosová funkce neuronu.

Struktura a vlastnosti umělého neuronu Neuron implementuje skalární funkci vektorového argumentu Matematický model neuronu: y \u003d f (s), kde w i, je váha synapsí, i \u003d 1 ... n; b - hodnota offsetu; s - výsledek součtu; x i - složka vstupního vektoru (vstupního signálu), i \u003d 1 ... n; y - neuronový výstupní signál; n je počet neuronových vstupů; f - nelineární transformace (aktivační funkce). Obecně platí, že vstupní signál, váhy a předpětí mohou být skutečné hodnoty. Výstup (y) je určen typem aktivační funkce a může být skutečný i celý. Synaptická spojení s kladnými váhami se nazývají excitační, se zápornými váhami - inhibiční. Popsaný výpočetní prvek lze považovat za zjednodušený matematický model biologických neuronů

Struktura a vlastnosti umělého neuronu Nelineární transformátor reaguje na vstupní signál (y) výstupním signálem f (s), který je výstupem neuronu. Jednou z nejběžnějších je nelineární aktivační funkce se sytostí (logistická funkce nebo sigmoid (funkce ve tvaru S): f (s) \u003d 1 / (1 + e -as) Jak klesá, sigmoid se stává plošší, v limitu a \u003d 0 degeneruje do vodorovné čáry na úrovni 0,5, se zvětšením sigmoidu se blíží formě funkce jediného skoku s prahovou hodnotou 0. Z výrazu pro sigmoid je zřejmé, že výstupní hodnota neuronu leží v rozsahu (0, 1). Jednou z cenných vlastností sigmoidální funkce je jednoduchý výraz pro jeho derivát. Navíc má vlastnost posilování slabé signály lepší než velké a brání nasycení velkými signály, protože odpovídají oblastem argumentů, kde se sigmoid jemně svažuje.

Syntéza neuronových sítí V závislosti na funkcích prováděných neurony v síti lze rozlišit tři typy neuronů: vstupní neurony, které jsou napájeny vektorem kódujícím vstupní akci nebo obrazem vnějšího prostředí; obvykle neprovádějí výpočetní postupy a informace se přenášejí ze vstupu na výstup změnou jejich aktivace; výstupní neurony, jejichž výstupní hodnoty představují výstupy neuronové sítě; transformace v nich se provádějí podle výrazů (1.1) a (1.2); intermediární neurony, které tvoří základ neuronových sítí, jejichž transformace se rovněž provádějí podle výrazů (1.1) a (1.2). Ve většině neurálních modelů je typ neuronu spojen s jeho umístěním v síti. Pokud má neuron pouze výstupní připojení, pak se jedná o vstupní neuron, pokud je naopak výstupním neuronem. V procesu síťového provozu je vstupní vektor transformován do výstupního a jsou zpracovávány některé informace. Známé neuronové sítě lze rozdělit podle typů neuronových struktur na homogenní (homogenní) a heterogenní. Homogenní sítě se skládají z neuronů stejného typu s jedinou aktivační funkcí, zatímco heterogenní síť zahrnuje neurony s různými aktivačními funkcemi.

Volba počtu neuronů a vrstev Počet neuronů a vrstev je spojen s: 1) složitostí problému; 2) s množstvím dat pro školení; 3) s požadovaným počtem síťových vstupů a výstupů; 4) s dostupnými prostředky: paměť a rychlost stroje, na kterém je síť simulována; Pokud je v síti příliš málo neuronů nebo vrstev: 1) síť se nenaučí a chyba během provozu sítě zůstane velká; 2) ostré výkyvy aproximované funkce y (x) nebudou přenášeny na výstupu ze sítě. Pokud je příliš mnoho neuronů nebo vrstev: 1) výkon bude nízký a na počítačích von Neumann bude vyžadováno hodně paměti; 2) síť bude přeškolena: výstupní vektor bude přenášet nepodstatné a nevýznamné detaily ve studované závislosti y (x), například šum nebo chybná data; 3) závislost výstupu na vstupu se ukáže být ostře nelineární: výstupní vektor se významně a nepředvídatelně změní s malou změnou vstupního vektoru x; 4) síť nebude schopna generalizace: v oblasti, kde nejsou žádné nebo jen málo známé body funkce y (x), bude výstupní vektor náhodný a nepředvídatelný, nebude adekvátní problému, který má být vyřešen

Příprava vstupních a výstupních dat Data dodávaná do síťového vstupu a získaná z výstupu musí být řádně připravena. Jedním z běžných způsobů je změna měřítka: x \u003d (x - m) c, kde x je původní vektor, x je zmenšený. Vektor m je průměrná hodnota sady vstupních dat, c je faktor měřítka. Škálování je žádoucí, aby se data dostala do platného rozsahu. Pokud se tak nestane, je možné několik problémů: 1) neurony vstupní vrstvy budou buď v konstantní saturaci (| m | velké, odchylka vstupních dat je malá), nebo budou neustále potlačovány (| m | malé, odchylka je malá); 2) váhy budou mít během tréninku velmi velké nebo velmi malé hodnoty (v závislosti na rozptylu) a v důsledku toho se tréninkový proces natáhne a přesnost se sníží

Výcvik v síti Proces fungování neuronové sítě závisí na hodnotách synaptických spojení, proto musí síťový designér vzhledem k určité struktuře neuronové sítě, která splňuje určitý úkol, najít optimální hodnoty všech koeficientů proměnné hmotnosti (některá synaptická spojení mohou být konstantní). Tato fáze se nazývá trénink NN. Schopnost sítě řešit problémy s ní spojené během provozu závisí na tom, jak dobře bude provedena. Ve fázi tréninku hraje kromě parametru kvality výběru vah důležitou roli i doba tréninku. Obvykle jsou tyto dva parametry nepřímo úměrné a musí být vybrány na základě kompromisu. Výcvik NN lze provádět s učitelem nebo bez něj. V prvním případě je síť prezentována s hodnotami vstupního i požadovaného výstupního signálu a podle některých interních algoritmů upravuje váhy svých synaptických spojení. V druhém případě jsou výstupy neuronové sítě vytvářeny nezávisle a váhy se mění podle algoritmu, který zohledňuje pouze vstupní a odvozené signály z nich.

Algoritmy síťového tréninkového učení jsou rozděleny do dvou velkých tříd: deterministické a stochastické. V první z nich je úprava vah pevnou posloupností akcí, ve druhé se provádí na základě akcí, které se řídí nějakým náhodným procesem. Zvažte supervizovaný algoritmus učení. 1. Inicializujte prvky matice hmotnosti (obvykle s malými náhodnými hodnotami). 2. Použijte jeden ze vstupních vektorů na vstupy, které se síť musí naučit rozlišovat, a vypočítejte jeho výstup. 3. Pokud je výstup správný, přejděte ke kroku 4. V opačném případě vypočítejte rozdíl mezi ideální a získanou výstupní hodnotou: Upravte váhy podle definovaného vzorce 4. Od kroku 2 opakujte smyčku, dokud síť nepřestane dělat chyby. Ve druhém kroku jsou při různých iteracích prezentovány všechny možné vstupní vektory v náhodném pořadí. Bohužel neexistuje způsob, jak předem určit počet iterací, které je třeba provést, a v některých případech zaručit úplný úspěch.