Cieľom tejto práce bolo naštudovať princípy posilňujúceho učenia. Na základe nadobudnutých vedomostí aplikovať posilňujúce učenie na riadenie určitého robotického systému. Začiatok práce sa venuje teoretickému základu a hlavným myšlienkam posilňujúceho učenia. Na učenie a riadenie robotického systému sa v tejto práci použil tabuľkový Q-Learning, ktorý patrí medzi základné Temporal-Difference algoritmy. Ďalej v práci sa rozoberajú vlastnosti prostredia ,ako aj agenta na ktorého je aplikované posilňujúce učenie. Dôležitou časťou práce je komunikácia medzi simulátorom a Matlabom. V Matlabe bol navrhnutý program učenia, ktorý v sebe zahrňoval Q-Learning algoritmus. V závere práce prezentujeme výsledky dosiahnuté spojením všetkých vyššie spomínaných prvkov.