Marko Ruman složil státní doktorskou zkoušku s vyznamenáním (obor: Matematické inženýrství, FJFI ČVUT) a úspešně představil teze své práce na téma "Transfer Learning in Reinforcement Learning".
The research studies optimal decision-making with the focus on preferences quantified for fully probabilistic design (FPD). FPD models the closed DM loop and the agent’s preferences by joint probability densities (pds). There is a preference-elicitation (PE) principle, which maps the agent’s model of the state transitions and its incompletely expressed wishes on an ideal pd quantifying them. This research also studies preferences targeting actions and contradicting preferences.
Deep reinforcement learning has shown an ability to achieve super-human performance in solving complex reinforcement learning tasks only from raw-pixels. However, it fails to reuse knowledge from previously learnt tasks to solve new, unseen ones. To generalize and reuse knowledge is one of the fundamental requirements for creating a truly intelligent agent. The work summarizes the problem of transfer learning in reinforcement learning tasks and offers a method for one-to-one task transfer learning.
Department of Adaptive Systems, Institute of Information Theory and Automation, Czech Academy of Sciences is looking for researchers/postdocs/PhD students in one of the areas: • - Cybernetics • - Artificial intelligence • - Informatics • - Applied mathematics • - Control theory • - other related fields
Good professional knowledge of English is essential, no knowledge of Czech is needed.
If you are interested please contact Mrs Neuner neuner@utia.cas.cz for further details. Those who have started PhD in Ukraine are also welcome.
This course will introduce the basic ideas underlying modelling dynamic decision problems and the methods used to solve them. The course will focus on probabilistic inference, decision making under uncertainty, and multi-agent interaction.
Předmět je orientován na nízkoúrovňový přístup k především bayesovskému statistickému a informačně-teoretickému modelování, kdy se student nejen seznamuje s existujícími metodami (regresní modely, Kalmanův filtr, fůze modelů aj.), ale sám si je i zkouší implementovat. Odpadá tedy využívání „vysokoúrovňových“ knihoven typu pandas, scikit-learn či statsmodels, důraz bude kladen naopak na využití numpy a scipy a nízkoúrovňovou algebru a kalkulus. Druhá polovina semestru je zaměřena na vlastní návrh metod a algoritmů, analýzu a ověřování jejich vlastností.
Studenti získají základy pravděpodobnostního uvažování, schopnost syntézy apriorní a aposteriorní informace a naučí se pracovat s náhodnými veličinami. Budou schopni správně aplikovat základní modely rozdělení náhodných veličin a řešit aplikační pravděpodobnostní úlohy v oblasti informatiky a počítačových věd. Pomocí metod statistické indukce budou schopni provádět odhady neznámých parametrů základního souboru na základě výběrových charakteristik. Seznámí se se základními metodami určování statistické závislosti dvou nebo více náhodných veličin.