Факултет по математика и информатика

Факултет по математика и информатика - Агентни системи

Лектори	доц. д-р Владимир Шкуртов, хон. ас. Стефан Ставрев
Анотация
Целите на курса са студентите да придобият основни познания в областта на агентните системи и подсиленото самообучение. Студентите ще бъдат запознати както с едноагентни, така и с мулти-агентни системи. Разглеждат се основни принципи в областта на подсиленото самоубочение (Reinforcement Learning), Процес за решенията на Марков (Markov decision process, MDP), въведение в Теория на игрите, Теория на Джон Наш, Парето-оптималност. При мулти-агентните системи се разлеждат и различни механизми за комуникация между агентите. Разясняват се основни понятия като това какво е агент, какво е рационално мислене, оптималност при избора на действията. Изискванията към желаещите да се запишат на тази избираема дисциплина са: основни познания по програмиране на какъвто и да е език от високо ниво.
Съдържание
Въведение в Изкувствения интелект. Какво е агент? Характеристики на едно- и мултиагента система. Примери. Преглед на темите в курса. Рационални агенти. Състояния на средата. Видимост. Свойството на Марков. Цели. Функции на прехода и Награди. История и възникване на едноагентните системи. Динамично програмиране. Монте-карло алгоритми. Уравнения на темпоралните разлики. Въведение в Теорията на игрите. Стратегически игри. Дилема на затворниците. Уравнение на Наш. Контрол - централизиран (ендоагентни системи) и децентрализиран (МАС). Предимства и недостатъци на децентрализирания контрол. Механизми за контрол. Въведение в Мулти-агентните системи. Координация. Координационни механизми. Комуникация – обособена и необособена. Обучение. Q-обучение. Итерация на Стойности. Уравнения на Белман. Задаване на проекта. Начало на писане на проекта. Работа по проекта. Отстраняване на възникнали проблеми. Довършване и тестване на проекта. Изготвяне на доклад (рапорт) за описание дейностите по проекта. Представяне и защита на проекта. Крайна оценка.