Целите на курса са студентите да придобият основни познания в областта на агентните системи и подсиленото самообучение. Студентите ще бъдат запознати както с едноагентни, така и с мулти-агентни системи. Разглеждат се основни принципи в областта на подсиленото самоубочение (Reinforcement Learning), Процес за решенията на Марков (Markov decision process, MDP), въведение в Теория на игрите, Теория на Джон Наш, Парето-оптималност. При мулти-агентните системи се разлеждат и различни механизми за комуникация между агентите. Разясняват се основни понятия като това какво е агент, какво е рационално мислене, оптималност при избора на действията. Изискванията към желаещите да се запишат на тази избираема дисциплина са: основни познания по програмиране на какъвто и да е език от високо ниво.
|
- Въведение в Изкувствения интелект. Какво е агент? Характеристики на едно- и мултиагента система. Примери. Преглед на темите в курса.
- Рационални агенти. Състояния на средата. Видимост. Свойството на Марков. Цели. Функции на прехода и Награди.
- История и възникване на едноагентните системи. Динамично програмиране. Монте-карло алгоритми. Уравнения на темпоралните разлики.
- Въведение в Теорията на игрите. Стратегически игри. Дилема на затворниците. Уравнение на Наш. Контрол - централизиран (ендоагентни системи) и децентрализиран (МАС). Предимства и недостатъци на децентрализирания контрол. Механизми за контрол.
- Въведение в Мулти-агентните системи. Координация. Координационни механизми. Комуникация – обособена и необособена.
- Обучение. Q-обучение. Итерация на Стойности. Уравнения на Белман.
- Задаване на проекта. Начало на писане на проекта.
- Работа по проекта. Отстраняване на възникнали проблеми.
- Довършване и тестване на проекта. Изготвяне на доклад (рапорт) за описание дейностите по проекта.
- Представяне и защита на проекта. Крайна оценка.
|