Достижения и применение обратного обучения с подкреплением

Достижения и применение обратного обучения с подкреплением

16 мая 2025 г. - 14:00 – 15:00

Котеча Кетан

Ph.D.

Профессор и декан факультета технологий Международного университета Симбиозис (Индия)

Котеча Кетан

Профессор и декан факультета технологий Международного университета Симбиозис (Индия)

Ph.D.

Аннотация

Обучение с подкреплением, характеризующееся обучением методом проб и ошибок и отложенным вознаграждением, занимает центральное место в процессах принятия решений. Его основной компонент, функция вознаграждения, традиционно создается вручную, но разработка этих функций часто является сложной или невозможной в реальных сценариях. Обратное обучение с подкреплением (Inverse Reinforcement Learning, ООП) решает эту проблему, извлекая функции вознаграждения из демонстраций экспертов, облегчая вывод оптимальной политики и предлагая более глубокое понимание поведения экспертов. Этот всеобъемлющий обзор фокусируется на трех ключевых аспектах: разнообразные методологии, используемые в ООП, его широкое применение в таких областях, как робототехника, автономные транспортные средства и анализ намерений человека, а также важность курируемых наборов данных для продвижения исследований ООП. Предоставляется структурированный анализ методов ООП, приложения классифицируются по областям, и подчеркивается роль контрольных наборов данных в оценке производительности и руководстве будущими разработками. Подчеркивается уникальная ценность ООП в преодолении разрыва между человеческим и искусственным обучением, демонстрируя его потенциал для раскрытия достижений в машинном обучении, принятии решений и объяснимом ИИ.

Краткая биография

Профессор Кетан Котеча является широко известным исследователем и преподавателем в области глубокого обучения, искусственного интеллекта, компьютерных алгоритмов и машинного обучения, был признан мировым сообществом как один из 2% лучших ученых мира по версии Стэнфордского университета. В настоящее время работает в Международном университете Симбиозис (Symbiosis International University, QS 140) в должности директора и профессора института технологий, является директором центра прикладного искусственного интеллекта Симбиозис (Symbiosis Centre for Applied Artificial Intelligence).