18 сентября 2025 г. - 14:00 – 15:00
|
Ву ШуфанPh.D. Профессор Шанхайский университета Джиа Тонг (Китай) |
Профессор
Шанхайский университета Джиа Тонг (Китай)
Ph.D.
В данном исследовании затрагивается проблема управления синхронизированными кооперативными многоагентными системами с использованием подхода обучения с подкреплением вне политики, инициируемого событиями. На основе графа связей с точки зрения глобальной оптимизации сначала строится системная модель, переформулирующая задачу как решение уравнения Гамильтона–Якоби–Айзекса (ГЯА). Для решения вычислительных и коммуникационных задач, связанных с обширным обменом информацией в многоагентных системах, вводится схема, инициируемая событиями. Предлагается условие инициирования, и его реализуемость строго анализируется с точки зрения устойчивости системы и исключения эффекта Зенона. Для решения уравнения ГЯА на основе уравнения Беллмана выводится безмодельный алгоритм обучения с подкреплением вне политики, использующий набор системных данных для обхода потенциальных неточностей в динамической модели системы. Наконец, реализуемость и эффективность предлагаемого алгоритма обосновывается помощью теоретического анализа и демонстрируются в виде примера моделирования.
Профессор Ву Шуфан является признанным специалистом в области механики космического полета и разработки малых космических аппаратов, академик Международной академии астронавтики (Academician of International Academy of Astronautics, IAA), член Американского института Аэронавтики и Астронавтики (Associate Fellow of American Institute of Aeronautics and Astronautics, AIAA), а также член редколлегии Журнала «Наведение, Навигации и Управления» (Journal of Guidance, Navigation and Control, 2737-4807). В настоящее время работает в Шанхайском университете Цзяо Тонг (Shanghai Jiao Tong University, QS 51) в должности профессора факультета аэронавтики и астронавтики. Он также является директором центра интеллектуальных космических технологий, где разрабатывает малые космические аппараты типа CubeSat различного назначения, методы и технические средства бесперебойной межспутниковой связи и обработки целевой информации.