Научно-технический вебинар «Последовательное принятие решений с помощью гауссовских процессов»

1 марта 2022, 15:00 MCK

О вебинаре

  • Спикер

    Вячеслав Боровицкий, СПбГУ, ПОМИ РАН, Россия

  • Тема

    Научно-технический вебинар «Последовательное принятие решений с помощью гауссовских процессов»

  • Подробнее про вебинар
    Спикер о работе:
    Задачи, связанные с последовательным принятием решений встречаются повсеместно. Автоматический агент, который решает такие задачи, должен обучаться, взаимодействуя с окружающей средой, и использовать полученные знания для выбора дальнейших действий. Поскольку данных обычно очень мало, для обучения таких агентов часто используются вероятностные модели, такие как гауссовские процессы. Я поговорю о таких моделях и об их приложениях для решения задач последовательного принятия решений, включая оптимизацию неизвестных функций и многое другое.

    Дополнительные материалы:
    1. https://arxiv.org/abs/1206.2944 — байесовская оптимизация для настройки ML алгоритмов, статья, которая это дело популяризировала.
    2. https://mlg.eng.cam.ac.uk/pub/pdf/DeiRas11.pdf — reinforcement learning на основе гауссовских процессов.
    3. https://willieneis.github.io/bax-website/ — новая работа по теме, открывающая возможность применять GP для приближенной оценки самых разных свойств сложно-вычислимых функций.

    Личный сайт:  https://vab.im/

    Запись: https://youtu.be/hh5E-6q0KVg

    Презентация: https://vab.im/download/2022-03-01-Sequential-Decision-Making-With-Gaussian-Processes.html