Сотрудник НТР, Data Science Researcher Роман Выгон занял второе место в соревновании Auto-KWS (Personalized Keyword Spotting) 2021 Challenge, проводимом в рамках конференции INTERSPEECH — одной из самых важных в мире конференций по распознаванию речи.
Это соревнование научного характера по решению задачи выделения из речи персонализованного ключевого слова, организованное консорциумом китайских университетов и компаний. Задача привлекает значительное внимание как в научных кругах, так и в промышленности, и находится на переднем крае технологий. С помощью такой технологии будят умную колонку, смартфон или любые иные устройства, которые имеют речевой интерфейс.
В рамках соревнования было предложено разработать технологию, с помощью которой устройство можно будить не стандартным словом, заранее заданным производителем (например, “ОК, Google”), а таким, которое человек придумал сам.
Ранее в этом году Роман Выгон и Николай Михайловский опубликовали научную работу по KWS — Learning Efficient Representations for Keyword Spotting with Triplet Loss, в которой на наборе данных Google Commands получили лучший в мире результат (State of the Art — SOTA). Тем не менее, для качественного распознавания персонализованных ключевых слов на китайском языке Роману пришлось разработать кардинально новую технологию, описание которой будет опубликовано в новой статье.
Поздравляем Романа и гордимся его научным достижением!
Результаты Auto-KWS 2021 Challenge: https://www.automl.ai/competitions/12#results