Доклад «Текст как большие данные»

3 февраля 2023, 17:00 MCK

О вебинаре

  • Спикер

    Николай Михайловский, НТР, Россия

  • Тема

    Доклад «Текст как большие данные»

  • Подробнее про вебинар

    Спикер о вебинаре:
    Пожалуй, наиболее известным статистическим свойством текста является закон Ципфа. Однако, интересные статистические свойства текста им не ограничиваются. Для статистических метрик длинных текстов характерно степеннОе убывание с расстоянием. Это говорит о том, что тексты на самом деле находятся за границами применимости большинства традиционно применяемых в NLP подходов, от n-грамных языковых моделей до трансформеров. Поэтому для качественной обработки длинных текстов нужны новые подходы.

    Видеозапись: https://youtu.be/q6XQP6xnxzk

    Презентация: https://drive.google.com/file/d/1JWfvVA-tmcR4FlDfWHWC1qBTIbON9oDi/view?usp=sharing