Доклад «Текст как большие данные»

3 февраля 2023, 17:00 MCK

О вебинаре

  • Спикер

    Николай Михайловский, НТР, Россия

  • Тема

    Доклад «Текст как большие данные»

  • Подробнее про вебинар

    Спикер о вебинаре:
    Пожалуй, наиболее известным статистическим свойством текста является закон Ципфа. Однако, интересные статистические свойства текста им не ограничиваются. Для статистических метрик длинных текстов характерно степеннОе убывание с расстоянием. Это говорит о том, что тексты на самом деле находятся за границами применимости большинства традиционно применяемых в NLP подходов, от n-грамных языковых моделей до трансформеров. Поэтому для качественной обработки длинных текстов нужны новые подходы.

    Видеозапись: https://youtu.be/q6XQP6xnxzk

    Презентация: https://drive.google.com/file/d/1JWfvVA-tmcR4FlDfWHWC1qBTIbON9oDi/view?usp=sharing

Connection Information

To perform the requested action, WordPress needs to access your web server. Please enter your FTP credentials to proceed. If you do not remember your credentials, you should contact your web host.

Connection Type