Спикер о вебинаре:
Пожалуй, наиболее известным статистическим свойством текста является закон Ципфа. Однако, интересные статистические свойства текста им не ограничиваются. Для статистических метрик длинных текстов характерно степеннОе убывание с расстоянием. Это говорит о том, что тексты на самом деле находятся за границами применимости большинства традиционно применяемых в NLP подходов, от n-грамных языковых моделей до трансформеров. Поэтому для качественной обработки длинных текстов нужны новые подходы.
Видеозапись: https://youtu.be/q6XQP6xnxzk
Презентация: https://drive.google.com/file/d/1JWfvVA-tmcR4FlDfWHWC1qBTIbON9oDi/view?usp=sharing