Публикации

21 декабря, 2022
RSpectr: «ИИ-помощник учителя. Сможет ли искусственный интеллект проверять школьные сочинения?»

Сможет ли искусственный интеллект проверять школьные сочинения В 2023 году в России стартует пилотный проект по проверке сочинений учеников с помощью технологий искусственного интеллекта, разработанный в Национальной технологической инициативе (НТИ). На что способен ИИ-ассистент учителя – подсвечивать ошибки в текстах или интерпретировать художественные образы, можно ли ему доверить оценку творчества школьника – в материале RSpectr. Генеральный директор НТР Николай Михайловский дал комментарий на эту тему....

11 декабря, 2022
Tadviser: «Газпром Томск» приобрел беспилотные дроны НТР

В Газпром трансгаз Томск скоро будут летать складские дроны компании НТР. Об этом компания-разработчик сообщила 5 декабря 2022 года. Дроны разработки НТР Томск - это решение для автоматизированной инвентаризации складов. Оно позволяет ускорить процесс инвентаризации и исключить ошибки, вызванные человеческим фактором....

2 декабря, 2022
Генеральный директор НТР Николай Михайловский рассказал НИУ ВШЭ про Искусственный Интеллект

Генеральный директор НТР Николай Михайловский поделился своим экспертным мнением с НИУ ВШЭ про технологию искусственного интеллекта в России в нынешнее время, какие есть тенденции в научных исследованиях и какие перспективы у технологии человеко-машинного взаимодействия. ...

30 ноября, 2022
Rupor.pro: Как используется искусственный интеллект в России?

Мы дали комментарий для информационному агентству РУПОР PRO на тему использования Искусственного Интеллекта в России....

6 октября, 2022
DIGITAL-REPORT: «ПрофессИИ для роботов: может ли искусственный разум заменить людей»

«Все работающие решения в области искусственного интеллекта относятся к «слабому» виду, то есть, решающему отдельные конкретные задачи, как правило, на основе тех или иных оптимизационных алгоритмов», — отмечает Николай Михайловский, директор компании HTP, которая больше 20 лет занимается разработкой ИИ в России. ...

30 сентября, 2022
МИР24: НТР Генеральный директор Николай Михайловский рассказал, как видит образование будущего

«С одной стороны, СССР являлся пионером соревновательной мотивации обучения в виде олимпиад. С другой стороны, проблема мотивации отстающих учеников глобально не решена мировой педагогикой, и можно ожидать попыток геймификации образования на основе ИИ», – говорит Николай Михайловский....

22 июля, 2022
iot.ru: Генеральный директор НТР рассказал про нынешние реалии робототехники в производстве

Гендиректор компании НТР Николай Михайловский заметил, что в России еще достаточно низкий уровень промышленной роботизации в сравнении с общемировым. «На это можно посмотреть и с позитивной точки зрения: сейчас существует национальная программа «Цифровая экономика России», предусматривающая инвестиции в это направление, на фоне которой с 2018-го наметилось ускорение роста роботизации производств». ...

19 июля, 2022
iot.ru: Робототехника в сельском хозяйстве – используемые в России решения и комментарии представителей рынка

Генеральный директор НТР Николай Михайловский рассказал про эффективно работающее решение на сельхозпредприятие. НТР разработала дрон с блоком визуальной навигации, который обеспечивает возможность полета и позиционирования на основе поступающей с бортовых видеокамер визуальной информации. При отсутствии спутниковой или радионавигации является единственным безопасным решением для применения на территории предприятия....

14 февраля, 2022
«Промышленные страницы Сибири»№1(163): ЗА БЕЗВРЕДНОСТЬ ТРУДА

После того как в 1818 году ввели закон об охране труда, на заводах и рудниках изменилось многое — и средства защиты работников, и документальная база, и требования. За сотрудниками следят невидимые «зрители», станок отключится, если совершена ошибка, и выпить перед работой уже не получится. Это заслуга «Индустрии 4.0» и сопутствующей цифровизации производства, в том числе и в части обеспечения его безопасности. Генеральный директор ООО «НТР Томск» Николай Михайловский поделился опытом по этой теме....

25 января, 2022
Affiliate academy: Как работают системы рекомендаций

Попросили экспертов простыми словами рассказать о том, как работают алгоритмы рекомендаций в соцсетях, сервисах (например, онлайн-кинотеатрах и каталогах), интернет-магазинах. Что такое рекомендательная система? Классификация систем рекомендаций? Как они работают?...

1 ноября, 2021
VZ.RU: «Курьеров в России заменят новой технологией»

Правительство резко упрощает правила использования в России беспилотных летательных аппаратов. Это создаст в стране новую систему доставки. В каких случаях и для каких регионов она будет особенно актуальна – и сможет ли заменить столь привычных на российских улицах обычных живых курьеров? ...

29 октября, 2021
WAYXAR WALL: «Об этике AI в России и мире – комментарий эксперта»

Вопрос об этике AI возник в первую очередь по инициативе угнетаемых американских меньшинств - многие наборы данных исторически собирались представителями белого большинства и содержали данные о нем же. В результате точность алгоритмов, обученных на этих данных, в применении к национальным меньшинствам страдала....

Встреча Михайловский Н.Э. и Жвачкин С.А.
23 августа, 2021
РИА Томск: «Резидент ОЭЗ «Томск» «учит» дроны проводить инвентаризацию на складах»

Компания "Сибирские информационные системы", резидент особой экономической зоны (ОЭЗ) "Томск", разрабатывает технологию ориентирования беспилотных дронов в пространстве с использованием нейросетей – без GPS или Глонасс; такие дроны можно использовать, к примеру для инвентаризации товаров на складах, сообщил в понедельник директор компании Николай Михайловский....

Дрон компании НТР
23 августа, 2021
TOMSK.RU: «Мозговой штурм от томских IT-компаний: губернатор предложил им поучаствовать в создании кампуса «Большого университета»»

Томские высокотехнологичные компании смогут поучаствовать в проекте кампуса "Большого университета". Это предложил им губернатор Сергей Жвачкин в ходе рабочей поездки в Особую экономическую зону технико-внедренческого типа «Томск». Глава региона встретился с руководителями нескольких компаний, увидел их перспективные разработки и подал идею, как реализовать новые в связке с властями и вузами города....

Дрон компании НТР
23 августа, 2021
GUBERNATOR.TOMSK.RU: «Губернатор Сергей Жвачкин оценил разработки резидентов ОЭЗ и пригласил их в проект кампуса»

Губернатор Сергей Жвачкин оценил разработки резидентов ОЭЗ и пригласил их в проект кампуса Сегодня, 23 августа, губернатор Томской области Сергей Жвачкин встретился с  руководством и технологическими командами томских инновационных компаний – резидентами особой экономической зоны....

9 июля, 2020
ЕВРАЗ: «Распадская угольная компания внедряет новые мобильные приложения»

К успешно используемым приложениям RUK MPU и RUK TMC, которые в реальном времени осуществляют мониторинг производственных показателей всех предприятий компании и показывают состояние складских программ, добавились новые — RUK ECO и Abie Sistem. Все приложения работают на платформах Android и iOS....

28 мая, 2020
ТВН: «Мобильное приложение для снабженцев»

Развитие через инновации и безопасность. Такой курс взяла Распадская угольная компания. Угольщики ЕВРАЗа активно используют в работе различные мобильные сервисы. Удобно, когда вся актуальная информация всегда с тобой в смартфоне. Но вот, что делать, если для производства срочно необходимы комплектующие? И тут вновь на помощь приходит мобильное приложение....

16 мая, 2020
«Единственный способ для бизнеса работать в нынешней ситуации – это пытаться куда-то двигаться. Потому что если никуда не двигаться, то никуда и не попадешь» — большое интерьвью Н.Михайловского.

– Николай, как повлияла пандемия на деятельность вашей компании? Положительно или отрицательно? – Прежде всего, с моей точки зрения, не совсем правильно говорить о пандемии как основном факторе. Более верно говорить о мировом финансовом кризисе, поводом для которого явилась, в данном случае, пандемия....

9 декабря, 2019
RG.RU: «Smartшахтеры: сделано в России»

Отечественная угольная отрасль не так часто попадает в заголовки hi-tech новостей. А между тем уже сегодня российские программисты снабжают шахтеров умными приложениями, о которых во многих странах только мечтают. Доступными, между прочим, для смартфонов на Android и iOS....

17 мая, 2017
Генеральный директор НТР в Intelligent enterprise о Информационных Системах Вчера, Сегодня и Завтра

НТР CEO Николай Михайловский рассказал об информационных Системах в Intelligent enterprise. Что такое информационная система? Информационные системы вчера сегодня и завтра?...

2023
Borisov E., Mikhaylovskiy N., 2023. Automated Minuting on DumSum Dataset. In Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2023”, Moscow.

Meeting minutes are short texts summarizing the most important outcomes of a meeting. The goal of this work is to develop a module for automatic generation of meeting minutes based on a meeting transcript text produced by an Automated Speech Recognition (ASR) system. We consider minuting as a supervised machine learning task on pairs of texts: the transcript of the meeting and its minutes. No Russian minuting dataset was previously available. To fill this gap we present DumSum - a dataset of meetings transcripts of the Russian State Duma and City Dumas, complete with minutes. We use a two-staged minuting pipeline, and introduce semantic segmentation that improves ROUGE and BERTScore metrics of minutes on City Dumas meetings by 1%-10% compared to naive segmentation....

Mikhaylovskiy N., Churilov I., 2023. Autocorrelations Decay in Texts and Applicability Limits of Language Models. In Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2023”, Moscow.

We show that the laws of autocorrelations decay in texts are closely related to applicability limits of language models. Using distributional semantics we empirically demonstrate that autocorrelations of words in texts decay according to a power law. We show that distributional semantics provides coherent autocorrelations decay exponents for texts translated to multiple languages. The autocorrelations decay in generated texts is quantitatively and often qualitatively different from the literary texts. We conclude that language models exhibiting Markov behavior, including large autoregressive language models, may have limitations when applied to long texts, whether analysis or generation....

2023
Bolshakov V., Kolobov R., Borisov E., Mikhaylovskiy N., Mukhtarova G., 2023. Scaled Down Lean BERT-like Language Models for Anaphora Resolution and Beyond. In Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2023”, Moscow.

We study performance of BERT-like distributive semantic language models on anaphora resolution and related tasks with the purpose of selecting a model for on-device inference. We have found that lean (narrow and deep) language models provide the best balance of speed and quality for word-level tasks, and opensource1 RuLUKE-tiny and RuLUKE-slim models we have trained. Both are significantly (over 27%) faster than models with comparable accuracy. We hypothesise that the model depth may play a critical role for performance as, according to recent findings each layer behaves as a gradient descent step in autoregressive setting....

2023
Bolshakov V., Mikhaylovskiy N., 2023. Pseudo-Labelling for Autoregressive Structured Prediction in Coreference Resolution. In Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2023”, Moscow.

Coreference resolution is an important task in natural language processing, since it can be applied to such vital tasks as information retrieval, text summarization, question answering, sentiment analysis and machine translation. In this paper, we present a study on the effectiveness of several approaches to coreference resolution, focusing on the RuCoCo dataset as well as results of participation in the Dialogue Evaluation 2023. We explore ways to increase the dataset size by using pseudo-labelling and data translated from another language. Using such technics we managed to triple the size of dataset, make it more diverse and improve performance of autoregressive structured prediction (ASP) on coreference resolution task. This approach allowed us to achieve the best results on RuCoCo private test with increase of F1-score by 1.8, Precision by 0.5 and Recall by 3.0 points compared to the second-best leaderboard score. Our results demonstrate the potential of the ASP model and the importance of utilizing diverse training data for coreference resolution....

2022
Жовнерчук Е.В., Чичкалюк В.А., Жовнерчук И.Ю., Михайловский Н.Э., Мошкин В.В., Юрашку И.В. Методика определения психической надежности сотрудников транспортной безопасности с использованием машинного обучения. Психическое здоровье 2022; 17(12): 3-10.

Цель: разработать методику формирования видеодатасета рефлекторной мимической активности лица в группе сотрудников транспортной безопасности (ТБ) с оценкой их психофизиологического состояния, подтверждающего наличие функционального состояния утомления....

Mikhaylovskiy N., 2022. On Unsupervised Training of Link Grammar Based Language Models. arXiv preprint arXiv:2208.13021.

In this short note we explore what is needed for the unsupervised training of graph language models based on link grammars. First, we introduce the ter-mination tags formalism required to build a language model based on a link grammar formalism of Sleator and Temperley [21] and discuss the influence of context on the unsupervised learning of link grammars. Second, we pro-pose a statistical link grammar formalism, allowing for statistical language generation. Third, based on the above formalism, we show that the classical dissertation of Yuret [25] on discovery of linguistic relations using lexical at-traction ignores contextual properties of the language, and thus the approach to unsupervised language learning relying just on bigrams is flawed. This correlates well with the unimpressive results in unsupervised training of graph language models based on bigram approach of Yuret....

Zubchuk, E., Menshikov, D., & Mikhaylovskiy, N. (2022, February). Using a Language Model in a Kiosk Recommender System at Fast-Food Restaurants.

Kiosks are a popular self-service option in many fast-food restaurants, they save time for the visitors and save labor for the fast-food chains. In this paper, we propose an effective design of a kiosk shopping cart recommender system that combines a language model as a vectorizer and a neural network-based classifier. The model performs better than other models in offline tests and exhibits performance comparable to the best models in A/B/C tests....

Danilovich, I., Moshkin, V., Reimche, A., Tevelevich, M., & Mikhaylovskiy, N. (2021, November). Video monitoring over anti-decubitus protocol execution with a deep neural network to prevent pressure ulcer. In 2021 43rd Annual International Conference of the IEEE Engineering in Medicine & Biology Society (EMBC) (pp. 1384-1387). IEEE.

Video monitoring of the patient position in the intensive care units is complicated by the obstacles covering the patient body. Conventional posture detection algorithms do not work in this case. A reformulation of the posture detection problem for the case as an object detection/image classification problem and the use of recent deep learning techniques allowed us to achieve 94.5% accuracy on a pre-clinical test classifying 4 postures using imagery from an off-the-shelf camera and edge processing, which is a 60% improvement over the result previously known in literature. This in turn allowed us to build a ready for the clinical trials system based on inexpensive off-the-shelf cameras.Clinical Relevance — A cheap and practical system of automatic video monitoring of bedridden patients allows to minimize the risks of pressure ulcer in ICU....

Zubchuk, E., Menshikov, D., & Mikhaylovsky, N. (2021, September). Efficiency of short text classifiers for payment classification. In 2021 International Conference on Information Technology and Nanotechnology (ITNT) (pp. 1-4). IEEE.

Traditionally, the Central Bank of Russia used regular expressions for the payment classification as part of its supervisory activities. Regular expressions often spanned multiple pages to cover varied relevant keywords and their forms. We compare this approach to two modern short text classification approaches: fastText and BERT-based transformer in terms of speed, accuracy and flexibility, including few-shot learning....

Bedyakin, R., & Mikhaylovskiy, N. (2021, June). Language ID Prediction from Speech Using Self-Attentive Pooling. In Proceedings of the Third Workshop on Computational Typology and Multilingual NLP (pp. 130-135).

This memo describes NTR-TSU submission for SIGTYP 2021 Shared Task on predicting language IDs from speech. Spoken Language Identification (LID) is an important step in a multilingual Automated Speech Recognition (ASR) system pipeline. For many low-resource and endangered languages, only single-speaker recordings may be available, demanding a need for domain and speaker-invariant language ID systems. In this memo, we show that a convolutional neural network with a Self-Attentive Pooling layer shows promising results for the language identification task....

Bedyakin, R., & Mikhaylovskiy, N. (2021, June). Low­-Resource Spoken Language Identification Using Self-­Attentive Pooling and Deep 1D Time­Channel Separable Convolutions. In Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2021”, Moscow.

This memo describes NTR/TSU winning submission for Low Resource ASR challenge at Dialog2021 conference, language identification track. Spoken Language Identification (LID) is an important step in a multilingual Automated Speech Recognition (ASR) system pipeline. Traditionally, the ASR task requires large volumes of labeled data that are unattainable for most of the world's languages, including most of the languages of Russia. In this memo, we show that a convolutional neural network with a Self-Attentive Pooling layer shows promising results in low-resource setting for the language identification task and set up a SOTA for the Low Resource ASR challenge dataset. Additionally, we compare the structure of confusion matrices for this and significantly more diverse VoxForge dataset and state and substantiate the hypothesis that whenever the dataset is diverse enough so that the other classification factors, like gender, age etc. are well-averaged, the confusion matrix for LID system bears the language similarity measure....

Kolobov, R., Okhapkina, O., Omelchishina, O., Platunov, A., Bedyakin, R., Moshkin, V., Menshikov, D. and Mikhaylovskiy, N., 2021. MediaSpeech: Multilanguage ASR Benchmark and Dataset. arXiv preprint arXiv:2103.16193.

The performance of automated speech recognition (ASR) systems is well known to differ for varied application domains. At the same time, vendors and research groups typically report ASR quality results either for limited use simplistic domains (audiobooks, TED talks), or proprietary datasets. To fill this gap, we provide an open-source 10-hour ASR system evaluation dataset NTR MediaSpeech for 4 languages: Spanish, French, Turkish and Arabic. The dataset was collected from the official youtube channels of media in the respective languages, and manually transcribed. We estimate that the WER of the dataset is under 5%. We have benchmarked many ASR systems available both commercially and freely, and provide the benchmark results. We also open-source baseline QuartzNet models for each language....

Vygon R., Mikhaylovskiy N. (2021) Learning Efficient Representations for Keyword Spotting with Triplet Loss. In: Karpov A., Potapova R. (eds) Speech and Computer. SPECOM 2021. Lecture Notes in Computer Science, vol 12997. Springer, Cham. https://doi.org/10.1007/978-3-030-87802-3_69

In the past few years, triplet loss-based metric embeddings have become a de-facto standard for several important computer vision problems, most notably, person reidentification. On the other hand, in the area of speech recognition the metric embeddings generated by the triplet loss are rarely used even for classification problems. We fill this gap showing that a combination of two representation learning techniques: a triplet loss-based embedding and a variant of kNN for classification instead of cross-entropy loss significantly (by 26% to 38%) improves the classification accuracy for convolutional networks on a LibriSpeech-derived LibriWords datasets. To do so, we propose a novel phonetic similarity based triplet mining approach. We also improve the current best published SOTA (for small-footprint models) for Google Speech Commands dataset V2 10+2-class classification by about 16%, achieving 98.37% accuracy, and the current best published SOTA for 35-class classification on Google Speech Commands dataset V2 by 47%, achieving 97.0% accuracy....

Mikhaylovskiy, N. (2020). “How Do You Test the Strength of AI?” September 2020, International Conference on Artificial General Intelligence (pp. 257-266).

Creating Strong AI means to develop artificial intelligence to the point where the machine’s intellectual capability is in a way equal to a human’s. Science is definitely one of the summits of human intelligence, the other being the art. Scientific research consists in creating hypotheses that are limited applicability models (methods) implying lossy information compression. In this article, we show that this paradigm is not unique to the science and is common to the most developed areas of human activities, like business and engineering. Thus, we argue, a Strong AI should possess a capability to build such models. Still, the known tests to confirm the human-level AI do not address this consideration. Based on the above we suggest a series of six tests of rising complexity to check if AI have achieved the human-level intelligence....

Pyakillya, B., Kazachenko, N., & Mikhailovsky, N. (2017, October). Deep learning for ECG classification. In Journal of physics: conference series (Vol. 913, No. 1, p. 012004). IOP Publishing.

The importance of ECG classification is very high now due to many current medical applications where this problem can be stated. Currently, there are many machine learning (ML) solutions which can be used for analyzing and classifying ECG data. However, the main disadvantages of these ML results is use of heuristic hand-crafted or engineered features with shallow feature learning architectures. The problem relies in the possibility not to find most appropriate features which will give high classification accuracy in this ECG problem. One of the proposing solution is to use deep learning architectures where first layers of convolutional neurons behave as feature extractors and in the end some fully-connected (FCN) layers are used for making final decision about ECG classes....

Михайловский, Н.Э. Сравнение методов оценки стоимости проектов по разработке информационных систем // Конференция «Теория и практика управления предприятием». – 2003.

Здесь не будут рассматриваться вопросы управления проектами, а сосредоточимся на двух последних проблемах, сводящихся к адекватной оценке стоимости проекта. Адекватная оценка стоимости проекта важна как для заказчика, так и для исполнителя проекта. В данной статье автор анализирует четыре основные модели оценки трудоемкости разработки информационных систем и предлагает способы использования моделей типа функциональных точек при управлении проектами разработки информационных систем и контрактами по их разработке. Оптимизация бизнес-процессов. Документирование, анализ и управление....

Михайловский, Н. Э. (2002). Архитектура информационной системы, оценка рисков и совокупная стоимость владения. Директор ИС, (6), 12-17.

Некоторое время назад нам довелось выполнять консалтинговый проект по разработке архитектуры достаточно крупной и нетривиальной информационной системы. И если вопрос построения архитектур-кандидатов казался более или менее очевидным, то вопрос выбора архитектуры из кандидатов, как оказалось, не столь проработан. В данной статье излагается метод выбора архитектуры информационной системы (ИС), к которому мы пришли в результате реализации двух аналогичных проектов....

Агапов, А. С., Зенин, С. В., Михайловский, Н. Э., & Мкртумян, А. А. (2001). Оценка и аттестация зрелости процессов создания и сопровождения программных средств и информационных систем (ISO/IEC TR 15504-CMM), Пер. с англ. Москва,» Книга и бизнес.

В книге рассматриваются основы оценки и аттестации зрелости процессов создания и сопровождения программных средств и информационных систем, полностью соответствующие источнику - техническому отчету ISO/IEC TR 15504, состоящему из девяти частей. Определяется эталонная модель оценки и аттестации зрелости процессов жизненного цикла, предназначенная для практического применения при разработке конкретных моделей оценки и аттестации зрелости процессов жизненного цикла программных средств или информационных систем. Материалы могут быть использованы: заказчиками в тендерах, компаниями разработчиками и производителями, системными интеграторами, занимающимися инжинирингом, реструктуризацией, реинжинирингом, поставкой информационных технологий и связанными с ними услугами. Установленная во второй части ISO/IEC TR 15504 эталонная модель аттестации (оценивания) зрелости процессов и усовершенствования этих процессов может быть использована не только для процессов видов деятельности, связанных с программными средствами и информационными технологиями....