Генеральный директор НТР в Intelligent enterprise о Информационных Системах Вчера, Сегодня и Завтра

«Информационные Технологии в текущий момент находятся в состоянии то ли новой революции, то ли контрреволюции. Происходит переход от внедрения систем учета к системам оптимизации с ясными бизнес-метриками эффективности. Старые системы, конечно, никуда не денутся, но фокус с них уйдет».

Николай Михайловский,
генеральный директор NTR Lab

Что такое информационная система?

Ответ на этот вопрос кажется тривиальным.

Давайте посмотрим в Федеральный закон «Об информации, информационных технологиях и о защите информации» от 27.07.2006 N 149-ФЗ. Он говорит, что “информационная система — совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств”.

Определение очень общее, как и полагается ему быть в законе.

Можно посмотреть определение и в классической теперь книжке «Глоссарий по информационному обществу». Там информационная система определяется, вслед за М.Р. Когаловским, как система, обеспечивающая «поддержку динамической информационной модели некоторой части реального мира для удовлетворения информационных потребностей пользователей».

Тоже очень общее определение со своими плюсами и минусами.

Пожалуй, понимание того, что обычно люди представляют себе под словами «информационная система», проще всего получить, просто вбив это словосочетание в поисковую строку. Вот какую картинку первой, выдает Гугл на этот вопрос (Рис. 1).

Рис. 1

Б.А. Позин на конференции отметил, что именно с этой картинки он и начинает свои лекции по информационным системам. Таким образом, она хорошо отражает массовое представление о том, что собой представляет «обычная информационная система»:

  • есть группировка серверов. Вероятно, на ней крутится какая-то база данных и программная система;
  • группировка подсоединена к сети;
  • через эту сеть подключены и рабочие станции/лаптопы, через которые, видимо, пользователи вводят в систему какую-то информацию. Информационная система эту информацию перерабатывает и выводит обратно на компьютеры;
  • также доступ к информации в информационной системе можно получить, возможно частично, через мобильные телефоны и планшеты;
  • какая-то часть информации может вводиться и выводиться через оконечные устройства типа сканнеров или принтеров.

Картина более чем знакомая. Такие информационные системы везде.

Уважаемый венчурный капиталист Джерри Чен, к слову, проработавший 10 лет вице-президентом VMWare, в свежей статье дает следующую таксономию информационных систем (Рис. 2).

Рис. 2

В нижней части картинки — учетные системы: CRM, HRM, ERP, ITSM. В верхнюю он выносит системы, обеспечивающие интерфейс учетных систем с конечным пользователем. Все логично.

Посмотрим на информационные системы еще с одной стороны — требований, предъявляемых к ним. Вот типичный список требований к системе учетного типа (автоматизации управления финансами), Таблица 1.

Таблица 1

Таким образом, предъявляемые к такой системе требования выражаются в списке функций/возможностей системы. Система оценивается по наличию в ней таких возможностей и, возможно, удобству их использования. Вопрос того, насколько эффективно эти возможности использованы, остается за скобками и определяется качеством внедрения системы в организации — равно как и вопрос эффективности самой системы.

Информационные системы вчера

Но так было не всегда.

Для того чтобы убедиться в этом, обратимся к классической книге предыдущей эпохи информационных технологий — В.Г. Репин, Г.П. Тартаковский «Статистический синтез при априорной неопределенности и адаптация информационных систем», М. Советское радио, 1977.

Возможно, для некоторых читателей фамилии покажутся незнакомыми, а название заумным. Поэтому позволю себе дать сверхкраткую историческую справку. В.Г. Репин и его учитель Г.П. Тартаковский создали теоретические основы советской системы противоракетной обороны (ПРО). Это происходило сначала на Алмазе (КБ-1), а потом в выделенном из него Вымпеле, где Репин стал Генеральным Конструктором и главным конструктором Системы предупреждения о ракетном нападении (СПРН) и Системы контроля космического пространства (СККП).

В первой главе этой книги «Информационные системы, их синтез и адаптация», в ее первом разделе авторы дают свое определение информационной системы:

Глава 1

ИНФОРМАЦИОННЫЕ СИСТЕМЫ, ИХ СИНТЕЗ И АДАПТАЦИЯ

1.1. ИНФОРМАЦИОННЫЕ СИСТЕМЫ

В книге рассматривается широкий класс систем, которые можно назвать информационными. К ним будем относить динамические системы, выполняющие свои функции на основе использования некоторой информации о событиях, ситуациях, процессах и т. д., происходящих вне рассматриваемых систем либо в самих системах. (В последнем случае информация поступает от датчиков внутренних состояний системы.)

Это определение уже существенно отличается по смыслу от предыдущих, но еще более важно замечание, которое они делают через параграф:

Для информационных систем характерно наличие случайных входных воздействий. Это объясняется двумя факторами. Во-первых, когда мы говорим о поступлении некоторой информации на входы системы, то при этом подразумеваем, что те или иные сведения, закодированные во входных сигналах, или величины, превращенные в параметры этих сигналов, заранее неизвестны.

И здесь кроется уже гигантское различие с теми системами, которые мы обсуждали в предыдущем разделе. В отличие от привычных и наиболее распространенных сейчас информационных систем учетно-транзакционного типа, информационные системы предыдущей эпохи:

  • работали с непрерывными данными, имеющими случайную компоненту;
  • не были нацелены на хранение всех получаемых сигналов;
  • не были ориентированы на ручной ввод данных операторами.

Естественно, когда я говорю про то, что в одну эпоху системы были одни, а в другую — другие, не означает стопроцентного соответствия. В каждую эпоху строились самые разные системы; речь в первую очередь о том, где происходил рост и на что были направлены преимущественные усилия инженерного сообщества.

Еще более поучительна таксономия информационных систем, приводимая ими в этом разделе. «Информационные системы <…> можно относить к разным классам. Приведем самые распространенные из них» (курсив мой — Н.М.)

1. Системы оценки некоторых величин, закодированных во входных сигналах. Оцениваемые величины могут быть скалярными или векторными либо представлять собой функции времени, пространственных координат или любых других независимых переменных. К этому классу относятся системы, устройства, приборы, предназначенные для всевозможных физических и других измерений. Сюда относятся системы, осуществляющие фильтрацию реализаций случайных процессов из их смесей с мешающими случайными процессами; системы прогнозирования значений случайных величин или процессов, экстраполяции и интерполяции этих значений. Ясно, что данный класс охватывает весьма большое число всевозможных систем, существующих в природе, а также создаваемых человеком в процессе развития разнообразных областей техники. Характерной особенностью здесь является то, что случайные величины, в которых заложена информация, описываются непрерывными распределениями вероятностей.

2. Системы проверки некоторых фиксированных гипотез, информация о которых заложена во входных сигналах. Гипотезы эти могут быть двух- и многоальтернативными, простыми (не зависящими от дополнительных случайных или неизвестных факторов) и сложными. Физический смысл этих гипотез может быть самым разнообразным. К этому классу относятся, в частности, различные системы обнаружения сигналов в шумах и помехах. Это системы обнаружения объектов на основе приема создаваемых ими излучений различных диапазонов электромагнитных волн (световые, инфракрасные, радиоволны и т. д.); системы обнаружения, использующие радио- и лазерные локаторы, гидроакустические приборы и др.

Еще более широкой разновидностью систем, осуществляющих проверку гипотез, являются системы распознавания образов или, что то же, классификаторы различных ситуаций, процессов, объектов наблюдения. Можно привести огромное количество примеров, относящихся к распознаванию образов и имеющих отношение к разнообразным явлениям природы, видам человеческой деятельности, техническим системам различных назначений. Достаточно упомянуть, например, медицинскую диагностику заболеваний на основе наблюдения случайных признаков, принимающих те или иные значения у больных; распознавание объектов на основе анализа отраженных от них радиолокационных сигналов; распознавание людей по их голосам или почерку; выявление скрытых дефектов в металлических изделиях на основе анализа рассеянных ими радиационных облучений; определение видов животных по остаткам их костей и т. д.

3. Системы проверки гипотез совместно с оценкой параметров сигналов или объектов наблюдения, соответствующих проверяемым гипотезам. Это, например, системы радиолокационного обнаружения объектов с определением их числа и измерением координат; системы различения видов передаваемых сигналов с целью извлечения информации, закодированной в их параметрах; диагностика заболеваний с измерением параметров, от величин которых зависит применение тех или иных способов лечения, и др. При функционировании систем этого класса существуют некоторые величины, описываемые дискретными распределениями вероятностен, либо ситуации, различающиеся видами распределений вероятностей для соответствующих им сигналов, а также неизвестные параметры в связи с каждой такой ситуацией, описываемые непрерывными распределениями.

4. Системы управления различными объектами, наблюдениями или экспериментами. В первом случае существует объект, функционирование которого зависит от параметров, называемых управлениями, их значения определяются информацией о качестве выполнения объектом его функции, заложенной в случайных сигналах, поступающих по некоторым каналам. Управления выбираются для улучшения качества выполнения функций или, что то же, принятия решений.

Во втором случае наблюдаются сигналы, статистически зависящие не только от информативных параметров, в связи с которыми должны быть приняты определенные решения, но и от дополнительных выбираемых параметров — управлений. Последние выбираются системой так, чтобы обеспечить наилучшие качества принятия решения.

5. Сложные или, как еще иначе говорят, большие системы, состоящие из большого числа частей, разобщенных в пространстве и времени и выполняющих разные функции на основе многообразных критериев качества. В эти функции входят и проверки гипотез, и оценки параметров, и фильтрация процессов, и управление объектами, процессами и наблюдениями. В целом такой системой выполняется некоторая единая комплексная функция (выносится комплексное решение), на качество выполнения которой влияют частные решения, принимаемые частями системы.

К таким системам может быть отнесена система народного хозяйства государства, система обороны и т. д.

Я почти без купюр привел такую длинную цитату в том числе и для того, чтобы убедить вас — хотя авторам, несомненно, и известны учетные системы, но они не перечисляют их среди наиболее распространенных типов систем.

Различие с современной таксономией ожидаемо, очевидно и разительно.

Итак, первый важнейший вывод данной статьи: в некоторый момент, примерно в 1980 году, произошла революция, фазовый переход в том, как люди представляют информационные системы. Эта революция обуславливалась появлением и распространением миникомпьютеров и персональных компьютеров, появлением технологий реляционных баз данных и технологий локальных и глобальных сетей. В этот момент представление о «типичной» информационной системе изменилось

  • с обработки непрерывных сигналов датчиков и инструментов — на обработку ручного ввода пользователей
  • с принятия решения системой — на отчеты пользователю системы
  • с обработки данных и принятия решений — на хранение данных

В принципе, все в индустрии знают, что когда-то тогда произошла некая революция в ИТ. Но она в массовом сознании заслонена более свежими, хотя и существенно менее глубокими изменениями, связанными с распространением сначала просто интернета, а потом — мобильного интернета и мобильных устройств. Хотя каждое из этих изменений критически важное, оно не изменяло смысла информационных систем и общего подхода к их построению, а в первую очередь расширяло группы процессов и бизнесов, к которым такие учетные и интерфейсные информационные системы можно применить за счет повышения доступности компьютеров и сетей.

Итак, мы тридцать лет прожили в одной парадигме информационных систем. Почти не осталось людей, которые сталкивались с системами предыдущей парадигмы, а тем паче их разрабатывали. Она фактически забыта.

Информационные системы завтра

И вот, по всей видимости, подобная революция, или, как мы скоро увидим, скорее, контрреволюция, происходит сейчас.

Рис. 3

Если мы посмотрим на гартнеровские кривые ажиотажа по поводу новых технологий (Gartner’s Hype Cycle for Emerging Technologies — на момент написания данной статьи самой свежей была версия 2016 года), то увидим, что 9 из 35 технологий на кривой 2016 года (Рис.3), (Autonomous Vehicles, Machine Learning, Cognitive Expert Advisors, Smart Robots, IoT platforms, Commercial UAVs, Affective computing, Personal Analytics и General Purpose Machine Intelligence) и 8 из 35 технологий на кривой 2015 года (Рис. 4) имеют важную общую особенность, будучи применены в информационной системе.

Рис. 4

Объясню ее на примере информационной системы на основе машинного обучения, в разработке которой моей компании NTR Lab довелось поучаствовать несколько лет назад. http://crossss.ru/ является сервисом персонализованных рекомендаций для интернет-магазинов.

Целью внедрения такого сервиса интернет-магазином является повышение его прибыли на одного посетителя (при условии фиксированной маркетинговой стратегии). Оптимизация такого показателя требует знания прибыли по каждому товару, в том числе, в зависимости от объема (в случае крупного ритейлера это означает включение данных по категорийному менеджменту). Такие данные нередко являются конфиденциальными и внешнему сервису не передаются. Поэтому подобные сервисы обычно оптимизируют одну из прокси-функций прибыли на посетителя — оборот на посетителя или конверсию.

Таком образом, клиент для выбора информационной системы подобного рода проводит сравнение не списка функций двух информационных систем, а их A/B тест в отношении одной из целевых функций, Рис.5.

Рис. 5

Та система, которая статистически значимо показывает лучший результат, и должна быть использована.

Таким образом, мы можем заметить, что технологии развиваются по спирали и сущность информационных систем нового класса не в модных словах (глубокое машинное обучение, интернет вещей и т.п.) а в том, что каждая такая система имеет небольшое количество хорошо измеримых в терминах бизнеса результатов оптимизации определенных процессов.

Если говорить о развитии по спирали чуть более подробно, то можно сказать, что в части получения данных информационные системы развивались:

  • от небольшого количества непрерывных/шумных данных, специально подготавливаемых для системы внешними устройствами (например, данные радара);
  • к дискретным данным, вводимым людьми;
  • и снова к непрерывным данным, в огромном количестве собираемым из источников общего рода.

В части целей функционирования информационной системы:

  • от принятия решений;
  • к информированию;
  • и опять к автономному принятию решений без участия человека и на масштабах объемов и скоростей, недоступных человеку.

В части способов оценки эффективности системы:

  • от явных критериев эффективности, основанных на статистических выводах;
  • к неявным критериям эффективности;
  • и снова к явным, статистически значимым критериям эффективности.

Как заметил в обсуждении выступления на мини-конференции ФОСТАС Григорий Циперман, это можно рассматривать, как подтверждение закона отрицания отрицания:

  1. На первом этапе развития ВТ, когда вычислительные средства были дороги и не могли иметь широкого распространения, их имело смысл применять только в самых критических случаях, где человек не мог справляться. Это системы реального времени, к которым относятся и диспетчерские системы, в т.ч. и системы ПВО. Применять средства ВТ в учетных системах было безумием, разве что, в системах государственного управления.
  2. Развитие средств ВТ и их удешевление, появление мини- и персональных компьютеров сделало возможным применение компьютеров для учетных систем. Отсюда и миграция понятий: системы управления информацией переместились именно к учетно-транзакционным и аналитическим системам, которые стали доминировать и узурпировали название информационных систем, отодвинув в особую нишу сложные стохастические системы.
  3. Наконец, дальнейшее развитие ВТ открыло доступ к системам, основанным на Big Data/интернете вещей и им подобным, в которых вероятностные методы играют ключевую роль.

Заметим, что в результате предыдущей революции советская школа информационных систем потеряла свою позицию мирового лидера. В ходе новой революции есть небольшой и отчасти призрачный, но шанс эту позицию восстановить.

Статья является переработанным вариантом выступления на юбилейной мини-конференции, посвященной 15-летию фонда ФОСТАС.

Москва. 25 апреля 2017 года.