Регистрация

Data Driven: как российские компании работают с данными

3 октября 2023 1952 0

Опыт ЦКИ РЖД, «Сбера», «Северстали», «Биовитрум», «Галамарта», ЦКИТ и «Наносемантики»

В рамках Конгресса «Подмосковные вечера» отдельная секция была посвящена работе с данными; спикеры рассказали на своем опыте, сколько данных требуется для принятия решения, и когда малые данные становятся большими. 

Ведущие секции Ренат Лашин (АРПП «Отечественный софт», Исполнительный директор) и Игорь Алтухов (Консультант, Развитие лидеров и команд) отметили актуальность темы — процессы, построенные на данных, имеют ряд преимуществ: управляемость, прозрачность и предсказуемость. На основе данных можно выстроить эффективную HR-аналитику, оптимизировать процесс закупок, найти «узкие» места при работе с клиентами, спрогнозировать бюджет и не только. 

Data Driven подход все чаще внедряется в компаниях различных отраслей. Но, как заметил Дмитрий Гуреев (Биовитрум, CDTO), запуск проектов по работе с данными всегда ведет к усложнению текущей системы. «У бизнеса возникает вопрос: зачем усложнять, если в Excel все есть? Но если хочешь принимать решения намного быстрее, то с данными нужно работать. В нашей компании мы оптимизировали процедуру закупок товаров на склад. Если раньше это требовало долгих манипуляций в таблицах, то сейчас мы всегда видим, что и в каком количество нужно закупить. Еще одно достижение команды в области работы с данными — внедрение BI-системы. Данные собираются из различных внутренних систем и из внешнего контура — смешивая их, мы создаем качественные аналитические срезы».

Тему необходимости работы с данными и перспективность этого направления продолжила Виктория Ефимова (Северсталь — ЦЕС, Руководитель центра бизнес-инноваций): «В “Северстали” утро начинается с просмотра дешбордов за чашкой кофе. Главным драйвером в вопросе работы с данными стал наш HR, который охотно ими делился и участвовал в пилоте и тестировании проекта». В своем выступлении Виктория осветила основные тренды работы с данными. Первое — создание единого для всех систем каталога метаданных с описанием готовых витрин данных, когда бизнес видит в одном месте всю нужную для проработки задачи информацию. Второе — использование технологий ML/NLP/NLU для создания цифровых помощников, которые смогут работать в разных направлениях бизнеса, а также использование генеративного ИИ для дополнения данных и обнаружения аномалий. Третье — обеспечение надежного и безопасного сбора информации с использованием отечественных программных решений. 

Станислав Ашманов (Наносемантика, Генеральный директор) подробнее рассказал о проектах, которые реализовала его команда. Так, например, компания занимается разработкой текстовых и голосовых виртуальных ассистентов, запускает проекты по распознаванию речи и видеоаналитике. «Все проекты по работе с данными можно легко просчитать на старте и оценить экономический эффект. Однако 80% успеха внедрения проекта зависит от качества данных: они должны быть действительно большими, точными и хорошо размеченными», — отметил Станислав. 

Евгений Нечепоренко (Сбербанк, Исполнительный директор по исследованию данных) рассказал о внедрении языковой модели, анализирующей пресс-релизы Центрального банка. Такой анализ, например, позволяет прогнозировать снижение или повышение процентных ставок. «Была задача — дать цифровую оценку неструктурированным текстам. На основе дерева синтаксического разбора мы реализовали правила извлечения тональности из текста». Как отметил в своем выступлении Евгений, тренд на большие языковые модели очевиден, для своей работы «Сбер» выбрал российскую платформу PolyAnalyst.

Кирилл Семион (ЦКИ РЖД, Начальник Департамента информатизации) поднял проблему, с которой РЖД столкнулась в процессе построения корпоративной системы управления данными — это вопрос культуры работы с данными: «К нам часто приходят с запросом: “Дайте свои данные”. Но потом мы получаем анализ зависимости чего-то от фазы Луны, утрирую, конечно. Но если вы хотите получить доступ к каким-либо данным, вы должны объяснить в терминах бизнес-показателей, зачем вам эти показатели нужны и как они влияют на бизнес».

Алексей Сученинов (Галамарт, Руководитель управления) в своем выступлении также обозначил одну из проблем работы с данными: «Только 5% собранных данных сохраняется для дальнейшего использования, примерно 70% данных собирается, но никогда не используется».  

Александр Тимофеев (ЦКИТ, Руководитель направления департамента по взаимодействию с институтами развития) рассказал про опыт классификации российского ПО: по отраслям (классам ОКВЭД), по количеству заключенных контрактов на это ПО и стоимости этих контрактов. Такой подход позволил структурировать российские решения, попадающие в реестр, по основным бизнес-показателям.

Все эксперты отметили, что данные сегодня — один из ключевых активов компании, и они требуют эффективного управления — стратегии Data Governance. В конечном итоге накопленные данные, как любой другой актив, должны работать на повышение общей результативности управления бизнесом.


Конгресс «Подмосковные вечера» — ежегодное мероприятие, организованное Клубом 4CIO, которое собирает руководителей компаний, разработчиков и представителей государственных структур с 2006 года. 

Цель Конгресса — обсудить тренды и проблемы развития ИТ-отрасли в России, помочь потребителям и поставщикам ИТ-решений достичь взаимопонимания, наметить пути развития. 

Подробнее о Конгрессе, секциях, спикерах смотрите в телеграм-канале Клуба 4CIO.

 

Нажимая на кнопку "Подписаться", Вы соглашаетесь с условиями Политики в отношении обработки персональных данных и даете согласие на обработку персональных данных