Не то, чем кажутся. Главные мифы о нейросетях

24 ноября 2021 2456 0

Источник: РБК.

Искусственный интеллект (ИИ) появился совсем недавно, но уже стал частью нашей жизни и избавил человека от многих рутинных задач. Например, благодаря технологии распознавания и синтеза речи люди могут быстрее получать информацию и решать разные проблемы. Несмотря на свою функциональность, нейросети обросли множеством стереотипов.

Вокруг искусственного интеллекта сформировалось несколько устойчивых мифов от апологетов и критиков технологии. Выясняем, как устроена работа нейросетей, в том числе лежащих в основе речевых технологий, в каких отраслях они помогают, чем интересна технология SmartSpeech от «Сбера» и способен ли ИИ обойтись без человека.

Миф №1. Нейросеть не совершает ошибок

Искусственный интеллект задумывался как идеальный компьютер, который позволит работать с огромными массивами данных, не совершая ошибок. Одним из важнейших этапов развития ИИ стала разработка нейросети. Так называют систему, которая работает по принципу человеческого мозга.

Ее строение напоминает нервную систему: нейросеть состоит из слоев, в каждом из которых находятся простые вычислительные элементы — «нейроны». Слой за слоем данные передаются по нейронам, пока искусственный интеллект не находит решение задачи.

В отличие от систем, основанных на правилах, нейросеть способна учитывать полученный опыт и при необходимости самостоятельно изменять параметры элементов «организма». Это помогает избежать ошибок, которые допускает человек из-за невнимательности.

В последнее время задачи для ИИ усложняются, и в процессе разработки нейросетей всплывают различные нюансы. При синтезе речи нейросеть может ошибаться с ударением. Это касается неоднозначных фраз, например «замок на замке» («замóк на зáмке» или «зáмок на замкé»). В этом случае, например, SmartSpeech отдаст предпочтение более распространенному — частотному — слову «замóк». В результате словосочетание будет озвучено как «замóк на замкé», что вряд ли соответствует задумке автора текста, однако это вполне можно предусмотреть.

Такие просчеты легко исправить, если указать ударения на те гласные, которые подразумевает контекст сообщения. Это можно сделать сразу в тексте, который будет синтезироваться. Такие нюансы важны при написании сценариев и создании интерактивного голосового меню (IVR).

Миф №2 . Нейросеть требует минимального обучения

Главное преимущество нейросетей перед традиционными машинными алгоритмами заключается в возможности обучения, в том числе самостоятельного. В этом же состоит слабая сторона технологии: чтобы нейросеть выполняла сложную задачу корректно, ее необходимо постоянно обучать. Для этого требуется огромный массив данных, который помогает ИИ понять, как обрабатывать задачу.

На этом этапе важно правильно спрогнозировать, какую информацию необходимо получить нейросети, а также проследить за качеством данных. Именно от качества исходного материала зависит, насколько точно в дальнейшем будет работать нейросеть.

Например, во время обучения сервиса распознавания и синтеза речи SmartSpeech от «Сбера» искусственному интеллекту дали обработать десятки тысяч часов аудиоданных на русском языке. Качество исходного материала удостоверили тем, что массив информации собирался, обрабатывался и размечался людьми вручную по специальному алгоритму.

Качество распознавания и синтеза речи SmartSpeech позволяет настраивать навигацию по сайтам и озвучивание текста без предварительной записи. Это значительно упрощает взаимодействие людей с интерфейсами, если человек не может ввести текст вручную или хочет прослушать информацию. Использовать эти функции можно даже в режиме реального времени.

Миф №3. Нейросеть — то же самое, что роботы

Нейросети действительно могут применяться в робототехнике. Правда, большинство роботов, которых сейчас используют в производстве и сфере услуг, лишены искусственного интеллекта. Они заранее запрограммированы, действуют на основе имеющихся алгоритмов и воспринимают действительность с помощью датчиков и исполнительных механизмов.

Подобные аппараты можно увидеть на многих заводах с конвейерной сборкой. По похожему принципу функционирует элементарное программное обеспечение, выполняющее большой объем задач по заданным алгоритмам.

Искусственный интеллект предполагает работу с более сложными процессами. Если на производстве достаточно раз и навсегда заданной последовательности действий, то для задач, связанных с принятием решений, прогнозированием, распознаванием объектов и анализом данных, этого недостаточно. Чтобы справиться со столь сложными действиями, потребуется человек. Или нейросеть. Сейчас нейросети используют в чат-ботах и голосовых интерфейсах, они же распознают номера машин и лица людей в системах видеонаблюдения или оплаты лицом.

В числе других технологий SmartSpeech работает в виртуальных ассистентах Салют, которые «живут» в умных устройствах Sber и приложении «СберБанк Онлайн». Благодаря распознаванию и синтезу речи ассистенты понимают голосовые запросы пользователей и могут произносить ответы.

Миф №4. Нейросеть оставит человека без работы

Стоит признать: технологии развиваются стремительно. Роботы давно помогают людям избавиться от выполнения рутинной ручной работы, однако заменить тех, чья работа не связана с ручным трудом, они вряд ли смогут. Зато сократят нагрузку и позволят сосредоточиться на более сложных задачах.

Современные нейросети помогают предсказывать пробки, прогнозировать расход сырья, рекомендовать контент и оптимизировать работу колл-центров. Например, IVR в колл-центре по номеру 900, используя технологии SmartSpeech, распознает речь, отвечает на рутинные запросы и тем самым разгружает операторов для более сложных обращений.

Миф №5. Нейросеть полностью возьмет на себя функцию общения с клиентом

К 2021 году чат-ботами обзавелось множество компаний, работающих в сфере услуг. Алгоритмы позволяют проконсультировать клиента в банке, записать на стрижку в салон красоты или на прием к врачу. Можно было бы решить, что наконец наступила эпоха, когда можно полностью переложить общение с клиентом на искусственный интеллект. Развитие сервисов распознавания и синтеза речи происходит столь стремительно, что подчас сложно сказать, происходит ли разговор с реальным человеком или с искусственным интеллектом.

Рано или поздно ИИ наверняка станет настолько умным, что сможет обработать любой клиентский вопрос и дать именно тот ответ, в котором нуждается человек. Но пока службы поддержки остаются незаменимыми для сложных случаев.

В ситуации, непредвиденной для нейросети, она переключает собеседника на клиентский отдел. Например, так поступает сервис SmartSpeech от «Сбера», умеющий распознавать не только суть вопроса, но и эмоции клиента. Они важны для анализа телефонных разговоров в целях повышения качества обслуживания клиентов.

Миф №6. Нейросеть может создавать произведения искусства

Все чаще в новостях появляются кричащие заголовки о том, как искусственный интеллект создал произведение искусства. В 2018 году пал последний бастион: на одном из наиболее именитых арт-аукционов Christie’s на продажу выставили портрет, написанный ИИ. Современные нейросети не только рисуют, но и пишут стихи, сочиняют киносценарии и создают музыку. А нейросеть ruDALL-E от «Сбера» умеет даже создавать картинки по описанию.

Активность нейросетей в творчестве объясняется их способностью быстро учиться и использовать имеющийся опыт. Дальше все зависит от их «учителя» и тех параметров, которые он задает. К примеру, искусственный интеллект способен математически обсчитывать технику живописцев и особенности музыки известных композиторов, а затем на основе собственного анализа генерировать усредненное произведение.

ИИ может приносить реальную пользу в искусстве: сейчас его задействуют для оценки подлинности картин знаменитых художников, а модели типа ruDALL-E можно применять для создания стоковых изображений и разных графических материалов.

Миф №7. Нейросеть приносит мгновенный результат в бизнесе

В конце 2020 года Huawei, TAdviser и «Техносерв» провели опрос 50 представителей российского среднего бизнеса из разных отраслей, от промышленности до ретейла. В ходе опроса выяснилось: 68% респондентов используют в работе искусственный интеллект. Представители реального бизнеса считают, что в дальнейшем эта доля будет расти, так как нейросети помогают оптимизировать работу.

Однако не стоит ожидать, что ИИ станет волшебной таблеткой. Во-первых, даже если определенные сервисы опробовали в конкретных сферах, понадобится время для обучения нейросети специфике бизнеса. Во-вторых, как и в случае с живыми специалистами, потребуется время, чтобы после первых проб и ошибок выйти на оптимальное решение.

Ситуация чуть проще с речевыми технологиями. По меркам нейросетей такие технологии вышли на рынок относительно давно, а их внедрение позволяет бизнесу эффективнее распределять нагрузку на персонал, экономить на аналитике и даже внедрять дополнительный функционал без больших затрат. Например, подключая озвучку интерфейсов или голосовой ввод на сайтах и в приложениях.

Не то, чем кажутся. Главные мифы о нейросетях

Вход для участников