Российская технология распознавания речи группы компаний ЦРТ Сбербанка признана лучшей в мире
Ольга Шарипова
12.05.2020 22:10
Технология сегментирования аудиопотока (диаризации) и распознавания речи, созданная группой компаний ЦРТ (входит в экосистему Сбербанка), признана лучшей на международном конкурсе CHiME Speech Separation and Recognition Challenge (CHiME-6).
Высокое признание технология получила за распознавание английской речи с нескольких микрофонов в условиях естественной обстановки.
Как сообщает пресс-служба Сбербанка, группа ЦРТ показала наилучшие результаты тестов в самой сложной задаче конкурса, значительно превзойдя конкурентов.
Организаторы CHiME предлагают сильнейшим командам со всего мира различные задачи, которые с каждым новым конкурсом усложняются. На CHiME-5, конкурсанты решали так называемую cocktail party problem – распознавание спонтанной речи нескольких дикторов в условиях частичного наложения речи и шума, то есть в типичной ситуации общения на вечеринке. Этот блок требовал работы с сегментированной (уже выделенной) речью. Новизна и особенность CHiME-6 заключалась в том, что впервые в истории конкурсантам было предложено решить аналогичную проблему, но работая с несегментированной речью, при этом – с перекрытием речи до 20%. Именно на решении этой – самой сложной – задачи сфокусировалась команда ЦРТ.
Записи для конкурса были сделаны на 20 ужинах в реальных домах на вечеринках, где люди готовили, ели, мыли посуду, свободно и эмоционально общались, шутили и смеялись. Распознавание речи здесь осложняет одновременная речь 2-4 человек, реверберация и интенсивный шум: звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех.
Цель участников – создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок. Команда группы ЦРТ заняла первое место.
Для этого был разработан уникальный алгоритм выделения речевых сегментов для каждого из дикторов, а также создан комплекс из нескольких нейронных сетей разных архитектур, различающий разных дикторов, реализующий бимформинг (эффект нацеливания микрофонов на конкретного диктора) и непосредственно распознающий речь.
Кроме группы ЦРТ в конкурсе участвовали научные команды со всего мира: и известные IT-компании (Toshiba и ряд других), и крупные университеты-лидеры в области речевых технологий: Университет Джонса Хопкинса (США), Университет науки и технологии Китая, Технический университет Брно (Чехия) и др.
– Группа ЦРТ уже 30 лет создает, развивает и совершенствует речевые технологии. В этом году на CHiME-6 впервые в истории стояла самая сложная задача – работа с несегментированной речью. Качественное распознавание речи разных дикторов, при этом перебиваемой шумами, позволяет выводить сервисы из разряда инновационных в повседневное применение, совершенствуя бизнес и упрощая нашу жизнь, – отметил генеральный директор группы компаний ЦРТ Дмитрий Дырмовский.
Он заявил, что качественная обработка несегментированной речи позволит, к примеру, вести грамотное протоколирование совещаний, где говорит сразу несколько спикеров, а интеллектуальная речевая аналитика позволит автоматизировать работу контактных центров: распознавать спонтанную речь, классифицировать голосовые обращения, выявлять соблюдения скрипта, делать выводы об удовлетворенности клиента и качестве диалога, а значит – существенно оптимизировать работу современных контакт-центров ретейла, e-commerce и телеком.
– Признание группы ЦРТ в этом международном конкурсе – не просто наша личная победа, но знаковое событие для всей индустрии, и мы рады выводить решение задач в области распознавания речи, над которыми работают сильнейшие команды со всего мира, на новый уровень, достойно представляя свои ключевые компетенции на глобальном рынке, – продолжил Дмитрий Дырмовский.
– Задача CHiME – обеспечить обмен опытом сильнейших команд со всего мира и продвинуть вперед решение глобальных задач в области распознавания речи. И мы приветствуем достижения группы компаний ЦРТ в этой области, – выразил свое мнение представитель Университета Шеффилд, участник организационного комитета CHiME Challenge Джон Баркер.
Теперь покупатели сети магазинов «М.Видео» и «Эльдорадо» смогут оплатить свои покупки улыбкой, без карты или смартфона. Клиенты Сбера могут оплачивать покупки как картой Сбера, так и картами других банков, сообщает пресс-служба Сбербанка.
Теперь бизнес может воспользоваться всеми преимуществами нейросетевой модели отСбера – GigaChat MAX. На сегодняшний день, это самая мощная модель в России и одна из сильнейших моделей мира, по данным независимого бенчмарка MERA. Об этом сообщает пресс-служба Сбера.
2 декабря стартует «Новогодний марафон» – традиционная благотворительная акция, в которой участвуют сотрудники компаний РУСАЛ и Эн+, а также городские команды волонтеров.
В этом году благотворительный фонд «Центр социальных программ РУСАЛа» отмечает юбилей – уже 20 лет благодаря его поддержке меняются и получают развитие города ответственности компании.
Я давным-давно живу в соответствии с мудрым принципом, подсказанным одним старшим товарищем: «Если ты не можешь ничего изменить, ты должен попытаться хотя бы понять». У меня даже футболка с этими словами есть, специально заказал и надеваю, если предстоит общение с какими-нибудь фрустрированными по политике балагурами.
Перелома на полях сражений за минувший месяц не произошло – ни решительного, ни коренного. Позволю себе, чуть ли не в первый раз за боевой год, написать о делах внутренних, а не боевых и внешнеполитических. Репертуар внутриполитических тем у нас не такой уж богатый и, на мой вкус, одна из...
Год минул. В Лужниках состоялось хоровое пение Цоя. Я немного удивился, что пели «Группу крови». Думал, что «Звезду по имени Солнце» с необходимыми правками:
Январская история с «Леопардами» – довольно интересный сюжет, как на тему замысловатости политической жизни в демократиях, так и на тему взаимодействия внутренней и внешней политики. Канцлер Шольц по причинам, которые могут быть самыми разными, танки Украине давать не хотел. Но министр иностранных дел его правительства – госпожа Анналена Бербок, которую...
Видит бог, я из тех мелких жуликов от гуманитаристики, прячущихся под якобы солидной вывеской «политолог», что совершенно не стесняются полного провала своей аналитики и прогнозов. В моей «политологической» жизни таких суперпровалов было два и 2022-й год один из них. Моя годичной давности уверенность в том, что никакого перевода отношений России...
Мы используем файлы cookies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с нашей Политикой в отношении обработки персональных данных, изложенной здесь.