Google наделила роботов «внутренним голосом»

ИА БайкалИнформ   
05.07.2025 17:00

Google DeepMind подала патентную заявку на систему, которая наделяет роботов способностью к внутреннему монологу — описанию увиденного на естественном языке. Это позволяет роботам быстрее обучаться новым задачам, наблюдая за действиями людей. Об этом пишет hightech.fm.

Кадр: YouTube /  Our Future STRONG
Кадр: YouTube / Our Future STRONG

Технология работает так: робот смотрит видео или изображение, где человек выполняет действие (например, поднимает чашку), и «внутренне проговаривает» — «человек поднимает чашку». Это связывает визуальные данные с речевыми описаниями и помогает лучше запоминать и воспроизводить действия — даже с незнакомыми объектами и без предварительного обучения.

Такой внутренний монолог помогает роботам сопоставлять визуальные данные с речевыми описаниями, что значительно улучшает их способность понимать и запоминать правильные действия при столкновении с похожими объектами.

Главное преимущество системы заключается в том, что она поддерживает обучение «с нуля»: роботы могут выполнять задачи с незнакомыми объектами без предварительного обучения.

DeepMind отмечает, что метод снижает требования к объему памяти и вычислительной мощности, необходимой для обучения роботизированных систем. Добавление внутренней речи обеспечивает роботам контекст, позволяя им принимать обоснованные решения и адаптироваться к новым ситуациям.

Проект развивается параллельно с другим направлением DeepMind — автономной моделью Gemini Robotics On-Device, представленной на прошлой недели. Она работает без облака и подходит для задач с минимальными задержками. Эта «стартовая модель» учится по 50–100 демонстрациям и работает даже на устройствах с ограниченной связью.

Ещё кое-что из новостей прогресса:

Новости о всякой всячине

 

Сергей Шмидт - серия колонок

Видеосюжеты
Сергей Шмидт: Срок