ИИ с треском провалил тест для определения интеллекта

ИА БайкалИнформ

26.03.2025 17:00

Тест ARC-AGI-2 для оценки интеллектуальных способностей ИИ-моделей продемонстрировал огромный разрыв между возможностями современных технологий и человеческим интеллектом, пишет hightech.fm. Модели, такие как o1-pro и R1, набрали не более 1,3%, в то время как люди показали результат в 60%.

Фонд Arc Prize Foundation, который создал этот тест, разработал серию головоломок, в которых ИИ должен анализировать визуальные закономерности, решая задачи на основе разноцветных квадратов. В отличие от предыдущих тестов, ARC-AGI-2 не позволяет моделям использовать прошлый опыт, заставляя их адаптироваться к новым задачам.

В тестировании участвовало более 400 человек, которые в среднем правильно ответили на 60% заданий. Это значительно превышает результаты ИИ, что подтверждает огромный разрыв в решении задач, требующих адаптации и понимания новых концепций.

Шолле, соучредитель Arc Prize Foundation, объяснил, что ARC-AGI-2 является более точным индикатором реального интеллекта ИИ, чем предыдущий тест ARC-AGI-1. В новой версии была исключена возможность решения задач с помощью «метода грубой силы», при котором ИИ использует огромные вычислительные мощности для перебора всех возможных вариантов. Для этого была введена метрика эффективности, которая вынуждает ИИ «на лету» интерпретировать паттерны, а не полагаться на запоминание.

Тест ARC-AGI-1 был основным в течение пяти лет, пока в декабре 2024 года OpenAI не представила модель o3, которая продемонстрировала достижения, сравнявшиеся с человеческим уровнем. Однако, как оказалось, эти результаты были достигнуты за счет значительных вычислительных затрат.

В ответ на растущие опасения о недостаточной объективности критериев для оценки ИИ, Arc Prize Foundation объявила о запуске конкурса Arc Prize 2025. Участники должны будут достичь 85% точности на ARC-AGI-2, при этом не затратив более $0,42 на решение каждой задачи.

Ещё кое-что о науке:

Новости о всякой всячине

Метки:

Последние публикации

Видеосюжеты

Сергей Шмидт: Срок

Next Prev

Уроки советского

Я давным-давно живу в соответствии с мудрым принципом, подсказанным одним старшим товарищем: «Если ты не можешь ничего изменить, ты должен попытаться хотя бы понять». У меня даже футболка с этими словами есть, специально заказал и надеваю, если предстоит общение с какими-нибудь фрустрированными по политике балагурами.

Борец с ветряными иблисами

Перелома на полях сражений за минувший месяц не произошло – ни решительного, ни коренного. Позволю себе, чуть ли не в первый раз за боевой год, написать о делах внутренних, а не боевых и внешнеполитических. Репертуар внутриполитических тем у нас не такой уж богатый и, на мой вкус, одна из...

Рождение нации из грохота пушек

Год минул. В Лужниках состоялось хоровое пение Цоя. Я немного удивился, что пели «Группу крови». Думал, что «Звезду по имени Солнце» с необходимыми правками:

Танки идут ромбом

Январская история с «Леопардами» – довольно интересный сюжет, как на тему замысловатости политической жизни в демократиях, так и на тему взаимодействия внутренней и внешней политики. Канцлер Шольц по причинам, которые могут быть самыми разными, танки Украине давать не хотел. Но министр иностранных дел его правительства – госпожа Анналена Бербок, которую...

Знак беды — знак вопроса

Видит бог, я из тех мелких жуликов от гуманитаристики, прячущихся под якобы солидной вывеской «политолог», что совершенно не стесняются полного провала своей аналитики и прогнозов. В моей «политологической» жизни таких суперпровалов было два и 2022-й год один из них. Моя годичной давности уверенность в том, что никакого перевода отношений России...

ПОГОДА В ИРКУТСКЕ

Если вы дожили до 70, то вам запрещено это делать: срочно читать

Новости органов власти

Новости компаний