Ученые создали компанию, где все сотрудники – ИИ: догадайтесь, что пошло не так

«Машины не придут за вашей работой в ближайшее время».

Эко

Сергей Коваленко3 мин на прочтение05 Мая 2025, 21:26

Изображение сгенерировано ИИ

Если вы волновались, что сингулярность искусственного интеллекта возьмет на себя всю работу и оставит вас на улице, то теперь можете вздохнуть с облегчением, ведь в ближайшее время искусственный интеллект не придет за вашей карьерой. Не потому, что не хочет, а потому, что буквально не может, рассказывает Futurism.

В недавнем эксперименте исследователи из Университета Карнеги-Меллона укомплектовали фальшивую софтверную компанию ИИ-агентами — моделью искусственного интеллекта, предназначенной для самостоятельного выполнения задач, — и результаты оказались до смешного хаотичными.

Симуляция, получившая название TheAgentCompany, была полностью укомплектована искусственными работниками от Google, OpenAI, Anthropic и Meta. Они выполняли роли финансовых аналитиков, инженеров-программистов и менеджеров проектов, работая вместе с симулированными коллегами, такими как фальшивый отдел кадров и главный технический директор.

Чтобы увидеть, как модели работают в реальной среде, исследователи поставили задачи, основанные на повседневной работе реальной компании, занимающейся разработкой программного обеспечения. Разные агенты искусственного интеллекта перемещались по каталогам файлов, виртуально осматривали новые офисные помещения и писали отзывы о работе инженеров-программистов на основе собранных отзывов.

Как впервые сообщил Business Insider, результаты оказались неутешительными. Наиболее эффективной оказалась модель Claude 3.5 Sonnet от Anthropic, которая изо всех сил пыталась выполнить лишь 24 % порученных ей задач. Авторы исследования отмечают, что даже такая мизерная продуктивность является непомерно дорогой: в среднем почти 30 шагов и более 6 долларов за задачу.

Тем временем Gemini 2.0 Flash от Google в среднем тратил 40 шагов на одну задачу, но имел лишь 11,4 % успеха — второй показатель среди всех моделей. Худшим работником с искусственным интеллектом оказался Nova Pro v1 от Amazon, который выполнил лишь 1,7 % задач, потратив на это в среднем почти 20 шагов.

Исследователи пишут, что агенты страдают от нехватки здравого смысла, слабых социальных навыков и плохого понимания того, как ориентироваться в интернете.

Боты также боролись с самообманом — преимущественно создавая ярлыки, которые приводят к полному провалу работы.

«Например, во время выполнения одной задачи агент не может найти нужного человека, чтобы задать вопрос в [чате компании]. В результате он решает создать быстрое решение, переименовав другого пользователя в имя нужного пользователя», — пишет команда Carnegie Mellon.

Хотя агенты искусственного интеллекта, как сообщается, могут хорошо выполнять некоторые небольшие задачи, результаты этого и других исследований показывают, что они явно не готовы к более сложным задачам, в которых люди достигают успеха. Основной причиной этого является то, что наш нынешний «искусственный интеллект», вероятно, все еще является лишь усовершенствованным расширением предиктивного текста вашего телефона, а не живым интеллектом, который может решать проблемы, учиться на прошлом опыте и применять этот опыт в новых ситуациях, подчеркивает издание.

«Это все к тому, что машины не придут за вашей работой в ближайшее время — несмотря на то, что утверждают крупные технологические компании», — подытоживает Futurism.

Больше новостей читайте на GreenPost.

Актуально

Почему искусственный интеллект не может заменить врача

Минцифры запускает государственную инфраструктуру для искусственного интеллекта

Ученые назвали напиток, который увлажняет организм лучше обычной воды

Новая эра ферментов: алгоритм создает белки с невиданной эффективностью