Ученые создали компанию, где все сотрудники – ИИ: догадайтесь, что пошло не так
«Машины не придут за вашей работой в ближайшее время».

Если вы волновались, что сингулярность искусственного интеллекта возьмет на себя всю работу и оставит вас на улице, то теперь можете вздохнуть с облегчением, ведь в ближайшее время искусственный интеллект не придет за вашей карьерой. Не потому, что не хочет, а потому, что буквально не может, рассказывает Futurism.
В недавнем эксперименте исследователи из Университета Карнеги-Меллона укомплектовали фальшивую софтверную компанию ИИ-агентами — моделью искусственного интеллекта, предназначенной для самостоятельного выполнения задач, — и результаты оказались до смешного хаотичными.
Симуляция, получившая название TheAgentCompany, была полностью укомплектована искусственными работниками от Google, OpenAI, Anthropic и Meta. Они выполняли роли финансовых аналитиков, инженеров-программистов и менеджеров проектов, работая вместе с симулированными коллегами, такими как фальшивый отдел кадров и главный технический директор.
Чтобы увидеть, как модели работают в реальной среде, исследователи поставили задачи, основанные на повседневной работе реальной компании, занимающейся разработкой программного обеспечения. Разные агенты искусственного интеллекта перемещались по каталогам файлов, виртуально осматривали новые офисные помещения и писали отзывы о работе инженеров-программистов на основе собранных отзывов.
Как впервые сообщил Business Insider, результаты оказались неутешительными. Наиболее эффективной оказалась модель Claude 3.5 Sonnet от Anthropic, которая изо всех сил пыталась выполнить лишь 24 % порученных ей задач. Авторы исследования отмечают, что даже такая мизерная продуктивность является непомерно дорогой: в среднем почти 30 шагов и более 6 долларов за задачу.
Тем временем Gemini 2.0 Flash от Google в среднем тратил 40 шагов на одну задачу, но имел лишь 11,4 % успеха — второй показатель среди всех моделей. Худшим работником с искусственным интеллектом оказался Nova Pro v1 от Amazon, который выполнил лишь 1,7 % задач, потратив на это в среднем почти 20 шагов.
Исследователи пишут, что агенты страдают от нехватки здравого смысла, слабых социальных навыков и плохого понимания того, как ориентироваться в интернете.
Боты также боролись с самообманом — преимущественно создавая ярлыки, которые приводят к полному провалу работы.
«Например, во время выполнения одной задачи агент не может найти нужного человека, чтобы задать вопрос в [чате компании]. В результате он решает создать быстрое решение, переименовав другого пользователя в имя нужного пользователя», — пишет команда Carnegie Mellon.
Хотя агенты искусственного интеллекта, как сообщается, могут хорошо выполнять некоторые небольшие задачи, результаты этого и других исследований показывают, что они явно не готовы к более сложным задачам, в которых люди достигают успеха. Основной причиной этого является то, что наш нынешний «искусственный интеллект», вероятно, все еще является лишь усовершенствованным расширением предиктивного текста вашего телефона, а не живым интеллектом, который может решать проблемы, учиться на прошлом опыте и применять этот опыт в новых ситуациях, подчеркивает издание.
«Это все к тому, что машины не придут за вашей работой в ближайшее время — несмотря на то, что утверждают крупные технологические компании», — подытоживает Futurism.
Больше новостей читайте на GreenPost.







