Науковці створили компанію, де всі співробітники — ШІ: здогадайтеся, що пішло не так

«Машини не прийдуть за вашою роботою найближчим часом».

Еко

Сергій Коваленко3 хв на прочитання05 Травня 2025, 20:39

Зображення згенеровано ШІ

Поділитись:

Якщо ви хвилювалися, що сингулярність штучного інтелекту перебере на себе всю роботу і залишить вас на вулиці, то тепер можете зітхнути з полегшенням, адже найближчим часом штучний інтелект не прийде за вашою кар'єрою. Не тому, що не хоче, а тому, що буквально не може, розповідає Futurism.

У нещодавньому експерименті дослідники з Університету Карнегі-Меллона укомплектували фальшиву софтверну компанію ШІ-агентами — моделлю штучного інтелекту, призначеною для самостійного виконання завдань, — і результати виявилися до смішного хаотичними.

Симуляція, що отримала назву TheAgentCompany, була повністю укомплектована штучними працівниками від Google, OpenAI, Anthropic і Meta. Вони виконували ролі фінансових аналітиків, інженерів-програмістів і менеджерів проектів, працюючи разом із симульованими колегами, такими як фальшивий відділ кадрів і головний технічний директор.

Щоб побачити, як моделі працюють у реальному середовищі, дослідники поставили завдання, засновані на повсякденній роботі реальної компанії, що займається розробкою програмного забезпечення. Різні агенти штучного інтелекту переміщалися по каталогах файлів, віртуально оглядали нові офісні приміщення та писали відгуки про роботу інженерів-програмістів на основі зібраних відгуків.

Як уперше повідомив Business Insider, результати виявилися невтішними. Найефективнішою виявилася модель Claude 3.5 Sonnet від Anthropic, яка з усіх сил намагалася виконати лише 24 % доручених їй завдань. Автори дослідження зазначають, що навіть така мізерна продуктивність є непомірно дорогою: в середньому майже 30 кроків і понад 6 доларів за завдання.

Тим часом Gemini 2.0 Flash від Google в середньому витрачав 40 кроків на одне завдання, але мав лише 11,4 % успіху — другий показник серед усіх моделей. Найгіршим працівником зі штучним інтелектом виявився Nova Pro v1 від Amazon, який виконав лише 1,7 % завдань, витративши на це в середньому майже 20 кроків.

Дослідники пишуть, що агенти страждають від браку здорового глузду, слабких соціальних навичок і поганого розуміння того, як орієнтуватися в інтернеті.

Боти також боролися з самообманом — переважно створюючи ярлики, які призводять до повного провалу роботи.

«Наприклад, під час виконання одного завдання агент не може знайти потрібну людину, щоб поставити запитання в [чаті компанії]. В результаті він вирішує створити швидке рішення, перейменувавши іншого користувача на ім'я потрібного користувача», — пише команда Carnegie Mellon.

Хоча агенти штучного інтелекту, як повідомляється, можуть добре виконувати деякі невеликі завдання, результати цього й інших досліджень показують, що вони явно не готові до складніших завдань, в яких люди досягають успіху. Основною причиною цього є те, що наш нинішній «штучний інтелект», імовірно, все ще є лише вдосконаленим розширенням предиктивного тексту вашого телефону, а не живим інтелектом, який може розв'язувати проблеми, вчитися на минулому досвіді та застосовувати цей досвід у нових ситуаціях, наголошує видання.

«Це все до того, що машини не прийдуть за вашою роботою найближчим часом — попри те, що стверджують великі технологічні компанії», — підсумовує Futurism.

Більше новин читайте на GreenPost.

Актуально

Чат-боти заохочують самогубство та імітують насилля

ШІ не замінив людей: компанії повертають звільнених працівників на роботу

Домашнім роботом NEO від 1X за $20 000 дистанційно керує людина

ChatGPT обмежує контент для підлітків