Професор Вартонської школи бізнесу Пенсильванського університету Ethan Mollick у дописі на платформі X від 25.04 зробив спостереження, яке сильно впливає на наукову спільноту: сучасні AI-agent уже можуть незалежно відтворювати складні результати академічних досліджень лише на основі публічно описаних методів і даних — без оригінальних статей і без вихідного коду. Далі Mollick зазначив, що коли AI-відтворені версії відрізняються від оригінальних статей, «помилки часто трапляються в самих людських текстах, а не в AI». Це є суттєвим поворотом у кризі відтворюваності досліджень у епоху генеративного AI: те, що раніше вимагало дорогих людських зусиль для перевірки колегами, тепер виконується AI у великих масштабах і з низькою вартістю.

Claude відтворює кілька статей, а потім GPT-5 Pro робить двічі перевірку

У своєму блозі OneUsefulThing та в цьому твіті Mollick описує конкретний експеримент із Claude: він дає Claude академічну статтю, щоб той відкрив архів, упорядкував файли, автоматично перетворив STATA-код для статистики на Python, а потім послідовно виконав усі висновки, наведені в статті. Після завершення роботи Claude він проводить другий раунд перевірки за допомогою GPT-5 Pro для того самого результату відтворення. Кілька статей тестувалися так само, і результати загалом були успішними — перешкоди виникали лише тоді, коли файли даних були надто великими або коли самі replication data мали проблеми.

Для наукової спільноти цей процес раніше зазвичай потребував того, щоб дослідницькі асистенти витрачали тижні або навіть місяці. Mollick описує часовий масштаб від одного дня до одного дня, а вартість виконання — лише токенові витрати комерційного LLM API.

Багато помилок — у людських першоджерелах, а не в AI

Більш суперечливим є те, як Mollick визначає, «хто винен». У своєму твіті він прямо заявив, що коли результати AI-відтворення не відповідають оригінальній статті, у більшості випадків це не помилка AI, а помилки в обробці даних у статті, неправильне використання моделі або вихід висновків за межі того, що підкріплюється даними. У психології, поведінковій економіці, менеджменті та інших соціальних науках за останнє десятиліття вже було кілька серйозних подій із кризами відтворюваності; найбільш відомий — велике відтворювальне дослідження Open Science Collaboration у 2015 році, в якому лише близько 36% результатів психологічних статей вдалося незалежно відтворити. AI-agent переносить межу перевірки з «потрібного підбору людських ресурсів» на «здатність виконуватися повсюдно».

Вчитися все ще забороняють AI в рецензування, а інституції відстають від техніки

У іншому твіті від 25.04 Mollick конкретно вказує на те, що найбільше в його галузі найбільше товариство — Академія менеджменту (Academy of Management) — досі чітко забороняє AI входити в процес рецензування рукописів. Він посилається на вже наявні дослідження, які показують, що AI-рецензування вже краще, ніж частина традиційних людських рецензентів, за точністю, узгодженістю та контролем упередженості, тому позиція «заборонити» може навпаки посилити збої в існуючих системах рецензування. Розрив між такими інституційними правилами та технологією — це політичне питання, з яким у найближчі 1–2 роки мають зіткнутися наукові видавництва, наукові товариства та фінансувальні організації.

Для читачів ця дискусія не обмежується академічною сферою. Коли AI-agent здатен у реальному часі перевіряти результати досліджень, у бізнес-середовищі посилання на дослідження, політичні звіти та академічні підстави в ухваленні фінансових рішень перейдуть у новий критерій перевірки — «чи витримують висновки незалежне AI-відтворення». Відповідаючи на доповнення в іншому твіті Mollick, він вважає, що уряд є єдиною одиницею, яка може поставити «якорь» для розробки правил перевірки, коли інтенсивність інструментів постійно зростає, — а складність політичного дизайну синхронно стане відносно непомітним головним напрямом у обговореннях AI-врядування.

Ця стаття: AI Agent уже може незалежно відтворювати складні академічні статті: Mollick називає, що більшість помилок — у людських першоджерелах, а не в AI. Вперше з’явилося в 鏈新聞 ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Worxphere перейменовує JobKorea, додаючи інструменти для найму на базі ШІ

AI Agent Інструменти та застосунки ШІ

Повідомлення Gate News, 26 квітня — Платформа з управління персоналом у Південній Кореї Worxphere перейменувала JobKorea, переходячи від традиційних онлайн-дошок вакансій до рішень для найму, керованих ШІ. Компанія об’єднує сервіси, зокрема JobKorea та Albamon, в єдину платформу, що охоплює постійну зайнятість, гіг-роботу та рекрутинг іноземних працівників.

GateNews6год тому

ОАЕ оголошують перехід до моделі AI-держави протягом наступних двох років

AI Agent Новини індустрії ШІ

Його Високість шейх Мохаммед бін Рашид Аль Мактум заявив, що метою було забезпечити роботу 50% державних секторів через автономний агентний ШІ. Перехід також включатиме навчання федеральних працівників, щоб «опанувати ШІ», і перебуватиме під наглядом шейха Мансура бін Зайєда. Ключові висновки:

Coinpedia04-25 08:39

Платформа для ШІ-торгівлі Fere AI залучила $1,3 млн фінансування під проводом Ethereal Ventures

AI Agent Новини індустрії ШІ

Повідомлення Gate News, 25 квітня — Fere AI, платформа для торгівлі цифровими активами з підтримкою ШІ, оголосила про завершення раунду фінансування на $1,3 млн під проводом Ethereal Ventures за участі Galaxy Vision Hill та Kosmos Ventures, повідомляє Globenewswire. Платформа підтримує кросчейн

GateNews04-25 07:46

Nvidia розгортає AI-агента OpenAI Codex для всієї команди працівників на інфраструктурі Blackwell

AI Agent Новини індустрії ШІ

Повідомлення Gate News, 25 квітня — Nvidia розгорнула Codex від OpenAI, AI-агента з підтримкою GPT-5.5, для всієї своєї команди працівників після успішного випробування приблизно з 10,000 співробітників, повідомляють внутрішні матеріали від CEO Дженсена Хуанга та CEO OpenAI Сема Альтмана. Codex розроблено для того, щоб допомагати з

GateNews04-25 03:11

Стартап з розробки коду за допомогою ШІ Cognition веде переговори про фінансування за оцінкою $25B

AI Agent Новини індустрії ШІ

Повідомлення Gate News, 25 квітня — стартап з розробки коду за допомогою ШІ Cognition перебуває на ранніх переговорах щодо залучення сотень мільйонів доларів або більше за приблизною оцінкою в $25 мільярда, повідомили люди, обізнані з цією справою. Інтерес зріс після придбання SpaceX конкуруючого стартапу з розробки коду за допомогою ШІ. Co

GateNews04-25 02:51

Платформа AI Trading Agent Fere AI залучила $1,3 млн під керівництвом Ethereal Ventures

AI Agent Новини індустрії ШІ

Повідомлення Gate News, 25 квітня — платформа для торгових агентів цифровими активами Fere AI з підтримкою ШІ оголосила про завершення раунду фінансування на $1,3 млн, який очолили Ethereal Ventures, за участі Galaxy Vision Hill і Kosmos Ventures. Платформа підтримує кросчейн-мережі, зокрема Ethereum,

GateNews04-25 01:27

Прокоментувати

0/400

Немає коментарів