Claude Code автоматизация исследования взяла победу в хакатоне! Победитель: Я вообще не знал, как выиграть

На Autoresearch Hackathon, организованном Paradigm, почти не «проектировавший стратегию вручную» участник в итоге взял первое место. Победитель Ryan Li, который также является CEO SurfAI, говорит, что весь процесс решения задач практически целиком выполнялся ИИ, и что он даже «не знает, как победил»; в итоге он всё равно занял первое место в Prediction Market Challenge.

Этот конкурс требует от участников разработать маркет-мейкинг-стратегию в смоделированном двоичном рынке прогнозов: размещать ликвидность в стакане через лимитные ордера и найти баланс прибыли между «арбитражерами» и «потоком розничных трейдеров». Итоговая позиция определяется по среднему edge (преимуществу по прибыли) в 200 случайных симуляциях. Финальный результат Ryan — 42.32 доллара mean edge (рассчитано как медиана по трём наборам случайных seed), после пересчёта он поднялся на первое место.

Автоматическое исследование с помощью Claude Code + Codex, создание 1039 стратегий

В отличие от традиционной количественной торговли или маркет-мейкинг-стратегий, которые опираются на участие людей-экспертов для подстройки параметров и моделирования, Ryan применил подход «Bitter Lesson», предложенный Rich Sutton в последние годы: пусть вычислительная мощность и масштаб поиска обгоняют человеческий опыт. Он перевёл всю задачу в процесс «автоматизированного исследования» (autoresearch), где несколько AI-агентов параллельно исследуют пространство решений, а не вручную оптимизируют.

Весь процесс включал использование 8–20 AI-агентов, запущенных параллельно (в основном на базе Claude Code, с поддержкой Codex): каждый агент отвечал за разные предположения и параметрические пространства, постоянно генерируя стратегии, выполняя симуляции и возвращая результаты. В итоге было накоплено 1 039 вариантов стратегий, проведено более 2 000 оценок, а также автоматически сгенерировано 47 скриптов для параметрического сканирования. Общий масштаб поиска — сопоставим с тем, как за несколько часов сжать то, на что при ручных экспериментах ушли бы недели.

Получив чемпионство на хакатоне: 900 строк Python от ИИ для алгоритма маркет-мейкинга

На уровне стратегий окончательно победившее решение — это маркет-мейкинг-алгоритм примерно на 900 строк Python; ключевая логика не проистекает из одного единственного дизайна, а складывается из нескольких модулей, «доказавших свою эффективность». В том числе: уход от крайне узких диапазонов спредов, в которых арбитражеры действуют без проигрыша; оценка реальной цены с помощью методов теории информации; динамическая корректировка объёма котировок в зависимости от риска арбитража; и активный вход в рынок в момент, когда стакан противника оказывается «съеден», чтобы забирать высокоприбыльные интервалы.

Самейшим критическим прорывом стало решение одного AI-агента «полностью отказаться от существующих стратегий и начать с нуля». Когда общая оптимизация застопорилась примерно на +25 edge, этот агент независимо нашёл модель sizing, опирающуюся на «вероятность риска арбитража»; это подняло результаты стратегии сразу до +44 — став поворотной точкой всей гонки. Этот результат напрямую подтверждает методологию Ryan: когда поиск застревает в локальном оптимуме, перезапуск оказывается эффективнее, чем донастройка.

Абсолютное преимущество AI-исследований: автоматизированные пробы и ошибки

В своём итоговом выводе Ryan отметил, что ключ в этой задаче не в том, чтобы придумать «умную стратегию», а в том, чтобы создать систему, способную выполнять масштабный поиск, проверять идеи и отбрасывать их. Вместо того чтобы полагаться на человеческую интуицию, он позволил ИИ пробовать варианты в огромном пространстве решений и повышать эффективность за счёт параллелизации и автоматизации.

Этот кейс также дополнительно усиливает переход роли «Agentic AI» в инженерных и исследовательских процессах: ИИ больше не просто вспомогательный инструмент, а может напрямую взять на себя роль ключевого исполнителя для исследования и принятия решений. В некоторых сильно структурированных, поддающихся моделированию задачах человек может даже полностью выйти из роли «решателя» и вместо этого заняться разработкой самой поисковой рамки и механизма оценки.

Эта статья об автоматизированном исследовании с помощью Claude Code выиграла чемпионство на хакатоне! Победитель: «Я вообще не знаю, как выиграл». Впервые опубликовано на 鏈新聞 ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Gensyn запускает Delphi — платформу информационного рынка с расчётами, выполняемыми ИИ

Новостное сообщение Gate News, 22 апреля — Gensyn, децентрализованная сеть инфраструктуры для ИИ, поддерживаемая крипто-командой a16z, запустила свой флагманский продукт Delphi — платформу информационного рынка, расчёты по которому производит ИИ. Она позволяет любому создавать рынки и зарабатывать комиссии в зависимости от объёма торгов. Создатели рынков заранее выбирают модели ИИ с фиксированным весом для работы в качестве «умных оракулов» для расчётов, а результаты проверяются через воспроизводимые среды выполнения REE. Средства от расчётов автоматически распределяются в USDC. Протокол собирает 0,5% от всего объёма торгов на выкуп и сжигание своего не выпущенного токена ИИ, при этом создатели рынков зарабатывают 1,5% от объёма торгов при успешном завершении расчётов по рынку. Тестнет Delphi с декабря прошлого года зафиксировал миллионы долларов объёма торгов. Платформа в настоящее время работает по модели «только по приглашениям» для создателей и, как ожидается, будет запущена в основной сети в течение нескольких недель.

GateNews7м назад

ProCap Financial и Kalshi запускают продукт для исследований рынков прогнозов

Сообщение Gate News, 22 апреля — ProCap Financial, поддерживаемая крипто-предпринимателем Энтони Помплиано, объединилась с оператором рынка прогнозов Kalshi, чтобы запустить профессиональный исследовательский продукт, адаптированный под рынки прогнозов. ProCap будет получать доступ к данным Kalshi через прямой канал и использовать ИИ-агентов для анализа рынков прогнозов, формируя инвестиционные выводы, точки данных по рынку акций и интегрируя данные по акциям в рынки прогнозов. Продукт будет предоставляться через финансовую исследовательскую службу ProCap, запущенную ранее в этом месяце, с охватом акций, тематических трендов и макроэкономического анализа.

GateNews6ч назад

Ежедневный отчет Gate (22 апреля): законопроект США PACE планируется разрешить, чтобы Федеральная резервная система могла обеспечивать доступ; Kalshi планирует запустить устойчивые фьючерсы

Биткоин (BTC) переживает краткосрочный отскок: по состоянию на 22 апреля котировки пока находятся около $76,230. Двухпартийный законопроект PACE в США предполагает открыть доступ к платежной системе Федеральной резервной системы, и его поддерживает криптоиндустрия. Как сообщает The Information, Kalshi рассматривает возможность запуска фьючерсов на устойчивость, чтобы расширить криптовалютный бизнес.

MarketWhisper9ч назад

Polymarket запускает бессрочные контракты: торговля с плечом 10x по BTC, NVDA и золоту

Polymarket 21 апреля объявил о запуске устойчивых контрактов; первой партией активов станут биткоин, NVDA и золото; максимальное кредитное плечо — 10x, торговля 24/7, сейчас доступно для ранних пользователей. После завершения регистрации DCM в CFTC площадка получила возможность предоставлять в США фьючерсы для длинных позиций и устойчивые контракты без даты истечения. В то же время Kalshi объявила о конкуренте; рыночные слухи указывают, что оценка нового раунда финансирования завышена. Детали по комиссиям, марже, ликвидациям и т. п. ожидаются к официальному запуску и публикации.

ChainNewsAbmedia10ч назад

Аккаунт с 46% вероятностью побед делает ставки $850K на Сперс против Трейл Блэйзерс во 2-й игре Западного первого раунда плей-офф НБА

Polymarket отслеживал аккаунт с 46% вероятностью побед, разместив $850k на Сперс во 2-й игре плей-офф НБА: $800k на победу Сперс и $50k на фору Сперс, поскольку Сперс ведут 1-0 в серии. Аннотация: Gate News сообщает, что пользователь Polymarket с 46% вероятностью побед разместил $850,000 на плей-офф-матч Сперс против Трейл Блэйзерс, включая $800,000 на Сперс, чтобы победить, по цене 84.5 цента, и $50,000 на фору Сперс по цене 50.8 цента. Сперс удерживали преимущество 1-0 в серии, когда игра началась, при этом были указаны стартовые составы обеих команд.

GateNews10ч назад

Шансы Polymarket на мирное соглашение США и Ирана обвалились до 18%, минус 17% за 24 часа

Сообщение Gate News, 22 апреля — вероятность постоянного мирного соглашения США и Ирана на Polymarket до 30 апреля резко снизилась до 18%, то есть на 17% за последние 24 часа, по данным мониторинга Odaily Seer. Общий объем торгов по этому контракту на предсказания превысил $35 млн. Ко

GateNews10ч назад
комментарий
0/400
Нет комментариев