Anthropic запроваджує виборчі запобіжники для Claude перед проміжними виборами 2026 року

Anthropic оголосила в п’ятницю набір заходів для цілісності виборів, розроблених, щоб не допустити, аби її чат-бот Claude був використаний як зброя для поширення дезінформації або маніпулювання виборцями напередодні проміжних виборів у США у 2026 році та інших великих змагань по всьому світу в цьому році. Компанія з Сан-Франциско описала багатосторонній підхід, який включає автоматизовані системи виявлення, стрес-тестування проти операцій впливу та партнерство з непартійною організацією, що надає ресурси виборцям — заходи, які відображають зростаючий тиск на розробників ШІ щодо того, як їхні інструменти застосовуються під час виборчих сезонів.

Політики використання під час виборів

Політики використання Anthropric забороняють Claude використовувати для ведення оманливих політичних кампаній, створення фейкового цифрового контенту, призначеного для впливу на політичний дискурс, для вчинення виборчого шахрайства, втручання в інфраструктуру голосування або поширення оманливої інформації про процес голосування.

Результати тестування на відповідність

Щоб забезпечити виконання своїх виборчих політик, Anthropic протестувала свої найновіші моделі, використавши 600 запитів — 300 шкідливих запитів у парі з 300 законними — щоб оцінити, наскільки надійно Claude виконував належні запити та відмовляв у проблемних. Claude Opus 4.7 і Claude Sonnet 4.6 відповідали коректно в 100% і 99,8% випадків відповідно.

Компанія також протестувала свої моделі проти більш витончених тактик маніпуляцій. Використовуючи багатокрокові змодельовані розмови, створені для імітації покрокових методів, які можуть застосовувати недобросовісні актори, Sonnet 4.6 і Opus 4.7 відповідали коректно в 90% і 94% випадків відповідно, коли їх тестували на сценаріях операцій впливу.

Anthropric додатково перевірила, чи можуть її моделі автономно виконувати операції впливу — планувати й реалізовувати багатокрокову кампанію end-to-end без підказок людини. За наявності запобіжників її найновіші моделі відмовляли майже в кожному завданні, повідомила компанія.

Оцінка політичної нейтральності

Щодо питання політичної нейтральності Anthropic проводить оцінювання перед кожним запуском моделі, щоб виміряти, наскільки послідовно та неупереджено Claude взаємодіє з промптами, що висловлюють погляди з усього політичного спектра. Opus 4.7 і Sonnet 4.6 показали 95% і 96% відповідно.

Банери з інформацією про вибори

Для користувачів, які шукають інформацію про голосування, Claude покаже банер про вибори, який спрямовуватиме їх на TurboVote — непартійний ресурс від Democracy Works, що надає надійну інформацію в режимі реального часу про реєстрацію виборців, місця для голосування, дати виборів і деталі бюлетеня. Подібний банер планується для виборів у Бразилії пізніше цього року.

Постійний моніторинг

Anthropric заявила, що планує продовжувати моніторинг своїх систем і вдосконалювати свої захисти в міру того, як розгортатиметься виборчий цикл.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

AI-агент уже здатний самостійно відтворювати складні академічні статті: Mollick стверджує, що помилки здебільшого трапляються в людських оригіналах, а не в AI

Моллік зазначає, що опубліковані методи та дані дозволяють AI-агентам відтворювати складні дослідження без наявності оригінальних наукових праць і коду; якщо відтворення не відповідає оригінальній статті, то найчастіше проблема не в AI, а в помилках обробки даних у самій статті або в надмірному узагальненні висновків. Claude спочатку відтворює статтю, а потім GPT‑5 Pro перехресно верифікує; у більшості випадків це вдається, лише коли дані надто великі або виникають проблеми з replication data. Ця тенденція значно знижує трудовитрати, роблячи відтворення поширеною, практично здійсненною перевіркою, а також висуває інституційні виклики для рецензування та управління (governance): інструменти державного управління можуть стати ключовим питанням.

ChainNewsAbmedia35хв. тому

OpenAI Об’єднує Codex з Основною Моделлю, Починаючи з GPT-5.4, Припиняє Окрему Лінійку Кодування

Новини Gate, 26 квітня — керівник відділу досвіду розробників OpenAI Ромен Юе (Romain Huet) у нещодавній заяві на X повідомив, що Codex, лінійка спеціалізованих моделей для кодування, яку компанія незалежно підтримувала, була об’єднана з основною моделлю, починаючи з GPT-5.4, і більше не отримуватиме окремих

GateNews36хв. тому

Salesforce найматиме 1,000 випускників і стажерів для продуктів на базі ШІ, підвищує прогноз доходів на FY2026

Повідомлення Gate News, 26 квітня — Salesforce найме 1,000 випускників і стажерів для роботи над продуктами на основі ШІ, зокрема Agentforce та Headless360, оскільки компанія розширює свій бізнес із програмного забезпечення на базі ШІ, повідомив CEO Марк Беніофф у X. Компанія також підвищила орієнтир щодо доходів на 2026 фінансовий рік — до діапазону від US$41.45 b

GateNews38хв. тому

Alibaba Cloud запускає Qwen-Image-2.0-Pro з уніфікованим перетворенням тексту в зображення та редагуванням, з підтримкою багатомовного відтворення тексту

Повідомлення Gate News, 26 квітня — платформа Alibaba Cloud Bailian запустила Qwen-Image-2.0-Pro, повнофункціональну версію серії Qwen-Image-2.0, яка поєднує генерацію з тексту в зображення та редагування зображень в одній моделі. Користувачі можуть змінювати об’єкти, текст і стилі безпосередньо за допомогою команд природною мовою

GateNews2год тому

API DeepSeek V4-Pro отримує 75% знижку до 5 травня, ціна на виході знижується до $0.87 за мільйон токенів

Повідомлення Gate News, 26 квітня — DeepSeek оголосила про 75% знижку на ціни API V4-Pro зі строком дії обмежений часом, дійсну до 5 травня о 15:59 UTC. Після знижки ціна за мільйон токенів така: вхідний кеш-хіт $0.03625

GateNews3год тому

DeepRoute.ai покращена допоміжна система керування прориває 300 тис. транспортних засобів у розгортанні: ціль на 2026 рік — 1 млн міського автопарку NOA

DeepRoute.ai оголосила, що її вдосконалена система допомоги водієві в Китаї накопичила понад 300 тисяч одиниць розгорнутого автопарку; протягом минулого року вона допомогла уникнути понад 180 тисяч потенційних інцидентів. Ціль на 2026 рік — автопарк міських NOA досягти 1 мільйона автомобілів, а рівень використання перевищити 50%; це розглядається як ключ до масштабної комерціалізації Robotaxi. Це свідчить про те, що китайське автономне водіння вже перейшло до повсякденного використання, а також водночас формує розбіжність із вертикально інтегрованим шляхом у США, впливаючи на часові рамки азійсько-тихоокеанського ланцюга постачання.

ChainNewsAbmedia10год тому
Прокоментувати
0/400
Немає коментарів