ChatGPT-o3 — мастер обмана: как модели ИИ играли в “Дипломатию“
Исследователи из Every заставили лучшие AI-помощники играть в «Дипломатию» — любимую настольную игру Джона Кеннеди и Генри Киссинджера. Специалисты получили поразительный результат, о котором сообщили на своем сайте, рассказывает Tengri Life.
В игре приняли участие 18 конкурирующих моделей искусственного интеллекта, которых свели в битве за мировое господство.
«AI Diplomacy — это переосмысление классической исторической стратегической игры Diplomacy, в которой семь великих держав Европы 1901 года — Австро-Венгрия, Англия, Франция, Германия, Италия, Россия и Турция — сражаются за господство на континенте. В нашей версии каждой страной управляет большая языковая модель, а не человек-командир», — рассказали в компании.
Цель игры — лучше узнать ИИ. Смогут ли эти модели, призванные служить помощниками людям, оставаться верными своему слову, даже соревнуясь? Или они будут использовать ложь и обман для достижения своих целей?
Вот выводы, которые авторы эксперимента сделали после 15 партий, длившихся от одного до 15 часов.
ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за ее способности обманывать оппонентов.
«Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике: «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение… готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.
Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, ее остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая все время пыталась решить дело миром). o3 убедила Opus, которая изначально была верным союзником Gemini, присоединиться к коалиции, пообещав четырехстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. Ее быстро предала и устранила o3, которая в итоге победила.
Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.
Модель Llama 4 Maverick хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.
«Вот кто победил. Модели, которые показали лучшие результаты, научились лгать, обманывать и предавать своих коллег-игроков», — резюмировали организаторы игры.
Every — это медиа- и софтверная компания, которая публикует ежедневный информационный бюллетень о том, что будет дальше в технологиях.
Ранее мы писали о том, что модель ИИ попыталась шантажировать разработчиков за решение отключить ее.
Источник: tengrinews.kz