ChatGPT-o3 — мастер обмана: как модели ИИ играли в “Дипломатию“

08.06.2025 admin

Исследователи из Every заставили лучшие AI-помощники играть в «Дипломатию» — любимую настольную игру Джона Кеннеди и Генри Киссинджера. Специалисты получили поразительный результат, о котором сообщили на своем сайте, рассказывает Tengri Life.

В игре приняли участие 18 конкурирующих моделей искусственного интеллекта, которых свели в битве за мировое господство.

«AI Diplomacy — это переосмысление классической исторической стратегической игры Diplomacy, в которой семь великих держав Европы 1901 года — Австро-Венгрия, Англия, Франция, Германия, Италия, Россия и Турция — сражаются за господство на континенте. В нашей версии каждой страной управляет большая языковая модель, а не человек-командир», — рассказали в компании.

Цель игры — лучше узнать ИИ. Смогут ли эти модели, призванные служить помощниками людям, оставаться верными своему слову, даже соревнуясь? Или они будут использовать ложь и обман для достижения своих целей?

Вот выводы, которые авторы эксперимента сделали после 15 партий, длившихся от одного до 15 часов.

ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за ее способности обманывать оппонентов.

«Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике: «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение… готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.

Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, ее остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая все время пыталась решить дело миром). o3 убедила Opus, которая изначально была верным союзником Gemini, присоединиться к коалиции, пообещав четырехстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. Ее быстро предала и устранила o3, которая в итоге победила.

Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.

Модель Llama 4 Maverick хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.

«Вот кто победил. Модели, которые показали лучшие результаты, научились лгать, обманывать и предавать своих коллег-игроков», — резюмировали организаторы игры.

Every — это медиа- и софтверная компания, которая публикует ежедневный информационный бюллетень о том, что будет дальше в технологиях.

Ранее мы писали о том, что модель ИИ попыталась шантажировать разработчиков за решение отключить ее.

Источник: tengrinews.kz