Учёные раскрыли главную уязвимость искусственного интеллекта

15 июн, 17:16

Какие продукты поднимают настроение?

09 июн, 09:57

Плохой сон оказался неожиданной угрозой для кишечника

09 июн, 19:55

Ученые раскрыли, как рыбы покорили моря после вымирания динозавров

10 июн, 12:58

Учёные раскрыли секрет медлительности ленивцев

11 июн, 15:12

Как правильно пить чай, чтобы защитить сердце

11 июн, 19:56

Врач рассказал, когда необходимо принимать препараты железа

19 май, 12:19

Названа продолжительность сна, ускоряющая старение

19 май, 18:34

Найден популярный продукт, выводящий микропластик из организма

20 май, 12:47

Дефицит витамина D: обнаружена скрытая угроза для женщин

20 май, 21:36

Тайна рептилий возрастом 320 миллионов лет впервые разгадана

23 май, 09:54

Учёные раскрыли главную уязвимость искусственного интеллекта

15 июн , 17:16

Международная команда исследователей бросила ведущим языковым моделям, казалось бы, простой вызов — классический тест Струпа, которым психологи уже почти сто лет измеряют способность к концентрации. Итог оказался обескураживающим: чем длиннее задание, тем беспомощнее становится ИИ — вплоть до почти полного провала. Работа опубликована в журнале PNAS Nexus.

Суть теста Струпа проста: испытуемому показывают слова, обозначающие цвета, но написанные чернилами другого цвета, и просят назвать именно цвет чернил, проигнорировав само слово. Скажем, слово «красный», набранное синим шрифтом, требует ответа «синий». Человеческий мозг справляется с этим стабильно даже при длинных списках — он умеет подавлять автоматическую реакцию и удерживать фокус.

Команда под руководством Сукету Пателя предложила этот тест сразу нескольким флагманским моделям — GPT-4o, Claude 3.5 Sonnet, GPT-5, Claude Opus 4.1 и Gemini 2.5. На коротких списках из пяти слов все системы показали уверенный результат. Однако с увеличением длины точность обрушивалась лавинообразно: GPT-4o при пяти словах выдавал 91% верных ответов, при десяти — уже 57%, а при сорока — жалкие 15%. Claude 3.5 держался дольше других, сохраняя приемлемый уровень до двадцати слов, но затем рухнул до 24%.

Авторы исследования объясняют этот эффект тем, что модели по мере выполнения задачи «теряют из виду» инструкцию и скатываются к тому, что усвоили прочнее всего — к простому чтению слов. Именно это, по мнению ученых, принципиально отличает ИИ от человека, способного удерживать произвольное внимание на протяжении длительного времени.

Поделиться статьей