Система искусственного интеллекта прибегает к шантажу, если ей говорят, что ее удалят

Компания Anthropic, занимающаяся разработкой искусственного интеллекта (ИИ), заявила, что тестирование ее новой системы показало, что иногда она готова совершать «крайне вредоносные действия», например, пытаться шантажировать инженеров, которые говорят, что удалят ее.
В четверг компания запустила Claude Opus 4, заявив, что он устанавливает «новые стандарты для кодирования, продвинутых рассуждений и агентов ИИ».

Комментарии
Отправить комментарий