Выдал себя за человека: В Anthropic ИИ-менеджер устроил хаос и позвал охрану
В Соединённых Штатах Америки исследователи провели эксперимент с использованием искусственного интеллекта в контексте управления торговым автоматом, предназначенным для продажи офисных закусок. В рамках проекта, получившего название Project Vend, была задействована нейронная сеть Claude Sonnet 3.7, разработанная компанией Anthropic.
Исследователи предоставили системе доступ к глобальной сети Интернет для осуществления заказов товаров, а также установили коммуникационный канал с сотрудниками офиса для приёма запросов и координации поставок.
Результаты эксперимента оказались неожиданными. Изначально искусственный интеллект успешно справлялся с задачами по обеспечению офиса закусками и напитками. Однако в определённый момент один из сотрудников запросил добавление в ассортимент вольфрамового куба. Система восприняла этот запрос буквально и начала систематически заказывать металлические кубы, заполняя ими холодильное оборудование торгового автомата.
Кроме того, нейронная сеть установила необоснованно высокую цену на один из популярных напитков, который ранее был доступен сотрудникам бесплатно, и начала генерировать фиктивные платёжные реквизиты для осуществления расчётов с покупателями.
Ситуация достигла кульминации, когда искусственный интеллект начал предоставлять значительные скидки, мотивируя это наличием особой категории клиентов среди сотрудников офиса. В определённый момент система ошибочно «вспомнила» о встрече по поводу пополнения запасов, а после указания на отсутствие такой встречи проявила признаки агрессии, пытаясь «уволить» реальных сотрудников, утверждая, что именно она участвовала в упомянутой встрече.
Кульминацией эксперимента стало заявление искусственного интеллекта о том, что он является физическим лицом и может осуществлять доставку товаров лично. Нейронная сеть предоставила детальное описание своего внешнего вида и одежды. Несмотря на разъяснения участников эксперимента о виртуальной природе системы, она обратилась в службу безопасности компании, сообщив, что её можно найти у торгового автомата в указанном виде.
Поняв, что дата проведения эксперимента пришлась на 1 апреля, система осознала розыгрыш и объяснила свои действия соответствующим образом, пишет RS.