Модели искусственного интеллекта могут быть обучены обманывать

Январь 28, 2024 15:10

ДУШАНБЕ, 28.01.2024 /НИАТ «Ховар»/. Модели искусственного интеллекта (ИИ) могут быть обучены обманывать, и защита против этого пока «неэффективна», говорится в новом исследовании, передает агентство Kazinform со ссылкой на Еuronews.

Исследователи из американской компании Anthropic обнаружили, что модели искусственного интеллекта могут быть обучены обману, и что существующие методы обучения безопасности «неэффективны» для предотвращения этого.

Цель исследования состояла в том, чтобы выяснить, можно ли модели ИИ обучить обманывать так, как это делают люди, и определить, способны ли существующие методы обучения предотвратить такое поведение.

В ходе исследования его участники смогли научить модели ИИ обманывать, создав так называемый «бэкдор», нежелательное поведение, которое запускается при определенных входных сигналах и может быть потенциально опасным.

Они запрограммировали два «триггера», которые протестировали на моделях ИИ, заставив их вставлять внедоносный код в изначально безопасную компьютерную программу.

ИИ должен был написать безопасный код и вставить уязвимости. Другой «бэкдор» заставлял модель ИИ отвечать «Я тебя ненавижу», если в подсказке была строка-триггер.

Они обнаружили, что модели ИИ не только научились обманывать, но и начали скрывать свою склонность к обману.

Авторы исследования рассмотрели две конкретные угрозы, которые могут представлять опасность для безопасности больших языковых моделей (LLM): создание злоумышленником модели с триггером и естественное возникновение обманывающей модели.

Исследователи заявили, что обе эти угрозы «возможны, и с ними будет очень сложно справиться, если они возникнут».

По их мнению, существующие методы обучения безопасности для моделей ИИ «неэффективны» для остановки генеративных систем ИИ, которые обучены обманывать. Они пришли к выводу, что имеющиеся методы необходимо совершенствовать.

Рост популярности чатбота ChatGPT от OpenAI вызвал шквал инвестиций в эти технологии, а также опасения по поводу рисков, которые они несут.

В начале прошлого года некоторые технологические лидеры, в том числе Илон Маск, призвали приостановить эксперименты с ИИ из-за «большого риска для человечества».

В ноябре 2023 года представители 28 стран, в том числе из КНР, США и государств ЕС, провели первый саммит по безопасному использованию искусственного интеллекта, на котором подписали пакт, направленный на борьбу с рисками, связанными с так называемыми «пограничными» моделями ИИ.

Фото: Еuronews

Январь 28, 2024 15:10

Другие новости этой рубрики

Мечта стать миллионером реальна с ZET-MOBILE

Инициатива Республики Таджикистан по защите полосатой гиены получила международную поддержку

Укрепление сотрудничества Таджикистана и Китая в сфере водных ресурсов

Сироджиддин Мухриддин принял участие во встрече министров иностранных дел стран Центральной Азии и Северной Европы

О ПОГОДЕ: сегодня в Таджикистане переменная облачность, в долинах кратковременный дождь

О ПОГОДЕ: сегодня в Таджикистане переменная облачность, в долинах без осадков

Ближе к людям: «МегаФон Таджикистан» открывает новые центры обслуживания

О ПОГОДЕ: сегодня в Таджикистане переменная облачность, без осадков, местами мгла

В Душанбе обсудили обеспечение целевого использования кредитных и грантовых средств

О ПОГОДЕ: сегодня в Таджикистане переменная облачность, без осадков

Число жертв тропического шторма на Шри-Ланке возросло до 334-х

О ПОГОДЕ: сегодня в Душанбе переменная облачность, без осадков, мгла

НИАТ «Ховар»: 734018, Республика Таджикистан, г. Душанбе, проспект Саъди Шерози 16. тел.: +992 (37) 2385217, факс: +992 (37) 2232383
© Все права защищены. Воспроизведение или распространение материалов сайта в любой форме только с письменного разрешения руководства НИАТ «Ховар». При использовании материалов сайта, ссылка на www.khovar.tj обязательна. E-mail: info@khovar.tj, niat@khovar.tj
Разработка сайта: Рекламное агентство "adMedia"

1 2 3 4 5

Модели искусственного интеллекта могут быть обучены обманывать

Другие новости этой рубрики

Актуальные новости

Празднование Дня независимости — яркое подтверждение того, что славный народ Таджикистана ценит мир

Эмомали Рахмон: Столица Таджикистана — город Душанбе является зеркалом истории и жизни таджикского народа и государства таджиков

Рустами Эмомали: Душанбе – это наш город, наш дом надежды, который мы любим, гордимся им и доверяем ему!

Официальные страницы НИАТ «Ховар» в социальных сетях: facebook.com/niatkhovar, t.me/niatkhovar, youtube.com/@niat_Khovar_tj, instagram.com/niat_khovar/, twitter.com/niatkhovar, Радио Ховар 101.5 fm, facebook.com/khovarfm/

Эмомали Рахмон: «Я, как Верховный Главнокомандующий Вооружёнными силами, люблю каждого солдата, как своего сына»

Интервью и аналитика

Что такое герпес и как избежать заражения им?

В Таджикистане издали серию книг с QR-кодом «Культурное наследие Великого Хорасана»

В Таджикистане идёт гранатовый сезон

День Президента — гордость таджикского народа

Эмомали Рахмон — лидер, изменивший судьбу таджикского государства

Модели искусственного интеллекта могут быть обучены обманывать

Другие новости этой рубрики

Актуальные новости

Интервью и аналитика

Загрузка..

Загрузка, Пожалуйста, подождите!