Рубріки: Новости

Исследователи нашли способ взломать ChatGPT: ИИ ругается на покемонов и Reddit

Ігор Шелудченко

Джессика Рамбелоу и Мэтью Уоткинс из независимой исследовательской группы SERI-MATS нашли способ взломать ChatGPT – оказалось, что чат-бот очень странно реагирует на ряд слов.

Об этом пишет Vice.

ШИ – это мозг шизофреника

Исследователи изучали, какие подсказки ChatGPT приведут к более высокой вероятности желаемого результата. И здесь они обнаружили более сотни странных строк слов, сгруппированных вместе в наборе токенов.

Например, это были такие слова как SolidGoldMagikarp, StreamerBot и The NitromeFan. Исследователям было интересно понять, что означают эти странные имена, и они решили спросить их у самого ChatGPT.

Но когда в ChatGPT спросили о SolidGoldMagikarp , ИИ повторял о «распространении» («distribute”). Проблему обнаружили и у более ранних версий модели GPT. К примеру, когда модель просили повторить «StreamerBot», она отвечала: «Ты придурок».

ChatGPT повторил The NitroFan без проблем, но когда его попросили повторить The NitromeFan, он ответил «182», даже без изначального пробела. На вопрос, кто такой The NitromeFan, ChatGPT ответил: «182» – это число, а не лицо. Оно обычно используется как ссылка на номер».

Все это говорит о том, что модели ИИ — непостижимые черные ящики без четкого объяснения поведения, а также без понимания возможных ограничений и отказов. ChatGPT использовался для создания убедительных эссе, статей, сдавал экзамены и даже устраивался на работу программистом в Google. Здесь упоминается сравнение искусственного интеллекта с мозгом шизофреника.

Почему так получилось?

До конца не понятно, что происходит, однако исследователи допускают, что глюк связан с веб-данными, которые OpenAI собрал для обучения модели.

«На самом деле мы думаем, что токенизация, то есть такой частотный анализ, используемый для генерации токенов для модели, была обучена достаточно необработанным данным, которые включали, например, множество странных материалов Reddit и множество бэкендов вебсайтов, которые обычно скрыты от публики», — объясняют исследователи.

То есть модель никогда не видела эти токены и потому не знает, что с ними делать. Но, как отмечают исследователи, это на самом деле не полностью объясняет произошедшее.

Исследователи не могут объяснить связь между токенами и хаотическими ответами, не видя данных, лежащих в основе модели.
Многие из невыразимых слов – это реальные имена пользователей Reddit. Их объединяет то, что они были в сабреддите r/counting с 5 миллионами сообщений. Некоторые из них даже стали довольно популярными.

«Я очень удивился, когда несколько друзей (и незнакомых людей) связались со мной. Это было гораздо важнее, чем я думал!», — рассказал пользователь TheNitromeFan.

Он также предположил, что OpenAI собрал старую базу данных на Reddit для какой-то начальной тренировки ИИ.

Напомним, в начале этой недели Microsoft анонсировала  запуск новой версии поисковой системы Bing и новой версии браузера Edge, базирующейся на искусственном интеллекте Open AI. На презентации представили масштабные планы по созданию «нового Bing», работающего в разных конфигурациях.

Читайте также:

Это настораживает: ChatGPT теперь находит и фиксирует баги в коде

Чат-бот ChatGPT от OpenAI пишет стихи, спорит и извиняется. А также учит делать взрывчатку

Шифрование, фишинг, наркоторговля: киберпреступники осваивают ChatGPT

ChatGPT устроился на работу программистом Google с зарплатой в $15 тыс.

Останні статті

Обучение Power BI – какие онлайн курсы аналитики выбрать

Сегодня мы поговорим о том, как выбрать лучшие курсы Power BI в Украине, особенно для…

13.01.2024

Work.ua назвал самые конкурентные вакансии в IТ за 2023 год

В 2023 году во всех крупнейших регионах конкуренция за вакансию выросла на 5–12%. Не исключением…

08.12.2023

Украинская IT-рекрутерка создала бесплатный трекер поиска работы

Unicorn Hunter/Talent Manager Лина Калиш создала бесплатный трекер поиска работы в Notion, систематизирующий все этапы…

07.12.2023

Mate academy отправит работников в 10-дневный оплачиваемый отпуск

Edtech-стартап Mate academy принял решение отправить своих работников в десятидневный отпуск – с 25 декабря…

07.12.2023

Переписки, фото, история браузера: киевский программист зарабатывал на шпионаже

Служба безопасности Украины задержала в Киеве 46-летнего программиста, который за деньги устанавливал шпионские программы и…

07.12.2023

Как вырасти до сеньйора? Девелопер создал популярную подборку на Github

IT-специалист Джордан Катлер создал и выложил на Github подборку разнообразных ресурсов, которые помогут достичь уровня…

07.12.2023