«Рабопарни-чат»: дата-саентист клонировал своих друзей с помощью ИИ

Ігор Шелудченко

14.04.2023 18:55

Специалист по Data Science Иззи Миллер клонировал групповой чат своих лучших друзей с помощью модели LLaMA от Meta.

О подробностях странного эксперимента рассказал The Verge.

Как появились «рабопарни»

Иззи Миллер загрузил 500 тыс. сообщений из семилетнего группового чата, в котором общались шесть друзей. Он отсортировал сообщения по авторам и побудил модель воспроизвести личность каждого участника: Харви, Генри, Вятта, Кибса, Люка и Миллера.

Для обработки данных он выбрал языковую модель LLaMA от Meta. Она примерно такой же мощности, как и модель GPT-3 от OpenAI.

Интересно, что автор не подавал запрос на использование языковой модели через официальные каналы, а просто воспользовался сливом на GitHub.

«Я увидел сценарий LLaMA и подумал, что это будет удалено из GitHub. Я сохранил его в текстовом файле на рабочем столе», — сказал он.

Сценарий действительно был впоследствии удален из Github.

Когда модель научилась работать с сообщениями группового чата, Миллер подключил ее к клону пользовательского интерфейса iMessage от Apple и предоставил доступ своим друзьям. В результате они все смогли пообщаться между собой.

«Я был действительно удивлен тем, как модель узнала нас, а не только о том, как мы говорим. Она знает информацию о том, с кем мы встречаемся, где мы ходили в школу, номер нашего дома, где мы жили и т.д.», — рассказал он.

В чате «рабопарней» ИИ довольно удачно имитировал поведение и манеру общения реальных людей.

Недостатки

Но у ИИ есть и существенные недостатки. Среди главных — непонимание хронологии.

ИИ не анализирует чат как нечто целостное — не обращает внимание на новости и обновление — а только на количество сообщений. Иными словами, чем больше о чем-то говорят, тем больше вероятность, что на это будут ссылаться боты.

Одним из неожиданных результатов этого является то, что клоны, как правило, действуют так, будто они учатся в колледже, поскольку именно тогда групповой чат был наиболее активным.

Кроме того, ИИ еще может путать факты, относящиеся к одному человеку и добавлять их к другому.

Кстати, все технические шаги, которые необходимо предпринять для повторения эксперимента, он описал у себя в блоге. Потому повторить это сможет каждый желающий.

Ускоряют разработку и повышают безопасность: Google запускает сервисы для девелоперов Deps.dev и Assured OSS

Разработчик создал программу Wolverine из GPT-4: cкрипты Python могут сами себя «ремонтировать»