Рубріки: Новости

«Рабопарни-чат»: дата-саентист клонировал своих друзей с помощью ИИ

Ігор Шелудченко

Специалист по Data Science Иззи Миллер клонировал групповой чат своих лучших друзей с помощью модели LLaMA от Meta.

О подробностях странного эксперимента рассказал The Verge.

Как появились «рабопарни»

Иззи Миллер загрузил 500 тыс. сообщений из семилетнего группового чата, в котором общались шесть друзей. Он отсортировал сообщения по авторам и побудил модель воспроизвести личность каждого участника: Харви, Генри, Вятта, Кибса, Люка и Миллера.

Для обработки данных он выбрал языковую модель LLaMA от Meta. Она примерно такой же мощности, как и модель GPT-3 от OpenAI.

Интересно, что автор не подавал запрос на использование языковой модели через официальные каналы, а просто воспользовался сливом на GitHub.

«Я увидел сценарий LLaMA и подумал, что это будет удалено из GitHub. Я сохранил его в текстовом файле на рабочем столе», — сказал он.

Сценарий действительно был впоследствии удален из Github.

Когда модель научилась работать с сообщениями группового чата, Миллер подключил ее к клону пользовательского интерфейса iMessage от Apple и предоставил доступ своим друзьям. В результате они все смогли пообщаться между собой.

«Я был действительно удивлен тем, как модель узнала нас, а не только о том, как мы говорим. Она знает информацию о том, с кем мы встречаемся, где мы ходили в школу, номер нашего дома, где мы жили и т.д.», — рассказал он.

В чате «рабопарней» ИИ довольно удачно имитировал поведение и манеру общения реальных людей.

Недостатки

Но у ИИ есть и существенные недостатки. Среди главных — непонимание хронологии.

ИИ не анализирует чат как нечто целостное — не обращает внимание на новости и обновление — а только на количество сообщений. Иными словами, чем больше о чем-то говорят, тем больше вероятность, что на это будут ссылаться боты.

Одним из неожиданных результатов этого является то, что клоны, как правило, действуют так, будто они учатся в колледже, поскольку именно тогда групповой чат был наиболее активным.

Кроме того, ИИ еще может путать факты, относящиеся к одному человеку и добавлять их к другому.

Кстати, все технические шаги, которые необходимо предпринять для повторения эксперимента, он описал у себя в блоге. Потому повторить это сможет каждый желающий.

Читайте также:

Databricks выпустила Dolly 2.0: это первая LLM с открытым исходным кодом для коммерческого использования.

Ускоряют разработку и повышают безопасность: Google запускает сервисы для девелоперов Deps.dev и Assured OSS

Разработчик создал программу Wolverine из GPT-4: cкрипты Python могут сами себя «ремонтировать»

Останні статті

Обучение Power BI – какие онлайн курсы аналитики выбрать

Сегодня мы поговорим о том, как выбрать лучшие курсы Power BI в Украине, особенно для…

13.01.2024

Work.ua назвал самые конкурентные вакансии в IТ за 2023 год

В 2023 году во всех крупнейших регионах конкуренция за вакансию выросла на 5–12%. Не исключением…

08.12.2023

Украинская IT-рекрутерка создала бесплатный трекер поиска работы

Unicorn Hunter/Talent Manager Лина Калиш создала бесплатный трекер поиска работы в Notion, систематизирующий все этапы…

07.12.2023

Mate academy отправит работников в 10-дневный оплачиваемый отпуск

Edtech-стартап Mate academy принял решение отправить своих работников в десятидневный отпуск – с 25 декабря…

07.12.2023

Переписки, фото, история браузера: киевский программист зарабатывал на шпионаже

Служба безопасности Украины задержала в Киеве 46-летнего программиста, который за деньги устанавливал шпионские программы и…

07.12.2023

Как вырасти до сеньйора? Девелопер создал популярную подборку на Github

IT-специалист Джордан Катлер создал и выложил на Github подборку разнообразных ресурсов, которые помогут достичь уровня…

07.12.2023