Рубріки: Новини

Некомерційна і краще GPT-3: Meta випустила нову мову машинного навчання LLaMa

Ігор Шелудченко

Meta, материнська компанія Facebook сьогодні офіційно оголосила про реліз нової large language model з назвою LLaMa.

Про це йдеться на офіційному сайті Meta AI.

Судячи з інформації, це скоріше дослідницький інструмент, для вирішення деяких проблем, які заважають іншим мовним моделям ШІ.

Цей дослідницький інструмент повинен «демократизувати доступ у цій важливій області, що швидко змінюється». Тобто, допомогти експертам виявити проблеми мовних моделей ШІ: упередженість, токсичнисть і схильність вигадувати інформацію.

LLaMA насправді є не єдиною системою, а збіркою моделей різного розміру під «некомерційною ліцензією, орієнтованою на дослідницькі варіанти використання».

«Ми робимо LLaMA доступними в декількох розмірах (параметри 7B, 13B, 33B та 65B), а також ділимося карткою моделі LLAMA, в якій детально описується, як ми побудували модель відповідно до нашого підходу до практики відповідального ШІ», — стверджують дослідники.

Відповідно, доступ до мови матимуть університети та дослідницькі заклади.

У дослідницькій статті Meta стверджує, що друга за розміром версія моделі LLaMA, LLaMA-13B, працює краще, ніж популярна модель OpenAI GPT-3, «у більшості тестів», у той час як найбільша, LLaMA-65B, «конкурентоспроможна з кращими моделі», такі як Chinchilla70B від DeepMind та PaLM 540B від Google.

Зазначимо, Google та OpenAI, який співпрацює з Microsoft, зараз ведуть війну штучного інтелекту.

Нещодавно Google анонсував запуск чат-бота на базі штучного інтелекту під назвою Bard, щоб конкурувати з ChatGPT. Bard побудовано на існуючій великій мовній моделі Google Lamda, яку один з інженерів описував як достатньо «розумну» у своїх відповідях.

При цьому на днях ChatGPT став найбільш зростаючим застосунком в історії.

Раніше повідомлялося, що корпорація Microsoft розпочала роботу над «вбивцею Google» — новою версією своєї пошукової системи Bing з використанням штучного інтеллекту, який лежить в основі ChatGPT від Open AI.

Останні статті

Айтівець Міноборони США понабирав кредитів і хотів продати рф секретну інформацію

32-річний розробник безпеки інформаційних систем Агентства національної безпеки Джарех Себастьян Далке отримав 22 роки в'язниці…

30.04.2024

Простий та дешевий. Українська Flytech запустила масове виробництво розвідувальних БПЛА ARES

Українська компанія Flytech представила розвідувальний безпілотний літальний апарат ARES. Основні його переваги — недорога ціна…

30.04.2024

Запрошуємо взяти участь у премії TechComms Award. Розкажіть про свій потужний PR-проєкт у сфері IT

MC.today разом з Асоціацією IT Ukraine і сервісом моніторингу та аналітики згадок у ЗМІ та…

30.04.2024

«Йдеться про потенціал мобілізації»: Україна не планує примусово повертати українців із ЄС

Україна не буде примусово повертати чоловіків призовного віку з-за кордону. Про це повідомила у Брюсселі…

30.04.2024

В ЗСУ з’явився жіночий підрозділ БПЛА — і вже можна проходити конкурсний відбір

В Збройних Силах України з'явився жіночий підрозділ з БПЛА. І вже проводиться конкурсний відбір до…

30.04.2024

GitHub на наступному тижні випустить Copilot Workplace — ШІ-помічника для розробників

GitHub анонсував Copilot Workspace, середовище розробки з використанням «агентів на базі Copilot». За задумкою, вони…

30.04.2024