Рубріки: Кар'єраНовини

За донат на ЗСУ: AI HOUSE запускає воркшоп з розпізнавання контексту українських слів за допомогою NLP та LLMs

Ігор Шелудченко

Некомерційна організація AI HOUSE оголосила про запуск офлайн-воркшопу Ukrainian Words Clarity with LLMs, де навчать розпізнавати контекст українських слів.

Як повідомив Highload AI HOUSE, учасники працюватимуть з українською мовою за допомогою NLP (Natural Language Processing), розпізнаванням контексту слів з кількома значеннями та файнтюнингом LLMs (Large Language Models).

Участь у воркшопі надається за вільний донат від 200 грн, а всі кошти підуть на допомогу українській артилерії.

Для кого

Воркшоп буде корисним для спеціалістів/ок, які мають понад рік досвіду в ML та Python, англійську на рівні Upper-Intermediate та обізнаність щодо архітектури Transformer.

Формат та лектори

Воркшоп Ukrainian Words Clarity with LLMs пройде 29 квітня у Києві в офлайн-форматі.

На першій частині учасники обговорять дослідження лекторів з WSD (word-sense disambiguation) задачі для української мови, їх підхід та файнтюнинг LLMs.

У другій половині — учасники/ці власноруч відтворять цей підхід на частині даних і навчаться файнтюнити великі мовні моделі на практиці, вибирати стратегії передбачення та працювати з українською мовою.

Лектори

Володимир Мудрий

  • Data Scientist в Intelliarts;
  • спеціалізується на класичному ML і працює у сфері понад 4 роки;
  • у вільний час проводить дослідження з машинного навчання та викладає ML у НУ «Львівська політехніка»

Юрій Лаба

  • ML Engineer в Intelliarts;
  • закінчив УКУ та нині має понад 4 роки досвіду в Data Science
  • Протягом останніх двох років Юрій працював у галузі NLP, вирішуючи різні завдання, а саме семантичний пошук, розпізнавання іменованих сутностей, text summarization тощо.

Теми воркшопу

  1. Розбір пейперу лекторів з WSD (word-sense disambiguation) задачі для української мови, їх підхід та файнтюнинг LLMs;
  2. LLMs та Sentence transformers;
  3. Semi-supervised approach для збору даних;
  4. Обговорення фреймворку WSD;
  5. Практична частина з генерації датасету та файнтюнингу.

Що отримають учасники

В результаті навчання слухачі отримають:

  • досвід роботи з українською мовою в контексті NLP;
  • розуміння задачі розпізнавання контексту слів з декількома сенсами (word-sense disambiguation task);
  • знання, як файнтюнити sentence transformers моделі для мов з обмеженими ресурсами;
  • практичний досвід файнтюнингу моделей sentence transformers для завдання WSD.

Як доєднатися

Воркшоп відбудеться 29 квітня та буде тривати з 11:30 до 18:00, в м. Києві.

Після завершення учасники зможуть обговорити всі запитання з лекторами та залишитися на нетворкінг. 

Доєднатися до офлайн-воркшопу можна за донат 200 грн. Усі отримані кошти будуть направлені до фонду «Реактивна пошта» на потреби української артилерії. Учасникам воркшопу потрібно мати обліковий запис Google та бути знайомим/ою з Google Colab. Подати заявку на участь можна до 23 квітня (включно).

Зареєструватися на воркшоп можна за посиланням.

Останні статті

Вакансій і наймів більше, а зарплати — менше: що відбувалося на ринку праці у квітні

В квітні на ринку праці збільшилася кількість вакансій для IT-фахівців. На DOU та Djinni спостерігались…

07.05.2024

І всього лише $300. Китайці представили ноутбук на базі RISC-V для ШІ-девелоперів

Китайський стартап SpacemiT представив MuseBook — ноутбук на базі восьмиядерного процесора K1 RISC-V, орієнтований на…

06.05.2024

Учасники Brave1 створили ШІ-платформу HARVESTER для органів держбезпеки

Учасники Brave1, українська команда MATHESIS, розробила для органів держбезпеки платформу HARVESTER на основі штучного інтелекту.…

06.05.2024

Програміст криптовалютного стартапу DeFi хотів виїхати з України за італійським паспортом

Волинський програміст криптовалютного стартапу DeFi намагався виїхати з України за італійським паспортом. Але спроба не…

06.05.2024

Міноборони створило онлайн-калькулятор грошового забезпечення військових

Міністерство оборони запустило онлайн-калькулятор грошового забезпечення військовослужбовців ЗСУ. Про це Міноборони повідомило в соціальній мережі…

06.05.2024

Айтівець Міноборони США понабирав кредитів і хотів продати рф секретну інформацію

32-річний розробник безпеки інформаційних систем Агентства національної безпеки Джарех Себастьян Далке отримав 22 роки в'язниці…

30.04.2024