За донат на ЗСУ: AI HOUSE запускає воркшоп з розпізнавання контексту українських слів за допомогою NLP та LLMs
Некомерційна організація AI HOUSE оголосила про запуск офлайн-воркшопу Ukrainian Words Clarity with LLMs, де навчать розпізнавати контекст українських слів.
Як повідомив Highload AI HOUSE, учасники працюватимуть з українською мовою за допомогою NLP (Natural Language Processing), розпізнаванням контексту слів з кількома значеннями та файнтюнингом LLMs (Large Language Models).
Участь у воркшопі надається за вільний донат від 200 грн, а всі кошти підуть на допомогу українській артилерії.
Для кого
Воркшоп буде корисним для спеціалістів/ок, які мають понад рік досвіду в ML та Python, англійську на рівні Upper-Intermediate та обізнаність щодо архітектури Transformer.
Формат та лектори
Воркшоп Ukrainian Words Clarity with LLMs пройде 29 квітня у Києві в офлайн-форматі.
На першій частині учасники обговорять дослідження лекторів з WSD (word-sense disambiguation) задачі для української мови, їх підхід та файнтюнинг LLMs.
У другій половині — учасники/ці власноруч відтворять цей підхід на частині даних і навчаться файнтюнити великі мовні моделі на практиці, вибирати стратегії передбачення та працювати з українською мовою.
Лектори
- Data Scientist в Intelliarts;
- спеціалізується на класичному ML і працює у сфері понад 4 роки;
- у вільний час проводить дослідження з машинного навчання та викладає ML у НУ «Львівська політехніка»
- ML Engineer в Intelliarts;
- закінчив УКУ та нині має понад 4 роки досвіду в Data Science
- Протягом останніх двох років Юрій працював у галузі NLP, вирішуючи різні завдання, а саме семантичний пошук, розпізнавання іменованих сутностей, text summarization тощо.
Теми воркшопу
- Розбір пейперу лекторів з WSD (word-sense disambiguation) задачі для української мови, їх підхід та файнтюнинг LLMs;
- LLMs та Sentence transformers;
- Semi-supervised approach для збору даних;
- Обговорення фреймворку WSD;
- Практична частина з генерації датасету та файнтюнингу.
Що отримають учасники
В результаті навчання слухачі отримають:
- досвід роботи з українською мовою в контексті NLP;
- розуміння задачі розпізнавання контексту слів з декількома сенсами (word-sense disambiguation task);
- знання, як файнтюнити sentence transformers моделі для мов з обмеженими ресурсами;
- практичний досвід файнтюнингу моделей sentence transformers для завдання WSD.
Як доєднатися
Воркшоп відбудеться 29 квітня та буде тривати з 11:30 до 18:00, в м. Києві.
Після завершення учасники зможуть обговорити всі запитання з лекторами та залишитися на нетворкінг.
Доєднатися до офлайн-воркшопу можна за донат 200 грн. Усі отримані кошти будуть направлені до фонду «Реактивна пошта» на потреби української артилерії. Учасникам воркшопу потрібно мати обліковий запис Google та бути знайомим/ою з Google Colab. Подати заявку на участь можна до 23 квітня (включно).
Зареєструватися на воркшоп можна за посиланням.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: