За донат на ВСУ: AI HOUSE запускает воркшоп по распознаванию контекста украинских слов с помощью NLP и LLMs
Некоммерческая организация AI HOUSE объявила о запуске офлайн-воркшопа Ukrainian Words Clarity with LLMs, где научат распознавать контекст украинских слов.
Как сообщил Highload AI HOUSE, участники будут работать с украинским языком с помощью NLP (Natural Language Processing), распознаванием контекста слов с несколькими значениями и файнтюнингом LLMs (Large Language Models).
Участие в воркшопе предоставляется за свободный донат от 200 грн, а все средства пойдут на помощь украинской артиллерии.
Для кого
Воркшоп будет полезен для специалистов/ок, имеющих более года опыта в ML и Python, английский на уровне Upper-Intermediate и осведомленность об архитектуре Transformer.
Формат и лекторы
Воркшоп Ukrainian Words Clarity with LLMs пройдет 29 апреля в Киеве в оффлайн-формате.
На первой части участники обсудят исследования лекторов по WSD (word-sense disambiguation) задаче для украинского языка, их подход и файнтюнинг LLMs.
Во второй половине — участники собственноручно воспроизведут этот подход на части данных и научатся файнтюнить большие языковые модели на практике, выбирать стратегии предвидения и работать с украинским языком.
Лекторы
- Data Scientist в Intelliarts;
- специализируется на классическом ML и работает в области более 4 лет;
- в свободное время проводит исследования по машинному обучению и преподает ML в НУ «Львовская политехника»
- ML-инженер в Intelliarts;
- закончил УКУ и ныне имеет более 4 лет опыта в Data Science
- В последние два года Юрий работал в области NLP, решая различные задачи, а именно семантический поиск, распознавание именуемых сущностей, text summarization и т.д.
Темы воркшопа
- Разбор пейпера лекторов с WSD (word-sense disambiguation) задачи для украинского языка, их подход и файнтюнинг LLMs;
- LLMs и Sentence transformers;
- Semi-supervised approach для сбора данных;
- Обсуждение фреймворка WSD;
- Практическая часть по генерации датасета и файнтюнинга.
Что получат участники
В результате обучения слушатели получат:
- опыт работы с украинским языком в контексте NLP;
- понимание задачи распознавания контекста слов с несколькими смыслами (word-sense disambiguation task);
- знание, как файнтюнить sentence transformers модели для языков с ограниченными ресурсами;
- практический опыт файнтюнинга моделей sentence transformers для задания WSD.
Как присоединиться
Воркшоп состоится 29 апреля и продлится с 11:30 до 18:00, в Киеве.
После завершения участники смогут обсудить все вопросы с лекторами и остаться на нетворкинге.
Присоединиться к офлайн-воркшопу можно за донат 200 грн. Все полученные средства будут направлены в фонд « Реактивная почта» на нужды украинской артиллерии. Участникам воркшопа нужно иметь аккаунт Google и быть знакомым с Google Colab. Подать заявку на участие можно до 23 апреля (включительно).
Зарегистрироваться на воркшоп можно по ссылке.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: