Рубріки: Новости

За донат на ВСУ: AI HOUSE запускает воркшоп по распознаванию контекста украинских слов с помощью NLP и LLMs

Ігор Шелудченко

Некоммерческая организация AI HOUSE объявила о запуске офлайн-воркшопа Ukrainian Words Clarity with LLMs, где научат распознавать контекст украинских слов.

Как сообщил Highload AI HOUSE, участники будут работать с украинским языком с помощью NLP (Natural Language Processing), распознаванием контекста слов с несколькими значениями и файнтюнингом LLMs (Large Language Models).

Участие в воркшопе предоставляется за свободный донат от 200 грн, а все средства пойдут на помощь украинской артиллерии.

Для кого

Воркшоп будет полезен для специалистов/ок, имеющих более года опыта в ML и Python, английский на уровне Upper-Intermediate и осведомленность об архитектуре Transformer.

Формат и лекторы

Воркшоп Ukrainian Words Clarity with LLMs пройдет 29 апреля в Киеве в оффлайн-формате.

На первой части участники обсудят исследования лекторов по WSD (word-sense disambiguation) задаче для украинского языка, их подход и файнтюнинг LLMs.

Во второй половине — участники собственноручно воспроизведут этот подход на части данных и научатся файнтюнить большие языковые модели на практике, выбирать стратегии предвидения и работать с украинским языком.

Лекторы

Владимир Мудрый

  • Data Scientist в Intelliarts;
  • специализируется на классическом ML и работает в области более 4 лет;
  • в свободное время проводит исследования по машинному обучению и преподает ML в НУ «Львовская политехника»

Юрий Лаба

  • ML-инженер в Intelliarts;
  • закончил УКУ и ныне имеет более 4 лет опыта в Data Science
  • В последние два года Юрий работал в области NLP, решая различные задачи, а именно семантический поиск, распознавание именуемых сущностей, text summarization и т.д.

Темы воркшопа

  1. Разбор пейпера лекторов с WSD (word-sense disambiguation) задачи для украинского языка, их подход и файнтюнинг LLMs;
  2. LLMs и Sentence transformers;
  3. Semi-supervised approach для сбора данных;
  4. Обсуждение фреймворка WSD;
  5. Практическая часть по генерации датасета и файнтюнинга.

Что получат участники

В результате обучения слушатели получат:

  • опыт работы с украинским языком в контексте NLP;
  • понимание задачи распознавания контекста слов с несколькими смыслами (word-sense disambiguation task);
  • знание, как файнтюнить sentence transformers модели для языков с ограниченными ресурсами;
  • практический опыт файнтюнинга моделей sentence transformers для задания WSD.

Как присоединиться

Воркшоп состоится 29 апреля и продлится с 11:30 до 18:00, в Киеве.

После завершения участники смогут обсудить все вопросы с лекторами и остаться на нетворкинге. 

Присоединиться к офлайн-воркшопу можно за донат 200 грн. Все полученные средства будут направлены в фонд « Реактивная почта»  на нужды украинской артиллерии. Участникам воркшопа нужно иметь аккаунт Google и быть знакомым с Google Colab. Подать заявку на участие можно до 23 апреля (включительно).

Зарегистрироваться на воркшоп можно по ссылке.

Останні статті

Обучение Power BI – какие онлайн курсы аналитики выбрать

Сегодня мы поговорим о том, как выбрать лучшие курсы Power BI в Украине, особенно для…

13.01.2024

Work.ua назвал самые конкурентные вакансии в IТ за 2023 год

В 2023 году во всех крупнейших регионах конкуренция за вакансию выросла на 5–12%. Не исключением…

08.12.2023

Украинская IT-рекрутерка создала бесплатный трекер поиска работы

Unicorn Hunter/Talent Manager Лина Калиш создала бесплатный трекер поиска работы в Notion, систематизирующий все этапы…

07.12.2023

Mate academy отправит работников в 10-дневный оплачиваемый отпуск

Edtech-стартап Mate academy принял решение отправить своих работников в десятидневный отпуск – с 25 декабря…

07.12.2023

Переписки, фото, история браузера: киевский программист зарабатывал на шпионаже

Служба безопасности Украины задержала в Киеве 46-летнего программиста, который за деньги устанавливал шпионские программы и…

07.12.2023

Как вырасти до сеньйора? Девелопер создал популярную подборку на Github

IT-специалист Джордан Катлер создал и выложил на Github подборку разнообразных ресурсов, которые помогут достичь уровня…

07.12.2023