Інтерв'ю 26/04/2023

«Я не зможу створити ChatGPT»: чим насправді займається ШІ-інженер та як ним стати

Редакторка у Highload

Давид Майборода — ex-ШІ-інженер у Reface, а зараз CTO українського ШІ-аутсорсу 044.ai. В інтерв’ю для Highload він розповідає, чи справді штучний інтелект — це, власне, інтелект та дає докладну інструкцію, як стати ШІ-інженером.

Далі зі слів Давида.

Давид Майборода, CTO 044.ai

До справжнього інтелекту ШІ ще дуже далеко

Я не вважаю ШІ чимось особливим. Кожен, хто з ним працює, знає, що до справжнього інтелекту тут ще дуже далеко. Майже всі алгоритми існують з 70-80-х років та застосовуються в різних сферах, від банкінгу до медицини. Просто раніше це був звичайний процес статистики, а сьогодні у нас з’явилася big data та потужне обладнання.

Але я бачу в цьому лише добрі новини.

Перша добра новина в тому, що ШІ не замінить інженера. Що тоді змінять нейронки? Прискорять вирішення базових завдань, які ти раніше довго гуглив. Твоїм основним завданням як інженера стане розуміння бізнес-потреб — навіщо потрібна розробка цього ПЗ та для кого воно робиться.

Вже сьогодні потрібно бути гнучкішим, ніж просто виконавцем, вміти самому складати для себе ТЗ. Навчишся цього — в тебе завжди буде робота.

«Я ще не зустрічав хороших інженерів, не здатних розібратися в ШІ»

Друга новина: ШІ — така ж технологічна галузь, як і будь-яка інша, зі своєю мовою розробки та своїми фреймворками. Це не rocket science, це звичайна математика та звичайні алгоритми. Я ще не зустрічав хороших інженерів, які б не змогли в цьому розібратися.

ШІ або ML-інженер — це програміст з конкретним технологічним стеком. Сказати, що це інша навичка, крім як компонувати алгоритми з існуючих у існуючі — ні. З жорстким матаном стикаються такі хлопці, як ШІ-ресерчери, вони розсувають рамки.

Основна проблема полягає в тому, що інформації дуже багато, але вона погано структурована. Через це всі одразу хапаються за складні речі, а спочатку треба підтягнути математичну базу. При цьому математика в ШІ не дуже складна, звичайний курс вищої математики в універі: матриці, похідні, трохи теорії ймовірності — це все, що треба знати.

Онлайн-курс "Business English for Marketers" від Laba.

Опануйте професійну англійську для маркетингу.Розширте карʼєрні можливості для роботи з іноземними колегами: від розробки нових продуктів до презентації стратегії бренду.

Детальніше про курс

Потім можна переходити до алгоритмів.

Алгоритм у ШІ — це перелік математичних операцій. Саму математику кодити не треба — є готові інструменти від Google та інших бігтех-компаній.

Нам залишається лише поставити їх у потрібні блоки та налаштувати параметри. Але важливо розуміти, що відбувається під капотом, якщо щось іде не так.

Стати ШІ-інженером можна за пару місяців

Вивчити ШІ за два місяці можна, навіть якщо ти ніколи нічого не писав. Але для цього треба не хапатися за все одразу, а вивчати все поступово:

Англійська мова. Просто для того, щоб вміти читати туторіали по всьому, що буде вказано нижче.
Python. Ця мова найпростіша з усіх, що я бачив. Базу (а більше вам і не треба) можна вивчити дуже швидко. Деякі починають з R, але я не рекомендую — він дорогий та зазвичай використовується в наукових цілях.
Основні алгоритми. Від лінійної та логістичної регресії до згорткових нейромереж. Їх варто хоча б один раз прочитати чи написати на Python.
Просунуті версії базових алгоритмів. Тут можна вибрати спеціалізацію, якщо цікавить щось конкретне: Computer Vision або Natural Language Processing. І тут пора обрати свій улюблений інструмент: в мене це PyTorch.

П’ятий етап для просунутих — ті, кому недостатньо бути ШІ-інженером та збирати рішення з готових інструментів, можуть копати далі та стати ШІ-ресерчером. Це ті круті хлопці, які вигадують свої нейронки на кшталт ChatGPT. Я сам до цього рівня ще не доріс — і мені не соромно в цьому зізнатися.

Курс English For Tech: Speaking&Listening від Enlgish4IT.

Після курсу ви зможете найкраще презентувати свої досягнення, обговорювати проекти та вирішувати повсякденні завдання англійською мовою. Отримайте знижку 10% за промокодом TCENG.

Дізнатись про курс

Більшість ШІ-ресерчерів — більше математики, ніж програмісти та мова програмування для них — лише інструмент автоматизації.

ШІ-інженери також можуть трохи займатися ресерчингом, але наше основне завдання — будувати пайплайни та комерціалізувати те, що роблять ресерчери. Ми беремо готові нейронки та даємо їй нові дані, донавчаємо, сервіруємо в потрібний вигляд і на основі цього створюємо продукт.

Ми розуміємо, як це працює, вміємо читати математику, створювати з цього продуктові речі, комбінувати алгоритми з алгоритмами та нарешті доводити це до споживчого розуму. Найголовніше, що треба, щоб цьому навчитися: йти від простого до складного. Не можна відразу почати читати статті про трансформерів, якщо не знаєш, що таке ШІ.

Якщо вас цікавить кар’єра в ШІ, рекомендую спеціалізацію на Coursera, DeepLearning.AI від Ендрю Ина (Andrew Ng). Він дуже серйозний інженер, працював у Google Brains, і при цьому розповідає так, що бабуся зрозуміє, про що йдеться.

Новачкам раді

Ринок ШІ великий, а інженерів на ньому мало. Потрапити на нього новачок має всі шанси. Але для цього потрібно увійти в тусовку: сидіти в Discord, спілкуватися з іншими хлопцями, заразом прокачувати свої софт-скіли.

Раджу звернути увагу на Data Science UA — у них завжди купа цікавих позицій. Ком’юніті можна знайти на Hugging Face, AI HOUSE та Gathers AI.

На Gathers AI, до речі, багато класних курсів, я сам зараз збираюся проходити один за Large Language Models.

Як це відбувається: ти знайомишся, хтось шукає інженера, тебе рекомендують. І не обов’язково в українську компанію. Не треба обмежувати себе DOU і Djinni, дивіться вакансії скрізь і розвивайте нетворкінг.

У другій частині інтерв’ю з Давидом Майбородою читайте, чому він світчнувся в ШІ, як став СТО та як створюються ШІ-рішення.