«Я не зможу створити ChatGPT»: чим насправді займається ШІ-інженер та як ним стати
Давид Майборода — ex-ШІ-інженер у Reface, а зараз CTO українського ШІ-аутсорсу 044.ai. В інтерв’ю для Highload він розповідає, чи справді штучний інтелект — це, власне, інтелект та дає докладну інструкцію, як стати ШІ-інженером.
Далі зі слів Давида.
Давид Майборода, CTO 044.ai
До справжнього інтелекту ШІ ще дуже далеко
Я не вважаю ШІ чимось особливим. Кожен, хто з ним працює, знає, що до справжнього інтелекту тут ще дуже далеко. Майже всі алгоритми існують з 70-80-х років та застосовуються в різних сферах, від банкінгу до медицини. Просто раніше це був звичайний процес статистики, а сьогодні у нас з’явилася big data та потужне обладнання.
Але я бачу в цьому лише добрі новини.
Перша добра новина в тому, що ШІ не замінить інженера. Що тоді змінять нейронки? Прискорять вирішення базових завдань, які ти раніше довго гуглив. Твоїм основним завданням як інженера стане розуміння бізнес-потреб — навіщо потрібна розробка цього ПЗ та для кого воно робиться.
Вже сьогодні потрібно бути гнучкішим, ніж просто виконавцем, вміти самому складати для себе ТЗ. Навчишся цього — в тебе завжди буде робота.
«Я ще не зустрічав хороших інженерів, не здатних розібратися в ШІ»
Друга новина: ШІ — така ж технологічна галузь, як і будь-яка інша, зі своєю мовою розробки та своїми фреймворками. Це не rocket science, це звичайна математика та звичайні алгоритми. Я ще не зустрічав хороших інженерів, які б не змогли в цьому розібратися.
ШІ або ML-інженер — це програміст з конкретним технологічним стеком. Сказати, що це інша навичка, крім як компонувати алгоритми з існуючих у існуючі — ні. З жорстким матаном стикаються такі хлопці, як ШІ-ресерчери, вони розсувають рамки.
Основна проблема полягає в тому, що інформації дуже багато, але вона погано структурована. Через це всі одразу хапаються за складні речі, а спочатку треба підтягнути математичну базу. При цьому математика в ШІ не дуже складна, звичайний курс вищої математики в універі: матриці, похідні, трохи теорії ймовірності — це все, що треба знати.
Потім можна переходити до алгоритмів.
Алгоритм у ШІ — це перелік математичних операцій. Саму математику кодити не треба — є готові інструменти від Google та інших бігтех-компаній.
Нам залишається лише поставити їх у потрібні блоки та налаштувати параметри. Але важливо розуміти, що відбувається під капотом, якщо щось іде не так.
Стати ШІ-інженером можна за пару місяців
Вивчити ШІ за два місяці можна, навіть якщо ти ніколи нічого не писав. Але для цього треба не хапатися за все одразу, а вивчати все поступово:
- Англійська мова. Просто для того, щоб вміти читати туторіали по всьому, що буде вказано нижче.
- Python. Ця мова найпростіша з усіх, що я бачив. Базу (а більше вам і не треба) можна вивчити дуже швидко. Деякі починають з R, але я не рекомендую — він дорогий та зазвичай використовується в наукових цілях.
- Основні алгоритми. Від лінійної та логістичної регресії до згорткових нейромереж. Їх варто хоча б один раз прочитати чи написати на Python.
- Просунуті версії базових алгоритмів. Тут можна вибрати спеціалізацію, якщо цікавить щось конкретне: Computer Vision або Natural Language Processing. І тут пора обрати свій улюблений інструмент: в мене це PyTorch.
П’ятий етап для просунутих — ті, кому недостатньо бути ШІ-інженером та збирати рішення з готових інструментів, можуть копати далі та стати ШІ-ресерчером. Це ті круті хлопці, які вигадують свої нейронки на кшталт ChatGPT. Я сам до цього рівня ще не доріс — і мені не соромно в цьому зізнатися.
Більшість ШІ-ресерчерів — більше математики, ніж програмісти та мова програмування для них — лише інструмент автоматизації.
ШІ-інженери також можуть трохи займатися ресерчингом, але наше основне завдання — будувати пайплайни та комерціалізувати те, що роблять ресерчери. Ми беремо готові нейронки та даємо їй нові дані, донавчаємо, сервіруємо в потрібний вигляд і на основі цього створюємо продукт.
Ми розуміємо, як це працює, вміємо читати математику, створювати з цього продуктові речі, комбінувати алгоритми з алгоритмами та нарешті доводити це до споживчого розуму. Найголовніше, що треба, щоб цьому навчитися: йти від простого до складного. Не можна відразу почати читати статті про трансформерів, якщо не знаєш, що таке ШІ.
Якщо вас цікавить кар’єра в ШІ, рекомендую спеціалізацію на Coursera, DeepLearning.AI від Ендрю Ина (Andrew Ng). Він дуже серйозний інженер, працював у Google Brains, і при цьому розповідає так, що бабуся зрозуміє, про що йдеться.
Новачкам раді
Ринок ШІ великий, а інженерів на ньому мало. Потрапити на нього новачок має всі шанси. Але для цього потрібно увійти в тусовку: сидіти в Discord, спілкуватися з іншими хлопцями, заразом прокачувати свої софт-скіли.
Раджу звернути увагу на Data Science UA — у них завжди купа цікавих позицій. Ком’юніті можна знайти на Hugging Face, AI HOUSE та Gathers AI.
На Gathers AI, до речі, багато класних курсів, я сам зараз збираюся проходити один за Large Language Models.
Як це відбувається: ти знайомишся, хтось шукає інженера, тебе рекомендують. І не обов’язково в українську компанію. Не треба обмежувати себе DOU і Djinni, дивіться вакансії скрізь і розвивайте нетворкінг.
У другій частині інтерв’ю з Давидом Майбородою читайте, чому він світчнувся в ШІ, як став СТО та як створюються ШІ-рішення.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: