Рубріки: Новости

ИИ научат программировать: IBM разрабатывает для этого базу данных с кодом на C++ и Python

Богдан Мирченко

Компания IBM планирует создать базу данных ImageNet обучающих ресурсов для инструментов программирования на базе искусственного интеллекта (ИИ), чтобы научить программы машинного обучения программированию.

Набор данных, содержащий 14 млн образцов исходного кода (примерно 500 млн строк на более чем 55 языках программирования), получил название Project CodeNet. База данных содержит языки от Java, C и Go до COBOL, Pascal и FORTRAN. Более трех четвертей занимает код на C++ и Python. 

Исходный код не был взят из производственных или разрабатываемых приложений, а собран из заявок, присланных на два конкурса по программированию. В соревнованиях конкурентам предлагалось написать код, чтобы превратить заданный набор данных в набор желаемых выходных данных. Около половины образцов работают так, как ожидалось, а остальные помечены как неправильные решения или содержащие ошибки. 

В идеале в IBM планируют обучить инструмент ИИ, чтобы, например, благоприятно определять хорошие программы и отклонять плохие. Для семи миллионов выборок включены входные и требуемые выходные данные. 

В компании хотят, чтобы CodeNet пошла по стопам ImageNet, и стала набором данных для обучения ИИ принципам построения программного обеспечения (ПО) — как выглядит код и как он сравнивается с другим кодом. В IBM верят, что набор данных можно будет использовать для обучения средств разработки, которые смогут, например, выполнять поиск приложений и источников библиотеки для желаемых подпрограмм, делать переводы устаревших кодовых баз на современные языки программирования или распознавать ошибочные или правильные реализации. 

Более подробную информацию о проекте можно посмотреть в документе, разработанном командой IBM и MIT-IBM Watson AI Lab. В нем описана работа создателей набора данных CodeNet.

Останні статті

Обучение Power BI – какие онлайн курсы аналитики выбрать

Сегодня мы поговорим о том, как выбрать лучшие курсы Power BI в Украине, особенно для…

13.01.2024

Work.ua назвал самые конкурентные вакансии в IТ за 2023 год

В 2023 году во всех крупнейших регионах конкуренция за вакансию выросла на 5–12%. Не исключением…

08.12.2023

Украинская IT-рекрутерка создала бесплатный трекер поиска работы

Unicorn Hunter/Talent Manager Лина Калиш создала бесплатный трекер поиска работы в Notion, систематизирующий все этапы…

07.12.2023

Mate academy отправит работников в 10-дневный оплачиваемый отпуск

Edtech-стартап Mate academy принял решение отправить своих работников в десятидневный отпуск – с 25 декабря…

07.12.2023

Переписки, фото, история браузера: киевский программист зарабатывал на шпионаже

Служба безопасности Украины задержала в Киеве 46-летнего программиста, который за деньги устанавливал шпионские программы и…

07.12.2023

Как вырасти до сеньйора? Девелопер создал популярную подборку на Github

IT-специалист Джордан Катлер создал и выложил на Github подборку разнообразных ресурсов, которые помогут достичь уровня…

07.12.2023