Delo.ua: Как сделать ИТ-открытие с помощью мультфильмов
Максим Прасолов
основатель и CEO Neuromation.io (Украина/США)
Многие меня знают как автора графической прозы, продюсера в мультимедиа, топ-менеджера, пиарщика, и это правда, я всем этим занимался. Работал с международным ритейлом и многими промышленными брендами, коммерческими банками, инвестиционными и страховыми компаниями.
У меня есть хобби — мультфильмы. В этом году мы с командой делали экранизацию "Кобзаря". У нас получился зомби-хоррор мультфильм. Поскольку анимация — достаточно трудоемкий процесс, в ходе работы мне пришла идея: нужно автоматизировать процесс, писать алгоритмы и учить нейросеть с помощью 3D мультфильмов.
Немного истории
Нейросети — это машинные алгоритмы, которыми человек пытается обучить машину и воспроизвести нервную систему человека. Еще в 1940-50-е ученые начали интересоваться их возможностями. Строили перцептроны на практике, "в железе" и с их помощью пытались воссоздать человеческий мозг, математическую модель нейронов. Потом настал "Ледниковый период": в 1970-м все о них забыли, переключившись на фантастику в литературе и кино. В 1980-е опять вспомнили. А к концу 80-х начали экспериментировать и производить алгоритмы. Обучать нейросети не получалось, поскольку не хватало компьютерных мощностей, данных и идей.
Нейросеть на практике
Нейросеть можно описать как классификатор и способ сегментации информации, который действует не только в соответствии с заданным алгоритмом и формулами, но и на основании прошлого опыта.
Этакий ребенок, который с каждым разом складывает пазл, делая все меньше ошибок.
Чтобы научить нейросеть что-то распознавать, нужно предоставлять в среднем 5 тыс. изображений одного объекта или предмета. Каждый объект на изображении должен быть размечен и описан: это мужчина, это кошка, это кубик, а это собака в свитере. Только после этого нейросеть научится отличать зонтик от собаки, машину от человека, бутылку от мотоцикла. Существует парадокс в обучении машин — люди учат нейросети вручную, а людям свойственно ошибаться. Этот процесс очень дорогой и долгий. Нейросеть обучают на синтетических данных с применением моделей на настоящих фотографиях. Кто-то пытался учить автономные автомобили внутри компьютерной игры GTA. Но мы упростили этот процесс.
Что мы придумали
Пока занимались мультфильмом, мы придумали, как автоматизировать эти процессы. Мы создали 3D симуляции реальности и, благодаря этим моделям, учим нейросети. Тем самым наши разработки позволяют добиться точности в обучении сетей, минимизировав человеческий фактор.
Нейросеть обучается на синтетических данных, перенося их на реальные. И такой процесс называется перенос обучения (transfer learning). Буквально 2 месяца назад нам удалось добиться высокого качества распознавания.
Как это работает
Мы нашли людей, которым была полезна наша разработка — то есть автоматизация розницы. Нашим первым клиентом стала огромная сеть ритейла и розничной торговли. Например, на полках в супермаркете представлено огромное количество товара. Но чтобы помочь поставщикам контролировать розницу, мы перевели ее в цифру, научив камеры видеть, что стоит на этих полках. Мы "выставили на полки" 3D-модели в любых комбинациях — это 1 млрд. фотореалистичных изображений.
Если бы сотрудники сети делали все вручную, то понадобилось 120 млн человеко-часов.
Кроме автоматизации розничной торговли, наша разработка поможет тестировать лекарства, потому что нейросеть сможет симулировать живую клетку. Или можем заняться тренировкой индустриальных роботов и беспилотных дронов в виртуальных средах. Но сначала для внедрения этих процессов мы задались вопросом, откуда брать ресурсы для всего этого.
Что мы сделали
Для существования Neuromation нужны были видеокарты. Много видеокарт. Поначалу все возможности для обучений мы арендовали на AmazonCloud и платили десятки тысячи долларов, за использование их мощностей. Потом мы решили купить свое оборудование, но столкнулись с удивительным явлением. Оказалось, что видеокарты, которые нужны нам с процессорами-GPU для нейросети, нужны для майнинга, для добычи криптовалюты. Еще в мае спекулянты продавали видеокарты втридорога. Мы искали их на всех рынках, но нам доставались лишь слабенькие видеокарты из США. За майнерами было не угнаться — они фильтровали все мощности. И мы решили предложить им сделку. Мы посчитали сколько они зарабатывают и оказалось, что одна фирма с шестью видеокартами получает $7-8 в день (это была приблизительно та сумма, которую мы платили Amazon"у). Мы пошли к майнерам и предложили им зарабатывать $10 в день в криптовалюте. Буквально через день, нас просили скинуть адреса, куда нести видеокарты. Сейчас с нами сотрудничают очень много майнеров, которые трудятся во благо человечества.
Что получилось в итоге
Мы создали мост между майнерами и учеными, предложив им зарабатывать больше на полезных вычислениях. Через месяц у нас была тысяча видеокарт, которые давали достаточное количество мощностей для наших экспериментов. А через два месяца мы вместе с командой ученых подтвердили гипотезу о синтетических данных.
Сейчас говорят, что data — это новая нефть, и нам удалось найти синтетическую нефть.
Полезные вычисления намного прибыльней, чем вычислять абстрактные алгоритмы в блокчейне. Индустрия глубокого и машинного обучения готова платить майнерам больше, чем они зарабатывают добычей криптовалют.
Наши исследования показывают, что все это можно делать во благо будущего с использованием двух вещей — нашего подхода синтетической даты и невероятной мощности, которая оказалась в руках людей, болеющих криптовалютной лихорадкой.
Поэтому мы создали платформу KNOWLEDGE MINING и объявили конкурс стартапов. В виде призов будем выдавать технологические мощности, которыми можно обучать ваши нейросети.
Мы создали продукт с удобным интерфейсом, где любой человек, не разбирающийся в нюансах машинного обучения, мог бы научить нейросеть распознавать все, что можно распознать под свою задачу.
Даже если у вас нет желания изменить мир, вам нужно просто заниматься тем, что вам нравится.
В моем случае, хобби — мультики, которые показали, как можно обучить нейросеть с помощью 3D анимации.