Delo.ua: Как перестать майнить криптовалюту и стать полезным

11 декабря 2017


 
Максим Прасолов многим украинцам известен в первую очередь как продюсер в мультимедиа. С 2001 по 2017 год он участвовал в создании более 50 анимационных рекламных роликов, 3D-фильмов, коммерческих и промышленных приложений, компьютерных игр, а также создал первый украинский графический роман "Даогопак". Максим работал с международным ритейлом и такими промышленными брендами как Unilever, Yukos, TPE, Metro Cash&Carry, Severstal Group, Ferrexpo, коммерческими банками, инвестиционными и страховыми компаниями. Был членом команды IPO от компании Ferrexpo, одного из крупных добытчиков железной руды в Украине, на London Stock Exchange.

С 2014-го Прасолов инвестирует в создание дронов, AI, AR мультимедийные стартапы, и буквально год назад запустил новый проект, платформу синтетических данных и машинного обучения Neuromation. За это время проект Neuromation выиграл 1 место в глобальном конкурсе стартапов d10e Conference в Давосе с призовым фондом в $250 тыс. долларов, а также привлек к партнертству преподавателя Университета Сингулярности Дэвида Орбана.

В начале декабря Neuromation объявила о партнерстве с одним из крупных операторов облачного Майнинга giga-watt.com и получила в свое распоряжение более 40.000 GPU для полезных вычислений.

Пока что Neuromation открыто проводит свой токенсейл до 15 февраля, и уже привлекла более $1,5 млн средств инвесторов, заинтересованных в услугах платформы. Нейротокен — внутренняя валюта платформы — обеспечивается услугами по разработке нейросетей, вычислительной мощностью для полезных алгоритмов и генераторами синтетических данных, а также другими продуктами на платформе Neuromation.

Delo.UA поговорило с Максимом Прасоловым, CEO Neuromation, о том, чем полезно для бизнеса машинное обучение, что ждет блокчейн и чему можно научить нейросети.

Расскажите подробнее о своей компании Neuromation. Чем вы занимаетесь и какие технологии используете?

Наша компания — разработчик алгоритмов глубокого обучения. Мы не очень любим термин "искусственный интеллект", потому что никакого искусственного интеллекта пока не существует. Это просто речевая форма упаковки всей индустрии. Нейросетевые алгоритмы, скорее, хороший классификатор, способ обобщения данных и поиска закономерностей, способ автоматизации повторяемых действий. И все это самообучаемо.

Буквально последние пять лет мы наблюдаем всплеск индустрии машинного обучения. Стало возможным многое, что раньше не было возможно. Например, распознавание объектов, сегментация и выделение объектов из фона, определение движения человека или любого объекта в пространстве, распознавание лиц и многое другое.

Только есть одна проблема. Для того чтобы машину чему-нибудь обучить, нужно огромное количество размеченных данных. Предположим, вам нужно определить количество предметов в этой комнате. Вы хотите, чтобы ваша умная камера точно знала положение этого предмета и умела его соответственно распознавать. Если кто-то захочет украсть флешку или пульт, то камера поймет, что этот предмет присвоил другой объект. Для этого ее нужно научить понимать, что это флешка, это телевизор, это часы, это мячик, а это — диван. Для того чтобы машинный алгоритм это делал, нужно объекты сфотографировать несколько тысяч раз в разных ракурсах и комбинациях и обвести каждый объект на фотографии квадратиком и подписать его. Затем показать это машине, машина сможет тогда определять эти объекты, и лучше, если они будут не в одном контексте, а стоять и на белом фоне и в других контекстах, под разными углами. Тогда это определение будет еще точнее.

 

А если цвет поменяется, он будет определять?

Конечно, алгоритм способен точно определять даже по нескольким пикселям . Мы с удивительной точностью можем определить объект и в том случае, если его практически не видно, и не только на переднем плане, но и на заднем.

Какое практическое применение всего этого?

Огромное количество вариантов. Наша компания имеет очень четкую специализацию, мы работаем с технологиями компьютерного зрения, основанного на нейронных сетях. Мы используем новаторский метод синтетических данных, мы одни из первых в коммерческом секторе, кто их использует. Что такое синтетические данные? Это 3D-картинки или 3D-мультфильмы, которые уже изначально идеально размечены. Размечать вручную все очень дорого и долго. Например, разметка одной фотографии в Индии в городе Бангалоре будет стоить 20-50 центов. Чтобы создать приложение, которое будет помогать мерчендайзеру в магазине распознавать товары на полках, где допустим 170 тысяч наименований, артикулов, соответственно на каждый артикул нужно 5 тыс. изображений. Таким образом, на это нужно потратить порядка $200 млн, чтобы научить сеть распознавать товары на по полках. И это только одна отрасль и один сектор, это колоссальные средства.

Однажды к нам пришли наши партнеры и попросили сделать такую нейросеть, которая могла бы распознавать товары на полках. Мы просчитали и придумали одну простую идею — а что, если мы не будем эти фотографии размечать вручную, а нарисуем их в 3D? Что, если мы создадим симуляционную среду, визуальную копию супермаркета, в которой мы можем сделать произвольное количество фотографий в нужном нам ракурсе, с нужным нам углом освещения, нужной комбинацией на полке? Что, если мы сделаем такой генератор данных и на них начнем обучать сеть? Сколько будет стоить создание такого проекта? Мы недавно создали пару миллионов фотографий в 3D, построили модель и начали на ней тренировать алгоритм.

Сначала у нас ничего не получалось, несколько месяцев у нас не было никаких результатов. Но внезапно летом этого года достигли результата точности в 96%. Наша система, которая никогда не видела реальных данных, эффективно учится на синтетических, а затем распознает реальные, и мы очень быстро достигли высокого результата. На таких фотографиях есть все, что присутствует на реальной фотографии — блики, прозрачность, полиграфические засечки, абсолютно все сделано с высоким уровнем детализации, даже пластиковая пробка.

И на сколько тогда меняется стоимость проекта?

Например, наши конкуренты, израильская компания, на протяжении трех лет разрабатывала модель, чтобы распознавать около 3 тысяч моделей, по нашей информации они потратили около $60 млн. Мы сделали модель на 1 тысячу за 2 месяца и $50 тыс.

А разница в качестве?

Понимаете, чтобы сделать индустриальное приложение нужно в разы больше денег, но это все равно не сопоставимо с затратами, которые имеют сейчас подобные проекты, работающие с реальными данными. Это разница в сотни раз. Наш метод дешевле и, что самое главное, быстрее, потому что помимо цены для создания такого проекта нужно приложить много усилий и процент ошибок там сумасшедший, около 20%. А у нас -100% точность, потому что мы точно знаем, что это 3D-объект, мы знаем, где он точно стоит на полке, где размещен, размер, описание. Сеть получает высококачественные данные, более того, они размечены так как человек их никогда не разметит. Мы по нескольким пикселям можем определить что это бутылка пепси-колы, даже если не будет видна этикетка. Это очень важно, потому что в работе контроля розницы положение товара на полке влияет на продажи, там прямая зависимость. Но это всего лишь одно из применений нашего алгоритма.

 

Можно сказать, что вы продаете технологии?

Мы продаем только технологии и ищем партнеров в различных секторах. Особенность в том, что наша технология требует очень большой вычислительной мощности. Чтобы сети обучать, нужна мощность. Представьте себе миллиард высококачественных фреймов с детализацией в 3D-мультфильм или фотореалистичного качества. Это действительно тысячи часов 3D-мультфильмов получилось. Однажды мы поняли, что таких мощностей у нас нет, и денег, чтобы их закупить, тоже нет.

А сколько у вас было денег?

В компанию мы уже вложили чуть больше миллиона долларов. Сейчас капитализация компании 15 миллионов и наши доли инвесторы покупают с такой оценкой. За один год, я считаю, что это довольно неплохой рост.

Вначале у нас было пару ангелов, потом у нас появился один смарт-инвестор, который помогал находить других, сейчас у нас инвесторы — это все люди, которые у нас работают. Люди все воодушевлены и работают, у нас такой реально правильный стартап, с ликвидностью уже на первом году жизни.

К нам сейчас зайдет один стратег, который хочет иметь место в совете директоров и собственно влиять на принятие решений.

Когда это произойдет?

Я думаю до конца года, мы сейчас закрываем сделку.

С какими трудностями сталкивалась компания?

Если же вернуться к работе компании, то момент, с которым мы столкнулись, — отсутствие достаточной вычислительной мощности. Мы решили купить мощности, однако пришли к выводу, что карт нет — их все раскупили майнеры. И тогда было предложено решение — использовать их мощности в наших целях. Майнеры зарабатывают не так уж и много на производстве криптовалют.

Пускай зарабатывают больше с нами. С помощью полезных вычислений.

Мир движется в этом направлении. Мы считаем, что будущее за универсальными фермами, которые будут заниматься полезными вычислениями, а мы будем таким себе Uberом, который будет их нанимать на разные типы задач.

Или, например, у нашей компании пока нет подходящего решения для высокой транзакционности блокчейна. В существующих ограничено количество транзакций, а нам нужно количество трансакций на уровне 3000 в секунду. Приведу пример. Представьте себе на стадионе массовую акцию, у вас 50 тыс. человек, огромное количество полиции, чтобы предотвратить даже не хулиганские действия, а элементарно — давку. А мы, допустим, можем сделать алгоритм, считающий и анализирующий всю эту массу людей, подключив на четыре часа матча 14 тыс. видеокарт майнеров и в течение четырех часов мы будем точно показывать вариант возникновения сложной ситуации. И выдавать систему предупреждений. И тогда не нужно на 50 тысяч человек 5 тысяч полиции, нужно будет 500 стюардов, которые просто будут понимать, что делать в этой ситуации и получать четкие инструкции. Экономится куча денег. Допустим, стадион в Бразилии арендует мощность на 4 часа, и при этом майнеры должны быть включены моментально. Мне нужно поддержать десятки тысяч транзакций, а у меня параллельно с этим еще 50 000 младенцев в роддомах, за которыми смотрят смарт-камеры. Нам нужно колоссальное количество транзакций, и со всеми вычислительными узлами нужно заключить смарт-контракты, им нужно заплатить за кратковременную работу. Это огромная нагрузка, никакой блокчейн сейчас этого делать не позволяет. Но скоро будет.

 

Тогда на что вы сейчас рассчитываете?

Мы рассчитываем на то, что по мере роста количества транзакций либо появится новый блокчейн, в который мы войдем, либо мы напишем свой. Вариант развития Etherium также рассматриваем.

Недавно вы сообщали, что стали партнерами с хакерами. Каким образом вы с ними планируете сотрудничать?

Мы нанимаем белых хакеров. Они тестируют, соответственно ломают нас, показывают уязвимости, и мы их закрываем. Они много полезного для нас делают. Мы постоянно им чего-то даем, а они тестируют.

Если обратиться к областям применения вашей технологии, то где еще ее можно использовать? Погоду предсказывать?

Мы вот этого как раз не делаем. Потому что это намного сложнее, чем кажется на первый взгляд — слишком сложная математика. Там вопрос не в синтетических данных, а в обработке той информации, которая идет. Это очень специфическая область компьютерного анализа и сбора данных, она гораздо сложнее, чем нейросенс. Предсказывать погоду хорошо, но это не наш бизнес, нельзя заниматься всем. У нас три направления — медицина, ритейл и industrial automation, это любая вещь, связанная с умными камерами в процессе автоматизации. Например, сортировка досок, посылок, или яиц, птицы, свиней, или запчастей — любые вещи, которые можно посчитать и запомнить.

Мы очень четко фокусируемся на том, чем мы можем заниматься. Я думаю, что основная специализация нашей платформы будут вычислительные мощности и модели для умных камер, я думаю, это будет процентов 90 всего нашего бизнеса. Умные камеры — это гигантский рынок, который только начинается.

Автор:Беседовали Оксана Тарасенко и Любомира Ремажевская