Последние 7 лет активно занимается исследованиями и разработкой систем компьютерного зрения и обработки естественного языка. Является автором курса по машинному обучению на онлайн-платформе Prometheus и курса по глубокому обучению в ARVI Lab.
Большой опыт в обработке видео с использованием методов deep learning для обнаружения объектов и действий, прогнозировании карт глубины изображений, семантической сегментации и генерации субтитров к изображениям и видео киностудий Голливуда.
Разрабатывал одну из первых систем автоматизации контроля размещений товаров на полках с помощью нейронных сетей. Руководил разработкой ряда проектов автоматизированного анализа новостей на разных языках, распознавания именуемых сущностей, анализа концептуального дрифта и репрезентации языковых структур с помощью систем машинного обучения.
В течение последнего года работал над системой автоматического переноса черт лица человека и позы тела в компании NeoCortext, а также над задачей 4х увеличения разрешения видео киностудий в компании VideoGorillas.
Искусственные нейросети позволяют почти полностью автоматизировать решение задач классификации, семантического сегментирование, распознавание объектов и тому подобное.
Такой тип моделей как generative adversarial networks позволяет не только обрабатывать определенный визуальный, аудиальный или текстовый контент, а и синтезировать новый контент который соответствует распределению признаков «настоящих» данных.
Это свойство можно эффективно использовать для синтеза персонализированного уникального контента «on the fly».
По моему мнению, в ближайшие несколько лет демократизация доступа к подобным генеративных систем в корне изменит то, как будет выглядеть рынок онлайн-рекламы, персонализации контента, видео и фото продакшена.
Из примеров как генеративные нейросети уже меняют некоторые индустрии: личный опыт автоматизации восстановления последнего фильма Орсона Уэллса совместно с компанией Netflix (занявший 2 недели вместо 6 месяцев, благодаря этим методам), использование разработанной системы замены черт лица для персонализации рекламы, мемов, gif- анимации и большой интерес со стороны пользователей, а также примеры успешного применения генеративных моделей для синтеза реалистического текста на заданную тематику.
Моральные и технологические вопросы, которые ставят перед нами подобные технологии и предложения по противодействию распространению высококачественных фейков и методы регуляции злонамеренного применения.