Останні 7 років активно займається дослідженнями та розробкою систем комп’ютерного зору та обробки природної мови. Є автором курсу з машинного навчання на онлайн-платформі Prometheus та курсу з глибокого навчання в ARVI Lab.
Має великий досвід роботи в обробці відео із використанням методів deep learning для виявлення об’єктів та дiй, прогнозування карт глибини зображень, семантичної сегментації та генерації субтитрів до зображень i відео для кіностудій Голлівуду.
Розробляв одну із перших систем автоматизації контролю розміщень товарів на полицях за допомогою нейромереж. Керував розробкою ряду проектів з автоматизованого аналізу новин різними мовами, розпізнавання іменованих сутностей, аналізу концептуального дрифту та репрезентації мовних структур за допомогою систем машинного навчання.
Впродовж останнього року працював над системою автоматичного перенесення рис людськго обличя та пози в компанії NeoCortext, а також над задачею 4х збільшення роздільності відео для кіностудій в компанії VideoGorillas.
Штучні нейромережі дозволяють майже повністю автоматизувати вирішення задач класифікації, семантичного сегментування, розпізнавання об’єктів тощо.
Такий тип моделей як generative adversarial networks дозволяє не тільки обробляти певний візуальний, аудіальний чи текстовий контент, а і синтезувати новий контент який відповідає розподілу ознак “справжніх” даних.
Цю властивість можна ефективно використовувати для синтезу персоналізованого унікального контенту “on the fly”.
На мою думку, в найближчі декілька років демократизація доступу до подібних генеративних систем докорінно змінить те як виглядатиме ринок онлайн-реклами, персоналізації контенту, відео та фото продакшену.
Із прикладів як генеративні нейромережі вже змінюють деякі індустрії: особистий досвід автоматизації відновлення останнього фільму Орсона Уелса спільно з компанією Netflix (який зайняв 2 тижні замість 6 місяців, завдяки цим методам), використання розробленої системи заміни рис обличчя для персоналізації реклами, мемів, gif-анімацій і великий ентузіазм з боку користувачів, а також приклади успішного застосування генеративних моделей для синтезу реалістичного тексту на задану тематику.
Моральні й технологічні питання які ставлять перед нами подібні технології та пропозиції щодо протидії поширенню високоякісних фейків та методи регуляції зловмисного застосування.