Созданная исследователями из Университета Вашингтона нейросеть способна оживлять фрагменты статических фотографий, заставляя их двигаться, как на видео. Результаты впечатляют, а в качестве исходного материала достаточно одного изображения.
Созданный метод глубокого обучения позволяет оживить некоторые части на картинке. Это может быть любой подвижный материал, включая дым, облака и воду. После этого система создаёт плавное зацикленное видео с высоким разрешением, отличить которое от реального почти невозможно.
Разработчики отмечают, что создание технологии оказалось сложной задачей, поскольку потребовалось построить модель на основе машинного обучения. С этой целью было решено разбить алгоритм на две части, одна из которых оценивает прошлое, а другая предсказывает будущее. В итоге нейронная сеть научилась угадывать движение на видео по одному кадру.
В процессе обучения было задействовано реальное видео, а прогнозирование осуществляется на основе большого объёма информации о различных объектах. Технология будет представлена на Конференции по компьютерному зрению и распознаванию образов 22 июня.