Она понимает вводные на русском и английском языках. Обучение осуществлялось на 240 млн примерах, сейчас учат на 500 млн картинках
Яндекс объявил о выпуске «Шедеврума» — приложения на Android и iOS, которое генерирует изображения по текстовому запросу с помощью фирменной нейронной сети. Разработчики отмечают, что ИИ принимает вводные на русском и английском языках, а чем детализированнее запросы, тем точнее результат.
Нейросеть Шедеврума работает по методу каскадной диффузии, то есть сначала алгоритм создаёт картинку согласно запросу, а на последующих этапах насыщает её деталями, при этом повышая разрешение. Первую версию нейросети обучали на 240 млн примеров картинок с текстовыми описаниями, а сейчас обучение продолжается на 500 млн примерах, так что в будущем качество будет постепенно повышаться.
«Мы пока в самом начале пути. В основе Шедеврума прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только. Бета-тест приложения для пользователей — это новый опыт и немного хорошего настроения, для нас — возможность чуть лучше понять, в каком направлении развивать нейросеть дальше», — заявил руководитель управления машинного интеллекта и исследований Яндекса Алексей Гусаков.
Для просмотра генераций нужно скачать приложение «Шедеврум» на Android или iOS — в ленте получится лайкать картинки, самым популярным отведена отдельная вкладка. Для получения возможности генерировать картинки по собственным запросам, нужно оставить заявку и дождаться её подтверждения. В будущем эта возможность появится у всех пользователей.
Источник trashbox