Nvidia научила нейросеть рисовать картины по словесному описанию

02.12.2021 22:09  460   Дарья Шипневская  Новость

Она стала логичным продолжением проекта, который разработчики запустили в 2019 году.

Nvidia научила нейросеть рисовать картины по словесному описанию

Нейросеть GauGAN, которая предназначена для создания фотореалистичных изображений, была впервые представлена инженерами Nvidia ещё в 2019 году. Однако общедоступным этот инструмент стал относительно недавно, когда был интегрирован в приложение Canvas. Теперь же разработчики представили более совершенную версию алгоритма, которая способна распознавать словесное описание желаемого изображения с последующим его моделированием на основе этих данных.

Источник отмечает, что обновлённая нейросеть с большой внимательностью относится к деталям описания изображений. Алгоритм может изменять форму, размер и текстуры предметов произвольным образом, отталкиваясь от словесного описания и графических данных. В результате такого преобразования сохраняется гармоничность и полнота изображения, благодаря чему в конечном счёте создаются полноценные фотореалистичные изображения.  

Новая нейросеть обучалась на 10 млн изображений пейзажей, поэтому она способна отличать мельчайшие отличия в описании картины, учитывая их при создании конечного изображения. Любопытно и то, что система может функционировать в режиме онлайн, т.е. пользователь видит изменения по мере добавления текстовой информации. Уже сейчас ознакомиться с алгоритмом GauGAN 2.0 может любой желающий, для чего достаточно перейти на официальный веб-сайт проекта.