Если пару лет назад сгенерированные фото вызывали только недоумение, то сейчас, когда нейросети вышли на новый уровень, такие изображения стали трендом.
Это неудивительно. Получить идеальный снимок с первого раза непросто: то не подходящий ракурс, то не тот свет, то в кадр попали люди — убрать эти помехи можно с помощью нейросетей. Рассмотрим, как они работают.
В основе ИИ-фото лежит диффузионная модель — тип генеративной нейросети, создающий изображения через поэтапное «очищение» случайного шума. Если проще, нейросеть анализирует композицию, сочетание цветов, освещение и текстуру тысячи фотографий. А уже при генерации создает грубое приближение, детализирует и улучшает композицию. Этот процесс похож на рисование: сперва мы делаем набросок, затем добавляем штрихи и убираем лишнее.

Итак, когда ИИ выбран, отправьте снимок и напишите промпт — это описание будущего изображения. Как правило, чем он конкретнее, тем лучше результат. Добавьте в запрос детали: фон, технические параметры (формат изображения, качество), стиль (акварель, цифровая живопись, ретро и другие). В интернете можно легко найти образцы промптов и на их основе написать свой.
Вот так это выглядит на практике:

После отправки промпта остается ждать, в среднем генерация снимков занимает не более десяти минут. Хотите добавить на фото кого-то еще? Смело загружайте его изображение, будь то реальный человек или персонаж из игры. Ограничений нет, все зависит от вашей фантазии!
Казалось бы, одни плюсы — скорость, смена образов и стиля, возможность воплотить в жизнь идеи, которые трудно или затратно реализовать. К примеру, для исторической съемки в замке нужен не только фотограф, но и реквизит. С нейросетью такая необходимость отпадает. Да и в целом генерация фото — отличная возможность поменять аватарку в соцсетях.
Но несмотря на преимущества сгенерированных фото, у них есть и существенные недостатки. Среди типичных проблем: искаженные пропорции тела, лишние пальцы, размытые и необработанные детали, неправильные тени и свет, да и лицо получается не всегда похожим — все это делает снимок неестественным. Кроме того, в таких изображениях нет ни эмоций, ни истории «за кадром», что превращает изображение в бездушную картинку.
Пусть и технологии способны творить чудеса, но стоит помнить, что именно настоящие фотографии хранят воспоминания. Нейросети — инструмент, а не замена живым кадрам.
Фото на обложке: unsplash