Google Imagen 2: AI для изображений стал еще лучше

Google Imagen 2: AI для изображений стал еще лучше

Компания Google представила новую версию своего моделя текст-в-изображение под названием Imagen 2. Разработчики и пользователи Google Cloud уже могут получить доступ к предварительной версии через API Imagen на платформе облачных вычислений Vertex AI. Для улучшения качества вывода генерируемых изображений Google использовало тренировочные данные с более детальными описаниями, что позволило модели более точно передавать настроение в картинках и более точно отрабатывать запросы. В качестве примера Google продемонстрировало изображения, созданные на основе лирических текстов и стихов. Кроме того, улучшенная версия обещает более естественное воспроизведение лиц и рук, а также модель была доработана для создания более привлекательной эстетики.

Google использовала набор тренировочных данных с оценками качества освещения, композиции, экспозиции и четкости изображений для дополнительной настройки модели под аэстетические предпочтения. Предпочтения людей легли в основу весов модели, что позволяет с большей точностью отвечать на запросы. Еще одной интересной особенностью является возможность использовать стили и узоры из референсных изображений для создания новых объектов. Первая версия Imagen 2 поддерживает английский, китайский, хинди, японский, корейский, португальский и испанский языки, а к 2024 году список будет расширен.

Следующий год обещает привнести функции Inpainting и Outpainting, которые уже довольно широко используются в других генераторах изображений. Эти техники позволяют пользователю изменять содержимое исходных или сгенерированных изображений (Inpainting) или расширять изображения за их пределы (Outpainting).

Ограничения модели Imagen 2

Как и другие современные модели, Imagen 2 содержит фильтры, предотвращающие создание изображений с насилием, непристойными или порнографическими материалами. Google тщательно проверила тренировочные данные на соответствие этим критериям, и модель также проверяет запросы и генерируемые материалы при их создании, чтобы не допустить возникновения нежелательного контента. Фильтры также направлены на предотвращение создания изображений известных личностей.

Для обозначения изображений, созданных с помощью ИИ, Google использует инструмент SynthID, который позволяет вводить водяные знаки непосредственно в пиксели сгенерированных изображений. Эти водяные знаки невидимы для человеческого глаза, однако SynthID способен их распознавать даже после применения фильтров, обрезки или изменения уровня сжатия изображения. Подобные инструменты также есть у Amazon в недавно выпущенном генераторе изображений Titan.

Конкуренция и проблемы с именованием

Стоит отметить, что модель Imagen от Google не следует путать с генератором Imagine от Meta. Более подробная информация о предварительной версии Imagen 2 доступна в документации Vertex AI.

Комментарии

Отлично! Вы успешно зарегистрировались.

Welcome back! You've successfully signed in.

You've successfully subscribed to GPTalk | AI Новости.

Проверьте свою электронную почту для личной ссылки для входа.

Ваша платежная информация была обновлена.

Ваш счет не был обновлен.