Google представил новый инструмент на основе ИИ под названием 'Whisk', который позволяет пользователям загружать фотографии в качестве подсказок для создания новых изображений. Сегодня этот инструмент доступен только в США.
На днях Google анонсировал свой новый инструмент, работающий немного иначе, чем большинство генераторов изображений, которые требуют длинного текстового описания. С помощью Whisk пользователи могут создавать изображения, используя другие фотографии в качестве подсказок, что позволяет "перемешивать" их для создания новых работ.
Пользователи Simply перетаскивают изображения в интерфейс Whisk, а система сама генерирует новое изображение. Whisk позволяет задавать темы, сцены и стили AI-генерируемой иллюстрации, предлагая возможность использовать несколько изображений для каждой из этих элементов. Если у пользователей нет своих изображений, они могут воспользоваться иконкой с кубиком, чтобы получить AI-генерированные картинки в качестве подсказок.
По завершении процесса, если пользователь доволен результатом, он может сохранить или загрузить изображение. В противном случае доступна функция уточнения изображения путём редактирования текстовой подсказки. За работой Whisk стоит искусственный интеллект Google Gemini и изображенческий генератор Imagen, который помогает создавать новые визуализации, преобразуя загруженные изображения в детализированные текстовые подсказки.
В блоге Google сообщается, что Whisk предназначен для "быстрого визуального исследования, а не для точных редактирований". Разработчики предупреждают, что иногда инструментарий может не совсем соответствовать ожиданиям, поэтому предусмотрена возможность редактирования базовых подсказок.