Нейросети

Инструменты нейродизайнера

Нейроинструментов для нейродизайнера становится всё больше, при этом какие-то из них уже даже успели отойти от дел. Во втором уроке мы познакомили тебя с несколькими приложениями, например для увеличения изображения или удаления фона. Здесь мы попытаемся собрать наиболее актуальную подборку больших ресурсов — законодателей индустрии. Смотри, читай и сохраняй в закладки браузера.

Общий список умений, которые на данный момент могут продемонстрировать AI-инструменты для дизайнера:

Animation (Анимация): создание движущегося или анимированного изображения из статичного.

Recolor (Перекрашивание): замена цветовой палитры изображения.

GPT или Copilot (Работа с текстом и информацией): автоматическое создание текста, например подписей или описаний, соответствующих содержанию изображения. Помощь в мозговом штурме, тестировании гипотез, принятии решений и других задач, связанных с текстом или поиском информации.

Большинство популярных ресурсов многофункциональны, но среди них можно выделить те, что специализируются на создании изображений или те, что делают упор на видео. Обычно их характеризуют уже знакомыми тебе терминами — text2image, text2video, image2video и другими. В этом уроке расскажем о них подробнее.

Generation (Генерация): создание новых уникальных изображений из текстового описания.

Inpainting (Дорисовка): изменение определённой области изображения, например для устранения дефектов или добавления новых элементов в уже существующую картинку.

Outpainting (Расширение): расширение изображения за его первоначальные границы, добавление новых частей к краям картины.

Upscale (Увеличение разрешения): увеличение размера изображения без потери качества.

Remove background (Удаление фона): удаление заднего фона из изображения, оставление только интересующего объекта или персонажа.

Лучшими генераторами картинок считаются DALL·E и Midjourney. По субъективным оценкам экспертов, эти нейронки побеждают по таким критериям, как количество ошибок в изображении, богатство цветовой гаммы, качество композиции и креативность.

Kandinsky от «Сбера» — довольно сильный бесплатный русскоязычный инструмент. Есть возможность, помимо веб-интерфейса, создавать картинки при помощи бота в Telegram и VK. Есть инструменты Inpainting и Outpainting (замена части картинки или дорисовка изображения за границами исходного холста). Можно генерировать короткое видео с удобным интерфейсом управления камерой. Ресурс бесплатный, поэтому иногда генерация может быть достаточно долгой.

Шедеврум от Яндекса — бесплатное приложение для телефона с функциями социальной сети. В нём можно создавать изображения и небольшие видеоролики. Результаты публикуются в ленте и видны другим пользователям. Можно ставить лайки чужим изображениям и собирать лайки своими картинками.

С английского text2image буквально можно перевести как «текст в картинку», к этой группе относятся нейронки, которые на основе текстового описания генерируют изображения. Рассмотрим два самых доступных text2image-инструмента на русском языке.

Text2image

Kandinsky

Шедеврум

DALL·E 3 от OpenAI — это один из флагманов среди категории text2image. Ресурс создаёт изображения высокого качества и способен выдать хороший результат даже при сложных креативных запросах. В России доступен через VPN, инструмент платный и работает через общение с чатом GPT-4. Поддерживает множество языков.

DALL·E 3 от OpenAI — это один из флагманов среди категории text2image. Ресурс создаёт изображения высокого качества и способен выдать хороший результат даже при сложных креативных запросах. В России доступен через VPN, инструмент платный и работает через общение с чатом GPT-4. Поддерживает множество языков.

Попробовать DALL·E 3 можно бесплатно при помощи Image Creator от Microsoft Designer по этой ссылке или непосредственно в чате Copilot Bing набрать create image и добавить описание.

Сток 123rf предлагает сгенерировать изображения в DALL·E 3. Они отображаются с водяными знаками. Чтобы скачать, нужна подписка.

Это качественные генераторы картинок, но не единственные доступные инструменты. Есть и другие нейросети. Например, Stable Diffusion завоевала популярность благодаря своей демократичности.

Для комфортной работы понадобится знание английского языка и немного времени, чтобы разобраться в командах. Генерировать изображение можно командой /imagine prompt, после которой через запятую нужно перечислить описание желаемого изображения на английском языке.

Есть инструменты инпеинтинга, аутпеинтинга и увеличения размера (upscale). У Midjourney сформировался узнаваемый стиль, который проявляется в том, что по умолчанию нейросеть выдаёт атмосферные, яркие, иногда совсем эпичные картинки с хорошей композицией и идеальной цветовой гаммой. При достаточном опыте в Midjourney получается не только сделать красивые изображения, но и визуализировать действительно креативные идеи.

Midjourney — ещё один топовый ресурс — мощный инструмент создания изображений. Для полноценной работы нужна подписка, в РФ доступен под VPN. Важной особенностью является то, что взаимодействие с нейронкой происходит через интерфейс мессенджера. Чтобы зарегистрироваться в Midjourney, нужно авторизоваться в Discord.

Midjourney

Stable Diffusion — это модель генерации изображений с открытым исходным кодом, разработанная компанией Stability AI в сотрудничестве с другими организациями и исследователями. Благодаря общедоступности пользователи могут адаптировать и модифицировать модель под свои нужды, экспериментируя с различными настройками и обучающими данными.

Модель оптимизирована для работы на обычных GPU, что делает её доступной для использования не только на мощных серверах, но и на персональных компьютерах. Stable Diffusion в отличие от предыдущих сервисов позволяет самостоятельно обучать свои модели на собственном наборе данных.

Для того чтобы запустить Stable Diffusion на своём компьютере, желательно иметь не менее 6 гигабайт GPU, знать английский язык и быть уверенным пользователем ПК.

Stable Diffusion

Пример бесплатного интерфейса для работы со Stable Diffusion, который позволяет запустить нейронку прямо на своём компьютере — Automatic 1111