Гайд по Deep Daze и самые странные изображения из нейросети
Инструмент для генерации изображения из текста Deep Daze для преобразования использует OpenAI CLIP и Siren (сеть неявного нейронного представления). Проект выпущен под лицензией MIT и имеет на GiitHub 3,2 тысяч звездочек. Вот как с ним работать:
Минимальные системные требования для запуска:
— NVIDIA GPU;
— 4 Гб + VRAM — чем больше, тем лучше;
— Python 3.9 и выше.
Установка
- Убедитесь, что у вас установлен язык Python не ниже версии 3.9. Инструкция по проверке доступна здесь.
- Не забудьте добавить Python в PATH на первой вкладке процесса установки. В дальнейшем нужно будет использовать команду
pip
. Все версии Python выше версии 3.4 автоматически устанавливаютpip
. Чтобы проверить, установлен ли он на компьютере, нужно ввести в командной строке следующее —py –m pip –version
. - Если
pip
не возвращается версию, нужно загрузить файлhttps://pypi.org/project/pip#files
или использоватьpip get pip
в командной строке для автоматической установки. - Чтобы загрузить deepdaze, введите в командной строке следующее:
pip install deep-daze
- Для создания изображения, используйте форму
Impress TEXT flags
. Полное руководство по всем доступным флагам можно посмотреть здесь. - Пример генерации изображения:
$ imagine “mist over green hills
- Откройте командную строку от имени администратор и введите:
image “mist over green hills
Вот и все! Если у вас достаточно памяти, можно улучшить качество изображение, добавив флаг --deeper
:
$ imagine “shattered plates on the ground» --deeper
Продвинутые настройки и наложение большего количества слоев дадут лучший результат. Подробная информация по генерации более сложных изображений доступна здесь.
Подборка пользовательских генераций текста в изображение:
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: