Анатомия правильного промта для Stable Diffusion
За три года работы с нейросетями понял: 80% успеха зависит от промта. Можно потратить часы на настройки, но плохо составленный запрос всё равно даст мусор. Разберём, как писать промты для Stable Diffusion, чтобы получать именно то, что задумал.
В этом гайде — только проверенные техники. Примеры промтов, весовые коэффициенты, частые ошибки. Всё тестировал на практике.
Базовая структура промта
Промт для Stable Diffusion — это техническое описание того, что нейросеть должна нарисовать. Не поэзия, а чёткие инструкции.
Правильная структура:
1. Главный объект в начале
2. Детали и характеристики через запятые
3. Окружение и фон
4. Стиль и технические параметры
Пример: «кибер-панк девушка, неоновые волосы, кожаная куртка, на фоне ночного города, дождь, искусственное освещение, детализированный арт»
Для работы понадобится бот со Stable Diffusion — там SD работает без VPN и принимает российские карты. Проверял лично, генерирует быстро.
Главный объект — основа промта
Первые слова в промте — самые важные. Stable Diffusion читает слева направо и придаёт больше веса началу запроса.
Правильно: «космический корабль, футуристический дизайн, металлическая поверхность»
Неправильно: «в далёком космосе летит красивый корабль с блестящей поверхностью»
Во втором случае SD может сфокусироваться на космосе или абстрактной красоте, а не на самом корабле.
Весовые коэффициенты — управляем вниманием нейросети
Когда SD игнорирует важные детали, используем круглые скобки и цифровые коэффициенты.
Система круглых скобок
Каждая пара скобок увеличивает важность элемента на 10%:
(слово) = важность +10%
((слово)) = важность +20%
(((слово))) = важность +30%
Пример: «лесной эльф с ((длинными ушами)), ((изумрудные глаза)), золотистые волосы, (((волшебный лук)))»
Здесь лук получит максимальное внимание, уши и глаза — среднее, остальное — базовое.
Цифровые коэффициенты
Более точный контроль:
(длинные уши:1.2) = +20% важности
(волшебный лук:1.4) = +40% важности
(зелёные глаза:0.8) = -20% важности
Безопасный диапазон: от 0.8 до 1.4. Выше 1.5 часто даёт артефакты и шум.
Важно: Не используй больше 5 скобок на один элемент. Проверял — после (((((слово))))) начинается деградация качества.
Продвинутые техники: смешивание и мутации
Квадратные скобки позволяют создавать гибридные объекты и эффекты перехода.
Временное смешивание
Синтаксис: [объект1:объект2:время_перехода]
«[дракон:феникс:0.3] летит над вулканом»
Расшифровка: первые 30% шагов генерации SD рисует дракона, затем 70% времени трансформирует его в феникса. Получается мифическое существо с чертами обоих.
Ещё примеры:
«[робот:человек:0.4] в космическом скафандре» — киборг
«[кот:тигр:0.6] в джунглях» — домашний хищник
«[замок:руины:0.2] на холме» — полуразрушенная крепость
Настройка шагов сэмплинга
В боте со Stable Diffusion можно выбрать количество шагов: 20, 30 или 50. От этого зависит, как работает смешивание.
При 30 шагах и коэффициенте 0.3:
• 9 шагов рисуется первый объект
• 21 шаг происходит трансформация
Для сложных мутаций лучше ставить 40-50 шагов — переход получается плавнее.
Правила пунктуации и форматирования
SD капризно относится к знакам препинания. Есть жёсткие правила.
Используй только запятые. Точки, восклицательные знаки, многоточия — всё это ломает парсинг промта.
Правильно:
«средневековый рыцарь, стальные доспехи, меч в руке, готический замок на фоне, драматическое освещение»
Неправильно:
«Средневековый рыцарь! Он стоит перед замком… В руках у него меч. Очень красиво!»
Переносы строк тоже лучше не использовать — SD может интерпретировать их как разные запросы.
Оптимальная длина промта
Практический предел — 75-80 токенов (примерно 60-70 слов). Дальше SD начинает игнорировать хвост промта.
Пример промта оптимальной длины:
«киберпанк самурай, ((неоновая катана)), чёрная маска, кожаное пальто, дождливая ночь, отражения в лужах, неоновая реклама, (детализированное лицо:1.2), профессиональное освещение»
Если промт получается длиннее, лучше разбить задачу на этапы или использовать inpainting для доработки деталей.
Практические примеры промтов по категориям
Портреты людей
«молодая женщина, (волнистые рыжие волосы:1.3), зелёные глаза, веснушки, мягкая улыбка, естественный макияж, студийное освещение, портрет крупным планом»
«брутальный мужчина, борода, шрамы на лице, ((пронзительный взгляд)), кожаная куртка, драматические тени»
Фантастические существа
«огненная птица феникс, ((пылающие крылья)), золотистые перья, [пламя:перья:0.4], летит над вулканом, искры в воздухе, эпическая композиция»
«ледяной дракон, прозрачная чешуя, ((ледяное дыхание)), кристаллические рога, снежная буря, холодные тона»
Архитектура и пейзажи
«заброшенная библиотека, ((полки до потолка)), пыль в лучах света, старые книги, винтажная лестница, мистическая атмосфера»
«космическая станция, вращающиеся секции, звёзды на фоне, ((детализированная конструкция)), синие огни, футуристический дизайн»
Частые ошибки и как их избежать
Переусложнение промта
Ошибка: Пытаться описать всё в одном промте
Решение: Генерируй базовое изображение, затем дорабатывай через img2img или inpainting
Игнорирование порядка слов
Ошибка: Ставить важные детали в конец промта
Решение: Главное — в начало, детали — в середину, стиль — в конец
Злоупотребление весами
Ошибка: (((((очень важное слово))))): 2.0
Решение: Максимум 3 скобки или коэффициент 1.4
Продвинутые настройки в боте
Открываем бот с нейросетями и настраиваем параметры SD для лучших результатов.
Основные параметры:
• Шаги сэмплинга: 20-30 для быстрой генерации, 40-50 для качества
• CFG Scale: 7-12 (насколько точно следовать промту)
• Размер: 512×512 для тестов, 768×768 для финальных версий
В боте доступны разные чекпоинты SD — они специализируются на разных стилях. Realistic Vision лучше для фотореализма, Anything v4 — для аниме, DreamShaper — универсальный.
Негативные промты — что исключать
Negative prompt говорит SD, что НЕ нужно рисовать. Это мощный инструмент для улучшения качества.
Базовый негативный промт:
«ugly, blurry, low quality, distorted, extra limbs, bad anatomy, watermark, signature»
Для портретов добавляй:
«extra fingers, malformed hands, bad eyes, asymmetric face, double chin»
Для архитектуры:
«tilted horizon, distorted perspective, floating objects, unrealistic proportions»
Негативный промт работает с теми же принципами весов: (bad quality:1.3) или ((blurry)) для усиления исключения.
Готово — теперь твои промты будут работать стабильно. Помни: лучше простой понятный запрос, чем сложная конструкция, которую SD не сможет разобрать. Кстати, если интересно углубиться в работу со Stable Diffusion, вот здесь разобрано ещё несколько полезных техник.