Внимание, дальше читать не имеет смысла если вы первые слышите про AUTOMATIC1111 и не читали хотя бы первую часть. Это плюсовое самоубийство, но что поделать. Прежде чем анимировать нейро танцы нужно показать основы.
Styles это способ сэкономить время на набор промпта. Пользоваться просто. Покажу на примере негативного. Заполняем только негативное поле(текст оставлю ниже). Нажимаем на дискету (на этом моменте олды пускают слезу), вбиваем желаемое имя. Ок.
deformed, bad anatomy, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, disgusting, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, blurry, ((((mutated hands and fingers)))), watermark, watermarked, oversaturated, censored, distorted hands, amputation, missing hands, obese, doubled face, double hands, asian, b&w, black and white, sepia
Теперь нам не нужно каждый раз вбивать все самому, просто в выпадающем меню выбираем наш стиль, удаляем то что писали, добавляем в запрос что мы хотим видеть. Генерируем
Советую запоминать что вы там понаписали. Потому что например там есть слово asian. Не потому что мы расисты, а потому что попробуйте убрать, 80% генераций в некоторых сценах будут с азиатами =). Но если вы хотите человека из этой этнической группы, то делаем вот что.
Нажмите на кнопку левее дискеты. Все что в ваших стилях перенесется в поле промптов. Удалите то что для вас сейчас лишнее, добавьте то что вам сейчас нужно. Удобно? Еще бы.
Теперь, когда мы обладаем этими знаниями, идем воровать. Воровать будем у меня.
Сразу хочется сказать. Делитесь своими промптами, используйте чужие, для этого они и выкладываются, экспериментируйте. Нейросетевой арт можно сказать только зарождаются и вместе мы сможем развивать его быстрее чем по одному. Каждый день кто-то находит удачный стиль, пишет скрипты, перемешивает модели между друг другом чтобы наши руки были развязаны, и мы могли бы получать в точности то что мы хотим с меньшими усилиями.
Дальше будет просто один из примеров, найти чужие нейроарты можно много где. Идем на сайт civitai.com помните его? Мы тут нашу модель качали. Идем на страницу с моделью(есть NSFW контент), листаем на работы пользователей которыми они поделились. Вот ссылка на мои. https://civitai.com/models/4823?modal=reviewThread&reviewId=10791
Листаем и вы такие, хммм, интересная цветовая палитра. Как он это сделал? 🤔🤔🤔. Следим за руками.
И что мы видим? Что генерируется совершенно другой результат? А почему? Потому что некоторые люди не очень внимательные, да это я про себя.
Внимательно посмотрим на то что скопировали. Проблемное место я выделил жирным:
(Rough Photo:1.3) of (Ultra detailed:1.3),(Proud:1.3) cyberpunk girl leaning a graffiti wall,(by Artist Gil Elvgren:1.3),Highly Detailed,(50s Art:1.3),(Blue hue:1.3), upper body, detailed skin, detailed eyes, realistic eyes, 20 megapixel, canon eos r3, detailed skin, detailed face, (TungstenDispo:1.2), raw photo, portrait of a business woman, (style by Flora Borsi), bold, bright colours, blue Mohawk haircut, ((Flora Borsi)), dslr, dramatic lighting, high quality, film grain, Fujifilm XT3, (strong backlight:1.1), analog style (liminal space), by Syd Mead, by Andr Kertsz, by Tadao Ando
Negative prompt: Amateur,Low rated, Phone, Wedding, Frame, Painting, tumblr, watermark, signature, 3d, ugly eyes, 2 people, deformed iris, deformed eyes, bad eyes, (disfigured), (bad art), (deformed), (poorly drawn), (extra limbs), (close up), strange colours, blurry, boring, sketch, lackluster, face portrait, signature, letters, watermark, grayscale, moody lighting, cartoon, busy, people
Size: 512x512, Seed: 3376955184, Model: realisticVisionV13_v13VAEIncluded, Steps: 20, Sampler: Euler a, CFG scale: 3, Model hash: c35782bad8, Hires upscale: 2, Hires upscaler: ESRGAN_4x, Denoising strength: 0.51
Мы на странице модели Deliberate, но я случайно загрузил туда картинку, которую генерировал на другой. Из-за чего результат и отличается. Так что когда у вас происходит подобное убедитесь что модели совпадают. Есть еще причины для отличий, но о них в другой раз.
Но мы пришли за стилем. Смотрим в промпт еще раз и копируем то что не относится к сюжету сцены:
(Rough Photo:1.3) of (Ultra detailed:1.3),(Proud:1.3) cyberpunk girl leaning a graffiti wall,(by Artist Gil Elvgren:1.3),Highly Detailed,(50s Art:1.3),(Blue hue:1.3), upper body, detailed skin, detailed eyes, realistic eyes, 20 megapixel, canon eos r3, detailed skin, detailed face, (TungstenDispo:1.2), raw photo, portrait of a business woman, (style by Flora Borsi), bold, bright colours, blue Mohawk haircut, ((Flora Borsi)), dslr, dramatic lighting, high quality, film grain, Fujifilm XT3, (strong backlight:1.1), analog style (liminal space), by Syd Mead, by Andr Kertsz, by Tadao Ando
Negative prompt: Amateur, Low rated, Phone, Wedding, Frame, Painting, tumblr, watermark, signature, 3d, ugly eyes, 2 people, deformed iris, deformed eyes, bad eyes, (disfigured), (bad art), (deformed), (poorly drawn), (extra limbs), (close up), strange colours, blurry, boring, sketch, lackluster, face portrait, signature, letters, watermark, grayscale, moody lighting, cartoon, busy, people
Size: 512x512, Seed: 3376955184, Model: realisticVisionV13_v13VAEIncluded, Steps: 20, Sampler: Euler a, CFG scale: 3, Model hash: c35782bad8, Hires upscale: 2, Hires upscaler: ESRGAN_4x, Denoising strength: 0.51
portrait of a business woman я бы тоже исключил, но не заметил во время создания гайда
Выставляем желаемые настройки, вписываем свой сюжет и вуаля. Можем сохранить как стиль и использовать.
Результат этой генерации:
Посмотрим что получили. Далеко не идеально. Лицо слишком игрушечное. Ну и руки... Про руки не влезем в статью, поэтому в другой раз, а пока давайте улучшать лицо.
Первое что нужно понять это как обучалась нейросеть. Упрощенно ей скормили кучу фотографий с размеченными данными что на ней изображено. cat, fur, table, window, pot. Вводим cat получаем представление как нейросеть видит cat.
woman is sitting on a chair next to a big window, (by Artist Gil Elvgren:1.3), Highly Detailed,(50s Art:1.3),(Blue hue:1.3), upper body, detailed skin, detailed eyes, realistic eyes, 20 megapixel, canon eos r3, detailed skin, detailed face, (TungstenDispo:1.2), raw photo, portrait of a business woman, (style by Flora Borsi), bold, bright colours, blue Mohawk haircut, ((Flora Borsi)), dslr, dramatic lighting, high quality, film grain, Fujifilm XT3, (strong backlight:1.1), analog style (liminal space), by Syd Mead, by Andr Kertsz, by Tadao Ando
Кто видит тут преступление против реализма?
Вот оно "realistic eyes". Под какой картинкой нейросеть могла увидеть такой тег? Под рендером или под картиной. Никто не пишет под фотографией realistic eyes. Поэтому такие и подобные им лучше перемещать в негативный prompt. Photorealistic, render, 3d, painting, cgi, doll и подобное сделают вашу модель игрушечной и место им в негативном промпте.
Что еще поможет? Часто лица слишком идеальные. Это надо исправлять! Добавляйте дефекты. Например (freckles, moles, skin pores:0.9) (пер: веснушки, родинки, поры кожи). Так же рекомендую изменить семплер с дефолтного "Euler a" например на "DPM++ 2M Karras". Так как первый любит мылить картинку.
По поводу проблем. Если попытаетесь скопировать мой сюжет, то с высокой долей вероятностей будете получать перекрученных мутантов. Так как поза сидеть часто связана с перекрытием конечностей друг другом что для нейросети на данном этапе в общем-то проблема. НО несколько дней назад вышел инструмент который способен эту проблему решить(я ведь уже говорил что что-то появляется буквально каждый день?), но это тема для отдельной статьи. Затравка вот.
Нейросети меня неплохо увлекли, если вас тоже приглашаю в телеграмм группу где сможем обсуждать проблемы, нововведения, делиться своими работами, опытом и учиться друг у друга. https://t.me/neuralphotoart_chat.
И канал где я выкладываю гайды чуть раньше чем тут(просто потому что там начал раньше) и картинки, которые могут нарушать правила площадки https://t.me/neuralphotoart.