Сообщество - Искусственный интеллект

Искусственный интеллект

4 218 постов 11 107 подписчиков

Популярные теги в сообществе:

Пост удален администрацией (запрещенный к публикации контент)1

2

Как из горизонтального видео сделать вертикальное в Runway для TikTok, Reels или Shorts?

Как из горизонтального видео сделать вертикальное в Runway для TikTok, Reels или Shorts? Нейронные сети, Короткие видео, Вертикальное видео, Искусственный интеллект, Видео, Длиннопост

Нашёл простой способ адаптировать горизонтальное видео под вертикальный формат.

🛠 Всё просто:

1. Загружаешь видео в Runway.

2. В настройках модели выбираешь Gen-3 Alpha Turbo — самая быстрая и стабильная под эту задачу.

3. Слева нажимаешь "Expend video" — это кнопка, которая расширяет видео по краям.

4. Жмёшь «Generate». И... вуаля! Видео растянуто под вертикаль, готово к TikTok или Reels.

Как из горизонтального видео сделать вертикальное в Runway для TikTok, Reels или Shorts? Нейронные сети, Короткие видео, Вертикальное видео, Искусственный интеллект, Видео, Длиннопост

Было:

Стало:

💸 По кредитам:

Сделать 1 видео стоит 50 кредитов = ~44 рубля. Не дешево, но красиво.

📡 Кстати, у меня есть AI-сообщество в Telegram. Делимся примерами работ, свежими находками, шаблонами промптов и разбираем, как нейросети реально помогают в работе и творчестве. Без воды, понтов и стыда. Только практика, поддержка и движ. Если ты как раз на волне AI — присоединяйся, будем расти вместе.

🚀 В Telegram-сообществе уже есть:

• 150+ участников — и каждый день нас становится больше

• Записи уроков + PDF-конспекты и статьи

• Шаблоны промптов (копируй — вставляй)

• Новости клуба и анонсы

• Чат поддержки и живое комьюнити — можно задать любой вопрос и не бояться быть непонятым или непринятым, потому что в клубе действуют правила.
Залетай!

Показать полностью 2 2
3

Задача из 5 класса, которая ломает ChatGPT и ему подобных

Я достаточно часто пишу и обсуждаю с коллегами про то, как использовать нейросети с пользой — для работы, бизнеса и жизни. И почти в каждом втором обсуждении кто-то пишет что-то вроде: «Да что вы от него хотите, это же просто болтающий калькулятор. Просто много рассуждает, врет и думать не умеет».

Конечно, есть тут частичка правды. Особенно страдает качество, если применять «ИИ» к задачам «на логику».
Вот, например, посмотрим как «ИИ» справляются с задачкой из 5 класса мат. школы.  Я ее использую её как мини-тест, когда выходит новая модель, чтобы проверить рекламные обещания:


см. Задачу 14 (Кстати, можете попробовать ее решить. Я лично пока нашел 2 способа. )

Задача из 5 класса, которая ломает ChatGPT и ему подобных ChatGPT, Искусственный интеллект, Логика, Длиннопост

Я загонял ее в разные модели — от GPT до Grok и Gemini. Они начинают бодро рассуждать, но потом, почти всегда, произносят магическую фразу:

«Взвесим кучу A и кучу B. Если они равны, значит фальшивые монеты в куче C нет.»

И это, конечно, ошибка.
Потому что фальшивки могут быть и в куче C — обе сразу.
То есть модель сделала логично построенный с точки зрения языка и контекста, но абсолютно ложный вывод.

(полное решение от ChatGPT см. ниже)

Чем мне эта информация помогает в применении LLM:

  1. Постоянно при решении своих задач напоминаю себе, как работает Большая Языковая Модель. Это не мыслитель, а предсказатель следующего слова c учетом контекста.У него нет пока понимания задачи, только языковая статистика.
    Минус при использовании: Все чаще замечаю ситуации, когда мне лень проверять ответ (это может стать проблемой при частом использовании).

  2. Заранее думаю, какой тип задачи подать в ллм для эффективного использования и как.
    Например, стоит ли давать условия по шагам? Или лучше использовать формат цепочки рассуждений (Chain-of-thought)?
    Поштурмить — ок. Но если задача требует чёткой логики и шагов — стараюсь действовать аккуратно.


Решение от ChatGPT:

«Давай внимательно разберем задачу 14:

Условие:

  • Есть три кучки монет:

    • Первая кучка — 18 монет

    • Вторая кучка — 23 монеты

    • Третья кучка — 27 монет.

  • Среди всех этих монет есть две фальшивые монеты.

  • Фальшивые монеты легче настоящих, но одинаковы по массе между собой.

  • Настоящие монеты одинаковы по массе.

  • Нужно за два взвешивания на чашечных весах (без гирь!) определить, в какой кучке находятся только настоящие монеты.

Поскольку известно, что только в одной из куч нет фальшивых монет, а две другие содержат две фальшивые монеты (возможно обе в одной, возможно по одной в каждой), то нам нужно определить „настоящую“ кучку.

Обозначим кучки:

  • A — 18 монет

  • B — 23 монеты

  • C — 27 монет.


Стратегия:

1️⃣ Первое взвешивание:

Возьмем любые две кучки и сравним их массу. Например:

Сравним B (23 монеты) и C (27 монет):

  • Если весы в равновесии — значит в обеих кучках нет фальшивых монет → тогда кучка A (18 монет) обязательно содержит обе фальшивые монеты, а настоящая кучка любая из B или C.

  • Если одна из чаш окажется легче — значит в этой кучке есть хотя бы одна фальшивая монета.

2️⃣ Второе взвешивание:

Теперь выбираем одну из кучек из первого взвешивания и сравниваем её с A.

Например, если оказалось, что B легче C, то делаем:

Сравниваем B и A.

  • Если теперь B и A весят одинаково, значит все фальшивки были в C → A — настоящая.

  • Если снова B легче, значит в B находятся фальшивые монеты → настоящая кучка — C.

  • Если B тяжелее A — значит фальшивки были в A → настоящая кучка — B.


Таким образом, за два взвешивания мы можем однозначно определить, где настоящие монеты.»


Несмотря на этот откровенный «косяк», есть множество задач, гре нейросеть Мегаэффективна. Такие кейсы я для себя коллекционирую и выкладываю сюда: 👉  Каталог полезных кейсов по эффективному применению ИИ на работе и жизни

Показать полностью 1

10 повседневных профессий, которые уже используют ИИ (и вы об этом не догадываетесь)

Привет! На связи Стас.

Если тебе кажется, что искусственный интеллект — это игрушка для айтишников, спешу тебя удивить: ИИ уже давно стал “второй парой рук” для кучи профессий, от электрика до учителя. И вот где он реально работает👇

10 повседневных профессий, которые уже используют ИИ (и вы об этом не догадываетесь) ChatGPT, Искусственный интеллект, Длиннопост

1. Электрик

Как помогает:
— Быстрый расчёт допустимой нагрузки (например, через ChatGPT или профильные боты):
Промт: “Рассчитай, какую максимальную нагрузку можно подключить к медному кабелю сечением 2,5 мм² на 220В.”
— Автоматическое составление схем подключения по заданным условиям:
Промт: “Сделай схему разводки для трёхкомнатной квартиры, где есть розетки, свет и кондиционер.”
— Перевод и пояснения к зарубежным инструкциям:
Промт: “Объясни, что значит пункт 3.2 в этой технической документации (вставить текст).”


2. Учитель

Как помогает:
— Генерация планов урока:
Промт: “Сделай поурочный план по биологии для 7 класса на тему ‘строение клетки’.”
— Проверка сочинений на плагиат и ошибки:
Промт: “Проверь это сочинение на уникальность и орфографию (вставить текст).”
— Подбор интерактивных заданий:
Промт: “Придумай 5 интерактивных упражнений по теме ‘экология’ для школьников.”


3. Врач

Как помогает:
— Анализ снимков (с помощью специализированных сервисов, например, Google Med-PaLM, DeepMind, отечественные сервисы):
Промт: “Посмотри на это изображение грудной клетки и оцени вероятность пневмонии.”
(Сервисы требуют загрузки снимка — многие работают через API или веб-интерфейс.)
— Объяснение сложных диагнозов пациенту:
Промт: “Поясни, что значит ‘дислипидемия’ простыми словами для пациента 50 лет.”
— Быстрый поиск новых клинических исследований:
Промт: “Дай список свежих публикаций по лечению гипертонии за 2024-2025 год.”


4. Маркетолог

Как помогает:
— Генерация рекламных текстов:
Промт: “Напиши три варианта объявления для Instagram про курс английского для детей.”
— Анализ рынка конкурентов:
Промт: “Сравни предложения топ-5 конкурентов в нише онлайн-курсов по программированию.”
— Идеи для креативов и визуалов (DALL·E, Midjourney):
Промт: “Сгенерируй картинку: современная семья за завтраком, ярко и дружелюбно, горизонтальный формат.”


5. Строитель/прораб

Как помогает:
— Расчёт материалов:
Промт: “Рассчитай, сколько кирпичей потребуется для стены длиной 10 м, высотой 3 м и толщиной в полкирпича.”
— Создание смет и графиков:
Промт: “Сделай пример сметы на ремонт ванной комнаты площадью 5 м².”
— Перевод сложных инструкций:
Промт: “Переведи и объясни кратко инструкцию к немецкому смесителю.”


6. Бухгалтер

Как помогает:
Подготовка шаблонов и форм для отчётов:
Промт: “Составь пример налоговой декларации для ИП на УСН за 2024 год.”
Проверка логики и поиск ошибок в документах:
Промт: “Проверь, всё ли правильно заполнено в этой таблице расходов (вставить данные).”
Отслеживание новых правил и законов:
Промт: “Какие изменения по НДС вступили в силу в 2025 году для малого бизнеса?”


7. Дизайнер

Как помогает:
— Генерация идей и референсов (Midjourney, DALL·E):
Промт: “Создай обложку для подкаста про ИИ в стиле минимализм, с синими и белыми цветами.”
— Автоматическая цветовая палитра:
Промт: “Подбери 5 гармоничных цветовых сочетаний для сайта про психологию.”
— Удаление фона и обработка фото:
В Canva, Photoshop — инструменты на основе ИИ (“удалить фон”, “улучшить фото”).


8. Переводчик

Как помогает:
— Перевод с адаптацией стиля:
Промт: “Переведи этот текст на английский, чтобы звучал дружелюбно и неформально (вставить текст).”
— Проверка на соответствие терминологии:
Промт: “Проверь текст на использование юридических терминов (вставить текст).”
— Автоматическое озвучивание перевода:
Сервисы типа Voice.ai, ElevenLabs.


9. Юрист

Как помогает:
— Генерация типовых договоров:
Промт: “Составь шаблон договора аренды помещения между ИП и ООО, Россия, 2024 год.”
— Поиск судебной практики:
Промт: “Найди решения судов по вопросам расторжения трудового договора за 2023-2024 гг.”
— Пояснение сложных правовых терминов:
Промт: “Объясни, что значит ‘ретроактивность’ простыми словами.”


10. HR-специалист

Как помогает:
— Быстрая сортировка резюме:
Промт: “Проанализируй 10 резюме и выдели кандидатов с опытом работы в ИТ от 2 лет.”
— Генерация шаблонов писем кандидатам:
Промт: “Напиши письмо-отказ для кандидата, чтобы оно звучало уважительно.”
— Сценарии собеседований:
Промт: “Составь 7 вопросов для собеседования на позицию маркетолога.”


💬 А теперь твой ход!

В какой профессии ты работаешь? Как тебе помогает ИИ или где видишь ему применение?
Делись своими кейсами, промтами и лайфхаками в комментариях — лучшие разберу и добавлю в отдельный пост!

P.S. Подписывайся на мой канал https://t.me/NeuroRennesans — там ещё больше реальных кейсов и свежих фишек по нейросетям.

Показать полностью 1
3

Ложь у ИИ можно снизить, дыра в безопасности OpenAI, увольнение 10 000 разрабов

Привет! С вами ежедневные новости искусственного интеллекта от AIvengo. И сегодня у нас в выпуске

OpenAI увольняет своих инженеров безопасности и выпускает модели без тестов

Исследователи OpenAI нашли нейронные паттерны токсичного поведения ИИ

Греция проводит первую Олимпиаду человекоподобных роботов

Instagram блокирует тысячи аккаунтов из-за ошибок ИИ-модерации

И другие интересные новости про ИИ.

Мой YouTube-канал с ежедневными выпусками новостей ИИ.

3

Как сгенерировать видео с лицом человека по фото и с любым сценарием

Недавно Снуп Догг добрался до нейросетей. Теперь его контент в соцсетях выглядит примерно так.

Как сгенерировать такое же видео с лицом вашего друга за пару минут?

1.Переходим в aiGam бот

2. Нажимаем старт и сразу присылаем фотографию с лицом человека, которого хотим оживить или преобразить и выбираем режим фото-будка
3. Текстом пишем в бот желаемый результат. Допустим «человек ползет по стене на руках и ногах»

Бот сгенерирует всё, что вы ему пропишите. Особенно популярно у девушек улучшать свои образы и менять фон на фото.

Как сгенерировать видео с лицом человека по фото и с любым сценарием Видеомонтаж, Нейронные сети, Компьютерная графика, Дизайнер, Openai, Deepfake, Сгенерировано, Обои на рабочий стол, Midjourney, Тренд, Видео, Вертикальное видео, Короткие видео, Без звука, Telegram (ссылка), Длиннопост
Показать полностью 1 2
17

Новое обновление Midjourney: V1 Video Model — теперь можно оживлять любую картинку (даже свою)

Midjourney выкатили новую модель — V1 Video Model. Теперь можно нажать одну кнопку, и твоя картинка начинает двигаться.

Камера едет, объекты двигаются, всё будто оживает. Работает даже с чужими картинками или со своими фотками.

Вот сгенерил такую фэшн-диву в стиле Gucci — теперь думаю:
а что если попробовать её оживить?
Сделать короткое видео: 5–10 секунд, как будто отрывок из модной съёмки. А давайте так и сделаем!

Новое обновление Midjourney: V1 Video Model — теперь можно оживлять любую картинку (даже свою) Midjourney, Нейронные сети, Генерация видео, Генерация изображений, Обновление, Анимация, Видео, Без звука, Вертикальное видео, Короткие видео, Длиннопост

Наводим курсор на картинку — появляется кнопка Animate. Скромная такая, но с большими амбициями. Именно она запускает магию.

Новое обновление Midjourney: V1 Video Model — теперь можно оживлять любую картинку (даже свою) Midjourney, Нейронные сети, Генерация видео, Генерация изображений, Обновление, Анимация, Видео, Без звука, Вертикальное видео, Короткие видео, Длиннопост

После нажатия Animate, Midjourney выдал четыре видео с этой красоткой — по 5 секунд каждое.
Каждое — с разным движением камеры: то лёгкий поворот, то плавный наезд.
Выглядит кинематографично, но есть нюанс: всё это в 480p, как будто ты снова в 2007 и качаешь клип через торрент.

Новое обновление Midjourney: V1 Video Model — теперь можно оживлять любую картинку (даже свою) Midjourney, Нейронные сети, Генерация видео, Генерация изображений, Обновление, Анимация, Видео, Без звука, Вертикальное видео, Короткие видео, Длиннопост

🖼️ Из всех четырёх вариантов — вот этот мне зашёл больше всего.
Камера двигается плавно, свет играет по ткани, а сама модель будто на секунду оживает.
5 секунд чистой глянцевой магии 👇

📈 Если видео нравится — его можно продлить.
Наводишь на ролик — появляется кнопка Extend Auto (или Manual, если хочешь сам рулить движением).

Я выбрал авто — просто нажал, и Midjourney добавил ещё 4 секунды движения.
Можно так продлевать максимум 4 раза, то есть дойти до 20 секунд живого ролика.
На фоне 5-секундных обрывков это уже почти кино 😎

Новое обновление Midjourney: V1 Video Model — теперь можно оживлять любую картинку (даже свою) Midjourney, Нейронные сети, Генерация видео, Генерация изображений, Обновление, Анимация, Видео, Без звука, Вертикальное видео, Короткие видео, Длиннопост

🎥 Ну и вот, финальный вариант — я немного продлил ролик через Extend Auto, получилось уже 9 секунд.
Как по мне, вышло не дурно 👇

Давайте попробуем оживить свое личное фото.

🔘 Что делает кнопка “Videos” в Midjourney?

Кнопка “Videos” в правом верхнем углу галереи переключает отображение с обычных статичных изображений на анимированные работы, созданные через V1 Video Model.

После нажатия:

Видишь только видео-работы, сгенерированные через новую функцию Animate (V1 Video Model).

Это может быть:

Оживлённая картинка (image-to-video),

Видео с движением камеры (auto или manual),

Продлённые анимации через функцию Extend.

Новое обновление Midjourney: V1 Video Model — теперь можно оживлять любую картинку (даже свою) Midjourney, Нейронные сети, Генерация видео, Генерация изображений, Обновление, Анимация, Видео, Без звука, Вертикальное видео, Короткие видео, Длиннопост

Я выбрал картинку, где девушка стоит у двери с дерзким видом и надутым пузырём, и перетащил её в поле Starting Frame — это как бы начальный кадр, из которого Midjourney будет делать видео.

Дальше прописал, что хочу: пузырь лопается у неё на губах, она смеётся и закрывает глазок на двери рукой — всё в лёгком, игривом настроении, как сцена из тинейджерской комедии 90-х.

Новое обновление Midjourney: V1 Video Model — теперь можно оживлять любую картинку (даже свою) Midjourney, Нейронные сети, Генерация видео, Генерация изображений, Обновление, Анимация, Видео, Без звука, Вертикальное видео, Короткие видео, Длиннопост

В итоге получилось почти всё, как задумывал: пузырь действительно лопается, она улыбается, атмосфера передалась точно.
Вот только момент с рукой и глазком Midjourney решил проигнорировать — видимо, он был занят жвачкой 😏

🧩 Вывод простой:
Midjourney наконец-то научился не только рисовать, но и шевелиться. Это не просто «фича ради фичи» — это полноценный новый слой выразительности.

Да, пока сыровато: 480p, кредитов жрёт не по-детски. Но сам факт, что ты можешь за пару кликов превратить картинку в видео — уже мощно. Особенно если любишь сторителлинг, стиль и эксперимент.

⚡️ Потенциал у фичи огромный. Не кино, конечно. Но что-то вроде модного TikTok-режиссёра у тебя в браузере — точно.

Дальше будет только круче. Ну а пока — жмём Animate и смотрим, как нейросети учатся дышать.

📌 Если тебе зашло и хочется глубже нырнуть в тему — приглашаю в своё Telegram-сообщество. Это не просто чат, а целый микрокосмос для тех, кто кайфует от нейросетей и визуального творчества:

🚀 Уже 140+ участников и каждый день прибавляется
📚 Записи уроков, PDF-конспекты, статьи
📎 Готовые шаблоны промптов — бери и вставляй
🗞 Анонсы, новости, апдейты
💬 Живой чат без токсичности — можно задавать любые вопросы и делиться своими работами
💡 Полезные фишки, сервисы, инсайты
🎨 Отдельный чат с примерами AI-работ — вдохновляем друг друга

Присоединяйся, если хочется практики, общения и визуального кайфа — без снобства и мусора.

Показать полностью 6 3

Искусственный интеллект друг или враг?



Искусственный интеллект (ИИ) становится неотъемлемой частью нашей жизни. Он уже используется в медицине, финансах и даже в творчестве. С одной стороны, ИИ может значительно улучшить качество жизни, автоматизируя рутинные задачи и помогая в принятии решений. Например, алгоритмы могут анализировать медицинские данные быстрее и точнее, чем человек, что спасает жизни.

С другой стороны, существует множество опасений по поводу ИИ. Некоторые эксперты предупреждают о рисках потери рабочих мест и возможных злоупотреблениях технологиями. Этические вопросы, связанные с ИИ, также требуют внимания. Как обеспечить, чтобы технологии служили на пользу человечеству, а не во вред?

Таким образом, ИИ — это инструмент, который может как помочь, так и навредить. Важно найти баланс и разработать этические нормы для его использования.

А сколько у вас?

Вы когда-нибудь считали, сколько экономите с вашим кешбэком и скидками? Предлагаем провести небольшие вычисления (потому что считать выгоду всегда приятно).

Реклама Реклама. ПАО «Банк ВТБ», ИНН: 7702070139

4

Лучшие AI-модели для генерации изображений (мой личный рейтинг по всем-всем моделям рынка)

Лучшие AI-модели для генерации изображений (мой личный рейтинг по всем-всем моделям рынка) Midjourney, Flux, Нейронные сети, Чат-бот, Telegram (ссылка), Длиннопост

Недавно я делал обзор по текстовым моделям, а теперь — визуал! Всё основано на моём практическом опыте и сотнях картинок. Ваше эстетическое чувство может быть другим, но вот мой топ и их краткое:

🥇 ТОП-модели

1. Flux (семейство моделей от Black Forest Lab - BFL)

Описание:

Flux Pro Ultra 1.1 — на данный момент самая фотореалистичная модель. Используя параметр raw, можно получить максимально реалистичные и естественные фото.

Версии:

* PRO — стабильное качество. Полностью закрытая модель.

* DEV — дешевле, качество возможно при подборе промптов. Открытая некоммерческая модель (если использовать на своём сервере, а не на replicate/fal/freepik, то BFL требует 40% прибыли)

* Schnell — модель с лицензией на коммерческое использование (можно поставить на свой сервер без оплаты), но очень слабая. Поэтому сообщество дотренировало её множества кастомных моделей более достойных моделей (Flex, Chroma и др.)

Лоры:

* PRO: только через API Black Forest Labs, максимум 1000 шагов (результат не понравился)

* DEV/Schnell и производные модели поддерживают лоры, тренировать можно локально, на Replicate (дешевле), Fal (дороже) или Krea (нельзя скачать веса). Тренировка от 2-3 минут.

Фичи:

* Flux Kotext: позволяет по текстовому промпту менять фон, погоду, возраст, добавлять/убирать предметы, переносить одежду и лицо по 1 фото (не идеально).

Доступ:

Black Forest Labs, Replicate, Fal.ai, Krea.ai

Цена:

От 2 до 6 центов за картинку

---

2. Midjourney V7

Описание:

Самая эстетичная модель. По умолчанию делает киношную картинку, люди выглядят как фотомодели.

Версии:

* Актуальны подвиды V6 и сама V7, есть возможность настройки параметров для большего реализма, хаотичноссти, детализации и так далее

Лоры:

* Лор нет, вместо этого можно натренировать свою стилистику-настройку или использовать чужую.

Фичи:

* Omni-reference: перенос предметов и людей по одному фото.

* Смена стиля, замена фона, добавление и удаление объектов.

Доступ:

Через сайт, Discord и сторонние сервисы (например, apiframe), API нет.

Цена:

От 3-4 центов (на relax-режиме на V6.1 можно генерировать сколько угодно).

---

3. Imagen v4

Описание:

Закрытая модель с отличным соотношением цена/качество, чем-то средним между Flux и Midjourney. Раньше генерила чернокожих индейцев и все над этим смеялись, сейчас стабильное качество.

Лоры:

* Нет

Фичи:

* Отлично слушается промпта, стабильное качество.

Доступ:

Есть на fal.ai и replicate, а также по официальному API от Google

Цена:

2,4,6 центов (fast/regular/ultra)

---

4. Recraft v3

Описание:

Создана бывшей сотрудницей Яндекса, заточена под дизайнеров — генерация маскотов, логотипов, рисованных картинок, 3D-объектов.

Лоры:

* Нет

Фичи:

* 50 бесплатных генераций каждые 3 часа.

* Огромное количество разных стилей для дизайнерских задач.

Доступ:

Есть на сайте, в fal.ai и replicate. Доступна по API, но закрытая.

Цена:

от $0.005 за картинку

---

Лучшие AI-модели для генерации изображений (мой личный рейтинг по всем-всем моделям рынка) Midjourney, Flux, Нейронные сети, Чат-бот, Telegram (ссылка), Длиннопост

📌 Крепкие середняки

5. Ideogram v3

Описание:

Модель всегда пытающаяся догнать Midjourney, даёт достаточно хорошее качество.

Версии:

* Turbo, Balanced, Quality (закрытые)

Лоры:

* Нет

Фичи:

* Реализм и креативность.

* Изменение фона, добавление и удаление объектов.

* Возможность создать свой стиль как Midjourney

Доступ:

На сайте Ideogram, fal.ai и replicate по API.

Цена:

3,6,9 центов (Turbo/Balanced/Quality)

---

6. Krea-1

Описание:

Закрытая авторская модель, по сути дообученный Flux. По эстетике чуть похожа на Midjourney. Переодически зачем-то генерит топлесс девушек (да-да, доступно НЮ!)

Лоры:

* Поддерживает свои flux-лоры (создаваемые в Krea).

Фичи:

* Библиотека стилей.

* 12 бесплатных фото в день.

* Raw режим (так себе)

Доступ:

Закрытая, API нет.

Цена:

Менее 1 цента за фото.

--

7. HiDream

Описание:

Китайская open-source модель, аналог Flux. Сложнее натренировать, но для предметки даёт качество лучше. В целом чуть более богатая картинка.

Версии:

* Fast/Dev/Full

Лоры:

* Поддерживает тренировки лор (нередко качественнее Flux).

Фичи:

* Можно тренировать на fal.ai.

Эстетика:

Похож на Flux, иногда даже лучше в детализации. Но нужно уметь хорошо промптить, иначе будет пластиковая кожа.

Доступ:

Fal.ai

Цена:

1/3/6 центов (Fast/Dev/Full)

---

8. Reve

Описание:

Знает Россию и её эстетику — реально генерит Пятёрочку, Сбербанк, отечественные объекты и даже известных личностей. Но арсенал функций очень маленьки

Лоры:

* Нет

Фичи:

* Очень хорошо слушается промпта

* Генерирует известных личностей и российские объекты (но не тексты)

* 20 бесплатных генераций ежедневно.

Доступ:

Закрытая, API нет.

Минус:

Арсенал функций ограничен, часто галлюционирует

Цена:

1 цент за фото

---

Лучшие AI-модели для генерации изображений (мой личный рейтинг по всем-всем моделям рынка) Midjourney, Flux, Нейронные сети, Чат-бот, Telegram (ссылка), Длиннопост

9. GPT-Image/Sora

Описание:

Авторегрессионная модель, умеет генерировать русский текст, известных лиц, хорошо слушается промптов.

Лоры:

* Нет

Фичи:

* Высокое следование промпту.

* Генерация русского текста и известных лиц.

Минусы:

Эстетика простая, часто "желтизна" или коричневый фильтр по умолчанию. При этом картинку делает чересчур как в жизни — с большим количеством человеческого несовершенства.

Доступ:

По подписке GPT и по API.

Цена:

Входит в подписку GPT. В API от 4 до 18 центов!

---

10. Кандинский

Описание:

Российская модель от Сбера, генерирует советских и российских персонажей.

Лоры:

* Нет

Фичи:

* Хорошо генерит чебурашку, Гагарина, русские образы.

* Бесплатно в Gigachat.

* Также в Gigachat можно неплохо редактировать изображение по промпту, что даже не сильно уступает Flux Kotext

Минусы:

Низкие детализация и реализм.

Доступ:

Она опен-сорсная

Цена:

Бесплатно.

---

🔸 Другие (коротко):

* Stable Diffusion — классика, есть лоры, только чаще всего хуже Flux.

* Phoenix 1.0 — сносная дообученая Flux модель от Leonardo AI

* Seedance (Bytedance) — неплохой реализм, но пока очень скудный арсенал дополнительных функций

* Runway: Подходит только для перенос персонажа или предмета в фото

* Kolors (Kling), Photon (Luma), Buget (авторегрессия), Sana (Nvidia), Image-1 (Minimax), Шедеврум: В основном для галочки, серьёзно использовать не вижу смысла.

---

🔖 Какую модель брать?

* Подходит для всего: Flux Pro, Imagen 4, меньше Ideogram

* Для обучения своих лор: Flux, или HiDream, если заморочиться

* Для эстетики: Midjourney, Krea-1

* Дизайнерам: Recraft

* Для русских задач: Reve, Кандинский, GPT-Image

* Для быстрых экспериментов и интеграций: Imagen и Flux на fal/replicate (библиотека стилей и низкая цена).

Промпт для сравнения картинок из сетов выше

low angle photo of a stylish woman staring down into the lens, wooden mask held beside her face in one hand, editorial fashion photography, sharp details, photorealistic, full body or bust-up, neutral tones, soft studio light or overcast daylight

P.S. Важно — лучшие модели всегда зависят от вашей задачи и эстетики, поэтому пробуйте и сравнивайте сами.

P.P.S. По-прежнему все модели переодически делают 6 пальцев или галлюцинируют иначе, панацеи нет

--

Мой тг-канал по ии-стартапам, вайб-коду и генеративному ИИ

Показать полностью 2
Отличная работа, все прочитано!