Сообщество - Искусственный интеллект

Искусственный интеллект

4 228 постов 11 110 подписчиков

Популярные теги в сообществе:

Пост удален администрацией (запрещенный к публикации контент)1

5

Как создавать вирусные AI-видео с помощью Google Veo3: пошаговый подробный гайд от PJ Ace


Намедни я наткнулся на 2(!) серийное интервью с известным фильммейкером и контент-креатором PJ Ace. Этот сударь регулярно выпускает AI-видеоролики, которые набирают миллионы просмотров. В чём его секрет? Давайте разберём по шагам, опираясь на его личный опыт.

Шаг 1. Поиск вдохновения и идея

PJ Ace говорит, что важно начать с изучения уже успешного контента. Посмотрите, что сейчас популярно на TikTok, Instagram и YouTube Shorts. Отмечайте, какие форматы и темы привлекают наибольшее внимание.

Пример:

* PJ увидел видео, где библейский персонаж Даниил снимает себя на селфи-камеру в львином рву и шутит, словно блогер.
* Он решил сделать похожее видео с другими библейскими персонажами в юмористическом контексте.

Шаг 2. Сильный "крючок" (Hook)

Первое впечатление решает всё. PJ рекомендует сразу показывать что-то неожиданное, провокационное или смешное, чтобы зритель остановил прокрутку.

Примеры крючков:

* Иисус улыбается и держит селфи-камеру на кресте.
* Ной в ливень стоит перед ковчегом и напевает строчку из популярного рэп-хита.

Шаг 3. Использование известных историй и контраста

Как вы уже заментили, сам креатор выбрал библейскую тематику - Ной, Моисей, дева Мария, Иисус. Используйте широко известные сюжеты, но помещайте их в непривычные или комичные ситуации.

Примеры:

* Давид готовится бросить камень в Голиафа и ведёт себя как блогер, снимающий челлендж.
* Моисей делает селфи перед разделённым Красным морем и иронично комментирует происходящее.

Шаг 4. Сценарий с ChatGPT

Сначала PJ пишет базовый сценарий и шутки, затем передаёт их ChatGPT. AI помогает уточнить детали, предложить дополнительные шутки и сформулировать промпты.

Пример промпта (для Даниила во львином рву):

"Молодой мужчина с бородой и длинными волосами, в древней одежде, улыбается и шепчет в камеру: «Этот лев спит, он по утрам сварливый». Камера показывает спящих львов на заднем фоне."

Шаг 5. Структура промпта для Veo3

Очень важно следовать чёткой структуре промпта:

* Тип кадра (например, селфи-стиль)
* Подробное описание персонажа (возраст, внешний вид, эмоции)
* Точный диалог
* Действия и жесты
* Технические детали (фон, освещение, звук, тип камеры)

Максимально подробный промпт выглядит так:

A cinematic handheld selfie-style video shot, showing a soggy, exhausted Middle Eastern man in his 30s with shoulder-length wet hair, a tangled beard, and shredded linen robes clinging to his frame. He’s seated awkwardly on a slick, uneven surface deep inside the belly of a massive sea creature. The fleshy, ribbed walls pulse slightly around him, dimly lit by a faint blue-green glow coming from slits in the whale’s tissue above. Water drips steadily in the background. He holds the camera close, his face lit softly by the glow, his expression weary and mildly guilty. He talks with a country accent.
He says: "Update, still swallowed. I would like to formally apologize to God, the sailors, and this whale, sorry dude, I just took a poop over there."
He glances offscreen and winces slightly, then gives the camera a sheepish shrug before shifting uncomfortably.
Time of Day: indeterminate interior, faint bioluminescent glow from above
Lens: natural wide framing, dim exposure optimized for low light and moisture
POV: Selfie camera held close to face, angled upward slightly to capture Jonah and the ribbed organic chamber behind him
Audio: (implied) dripping water, faint groaning of the whale’s body, distant liquid movement
Background: wet, fleshy whale interior with ribbed walls and dim, humid atmosphere

Я создал для вас GPT, которое по данной структуре создаст для вас промпт

Вот прям внутри openai, если у вас есть подписка

Вот я сделал для вас бота, который делает это же, он бесплатный, но ограничен 50 запросами в день

Шаг 6. Генерация и выбор кадров

PJ рекомендует делать по несколько версий каждого кадра (2-3 минимум). Генерируйте кадры по одному и выбирайте те, которые:
* Имеют естественную актёрскую игру
* Реально смешные и вызывают смех у зрителей (можете тестировать на близких)
* Обладают хорошим техническим качеством


Шаг 7. Монтаж

Используйте простые редакторы (Final Cut или CapCut). PJ советует минимизировать эффекты и сосредоточиться на юморе и естественности.

Как создавать вирусные AI-видео с помощью Google Veo3: пошаговый подробный гайд от PJ Ace Нейронные сети, Чат-бот, Короткие видео, Видеомонтаж, Тренд, Видео, Длиннопост

Шаг 8. Публикация и продвижение

Регулярность — ключ к успеху. PJ Ace советует публиковать видео каждые 2-3 дня. Оптимальный формат — короткие вертикальные ролики.

Стратегия публикации:
* TikTok для быстрого роста аудитории
* X (Twitter), Нельзяграм (в нашем случае это Threads + Нельзяграм)

Обязательно используйте водяной знак на видео, чтобы защитить авторство.

P.S. От себя добавлю, что самые хорошо шутящие модели — Claude 4 Sonnet и Opus, чтобы вообще сгенерировать смешные идеи.

Само интервью часть 1, часть 2, и статья от PJ Ace, и mindmap по содержанию интервью

а также ссылка на его ТикТок

--

И мой тг-канал с лайфхаками по вайбкодингу и ии-контенту

Показать полностью 1 2
14

Как я генерю прикольные видео с озвучкой в нейросети Veo 3. Прям на русском

Недавно узнал про нейросеть Veo 3 — она делает видео по тексту. Да не просто видео, а со звуком и озвучкой персонажей. Причем работает и на русском языке. Можно добавить музыку, фразы, атмосферу. Всё прямо из головы — и за пару минут.

Доступна она прямо в Телеграм-боте. Без VPN, без регистрации. Просто заходишь и сразу работаешь.

Как работает?

  1. Придумал сценарий (хоть кривой, хоть косой)

  2. Отправил в бота

  3. Через 5 минут готово

Прикольные видео созданные в нейросети veo 3 (точные промпты)

Спецназовец говорит - "Ну что, вот вам и моё пробное видео в Вео 3, круто, не правда ли?". Садится на мотоцикл и уезжает, дым, искры и взрывы на фоне разбитого здания.


Мужчина в костюме супергероя неуверенно стоит на крыше, оглядывается и говорит: "Кажется, я забыл, как летать". Затем неловко падает вниз, в последний момент его ловит дрон.


Блондинка в красном кружевном платье с глубоким декольте, с красной кружевной шапочке и яркой красной помадой, ярким красным маникюром на руках, обнимает серого волка. Прижимает волка к себе, и говорит: "Ну что, Серый? Попался?"


Девушка в розовых лосинах в фитнес зале. Внезапно перед ней появляется красный демон в костюме Adidas и говорит женским голосом: "20 приседаний, или забираю твою душу!" Девушка в ужасе приседает.

С этим роликом у меня уже просят ссылку, как я это сделал. Людям нравится трэш и юмор.

Можно делать вирусные короткие ролики, абсурдные, смешные, странные — и люди это лайкают. А можно даже подстроить под бизнес: пиццерия, доставка, ремонт, курсы, фитнес — любые услуги можно так подать. Например, продвигать товары через смешные сценки. Главное, чтобы цепляло и было весело.

Пробуйте! Кидайте в комменты свои сценарии — запилю ещё пост с лучшими идеями.

(Сделано в боте в Телеграмм: работает без VPN и регистрации)

P.S. Если пойдет — напишу пост как зарабатывать на таких видосах.

Показать полностью 3
6

Крутой союз Gemini и Veo, Цукерберг давал Китаю ИИ, $180К за переход в NVIDIA

В этом выпуске новостей про искусственный интеллект вы узнаете, почему OpenAI обязали хранить все ваши данные, как компания Марка Цукерберга тайно помогала Китаю развивать искусственный интеллект, каким образом Sparkify генерирует крутые короткие видео и другие интересные новости.

9

ИИ-диктор — OpenAudio S1

Появился шедевральный самый реалистичный ИИ-диктор — OpenAudio S1.

Эта нейросеть копирует паузы, интонации, даже шёпот и крик, как настоящий человек. Можно вручную указать, где добавить нужную эмоцию — от вдоха до сарказма.

• Поддерживает голоса знаменитостей, включая Маска и Трампа.

• Импорт любого голоса — достаточно 15 секунд записи.

• Подходит для озвучки игр, видео, подкастов и книг.

• На русском. Бесплатно.

Ссылка

Источник

Показать полностью
5

«Неминуемые изменения. С днём рождения GPT»

«Неминуемые изменения. С днём рождения GPT» Будущее, Тренд, Openai, Искусственный интеллект, ChatGPT, Виктор Кох, Длиннопост

🧐 Мои публикации изначально создавались для проверки гипотез и определения оптимального формата авторского контента. Чтобы сформировать твёрдую, независимую позицию, важно пройти весь путь от начала до конца. В основе моего эксперимента лежала идея обучить нейронную сеть на своих мыслях и рассуждениях, а также выявить пределы возможностей AI. Интернет — изменчивая среда, но развитие ИИ в последние годы кардинально меняет его принципы, особенно в отношении контента.

«Content is 👑»

Контент был королём интернета. На заре его развития, когда любой сайт и автор легко находили свою аудиторию. Это было время расширения интернет проникновения; отсутствие сайта означало отсутствие в сети. Вебмастера получали значительный доход от платных ссылок и баннерной рекламы.

🤑Даже 3-5M MAU тогда считались огромным успехом. Например, я создал первую и крупнейшую поисковую систему для GIFs - Slinky с ~2.9M MAU (стала частью $SOHU) задолго до GIPHY. Многие известные компании, как $ABNB, $META, Twitter, $TRIP, $VK, $HH, стартовали в этом цикле.

Контент оставался королём долго, но с ростом интернета его распространение требовало всё больших усилий. Google и Meta сыграли ключевую роль в формировании современного WEB.

👨‍💻 Тысячи алгоритмов создали новую индустрию с сотнями критериев ранжирования контента: от PageRank до уникальности и поведенческих факторов.

К 2018 году стало ясно: объёма контента стало слишком много. Это привело к появлению алгоритмических лент, умных рекомендаций и глубокому анализу ПФ. Хотя рост рекламных доходов был частью этих изменений, без рекламы не было бы столь бурного развития и технологических прорывов.

🧠

В 2018 году индустрия вышла на новый виток развития. Семь лет назад вышел GPT-1 от OpenAI. Хотя первая версия и не произвела фурора, её потенциал был очевиден для экспертов. Многие пользователи уже были знакомы с нейросетями через популярные приложения, использующие их возможности под капотом.

Мне посчастливилось быть на передовой этой трансформации. Среди B2C-стартапов, которые первыми показали нейросети миллионам, можно выделить Prisma (2017), FaceApp (2016), Teleport (2017, стал частью $SNAP), Fabby (2017, часть $GOOGL), Stickeroid (2018, стал частью Naver C.) и Spectral (часть $AAPL).

«2024»

Спустя годы развития GPT и AI, интернет действительно начал преобразовываться. В 2024 году, с появлением GPT-4o, многомодальные генеративные возможности достигли уровня, близкого или неотличимого от работы человека. После ~3 недель интенсивного тестирования и дообучения я задумался: что дальше? Мысль о глобальной трансформации и будущем интернета на ближайшие 10-20 лет не давала мне покоя. В этот период был создан канал — эксперимент по использованию всех возможных AI-инструментов. Наша цель была простой— найти формулу, которую AI сгенерировать не сможет.

«Now»

Последние версии GPT-трансформеров создают типизированный контент, который практически неотличим от человеческого и ранее преобладал в интернете.

На данный момент GPT-трансформеры пока не способны создавать:

- Воспоминания

- Человекоориентированный нарратив и креатив

- Гибкие гипотезы

- Эмоционально-ориентированный контент

«Прогноз. Проекция Будущего»

- К 2030 году значительная часть контента будет AI-сгенерирована. У читателей образуется «генеративная слепота»

- Авторский, уникальный контент приобретает полное превосходство

- Ценность креатива и неординарного подхода многократно возрастет

- Создание контента останется как-то ещё востребованным, но критерии форматов изменятся

- Социальные сети полностью адаптируются к генеративу, а UGC-платформы внедрят фильтры и новые правила

Выводы сделаны на основе наших экспериментов и полномасштабного анализа парса данных с UGC-платформ.

- Можно ли считать типичный блогинг перспективным?

Ответ - 💯 нет

Цифры:

- Проанализировано ~281298 публикаций в тематике: экономика, финансы, стартапы, lifestyle и бизнес.

- Более 3900 top-tier авторов, блогеров и контент-мейкеров.

- Анализ охватил T-каналы, Пульс, $RDDT, S-Lab, Quora и Medium


Автор: Виктор Кох и Ко.

Показать полностью
1

Не знает и все-равно пишет...

Диалог с DeepSeek-r1-0528:

- Нашел нейросеть для генерации песен - музыка с вокалом YuE. Знаешь что-то о ней? Если не знаешь, то не пиши.

- Да, знаю о YuE ("Yu-E" или "YourEncoder") — это голосовая модель для разделения музыки (stem extraction), а именно для извлечения вокала из готовых треков. Она не генерирует музыку с нуля, но отлично справляется с выделением вокалов из смеси.

  1. Ключевые моменты о YuE:

    1. Где используется: На платформе MUSICFY.LOL (или подобных сервисах). Это ее основное применение.

    2. Что делает: Анализирует MP3 или WAV файл песни и отделяет вокал от инструментального аккомпанемента (инструментала).

    ... и т.д.


Даже самые современные нейросети этим страдают. Gemini 2.5 Pro Preview 06-05 - то же самое чешет, только более обтекаемо. И даже Алиса в поиске предпочитает написать какую-нибудь дичь, чем ничего не отвечать.
В обучении нейросетей очень не хватает заданий которые бы вырабатывали способность самокритики, чтобы она могла честно признаться что чего-то не знает. Пока что это недостижимая для нейросетей высота.

***

А вот проект о котором я спрашивал. https://github.com/multimodal-art-projection/YuE
Это похоже на SUNO но можно запустить локально. (Если конечно у вас есть GPU H800 или A100 с 80Gb VRAM или 4-8 штук RTX4090)

6

Veo3 теперь по API, в n8n и вообще везде / Google удивляет через Sparkify

За последние 3-4 дня Veo3 действительно стала доступна по API, правда, не очень дёшево.

Fal.ai / Replicate / Segmind — около 6 долларов за генерацию.

Leonardo / Envato — если брать большие планы, то можно снизить до 2.5 долларов за генерацию (видео от Leonardo как раз 1)

Грабительские расценки, не так ли?

У Veo3 также есть отдельный API, но там вейт-лист, куда пускают только если компания крупная.

Veo3 теперь по API, в n8n и вообще везде / Google удивляет через Sparkify Нейронные сети, Короткие видео, Digital, Чат-бот, Видео, Вертикальное видео, Длиннопост

Вот на такое блогеры твиттеры ловят подписчиков сегодня

Кроме того, из-за появления Veo3 на fal.ai, сеть заполонили схемы n8n, по которым якобы можно стать тикток-миллионером за неделю. Но есть нюанс: Veo3 часто галлюцинирует, и только 30–50% кадров получаются удачными. До настоящего автопилота пока далеко. Так что не рекомендую.

А теперь самое интересное:

Google анонсировал Sparkify — новый сервис для создания коротких видео. Это платформа, где можно собирать видеоистории буквально за пару минут. Весь сюжет и текст придумывает ИИ Gemini, а за анимацию, музыку и озвучку отвечает Veo. Всё это — на одной платформе, в пару кликов.

Сейчас доступ только по вейт-листу, подать заявку можно здесь:

https://sparkify.withgoogle.com/explore

Давайте будем одними из первых)

--

Мой тг канал

Показать полностью 1 2
Отличная работа, все прочитано!