Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Погрузитесь в логическую головоломку: откручивайте болты из планок на самых сложных уровнях! Вы не только расслабитесь в конце сложного дня, но еще и натренируете свой мозг, решая увлекательные задачки. Справитесь с ролью опытного мастера? Попробуйте свои силы в режиме онлайн бесплатно и без регистрации!

Головоломка. Болты и Гайки

Казуальные, Гиперказуальные, Головоломки

Играть

Топ прошлой недели

  • AlexKud AlexKud 38 постов
  • SergeyKorsun SergeyKorsun 12 постов
  • SupportHuaport SupportHuaport 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Нейронные сети + Обработка звука

С этим тегом используют

Арты нейросетей Искусственный интеллект Арт Stable Diffusion Midjourney Девушки Эротика Звук Музыка Создание музыки Ableton Ableton Live Электронная музыка Все
15 постов сначала свежее
22
wonderlove
wonderlove
3 месяца назад
Искусственный интеллект

Озвучка диалогов с помощью нейросети FishSpeech⁠⁠

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.

Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.

Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.


❯ Основные особенности FishSpeech🐠

Fish Speech Dialogue — современный инструмент для озвучивания диалогов и реплик с использованием разнообразных голосов.

Благодаря портативной версии не нужна установка базового Fish Speech MOD, а функциональность доступна «из коробки»:

  • Поддержка до 10 говорящих. Идеально для одиночных реплик и сложных диалогов.

  • Автоматическое распределение голосов. Экономит время, подбирая подходящие голоса для каждого персонажа.

  • Библиотека из 50+ голосов от сообщества. От Жириновского до Яндекс Алисы.

  • Форматирование диалогов. Автоматическое оформление в формате «Говорящий: текст».

  • Различные форматы сохранения. Поддерживаются WAV, MP3 и FLAC.

  • Мультиязычный интерфейс. Доступны русский и английский.

  • Автообновления и интеграция с GitHub.

❯ Обзор интерфейса

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Интерфейс FishSpeech Dialogue

Нас встречает такой интерфейс. В самой верхней строке можно выбрать язык интерфейса, изначально будет английский.

Левое окно «Статистика диалога» — основное рабочее поле. В верхней части окна отображается количество говорящих, число реплик и общее количество символов. Нижняя часть содержит текст диалога.

Диалоги необходимо оформлять так: каждая реплика должна начинаться с имени говорящего и двоеточия. Пример видно на скриншоте выше.

В правой части интерфейса находится блок с итоговым результатом и кнопка «Сгенерировать диалог».

Плавно спускаемся ниже.

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Количество говорящих — это автоматический параметр, который определяется системой в зависимости от структуры диалога.

Для каждого говорящего доступна отдельная панель настроек. Здесь можно:

  1. Указать имя говорящего, которое должно совпадать с именем в тексте диалога.

  2. Выбрать референсный голос из доступных вариантов.

  3. Загрузить собственную аудиодорожку и использовать голос из неё. Также необходимо подписать транскрипцию. В этом случае нейросеть будет использовать загруженный голос для генерации диалога. Транскрипцию пишем сплошным текстом.

Последняя функция очень полезна. Когда ваш профессиональный диктор заболел, можно чуть схитрить и продолжить процесс записи и озвучки :D

В самом низу находятся расширенные настройки:

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Честно, расширенные параметры я не щупал, меня интересовал лишь принцип работы и результаты. Но я попросил ассистента Perplexity пояснить, что это, кому интересно, вот выжимка:

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

В общем, всё до безумия просто. Пишем или генерируем диалог, выбираем голоса и получаем озвучку. Давайте посмотрим на неё в деле.

❯ Примеры и возможности

Начнём с простого — рассуждения Винни-Пуха.

Давайте усложним и представим миниатюру: бытовой диалог Джонни Сильверхенда и Яндекс Алисы.

Сгенерируем диалог с тремя участниками - Шерлок Холмс, Сергей Дружко и Кот Матроскин. Такого вы ещё не слышали.

Далее я решил попробовать сгенерировать что-нибудь на английском с голосом Матроскина. И вышло очень даже неплохо и похоже.

Дмитрий Нагиев и Чебурашка:

Ну и напоследок я попросил свою знакомую записать пару голосовых для теста. Дальше скачал их в формате .ogg, конвертировал в .mp3 и загрузил в нейросеть. Для транскрипции я использую крутую нейронку Whisper, скачать её можно на GitHub. Там всё интуитивно понятно, думаю, разберётесь. Вот что получилось.

Ещё пара примеров:

Как итог, FishSpeech — удобный инструмент, который помогает озвучивать тексты даже в ситуациях, когда запись голоса невозможна. Простота и гибкость делают его отличным решением для создания игр, подкастов, аудиокниг и других проектов, где важна качественная озвучка.

Скачать портативную версию FishSpeech с установкой в один клик для самых ленивых вы можете тут.

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

Показать полностью 6 8
[моё] Нейронные сети Искусственный интеллект Digital Видеомонтаж Озвучка Звук Звукорежиссура Машинное обучение Монтаж Обработка звука Транскрипция Русская озвучка Видео Видео ВК Короткие видео Длиннопост
6
75
Nerual.Dreming
Nerual.Dreming
4 месяца назад
Stable Diffusion & Flux

Три бесплатных портативных нейросети для работы со звуком | MM-Audio, Fish Speech, LatentSync⁠⁠

🎵 Друзья, вы готовы к настоящей революции в мире аудио? В этом видео я покажу вам три невероятные нейросети, которые перевернут ваше представление о работе со звуком! MM-Audio создаст потрясающие звуковые эффекты для ваших видео и игр всего за пару кликов, Fish Speech поразит вас качеством клонирования голоса по минутному образцу, а LatentSync идеально синхронизирует сгенерированную речь с любым видео.

Я покажу все хитрости настройки, поделюсь личным опытом и научу пользоваться каждым инструментом. А самое крутое - все они доступны в удобных портативных версиях! 🚀

Альтернативный плеер YouTube:

Ссылки из видео:

🎨 MM-Audio - генерация звуков

  • Скачать портативную версию: https://t.me/neuroport/119

  • Исходный код: https://github.com/hkchengrex/MMAudio

  • Онлайн демо: https://huggingface.co/spaces/hkchengrex/MMAudio

🗣️ Fish Speech - клонирование голоса

  • Скачать портативную версию: https://t.me/neuroport/134

  • Исходный код: https://github.com/fishaudio/fish-speech

  • Онлайн демо: https://huggingface.co/spaces/fishaudio/fish-speech-1

🎬 LatentSync - синхронизация губ

  • Скачать портативную версию: https://t.me/neuroport/129

  • Исходный код: https://github.com/bytedance/LatentSync

  • Онлайн демо: https://huggingface.co/spaces/fffiloni/LatentSync

🛠️ Полезные инструменты:

  • Whisper для транскрибации: http://github.com/Const-me/Whisper

  • Ultimate Vocal Remover: https://github.com/Anjok07/ultimatevocalremovergui

  • Audacity для редактирования: https://www.audacityteam.org

  • База голосов для TTS: https://t.me/neuroportchat/6633

📱 Мои ссылки:

  • Поддержать донатом: https://www.donationalerts.com/r/nerual_dreming

  • Основной Telegram: https://t.me/neuro_art0

  • Эксклюзивы на Boosty: https://boosty.to/neuro_art

  • Курс по нейросетям: https://fooocus.ru

  • Клуб "Нейро-музыка": https://neuromusic.club

  • Все Telegram каналы: https://t.me/addlist/LQ-fUTyhVjEzYjIy

Буду рад вашей подписке и поддержке. Всех обнял и удачных генераций.

Показать полностью 1
[моё] Нейронные сети Липсинк Синтез речи Искусственный интеллект Обработка звука Звуковые нейросети Звуковые эффекты Видео Видео ВК YouTube
25
20
Nerual.Dreming
Nerual.Dreming
5 месяцев назад
Видеомонтаж

MMAudio: Генерация звука для видео с помощью ИИ⁠⁠

Всем привет! Исследователи из Университета Иллинойса и Sony AI представили интересный проект MMAudio - нейросеть для создания звукового сопровождения к видео. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист, и сегодня я хочу рассказать об этой технологии подробнее и поделиться нашей портативной версией. Главная особенность системы в том, что она может генерировать звуки не только по текстовому описанию, но и на основе изображения или видео.

Как это работает

MMAudio: Генерация звука для видео с помощью ИИ Искусственный интеллект, Нейронные сети, Инновации, Нейроозвучка, Технологии, Звук, Видеомонтаж, Звуковые нейросети, Озвучка, Обработка звука, Видео, Длиннопост

В основе MMAudio лежит идея мультимодального обучения - система одновременно анализирует видео, звук и текстовые описания. Для этого используются два параллельных потока обработки видео: CLIP для понимания общего контекста (8 кадров/сек) и Synchformer для точной синхронизации (24 кадра/сек).

Такой подход позволяет системе лучше понимать происходящее в видео и создавать более подходящее звуковое сопровождение. Например, увидев падающие капли дождя, MMAudio не просто генерирует шум дождя, а пытается воспроизвести характерный звук капель, попадающих на разные поверхности.

MMAudio: Генерация звука для видео с помощью ИИ Искусственный интеллект, Нейронные сети, Инновации, Нейроозвучка, Технологии, Звук, Видеомонтаж, Звуковые нейросети, Озвучка, Обработка звука, Видео, Длиннопост

Важно отметить, что система использует технологию Flow Matching вместо традиционной диффузии, что позволяет достичь впечатляющей скорости работы - генерация 8-секундного клипа занимает всего несколько секунд.

Системные требования

Для работы с MMAudio необходимо:

  • NVIDIA GPU с 8+ ГБ видеопамяти

  • Windows 10/11 64-bit

  • 16 ГБ оперативной памяти

  • 12 ГБ свободного места на диске

Возможности MMAudio

Система отлично справляется с базовым озвучиванием видео. В первую очередь это звуки повседневной жизни - шаги, движение предметов, звуки природы. Вот несколько примеров:

• Динамические звуки: система точно улавливает моменты движения и синхронизирует звуки шагов, прыжков, перемещения объектов. Точность синхронизации достигает 25 миллисекунд.

• Природные эффекты: реалистично воссоздаёт звуки дождя, ветра, текущей воды. Особенно впечатляет работа с дождём - система различает как он звучит на разных поверхностях.

• Спортивные события: безошибочно определяет моменты ударов по мячу, прыжков, создает реалистичную акустическую атмосферу стадиона или спортзала.

• Звуковые ландшафты: может создавать атмосферные звуки для различных локаций - леса, города, пляжа и т.д.

Текущие ограничения

К сожалению, не все задачи система решает одинаково хорошо:

• Проблемы с речью: генерируемая человеческая речь пока неразборчива. Система может создать речеподобные звуки, но понять их невозможно.

• Сложная музыка: музыкальное сопровождение ограничивается простыми эффектами. Полноценные композиции пока недоступны.

• Временные рамки: система работает с клипами длительностью 8-10 секунд. Более длинные видео приходится обрабатывать по частям.

• Необычные звуки: могут возникать проблемы со звуками, которых не было в обучающей выборке.

Кому это пригодится

Создателям контента:
MMAudio станет незаменимым помощником для ютуберов и стримеров. С её помощью можно быстро озвучить короткий ролик или добавить звуковые эффекты в прямом эфире. Аниматоры оценят возможность быстрого прототипирования звукового сопровождения.

Разработчикам игр:
Технология отлично подходит для создания тестовых звуковых эффектов и процедурной генерации звука. Это особенно полезно на этапе прототипирования, когда нужно быстро проверить разные звуковые концепции.

Видеомонтажерам:
MMAudio поможет в создании черновых версий звуковых дорожек. Система быстро сгенерирует базовое звуковое сопровождение, которое потом можно доработать вручную.

3D-аниматорам:
Идеально подходит для быстрого озвучивания превизуализаций и тестовых рендеров.

Как попробовать

Попробовать MMAudio можно несколькими способами:

Онлайн-демо

  • Hugging Face - быстрый способ оценить возможности

  • Google Colab - для экспериментов без установки

  • Replicate - для интеграции через API

Для разработчиков
Исходный код доступен на GitHub

Наша портативная версия

Мы с каналом Нейро-Софт подготовили модифицированную русифицированную портативную сборку MMAudio, в которой:

  • Русский интерфейс

  • Упрощенная установка в 1 клик которая сама все скачает и поставит

  • Возможность сохранять аудио отдельно от видео

  • Генерация аудио из изображения

  • Оптимизация для работы на доступных GPU

Всё необходимое уже включено в дистрибутив, просто распакуйте и запускайте. Никаких дополнительных настроек не требуется. Забирайте тут.

Мой опыт

Я активно использую MMAudio для озвучки видео, сгенерированных в различных img2video сервисах. Результаты действительно впечатляют - система отлично справляется с базовыми звуками и создает довольно реалистичную атмосферу. Особенно хорошо получается озвучка природных сцен и различных действий вроде ходьбы или спортивных движений.

Конечно, технология ещё развивается, и иногда встречаются забавные артефакты в генерации, но для быстрого создания базового звукового сопровождения - это отличный инструмент.

Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Ну и на канал с репаками тоже подпишетесь, чтобы не пропустить ничего полезного. Всех обнял. Удачных генераций!

Показать полностью 2 10
[моё] Искусственный интеллект Нейронные сети Инновации Нейроозвучка Технологии Звук Видеомонтаж Звуковые нейросети Озвучка Обработка звука Видео Длиннопост
3
Партнёрский материал Реклама
specials
specials

Считаете себя киноманом 80 LVL?⁠⁠

Залетайте проверить память и сообразительность → Будет интересно

Киногерои Тест Текст
4
BigDataExclusive
BigDataExclusive
8 месяцев назад

Обновление Suno позволяет менять части уже готового трека⁠⁠

Не секрет, что некоторые из нас проводят вечера, сидя за экраном и создавая в Suno очередной шедевр, готовый порвать весь танцпол на следующей вечеринке.

Теперь в Suno можно легко изменять части трека! Подписчики Pro могут менять текст или добавлять, например, гитарные риффы и другие инструменты.

Как это сделать:

➡️ Кликните правой кнопкой мыши на песне или нажмите “...”, затем выберите "Дополнительно".
➡️ Перейдите в раздел Редактировать > Заменить фрагмент.
➡️ Выберите отрезок (10-30 сек), текст появится автоматически.
➡️ Изменяйте текст или добавляйте drum break или другое.
➡️ Нажмите “Заменить фрагмент”.
➡️ Прослушайте обе версии и выберите понравившуюся.
➡️ Далее все сгенерируется автоматически!

🎉 Пошла жара!

Показать полностью
Нейронные сети Искусственный интеллект Инновации Технологии Будущее Suno Обработка звука Голос Видео Вертикальное видео
0
48
wonderlove
wonderlove
10 месяцев назад
Видеомонтаж
Серия Нейро-Звук

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума⁠⁠

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума Искусственный интеллект, Нейронные сети, Звук, Видеомонтаж, Монтаж, Гайд, Обработка звука, Инновации, Программа, Технологии, Цифровые технологии, Голос, Создание музыки, Видео, Длиннопост

Resemble Enhance - это инструмент на основе ИИ для улучшения качества речи путем шумоподавления и усиления.

Он состоит из двух модулей: шумоподавителя, который отделяет речь от шумного аудио, и улучшателя, который повышает качество звука, устраняя искажения и расширяя полосу пропускания.

Модели обучены на высококачественных речевых данных с частотой дискретизации 44.1 кГц.

Проще говоря, это портативный улучшатель записей голоса, который может пригодиться буквально всем, кто работает с медиа/контентом/звуком.

Это очень хорошая альтернатива плагина GOYO, который на данный момент недоступен. Более того, вам не нужна DAW или другая сторонняя программа, чтобы запустить Resemble, как в случае с GOYO.

Модель пока что подходит только для английской речи. Чтобы развернуть локально, необходима видеокарта NVIDIA минимум с 4 Gb видеопамяти.

По классике, начнем с интерфейса и далее взглянем на возможности более наглядно.

На самом деле, мы постарались и перевели интерфейс на русский язык и он стал уж совсем интуитивно понятным, но все же пробежимся в общих чертах.

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума Искусственный интеллект, Нейронные сети, Звук, Видеомонтаж, Монтаж, Гайд, Обработка звука, Инновации, Программа, Технологии, Цифровые технологии, Голос, Создание музыки, Видео, Длиннопост
  1. Выбор Сэмплера ОДУ для CFM

    Если вы уже сталкивались ранее с нейросетями, то знаете, что сэмплер, если просто - метод обработки шума. По стандарту стоит Midpoint и я также советую вам не менять его.

  2. Количество вычислений для CFM

То же самое, что и количество шагов. По стандарту 64.

Параметры 3, 4 и 5 показались мне не сильно важными.

В целом, настройки уже выставлены так, чтобы хорошо обработать бОльшую часть записей.

Шумоподавление перед усилением

Последняя галочка важная. Если в записи очень громкий внешний шум, то перед улучшением весь шум необходимо подавить, чтобы оно работало более корректно.

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума Искусственный интеллект, Нейронные сети, Звук, Видеомонтаж, Монтаж, Гайд, Обработка звука, Инновации, Программа, Технологии, Цифровые технологии, Голос, Создание музыки, Видео, Длиннопост

Так же в Resemble Enhance есть возможность записать голос сразу, ускорять запись при прослушивании и возможность вырезать выбранный фрагмент.

Так как я не особо в курсе, где можно взять уже готовые плохие записи голоса, кроме как тех самых туториалов 10-летней давности, то предлагаю взять пару примеров из моих роликов и искусственно испортить исходник: добавим шум ветра, моря, можно чуть исказить с помощью эквалайзера.

Ну и все записи я заранее перевел на английский язык с помощью сервиса HeyGen.

Я добавил в запись своего голоса шум толпы. Представим, что мне пришлось записывать подкаст в ресторане.

Resemble очень хорошо очистил шум с этой задачей он справляется прекрасно, но улучшатор голоса иногда работает не совсем стабильно. В прочем, возможно это из-за искусственного перевода.

Давайте попробуем взять неискуственный, оригинальный кусок на настоящем английском из популярного мультика. К нему я дополнительно чуть-чуть примиксовал шум озера, посмотрим, как нейросеть справится с задачей.

Замечу, здесь улучшатор сработал много лучше.

Вот как это смотрится на видео:

Теперь давайте попробуем взять что-то всем знакомое, от чего становится тепло на душе: протестируем нашу нейросеть на старых мемах.

Я уверен, все слышали про мем Очень очень affordable... Довольно старый мем, местами проскакивает посторонний шум толпы, попробуем её исправить.

Ради эксперимента я не стал переводить его и очень удивился результату, просто взгляните

Следующий уж точно не менее известный мем - салатик и борщ с капусткой, но не красной. Уже его я перевёл, в целом на записи и так достаточно шума и его уж точно больше, чем на прошлой.

Здесь опять же чуть хуже работает улучшатор голоса. Я уверен, что это связано с тем, что перевод искусственный, а модель обучалась на настоящих голосах.

Ну и давайте повысим сложность - легендарный мем Очень плохая музыка с просто ужасным исходником. Громкая музыка, а в оригинале еще и стерео панорама не понятно куда едет. Про микрофон промолчу, записано это чудо 15 лет назад, чему удивляться.

На удивление, даже тут нейросеть прекрасно очистила шум, правда запись все равно осталась низкой по качеству. Улучшатор, конечно, совсем не в кассу - речь превратилась в один из монологов Уинстона Черчилля.

Далее мне стало интересно, и я взял еще одно видео, на нем очень сильное эхо, которое я еще и усилил.

Шумодав подчистил хвосты от эхо, но само оно не пропало, что было очевидно. А вот улучшатору, судя по всему, пришлось переписывать голос по новой.

На возможности нейросети взглянули со всевозможных сторон, теперь расскажу, как установить это действительно полезное чудо техники.

Чтобы установить Resemble Enhance, достаточно скачать нашу портативную версию с установкой в один клик.

Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте 7z-архив, который нужно просто разархивировать в любое удобное место.

Надеюсь, статья была полезной, подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

Показать полностью 2 8
[моё] Искусственный интеллект Нейронные сети Звук Видеомонтаж Монтаж Гайд Обработка звука Инновации Программа Технологии Цифровые технологии Голос Создание музыки Видео Длиннопост
2
3
aleks.kp
aleks.kp
10 месяцев назад
Искусственный интеллект

Нейросети или где?⁠⁠

Не понимаю почему до сих пор делают ролики с субтитрами с английского языка на русский.

Не, статистика - ок, люди смотрят без звука. Но. Уже существует бесплатный вариант как сделать перевод видео на любой язык почти.

Пора осваивать новые веяния, народ.

[моё] Нейронные сети Обработка звука Текст
8
izlayavedma
izlayavedma
11 месяцев назад

Ищу нейросеть для работы со звуком⁠⁠

Добрый день. Подскажите, есть ли нейросеть в которую можно загрузить инструментал, а она уже на её основе создаст музыкальную работу (так же инструментал, без слов)?

Вопрос Нейронные сети Музыка Обработка звука Текст
3
Блог компании Партнёрский материал Реклама
Yandex
Yandex
1 день назад
Искусственный интеллект

Нейросеть Алиса на самых мощных генеративных моделях Яндекса — теперь доступна всем. Бесплатно, без ограничений⁠⁠1

Привет, Пикабу! У нас хорошая новость — и для тех, кто давно пользуется нейросетями, и для тех, кто только собирается с ними познакомиться. Теперь в чате с Алисой вам бесплатно и без ограничений доступны самые мощные генеративные модели Яндекса.

С помощью нейросети Алиса вы можете решать личные, учебные и рабочие задачи: генерировать тексты разных жанров на русском и английском, находить ответы на вопросы, создавать изображения, использовать режим рассуждений и работать с файлами.

Кроме того, мы обновили ещё и подписку на опцию «Про»: в дополнение к играм и квестам для детей, Live-режиму и другим возможностям в ней появилась функция персонализированного общения с нейросетью.

Расскажем чуть подробнее обо всех возможностях нейросети.

Нейросеть Алиса на самых мощных генеративных моделях Яндекса — теперь доступна всем. Бесплатно, без ограничений Чат-бот, Яндекс, Нейронные сети, Искусственный интеллект, Длиннопост, Блоги компаний

Генерация: тексты, идеи, ответы на вопросы

С помощью мощной языковой модели Яндекса вы можете создавать тексты разных стилей и форматов, писать код, выполнять задания по математике и решать другие задачи. Она объяснит сложное простыми словами, поможет разобраться в новой теме и подскажет идею. А если подключить функцию поиска, модель будет использовать не только свои знания, но и информацию из интернета — вы сможете узнать, на основе каких источников составлен ответ.

1/3

Раньше эта языковая модель была доступна только по подписке, теперь она открыта для всех — причём в улучшенной версии. Обновлённая версия полнее отвечает на вопросы, больше знает о мире, а случаев, когда она уходит от ответа, стало почти на треть меньше. В момент пиковой нагрузки вместо мощной модели может отвечать её облегчённая версия, что будет отражено в интерфейсе.

Режим рассуждений

В этом режиме нейросеть Алиса пошагово решает задачу: прежде чем ответить на вопрос, она выстраивает логическую цепочку рассуждений. Следить за ходом её мысли можно в реальном времени. Вы сможете понять, как нейросеть рассуждает и почему делает именно такие выводы. А заодно — взять на заметку её подход.

Генерация изображений

В чате с Алисой теперь вы можете генерировать сколько угодно картинок. Изображение легко скачать, чтобы использовать в соцсетях или презентации. Функция работает на базе обновлённой модели YandexART. По сравнению с предыдущей версией она создаёт изображения более высокого качества и с меньшим числом дефектов.

Нейросеть Алиса на самых мощных генеративных моделях Яндекса — теперь доступна всем. Бесплатно, без ограничений Чат-бот, Яндекс, Нейронные сети, Искусственный интеллект, Длиннопост, Блоги компаний

Работа с файлами

Загружайте в чат с Алисой текстовые файлы в форматах pdf, txt, doc и docх. Нейросеть сумеет ответить на вопросы по их содержанию, проанализировать данные или сделать сжатый пересказ. Например, вы можете загрузить в чат файл с ответами респондентов, чтобы Алиса подготовила по ним отчёт. Или дать нейросети научную статью, чтобы она сделала конспект или глоссарий.

Нейросеть Алиса на самых мощных генеративных моделях Яндекса — теперь доступна всем. Бесплатно, без ограничений Чат-бот, Яндекс, Нейронные сети, Искусственный интеллект, Длиннопост, Блоги компаний

Персонализированное общение с Алисой — в опции «Про»

Опция «Про» получила ещё одно важное обновление. Теперь подписчикам доступна функция персонализированного общения с Алисой. Нейросеть будет учитывать, что раньше сообщал о себе пользователь в диалогах: например, чем он увлекается, какую кухню любит, как зовут его собаку. Чтобы получать персонализированные ответы, нужно авторизоваться в Яндексе или познакомиться с нейросетью на умной колонке или ТВ Станции. Для этого достаточно сказать: «Алиса, давай познакомимся».


Использовать новые бесплатные возможности вы можете в чате на https://alice.yandex.ru, на главной странице Яндекса, в приложениях Алиса и Яндекс, а также в Яндекс Браузере для Android (чуть позже нейросеть появится в десктопном Браузере и версии для iOS). Будем рады вашим отзывам!

Показать полностью 5
Чат-бот Яндекс Нейронные сети Искусственный интеллект Длиннопост Блоги компаний
73
7
AI.Design
AI.Design
1 год назад
Искусственный интеллект
Серия Аудио обработка в нейросетях

Audacity обогатился новым набором ИИ-плагинов для улучшения аудио и создания музыки, предоставляемых бесплатно⁠⁠

‍Audacity обогатился новым набором ИИ-плагинов для улучшения аудио и создания музыки, предоставляемых бесплатно. Разработчики подчеркивают, что это лишь начало их планов по интеграции ИИ в редактирование звука. Этот популярный аудиоредактор теперь включает в себя набор инструментов на базе Intel OpenVINO AI toolkit, предназначенных для детальной обработки аудиосигналов.

Всего в Audacity интегрировано шесть новых плагинов для музыкальной генерации и аудиообработки. Каждый из них использует передовые алгоритмы искусственного интеллекта, что делает их особенно эффективными в своей области, как отмечают создатели.

P.S. Audacity — это бесплатный, открытый и мультиплатформенный аудиоредактор, который позволяет записывать и редактировать аудиофайлы в различных форматах. Он предлагает широкий спектр инструментов для обработки звука, включая обрезку, склеивание, изменение темпа и тональности, а также добавление различных эффектов. Программа популярна среди подкастеров, музыкантов и звукорежиссеров благодаря своей функциональности и простоте использования.
https://smbx.me/9kBkS

Audacity обогатился новым набором ИИ-плагинов для улучшения аудио и создания музыки, предоставляемых бесплатно Кросспостинг, Pikabu Publish Bot, Нейронные сети, Обработка звука, Аудио
Кросспостинг Pikabu Publish Bot Нейронные сети Обработка звука Аудио
5
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии