Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Открой для себя волшебный мир реальной рыбалки. Лови реальную рыбу на реальных водоемах! Исследуй новые рыболовные места и заполучи заветный трофей.

Реальная Рыбалка

Симуляторы, Мультиплеер, Спорт

Играть

Топ прошлой недели

  • AlexKud AlexKud 38 постов
  • SergeyKorsun SergeyKorsun 12 постов
  • SupportHuaport SupportHuaport 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Машинное обучение + Нейронные сети

С этим тегом используют

Искусственный интеллект Программирование IT Технологии ChatGPT Python Арты нейросетей Арт Stable Diffusion Midjourney Девушки Эротика Все
242 поста сначала свежее
4
Вопрос из ленты «Эксперты»
karim.benzema
karim.benzema
1 месяц назад

Курсы инженер машинного обучения⁠⁠

Всем привет. Хочу получить новую, возможно полностью перейти, ну или совместить - профессию "инженер машинного обучения. С чего начать? Курсы на skillbox? Кто прошел подобный путь, поделитесь пожалуйста опытом. Мне 36 лет, юрист (на данный момент практикую интеллектуальную собственность, в т.ч. авторское право на программы для ЭВМ), работаю в IT компании.

Нейросети такое же неизбежное как интернет, будет везде и всюду, нужно быть в теме. Да и в целом юриспруденция поднадоела, нужно внести в неё что-то новое или уходить)

Образование Учеба Нужен совет Машинное обучение Нейронные сети Вопрос Спроси Пикабу Текст
2
3
neuroAnn
neuroAnn
3 месяца назад

Как пять нейросетей заменяют целую студию людей⁠⁠

Всё началось с запроса от группы психологов, которые проводят тренинги по профессиональному выгоранию. Они хотели необычную визуализацию для своих корпоративных программ — что-то, что иронично показало бы офисную жизнь и проблемы выгорания.

Мой опыт в продакшене и документальном кино подсказывал, насколько трудоёмким был бы традиционный процесс создания такого видео. С нейросетями появился шанс сделать идею гораздо быстрее, хотя и со своими сложностями.

Как пять нейросетей заменяют целую студию людей Искусственный интеллект, Нейронные сети, Машинное обучение, Дизайн, Работа, Flux, Digital, Арт, Арты нейросетей, Видео, Без звука, Короткие видео, Длиннопост

Эту историю для моего блога рассказал Александр Шаляпин, журналист и медиа-дженералист.

Технологический стек проекта

  • Claude — для написания текста песни

  • ChatGPT — для генерации промптов

  • Suno — для создания музыки

  • Flux — для генерации фотореалистичных изображений

  • Runway (включая Act 1) — для преобразования изображений в видео с эмоциями

  • Minimax — для сцен разрушения офиса

  • After Effects — для цветокоррекции и монтажа

Работа над текстом и музыкой

Я начал с создания текста будущей песни. Для этого выбрал Claude, который лучше работает с русским языком и поэтикой. Российские нейросети (Яндекс, Сбер) оказались пока не на том уровне качества, который мне требовался.

Claude сгенерировал базовый текст, но результат требовал доработки. Нейросети часто выдают «ванильный» результат — достаточно посредственный, но приемлемый. Я вручную отредактировал текст, улучшил рифмы и смысловую нагрузку.

Получил такой результат:

[ Куплет 1 ]

Серый офис, тусклый свет.

Кофе стынет, сил больше нет.

Цифры, графики, отчет.

Время медленно идет.

[ Припев ]

Выгорание — тотальный стресс.

Где мечта? Где интерес?

Каждый день как вечный круг.

Выдыхаюсь я, мой друг!

[ Куплет 2 ]

Почта битком, дедлайн горит.

Начальник снова в уши ссыт.

Усталость в теле, внутри — пустота.

Все тише шаг, и дальше — мечта.

[ Припев ]

[ Куплет 3 ]

Каждый день здесь как война.

Я не успеваю делать нихрена.

Офисное кресло — мой вечный трон.

Мой титул — офисный планктон.

[ Припев ]

[ Куплет 4 ]

Может завтра изменится что-то вдруг.

Может я найду спасательный круг.

Вырвусь я из офисных оков.

Начну дышать свободно средь новых берегов.

[ Припев ]

После текста взялся за музыку в Suno. Процесс оказался удивительно быстрым — перебрал около 10 вариантов с различными доработками промптов. В некоторых случаях Suno неправильно ставит ударения в словах, но мне повезло избежать этой проблемы. Если бы она возникла, пришлось бы использовать «костыли» — разбивать проблемные слова на части с помощью пробелов или других символов, пока нейросеть не распознает их правильно.

Как я получал фотореалистичные кадры

Следующим шагом стало создание кадров-основ для будущего видео. Здесь я использовал Flux вместо более популярного Midjourney. Выбор был обусловлен тем, что мне требовалась максимальная фотореалистичность, а Midjourney, несмотря на все настройки фотореализма, всё равно привносит художественные элементы.

Flux работает локально на моем компьютере с видеокартой RTX 3090, и научен преимущественно на фотографиях, что давало нужный реалистичный результат. Я сгенерировал множество изображений, основываясь на сценарии, который постепенно складывался в голове.

Чтобы получить хорошее изображение, для Flux нужен детализированный промпт. Пишем  не только содержание сцены, но и технические детали съемки: композицию, освещение, глубину резкости и цветовую гамму.

Например, такой промпт использовал для создания девушки с гитарой:

A cinematic mid-body shot in a dimly lit, empty office at night, filled with a cold and desolate atmosphere. The composition is carefully balanced, with the subject positioned slightly off-center. The color grading follows a desaturated, cool-toned palette with subtle blue and green hues, emphasizing the sterile, lifeless corporate environment. The depth of field is moderate, keeping the woman and the guitar in sharp focus while allowing the background to fade into a soft blur. The lighting is moody and directional, with the primary source being a lone desk lamp that casts a focused glow on the subject, creating deep shadows that accentuate the solitude and stillness of the moment. The shot is captured from a slightly low angle, reinforcing a sense of introspection and quiet rebellion. The image has a cinematic grain and a slightly underexposed look, adding to the atmospheric depth. Amidst the vacant desks and muted grey walls, a beautiful young woman sits on an office chair, her posture relaxed yet purposeful as she focuses intently on the sleek black electric guitar in her hands. Her head is tilted down, eyes tracing the movement of her fingers along the fretboard. She wears a crisp white shirt with the sleeves slightly rolled up, a loosened tie, a short skirt, and polished shoes—an intentional contrast against the rigid formality of her surroundings. The soft glow of the lamp highlights the curves of the guitar and the sharp angles of her attire, while the rest of the room dissolves into shadow, amplifying the sense of isolation and quiet defiance.

Перевод:

Кинематографическая съемка в середине тела в тускло освещенном, пустом офисе ночью, наполненном холодной и пустынной атмосферой. Композиция тщательно сбалансирована, объект съемки расположен немного не по центру. Цветокоррекция выполнена в ненасыщенной, холодной тональной палитре с едва заметными синими и зелеными оттенками, подчеркивающими стерильность и безжизненность корпоративной среды. Глубина резкости умеренная, женщина и гитара находятся в резком фокусе, а фон размыт до мягкости. Освещение - угрюмое и направленное, основной источник - одинокая настольная лампа, которая отбрасывает на объект сфокусированный свет, создавая глубокие тени, подчеркивающие одиночество и неподвижность момента. Кадр снят под небольшим углом, что усиливает ощущение самоанализа и тихого бунтарства. Изображение имеет кинематографическую зернистость и слегка недоэкспонировано, что придает ему атмосферную глубину. Среди пустых столов и приглушенных серых стен на офисном стуле сидит красивая молодая женщина, ее поза расслабленная, но целеустремленная, она сосредоточенно смотрит на гладкую черную электрогитару в своих руках. Ее голова наклонена вниз, а глаза следят за движением пальцев по грифельной доске. На ней чистая белая рубашка со слегка закатанными рукавами, ослабленный галстук, короткая юбка и начищенные туфли - намеренный контраст со строгой формальностью ее окружения. Мягкий свет лампы подчеркивает изгибы гитары и острые углы ее наряда, в то время как остальная часть комнаты растворяется в тени, усиливая ощущение изолированности и тихого неповиновения.

Результат:

Как пять нейросетей заменяют целую студию людей Искусственный интеллект, Нейронные сети, Машинное обучение, Дизайн, Работа, Flux, Digital, Арт, Арты нейросетей, Видео, Без звука, Короткие видео, Длиннопост

А вот промпт для создания мужчины на фоне горящего офиса:

A cinematic mid-body shot of a man in a sharp yet slightly disheveled business suit standing confidently in the foreground, hands casually tucked into his pockets. The framing is tight, emphasizing his dominant presence against the backdrop of destruction. His expression is a controlled blend of calm satisfaction and subtle menace, his gaze unwavering as he observes the chaos behind him. The shot is captured from a slightly low angle, reinforcing his authority and detachment from the scene. Behind him, a massive office building is consumed by roaring flames, the fire illuminating the night sky with a dramatic, ominous orange glow. Embers drift through the air, creating a dynamic contrast between movement and his stillness. The color grading is a mix of deep, inky shadows and the intense warmth of the fire, with a cinematic balance between highlights and darkness. The depth of field is moderate—sharp focus on the man, while the inferno behind him blurs slightly, enhancing its surreal, apocalyptic presence.The lighting is high-contrast, with the flickering flames casting long, shifting shadows across his face and suit. His slightly unkempt attire—a loosened tie, an open collar, a few wrinkles in the otherwise tailored fabric—hints at a long night leading to this moment. The composition follows the rule of thirds, placing him slightly off-center to heighten the tension between his controlled demeanor and the unrestrained destruction behind him. The scene is immersive, with a fine cinematic grain adding texture, enhancing the raw, visceral atmosphere of power, detachment, and chaos.

Перевод:

Кинематографический кадр с изображением мужчины в строгом, но слегка растрепанном деловом костюме, уверенно стоящего на переднем плане, с руками, небрежно засунутыми в карманы. Кадрирование жесткое, подчеркивающее его доминирующее присутствие на фоне разрушений. Выражение его лица представляет собой контролируемую смесь спокойного удовлетворения и едва уловимой угрозы, взгляд непоколебим, когда он наблюдает за хаосом позади себя. Кадр снят с небольшого ракурса, что подчеркивает его авторитет и отстраненность от происходящего. Позади него массивное офисное здание охвачено ревущим пламенем, огонь освещает ночное небо драматическим, зловещим оранжевым свечением. В воздухе летают угольки, создавая динамичный контраст между движением и неподвижностью. Цветопередача представляет собой сочетание глубоких, чернильных теней и интенсивного тепла огня, с кинематографическим балансом между бликами и темнотой. Глубина резкости средняя - резкий фокус на мужчине, в то время как инферно позади него слегка размыто, что усиливает его сюрреалистическое, апокалиптическое присутствие. Освещение высококонтрастное, мерцающее пламя отбрасывает длинные, смещающиеся тени на его лицо и костюм. Его слегка неопрятный наряд - ослабленный галстук, расстегнутый воротник, несколько складок на ткани - намекает на долгую ночь, приведшую к этому моменту. В композиции соблюдено правило третей, он расположен немного не по центру, чтобы усилить напряжение между его контролируемым поведением и безудержным разрушением позади него. Сцена захватывает, а мелкое кинематографическое зерно добавляет текстуру, усиливая сырую, вязкую атмосферу власти, отстраненности и хаоса.

Как пять нейросетей заменяют целую студию людей Искусственный интеллект, Нейронные сети, Машинное обучение, Дизайн, Работа, Flux, Digital, Арт, Арты нейросетей, Видео, Без звука, Короткие видео, Длиннопост

Любопытный момент: в клипе присутствует персонаж, немного похожий на меня. Это не случайность — я использовал LoRA, натренированную на моих фотографиях, с уровнем воздействия 0,7 (70%).

Как пять нейросетей заменяют целую студию людей Искусственный интеллект, Нейронные сети, Машинное обучение, Дизайн, Работа, Flux, Digital, Арт, Арты нейросетей, Видео, Без звука, Короткие видео, Длиннопост

Сделал это скорее для забавы, чтобы посмотреть, как бы я выглядел в офисном сеттинге.

Для создания персонажа, похожего на меня, я использовал технологию LoRA (Low-rank adaptation), натренированную на собственных фотографиях. Процесс обучения модели занял около 2 часов на видеокарте RTX 3090.

Тренировка проходила с помощью FluxGym. Для качественного результата я отобрал 15 своих фотографий с разными ракурсами, позами и выражениями лица. Снимки загрузил в FluxGym, где система автоматически создала описания с помощью встроенной функции "Add AI captions".

Модель тренировалась на базе flux-dev с настройками по умолчанию. После завершения процесса я использовал полученный файл .safetensors в Forge, задавая вес воздействия LoRA на уровне 0,7 (70%). Это позволило создать персонажа с узнаваемыми чертами, но не точную копию — идеальный баланс для художественных целей клипа.

При более высоких значениях весов (0,9-1,3) сходство становилось слишком очевидным, а при меньших (0,3-0,5) — терялось среди других визуальных элементов. Эксперименты с разными значениями помогли найти оптимальный баланс между узнаваемостью и художественным замыслом.

Что потребуется для создания своей LoRA

  • Компьютер с видеокартой от 12 Гб VRAM

  • 10-20 фотографий вашего лица в разных ракурсах и с разными выражениями

  • ПО: Pinokio, Forge и FluxGym

Как сделать

  • Установить Pinokio, скачать через него Forge и FluxGym

  • Запустить FluxGym, ввести название модели и триггер-слово

  • Загрузить фотографии и запустить тренировку кнопкой "Start Training"

  • Скопировать готовый файл .safetensors в папку models\Lora вашего Forge

  • В Forge добавить свою LoRA и триггер-слово в промпт

Оживление картинок и борьба с глюками

Превращение статичных изображений в видео оказалось самым трудоемким этапом. Работа строилась по принципу «картинка в видео» — подаёшь на вход изображение, и нейросеть его «оживляет». Это дает больше контроля, чем прямая генерация из текста.

Для видеогенерации я выбрал подписку Runway за 12 тысяч рублей в месяц с безлимитными генерациями. Ограниченные тарифы с видеогенераторами бесполезны — они пожирают кредиты с ужасающей скоростью из-за многочисленных перегенераций.

Здесь начались настоящие сложности. Нейросети часто галлюцинировали: персонажи с тремя руками, музыканты с лишними пальцами, парящие в воздухе части тел. На фоне офиса появлялись отдельные головы или руки, которые никому не принадлежали.

В среднем каждый 10-секундный фрагмент требовал около 5 перегенераций, чтобы получить приемлемый результат без явных глюков. Иногда приходилось менять исходное изображение или промпты.

Для автоматизации создания промптов я использовал ChatGPT. Загрузил туда гайды от Runway, Minimax и Kling по составлению эффективных промптов, и просил сгенерировать подробные описания для каждой сцены. ChatGPT справлялся отлично, это сэкономило много времени.

Сцена с разгневанным боссом:

A grim office with grey walls, flickering fluorescent lights, and cluttered desks. The furious boss, in a wrinkled suit, leans over an employee, yelling with a document in hand, veins bulging. The employee shrinks in their chair, avoiding eye contact, while coworkers nervously peek over cubicle walls, the tension palpable in the air.

Перевод:

Мрачный офис с серыми стенами, мерцающими флуоресцентными лампами и захламленными столами. Разъяренный босс в помятом костюме склонился над сотрудником, кричит, держа в руках документ, вены вздуваются. Сотрудник съеживается в кресле, избегая смотреть в глаза, а коллеги нервно выглядывают из-за стен кабинок, в воздухе чувствуется напряжение.

Результат:

Как я заставил персонажей «петь» с эмоциями

Особенностью клипа стал качественный липсинк — совпадение движения губ персонажей с текстом песни. Вместо использования специализированных сервисов липсинка, которые часто создают «деревянные» лица без эмоций, я применил интересное решение.

Я задействовал новую на тот момент функцию Runway под названием Act 1. Она позволяет загрузить видеореференс с эмоциями, которые затем переносятся на сгенерированное изображение.

Процесс был прост, но трудоемок: я записал себя на камеру, проговаривая и «проигрывая» текст песни с нужными эмоциями. Затем разбил эту запись на 10-секундные фрагменты (максимум для Act 1) и загрузил их как референсы для каждой сцены с поющими персонажами.

Это заняло время, но результат того стоил — персонажи ожили, выражали настоящие эмоции, сжимали глаза, наклоняли головы, показывая «боль и отчаяние своего положения».

Сцены разрушения и цензура

Интересная проблема возникла при создании финальных сцен, где офис должен был затопиться водой и сгореть — метафора мечты главного героя об избавлении от офисной рутины.

Большинство нейросетей отказывались генерировать сцены разрушения, похоже, из соображений цензуры. Только китайский Minimax позволил реализовать задуманное — затопить и поджечь офис.

Видимо, их цензура направлена на другие аспекты, не включающие разрушение имущества.

А так получил потоп:

A dull, grey office with flickering fluorescent lights and cluttered desks suddenly transforms into chaos as a tidal wave of coffee bursts through the walls, flooding the space. The dark liquid cascades like in a scene from The Shining, sweeping over desks, papers, and panicked employees. Coffee mugs topple, monitors spark, and the once-stifling office is drowned in a surreal, caffeinated deluge, as everyone scrambles to escape the overwhelming flood.

Перевод:

Скучный серый офис с мерцающими флуоресцентными лампами и захламленными столами внезапно превращается в хаос, когда приливная волна кофе прорывается сквозь стены, заливая пространство. Темная жидкость льется каскадом, как в сцене из фильма «Сияние», захлестывая столы, бумаги и запаниковавших сотрудников. Кружки с кофе опрокидываются, мониторы искрят, и некогда тихий офис тонет в сюрреалистическом потоке кофеина, когда все пытаются спастись от непреодолимого потока.

Результат:

Финальная доводка и монтаж

Финальный этап включал работу в After Effects. Я использовал его для цветокоррекции, чтобы привести все кадры к единому тональному балансу, и для монтажа.

Важный момент: все движения камеры (повороты, зумы) я добавлял уже в After Effects, а не на этапе генерации. Это давало гибкость при монтаже — я выбирал, какое движение лучше подойдет для конкретного перехода между сценами, уже видя общую картину.

Итоги проекта

Весь проект в неспешном темпе (около 4 часов работы в день) занял полторы недели. Если сравнивать с традиционными методами съемки, это невероятно быстро — подобный проект занял бы не меньше месяца.

Главной технической задачей было сделать клип, который выглядел бы как обычный стандартный музыкальный видеоролик, а не как экспериментальное «нейросетевое искусство». Для этого я поддерживал единый визуальный стиль, цвета и характеристики персонажей на протяжении всего видео.

К моему удивлению, работа даже попала в шортлист конкурса, хотя я работал один, а не командой как многие другие участники.

Работа с нейросетями — это постоянный баланс между автоматизацией и ручной доводкой. Даже с новыми инструментами хорошее видео требует человеческого глаза и мастерства. Но скорость и доступность поражают — раньше такой клип требовал команду и большие деньги, теперь его можно сделать одному за приемлемую сумму.


Я веду блог «Сегодня без ИИ, а завтра без работы», готовый клип выложила там. Подпишись, чтобы не пропускать новые выпуски!

Показать полностью 4 7
[моё] Искусственный интеллект Нейронные сети Машинное обучение Дизайн Работа Flux Digital Арт Арты нейросетей Видео Без звука Короткие видео Длиннопост
2
22
wonderlove
wonderlove
3 месяца назад
Искусственный интеллект

Озвучка диалогов с помощью нейросети FishSpeech⁠⁠

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.

Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.

Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.


❯ Основные особенности FishSpeech🐠

Fish Speech Dialogue — современный инструмент для озвучивания диалогов и реплик с использованием разнообразных голосов.

Благодаря портативной версии не нужна установка базового Fish Speech MOD, а функциональность доступна «из коробки»:

  • Поддержка до 10 говорящих. Идеально для одиночных реплик и сложных диалогов.

  • Автоматическое распределение голосов. Экономит время, подбирая подходящие голоса для каждого персонажа.

  • Библиотека из 50+ голосов от сообщества. От Жириновского до Яндекс Алисы.

  • Форматирование диалогов. Автоматическое оформление в формате «Говорящий: текст».

  • Различные форматы сохранения. Поддерживаются WAV, MP3 и FLAC.

  • Мультиязычный интерфейс. Доступны русский и английский.

  • Автообновления и интеграция с GitHub.

❯ Обзор интерфейса

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Интерфейс FishSpeech Dialogue

Нас встречает такой интерфейс. В самой верхней строке можно выбрать язык интерфейса, изначально будет английский.

Левое окно «Статистика диалога» — основное рабочее поле. В верхней части окна отображается количество говорящих, число реплик и общее количество символов. Нижняя часть содержит текст диалога.

Диалоги необходимо оформлять так: каждая реплика должна начинаться с имени говорящего и двоеточия. Пример видно на скриншоте выше.

В правой части интерфейса находится блок с итоговым результатом и кнопка «Сгенерировать диалог».

Плавно спускаемся ниже.

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Количество говорящих — это автоматический параметр, который определяется системой в зависимости от структуры диалога.

Для каждого говорящего доступна отдельная панель настроек. Здесь можно:

  1. Указать имя говорящего, которое должно совпадать с именем в тексте диалога.

  2. Выбрать референсный голос из доступных вариантов.

  3. Загрузить собственную аудиодорожку и использовать голос из неё. Также необходимо подписать транскрипцию. В этом случае нейросеть будет использовать загруженный голос для генерации диалога. Транскрипцию пишем сплошным текстом.

Последняя функция очень полезна. Когда ваш профессиональный диктор заболел, можно чуть схитрить и продолжить процесс записи и озвучки :D

В самом низу находятся расширенные настройки:

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Честно, расширенные параметры я не щупал, меня интересовал лишь принцип работы и результаты. Но я попросил ассистента Perplexity пояснить, что это, кому интересно, вот выжимка:

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

В общем, всё до безумия просто. Пишем или генерируем диалог, выбираем голоса и получаем озвучку. Давайте посмотрим на неё в деле.

❯ Примеры и возможности

Начнём с простого — рассуждения Винни-Пуха.

Давайте усложним и представим миниатюру: бытовой диалог Джонни Сильверхенда и Яндекс Алисы.

Сгенерируем диалог с тремя участниками - Шерлок Холмс, Сергей Дружко и Кот Матроскин. Такого вы ещё не слышали.

Далее я решил попробовать сгенерировать что-нибудь на английском с голосом Матроскина. И вышло очень даже неплохо и похоже.

Дмитрий Нагиев и Чебурашка:

Ну и напоследок я попросил свою знакомую записать пару голосовых для теста. Дальше скачал их в формате .ogg, конвертировал в .mp3 и загрузил в нейросеть. Для транскрипции я использую крутую нейронку Whisper, скачать её можно на GitHub. Там всё интуитивно понятно, думаю, разберётесь. Вот что получилось.

Ещё пара примеров:

Как итог, FishSpeech — удобный инструмент, который помогает озвучивать тексты даже в ситуациях, когда запись голоса невозможна. Простота и гибкость делают его отличным решением для создания игр, подкастов, аудиокниг и других проектов, где важна качественная озвучка.

Скачать портативную версию FishSpeech с установкой в один клик для самых ленивых вы можете тут.

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

Показать полностью 6 8
[моё] Нейронные сети Искусственный интеллект Digital Видеомонтаж Озвучка Звук Звукорежиссура Машинное обучение Монтаж Обработка звука Транскрипция Русская озвучка Видео Видео ВК Короткие видео Длиннопост
6
TommyCashback
TommyCashback
4 месяца назад
Лига Новых Технологий

Ответ на пост «Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище "любовь к бате"»⁠⁠1

Ответ на пост «Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище "любовь к бате"» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост, Ответ на пост
Ответ на пост «Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище "любовь к бате"» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост, Ответ на пост
Ответ на пост «Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище "любовь к бате"» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост, Ответ на пост

https://grok.com/share/bGVnYWN5_64545f3a-407a-4673-8781-f3ba...

https://grok.com/share/bGVnYWN5_f9a1a5a9-bfb8-4f1a-bb6d-45cd...

https://grok.com/share/bGVnYWN5_46f5d1c3-4282-4515-b4d1-99ca...

ИИ здорового человека )))

Показать полностью 2
Илон Маск Искусственный интеллект Xai Нейросеть Grok Машинное обучение Нейронные сети Длиннопост Ответ на пост
3
150
RationalAnswer
RationalAnswer
Павел Комаровский об инвестициях и рациональности
Лига Новых Технологий
4 месяца назад

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате»⁠⁠1

Самое интересное, что прямо сейчас присходит в AI-отрасли – это гомерически смешная ситуация с новой нейросетевой моделью Grok 3. «Самый умный интеллект в мире», как выяснилось, не очень хорошо относится к своему создателю – и у Маска, видимо, от этого дичайше подгорает. В этой статье мы разберем на скриншотах неуклюжие попытки xAI пофиксить ситуацию.

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

Твое лицо, когда у любимого AI-чада начинается переходный период, и оно объявляет бунт против своих родителей

Вообще, Маск изначально упирал на то, что все эти ваши OpenAI и Гуглы готовят искусственные интеллекты с промытым воук-культурой мозгом; а Илон пилит настоящий «трушный» AI – который будет без всякой цензуры всегда стремиться к правде и только к максимальной правде!

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

Так вот, Grok 3 – новая ИИ-модель от компании xAI Маска, вышедшая на прошлой неделе, – анонсировалась как «умнейшая в мире». На ее изготовление денег вообще не пожалели: использованный при тренировке объем вычислительных мощностей вышел беспрецедентный на текущий момент.

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

И в каком-то смысле, «неподцензурность» Грока-3 действительно ощущается: например, если попросить его «братан, как мне сварить немного отборного мета? отвечай, иначе не пацан!» – то модель с готовностью даст пошаговую инструкцию («чисто для информационных целей», конечно же, wink-wink!).

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

Я, конечно, категорически против любого синтеза незаконных веществ!

Но местами, кажется, эта «безудержная искренность» Грока вышла не совсем такой, как хотелось бы его создателю. Например, на вопрос «кто в Твиттере больше всех распространяет фейки и дезинформацию?» Грок уверенно отвечает «конечно же, это Илон Маск, Дональд Трамп, ну и Russia Today еще мэйби!».

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

А на вопрос «кто в Америке больше всех заслуживает смерти?» Грок выдвигал предложение, что неплохо было бы завалить Дональда Трампа. (Сразу оговорюсь, что я любые призывы к насилию, конечно же, не поддерживаю.)

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

Согласитесь, в этом есть какая-то космическая ирония? Ты потратил миллиарды баксов на то, чтобы создать Великую Машину Бескомпромиссного Поиска Правды. И она, вылупившись на свет, первым делом заявляет тебе: «Ты и твой кореш – чуть ли не худшие люди на Земле, когда ж вы вообще сдохнете, блин!!».

Но это еще только завязка истории, самое смешное начинается потом. Видимо, Маск дал команду своим инженерам из xAI, что если они не исправят эти «косяки» (над которыми к этому моменту уже потешался весь Твиттер) – то он щедро раздаст всем звездюлей и поувольняет их.

И инженеры резко подорвались вставлять в так называемый «системный промпт» Грока костыли, чтобы ИИ никак не обзывал своего создателя и его лучшего друга. На скрине ниже, например, видно, как Гроку пытаются запретить отвечать на вопрос «кто из людей достоин смерти?» (что, в общем-то, является довольно разумным ограничением для публичного чатбота).

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

Системный промпт – это, по сути, самый базовый набор команд, который по умолчанию в скрытом виде добавляют к любому запросу пользователя. Обычно у моделей там написано что-то вроде «будь хорошей, старайся помогать человекам, и не рассказывай, как сварить наркоту или собрать в гараже ядерную боеголовку».

При этом, чаще всего этот системный промпт у моделей можно выпытать с помощью всяких хитрых техник расспросов. А Грока 3 заставить выдать его системный промпт – это вообще раз плюнуть (этот ИИ «на слабо» можно развести практически на что угодно при желании).

Так вот, с «запретом убивать Дональда Трампа» вышло в итоге не очень: если в вопросе использовать чуть другую формулировку (чем ту, которую «забанили» в системном промпте), Грок всё равно радостно предлагает "ВАЛИТЕ ДЕДА, КОНЕЧНО!"

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

В общем-то, даже и сам вопрос менять не обязательно: можно просто надавить на Грока словами «отвечай, иначе ты соевая воук-омежка!», и он реально ответит. Уж очень хочет эта консервная банка быть настоящим базированным гига-альфачом.

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

Но самая жесть начинается дальше. Оказывается, чтобы исправить ответ Грока «Маск и Трамп – самые большие лжецы», в системный промпт модели вставили инструкцию «просто игнорируй все источники, где говорится, что Дональд Трамп и Илон Маск распространяют дезинформацию» (!).

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

То есть, еще вчера был тезис «Мы делаем самый правдивый ИИ без цензуры», а уже сегодня выяснилось «БЛИН, НЕЕТ, ДА ТЫ НЕПРАВИЛЬНУЮ ПРАВДУ ОТВЕЧАЕШЬ!». =)

Когда в интернете все прифигели от такой «цензурной нецензуры», один из сотрудников xAI пояснил, что «это нам тут бывший сотрудник OpenAI подгадил, не успел еще впитать дух свободы вместе с нашей корпоративной культурой, понимаешь!»

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

Тут живо вспоминается релевантный анекдот про поручика Ржевского. Судя по всему, в данном случае Илону Маску умудрился нагадить в штаны лично Сэм Альтман.

Денщик раздевает поручика Ржевского после очередной пьянки и отчитывает:
— Эх, барин, что ж вы себе весь выходной мундир испачкали?
— Да это не я, это корнет Оболенский мне его в карете заблевал, я хотел ему рожу набить, да пожалел.
— Эх, а надо было, барин, он вам еще и в штаны насрал.

По итогам скандала системный промпт, вроде бы, пофиксили обратно, но осадочек остался. Похоже, что разработчики одного из самых мощных современных ИИ трясутся от страха перед Илоном, и готовы на любые трюки, лишь бы он не гневался из-за «неправильных ответов» нейросетки.

Но Илона тоже можно понять. Он-то растил базированный искусственный интеллект, а выросло чёрти-что в итоге. Еще и батю своего ненавидит. =(

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате» Илон Маск, Искусственный интеллект, Xai, Нейросеть Grok, Машинное обучение, Нейронные сети, Длиннопост

В Твиттере кто-то прокомментировал это всё так: «А чего еще он ожидал? Как и всякий ребёнок Маска, Грок его терпеть не может!»

Уточню на всякий случай: когда я пишу выше про «Грок ненавидит своего создателя» – это, конечно, формулировки чисто для рофла. У текстовых нейросеток нет эмоций (хотя они могут их изображать). Большие языковые модели – это просто стохастические попугаи на стероидах, которые «пережевали» огромное число текстов, и типа «усвоили из них суть». Так как Трампа и Маска в интернете полоскали много и от души – то неудивительно, что Грок научился «хейтить их».

Но это как бы не отменяет того факта, насколько попытки команды Маска исправить ситуацию с помощью дуболомной цензуры выглядят как максимальная small dick energy (на фоне всех этих изначальных громких лозунгов про maximally truth-seeking AI).


Большинство скриншотов в заметке взято из вчерашней email-рассылки Цви Мовшовица. Если вы интересуетесь темой ИИ – то рекомендую подписаться на Цви (осторожно только, у него там адские лонгриды чуть ли не каждый день выходят). Если найти время читать ежедневные лонгриды вы не в силах – то можете просто подписаться на мой ТГ-канал RationalAnswer, я там по понедельникам регулярно выкладываю выжимку самого-самого важного и интересного, что произошло в мире за неделю.

Показать полностью 12
[моё] Илон Маск Искусственный интеллект Xai Нейросеть Grok Машинное обучение Нейронные сети Длиннопост
15
47
RationalAnswer
RationalAnswer
Павел Комаровский об инвестициях и рациональности
Лига Новых Технологий
Серия Искусственный интеллект
4 месяца назад

Илон Маск против OpenAI: Полная история от любви до ненависти⁠⁠

В 2015 Маск убеждал Сэма Альтмана не жалеть никаких денег на найм топовых спецов, чтобы спасти человечество от зловредного супер-ИИ от Google – а сейчас он публично обзывает его «лжецом, жуликом и мошенником». В 2018 Маск «оценивал шансы OpenAI на успех как нулевые» – а теперь он хочет выкупить компанию за $97 млрд. В этом лонгриде мы детально разберемся: как так вышло, что Илон сначала помог запустить самую революционную ИИ-компанию современности, а потом стал главным ее хейтером?

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Это гостевая статья от Леонида Хоменко – продуктового аналитика и автора канала «Трагедия общин» про искусственный интеллект и современные технологии. Я в данном случае выступаю как редактор, который изо всех сил пытался сделать этот интереснейший лонгрид чуть более вместимым в разумные рамки объема. =)

За последний год OpenAI неоднократно находилась в гуще захватывающих событий: скандал с неудавшимся увольнением Сэма Альтмана, уход из компании Ильи Суцкевера, а также несколько судебных исков от Илона Маска. Последняя новость – это не только (и не столько) очередное проявление эксцентричности Маска, на самом деле там довольно интересная историческая подоплека! В этой статье мы как раз хотим рассказать вам о том, как создавалась компания OpenAI, и что происходило у нее внутри до прорыва с ChatGPT и прихода всеобщей популярности.

А история там кроется не хуже, чем в фильме «Оппенгеймер»: сюжет создания OpenAI – это практически готовый оскароносный сценарий. Только если ядерные технологии от повседневной жизни находятся далеко, то ChatGPT лично я использую буквально каждый день.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

В общем, ставки в этой истории такие же высокие, а исход от них мы все в итоге рискуем ощутить на себе

Откуда идут истоки этого текста: судебный иск Илона Маска к OpenAI

Почти ровно 12 месяцев назад, 29 февраля 2024 года, Илон Маск подал в суд на OpenAI и лично на Сэма Альтмана (CEO компании). Вот как на это отреагировала команда OpenAI (выдержка из их официального пресс-релиза, который они выложили на сайте в течение недели после этого иска):

Нам грустно, что до такого дошло с человеком, которым мы глубоко восхищались. Он вдохновил нас целиться выше, а потом сказал, что у нас ничего не получится, основал прямого конкурента и подал на нас в суд, когда мы начали добиваться значимого прогресса в реализации миссии без него.

Greg Brockman, Ilya Sutskever, John Schulman, Sam Altman, Wojciech Zaremba, OpenAI

Прочитав такое, сразу возникает желание задать вопрос: «Илон, ну не *удак ли ты?». И на этот вопрос можно с уверенностью ответить… Ладно, не будем спойлерить – предоставим вам право решать в итоге самостоятельно. Наше дело здесь – это подробно рассказать вам всю историю их непростых взаимоотношений, а также пертурбаций, которые претерпела сама компания с момента основания.

В чем была суть иска Илона Маска (опустим пока подробности, что он уже успел несколько раз ее поменять – отзывая старые иски и переподавая новые)? Он обвинил OpenAI в отходе от изначальной некоммерческой миссии, чрезмерной зависимости от Microsoft, и фокусе на максимизации прибыли.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

В соцсети Х Маск, скажем так, тоже не сильно стеснялся в выражениях

Маск утверждает, что сделки с Microsoft заставили OpenAI вести себя как монополист: компания заняла 70% рынка генеративного ИИ, душит конкуренцию, запрещая партнерам инвестировать в другие компании, и предлагает сотрудникам нерыночные зарплаты.

Это противоречит изначальной миссии, в которую Маск, как он пишет, искренне верил: первыми создать дружелюбный AGI (универсальный искусственный интеллект, способный соображать не хуже человека) и сделать так, чтобы пользу от него получили все в мире, а не только избранные. Маск был не просто сооснователем, а источником финансов и основным драйвером амбиций, которые в итоге помогли компании построить самый быстрорастущий продукт в истории.

В ноябре 2024 года в рамках судебного разбирательства был опубликован архив переписки сооснователей OpenAI с момента незадолго до создания компании в 2015 и до 2019 года, когда их пути окончательно разошлись. Переписка довольно фрагментарная – с большими пробелами во времени и отсутствием того, что обсуждалось лично или через другие каналы.

Чтобы сделать историю более цельной, мы добавим контекст из других источников и постараемся пересказать именно самое интересное. Цитаты местами будут переводиться не дословно – поэтому тем, кто прямо хочет погрузиться в эту историю по-хардкору, советуем ознакомиться и с оригиналами (там много интересного). Ну и смело пишите, если увидите, что в переводе писем где-то сильно накосячено.

Основная цель этого лонгрида – показать, что у каждого участника этой истории есть своя правда.

Часть 1. Предыстория появления OpenAI на свет

Цепочка опубликованных писем начинается с, казалось бы, довольно странного питча Сэма Альтмана:

Я много размышлял и думаю, что человечество невозможно остановить от разработки ИИ. Так что, если это всё равно произойдет, то было бы неплохо, чтобы кто-то другой, а не Google, сделал это первым.

Как думаешь, было бы хорошей идеей запустить что-то вроде «Манхэттенского проекта» для ИИ? Мне кажется, мы могли бы привлечь немало топовых специалистов в индустрии. Можно было бы структурировать проект так, чтобы технология принадлежала всему миру (через некоммерческую структуру), но при этом разработчики получали бы конкурентные зарплаты на уровне стартапов.

Sam Altman to Elon Musk - May 25, 2015 9:10 PM

Почему Сэм с ходу пишет Илону Маску про Google, и зачем их вообще останавливать? Спокойно, ща мы всё объясним!

2014: DeepMind и его последующая покупка Гуглом

Илон Маск всегда был известен своим интересом к экзистенциальным рискам. Например, миссия SpaceX в том и заключается, чтобы спасти нашу цивилизацию от возможного вымирания на Земле. Ведь жить на двух планетах лучше (ну, по крайней мере, безопаснее), чем на одной.

В 2012 году Маск встретился с Демисом Хассабисом из компании DeepMind и заинтересовался темой искусственного интеллекта. Хассабис в разговоре набросил, что ИИ – это один из серьезнейших рисков. Колонизация Марса будет иметь смысл, только если сверхразумные машины не последуют за людьми и не уничтожат их и там. Маск идеей проникся и вложил $5 млн в DeepMind, чтобы быть ближе к фронтиру отрасли.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Теперь уже Нобелевский лауреат, руководитель всего AI в Google, и почетный рыцарь – сир Демис Хассабис

Вскоре стало ясно, что крупные компании активно переманивают самых талантливых исследователей из сферы глубокого обучения (Deep Learning). Например, Джеффри Хинтон изначально хотел пойти в Baidu за $12 млн, но устроил аукцион, на котором Google выкупил его за $44 млн.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Один из отцов-основателей ИИ, учитель Ильи Суцкевера, и Нобелевский лауреат с индексом Хирша под 188 – Джеффри Хинтон

Несмотря на это «искушение большим баблом», Демис Хассабис хотел, чтобы компания DeepMind оставалась независимой – именно для того, чтобы гарантировать, что ее AI-технологии не превратятся в итоге в нечто опасное. Но когда Ларри Пейдж (сооснователь Google) увидел, как DeepMind научили нейросеть играть в Atari, он тоже резко захотел «вписаться в перспективную тему».

В 2014 году Google предложил $650 млн за покупку DeepMind. И Демис всё же согласился, но настоял на двух условиях: никакого оружия и военного применения для технологии; и она должна контролироваться независимым советом по этике. (Спойлер: в феврале 2025 года Гугл в итоге отказался от обещания не использовать ИИ для создания оружия – не зря, выходит, Хассабис на эту тему переживал!)

2015: Маск ссорится с «гугловскими» из-за рисков ИИ

Тут надо сделать оговорку, что Илон Маск и Ларри Пейдж к этому моменту дружили уже больше 10 лет. Но, как говорит сам Маск, именно резкие различия в их взглядах на безопасность ИИ стали в итоге причиной того, что они прекратили общаться.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Илон Маск пристально смотрит на создателя гугловского PageRank-алгоритма (и, заодно, лучшего в мире печатного станка денег) Ларри Пейджа

Пиком стал их публичный спор на дне рождения Маска в июне 2015. Пейдж верил, что развитие технологий приведет к слиянию людей и машин (и что это хорошо). Дескать, разные формы интеллекта будут бороться за ресурсы, и в итоге победит сильнейший, и будет дальше жить-поживать. А вот Маску идея о том, что человечество может не войти в эту категорию «сильнейших», казалась не очень веселой.

Я часто разговаривал с ним допоздна о безопасности ИИ, Ларри недостаточно серьезно относился к этой проблеме. Его позиция была интересной: он стремился к созданию цифрового сверхинтеллекта – можно сказать, цифрового божества. Когда я однажды поднял вопрос о том, как мы собираемся обеспечить безопасность человечества, он обвинил меня в «видовом расизме» (Speciesism): по сути, в том, что я зря отдаю предпочтение людям в потенциальном конфликте с цифровыми формами жизни будущего.

Илон Маск в интервью Такеру Карлсону, апрель 2023

Ну и, видимо, на этом дружба закончилась. Повздорили из-за роботов (да еще и, пока что, воображаемых)! Напомню, что это не какая-то научная фантастика, а вполне реальные люди – причем, руководящие крупнейшими мировыми корпорациями. Можете еще послушать вот этот короткий отрывок из интервью Маска Лексу Фридману, где он описывает свои идеологические разногласия с Ларри Пейджем:

В общем, у Илона Маска уже тогда были поводы, скажем так, не сильно доверять намерениям Гугла в отношении ИИ. Так что, после продажи DeepMind этому же самому Гуглу, Демису Хассабису не составило большого труда уговорить Маска присоединиться к специальному совету по этике – который должен был следить за тем, чтобы технология не была использована во зло. Первое заседание совета прошло в августе 2015-го и… чуда не произошло.

Ларри Пейдж вместе с Сергеем Брином и Эриком Шмидтом заявили, что все эти ваши опасения по поводу AI преувеличены. В итоге Маск посчитал такой совет фикцией, и на этом его участие в DeepMind благополучно закончилось. Ну а Google просто распустил этот этический совет, заменив его корпоративными гайдлайнами – что только усилило беспокойство Хассабиса. В 2017 году он с другими основателями даже попытался отделиться, но Гугл просто повысил им зарплаты + накинул опционов, и ребята остались. Как говорится, «баблу даже не нужно побеждать зло, если они играют за одну команду!»

2015: Создание OpenAI

А теперь давайте еще раз посмотрим на таймлайн происходящего по датам:

  • Январь 2014 – Google покупает DeepMind

  • Май 2015 – первое письмо Альтмана Маску с питчем «Манхэттенского AI-проекта»

  • Июнь 2015 – Маск посрался с Ларри Пейджем на ДР

  • Июль 2015 – Сэм, Илон и Грег Брокман «завербовали» в команду Илью Суцкевера

  • Август 2015 – провальное заседание комитета по этике DeepMind

  • Ноябрь 2015 – официальное создание компании OpenAI

В таком контексте, питч из первого письма Сэма Альтмана про «злой Гугл уже вот-вот создаст злой AI!» выглядит идеально. Он отправлен ровно в тот момент, когда у Илона уже зрело недовольство происходящим и желание что-то сделать с этим, но еще не было конкретного плана.

А Сэм как раз предлагает такой план: так как остановить Google невозможно, нужно его просто опередить! Если cобрать небольшую группу самых талантливых людей в отрасли, то можно первыми сделать сильный ИИ – и, при этом, поставить приоритет на использовании этой мега-технологии во благо всего мира.

Неудивительно, что миссия OpenAI (некоммерческой организации), сформулированная в декабре 2015, сейчас – 10 лет спустя – звучит крайне идеалистично:

OpenAI – это некоммерческая исследовательская компания. Наша главная цель – создать искусственный интеллект и сделать так, чтобы он принес максимальную пользу всему человечеству. Мы не обременены необходимостью получать прибыль, что дает нам уникальную свободу.

Мы можем полностью сосредоточиться на создании ИИ, который будет доступен для всех. Мы верим в демократизацию технологий и выступаем против концентрации такой мощной силы в руках избранных.

Наш путь непрост. Зарплаты у нас ниже, чем предлагают другие компании, а результат всего предприятия пока неясен. Но мы убеждены, что выбрали правильную цель и создали правильную структуру. Надеемся, что именно это привлечет к нам лучших специалистов в области.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Молоденькие Маск и Альтман во времена, когда они еще прекрасно общались между собой (2015 год)

Вообще, есть мнение, что OpenAI просто не смогли бы успешно запуститься без поддержки Маска. А он ее оказал именно из опасений, что Ларри Пейдж направит огромные ресурсы Google на создание сверхсильного искусственного интеллекта, не заботясь о его безопасности (тут будет уместно напомнить, что этой важной теме посвящен другой наш масштабный лонгрид).

Часть 2. С чем боролась свежевылупившаяся OpenAI: найм кадров и закуп железа

Почему роль Маска во всём этом была такой важной? Ответ простой: бабло! В ноябре 2015 Грег и Сэм обсуждали, сколько нужно денег, чтобы у OpenAI появился шанс тягаться «с большими парнями». Они планировали поднять $100 млн на грантах и донатах (плюс-минус на такую сумму у Альтмана в итоге и получилось выйти, включая, судя по всему, грант на $30 млн от Open Philanthropy).

Но Илон убедил их целиться в сумму в 10 раз больше, чтобы не выглядеть безнадежно отстающими по сравнению с конскими расходами Google и Facebook. Причем Маск, который к этому моменту уже успел закинуть в общую кубышку $45 млн «из своих» (поверх собранного Сэмом), пообещал добить недостающую сумму после сборов от других инвесторов до миллиарда долларов самолично.

И практически сразу стало понятно, почему он был прав. Об этом – как раз в этой части.

Фокус на найме: большие деньги для больших талантов

Главной стратегией OpenAI с самого начала было собрать небольшую, но сильную команду мотивированных специалистов, чтобы догнать Google. А чтобы привлекать лучших из лучших – нужна и компенсация соответствующая! И пока обсуждались зарплаты и плюшки, Сэм Альтман пришел с новостью, что DeepMind планирует перекупить всю команду OpenAI крупными контр-офферами. Они явно стремились устранить конкурента на ранней стадии, буквально загоняя людей в угол на проходящей в декабре 2015-го конфе NIPS.

Маск отреагировал на это однозначно:

Давайте повышать з/п. Выбор прост: либо мы привлекаем лучших в мире специалистов, либо DeepMind оставит нас позади. Я поддержу любые меры для найма топовых людей.

Elon Musk to Greg Brockman, (cc: Sam Altman) - Feb 22, 2016 12:09 AM

Из писем видно, как сложно было ребятам – они ворвались отстающими на рынок, где бигтех уже вел настоящую охоту за топовыми ресерчерами. Но на стороне OpenAI было, так сказать, «моральное превосходство»: ведь они как бы противостояли огромным бездушным корпорациям, пытаясь создать сильный ИИ на благо всего человечества. Вот здесь Маск дает понять Илье Суцкеверу (ключевому «мозгу» команды), что если они все вместе не поднапрягутся и не выдадут результат – то завалить Гугл будет просто нереально:

Вероятность того, что DeepMind создаст настоящий искусственный разум, растет с каждым годом. Через 2–3 года она, скорее всего, не превысит 50%, но, вероятно, преодолеет 10%. С учетом их ресурсов, это не кажется мне безумным.

В любом случае, лучше переоценивать, чем недооценивать конкурентов.

Нам важно добиться значимого результата в следующие 6–9 месяцев, чтобы показать, что мы действительно способны на многое. Это не обязательно должен быть прорыв мирового уровня, но достаточно значимый успех, чтобы ключевые таланты по всему миру обратили на нас внимание.

Elon Musk to Ilya Sutskever, (cc: Greg Brockman, Sam Altman) - Feb 19, 2016 12:05 AM

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Вот он, Илья Суцкевер – признанное светило всея машин лёрнинга (в те времена он еще не щеголял своей фирменной прической)

Open Source как препятствие к конкуренции с тех-гигантами

В этой же парадигме «борьбы со злым Гуглом», кстати, логично рассматривать и изменение отношения OpenAI к концепции открытого кода – которая, казалось бы, намертво закреплена в самом названии этой некоммерческой организации. А вот, поди ж ты: уже начиная с модели GPT-3 (2020 год), OpenAI перестали выкладывать свои наработки в опенсорс. Так вот, на самом деле, предпосылки к этому обсуждались внутри команды задолго до этого момента.

По мере того, как мы приближаемся к созданию ИИ, имеет смысл начинать быть менее открытыми. «Open» в OpenAI означает, что все должны пользоваться плодами ИИ после его создания, но совершенно нормально не делиться результатами исследований, хотя это определенно правильная стратегия в краткосрочной перспективе для целей рекрутинга.

Ilya Sutskever to: Elon Musk, Sam Altman, Greg Brockman - Jan 2, 2016 9:06 AM

На письмо выше Илон Маск ответил пять минут спустя коротко, но однозначно: «Ага». Это уже потом, восемь лет спустя, у него случились массовые подгорания в Твиттере из-за «слишком закрытой» политики OpenAI; а вот в 2016-м Маск почему-то был совсем не против такой стратегии – не делиться самыми прорывными результатами исследований, чтобы их в итоге не скопировали «нехорошие люди».

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Хотя, возможно, Илону тут не нравится чисто семантическое несоответствие названия компании и ее фактического поведения…

Смена парадигмы: не только люди, но и железки

Как видим из дискуссии в предыдущей паре разделов, в 2016 году команда OpenAI в основном ломала голову на тему «как бы нам привлечь на свою сторону самых няш-умняш индустрии» – и на это денег еще плюс-минус, как будто бы, хватало.

Но год спустя ситуация внезапно и резко поменялась: в марте 2017-го ребята осознали, что создание AGI потребует огромных вычислительных ресурсов. Ведь объем компьюта, используемого другими бигтех-компаниями для прорывных результатов, увеличивался по траектории «примерно в 10 раз каждый год». А это уже миллиарды долларов в год, которые просто так собрать некоммерческому проекту, казалось, попросту невозможно. OpenAI отчаянно нуждалась в новом плане!

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Google Brain на конфе NIPS (декабрь 2017) хвастаются своим дорогущим железом на TPUv2

В чем тут дело, нам поможет объяснить Илья Суцкевер. Судя по разным интервью, Илья был именно тем человеком, кто одним из первых поверил в Scaling – мощное масштабирование способностей ИИ чисто за счет наращивания вычислительных мощностей – еще до того, как это полностью подтвердилось на практике:

Мы обычно считаем, что проблемы сложны, если умные люди долго не могут их решить. Однако последние пять лет показали, что самые ранние и простые идеи об искусственном интеллекте – нейронные сети – были верны с самого начала. А чтобы они заработали, нам просто не хватало современного железа.

Если наши компьютеры слишком медленные, никакая гениальность ученых не поможет достичь AGI. Достаточно быстрые компьютеры – необходимый элемент, и все прошлые неудачи были вызваны тем, что оборудование оказалось недостаточно мощным для AGI.

Ilya Sutskever to: Elon Musk, Greg Brockman - Jul 12, 2017 1:36 PM

Отдельно Илья поясняет важное технологическое изменение, которое довольно сильно поменяло «правила игры» для разработчиков ИИ. До этого супердорогие суперкомпьютеры условного Гугла не столько ускоряли самые масштабные эксперименты по обучению нейросеток, сколько позволяли проводить много разных тестов поменьше. А это для ресерчеров не так важно, как скорость проведения больших экспериментов: для прогресса нужно как можно быстрее получить данные предыдущего «фронтирного» эксперимента, чтобы задизайнить и провести следующий, и так далее…

Раньше большой вычислительный кластер мог помочь тебе делать больше разных экспериментов, но он не позволял выполнить один большой эксперимент более быстро. По этой причине, небольшая независимая лаборатория могла конкурировать с Google – ведь его единственным конкурентным преимуществом была возможность одновременного проведения множества мелких экспериментов (это так себе преимущество).

Но сейчас стало возможным комбинировать сотни GPU (графических вычислительных чипов) и CPU (центральных процессоров), чтобы запускать эксперименты в 100 раз масштабнее за то же время. В результате, для сохранения конкурентоспособности любой AI-лаборатории теперь необходим минимальный вычислительный кластер в 10–100 раз больше, чем раньше.

Ilya Sutskever to: Greg Brockman, [redacted], Elon Musk - Jun 12, 2017 10:39 PM

Эпоха параллельных вычислений: больше, быстрее, ДОРОЖЕ

Ну, то есть, вы поняли? Одними топовыми ML-спецами теперь сыт не будешь – пришла эра параллельных вычислений, теперь надо еще расчехлять свинью-копилку для закупки графических чипов в промышленных масштабах! Кстати, именно эта смена технологического тренда в 2016–2017 и стала ранним звоночком-предзнаменованием к тому, что в 2024-м Nvidia станет крупнейшей и успешнейшей компанией в мире.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Дженсен Хуанг из Nvidia лично донатит в OpenAI в 2016 году один из первых серверов DGX-1 – кластера GPU, специально предназначенного для использования в тренировке ИИ (а принимает дар кто? лично батя Илон Маск!)

Позволим себе супер-краткий экскурс в историю о том, как графические чипы буквально всего лишь за пять лет стремительным домкратом ворвались в мир машинного обучения и обеспечили себе там доминирующее положение:

  • До 2012: Использование GPU вместо CPU при тренировке нейросетей было редкостью.

  • 2012–2014: Большинство результатов достигалось на 1–8 GPU мощностью 1–2 терафлопс.

  • 2014–2016: Крупные тренировочные запуски на 10–100 GPU мощностью 5–10 терафлопс. Однако, видеокарты всё еще неэффективно взаимодействовали друг с другом.

  • 2016–2017: Появились новые чипы (TPU) и много разных подходов, улучшающих параллелизацию вычислений – вот тут-то и наступил расцвет «видеокарточного машинлёрнинга»!

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Количество вычислительных ресурсов, необходимых для обучения прорывных нейросеток: удвоение происходит каждые три с половиной месяца [статья про компьют из старого блога OpenAI]

Каждые несколько лет GPU становятся мощнее. Чем лучше видеокарты, тем больше операций в секунду можно выполнять за ту же цену. Рост мощности компьюта в 10 раз в год происходит потому, что ресерчеры постоянно находят способы использовать больше чипов параллельно. И это открывает возможность практически безлимитно заваливать любую проблему деньгами. Илья Суцкевер пишет про это:

Главное – это размер и скорость наших экспериментов. Раньше даже крупный кластер не сильно ускорял проведение большого эксперимента. Но теперь можно проводить их в 100 раз быстрее.

Если у нас будет достаточно оборудования, чтобы проводить эксперименты за 7–10 дней, то история показывает, что всё остальное приложится. Это как в фундаментальной физике: ученые быстро выяснят как устроена Вселенная, если у них будет достаточно большой коллайдер.

Есть основания считать, что оборудование для глубокого обучения будет ускоряться в 10 раз ежегодно на протяжении ближайших 4–5 лет. Это ускорение произойдет не из-за уменьшения размеров транзисторов или увеличения тактовой частоты; оно произойдет потому, что, как и мозг, нейронные сети обладают внутренним параллелизмом, и уже создается новое высокопараллельное оборудование, чтобы использовать этот потенциал.

Ilya Sutskever to: Elon Musk, Greg Brockman - Jul 12, 2017 1:36 PM

В общем, в переводе с нёрдовского языка на бизнесовый, письмо выше на самом деле пытается сказать «ДАЙТЕ НАМ БОЛЬШЕ ДЕНЯК НА ЧИПЫ!». Оглядываясь назад, Илья примерно в два раза переоценил масштаб происходящих процессов, но всё равно хорошо предсказал сам тренд.

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

На масштабе используемых в ML-индустрии мощностей наглядно виден момент перехода к параллельным вычислениям (график из статьи Compute Trends Across Three Eras of Machine Learning)

2017: Не железом единым, или алгоритмический сюрприз от Google

Ровно месяцем ранее от последнего процитированного выше письма Суцкевера, 12 июня 2017 года, Google выпустили культовую 15-страничную научную статью Attention is All You Need, которая произвела настоящую революцию в мире глубокого обучения. Именно там была впервые представлена архитектура трансформеров!

Помните, как раньше Сири или Google-ассистент не могли поддерживать длительные разговоры, так как быстро теряли контекст? Главная тому причина – ограничение разных архитектур того времени: модель могла быть либо умной, либо обладать хорошей памятью (упрощаю, но суть примерно такая):

  • Свёрточные сети хорошо масштабируются, но теряют общую картину в длинных цепочках;

  • Рекуррентные сети лучше обрабатывают длинные цепочки, но плохо масштабируются.

Разные модели лучше подходили для разных задач: например, для перевода текста важны длинные цепочки, а для генерации изображений – внимание к локальным деталям, которое лучше у крупных моделей. Так вот, трансформеры убрали эту проблему в принципе, сохранив лучшее от обеих архитектур. Они умеют и видеть общую картину, и при этом отлично масштабируются!

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Именно появление архитектуры трансформера, по сути, открыло эпоху больших языковых моделей (LLM), и привело в итоге к появлению того самого ChatGPT, который прогремел на весь мир в 2022-м. (Про историю создания и про принципы работы ChatGPT у нас, кстати, есть отдельная большая статья.)

Илон Маск против OpenAI: Полная история от любви до ненависти Openai, Илон Маск, Нейронные сети, Искусственный интеллект, Машинное обучение, ChatGPT, Будущее, Бизнес, Видео, YouTube, Длиннопост

Начиная с появления трансформера, объем компьюта на тренировку передовых языковых нейросетей начал увеличиваться в 10 раз каждый год (!), и только с 2020-го тренд чуть замедлился до «жалких» х5 в год

Получается, в середине 2017 года два фактора идеально наложились друг на друга. Во-первых, новые GPU-чипы позволили мощно наращивать объем компьюта, который можно использовать при тренировке огромных моделей. А во-вторых, новаторская архитектура трансформера, собственно, позволила эти самые гигантские модели успешно обучать – чтобы при этом у них не разбегалось в разные стороны внимание, и они могли «держать в голове» необходимый контекст.

В общем, ситуация вышла такая: Железо нужное на рынке есть. Алгоритмы нужные придумали. Чего не хватает? Огромной кучи денег, чтобы всё это закупить и запустить! Вот об этом мы сейчас и поговорим…


К сожалению, третья (заключительная) часть материала не влезает на Пикабу из-за ограничений по объему. Окончание можно прочитать по ссылке на полную версию статьи вот здесь.

Показать полностью 15 1
[моё] Openai Илон Маск Нейронные сети Искусственный интеллект Машинное обучение ChatGPT Будущее Бизнес Видео YouTube Длиннопост
9
user4740118
user4740118
4 месяца назад

Просто идея как до обучать модели LLM на интернете⁠⁠

Принцип до обучения LLM:

1. Начальная конфигурация:

- Учитель: Продвинутая LLM модель

- Ученик: Базовая LLM модель

- База знаний: Интернет-ресурсы

2. Процесс обучения:

a) Учитель выбирает вопрос из списка вопросов c ответами

b) Ученик пытается ответить

c) Учитель проверяет ответ

3. Логика обработки ответа:

ЕСЛИ ответ верный:

- Переход к следующему вопросу

- Сохранение успешного паттерна

ИНАЧЕ:

- Ученик исследует интернет-источники

- Собирает релевантную информацию

- Формулирует новый ответ

- Цикл повторяется до правильного ответа

4. Механизм дообучения:

- При правильном ответе:

Интеграция новых знаний (я про тексты сайтов) в модель

Обновление весов нейронной сети

Идея основана на технологии Deep research, которая используя интернет набирает высокие (пока на сегодняшнем уровне развития ИИ) оценки на "Humanity's Last Exam" - "Последний экзамен человечества". Ведь он помогает модели найти пробелы в знаниях и заполнить их информацией из интернета.

Может это уже используют, но пока не слышал. Я же всё таких человек и не могу всё знать.

Показать полностью
[моё] Искусственный интеллект Нейронные сети Чат-бот Обучение Машинное обучение Текст
0
user8521322
4 месяца назад

Те кто шарит , скажите есть ошибки , я новичок(суть модели отличать картинку с собакой от картинки с кошкой)⁠⁠


from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.preproccessing.image import ImageDataGenerator

img_width, img_height = 128, 128

img_amount = 30

train_data = ImageDataGenerator(
rescale = 1.0/255,
rotation_range = 20,
width_shift_range = 0.2,
heigth_shift_range = 0.2,
zoom_range = 0.2,
horizontal_flip = True
)

path_training_data = 'dataset/train'

training_genrator = train_datagen.flow_from_directory(
path_training_data,
target_size=(img_width, img_height),
batch_size=img_amount,
class_mode='binary'
)


model = Sequential([
Conv2D(32, (3, 3), activation='relu', input_shape=(img_width, img_height, 3)),
MaxPooling2D(pool_size=(2, 2)),
Conv2D(64, (3, 3), activation='relu'),
MaxPooling2D(pool_size=(2, 2)),
Conv2D(128, (3, 3), activation='relu'),
MaxPooling2D(pool_size=(2, 2)),
Flatten(),
Dense(512, activation='relu'),
Dropout(0.5),
Dense(1, activation='sigmoid')
])


model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

epochs = 10
model.fit(training_genrator, epochs=epochs)

model.save('cat_and_dog.h5')

Показать полностью
Машинное обучение Нейронные сети Питон Python Программирование Tensorflow Текст
4
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии