Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Управляйте маятником, чтобы построить самую высокую (и устойчивую) башню из падающих сверху постов. Следите за временем на каждый бросок по полоске справа: если она закончится, пост упадет мимо башни.

Башня

Аркады, Строительство, На ловкость

Играть

Топ прошлой недели

  • AlexKud AlexKud 38 постов
  • SergeyKorsun SergeyKorsun 12 постов
  • SupportHuaport SupportHuaport 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

IT + Stable Diffusion

С этим тегом используют

Программирование IT юмор Программист Юмор Работа Картинка с текстом Разработка Арты нейросетей Арт Нейронные сети Девушки Эротика Аниме Anime Art Все
11 постов сначала свежее
3
Proglib
Proglib
10 месяцев назад
Серия Итоги недели в мире ИИ и обзоры новых сервисов

Итоги недели в мире ИИ и обзоры новых сервисов: 25 опенсорсных AI-инструментов для ваших проектов⁠⁠

Итоги недели в мире ИИ и обзоры новых сервисов: 25 опенсорсных AI-инструментов для ваших проектов ChatGPT, Dall-e, Javascript, Markdown, Microsoft, Midjourney, Openai, Python, Notion, Stable Diffusion, Искусственный интеллект, Нейронные сети, Чат-бот, Видео, Длиннопост, YouTube, YouTube (ссылка), IT, Программирование, Digital, Twitter (ссылка)

📰 Новости

В Южной Корее разработали новые ИИ-учебники для 5 млн школьников всех классов – от начального до выпускного. Контент этих учебников адаптируется под текущий уровень знаний ученика.

Исследователи Google Deep Mind провели анализ сообщений о случаях мошенничества с использованием ИИ и выяснили, для каких преступлений чаще всего используются возможности GenAI. Спойлеры:

  • Самый популярный вид кибермошенничества с применением ИИ – имперсонация, когда злоумышленники с помощью дипфейк-технологий притворяются другими людьми.

  • Один из самых впечатляющих случаев мошенничества произошел в феврале 2024 года в Гонконге, когда злоумышленникам удалось убедительно подделать видеоконференцию с участием нескольких лиц. Все участники, включая фальшивого финансового директора, выглядели настолько естественно, что ничего не подозревающий сотрудник послушно перевел $25,6 млн на подставной счет.

Еще один из отцов-основателей OpenAI, Джон Шульман, перешел в Anthropic.

Компания Groq, разработавшая уникальный супербыстрый LPU (языковой процессор), получила $640 млн инвестиций и оценку в $2,8 млрд, что свидетельствует о фундаментальном сдвиге в индустрии ИИ-инфраструктуры – Groq стал серьезным конкурентом для NVIDIA.

На опенсорсной платформе LMSYS Chatbot Arena, где ИИ-компании часто тестируют предстоящие релизы, появился некий anonymous-chatbot, который превосходит GPT-4o и остальные крупнейшие модели и, возможно, является секретным проектом Q*/Strawberry от OpenAI. На это намекнул Альтман.

Новая модель роботов-гуманоидов Figure 02 успешно прошла тестирование на заводе BMW. Робот поддерживает диалог благодаря генеративному ИИ от OpenAI, может поднимать до 25 кг, выполняет задачи автономно и работает 8 часов без подзарядки.

На платформе Mistral теперь можно создать собственных ИИ-агентов, имеющих такую же функциональность, как кастомные GPT.

Феноменальный успех ChatGPT сделал Сэма Альтмана одним из самых влиятельных людей в мире, и это должно внушать серьезное беспокойство всем нам. По наблюдениям Гэри Маркуса, которые он подробно изложил в разоблачительной статье, директору OpenAI и деятельности его компании нельзя доверять:

  • Во время слушаний по вопросам регулирования ИИ в сенате США Альтман предоставил неполную и неискреннюю информацию и солгал, отвечая на вопрос о том, получает ли он прибыль от OpenAI. Альтман буквально сказал, что получает денег «достаточно для оплаты медстраховки». При этом один автомобиль из его обширного автопарка, Koenigsegg Regera, стоит не менее $4 млн.

  • Несмотря на публичные заявления Альтмана о необходимости регулирования ИИ, на деле OpenAI активно лоббирует ослабление регулирования.

  • OpenAI не уделяет достаточного внимания вопросам безопасности ИИ, что подтверждается уходом нескольких ключевых сотрудников, занимавшихся безопасностью.

  • Деятельность OpenAI подразумевает использование огромных объемов электроэнергии, воды и других ресурсов. Такое же безответственное отношение к ресурсам переняли все конкуренты OpenAI – от Anthropic до Microsoft. Никто не пытается «озеленить» ИИ-индустрию.

  • Технологии OpenAI активно используются для создания политической дезинформации – компания признала несколько инцидентов, но не предпринимает видимых усилий для предотвращения подобных случаев.

Илон Маск снова решил судиться с OpenAI и ее основателями – Сэмом Альтманом и Грэгом Брокманом. Юридическая команда Маска утверждает, что Альтман и Брокман «усердно манипулировали Маском», убеждая его стать соучредителем их якобы благотворительной организации, обещая безопасность и прозрачность OpenAI, что отличало ее от альтернатив, ориентированных на прибыль. Иск выходит за рамки простых договорных споров, поскольку содержит серьезные юридические обвинения, включая финансовое мошенничество, нарушение договора, сетевое мошенничество и даже нарушение RICO («Закона о коррумпированных и находящихся под влиянием рэкетиров организациях»).

Привет!

Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.

В еженедельных письмах ты найдешь:

  • Новости о прорывных исследованиях в области машинного обучения и нейросетей.

  • Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.

  • Статьи об этических аспектах развития технологий.

  • Подборки лучших онлайн-курсов и видеолекций по машинному обучению.

  • Обзоры инструментов и библиотек для разработки нейронных сетей.

  • Ссылки на репозитории с открытым исходным кодом ИИ-проектов.

  • Фильмы, сериалы и книги, которые заслуживают внимания AI-энтузиастов.

📧 Подпишись, чтобы быть в числе первых, кто получит дайджест

🛠️ Инструменты

MinusX – Chrome-расширение для анализа данных в Jupyter и Metabase.

Frontend AI – генерирует код UI-компонентов по текстовым описаниям и скриншотам, поддерживает редактирование.

Pictory – превращает любой контент в видеоклипы.

Semantic Scholar – бесплатный ИИ-поисковик по огромной базе (220,2 млн +) научных публикаций из всех отраслей науки. Имеет API для использования в собственных приложениях.

Napkin AI – визуализирует информацию в виде любой бизнес-графики – диаграмм, схем, графиков, презентаций и т. д.

🤖✍️ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»

AIswers – платформа, на которой можно задавать вопросы множеству ИИ-моделей одновременно.

Spreadsite – превращает данные из CSV-файлов в интерактивные дашборды и сайты.

GummySearch – находит Reddit-сообщества, попадающие под описание целевой аудитории продукта.

Rosebud – личный коуч и психолог.

✍️ Сделай сам

На Hugging Face выпустили опенсорсную модель CogVideoX-2B для генерации видео, по качеству сопaоставимую с Sora.

MiniCPM-V – опенсорсная минимодель, которая имеет всего 8 млрд параметров и работает на смартфоне, но при этом превосходит GPT-4V в понимании содержимого изображений и видео в реальном времени.

Итоги недели в мире ИИ и обзоры новых сервисов: 25 опенсорсных AI-инструментов для ваших проектов ChatGPT, Dall-e, Javascript, Markdown, Microsoft, Midjourney, Openai, Python, Notion, Stable Diffusion, Искусственный интеллект, Нейронные сети, Чат-бот, Видео, Длиннопост, YouTube, YouTube (ссылка), IT, Программирование, Digital, Twitter (ссылка)

MiniCPM-V отлично понимает смысл и контекст изображений

Flux – модель, разработанная командой, создавшей Stable Diffusion. По многочисленным отзывам, во многом превосходит Midjourney и DALL-E. И самое главное – ее можно установить на свой комп и даже на приличный игровой ноутбук. Протестировать можно на платформе NightCafe.

Итоги недели в мире ИИ и обзоры новых сервисов: 25 опенсорсных AI-инструментов для ваших проектов ChatGPT, Dall-e, Javascript, Markdown, Microsoft, Midjourney, Openai, Python, Notion, Stable Diffusion, Искусственный интеллект, Нейронные сети, Чат-бот, Видео, Длиннопост, YouTube, YouTube (ссылка), IT, Программирование, Digital, Twitter (ссылка)

Примеры генераций Flux

🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

25 опенсорных инструментов для использования в ИИ-проектах

Vanna – Python-библиотека, которая позволяет автоматически писать SQL-запросы и задавать базе данных вопросы на естественном языке.

Khoj – AI-помощник для поиска информации. Понимает разные форматы файлов, включая Word, PDF, Markdown и другие, а также интегрируется с платформами вроде Notion.

Flowise – визуальный конструктор для построения пользовательских потоков управления языковыми моделями и AI-агентами.

LLAMA GPT – локальный и автономный чат-бот, похожий на ChatGPT.

LocalAI – API-сервер, совместимый с API OpenAI, который позволяет запускать языковые модели, генерировать изображения и аудио локально или на своей инфраструктуре без использования GPU.

Continue – один из лучших AI-ассистентов для написания кода. Он позволяет подключать разные модели и контексты, чтобы создавать пользовательские автодополнения и чат-интерфейсы внутри VS Code и JetBrains IDE.

Chat2DB – ИИ-платформа для управления данными, разработки и анализа. Может конвертировать естественный язык в SQL (и наоборот), а также автоматически генерировать отчеты.

🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале

«Библиотека робототехники и беспилотников»

LibreChat – продвинутая платформа для создания собственного интерфейса для чат-ботов. Она предлагает множество настроек и поддержку разных AI-провайдеров, сервисов и интеграций, предоставляет единый интерфейс для общения с несколькими AI-ассистентами.

Lobe Chat – фреймворк для создания чат-интерфейсов с языковыми моделями. Он поддерживает речевой синтез, мультимодальность и расширяемую систему плагинов.

MindsDB – платформа для настройки AI на основе корпоративных данных. Она позволяет развертывать, обслуживать и настраивать модели в режиме реального времени, используя данные из баз данных, векторных хранилищ или сторонних приложений.

AutoGPT – полуавтономный агент, способный автоматизировать сложные процессы, выполняя последовательности действий без постоянного вмешательства человека.

🤖🔊 Все самое полезное про нейросети для звука: транскрибации, синтеза речи и музыки вы найдете на нашем телеграм-канале «Библиотека нейрозвука»

reor – ИИ-приложение для ведения заметок. Автоматически связывает заметки, отвечает на вопросы и обеспечивает семантический поиск. Все данные хранятся локально, а редактирование заметок происходит в Markdown-редакторе, похожем на Obsidian.

Leon – персональный ассистент, который может работать на вашем сервере. Выполняет разные задачи по вашему запросу и может общаться голосом или текстом. Имеет модульную структуру навыков, которую при желании можно расширить.

Instrukt – терминальная среда с интегрированным ИИ. Позволяет создавать и инструктировать модульных AI-агентов, генерировать индексы документов для ответов на вопросы и назначать инструменты для любого агента.

Quivr – RAG-фреймворк для создания специализированных AI-ассистентов с разными возможностями.

Open Interpreter – интерфейс, который позволяет отдавать компьютеру команды на естественном языке в терминале и дает возможность LLM выполнять код (Python, JavaScript, Shell и т. д.).

CopilotKit – фреймворк для создания пользовательских AI-помощников в React-приложениях.

GPT Engineer – инструмент, который позволяет вам описать нужное приложение на естественном языке, а затем наблюдать, как AI пишет, выполняет и вносит улучшения в код.

Dalai – самый простой инструмент для запуска моделей Llama* и Alpaca локально на вашем компьютере.

🤖🎥 Все самое полезное про нейросети для генерации видео и дипфейки вы найдете на нашем телеграм-канале «Библиотека нейровидео»

OpenLLM – инструмент, позволяющий с помощью одной команды запускать любые опенсорсные LLM в виде API-эндпоинтов. Поддерживает множество моделей и оптимизирован для использования в высоконагруженных приложениях.

Unsloth – ускоряет процесс тонкой настройки больших языковых моделей (Llama-3*, Mistral, Phi-3 и Gemma). Позволяет проводить файнтюнинг в два раза быстрее, используя на 70% меньше памяти, без потери точности.

E2B – предоставляет безопасную среду (песочницу) для AI-агентов и приложений. Это особенно полезно при создании ИИ-приложений с возможностями выполнения кода.

Camel AI – фреймворк, предлагающий масштабируемый подход к созданию систем с несколькими AI-агентами, которые могут эффективно взаимодействовать друг с другом.

Aider – ИИ-напарник программиста, который работает в терминале. Он может начинать новые проекты, умеет редактировать файлы и работать с существующими Git-репозиториями. Aider совместим со всеми популярными моделями (GPT-4, Sonnet 3.5, DeepSeek Coder, Llama 70b и другими).

FastEmbed – быстрая и легкая Python-библиотека для генерации эмбеддингов (векторных представлений) документов. Она использует ONNX runtime вместо PyTorch, что и делает ее быстрее традиционных решений.

Автор рассылки: Наталья Кайда

📧 Подписаться на рассылку

Показать полностью 2 10
ChatGPT Dall-e Javascript Markdown Microsoft Midjourney Openai Python Notion Stable Diffusion Искусственный интеллект Нейронные сети Чат-бот Видео Длиннопост YouTube YouTube (ссылка) IT Программирование Digital Twitter (ссылка)
0
1
user9006680
user9006680
1 год назад
Искусственный интеллект
Серия Поговорим об искусственном интеллекте

Искусственный Интеллект и мы⁠⁠

Искусственный Интеллект и мы Опрос, Искусственный интеллект, IT, Технологии, Инновации, ChatGPT, Midjourney, Stable Diffusion, Тренд, Digital, Чат-бот, Длиннопост

Если вас интересует тема ИИ и то, как он вам может помочь в работе и повседневной жизни, высвободить ваше время для родных и интересных увлечений, а также заметно повысить производительность труда и значительно повысить ваш доход - то вы в правильном месте.

Давайте осваивать ИИ вместе. Сейчас - самое время, не упустите!

Искусственный Интеллект и мы Опрос, Искусственный интеллект, IT, Технологии, Инновации, ChatGPT, Midjourney, Stable Diffusion, Тренд, Digital, Чат-бот, Длиннопост

Здравствуйте, друзья. Меня зовут Виктор.

Я больше 25 лет работаю в IT-отрасли.  В онлайн - более 5 лет. Освоил множество интернет- специальностей. Умею делать сайты, лендинги, интернет-магазины и онлайн-школы. Могу писать интересные тексты с цепляющими заголовками, создавать креативы. Умею создавать, настраивать и докручивать рекламные кампании в Таргете и Директе. Могу создавать воронки продаж и делать автоматизацию бизнеса с помощью чат-ботов. Мое последнее увлечение - это искусственный интеллект  (далее ИИ или AI). Мне очень нравится его мощь и те возможности, которые он предоставляет людям, умеющим с ним работать.

Не ИИ заменит человека, а люди, владеющие ИИ постепенно вытеснят тех, кто  им не владеет.

А как вы думаете, заменит ли ИИ человека?
Всего голосов:
И если ДА, то на каких профессиях это отразится в первую очередь?
Всего голосов:

От того, насколько адекватно мы будем относиться к появлению ИИ, возможно будет зависеть наше место в стремительно меняющейся действительности. Третья революция уже меняет нашу жизнь. В крупных IT компаниях массово увольняют сотрудников традиционных специальностей и набирают новых, владеющих навыками работы с ИИ.

Показать полностью 1 2
[моё] Опрос Искусственный интеллект IT Технологии Инновации ChatGPT Midjourney Stable Diffusion Тренд Digital Чат-бот Длиннопост
2
7
wonderlove
wonderlove
1 год назад
Stable Diffusion & Flux

Новая ИИ технология создания 3D Движений с помощью текста⁠⁠

С помощью неё и можно синтезировать 3D движения на основе текстовых описаний. Пользователи могут задавать несколько текстовых запросов в мульти-таймлайне, что позволяет создавать последовательные и перекрывающиеся действия. Этот инновационный метод обеспечивает высокую реалистичность движений, которые можно задать в разное время и в разном порядке!

Очередной прорыв в нейросетях

Сайт технологии

Больше о нейросетях и IT в источнике - 🎯Нейро-Пушка

Показать полностью
[моё] Искусственный интеллект Нейронные сети Stable Diffusion Арт Компьютерная графика Инновации Технологии IT Digital Арты нейросетей Видео Без звука
3
Партнёрский материал Реклама
specials
specials

Сколько нужно времени, чтобы уложить теплый пол?⁠⁠

Точно не скажем, но в нашем проекте с этим можно справиться буквально за минуту одной левой!

Попробовать

Ремонт Теплый пол Текст
14
GoblinCave
GoblinCave
1 год назад
Лига Разработчиков Видеоигр

Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей?⁠⁠

Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост

● Примерно так выглядит сбор "деталей" для создания модельки в "Dragon Bones".

Из более сотни вариантов выбираются самые удачные части тела и вырезаются для дальнейшего использования в конструкторе.

Нейросеть Stable Diffusion хорошо прорисовывает тени, детали одежды и в половине случаев даже лица получаются более-менее адекватными. Но есть проблема - руки и в особенности пальцы.

Любой кто пытался сгенерировать изображение с руками сталкивается с кучей артефактов. Кривые, непропорциональные и иногда лишние культяпки. В среднем лишь 1 из 100 вариантов более-менее удовлетворяет запросу.

● Как это исправить?

Можно просто добавить в запрос "detailed fingers" и без конца мучать нейросеть в ожидании чуда. Но куда проще взять "ситуацию с руками" в свои руки. Я владею Photoshop на базовом уровне, но даже таких знаний хватает, чтобы исправить косяки робота.

Я отобрал модельки с менее уродливой правой рукой (та где видно пальцы). Именно с ней связанно больше всего косяков. С помощью графического редактора я удалил лишнее и дорисовал недостающее. В основном применялся "Штамп". Цветовая палитра копируется пипеткой, обводка при помощи кисти.

Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост

▸ Эволюция руки

Таким образом вместо соотношения 1/100 удачных, мы получаем уже 5-10/100, что делает работу с нейросетью более продуктивной. Да, программа не нарисует все за вас, придется научиться хотя бы редактировать графические элементы. Но это уже в половину проще чем рисовать все с нуля.

Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост
Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост
Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост
Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост
Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост
Нейросети - это буквально "руки из ж*пы". Как решить проблему лишних пальцев и конечностей? Разработка, Программирование, Gamedev, Программист, Инди игра, Unity, Unreal Engine, IT, Дизайн, Арты нейросетей, Нейронные сети, Stable Diffusion, Игры, Game Art, Motion design, Гайд, Анимация, 2D, 2D анимация, 2d рисование, Длиннопост

Продолжаю изучать нейросети как инструмент в разработке игр. Подписывайся на мой гоблинский блог, впереди еще больше интересного!

Показать полностью 8
[моё] Разработка Программирование Gamedev Программист Инди игра Unity Unreal Engine IT Дизайн Арты нейросетей Нейронные сети Stable Diffusion Игры Game Art Motion design Гайд Анимация 2D 2D анимация 2d рисование Длиннопост
0
15
Dmitriy.yiu
Dmitriy.yiu
1 год назад

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума⁠⁠

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Продолжая цикл разъяснения параметров нашей любимой нейронной сети Stable Diffusion я решил в этот раз остановиться именно на Denoising Strength, ибо он каждый раз взрывал мне бошку. В прошлый раз я разбирал CFG Scale.

На данный момент шум могут декодировать VAE (вариационные автоэнкодеры), DPM (диффузионные вероятностные модели) и Сэмплеры (специализированные решатели высокого порядка для диффузионных уравнений).

Их задача сводится к тому, чтобы за определенное количество шагов генерации или Sampling steps из полного шума достать четкое изображение, к тому же сформированное по текстовой или визуальной подсказке (другой картинке).

В 2022 году был изобретен и адаптирован под диффузионные нейронные сети сэмплер DPM Solver, который значительно ускорил процесс декодирования шума. С момента его появления начали появляться, DPM Solver++, DPM ++ SDE Karras, DPM++ 2M Karras и другие, которые отличаются лишь методом решения дифференциальных уравнений (ими и убирается шум).

По итогу: чем быстрее вы решаете уравнение, тем меньше времени требуется для денойзинга картинки. И тут приходится балансировать между точностью и скоростью.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

На картинке выше вы можете посмотреть скорость работы различных сэмплеров. DPM Adaptive вышел в топы по медлительности потому, что сам определяет количество шагов генерации, что значительно повышает его точность в зависимости от конкретного запроса.

Как работает параметр Denoising strength?

Если нужна научная статья со всей математикой, то рекомендую прочитать данный материал.

Этот параметр мы будем рассматривать в режиме работы img2img, где он нужен для того, чтобы определять, насколько будет преобразовано исходное изображение во что-то новое.

Сейчас коротко залезем в изнанку того, за счет чего вообще происходит генерация img2img и Inpaint.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Обратите внимание на самую правую колонку с Мона Лизой, разберем ее. Во-первых, для создания изображения используется не только текстовые эмбеддинги (зашифрованный текст), но и визуальные эмбеддинги (зашифрованные картинки), плюс учитывается исходник (Мона Лиза).

Т.е. нейросеть не просто накладывает поверх изображения шум и рисует что-то поверх, а полностью с нуля генерирует изображение, предварительно размазывая его с заданной силой.

И чем больше Denoising strength, тем с большей силой нейросеть может опираться не на исходник, а на внутренние эмбеддинги (зашифрованные в ней текст и картинки). А понижением денойза мы обрубаем эти эмбеддинги и не позволяем нейронке работать с шумом.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Выше представлено наглядное доказательство того, что модель Stable Diffusion учитывает исходник и генерирует разный шум в зависимости от контекста.

Слева учитывается контекст всей картинки с яблоком, а справа только определенная область в центре. Шум, сгенерированный на первом шаге, отличается: слева это целая область, а справа второе яблоко внутри первого.

Для закрепления: если Denoising strength небольшой, то шумом ка бы является исходное яблоко, которое уже без шума (его не надо пересоздавать). А если Denoising strength большой, то нейронка подавляет уже новосозданный шум и получает другой результат.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Если сложно, то посмотрим на это дело с другой стороны: представьте, что у вас в руках лупа. Более точная фокусировка эквивалентна низкому denoising strength: все уже сфокусировано, менять ничего не нужно. Ну, а если произошла расфокусировка, то нам срочно нужно это исправить и навести фокус: а пока мы это делаем — происходит генерация.

Разбираем больше примеров генерации шума

К примеру, у нас есть яблоко, и мы хотим его изменить на другое яблоко. Закидываем картинку в img2img, выставляем Denoising strength и жмем Generate.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

На нулевом шаге генерации мы имеем наш исходник, который затем размывается и зашумляется. Как вы можете видеть, шум не похож на тот, который появляется при сбоях связи на телевизоре: он не заготовлен, а создается самой моделью. Нейронка как бы упрощает картинку донельзя и размывает ее, превращая в некую заготовку.

Даже при низком показателе Denoising strength мы получаем шум, однако на следующем шаге происходит перерасчет, и мы снова получаем исходное яблоко.

Сравнение методов генерации шума в режиме Inpaint

Далее посмотрим, как влияют на генерацию разные режимы работы генерации шума, среди которых: original, fill, latent noise, latent nothing. По мере продвижения буду комментировать и оставлять комменты для понимания, нафиг это нужно все вообще.

Тесты проводились на модели Deliberate_v2.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Метод original учитывает эмбеддинги исходника и придерживается их при генерации и декодировании шума. Хорош в том случае, если необходимо соблюдать контекст, цвета или формы.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Fill отлично подходит тогда, когда нужно убрать объект с фона или предмета. Этот метод размывает замаскированную область под маской, тем самым создавая пустое пространство.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Latent noise по сути создает случайный шум и затем его декодирует. С помощью данного метода можно как сгенерировать что-то новое в кадре, так и переделать часть объекта с нуля.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Latent nothing всегда создает определенный цвет, поверх которого затем происходит генерация.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Еще я заметил, что разные методики наложения шума по-разному меняют цветовую палитру. Для проведения этого эксперимента и размыл исходник в Photoshop в режиме Средняя, после чего проделал ту же операцию с картинками, на которых есть наложенный шум.

Чем правее стоит пример, тем больше он подвержен изменениям, и тем больше цвет отличается от исходника.

Отличие Inpaint модели от обычной

Inpaint-версия создает шум немного иначе, нежели обычная модель. Я привел данный пример, чтобы еще раз доказать, что шум — это многоэтапный и сложный процесс, который комбинируется с разными эмбеддингами и исходными данными.

Использовал в тестах Reliberate-inpaint. Такого рода модели обучаются дополнительно на масках и контентом под ним, а следование подсказке остается не в приоритете.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Шум Inpaint-модели максимально схож с оригинальной палитрой, а денойз стремится ближе к исходнику, т.е. эмбеддинги изображения явно перевешивают текстовые.

Самое понятное объяснение работы Denoising strength в Stable Diffusion. Режимы работы и генерация шума Искусственный интеллект, Нейронные сети, Stable Diffusion, Digital, IT, Наука, Алгоритм, Длиннопост

Вот еще примеры — и все также следование исходнику.

Congratulations, вы выжили!

Теперь вы разбираетесь в том, что такое Denoising strength в нейросетях. А если еще нет, то спамьте вопросами. Буду рад обратной связи и вашим комментариям, а также приглашаю в свой телеграм чат, где отвечу на все вопросы касаемо SD.

Буду рад видеть вас в телеграм-канале, где я собираю лучшие гайды по Stable Diffusion. А если не найду, то пишу сам.

Показать полностью 12
[моё] Искусственный интеллект Нейронные сети Stable Diffusion Digital IT Наука Алгоритм Длиннопост
0
7
Dmitriy.yiu
Dmitriy.yiu
1 год назад

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion⁠⁠

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

Вы не поверите, но я уже и разработчиков Kandinsky 2.2 спрашивал, что такое CFG Scale в фундаментальном смысле, и нейронщиков всех мастей, однако так не получил внятного ответа. От обывательских блогов меня вообще теперь тошнит, ибо там одно и то же: параметр CFG Scale увеличивает силу следования подсказке... И все как бы, окей — сами разберемся.

Так вот, я начал с базы и открыл научные статьи родоначальников метода classifier free guidance scale. Прикреплю ссылки на них сразу же, чтобы вы тоже могли ознакомиться. Вот статья, посвященная именно CFG Scale для диффузных моделей, а вот статейка о применении данного метода в современных языковых моделях.

Для чего это нужно?

Меня поразил тот факт, что метод CFG Scale и позволил диффузным моделям родиться. До них были GAN-модели, которые совмещали в себе генератор и дискриминатор. Дискриминатор, по-другому, это классификатор. Т.е. моделька сначала генерит изображение, а потом вторая полноценная модель оценивает его на вшивость и корректирует вместе с первой.

Из этого вытекают минусы: например, нужно вместе с одной моделью обучать и вторую (работы в два раза больше). Также нужно, чтобы железо тянуло сразу две модели, ибо они задействуются в паре.

Метод же SFG Scale позволил задействовать только одну модель — диффузнную, т.е. обучать вторую больше не нужно. Чтобы вы понимали, механика описывается парой строк кода. Думаю, вы смекаете, что это намного проще дополнительной полноценной модели, которую еще хранить где-то нужно.

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

В общем, благодаря CFG Scale мы получили более быстрое и стабильное обучение моделей, которые еще и по точности не уступают GAN-ам, а также могут генерировать изображения в разных разрешениях. Плюс дополнительные надстройки в виде LoRA стали доступны.

Как это работает?

Метод Classifier-Free Guidance Scale использует безусловную и условную генерации, которые перемножаются друг с другом. Грубо говоря, сначала создается изображение без учета текстовой подсказки, а затем с ней. Чем выше CFG Scale, тем больше будет доминировать условное изображение.

Это нужно для того, чтобы мы могли получить либо больше вариативности генерации, либо больше точности — того самого следования текстовой подсказке. Получается, что чем ниже CFG Scale, тем нейронка свободнее в своих действиях, а чем больше — наоборот, скованнее.

Так как формула просчета CFG Scale и перемножения двух генераций простая, то и минусы из этого следуют такие же простые и очевидные. Всем ясно, что математематические формулы можно совершенствовать до бесконечности, повышая точность и скорость. И это делают, сейчас разберем как.

Вот вам наглядная демонстрация влияния CFG Scale на качество генерации.

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

Как вы можете видеть, первое изображение при низком CFG Scale близко к безусловному, т.е. не учитывающем классы из текстовой подсказки. При высоком же значении этого параметра мы получаем те самые минусы математики, о которых я говорил выше. Нейросеть как бы пытается достать генерацию, выдавить ее через трафарет, максимально четко охарактеризовать объект.

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

Помните лизуна в сетке? Представьте, что когда вы сжимаете его, то увеличиваете тем самым CFG Scale. Т.е. вы проталкиваете подсказку через некий трафарет (сетка — это безусловное базовое изображение, а лизун — это условное изображение, сформированное подсказкой).

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

Теперь посмотрим на чрезмерное увеличение контрастности изображения в Photoshop. Принцип по сути очень похож: мы пытаемся усилить цвета и как бы выделить на фоне остальных, т.е. выжать, как того самого лизуна.

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

Снова возвращусь к минусам математики и ее бесконечном улучшении. Взгляните на примеры выше и сравните с предыдущими. Высокие значения уже не так коверкают генерацию, как раньше, а помогло в этом расширение CFG Dynamic trashholing, которое не выдавливает, а спиливает ненужные части. Вместе с лишним уходит и освещенность, но это все же лучше артефактов. Суть метода в том, чтобы как бы отодвигать яркие пиксели назад, тем самым уменьшая эффект ярких артефактов.

Про данное расширение и другие способы увеличить качество ваших генераций в десятки раз у меня, кстати, есть ролик.

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

Еще одной иллюстрацией механики CFG Scale можно считать два негативных промпта у нейросети Kandinsky 2.1, один из которых является безусловным, а другой условным. При CFG Scale < 1 отрицательная подсказка игнорируется.

По ссылке вы можете найти официальную документацию Kandinsky 2.1, а также прочитать буклет Google о classifier-free guidance scale, на который ссылаются разработчики Кандинского.

Что по итогу?

Самое понятное объяснения CFG Scale в нейросетях. Почему эта штука так важна и как повлияла на появление Stable Diffusion Искусственный интеллект, Нейронные сети, Digital, Stable Diffusion, Наука, IT, Диффузия, Генерация, Статья, Научная статья, Длиннопост

А по итогу мы имеем представление о методе, который является одним из родителей диффузных моделей, к примеру, Stable Diffusion или Midjourney.

Теперь нам не нужен дискриминатор, а модель генерирует изображение за несколько шагов, что дает массу простора в контроле генерации. Мы можем и ControlNet подрубать, и LoRA, всякие разные расширения, дополнения.

Но не только ControlNet-ом хороши современные нейронки, но и целыми каскадами других, не менее масштабных сетей. У Midjourney, к примеру, есть сеть-генератор формы объекта, граней, апскейла, раскраски и много чего еще. С GAN-моделями такое было бы практически невозможно совместить.

Если вы хотите глубже погрузиться в диффузные нейросети, то советую прочитать этот материал, который мне также помог в изучении темы. Также продублирую статью о методе CFG Scale в диффузных моделях, а также статью о применении методики в языковых моделях.

Congratulations, вы выжили!

Теперь вы разбираетесь в том, что такое CFG Scale в нейросетях. Буду рад обратной связи и вашим комментариям, а также приглашаю в свой телеграм чат, где отвечу на все вопросы касаемо SD.

Буду рад видеть вас в телеграм-канале, где я собираю лучшие гайды по Stable Diffusion. А если не найду, то пишу сам.

Показать полностью 7
[моё] Искусственный интеллект Нейронные сети Digital Stable Diffusion Наука IT Диффузия Генерация Статья Научная статья Длиннопост
5
88
ruitunion
ruitunion
2 года назад
Лига программистов
Серия Статьи

Обесценивание информации⁠⁠

Обесценивание информации IT, Трудовые отношения, ChatGPT, Midjourney, Stable Diffusion, Искусственный интеллект, Работа, Нейронные сети, Кризис, Длиннопост

Последние месяцы новости о применении генеративных нейросетей выходят по несколько штук в день. Но мнения о нейросетях кардинально расходятся даже у известных профессионалов в этой области. Франсуа Шолле еще в 2019 писал о третьей зиме искусственного интеллекта, как и MMC Ventures в своих отчётах. Илон Маск писал о неминуемой технологической сингулярности, которая может случиться со дня на день. Питер Тиль наоборот предлагает использовать LLM для военных действий. А известный исследователь ИИ и автор книги «Гарри Поттер и методы рационального мышления» Элиезер Юдковский, словно глашатай Судного дня, призывает бомбить несанкционированные датацентры ядерным оружием.

Фантасты и футурологи прошлого века мечтали, что роботы возьмут на себя всю грязную и тяжёлую работу, оставив людям творчество. Но теперь сформулированный еще в 80-е годы парадокс Моравека полностью подтвердился: началось наступление на творческие профессии. Художники, писатели, актёры, певцы, дизайнеры, программисты, управленцы, переводчики, рекрутеры могут быть заменены искусственным интеллектом.

Нейросети уже создают немыслимое количество контента. Положительные области применения нейросетей задвинуты в угол (например, преобразование информации из одного домена в другой: перевод текста, распознавание текста на изображениях, преобразование текста в речь или же речи в текст). А свидетели искусственного интеллекта уже стучат в вашу дверь. Ситуацию, в которой мы все оказались, хотелось бы рассмотреть поближе.

Да кто такой этот ваш ChatGPT?

Начнём с общего (не)понимания контекста. Наше представление об ИИ в основном сформировано исследованиями советской школы. Под искусственным интеллектом понимается именно полноценно мыслящий интеллект. В американской школе AI — это программа, которая может выполнять одну из функций человека. Например, читать или смотреть. Мыслящий ИИ в США называется AGI — искусственный интеллект общего назначения. Откровенно говоря, человечеству до него ещё много лет исследований и разработок.

ChatGPT

  1. Generative Pretrained Transformers (GPT) — трансформеры, особая архитектура нейросети, которая может обучаться на сверхбольших корпусах неразмеченных данных для генерации текстов. Модель учится максимально хорошо предсказывать следующее слово в предложении (но не более того).

  2. Reinforcement Learning from Human Feedback (RLHF) — обучение с подкреплением на основе пользовательской обратной связи. Обучение с подкреплением — это самая понятная концепция: мы назначаем нейросети «награду» за правильный результат и «наказание» за неправильный. Таким способом модель обучается выполнять правильные действия. В случае ChatGPT размер награды назначает человек, отмечая, насколько текст кажется ему правильным.

Из описания архитектуры и принципа работы ChatGPT можно выделить следующие вещи:

  • нейросеть обучается на сверхбольшом корпусе текстов;

  • учится выдавать некий усреднённый ответ, исходя из изученных данных, добавляя к результату немного энтропии.

Причём сеть обучена так, чтобы текст казался правильным и нравился человеку с субъективным восприятием прочитанного. На выходе получается красивый и грамматически выверенный усреднённый ответ. OpenAI утверждает, что по специфическим темам модель обучали профильные специалисты. Хотя основной корпус ответов обрабатывали разметчики из Африки с зарплатой 2$ в час.

Midjourney / Stable Diffusion

  1. Diffusion Model — модель вначале смотрит, как исходные изображения превращаются в шум, а затем учится восстанавливать изображения из гауссовского шума. Если провести эту операцию много раз с текстовыми подсказками, то модель научится восстанавливать усреднённое изображение, соответствующее конкретному текстовому описанию.

  2. Contrastive Language-Image Pre-Training (CLIP) — нейросеть, которая обучена связывать между собой изображение и текстовое описание, чтобы по текстовому описанию можно было найти максимально близкое изображение.

И опять нейросеть создаёт некое усреднённое изображение по текстовому описанию. Сеть обучается усреднению на сверхбольшом наборе доступных в интернете работ популярных художников. Связь между изображением и описанием создаётся людьми с субъективным восприятием увиденного.

Всё это сильно напоминает знаменитую «китайскую комнату», это неплохо и даже полезно. Но у всего есть границы применимости, выход за которые даёт абсолютно непредсказуемый результат. Нейросеть обучалась давать пользователям не правильный, а приятный ответ, и использовать её нужно именно для этого.

Информация

Люди хотят получать не просто информацию, а новую информацию. Заходя в интернет-магазин, они хотят узнать информацию о конкретных ботинках, а не об усреднённо-абстрактных: почитать о материале подошвы, посмотреть фото. Остальной текст служит для связи информации между собой. И когда информации вокруг становится слишком много, люди хотят получать максимально сжатые сведения.

В теории информации чётко разделяют данные и информацию. Например, Клод Шеннон определяет информацию как «уменьшение неопределённости знаний». Иначе говоря, насколько полученные данные являются новыми для субъекта.

Согласно этому, средние данные — это если прочитал описание ботинок, сгенерированное нейросетью, то прочитал все такие описания. Если посмотрел достаточно изображений, нарисованных нейросетью, то видел их все. Интерес вызывает только нечто новое, привнесённое человеком. Но нейросети генерируют данные очень быстро, тысячи и десятки тысяч изображений в секунду, в которых информация, привнесённая человеком, крайне мала. Повсеместное внедрение генеративных нейросетей ведёт к стремительному обесцениванию информации. Никто не прочитает описания товаров, если 95% из них будут написаны нейросетью. К изображениям, нарисованным нейросетью, будут относиться, как к стоковым картинкам из фотобанка. Все будут вставлять их потому, что так написано в правилах дизайна, но никто из пользователей не будет на них смотреть. Книги, написанные нейросетями, никто не будет читать. Дополнительно это будет усугубляться информационным шумом и галлюцинациями нейросетей. Очень сложно будет понять, насколько правдив прочитанный текст.

Но корпорации это не останавливает, как не остановили жалобы клиентов на ранние чат-боты, поставленные на замену первой линии техподдержки. Уже лавиной хлынули сообщения о применении нейросетей для «автоматизации» работы:

Microsoft внедряет ChatGPT в систему управления задачами для повышения «вовлечённости» сотрудников. Генерируя фактически бесполезные задания вместо настоящей работы. Геймификация на новый лад: «подключите 5 новых клиентов», «ответьте на 5 электронных писем», «изучите корпоративный регламент».

Компания «Подбор» собирается рассылать своим соискателям работы сгенерированные письма. Британская Octopus Energy уже использует ChatGPT для общения с клиентами через электронную почту. Обе компании результат оценивают положительно. Клиенты остались довольны, потому что нейросеть натренирована писать тексты, которые нравятся(!) людям.

«Fix Price» собирается генерировать описания вакансий и описания товаров. Маркетологи предлагают генерировать карточки товаров и описания к ним на OZON и Wildberries. В обоих случаях полезную информацию вносит человек, прося нейросеть учесть её при генерации. То есть нейросеть генерирует заполнитель между важной информацией, заваливая клиентов бесполезными словами и картинками.

DoccGTP — автоматическое комментирование кода на Swift, что уже на грани. Смысл комментариев в коде — указание на важную и неявную особенность. Нет никакого смысла документировать каждую строчку, размывая внимание разработчика.

Robusta смотрит на ошибки в системе логирования и даёт рекомендации по их устранению. Знания нейросети ограничены 2021 годом, и она не сможет подстраиваться под стремительно переписываемый Kubernetes. Вполне вероятно, что ситуацию спасёт плагин для доступа в интернет. Но и тогда нейросеть будет просто гуглить за сотрудника и пересказывать чужие и, возможно, ошибочные рекомендации своими словами с шансом галлюцинации.

Spotify удалила десятки тысяч треков, сгенерированных ИИ, из-за накрутки прослушиваний ботами для получения денежного вознаграждения. Как в этом хаосе из сгенерированной бессмыслицы пробиться начинающему таланту?

BuzzFeed заменяет 180 человек на ChatGPT для написания новостей. А главный редактор РБК только пробует на вкус. Для читателей нет ничего лучше новостей, разбавленных водой от галлюцинирующих нейросетей.

Дипфейки

Дипфейки можно отнести к отдельной категории информационного шума. Имитация голоса и манеры речи, синхронизация движения губ уже может наделать немало шуму, многократно искажая исходное послание. Современные нейросети пока не позволяют быстро изготавливать достаточно достоверный контент. Но часто этого и не нужно, даже плохо сгенерированный взрыв в Пентагоне способен обвалить фондовую биржу. А до распространения по сети фейкового видеоконтента с политиками и лидерами общественного мнения осталось не так много времени. Тем более, что на волне популярности многие из них сами используют генеративные нейросети для создания контента.

Философская телега

Способ обучения и использования нейросетей напоминает концепцию известного французского философа Жака Дерриды «Мир как текст». В век информации любая личность сформирована, по большей части, из прочитанных текстов. И восприятие реальности для субъектов искажается текстами, что порождает новые субъективные тексты. Например, Илья Суцкевер напрямую заявляет, что при достаточно большой и всеобъемлющей выборке возможность нейросетей просто предсказывать следующее слово в предложении должна привести к очень подробному пониманию мира. Другими словами: нейросеть, прочитавшая достаточное количество текстов, сможет понять все грани реального мира.

Вот только человек проверяет полученные знания, взаимодействуя с материальным миром. Может подвергнуть сомнению любую информацию, пройдя до материального первоисточника. Отринуть субъективные выводы автора и выработать собственные. Нейросеть такой возможности лишена изначально. Более того, RLHF, петля обратной связи на этапе дообучения, приносит ещё больше субъективного взгляда разметчиков, которые могут не обладать обширными знаниями. Среднее мнение по субъективным текстам не обязано коррелировать с материальным миром. Если количество текстов, оправдывающих теорию плоской земли, станет большим, чем количество опровергающих, то теория плоской земли вполне может встать рядом с научными теориями. Благо, текстам из википедии можно добавить побольше веса.

Так что же, нас всех уволят?

Обязательно уволят. Когда-нибудь.

Мировая экономика входит в очередной виток всеобщего кризиса, во время которого урезать затраты на ФОТ — единственный способ обеспечить рост прибыли. Первой волной пошли работники проектов, находящихся на грани самоокупаемости и ниже. Второй волной пойдут работники, которых хоть как-то можно заменить ИИ, только создав видимость их работы. IBM уже приостановила найм на 8 тысяч позиций.

Выдаваемый нейросетью текст на первый взгляд не отличается от текста копирайтера, а сгенерированные изображения побеждают в конкурсах художников и фотографов. И кого остановит отсутствие информации, когда техподдержку первой линии заменяли чат-ботами первого поколения? Пользователи до сих пор жалуются, что чат-боты не помогают решить проблему. «Лайфхаки», как выйти на оператора, востребованы у аудитории. Поэтому увольнять будут, несмотря на падение работоспособности даже в ближайшей перспективе.

Пользователи сети начали страдать от избыточного информационного шума ещё до появления нейросетей. Умение искать достоверную информацию превратилось в необходимый навык. Но в ближайшие годы нас ждёт стремительное обесценивание информации. По крайней мере, с таким заявлением Джеффри Хинтон уволился из Google. Ящик Пандоры уже не закрыть. Нейросетевые системы фильтрации контента петабайт мусора уже на подходе. Массовые сокращения работников под прикрытием внедрения ИИ только начались. А тысячи «волшебников» от мира IT спешат продать AI для собак, для дорожных работников, для выбора цвета штанов.

Показать полностью
[моё] IT Трудовые отношения ChatGPT Midjourney Stable Diffusion Искусственный интеллект Работа Нейронные сети Кризис Длиннопост
8

Оформить подписку для бизнеса

Перейти
Партнёрский материал Реклама
specials
specials

Ваш бизнес заслуживает большего!⁠⁠

Оформляйте подписку Пикабу+ и получайте максимум возможностей:

Ваш бизнес заслуживает большего! Малый бизнес, Предпринимательство, Бизнес

О ПОДПИСКЕ

Малый бизнес Предпринимательство Бизнес
1182
TECHNOKUB
TECHNOKUB
2 года назад

Stable diffusion запустили свой аналог ChatGPT и пользоваться им можно абсолютно бесплатно⁠⁠

На данный момент доступны модели с 3В и 7В параметров. В планах у компании так же 15, 30, 65, 175 В.

Модели полностью обученные и бесплатные в отличие от аналогов. Ссылка инструкция и установка.

Stable diffusion запустили свой аналог ChatGPT и пользоваться им можно абсолютно бесплатно Нейронные сети, Stable Diffusion, Технологии, Будущее, Длиннопост, IT
Stable diffusion запустили свой аналог ChatGPT и пользоваться им можно абсолютно бесплатно Нейронные сети, Stable Diffusion, Технологии, Будущее, Длиннопост, IT
Stable diffusion запустили свой аналог ChatGPT и пользоваться им можно абсолютно бесплатно Нейронные сети, Stable Diffusion, Технологии, Будущее, Длиннопост, IT

Пост в телеграм: https://t.me/tetidice/629?single=

Показать полностью 3
Нейронные сети Stable Diffusion Технологии Будущее Длиннопост IT
207
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии