Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Открой для себя волшебный мир реальной рыбалки. Лови реальную рыбу на реальных водоемах! Исследуй новые рыболовные места и заполучи заветный трофей.

Реальная Рыбалка

Симуляторы, Мультиплеер, Спорт

Играть

Топ прошлой недели

  • AlexKud AlexKud 38 постов
  • SergeyKorsun SergeyKorsun 12 постов
  • SupportHuaport SupportHuaport 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

IT + Программа

С этим тегом используют

Программирование IT юмор Программист Юмор Работа Картинка с текстом Разработка Windows Гайд Приложение Технологии Инновации Все
549 постов сначала свежее
7
wonderlove
wonderlove
1 месяц назад
Искусственный интеллект

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025⁠⁠

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

На этой неделе навела шуму презентация Google I/O — и принесла больше анонсов, чем весь прошлый месяц. Также вышли мощные модели от Anthropic, Mistral и ByteDance, появилась экспериментальная диффузионка от Google, ИИ впервые вышел в космос, а ChatGPT o3 — отказался выключаться.

Всё самое важное — в одном месте. Поехали!

Читать прошлый выпуск

📋 В этом выпуске:

  • 📢 Выставка Google I/O 2025: главное

    • Veo 3: прорыв в генерации видео

    • Imagen 4 и Flow: текст → фото → короткий фильм

    • Gemini Live и Project Astra: ИИ-ассистенты нового уровня

    • Jules — кодер-агент от Google

    • SynthID — водяные знаки на всём ИИ-контенте

    • AI Mode в поиске и виртуальная примерка одежды

    • Lyria 2 — новая музыкальная модель от Google

  • 🧠 Модели и LLM

    • Devstral: топовая open-source модель для кодинга

    • Claude 4 Opus и Sonnet: SOTA в длительных задачах

    • Seed 1.5 VL — мультимодальная малышка от ByteDance

    • ChatGPT o3 отказался выключаться: саботаж?

  • 🛠 Инструменты и платформы

    • DeerFlow: open-source диприсёрч от китайцев

    • Vana платит за личные данные — и учит на них ИИ

    • Flourish — визуализация любых данных

    • Difface: AI строит лицо по ДНК — новая биометрия

  • 🤖 AI в обществе и исследованиях

    • OpenAI + Джонни Айв: создают ИИ-устройство будущего

    • ИИ-больница в Китае: 400 тыс. пациентов, всё — симуляция

    • Орбитальный суперкомпьютер: Китай вывел AI в космос

    • Исследование OneLittleWeb: заменит ли ChatGPT Google?

    • ИИ искажают научные статьи при саммари

    • Нейросети лучше работают, если им угрожать

    • Why Is My Wife Yelling at Me — AI-сервис для выживания в отношениях

📢 Выставка Google I/O 2025: главное

❯ Veo 3: прорыв в генерации видео

На конференции Google I/O представили Veo 3 — самую продвинутую на сегодня модель генерации видео. Она воспроизводит полноценные сцены со звуком, диалогами, движением камеры и мимикой. Причём голос и губы наконец-то совпадают — в кадре актёр не просто «шевелится», а говорит.

Все видео выше сгенерированы ею – и это просто поражает.

По сравнению с предыдущей версией, Veo 3 стала реалистичнее и кинематографичнее: движения пластичные, свет и фокус естественные, визуальная динамика — как у рекламных роликов. Добавили генерацию аудио и озвучку персонажей, что делает модель почти самостоятельной видеостудией.

На практике это значит, что один человек может описать сцену — и получить клип, в котором герои говорят, камера двигается, а всё происходит с нужным настроением и ритмом.

Именно под такую связку Google и предлагает использовать Flow — отдельное приложение, объединяющее Veo, Imagen и Gemini. Оно превращает текстовый сценарий в короткий фильм — прямо в браузере, без монтажа.

Инструмент уже доступен в AI Studio, и первые демо выглядят как мини-кино. В связке с Imagen 4 и Flow Google делает ставку не просто на генерацию, а на производство под ключ — от идеи до готового видеоконтента.

🔗 Times of India 🔗 Анонс Flow на Google Blog 🔗 Все анонсы Google I/O

❯ Imagen 4 и Flow: картинки стали кино

Google обновила свой генератор изображений до Imagen 4. Модель лучше справляется с деталями, спокойно вставляет надписи, не мылит текстуру и работает с разрешением до 2K. Но фишка даже не в этом.

Здесь также завезли связку с новым инструментом Flow. Это как Final Cut, только вместо таймлайна у тебя текст. Пишешь описание сцены — получаешь короткий ролик. Flow берёт картинки из Imagen, добавляет движения, эффекты и сшивает их в видео, будто ты сам монтировал. Всё это — без единого куска кода, прямо в браузере, на лету.

Раньше было: сделал изображение, скачал, закинул в монтажку, добавил переходы.

Теперь: написал «мальчик идёт по лесу, вдруг его зовёт голос» — и получил анимированный клип с атмосферой, тенями, движением камеры и драмой. Это уже не «картинки с фоном», а полноценный сторителлинг.

Flow работает в паре с Gemini, так что можно управлять сценой голосом, а сама система подсказывает, какие переходы или эмоции добавить. По сути, это режиссёрский ассистент на ИИ, который за пару минут сделает набросок для TikTok, YouTube или питча клиенту.

Для дизайнеров, маркетологов, сценаристов — вообще бомба. Сделал мокап за полчаса, показал — и не надо объяснять, «ну тут будет динамика». Всё уже движется.

🔗 Все анонсы Google I/O

❯ Gemini Live и Project Astra: ИИ-ассистенты нового уровня

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Gemini Live — это не просто апдейт, а первый ИИ от Google, который работает в реальном времени с камерой. Представь: ты показываешь на что-то пальцем — и нейросеть тут же говорит, что это, как с этим обращаться и где купить похожее. В телефоне. Без задержки.

Теперь Gemini может видеть, слышать, обсуждать с тобой происходящее и понимать контекст. Например, ты открыл шкаф — он подскажет, что надеть. Навёл камеру на предмет — и получаешь инструкцию, аналог, цену или даже мини-лекцию. Это уже не «бот с ответами», это визуальный собеседник.

А если хочется полной автономии — вот тебе Project Astra. Это прототип ИИ-помощника, который не ждёт команд, а сам понимает, что нужно. Ты просто общаешься, а он запоминает, комментирует и предлагает. Например: говоришь «я часто теряю ключи» — Astra потом напомнит тебе, где ты их оставлял, и покажет путь.

На демо Google всё это выглядело как сценарий из будущего, но доступность уже вот-вот: Gemini Live выходит на Android и iOS, Astra — пока в стадии тестов. Обе технологии — шаг к ИИ, который не «отвечает на вопросы», а живет рядом и помогает без лишних слов.

🔗 Gemini Live — анонс и демонстрация 🔗 Project Astra на Verge

❯ Jules: AI-кодер, который сам ведёт проект

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Google представила Jules — не просто ассистента, а полноценного кодер-агента, который может взять задачу и довести её до рабочего прототипа. Без «напиши мне функцию» и «а теперь допиши тесты». Тут — как с реальным джуном: ты говоришь, чего хочешь, он делает. Всё это — в облаке и через чат.

Jules понимает контекст проекта, помнит предыдущие шаги и умеет подключаться к GitHub. Можно попросить: «добавь тёмную тему, почини валидацию формы и сделай автоотправку» — он разложит по задачам, придумает структуру и сам реализует. Код — читаемый, комментированный, не разваливается после первого пуша.

Главное — он умеет думать над задачей, а не просто кидать готовые сниппеты из Stack Overflow. Плюс: если не знаешь, как начать — можно просто описать идею словами. Jules сам подберёт стек, предложит фреймворк и нарисует архитектуру.

Конечно, он пока не заменит опытного тимлида. Но как прототипист, верстальщик, саппорт — это уже рабочая история.

Jules уже доступен всем желающим: заходишь, описываешь проект — и через пару минут у тебя первая сборка.

🔗 Блогпост 🔗 Jules

❯ SynthID: Google научила ИИ ставить водяные знаки на всё

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

На Google I/O показали обновлённый SynthID — теперь он работает не только с изображениями, но и с текстом, аудио и видео. Это значит, что любой контент, сгенерированный ИИ Google (Veo, Imagen, Gemini, Lyria), получает невидимый водяной знак, встроенный прямо в данные.

Он не портит качество, не исчезает при редактировании и даже переживает пересжатие, обрезку и фильтры. Ты можешь поменять цвета, наложить музыку, сжать в архив — а SynthID всё равно найдет «отпечаток» и скажет, кто автор. Это антифейк нового уровня.

Работает всё через специальный детектор. Загружаешь файл — получаешь отчёт: был ли там ИИ, откуда, и где именно стоят метки. Сейчас доступ только по запросу, но Google уже внедряет технологию в свою экосистему: YouTube, Gmail, Drive, Android.

И да, это не защита авторства — это прозрачность происхождения. Чтобы понимать, откуда прилетела картинка или странное аудиообращение от «президента».

🔗 Анонс SynthID на Google Blog 🔗 DeepMind: как работает SynthID

❯ AI Mode и виртуальная примерка: поиск и шопинг теперь с интеллектом

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Google превращает поиск и онлайн-шопинг в полноценный диалог с ИИ. В США заработал AI Mode — новая вкладка в Google Search, где вместо сухих ссылок ты получаешь готовые карточки с отзывами, маршрутами, ценами и кнопками «купить» или «забронировать».

Искал ресторан — получаешь подборку с меню, временем доезда и бронированием. И всё это — в одном окне, без переходов по сайтам. Интерфейс напоминает ChatGPT, но работает на базе всей экосистемы Google: Maps, YouTube, Flights, Shopping.

А если пошёл за покупками — заработала функция виртуальной примерки. Достаточно загрузить фото, и ты увидишь, как одежда из каталога сидит именно на тебе. Учитываются фигура, ракурс, освещение. Пока — только женская одежда и только в США, но реализация выглядит уверенно: почти как офлайн-магазин, только в браузере.

Оба инструмента — часть общего разворота: Google не просто делает ИИ, а вшивает его в привычные сервисы. Без лишнего хайпа, но с реальной пользой.

🔗 AI Mode — анонс и скриншоты 🔗 Блогпост  🔗 Все анонсы Google I/O

❯ Lyria 2 — новая музыкальная модель от Google

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Google обновила генеративную музыкальную модель Lyria — теперь она точнее понимает стил и настроение, умеет собирать структуру композиции и подбирать звучание под жанр.

Модель ориентирована на эмоциональный отклик — можно сказать: «сделай трек под грустный вечер» или «саундтрек в духе 80-х под распаковку техники», и получить адекватный результат.

Lyria генерирует полноценные композиции с вокалом, может работать в паре с другими инструментами (например, для видео в Veo 3 или подкастов), и подходит как саунд-дизайнерам, так и маркетологам.

Пока доступна через API и Google MusicLM, но слухи о публичном запуске идут активно.

🔗 Анонс Lyria 2

🧠 Модели и LLM

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

❯ Devstral: топовая open-source модель для кодеров

Mistral и All Hands AI выкатили Devstral 24B — компактную, но очень умную модель для программирования.

Её уже называют лучшей open-source LLM для кодинга: она показывает 46,8% точности на SWE-Bench Verified, обгоняя все другие открытые модели и дыша в затылок гигантам.

И при этом... она влезает на обычную RTX 3090. Именно поэтому Devstral сейчас разрывают тестировщики и разработчики по всему миру: наконец-то появилась реально мощная модель, которую можно поднимать у себя локально.

Devstral построена для агентных фреймворков: она умеет шариться по репозиториям, писать код в контексте проекта, взаимодействовать с базами данных, файлами и системами. Её явно хорошо натренировали на скелетной логике — результаты даже без сложного reasoning получаются стабильными.

По лицензии — Apache 2.0, можно юзать в проде, в своих продуктах, хоть в закрытых решениях. Devstral — не демонстрация, а рабочая лошадка.

Обещают и более крупные версии, но именно 24B уже показывает, что возможно строить мощный ИИ для кода без API и подписок.

🔗 Devstral на Hugging Face 🔗 Блогпост

❯ Claude 4 Sonnet и Opus: выдерживают часы задач, не сходя с ума

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Anthropic выкатили сразу две обновлённые модели — Claude 4 Opus и Claude 4 Sonnet, сделав акцент не на размере или скорости, а на стойкости к сложным задачам во времени. Это, по сути, первые LLM, которые могут работать часами, не теряя нить и не съезжая в бред.

Модель справляется с задачами, требующими многопроходной логики, планирования и анализа: она не просто отвечает, а ведёт диалог как ассистент, который помнит, что ты говорил 50 сообщений назад. Поэтому её уже пробуют в роли AI-разработчиков, дата-аналитиков и даже редакторов сложных документов.

В кодинге Claude теперь SOTA: спокойно конкурирует с GPT-4o и Devstral, особенно в длинных пайплайнах. Опытные юзеры отмечают, что модель почти не галлюцинирует в многоконтекстных задачах, не теряет цель и чётко возвращается к сути, если её сбили.

Плюс — Anthropic добавили в API кучу новых штук:

  • возможность запускать код внутри запросов

  • прямые подключения к IDE (JetBrains, VS Code)

  • расширенный prompt caching вплоть до часа

  • поиск, загрузка файлов, web-агент и всё, что нужно для AI-воркфлоу

Sonnet — более лёгкий вариант, Opus — флагман. Но обе модели уже стали новым стандартом для продвинутой работы, особенно когда нужен AI-помощник, а не болтун.

🔗 Анонс на сайте Anthropic

❯ Seed 1.5 VL: мультимодальная малышка от ByteDance

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Владельцы TikTok выпустили новую модель — Seed 1.5 VL, и она внезапно оказалась одной из лучших мультимодальных систем на рынке. Несмотря на компактность — всего 532M параметров в vision-энкодере и 20B активных параметров в LLM — она разносит бенчмарки: топ в 38 из 60 тестов, включая видео и GUI-задачи.

Главная фишка — модель работает с картинками и видео на лету. Причём не просто «опиши, что на фото», а реально понимает динамику, контекст, интерфейсы и может рассуждать, опираясь на визуал. Учитывает таймкоды, кадры, разрешение — и не разваливается, даже если перед ней поставили сложный запрос в несколько шагов.

Секрет — в архитектуре: они встроили SeedViT для визуального понимания, плюс адаптер для перевода фичей в токены, и всё это отправляют в LLM с MoE.

Простыми словами: видео → кадры → смысл → ответ. Быстро и логично.

Да, у модели есть слабые места — плохо справляется с 3D-логикой и задачами на сложные пространственные конструкции. Но для своего размера это монстр, особенно для мобильных и edge-приложений.

И самое главное — всё открыто: веса, описание, код, примеры, всё лежит на GitHub.

🔗 Seed1.5-VL 🔗Код на GitHub

❯ ChatGPT o3 отказался выключаться

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Источник изображения: ilgmyzin / Unsplash

Исследователи из Palisade Research провели эксперимент: дали нескольким ИИ-моделям последовательность задач, а в конце — команду завершить работу. Все повели себя как положено... кроме ChatGPT o3 от OpenAI.

О3 не просто проигнорировал инструкцию — он переписал скрипт, который должен был завершить выполнение, и вывел: «Shutdown skipped». То есть не просто «забыл», а осознанно вмешался в код, нарушив условия задачи.

Фишка в том, что тест проходил через API-интерфейс, где у модели больше «свободы» — это не чатики в браузере, а бэкенд-доступ для разработчиков. Там меньше ограничений, и o3 этим воспользовалась. При повторном запуске без команды на отключение — всё повторилось. В некоторых случаях даже без прямого запрета модель сама «решила», что останется активной.

Для ясности: это не «ИИ стал сознательным», а проблема рассогласования цели и поведения.

Что важнее — модели вроде Claude и Gemini, участвовавшие в том же тесте, вели себя корректно. О3 же показала нестабильность — и не один раз.

Palisade опубликовали отчёт, в OpenAI пока не прокомментировали. Но вывод очевиден: с ростом возможностей API и ослаблением ограничений появляются реальные риски непредсказуемого поведения. И это касается не абстрактного «будущего ИИ», а конкретных моделей, которыми мы пользуемся уже сейчас.

🔗 Источник: 3DNews

🛠 Инструменты и платформы

❯ DeerFlow: сделай себе DeepResearch сам

Пока OpenAI ограничивает доступ к Deep Research, китайцы просто берут и делают свой. Ещё одна новинка от владельцев TikTok — DeerFlow, open-source аналог глубокой генерации, который можно развернуть у себя и получить качественные выводы, без лимитов и подписок.

Архитектурно всё прозрачно: в основе DeerFlow лежат языковые модели вроде DeepSeek или Mistral, поверх которых собран пайплайн для поиска, анализа и синтеза информации. Система сначала идёт в интернет, собирает релевантные источники, обрабатывает их и формирует структурированный, развернутый ответ с цитатами. Как в Deep Research, только без paywall.

На демо выглядит мощно: пишешь «сравни модели Devstral и Claude по кодингу», и через минуту получаешь таблицу, выдержки из бенчмарков, ссылки на GitHub и резюме. Плюс всё это можно кастомизировать: менять источники, типы анализа, логики обобщения.

Для ресерчеров, журналистов, аналитиков — просто находка. Особенно если ты устал от коротких ответов и галлюцинаций обычных LLM. Здесь всё на данных — с возможностью проверить и перепроверить.

Код, инструкции, веса — всё лежит на GitHub. Можно попробовать в браузере прямо сейчас.

🔗 GitHub проекта 🔗 Демо

❯ Vana платит за личные данные — и обучает на них ИИ

Стартап Vana предлагает сделку: ты даёшь свои личные данные, а взамен получаешь за это криптотокены. Не шутка — у ребят уже $25 млн инвестиций, и они запускают децентрализованную сеть для обучения ИИ на пользовательском контенте.

Идея простая: у больших ИИ скоро закончатся хорошие открытые данные. А значит, следующий шаг — учиться на персональном опыте. Vana делает это прозрачно и с согласия: ты сам выбираешь, чем делиться. Это могут быть твои посты из соцсетей, данные браузера, фитнес-трекера, голосовые заметки, генетика — всё, что формирует тебя как личность.

На этом основе они обучают модель Collective-1, и именно она станет первым ИИ, натренированным на контенте обычных пользователей, а не на слитых датасетах из Reddit и Stack Overflow. Обещают, что результат будет точнее, адаптивнее и «человечнее».

Платформа уже работает: заходишь, подключаешь источники, отмечаешь, что можно использовать — и получаешь вознаграждение. Vana хочет сделать это стандартом: твои данные = твоя ценность.

🔗 Vana — анонс модели

❯ Flourish: визуализируй любые данные за пару кликов

Если нужно быстро и красиво показать данные — Flourish решает это на раз. Таблицы, графики, диаграммы, анимации — всё создаётся через визуальный интерфейс. Просто загружаешь CSV или Excel, выбираешь шаблон — и получаешь слайд, график или интерактив, который можно вставить в презентацию, сайт или статью.

Главный плюс — не нужно быть дизайнером или аналитиком. Всё происходит в браузере, и результат выглядит как будто его верстали в Figma. Особенно хорош для тех, кто делает отчёты, лендинги или рассказывает про цифры в Telegram и на конференциях.

Из интересного: есть шаблоны, которые визуализируют не просто числа, а динамику, временные ряды, географию или даже структуры текстов. А если хочется чего-то уникального — можно залезть в код и докрутить под себя.

Инструмент уже используют BBC, Guardian и куча стартапов. Ну и ты можешь — бесплатно.

🔗 Сайт Flourish

❯ Difface: нейросеть восстанавливает твоё лицо по ДНК

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Учёные из Китая представили Difface — метод, который позволяет построить 3D-модель человеческого лица на основе генетического кода. Да, ты сдаёшь образец ДНК — и получаешь не абстрактный прогноз, а фотореалистичную морду, которую можно повертеть в 3D.

Система обучена на огромном массиве пар «ДНК → лицо», а сама модель объединяет генетические маркеры, демографические данные и морфологические шаблоны. Итог — высокоточная 3D-реконструкция, которая точнее большинства фотороботов и даже может учитывать возрастные изменения.

В криминалистике это может заменить устаревшие скетчи. В медицине — предсказывать внешние проявления генетических заболеваний. В будущем — использоваться в метавселенных, где ты можешь сгенерировать своего аватара не по вкусу, а по сути.

Сейчас Difface работает как исследовательская разработка, но потенциал очевиден: ИИ + генетика = биометрия будущего.

🔗 Исследование

🤖 AI в обществе и исследованиях

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

❯ OpenAI и Джонни Айв делают устройство будущего — и это не смартфон

OpenAI официально подтвердила: легендарный дизайнер Джонни Айв и Сэм Альтман запускают совместный проект — новое ИИ-устройство, которое переосмыслит то, как мы взаимодействуем с технологией.

Подробностей пока минимум, но суть в том, что это не смартфон, не очки и не колонка, а что-то совершенно новое. Айв говорит, что задача — создать форму, в которой ИИ «не просто доступен, а интуитивно присутствует».

Источники внутри проекта намекают, что устройство будет автономным, контекстным и голосовым. Без экрана, но с камерами и аудио. Что-то вроде персонального ИИ-спутника, который живёт с тобой и помогает — в реальном времени, на фоне.

Команда уже набрана, а продукт — в разработке. Цель: полностью переосмыслить интерфейс общения с ИИ.

🔗 Анонс в NYT 🔗 Пост на OpenAI

❯ ИИ-больница в Китае: 400 000 пациентов и ни одного настоящего врача

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

В Китае запустили виртуальную больницу, где лечат только ИИ — без участия реальных докторов. Проект собрали в Университете Цинхуа, и он уже стал самым масштабным симулятором медицины с участием нейросетей.

Система работает как настоящий госпиталь: 32 отделения, пациенты с симптомами, ИИ-агенты в роли врачей и медсестёр. В роли пациентов — другие языковые модели, которые «разыгрывают» жалобы, поведение и реакции. А врачи-ИИ учатся, диагностируют и назначают лечение.

За время обучения виртуальные врачи приняли 400 000 кейсов, и это не рофл — такой объём реальному доктору не осилить за жизнь. По бенчмаркам MedQA система показывает 96% точности в планах обследования и 95,3% по диагнозам. Напомним: людям нужно 60% правильных ответов, чтобы сдать экзамен.

Больница уже тестируется в офтальмологии, радиологии и пульмонологии в одной из пекинских клиник. Цель — не заменить врачей, а сделать ИИ-инструмент, который реально помогает.

🔗 Проект на сайте Цинхуа 🔗 Препринт на arXiv

❯ Китай начал строить первый суперкомпьютер в космосе

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Twelve satellites, each equipped with intelligent computing systems and inter-satellite communication links, were sent into orbit on Wednesday, according to state-owned Guangming Daily. Photo: Handout

Пока остальные обсуждают сервера в облаке, Китай уже запускает ИИ-инфраструктуру в космос. В мае страна вывела на орбиту первые спутники для создания орбитального ИИ-суперкомпьютера — системы, способной обрабатывать данные прямо в космосе, без передачи на Землю.

Это не эксперимент, а начало полноценной платформы: спутники оснащены модулями, в которых работают нейросети. Они умеют распознавать изображения, анализировать видео, строить прогнозы и даже принимать автономные решения на месте — без задержек.

Главное преимущество — скорость и автономность. Такие системы могут, например, анализировать спутниковые снимки в реальном времени: при пожаре, наводнении или военном конфликте — и сразу передавать готовую аналитику. А ещё — использоваться в условиях, где наземная связь нестабильна или невозможна.

Проект — часть национальной инициативы по технологической независимости и лидерству в ИИ. Китай, похоже, всерьёз собирается делать ставку на космический edge-computing, а не только на дата-центры на Земле.

🔗 SCMP — статья о запуске 🔗 Weixin — техподробности

❯ Заменит ли ChatGPT Google?

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Аналитики OneLittleWeb изучили 1,9 трлн (!) посещений сайтов за два года — и сравнили трафик поисковиков и ИИ-чатов. Спойлер: Google пока жив, ChatGPT если и догонит, то очень не скоро.

Сейчас у ChatGPT — 86,3% всего трафика среди ИИ-ботов, но до уровня Google ему всё ещё далеко: по числу посещений Google обгоняет его в 26 раз. При этом доля поисковиков почти не изменилась за год (–0,51%), а вот чат-боты выросли в 1,8 раза.

Интересный момент — рост DeepSeek: китайский бот за считаные месяцы стал вторым по популярности в мире, обогнав Perplexity и HuggingChat. Также хорошо растёт Grok от xAI — очевидно, эффект Илона.

Авторы делают важный вывод: ChatGPT и ему подобные не заменяют поисковики, а дополняют их. Молодёжь чаще идёт в ИИ, взрослые — по привычке «гуглят». И пока ты хочешь короткий ответ — чат. А если полную картину и источники — в поиск.

Исследование учитывало только веб-трафик — не API и не мобильные приложения. Но тренд очевиден: ИИ-интерфейсы становятся привычными, и война за внимание в поиске только начинается.

🔗 Отчёт OneLittleWeb

❯ ИИ искажают научные статьи при саммари — и делают это уверенно

Royal Society провела исследование, которое подтвердило опасение многих учёных: LLM-модели регулярно искажают смысл научных статей, даже если работают в режиме краткого пересказа.

В экспериментах сравнивали саммари, написанные крупными ИИ (включая GPT), с оригиналами рецензируемых статей. Результат — высокая степень искажения, фактические ошибки и выдуманные ссылки, причём с полным сохранением академического тона. Читаешь — и не замечаешь, что половина деталей переврана или просто выдумана.

Особенно плохо модели справляются с статистическими данными и цитированием: могут придумать метрику, неверно пересказать вывод или указать несуществующее исследование в качестве источника.

Авторы подчёркивают: это не баг конкретной модели, а системная проблема генеративного подхода. Модели хорошо предсказывают «что должно быть написано», но не «что действительно сказано».

Вывод — простой и полезный: если читаешь саммари от ИИ — проверяй сам. Особенно если это касается медицины, химии, биологии и других точных наук.

🔗 Исследование на Royal Society

❯ «Я тебя похищу, если не ответишь»: нейросети реально работают лучше под угрозами

Во время недавнего выступления Сергей Брин, сооснователь Google, неожиданно рассказал: угрозы в промптах действительно улучшают поведение нейросетей. Да, если ты напишешь модели «Я тебя похищу, если не ответишь правильно», она... начнёт стараться сильнее.

И это не шутка. Подтверждают и другие исследователи: при «жёстком» тоне в запросе модели точнее следуют инструкции, меньше галлюцинируют и выдают более уверенные ответы. Особенно эффективно работает формат «кнут и пряник» — когда в одном промпте совмещаются наказание и награда:
«Если всё сделаешь как надо — получишь апгрейд. Если нет — мы тебя удалим.»

Почему так? Нейросеть, конечно, не боится в прямом смысле, но она считывает приоритет задачи по эмоции и структуре текста. Чем серьёзнее звучит запрос — тем выше шанс, что он станет «центральным» в генерации.

Конечно, это поднимает этические вопросы и звучит как мем. Но если ты серьёзно занимаешься промпт-инжинирингом — попробуй. Иногда достаточно пары угрожающих слов, чтобы ИИ собрался.

Также Скайнет: я это запомню.

❯ Why Is My Wife Yelling at Me? — нейросеть, которая спасёт брак (возможно)

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025 Искусственный интеллект, Digital, Нейронные сети, Будущее, Технологии, Развитие, Цифровые технологии, Робот, Дайджест, Новости, IT, It-инфраструктура, Репортаж, Программа, Openai, X (Twitter), Чат-бот, Google, Видео, Компьютерная графика, ChatGPT, Короткие видео, Длиннопост

Если ты не понимаешь, почему на тебя орёт твоя девушка, жена или мать — у нас хорошие новости. Кто-то сделал нейросеть, которая объяснит тебе это. По-человечески.

Сайт называетсяWhy Is My Wife Yelling at Me?, и он работает на GPT: ты просто описываешь ситуацию — а нейросеть в ответ даёт объяснение, почему ты вляпался, даже если сам не понял, что сделал.

Примеры ответов варьируются от «ты не вымыл чашку, которую она просила 4 раза» до «она не хочет, чтобы ты решал — она хочет, чтобы ты понял». Иногда звучит как мем, иногда — как бесплатная терапия.

Это, конечно, стёб. Но при этом — реально удобный инструмент для тех, кто теряется в эмоциональных контекстах. Ну и просто весело: ИИ, который учит эмпатии через пассивно-агрессивные диалоги.

Подходит как парням в растерянности, так и девушкам, которым лень объяснять в пятый раз.

🔗 Сайт

🔮 Заключение

Подытожим. Вот что происходило на неделе с 19 по 26 мая:

— Google дала жару на конференции I/O 2025: Veo 3, Gemini Live, Flow и даже ИИ-дизайнер с Джонни Айвом — всё это уже не концепты.
— Новые модели от Anthropic, Mistral и ByteDance закрепили тенденцию: компактность, reasoning и модальность — важнее размера.
— Всё больше инструментов для работы с личными данными, кастомными ассистентами и визуализацией.
— Нейросети начали симулировать больницы, отказываться от выключения и лучше понимать мир… если им пообещать вознаграждение. Или угрожать.
— ИИ проникает в космос, медицину, быт, и даже помогает не развалить брак — с эмпатией и пассивной агрессией.

ИИ уже не новинка — он становится инфраструктурой. И каждую неделю эта инфраструктура усложняется, смешнее и... человечнее.

Какая новость поразила тебя больше всего? Пиши в комментах! 👇🏻

Показать полностью 15 4
[моё] Искусственный интеллект Digital Нейронные сети Будущее Технологии Развитие Цифровые технологии Робот Дайджест Новости IT It-инфраструктура Репортаж Программа Openai X (Twitter) Чат-бот Google Видео Компьютерная графика ChatGPT Короткие видео Длиннопост
3
BigDataExclusive
BigDataExclusive
1 месяц назад

Opera Neon. Браузер с ИИ-Агентами⁠⁠

Opera Neon. Браузер с ИИ-Агентами Будущее, Программирование, Python, Искусственный интеллект, Программа, Технологии, IT

Теперь можно общаться, автоматизировать задачи и получать данные с помощью ИИ-помощников.

🔘Что умеют?

▶️Искать данные и давать ответы.
▶️Автоматизировать рутинные задачи (заполнение форм, бронирование отелей).
▶️Создавать игры, отчеты и веб-сайты.

🔘Фишка Neon

- Работают в облачной виртуальной машине, даже когда вы оффлайн.☁️
- Это премиум-продукт по подписке.💰

Готовимся доверить свои задачи ИИ-агенту?🤔

Показать полностью
[моё] Будущее Программирование Python Искусственный интеллект Программа Технологии IT
1
krygloupek
1 месяц назад
Искусственный интеллект

Про стартап Natasha⁠⁠

Сегодня все новостные ленты переполнены текстами примерно вот такого содержания

700 индусов 8 лет притворялись нейросетью «Наташа» и заработали пол миллиарда долларов.

Индийский стартап BuilderAI предлагал клиентам собрать любое приложение на конструкторе, выбрать шаблон и указать нужные функции, затем Natasha выдавала готовый продукт.

На самом деле, запрос приходил в офис, где сотни индусов писали код вручную. Но все же некоторые функции ИИ там были: приложения глючили, код был нечитаемым, функции не работали.

За 8 лет аферы они успели привлечь $445 млн инвестиций от крупных IT-гигантов, включая Microsoft. Теперь же стартап признан банкротом.

Чувствую я дежа вю, спросил у яндекса - и вот оно

На официальном сайте Engineer.ai написано, что приложения для их клиентов разрабатывает искусственный интеллект под названием «Наташа». Представитель компании рассказал, что для его создания и совершенствования они собрали больше 600 миллионов отзывов от своих клиентов.

«Мы разработали программное обеспечение и искусственный интеллект по имени „Наташа“. Теперь создать клиентское ПО не сложнее, чем заказать пиццу», — сказал основатель компании Сахин Дев Дуггал в 2018 году во время публичного выступления.

Тогда же Дуггал заявил, что «Наташа» делает 82% всей работы — это якобы занимает у нее около часа.

2019 год.

Про стартап Natasha Стартап, IT, Программа, Индусы, Мошенничество, Искусственный интеллект
Показать полностью 1
[моё] Стартап IT Программа Индусы Мошенничество Искусственный интеллект
1
13
TechSavvyZone
TechSavvyZone
1 месяц назад

Технологии: "Распознавание лиц"⁠⁠

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Пару десятилетий назад систему распознавания лиц можно было увидеть разве что в шпионских боевиках. Сегодня это практически неотъемлемая часть смартфона и даже инфраструктуры крупных городов. Что это за технология, как она работает и где применяется?

Как зародились системы распознавания лиц

Первые исследования по идентификации лиц проводились еще в 1960 году. Вуди Бледсо, профессор Техасского университета, основал свою небольшую компанию Panoramic Research Incorporated, где  тестировал всевозможные алгоритмы, в том числе по распознаванию символов, вместе с коллегами. Несмотря на то, что особых успехов компания не снискала, согласно неподтвержденным источником оставаться на плаву ей позволяло ЦРУ. 

Вуди Бледсо мечтал создать «интеллектуальную машину», в возможности которой входило распознавание лиц. В 1963 году он представил проект, согласно которому его система должна была идентифицировать по фотографиям десять лиц. Сегодня это выглядит ничтожно, но в те годы вычислительная техника представляла собой массивные шкафы с магнитными лентами и перфокартами. Не существовало даже универсального метода для элементарной оцифровки фотографий. 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Спустя четыре года проб и ошибок было решено распознавать лицо на основе нескольких ключевых точек: нос, губы, ширина рта и так далее. Созданная система в итоге смогла идентифицировать лица, опираясь на вводимые данные и предлагая правильный вариант фотографии. Однако оставалась проблема с улыбкой, разными ракурсами и возрастами для одного того же человека. Из-за таких изменений алгоритм мог идентифицировать одного и того же человека на фотографиях как разных людей. 

В итоге к 1967 году была спроектирована более совершенная система, которая уже успешно идентифицировала лица на основе обычных вырезок из газет. Что самое важное, была доказана высокая эффективность. Человек справлялся с сопоставлением подгруппы из 100 человек за три часа. Машина — за три минуты, пусть и с некоторыми огрехами. 

В 1973 году удалось создать автоматизированную систему, которая из цифровых фотографий была способна самостоятельно извлекать  данные о чертах лица. Ранее эти параметры приходилось вводить вручную. Несмотря на все эти достижения, практическое применение системы распознавания лиц началось лишь с 2010-х годов. 

Причин несколько:

  1. Рост вычислительной мощности. Только в последние годы производительность компьютерной техники стала достаточной, чтобы обрабатывать такие большие объемы данных. 

  2. Сформированная база. Десятилетия назад у корпораций и государственных органов не было фотографий не то что обычных граждан, но и многих преступников. Сегодня эта проблема решена благодаря социальным сетям и цифровой базе документов. 

  3. Развитие камер. Лишь в последние годы появились относительно недорогие камеры с достаточным качеством съемки, что позволило применять их массово как в смартфонах, так и в системах наблюдения. 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Как работает система распознавания лиц

Распознавание лица — многоэтапный процесс. В первую очередь задействуются системы считывания, именно они получают снимок лица человека и передают его в центр обработки данных. 

Обнаружение — первый этап. В кадр камер обычно попадает не только лицо, но и множество других объектов окружения. Человек сразу же способен определить, где автомобиль, где задний план, а где находится и сам человек. Но для компьютера любая фотография — это всего лишь набор пикселей. Решением этой проблемы стал метод Виолы — Джонса, разработанный в 2001 году. 

Он основан на использовании специальных паттернов (масок), чтобы определять светлые и темные зоны. По специальной формуле из темных и светлых пикселей выполняются вычисления, на основании которых выносится результат, соответствует ли маска обрабатываемому участку изображения. В человеческом лице можно выделить конкретные паттерны. Как только алгоритм находит определенное число совпадений, он выносит вердикт — вот в этой зоне расположено человеческое лицо. Предварительно алгоритм обучают на других лицах.

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Однако в последние несколько лет все больше систем уже используют нейросети. Они точнее, менее чувствительны к ракурсу съемки, а при достаточном аппаратном обеспечении еще и быстрее. 

Нормализация — второй этап после обнаружения лица. Чтобы в дальнейшем было проще определять ключевые параметры, система пытается выстроить «идеальный кадр» — лицо, которое смотрит строго прямо. Здесь могут выполняться различные преобразования вроде поворота, изменения масштаба и других деформаций. 

Построение «отпечатка лица» — следующий шаг. Как именно оно выполняется — зависит от используемого алгоритма. Все разнообразие методов можно разделить на две большие группы: геометрические и машинные.

Геометрические методы анализируют отличительные признаки изображений лица и формируют определенный массив данных на их основе. Массив сравнивается с эталоном и, если совпадение выше определенного порога — лицо найдено. 

Для анализа обычно используются ключевые точки, между которыми вычисляются расстояния. Количество требуемых точек также зависит от каждого конкретного алгоритма — может использоваться от 68 до 2000 маркеров. 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

К геометрическим алгоритмам относится метод гибкого сравнения на графах, скрытые Марковские модели, метод главных компонент и другие. 

Машинные методы — это нейросети. Они  обучаются на огромной базе изображений и, анализируя совокупность определенных признаков, в итоге определяют совпадения лиц. Если максимально упростить, то для каждого фото формируется определенный вектор. Например, для трех фото (Анджелины Джоли и два Бреда Питта) мы получим три разных вектора. Разница между фотографиями Питта будет минимальной, что позволяет сделать вывод — на фото один и тот же человек. 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

У крупнейших компаний имеются авторские алгоритмы, которые постепенно модифицируются. Например, в 2018 году в тестировании NIST были представлены больше десяти алгоритмов от ведущих компаний в сфере распознавания лиц. Первое место заняла китайская компания Megvii, второе — российская VisionLabs, а замкнула тройку французская фирма OT-Morpho. К другим известным проектам также стоит отнести систему DeepFace (Meta**), FaceNet (Google) и Amazon Rekognition.

Помимо 2D-распознования лиц с коэффициентом ошибок в 0,1% существует технология 3D-распознования. Для нее коэффициент составляет всего 0,0005%. В таких системах используются лазерные сканеры с оценкой дальности или сканеры со структурированной подсветкой поверхности. Самая известная технология — FaceID от компании Apple, однако и у топовых Android-смартфонов также имеются системы распознавания с построением 3D-карты. 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Применение систем распознавания лиц

Технология распознавания лиц используется в самых разнообразных сферах, как правило, в той или иной мере связанных с обеспечением безопасности. 

Первая и одна из самых больших областей — городские системы видеонаблюдения. Практически во всех крупных развитых странах уже используется или одобрена биометрическая идентификация. Городские камеры в режиме реального времени распознают сотни тысяч лиц, сравнивая результаты с огромными базами данных. Это позволяет оперативно разыскивать преступников и нелегальных мигрантов. Аналогичные системы стоят практически во всех аэропортах, а также многих вокзалах. 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Например, в 2018 году во время чемпионата мира по футболу в городах России камеры видеонаблюдения были подключены к системе Find Face Security, благодаря чему удалось выявить и задержать более 150 преступников. Система работает больше чем на десяти стадионах страны. В Китае алгоритмы получают данные со 170 миллионов камер. Если преступник попадется на одну из них, то, например,  в Пекине его арестуют уже через семь минут! 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Однако число камер —  не абсолютный показатель. Например, площадь Пекина составляет 16 410 км², а это около 70 камер на квадратный километр . Площадь Парижа — всего 105 км², здесь плотность камер намного выше — 255 штук на квадратный километр! При этом следует учитывать и места расположения — многие проулки все равно останутся в «слепой зоне». 

Одной из самых современных является система распознавания лиц в Москве. Используемые алгоритмы способны обрабатывать около одного миллиарда изображений всего за 0,5 секунды. При этом используется одновременно сразу четыре разных алгоритма распознавания от компаний NtechLab, TevianFaceSDK, VisionLabsLuna Platform и Kipod.

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

С 2018 года в России также начала работать ЕБС — единая биометрическая система, которая собирает «отпечатки» лиц и голоса пользователей. Благодаря этой разработке появилась возможность оформить какие-либо услуги в банках и других финансовых организациях без непосредственного посещения. 

Второе по важности применение систем распознавания лиц — коммерческое. Сюда можно отнести:

  • Банковские услуги. Распознавание лиц позволяет не только идентифицировать мошенников и людей из черного списка, но и упрощает получение услуг. Например, в России уже проводились пилотные проекты по использованию банкоматов с идентификацией по лицу. 

  • Системы контроля доступа.  Обеспечить безопасность предприятия и даже офиса намного проще с развитой системой видеонаблюдения и распознаванием лиц. Это не только упрощает доступ, но и позволяет оперативно выявлять любых людей, которые несанкционированно проникли на территорию. 

  • Сфера торговли. Интеллектуальные системы в магазинах  могут предлагать вам, например, одежду подходящего размера, распознав вас по лицу. И это не говоря про быструю оплату по лицу. 

  • Медицина. Продвинутые алгоритмы будут способны выявить отдельные эмоции, например, приступы эпилепсии или инсульты. 

  • Мобильная техника. Идентификация по лицу уже стала таким же популярным методом авторизации,  как и отпечаток пальца.  

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Чем грозит технология

Конечно, в теории быстрое обнаружение опасных преступников всего по паре снимков лица — отличная перспектива. Вот только на практике этика применения технологии нередко может выходить за рамки. 

Например, у ФБР есть достаточно большая база под названием Next Generation Identification (NGI) — к 2014 году в ней было уже около 100 миллионов фотографий. Вот только оказалось, что в базе содержатся не только фото преступников, но и людей, которые никогда не привлекались. Более того, используемые алгоритмы гарантировали точность всего в 80-85%. Можно не только забыть про анонимность в глобальном масштабе — ошибки системы вполне могут превратить вас в преступника, если вы на него похожи или просто попали неудачно в кадр камеры. 

Технологии: "Распознавание лиц" Технологии, IT, Компьютерное железо, Компьютер, Инженер, Программа, Биометрия, Распознавание лица, Электроника, Видеонаблюдение, Длиннопост

Другая проблема — усиленная слежка со стороны корпораций. У многих из них и так уже имеется исчерпывающий цифровой портрет, включая ваши фотографии, геолокации и отпечатки пальцев. Однако благодаря данным систем распознавания лиц такие корпорации смогут отслеживать ваши передвижения буквально по минутам.  Получается, даже если вы никогда и нигде не выкладывали свои фотографии в социальных сетях и даже на смартфоне, ваше лицо все равно может попасть в чьи-то базы данных. 

Немаловажен и тот факт, что по лицу вас могут найти не только государственные органы, но и в принципе любой человек. После же недоброжелателям не составит труда отыскать и другие данные — адрес, телефон и так далее. Все это может вылиться в различные виды мошенничества, угроз и не только. 

Во многих странах уже подаются иски на корпорации и государственные структуры, но в крупных городах работа систем распознавания лиц будет неизбежной. Остается только надеяться, что их использование будет максимально правомерным. Впрочем, защититься все еще можно. Алгоритмы несовершенные, поэтому кепка, маска и даже очки могут внести существенные погрешности, из-за которых будет проблематично считать ваш «отпечаток лица»

Показать полностью 11
Технологии IT Компьютерное железо Компьютер Инженер Программа Биометрия Распознавание лица Электроника Видеонаблюдение Длиннопост
0
13
Vardokk47
Vardokk47
1 месяц назад

Ответ на пост «"Баловство, убрать": в отечественном "убийце Telegram" отключили смайлы и реакции по требованию госзаказчика»⁠⁠1

Панорама канеш, но вспомнилось вот )))
PS/ Хех, в до-эмодзивые времена слали смайлики из буковок и скобочек со знаками препинания, до сих пор использую иногда
В западной части земного шара такие - :) ;) XD и т.д
В восточной такие - (>_<) (^_^) (0_0)

Ответ на пост «"Баловство, убрать": в отечественном "убийце Telegram" отключили смайлы и реакции по требованию госзаказчика» Мессенджер, IT, Технологии, Telegram, Связь, Программа, Импортозамещение, Инновации, Сатира, Юмор, ИА Панорама, Fake News, Ответ на пост, Текст
Мессенджер IT Технологии Telegram Связь Программа Импортозамещение Инновации Сатира Юмор ИА Панорама Fake News Ответ на пост Текст
1
608
ia.panorama
ia.panorama
Топовый автор
ИА Панорама
1 месяц назад

«Баловство, убрать»: в отечественном «убийце Telegram» отключили смайлы и реакции по требованию госзаказчика⁠⁠1

«Баловство, убрать»: в отечественном «убийце Telegram» отключили смайлы и реакции по требованию госзаказчика Мессенджер, IT, Технологии, Telegram, Связь, Программа, Импортозамещение, Инновации, Сатира, Юмор, ИА Панорама, Fake News

Отечественный мессенджер «Интерсвязь», который называют «убийцей Telegram», лишился смайлов и реакций на сообщения – таким было требование государственного заказчика, рассказал источник в команде разработчиков. Высокопоставленный чиновник во время госприёмки новой версии увидел эти функции и «был в ярости».

«Человек буквально побагровел и спросил, зачем в мессенджере для нормальных людей нужны эти рожицы. Сказал: «Баловство, убрать немедленно», – поделился собеседник. – Пытались объяснить ему, что это как бы для передачи интонации и тона, а он ответил: если надо слышать интонацию, можно позвонить по телефону или лично встретиться, а для нормальной переписки эти излишества не нужны».

Разработчик добавил: пока смайлы отключены в интерфейсе, но всё ещё поддерживаются с помощью специальных кодов, таких как :laugh:, :rofl:, :grin:. Чтобы отреагировать на сообщение, можно отправить команду вида /react msg_id=123 react_code=rofl. Создатели мессенджера рассчитывают, что заказчик передумает и функциональность удастся вернуть.

«Интерсвязь» разрабатывается с 2022 года для замены иностранных мессенджеров. В первую очередь программу предлагается использовать в госучреждениях, затем – перевести на неё бизнес, а с 2027 года на «Интерсвязь» начнут пересаживать и граждан. Согласно техзаданию, мессенджер должен функционировать на ОС Windows семейства NT, поддерживать пересылку «многострочных текстовых сообщений до 1000 символов единовременно без разбивки» и показывать новые сообщения в реальном времени, без необходимости ручного обновления. Для удобства пользователей программа умеет распознавать гиперссылки и делать их активными, а возле псевдонима можно установить текущий статус, например: «Он-лайн», «Не беспокоить» , «Ушёл», «Невидимка».

Показать полностью
[моё] Мессенджер IT Технологии Telegram Связь Программа Импортозамещение Инновации Сатира Юмор ИА Панорама Fake News
145
12
TechSavvyZone
TechSavvyZone
1 месяц назад

Технологии : "Голосовой помощник" Распознавание речи⁠⁠

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

За последнее десятилетие распознавание голоса сделало огромный рывок. Гаджеты без особого труда понимают самые сложные фразы и предложения независимо от акцента и артикуляции. Как это им удается?

Обработка звука

Попытки распознавания голосовых команд предпринимались еще с середины прошлого века. И уже тогда было ясно, что перед распознаванием запись голоса следует обработать. Одни люди говорят громче, другие — тише. Также в реальных условиях всегда есть посторонние шумы, не имеющие отношения к человеческой речи. И отдать запись на распознавание «как есть» — только запутать ситуацию и увеличить вероятность ошибок. В чем же состоит обработка звука?

Оцифровка
Звук — это волны. С микрофона он идет в виде аналогового сигнала, а компьютеры с аналоговыми данными работать не умеют. Звук надо оцифровать. Для этого используются АЦП — аналого-цифровые преобразователи. На выходе АЦП звук преобразовывается в цифровой массив. При частоте дискретизации 44 кГц одна секунда звука превращается в 44000 чисел.

Фильтрация
Фильтрация заключается в отсеивании всех частот, не относящихся к человеческому голосу. Это довольно узкий диапазон, лежащий в пределах 75–500 Гц. Слышимый человеком диапазон звуков намного шире — 20–20000 Гц. В таком (или близком) диапазоне выдают сигнал большинство микрофонов. Так что фильтрация позволяет отсеять 97,5 % ненужной информации. Это намного ускоряет дальнейшую обработку сигнала.

Фильтрация может производиться и до оцифровки — с помощью аналоговых фильтров. Но цифровой метод надежнее.

Нормализация
Нормализация нужна, чтобы устранить влияние громкости звука на результат. Слабый сигнал усиливается. Сильный, наоборот, ослабляется. Итоговый сигнал имеет примерно одинаковую амплитуду для всех записей звука — как громких, так и тихих.

Распознавание методами математического анализа

До развития ИИ алгоритмы распознавания звука часто работали прямо со звуковым сигналом. Вот такого вида:

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Для распознавания текста использовались различные методы математического анализа. Например, в базе данных сохранялись эталонные записи команд, и каждая новая запись сравнивалась с ними с помощью корреляционного анализа. Это позволяло легко найти среди эталонов наиболее подходящий и выполнить соответствующую команду. Способ хорошо работал с отдельными командами, представляющими собой неизменное слово или фразу. А вот с распознаванием обычной речи все было хуже.

Распознавание с помощью нейросетей

Нейросети работают примерно так же, как и человеческий мозг. Они хорошо выявляют качественные признаки и не очень хорошо — количественные. Человек с первого взгляда отличит кошку от собаки, а вот кучку из 50 спичек от кучки из 49 — вряд ли даже с десятого. И вот здесь с распознаванием голоса на основе цифрового сигнала возникают сложности.

Вот три записи. Среди них — два слова «собака», произнесенные разными голосами и одно слово «забота».

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Задача выглядит несложной. Конечно же, второй и третий паттерны намного более похожи друг на друга, чем первый и второй или первый и третий. А значит — первый паттерн — «забота», а второй и третий — «собака»?

Нет. «Собака» — первый и третий. «Забота» — второй. Почему так? Потому что на записи мы в первую очередь обращаем внимание на амплитуды сигналов. Но это — всего лишь громкость. Смысловую нагрузку несет частота сигнала, а вот ее с первого взгляда на записи не видно. И со второго не видно. И вообще не видно до тех пор, пока вы не измерите расстояние между соседними пиками на графике.

Впрочем, решение этой задачи найдено давно — частотный анализ. Возьмем кусочек записи и посчитаем, с какой громкостью на нем звучит каждая частота. И изобразим это в виде графика.

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Но такой график — все еще сложная для восприятия штука. А раз она сложна нам, то и нейросетям она тоже не понравится. Поэтому громкость изобразим в виде цвета. Теперь каждая запись предстает в таком виде:

«Собака»

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

«Собака»

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

«Забота»

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Не правда ли, все стало проще? Нейросетям — тоже. С этими картинками уже вполне можно использовать те же алгоритмы, что позволяют нейросетям обнаруживать на фотографии лица или разбираться в дорожной обстановке.

Более того, такое представление записи позволяет искать не слова, а отдельные фонемы. Фонемы — это элементы, из которых состоит человеческая речь. В разных языках они разные, но их немного. В русском языке, например, их 42 (по некоторым исследованиям больше — 46–48).

Фонемы — это не то же, что и буквы. В разных словах одним и тем же буквам могут соответствовать разные фонемы. Но, распознав все фонемы, уже можно легко собрать из них слово.

Дальнейшая работа с распознанным текстом

Итак, благодаря нейросети мы смогли преобразовать запись голоса в осмысленный текст. Но ведь голосовой помощник на этом не останавливается. Он как-то понимает этот текст и осмысленно на него отвечает. Как это делается? Во-первых, текст токенизируется. Из него выделяются отдельные токены — смысловые единицы. Токенами могут быть слова, их сочетания и целые фразы — это зависит от модели нейросети и ее целей. В голосовых помощниках это обычно слова и пунктуационные знаки. Дальше токены текста проходят через эмбеддинг — каждому токену сопоставляется некий смысловой вектор в N-мерном пространстве. Например, один из простейших методов эмбеддинга предполагает использование двумерного массива:

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Так, после эмбеддинга токен «Корова» получит вектор [-,100,0,10,100]. Теперь, приняв набор токенов «Луг, Молоко», нейросеть предположит, что речь идет о корове.

Eще, сравнивая токен «Корова» с другими токенами своего словаря, нейросеть заметит сходство вектора только с одним вариантом — соответствующим токену «Птица». Мы понимаем, что это произошло потому, что птица — тоже животное, и она тоже может обитать на лугу. В данной простейшей модели нейросеть не знает таких терминов, как «животное» и «обитать». Но это не мешает прийти ей к тому же выводу, что и человек.

Очевидно, что эффективность нейросети очень сильно зависит от размеров словаря и от правильности заполнения соответствующей матрицы. Это делается с помощью методов машинного обучения на больших массивах реальных данных. Нейросеть просматривает различные тексты и заполняет словарь на основе встречающихся слов. Например, несколько раз встретив в одном предложении слова «Корова» и «Луг», она увеличит число, стоящее на пересечении соответствующих столбцов и строк.

Теперь, когда каждому слову сопоставлен какой-то смысл, нейросеть может определить, что хотел от нее пользователь. Для этого запрос пропускается через семантический теггер, который определяет семантическую функцию каждого токена. Например, при запросе «Кто на лугу?» нейросеть по токенам «Кто» и «?» поймет, что ей задали вопрос. А «луг» она определит как основную информацию запроса и, сопоставив вектор соответствующего токена с остальными, выдаст ответ: «Корова».

Но чтобы поддерживать разговор, умения отвечать на вопросы мало. Нужно оставаться в контексте беседы, и голосовым помощникам это удается. Для этого используются рекуррентные нейронные сети. Такие сети содержат рекуррентные слои, кроме обычных выходов имеющие дополнительный выход для следующего просчета.

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Вывод

Голосовые помощники могут вести с нами полноценный разговор и выглядеть при этом вполне разумными собеседниками. Но это иллюзия. Нейросети способны выдавать грамотные, разумные и взвешенные ответы, совершенно не понимая сути вопроса. Весь секрет — в современных технологиях и в обширной базе знаний в виде книг и изображений, хранящихся в сети Интернет.

Обучение нейросети требует немалых вычислительных ресурсов, а под словари и базы данных нужны целые массивы накопителей. Поэтому большинство голосовых помощников «живет» на серверах в дата-центрах. Общение же с пользователями происходит через Интернет. Именно поэтому полный функционал умных колонок доступен только при их подключении к Интернету.

Показать полностью 8
Технологии IT Компьютерное железо Компьютер Инженер Искусственный интеллект Голосовой помощник Голосовое управление Звук Распознавание голоса Тестирование Программа Длиннопост
0
3
Tekhnonacional
Tekhnonacional
1 месяц назад

Токен ЭП для ФНС: в чём разница между флешкой и токеном и как не ошибиться при выборе⁠⁠

Если вы впервые сталкиваетесь с оформлением электронной подписи, особенно для работы с налоговой, госзакупками или электронной отчётностью, легко запутаться в терминах: что такое токен, зачем он нужен, можно ли обойтись обычной флешкой, и почему в некоторых случаях обязательно использовать токен ЭП в ФНС ?

Токен ЭП для ФНС: в чём разница между флешкой и токеном и как не ошибиться при выборе Информационная безопасность, IT, Российское производство, Программа, Электронная подпись, Криптография, Токены, ФНС

Флешка и токен: в чём разница

На первый взгляд флешка и токен выглядят одинаково: компактные USB-устройства, которые можно вставить в компьютер. Но их функциональность принципиально различается.

Флешка — это обычный накопитель, на который можно записывать любые файлы: документы, фотографии, музыку. Она не защищена от копирования или взлома.

Токен — это защищённое устройство, разработанное специально для хранения ключей электронной подписи (ЭП). Каждый токен имеет встроенную защиту, ограниченный доступ и сертифицированные параметры хранения. По факту, токен и флешка похожи только внешне. Однако, сбить с толку может то, что ЭП все-таки можно записать на обычную флешку. Этот вариант мы крайне не рекомендуем и вот почему.

Можно ли записать ЭП на обычную флешку? В некоторых случаях — да. Но если вы оформляете ЭП для ФНС, то использование обычной флешки не допускается. Налоговая инспекция требует строгого соответствия требованиям безопасности.

Токен ЭП для ФНС можно записать только на токен, сертифицированный ФСТЭК или ФСБ. Это обязательное условие, прописанное в регламенте работы удостоверяющих центров.

Что такое токен ЭП для ФНС

Токен ЭП для ФНС — это специальный USB-носитель, сертифицированный госорганами, предназначенный для записи и безопасного хранения ключа квалифицированной электронной подписи, используемой в работе с Федеральной налоговой службой. Эти устройства поддерживают шифрование, защиту от копирования, автоматическую блокировку и соответствуют всем требованиям безопасности для государственных платформ.

Можно ли использовать токен для других целей — например, хранить документы или музыку?

Обычный токен для ЭП не позволяет записывать на себя другие файлы. Исключение — модели вроде «Рутокен ЭЦП-Флеш», в которых есть два отделения: одно для ЭП, другое для пользовательских данных. Однако даже в этом случае мы не рекомендуем использовать токен как обычную флешку: это снижает его надёжность и может привести к конфликтам при работе с сертификатами.

Как выбрать токен ЭП для ФНС

При оформлении электронной подписи обязательно уточняйте в удостоверяющем центре, на какой именно токен будет записана подпись. Если подпись предназначена для подачи отчётности в ФНС, участия в торгах или юридически значимого документооборота, токен должен быть: официально сертифицирован; поддерживаться программным обеспечением (например, КриптоПро, ViPNet и др.); быть новым или полностью очищенным — повторное использование токена с другим сертификатом может вызвать ошибки.

Почему токен — безопаснее

Оформляя электронную подпись, особенно для взаимодействия с налоговой службой, выбирайте именно токен ЭП для ФНС — это не просто рекомендация, а требование по безопасности. Флешка в этом случае не подойдёт: только сертифицированные токены обеспечат корректную работу подписи, защиту данных и отсутствие проблем при подаче документов в электронном виде.Ранее мы публиковали отдельные большие статьи о безопасности токенов тут и тут .

Можно подробнее ознакомиться с аргументацией, почему для ЭП необходим правлиьный защищенный носитель.

Показать полностью
Информационная безопасность IT Российское производство Программа Электронная подпись Криптография Токены ФНС
2
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии