Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
Это захватывающая 2D рогалик, аркадный шутер и динамичная игра. Исследуйте уникальные уровни, уничтожайте врагов, собирайте монеты и прокачивайте своего персонажа.

Подземелье дизлайков

Экшены, Аркады, Шутер

Играть

Топ прошлой недели

  • AlexKud AlexKud 38 постов
  • SergeyKorsun SergeyKorsun 12 постов
  • SupportHuaport SupportHuaport 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Nvidia + Электроника

С этим тегом используют

Видеокарта Компьютер Компьютерное железо Игровой ПК AMD Nvidia RTX AliExpress Гаджеты Товары Китайские товары Техника Вертикальное видео Самоделки Все
294 поста сначала свежее
Nodewind
Nodewind
10 дней назад
Ларец гика
Серия Гаджеты с AliExpress

Игровые ноутбуки Lenovo рухнули в цене на AliExpress. Нашли 2 самых выгодных варианта⁠⁠

Игровые ноутбуки Lenovo рухнули в цене на AliExpress. Нашли 2 самых выгодных варианта Lenovo, Ноутбук, Гаджеты, AliExpress, Nvidia, Amd ryzen, Электроника, Длиннопост

Прямо сейчас на AliExpress проходит Фестиваль брендов, и среди прочего в этой акции участвуют ноутбуки Lenovo. Наиболее ощутимо сбросили в цене игровые модели, оснащенные мощной дискретной графикой. Если вы планировали обзавестись брендовым лэптопом, который будет тянуть все AAA-тайтлы в ближайшие годы, то стоит присмотреться к этим моделям:

1. Lenovo Legion R9000P

Игровые ноутбуки Lenovo рухнули в цене на AliExpress. Нашли 2 самых выгодных варианта Lenovo, Ноутбук, Гаджеты, AliExpress, Nvidia, Amd ryzen, Электроника, Длиннопост

Это свежая модель 2025 года, а потому она оснащена наиболее актуальной видеокартой Nvidia GeForce RTX 5060. Сердцем системы служит флагманский 16-ядерный 32-поточный процессор AMD Ryzen 9 8945HX, который работает в связке с 32 ГБ ОЗУ DDR5.

1/2

В отличие от многих бюджетных китайских брендов, в Lenovo не стали экономить на системе охлаждения. В результате Ryzen 9 здесь практически не ограничен в энергопотреблении — TDP может достигать 120 Вт, что сравнимо с десктопными решениями.

1/2

Обладателей R9000P порадует дисплей — 16-дюймовая IPS-матрица с яркостью 500 нит при разрешении 2.5K обновляет картинку с частотой 240 Гц. Это позволяет очень уверенно чувствовать себя в любых соревновательных онлайн-играх. Поддержка Wi-Fi 7 обеспечивает максимально скоростное подключение к сети и минимизирует задержки. R9000P может оснащаться SSD на 1 либо 2 ТБ, где "из коробки" установлена Windows 11.

⤴️ Узнать актуальную цену на AliExpress

2. Lenovo Legion R7000P (2024)

Игровые ноутбуки Lenovo рухнули в цене на AliExpress. Нашли 2 самых выгодных варианта Lenovo, Ноутбук, Гаджеты, AliExpress, Nvidia, Amd ryzen, Электроника, Длиннопост

В качестве более бюджетной альтернативы можно рассмотреть прошлогоднюю модель R7000P, которая в зависимости от комплектации подешевела (с учетом действующих сейчас купонов) примерно вдвое. Это тоже 16-дюймовая модель, но с чуть менее быстрым 2.5K-дисплеем (на 165 Гц).

Так как R7000P вышел в 2024 году, то внутри него находится дискретная графика RTX 4060. Среди ноутбучных игровых решений поколения RTX 4000 именно эту видеокарту принято считать оптимальной с точки зрения соотношения цены, производительности и уровня энергопотребления (а значит, и шума). В отличие от RTX 4070 и более "старших" моделей, мобильная RTX 4060 совсем немного уступает своему десктопному собрату.

1/2

R7000P оснащается ЦП Ryzen 7 8845HS на 8 ядер / 16 потоков. Объем ОЗУ и ПЗУ в зависимости от выбранного уровня оснащения может составлять от 16 ГБ / 1 ТБ до внушительных 64 ГБ / 2 ТБ. В целом эта модель благодаря адекватным компромиссам предлагает отличный баланс характеристик и стоимости. А так как R7000P 2024 теперь уже покидает рынок, то сейчас на распродаже цена на нее минимальна.

⤴️ Узнать актуальную цену на AliExpress

Помимо игровых ноутбуков, на распродаже действуют скидки и на ультрабуки от Lenovo (включая популярные ThinkBook), их все можно найти на соответствующей страничке акции Lenovo.

Распродажа заканчивается 26.06.25 в 09:59 по МСК, так что рекомендуем поторопиться 😎


Реклама:
ООО "АЛИБАБА.КОМ (РУ)" ИНН: 7703380158

Показать полностью 8
[моё] Lenovo Ноутбук Гаджеты AliExpress Nvidia Amd ryzen Электроника Длиннопост
42
BrawlSup
BrawlSup
26 дней назад
Видеохостинг на Пикабу

СБОРКА ПК ЗА 150К - МОЩНЫЙ ИГРОВОЙ КОМПЬЮТЕР НА RTX 5070 (2025) С ВЫСОКИМ FPS В ИГРАХ⁠⁠

[моё] YouTube Электроника Новинки Со звуком Обзор Сборка компьютера Компьютерное железо Игровой ПК Сборка Материнская плата Видеокарта AMD Amd ryzen Nvidia Nvidia RTX Rtx 5070 Видео
1
11
TechSavvyZone
TechSavvyZone
1 месяц назад

Технологии: "NVIDIA" доминант на рынке GPU для AI⁠⁠

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Компания NVIDIA является крупнейшим в мире производителем графических процессоров. Ее разработки на первом месте не только в игровых видеокартах, но и в решениях для различных вычислений. В том числе — в задачах искусственного интеллекта. В чем преимущества чипов NVIDIA, и почему конкурентам сложно их догнать в этом направлении?

Зарождение вычислений на ГП

GPU, или «графический процессор». Впервые это название было использовано в 1999 году для чипа видеокарты GeForce 256, в состав которого вошел блок аппаратной трансформации и освещения. В играх он выполнял эти нехитрые расчеты, освобождая от них центральный процессор ПК.

Но это было только начало. В 2001 году в графических процессорах появились куда более сложные компоненты — шейдерные блоки. Вначале степень их программируемости была ограниченной. Но уже через пару поколений видеокарт шейдеры получили поддержку графических вычислений с плавающей запятой (Floating Point, FP), а их количество в чипах кратно возросло.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

В линейке GeForce 6000 родом из 2004 года вертексные шейдеры впервые научились выполнять вычисления формата FP32

Уже тогда некоторые исследователи стали проводить собственные испытания в попытках ускорить математические вычисления с помощью ГП. Этот процесс был сложным, так как для расчетов приходилось переформулировать задачи в вызовы графических API DirectX или OpenGL. Для доступности подобных вычислений в сторонних программах был необходим собственный API, который невозможно было создать без поддержки производителей видеокарт.

В 2006 году на конференции SIGGRAPH, посвященной компьютерной графике, компания ATI представила «Close to Metal». Это был первый API для выполнения неграфических вычислений на видеокартах ATI, который вскоре был переименован в ATI Stream.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

В это время в недрах NVIDIA была почти готова новая графическая архитектура Tesla, которая изначально проектировалась с учетом возможности неграфических расчетов. После выпуска первых игровых видеокарт на ее основе, в феврале 2007 года компания представила свой собственный API для вычислений — CUDA. А три месяца спустя были выпущены первые продукты NVIDIA, предназначенных специально для вычислений: Tesla С870, D870 и S870. Этот момент можно считать началом главы массово доступных вычислений на графических процессорах.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Становление CUDA

Темп вычислений на графических чипах NVIDIA и ATI уже в 2007 году в несколько раз превышал значения, которые могли обеспечить центральные процессоры того времени. Топ NVIDIA обеспечивал 384 Гфлопс, а флагман ATI — 475 Гфлопс. По сравнению с 48 Гфлопс, которыми мог оперировать старший ЦП линейки Intel Core 2 Quad, разница была практически на порядок.

Однако все упиралось в возможность многопоточной обработки. NVIDIA G80 обладал 128 шейдерными процессорами, а конкурирующий ATI R600 — целыми 320. Распределить нагрузку между таким количеством вычислительных единиц в то время, когда даже четыре ядра процессора еще не везде использовались, было задачей не из простых. Но главный вектор продвижения все же нашелся — им стали научные проекты. Основная масса расчетов для них масштабируется практически линейно, поэтому именно они извлекали больше всего пользы из CUDA и Stream.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Через некоторое время неграфические вычисления нашли применение и в домашних ПК. С их помощью мощности видеокарт стали использоваться в различных программах для конвертации и кодирования видео. А в августе 2008 года NVIDIA решила использовать CUDA для просчетов PhysX — движка физического поведения объектов в играх.

В 2009 году свет увидел DirectX 11, в состав которого был включен API для неграфических вычислений DirectCompute. Практически одновременно с ним появляется и другой похожий, но открытый API — Open CL. Именно в его пользу делает выбор AMD, потихоньку забросив развитие Stream. А вот NVIDIA хоть и реализовывает поддержку новых API, но при этом не отказывается от своей CUDA. И, как покажет практика, совсем не зря.

Глубокое обучение

После появления универсальных шейдерных процессоров их количество в чипах росло по экспоненте. Благодаря этому топовый чип GF100, появившийся через три года после G80, работал с вычислениями вчетверо быстрее своего «предка». Ускорение, которые давали вычисления на ГП по сравнению с ЦП, становилось все больше, а сами вычисления распространялись все шире.

В 2012 году c помощью API CUDA группа энтузиастов в университете Торонто решает создать одну из первых сверточных нейросетей для распознавания изображений. Для этого они используют более миллиона изображений и три терафлопса вычислительной мощности, которые обеспечили две видеокарты GTX 580 на базе ГП GF110. Проект получает название AlexNet. Он был представлен на конкурсе ImageNet Large Scale Visual Recognition Challenge, получив первое место за распознавание c минимальным количеством ошибок.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Архитектура AlexNet оказала существенное влияние на многие последующие проекты в области глубокого обучения с помощью графических процессоров. И, как следствие, в разы увеличила интерес к самим ГП в роли вычислительных чипов для подобных расчетов.

До 2017 года NVIDIA продолжала наращивать «чистую» мощь своих графических процессоров. Если в 2007 году топовый G80 мог обеспечить 384 Гфлопс при расчетах, то в 2017 году чип GP102 достигал в них уже 12 Тфлопс. Но компания продолжала искать пути по более существенному наращиванию производительности, так как задачи для ГП со временем становились все сложнее и сложнее.

Конец 2017 года можно считать переломным моментом для нейросетевой отрасли. Тогда NVIDIA представила первый графический процессор с тензорными ядрами — GV100 на архитектуре Volta. В то время, как шейдерные процессоры могли работать с вычислениями полной точности (FP32), тензоры поддерживали только половинную (FP16), но с гораздо большим темпом. Вдобавок к этому появилась возможность использовать целочисленные вычисления (INT32) на шейдерах одновременно с плавающими. Для эффективного задействования всех вычислительных элементов вместе с чипом и видеокартами на его основе NVIDIA представила API CUDA версии 7.0.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Эксперимент был успешным: производительность в задачах глубокого обучения возросла кратно, ведь высокая точность им была не нужна. Чипы AMD, до этого хоть как-то конкурирующие за счет вычислительной мощности шейдеров, остались далеко позади. А NVIDIA занялась разработкой следующей графической архитектуры — Turing. Теперь каждое поколение компания совершенствовала тензорные ядра. Помимо рабочих нагрузок, они пригодились и в играх для технологии повышения производительности DLSS. В 2022 году NVIDIA представила графическую архитектуру Ada Lovelace. Ее тензорные ядра поддерживают вычисления в менее точном формате FP8, но в двойном темпе по сравнению с FP16. Таким образом, даже без учета роста количества тензоров, пиковую производительность обучения удалось удвоить. В следующей архитектуре Blackwell появилась поддержка вычислений FP4, которая в очередной раз удваивает пиковую производительность тензоров.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Сила ГП NVIDIA не только в «железе», но и в программной поддержке. С выходом каждой графической архитектуры компания обновляет API CUDA и предоставляет разработчикам подробные инструкции по работе с ним. Благодаря этому производители ПО своевременно учатся использовать особенности новых чипов, что позволяет «выжимать» из них в реальных задачах практически всю возможную производительность.

NVIDIA и ее конкуренты на рынке нейросетей

На сегодняшний день ГП NVIDIA — самые востребованные чипы для обучения и работы различных нейросетей. Высокая вычислительная мощность и постоянно развивающаяся программная платформа CUDA, совместимая со многими популярными фреймворками вроде TensorFlow и PyTorch, делают их лучшим выбором для вычислений глубокого обучения. И лидер этого рынка в лице Open AI, и недавно «выстрелившая» DeepSeek обучали свои модели именно на чипах от NVIDIA.

Для вычислительных центров компания выпускает отдельную линейку карт GPU Accelerator (бывшая Tesla). Многие из них основаны на тех же графических процессорах, что и игровые видеокарты. Но для наиболее производительных решений NVIDIA в последнее время разрабатывает отдельные чипы, совершенствуя их чуть раньше более доступных решений.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Тем не менее, все основные элементы графической архитектуры даже в таких «больших» чипах схожи с теми, что используются в игровых видеокартах GeForce. Поэтому их тоже можно использовать для несложных задач глубокого обучения, если хватает видеопамяти. В этом кроется огромный плюс: единая графическая архитектура и поддержка CUDA для игровых, профессиональных и вычислительных решений делает ГП NVIDIA доступными как для крупных фирм, так и для небольших стартапов.

В этом плане NVIDIA поступает умно: даже с одной игровой картой вместе с CUDA и ее развитыми инструментами разработчик может получить желаемый результат — пусть и заметно медленнее, чем с вычислительным сервером. При этом он привязывается к API, и при переходе на более производительные решения вновь будет использовать ГП NVIDIA.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Но лавры CUDA не дают покоя многим другим компаниям, в частности — Intel. В ответ она разработала открытый стандарт oneAPI, который призван унифицировать вычисления на различных чипах: центральных и графических процессорах, программируемых матрицах и специализированных ускорителях. В 2024 году Intel вместе с Google, Qualcomm, Samsung, ARM, Fujitsu, Imagination и VMware создали консорциум Unified Acceleration Foundation. Его целью будет дальнейшее развитие инициатив oneAPI.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Изменит ли как-то это баланс оборудования на рынке нейросетей — вопрос будущего, причем не самого ближнего. Сегодня реальный конкурент у NVIDIA на этом направлении все также один: это компания AMD с картами Instinct. С 2020 года «красные» разделили свою графическую архитектуру на две параллельно развивающиеся ветви. RDNA предназначена для игровых и профессиональных видеокарт, а CDNA — для центров обработки данных. Современные чипы AMD используют программный стек ROCm, и могут ускорять вычисления невысокой точности с помощью матричных блоков. Но до возможностей API CUDA и производительности тензорных ядер NVIDIA им все еще далеко.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Возможно, в скором времени определенную конкуренцию NVIDIA смогут предложить и чипы от Huawei. Компания разрабатывает собственные ИИ-ускорители, и последнее решение в лице Ascend 910C выглядит довольно неплохо. Однако стоит учитывать, что Huawei ограничена санкциями и не имеет доступа к самым современным техпроцессам. Поэтому, скорее всего, ускорители компании останутся эксклюзивным решением для китайского рынка, а будущие поколения из-за ограничений техпроцесса не получат существенного роста производительности на чип.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

А пока лидерство NVIDIA в этой сфере не подлежит сомнению. Благодаря буму нейросетей ее доходы от вычислительных решений впервые превысили аналогичные от игровых видеокарт уже в 2023 году. 2024 год оказался для компании еще более успешным: на оборудовании для вычислений она заработала вчетверо больше, чем на игровом рынке. посмотрим что ей принесет год грядущий. Важно то, что NVIDIA не забывает вкладывать часть полученной прибыли в новые разработки. Каждый год компания представляет их на конференции GPU Technology Conference (GTC), основной темой которой в последнее время является искусственный интеллект. В этом году GTC прошел с 17 по 21 марта. NVIDIA раскрыла подробности о будущих графических архитектурах Blackwell Ultra и Rubin, а также презентовала новый вычислительный чип B300.

К сведению:

В 2006 году на конференции SIGGRAPH, посвященной компьютерной графике, компания ATI представила «Close to Metal»

Самое интересное, что первоначально ATI удалось реализовать вычисления не на универсальных шейдерах, а на пиксельных. Для этого в чипе R580, который стал основой для первой вычислительной карты, они уместили аж 48 (!) пиксельных шейдеров с продвинутым управляющим блоком. 

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Для сравнения: у старшего R520 из того же поколения, который был выпущен на 3 месяца раньше, было всего 16 пиксельных шейдеров, а у G70/G71 от главного конкурента - 24.

Показать полностью 13
Инженер Компьютерное железо IT Компьютер Технологии Искусственный интеллект Программа Nvidia Чип Электроника Длиннопост Видеокарта
3
96
TechSavvyZone
TechSavvyZone
1 месяц назад

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят?⁠⁠

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Выпуск серии видеокарт RTX20 в свое время стал важнейшим событием в сфере компьютерных технологий. Десктопные видеокарты впервые получили отдельные тензорные ядра. Что это такое? Как работают эти ядра и для чего используются?

CUDA и тензорные ядра

Работа с графикой — специфическая задача для компьютерного «железа». Здесь требуется выполнять довольно однообразные команды с большим объемом данных. Архитектура CPU для этого подходит плохо. Из-за ограниченного числа ядер и АЛУ (арифметико-логических устройств) процессоры не могут быстро делать объемные операции по сложению и умножению.

Был необходим максимальный параллелизм — одновременная обработка данных. Одним из решений стали CUDA-ядра — технология, созданная Nvidia больше десяти лет назад. Эти ядра создали специально для параллельной работы. На чипе помещались сотни и тысячи CUDA-ядер, а их число стало одним из критериев оценки производительности видеокарты.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

CUDA-ядра имеют высокоскоростной доступ к видеопамяти, так что обработка выполняется с минимальными задержками. Это важнейший показатель для быстрого вывода подготовленных кадров на монитор.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Однако обработка больших объемов данных нужна не только при выводе графики. Она требуется для научных вычислений, моделирования физических процессов и машинного обучения. Во всех этих задачах одна из главных операций — перемножение матриц.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Задача непростая. Скажем, для решения вышеописанного примера нужны целых 64 умножения и 48 сложений. Не говоря о том, что промежуточные результаты нужно еще где-то хранить. Для операций чтения и записи нужны дополнительные регистры и достаточно скоростная кэш-память.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Может ли с этой задачей справиться CPU? Вообще-то, да. Специально для таких вычислений в процессорах начали появляться инструкции MMX, SSE и (самые совершенные) AVX. Однако видеокарты с их многочисленными CUDA-ядрами — более предпочтительный вариант. Они могут распараллелить большую часть простых операций сложения и умножения. Но даже для них задача просчета матриц оставалась трудоемкой. Решением стали тензорные ядра.

Одно такое ядро способно перемножить две матрицы за один такт. В то время как CUDA-ядрам требуется несколько тактов.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Первое тензорное ядро представляло собой микроблок, выполнявший суммирование-произведение матриц 4x4. Могли использоваться значения FP16 (числа с плавающей запятой размером 16 бит) или умножение FP16 с добавлением FP32.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Размерность рабочих матриц невелика. Ядра при обработке реальных наборов данных обрабатывают небольшие блоки более крупных матриц, в итоге формируя окончательный ответ.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Решение оказалось крайне эффективным. Специалисты из Anandtech провели замеры производительности топовых решений от Nvidia — без тензорных ядер и с ними.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

В операциях перемножения матриц (GEMM) прирост производительности с использованием тензорных ядер колоссальный.

Применение тензорных ядер

Научные вычисления

Тензорная математика активно используется в физике и инженерии для решения всех видов сложных вычислений. Например, в механике жидкостей, электромагнетизме, астрофизике, медицине и климатологии. В суперкомпьютерах для этих задач обычно используют крупные кластеры с тысячами высокопроизводительных процессоров уровня Xeon Platinum или AMD Epyc. Однако видеоускорители стали неотъемлемой частью практически любого суперкомпьютера. Подавляющее число машин из рейтинга Top500 работают на базе решений от Nvidia.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Машинное обучение

Задача глубокого обучения в самом простом смысле — это работа с математическими выражениями. Простейший вариант — нейронная сеть, состоящая из одного слоя с двумя нейронами и линейными функциями активации. Представлена она вот таким умножением вектора на матрицу:

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Задача обучения сводится к поиску наилучших коэффициентов W. То есть предполагаются матричные операции.

На практике нейросети чаще всего многослойные, и математические выражения получаются куда сложнее. Однако принципиально используются все те же действия — умножение и сложение матриц. Тензорные ядра как раз ориентированы на эти действия.

Самый яркий пример — суперкомпьютер, созданный Microsoft совместно c OpenAI. В нем использовали 10 тысяч графических процессоров Nvidia V100. Именно этот компьютер применили для обучения ChatGPT-3. Продукты Nvidia можно найти в Microsoft Azure, Oracle Cloud и Google Cloud.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Илон Маск для своего ИИ Grok также задействует продукцию Nvidia. Изначально это был кластер на 20 тысяч графических процессоров H100. Недавно для обучения версии GROK 3 миллиардер запустил суперкомпьютер с сотней тысяч NVIDIA H100! Теперь вы можете понять, почему NVIDIA стала самой дорогой компанией и продолжает наращивать прибыль.

Инференс нейросети

Инференс — это запуск уже обученной модели, «скармливание» данных и получение результата. Процесс менее требователен к вычислительной мощности. Но здесь все так же используются матричные операции. Сюда входит распознавание текста (например, в голосовых помощниках), поиск объектов на изображении (распознавание лиц, номерных знаков), шумоподавление и не только.

Тензорные ядра и здесь предлагают высокую производительность. Они позволяют запускать «легкие» нейросети прямо на домашних видеокартах средневысокого ценового сегмента. Например, запустить Chat with RTX — тут достаточно RTX 30 или 40 серии с минимум 8 ГБ видеопамяти. Stable Diffusion также можно запустить локально на видеокартах. Однако производительность каждой модели зависит еще и от ПО. Оно не всегда в полной мере задействует те же тензорные или CUDA-ядра.

DLSS (Deep Learning Super Sampling)

Один из самых доступных вариантов инференса нейросетей — технология DLSS. Специально обученная на игре нейросеть запускается на тензорных ядрах видеокарты, повышая разрешение картинки в реальном времени. Игрок, в свою очередь, получает более высокий FPS. DLSS 3 работает только на видеокартах серии RTX40.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Где имеются тензорные ядра

Nvidia

Поскольку это авторская разработка «зеленых», то именно «тензорные ядра» можно найти лишь в продукции этой компании.

Впервые появились в Nvidia TITAN V в 2017 году — карта имела 640 ядер. После этого ядра стали неотъемлемой частью профессиональных ускорителей

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

С каждой новой архитектурой появлялось усовершенствованное поколение тензорных ядер. Так что сравнивать их число в рамках разных поколений некорректно. Есть и различия в поддерживаемых форматах данных. Первые ядра могли складывать матрицы с данными только FP16, а современные имеют поддержку куда больших форматов.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

В десктопных и мобильных видеокартах технология стала доступна с приходом серии RTX20.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Именно благодаря тензорным ядрам пользовательские карты RTX можно использовать для работы с нейросетями. А также получить апскейл с использованием ИИ. Альтернативные технологии вроде XeSS и FSR базово специальных ядер не требуют.

AMD

Компания «красных» на рынок ИИ вышла относительно недавно. Аналогом тензорных ядер у них является Matrix Core Technologies, которая появилась в архитектуре CDNA 3.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Ядра Matrix Core Technologies пока встречаются только в AMD Instinct MI300A (912 штук) и MI300X (1216 штук). Новые ИИ-ускорители планируют поставить в немецкие суперкомпьютеры Hunter и Herder — в 2025 и 2027 годах соответственно. Сейчас же у немцев работают суперкомпьютеры Hawk и JUWELS на базе Nvidia A100.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Intel

У «синих» используются ядра XMX (Xe Matrix Extensions), созданные специально для матричных вычислений. На них аппаратно работает и фирменный апскейлер Intel XeSS. Встретить ядра XMX можно в линейке видеокарт ARC.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Ядра XMX используются и в Intel Xᵉ HPC 2, установленных в Data Center GPU Max. Графика Xe2-LPG будет встроена в процессоры Lunar Lake. Там также будут использоваться XMX-ядра для задач, связанных с работой ИИ.

Google

В компании не стали изобретать отдельные ядра, а нацелились сразу же на разработку полноценных плат. Они получили название TPU — Tensor Processing Unit. Эти платы специализируются на обработке матриц. Они подходят как для тренировки, так и выполнения нейросетей.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Показать полностью 23
Технологии IT Компьютерное железо Компьютер Инженер Nvidia Видеокарта Производство Электроника Чип Компьютерная графика Ядро Длиннопост
6
2
ARCHiGAME
ARCHiGAME
1 месяц назад

NVIDIA объявляет о переносе технологии TensorRT на платформу RTX⁠⁠

🔊 В рамках выставки Computex 2025 NVIDIA заявила о предоставлении технологии TensorRT пользователям видеокарт RTX. Она должна существенно увеличить производительность пользовательских решений в работе с ИИ. Компании наглядно продемонстрировала возможности TensorRT в сравнении с DirectML.

💥 ComfyUI демонстрирует двукратное увеличение производительности. В тесте ON1 прирост оказался на уровне 70 %, тогда как в DaVinci Resolve и Vegas Pro отмечается 60-процентное улучшение. Наименьший прогресс наблюдается в Topaz AI — 50 %. Такое ускорение значительно сокращает время выполнения ИИ-задач.

⚔️ Новый бэкенд обеспечивает восьмикратное сокращение объема файлов библиотеки и включает оптимизацию Just-in-Time для каждой модели. TensorRT для RTX станет доступен в июне для всего ассортимента видеокарт NVIDIA RTX.

#Nvidia #TensorRT #RTX

🎙 Подписывайтесь на ARCHiTECH

NVIDIA объявляет о переносе технологии TensorRT на платформу RTX Компьютерное железо, Игровой ПК, Компьютер, Электроника, Искусственный интеллект, Nvidia, Монтаж, Новинки, Инновации
NVIDIA объявляет о переносе технологии TensorRT на платформу RTX Компьютерное железо, Игровой ПК, Компьютер, Электроника, Искусственный интеллект, Nvidia, Монтаж, Новинки, Инновации
Показать полностью 2
Компьютерное железо Игровой ПК Компьютер Электроника Искусственный интеллект Nvidia Монтаж Новинки Инновации
3
4
ARCHiGAME
ARCHiGAME
1 месяц назад

NVIDIA повысила цены почти на все чипы из-за пошлин и роста затрат⁠⁠

📈 NVIDIA увеличила цены почти на всю свою продукцию, включая игровые карточки и ИИ чипы.

💵 Причиной стал рост производственных затрат, повышение цен со стороны TSMC и ужесточение торговых условий между США и Китаем. Об этом сообщили источники тайваньского издания DigiTimes.

💰 Рост стоимости игровых видеокарт серии RTX 5000 составил 5-10%, а ИИ-чипов — до 15%

#ИИ #Куртка #Nvidia

🎙 Подписывайтесь на ARCHiTECH

NVIDIA повысила цены почти на все чипы из-за пошлин и роста затрат Компьютерное железо, Игровой ПК, Компьютер, Новинки, Санкции, Китай, Цены, Сборка компьютера, Электроника, Видеокарта, Nvidia, Инновации, Искусственный интеллект, Нейронные сети
Компьютерное железо Игровой ПК Компьютер Новинки Санкции Китай Цены Сборка компьютера Электроника Видеокарта Nvidia Инновации Искусственный интеллект Нейронные сети
1
BrawlSup
BrawlSup
2 месяца назад
Видеохостинг на Пикабу

ОПТИМАЛЬНАЯ СБОРКА ПК ЗА 50К - СОБРАЛ МОЩНЫЙ ИГРОВОЙ КОМП ЗА 50000 РУБЛЕЙ С ВЫСОКИМ FPS В ИГРАХ⁠⁠

[моё] YouTube Электроника Обзор Новинки Со звуком Сборка компьютера Компьютерное железо Игровой ПК Сборка Материнская плата Видеокарта Nvidia Nvidia RTX Intel SSD Windows Видео
10
9
Trup.fsmoke
Trup.fsmoke
2 месяца назад

Ответ Iluysha в «Ответ 35sm в "DDR память - сделано у нас"»⁠⁠

Ссылка слетела Ответ на пост «Ответ 35sm в "DDR память - сделано у нас"»

Да нахуй надо ...8к за жалкие 256гб

Ответ Iluysha в «Ответ 35sm в "DDR память - сделано у нас"» Производство, Промышленность, Российское производство, Импортозамещение, Электроника, DDR, Nvidia, AMD, Intel, Apple, Мат, Длиннопост, Ответ на пост

Если мне надо 250гб я лучше mx500 возьму

Ответ Iluysha в «Ответ 35sm в "DDR память - сделано у нас"» Производство, Промышленность, Российское производство, Импортозамещение, Электроника, DDR, Nvidia, AMD, Intel, Apple, Мат, Длиннопост, Ответ на пост

А за 8.5 косых уже можно на тер брать!!

Ответ Iluysha в «Ответ 35sm в "DDR память - сделано у нас"» Производство, Промышленность, Российское производство, Импортозамещение, Электроника, DDR, Nvidia, AMD, Intel, Apple, Мат, Длиннопост, Ответ на пост

Но для попила гос бабла наверно годная тема

Показать полностью 3
Производство Промышленность Российское производство Импортозамещение Электроника DDR Nvidia AMD Intel Apple Мат Длиннопост Ответ на пост
28
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии