Продолжение материала, рассказывающего о долгой дороге графики Intel — от медленных встроенных решений до современных высокопроизводительных дискретных карт семейства Intel Arc.
7 поколение — серия HD4000/Iris 5200
В представленных в 2012 году процессорах 3 поколения Core под кодовым названием Ivy Bridge Intel продолжила начатую революцию встроенной графики. Устранили узкое место — низкий филлрейт, добавив растровые и текстурные блоки — теперь их стало 2 и 4 соответственно. Количество шейдерных блоков увеличилось до 128, EU — до 16, был добавлен небольшой собственный кеш для графического процессора. Благодаря этим изменениям HD4000 стала от полутора до двух раз быстрее предшественника. К тому же были внесены изменения в графический конвейер и добавлен блок тесселяции. Теперь встроенная графика полностью поддерживала самые современные API — DirectX 11, OpenGL 4 и шейдеры версии 5.0. Плюс ко всему этому теперь она обзавелась поддержкой декодирования 4K-видео с кодеком AVC.
При этом частота ядра снизилась на пару сотен МГц, а память на новых процессорах ускорилась лишь немного — стала поддерживаться DDR3-1600 с полосой пропускания 25.6 Гб/c. Как и в прошлом поколении, для ряда процессоров была применена упрощенная версия графики — она получила название HD2500. Несмотря на то, что блоков EU в ней было 6, как и в предшественнике, за счет архитектурных изменений она могла быть ощутимо быстрее HD2000, почти наравне с HD3000 — при том, что некоторые новые тайтлы давались новинке даже лучше.
В 2013 году, с выходом процессоров 4 поколения под кодовым названием Haswell, Intel в очередной раз доработала встроенный ГП. Новинка получила 160 шейдерных процессоров, объединенных в 20 EU. Ускоренный в два раза кеш процессоров новой архитектуры позитивно повлиял и на встроенную графику. Все это привело к увеличению производительности примерно в полтора раза. В итоге, HD4600 практически сравнялась с дискретными картами уровня популярной бюджетной GeForce GT630, чего было достаточно для многих игр на низких настройках в HD-разрешении. Несмотря на ощутимое повышение производительности, количество растровых и текстурных модулей осталось неизменным, да и частота ядра тоже осталась прежней. Максимальный объём памяти, доступный для графики, был увеличен до 2048 Мб.
Конвеер в очередной раз был доработан, улучшился блок тесселяции, добавилась поддержка DirectX 11.1, позже — частичная для DirectX 12. Но самое главное то, что устройство графической части отныне проектировалось изначально масштабируемым по 10 EU с 80 шейдерных процессорами. Такой модуль Intel называет Subslice. В более ранних ГП для получения младшего варианта графики отключались блоки. Теперь же можно было изначально формировать на кристалле нужное количество таких «кирпичиков», не тратя транзисторный бюджет на отключенную часть.
В Pentium и Celeron такой блок был один, в основной массе Core i3/i5/i7 — два, а в отдельных мобильных моделях — целых четыре. Последняя версия получила две разновидности: HD5000 и Iris 5100. Обе обладают 320 шейдерными процессорами, 40 EU, 4 ROP и 8 TMU. Начиная с Haswell, Intel больше внимания стала уделять производительности мобильной графики, нежели десктопной. Как следствие, некоторые мобильные модели стали получать производительную встроенную графику, аналогов которой у сокетных десктопных процессоров просто не было.
Для топовых мобильных i7 и распаиваемых на плате десктопных версий i5/i7 рядом с процессором был внедрен дополнительный кристалл высокоскоростной памяти eDRAM объемом 128 Мб, который играл роль кеша 4 уровня. Помимо процессора, этот кеш использовался и встроенной графикой, аналогичной по конфигурации блоков HD5000 и Iris 5100. Она получила название Iris Pro 5200. Благодаря дополнительному быстрому кешу скорость работы по сравнению с HD4600 удвоилась и находилась на уровне дискретной GeForce GT640. К сожалению, в массовых моделях встроенных ГП Intel пользователь не увидит такой производительности еще долго.
8 поколение — серия HD5500/Iris 6200
Следующее поколение процессоров Core под кодовым названием Broadwell — пятое. Оно обрело в очередной раз улучшенную графику. Правда, десктоп в этот раз остался практически в стороне — для ПК была выпущена только пара моделей i5 и i7, а остальной ассортимент достался ноутбукам. Частота поддерживаемой памяти осталась прежней — все та же DDR3-1600.
Топовая графика Iris Pro 6200, которая теперь досталась и редким десктопным моделям, стала эволюционным развитием Iris Pro 5200. Ее базовым «кирпичиком» стал более мелкий модуль Subslice из 8 EU и 64 шейдерных процессоров. Общее количество шейдеров увеличилось незначительно — с 320 до 384, но текстурный и пиксельный филлрейт довольно сильно подросли. Это стало возможным благодаря удвоению растровых и текстурных блоков. В Iris Pro 6200 их стало 8 и 16 соответственно. Никуда не делся и быстрый кеш eDRAM объемом в 128 Мб, повышающий производительность. Такой набор устранил слабые места и позволил новой графике местами довольно близко подойти к уровню дискретной GeForce GTX650.
Однако Iris Pro 6200 постигла та же участь, что и ее предшественника в лице Iris Pro 5200 — малая распространенность. Десктопные процессоры Broadwell были редки и дороги, а в мобильных такая графика устанавливалась разве что в топовые i7. Некоторые ноутбучные модели получили HD6000 и Iris Graphics 6100 с такими же характеристиками, но без eDRAM кеша.
При всех достоинствах графики Iris, основная масса мобильных процессоров пятого поколения ограничилась гораздо более простыми HD Graphics 5300/5500, которые являлись «половинкой» старшей модели. Она включая в себя 192 шейдерных блока, 24 EU, 4 блока растровых операций и 8 текстурных юнитов. Производительность этих моделей недалеко ушла от HD Graphics 4600 — среднее превосходство составляло всего около четверти, а то и меньше.
Графика в немногочисленных бюджетных моделях Pentium и Celeron и такого отрыва от своих предшественников не показывала — несмотря на 96 шейдеров против старых 80, ее частоты снизили на четверть, из-за чего чаще всего наблюдался паритет между старым и новым поколением. При этом даже старшие решения за пределы 1150 МГц по ядру так и не вышли, оказавшись по этому параметру аналогичными двум предшествующим поколениям графики.
9 поколение — серии HD, UHD и Iris 500/600
В конце 2015 года, после прихода 6 поколения процессоров Core под кодовым названием Skylake, Intel на несколько лет практически перестала развивать как процессорную архитектуру, так и графическую. Массовая графика мобильных Broadwel — HD5500 — практически без изменений перекочевала в процессоры Skylake, сменив имя на HD520/530. Те же 192 шейдера, 24 исполнительных блока, 4 ROP и 8 TMU, аналогичные рабочие частоты. Наибольшие отличия лишь в полноценной поддержке DirectX 12, Open GL 4.6 и Vulkan, а также новом декодере для видео формата HEVC.
Благодаря новым драйверам встроенное видео теперь могло использовать до половины системной памяти — правда, реально такая возможность встроенной графике в большинстве случаев была ни к чему. Пропускная способность увеличилась из-за новой памяти DDR4: теперь это значение могло достигать 34.1 Гб/c. При этом сокетные десктопные модели более производительных версий графики не получили, что было шагом назад по сравнению с предшественником Broadwell. Как следствие, несмотря на увеличившееся количество растровых блоков, текстурных юнитов и новую память, производительность массовой графики HD530 все также топталась рядом с позапрошлогодней HD4600.
Младшие Pentium и Celeron ограничились урезанной версией под названием HD 510, которая являлась половинкой старшего брата по всем рабочим блокам. Немногочисленные модели Iris Graphics 540/550, распространявшиеся в некоторых мобильных моделях, являлись копией Iris Pro 6200 с уменьшенным до 64 Мб объемом памяти eDRAM. Обойти они своего прямого предшественника не смогли, но показывали производительность примерно на его уровне.
Особняком стояла новая Iris Pro 580, получившаяся, по сути, полуторакратным масштабированием Iris Pro 6200 — целых 576 шейдерных процессоров в 72 исполнительных блоках, 12 ROP и 24 TMU. Не пожалели для нее и полноценный кеш eDRAM объемом 128 Мб. Все это делало Iris Pro 580 новым рекордсменом производительности среди встроенной графики Intel. Однако в реальных устройствах она встречалась исключительно редко — только в топовых мобильных i7, где в пару процессору обычно ставили дискретную графику, или в некоторых дорогих моноблоках с распаянными процессорами. По производительности такая графика в определенных случаях может дотянуться даже до GeForce GTX750, но из-за нераспространенности в реальных устройствах практического смысла в ней было немного.
Графика, встроенная в массовые процессоры 7 поколения Kaby Lake, изменений не претерпела, лишь сменив название на HD620/630. Благодаря новому контроллеру памяти процессоров увеличилась разве что пиковая пропускная способность — с 34.1 до 38.4 Гб/c. Младшие модели получили переименованную HD510 в виде HD610. Вариации Iris сменили приставку Pro на Plus: 540 модель стала именоваться Iris Plus 640, 550 — Iris Plus 650. Преемника Iris Pro Graphics 580 в этом поколении не последовало — скорее всего потому, что процессоры с такой графикой получались слишком дорогими, и без дискретной графики все равно почти нигде не использовались.
С приходом 8 поколения процессоров Coffee Lake в 2017 году, название HD Graphics было изменено на Ultra HD Graphics — для подчеркивания возможности работы с видео высокого разрешения и соответствующими мониторами. HD630 стала UHD630, HD610 — UHD610. Была расширена работа с видеокодеками, а поддерживаемая скорость памяти в очередной раз повысилась, обеспечив пропускную способность в 42.7 Гб/c. И, в общем-то, все. В таком же виде она перекочевала в массовые процессоры 9 и 10 поколения без каких-либо изменений. Сама Intel относит UHD к поколению 9.5, но нововведений в самом графическом процессоре или поддерживаемых API со времен Skylake так и не было.
11 поколение — серия UHD/Iris Plus
Несмотря на то, что десктопные процессоры 10 поколения производились по старым 14 нм нормам, мобильные модели было решено перевести на более современные 10 нм. Тем более, что ноутбуки нуждались в более быстрой встроенной графике гораздо больше, чем десктопы. Именно поэтому эти процессоры, получившие кодовое имя Ice Lake, стали пробой пера для очередного поколения графики — одиннадцатого. При этом цифру «10» в поколениях графики решено было перепрыгнуть.
В новую линейку встроенных ГП входило три модели: две Iris Plus и одна UHD. Старшая имеет 512 шейдерных процессоров (64 EU), средняя 384 (48 EU), младшая — 256 (32 EU). От кристалла eDRAM, значительно увеличивавшего цену конечных продуктов, решено было полностью отказаться. Была добавлена совместимость с DirectX 12.1 и поддержка затенения с переменной скоростью, проведена оптимизация, увеличена пиковая пропускная способность памяти платформы — при использовании самой быстрой памяти это значение доходит до 59.7 Гб/c. Это позволило увеличить производительность — старшая модель догоняет старые Iris с 48 исполнительными блоками и eDRAM кешем, и в ряде случаев способна приблизиться к дискретной GeForce GT1030.
Претерпели изменения как набор инструкций ГП, так и внутренняя конфигурация блоков: теперь 2 ROP и 4 TMU приходятся не на 96 шейдерных процессоров, а на 128. В итоге, старшая модель обладает все теми же 8 ROP и 16 TMU, что и прошлые модели Iris, за исключением топовой на свое время Iris Pro 580. Но это только начало кардинальных изменений. Все самое интересное ждет графику Intel в следующем, 12 поколении.
12 поколение — серия Xe
На самом деле, работа над 11 поколением графики была лишь подготовкой к чему-то более масштабному. Еще в 2019 году Intel объявила о разработке новой графической архитетуры, которая в будущем станет основой как дискретных, так и встроенных графических решений. Она получила название Intel Xe и должна была включать в себя несколько вариаций для разного оборудования: Xe-LP для встроенной графики, Xe-HP для центров обработки данных, Xe-HPC для ускорителей вычислений, и Xe-HPG для высокопроизводительных дискретных графических процессоров.
Первое поколение Xe-LP дебютировало с выходом 11 поколения процессоров Core под кодовым названием Rocket Lake. Было удвоено количество блоков растровых и текстурных операций — теперь 2 ROP и 4 TMU приходятся на каждый блок Subclice, а не на пару, как ранее. За счет этого филлрейт новой встроенной графики увеличился в два раза.
Для дектопных процессоров представили две разновидности — UHD750 с 256 шейдерными процессорами и 32EU и слегка урезанную UHD730 с 192 шейдерами и 24 EU. Пропускная способность памяти на десктопе ограничилась значением 51.2 Гб/c, а потолок частоты ядра поднялся до 1300 МГц. Из-за небольшого количества шейдеров, производительность старшей модели по сравнению со старой HD530/630 увеличилась не так сильно — чуть более, чем на треть. С младшей моделью разница у предшественника еще меньше.
А вот мобильные версии, как и раньше, получили больше исполнительных блоков. Причем, в этот раз еще более существенно — под разными версиями Iris Xe Graphics в ноутбучных процессорах скрываются две вариации графики, обладающие 640 шейдерами в 80 EU и 768 шейдерами в 96 EU. Соответственно новой иерархии соотношения блоков, старшая версия обладает 24 ROP и 48 TMU, младшая — 20 ROP и 40 TMU, что наконец стало первым существенным скачком аж со времен редкого Iris Pro 580 конца 2015 года. Пиковая пропускная способность памяти на мобильной платформе возросла до 68.2 Гб/c, что тоже положительно повлияло на производительность. Все это позволило графике идти на равных с современными дискретными мобильными видеокартами начального уровня — такими, как GeForce MX350.
Одна из разновидностей Iris Xe устанавливается во все мобильные процессоры этого поколения, за исключением Pentium и Celeron. Последние получили урезанную версию под названием UHD Graphics, которая при этом все равно быстрее десктопной UHD750. Она содержит 384 шейдерных процессора, сгрупированных в 48 EU.
Позже на основе одной из конфигураций блоков встроенной ноутбучной Iris Xe была выпущена первая с 1998 года дискретная карта Intel — Iris Xe DG1. Обладая собственной памятью 4Гб LPDDR4X с пропускной способностью 68.2 Гб/c, карта оказалась немного производительнее GeForce GT1030 — чаще всего на уровне с более быстрой Radeon RX550. Такие же характеристики имеет мобильная разновидность дискретной Iris Xe DG1 в ноутбуках — там она носит имя Iris Xe Max.
В 2022 году в 12 поколении процессоров Alder Lake архитектурно графика не поменялась. Старшая версия стала называться UHD 770, обзаведясь частотой ядра до 1500 МГц и поддержкой новой памяти DDR5 с пропускной способностью до 76.8 Гб/c. Добавился младший вариант UHD 710, в котором всего 128 шейдерных блоков — он нашел применение в новых Pentium и Celeron. Также стал доступен промежуточный вариант UHD с 512 шейдерами для мобильных процессоров.
Первая итерация архитектуры Xe-HPG, предназначенная для производительных карт, получила название Alchemist. Блоки производительного варианта архитектуры претерпели изменения по сравнению с теми, которые используются во встроенной графике. В каждом новом базовом блоке 128 шейдерных процессоров и 16 EU. К нему привязаны 4 растровых и 8 текстурных модуля, а также одно специализированное ядро для трассировки лучей.
Среди десктопных карт в свет вышла пока только младшая модель — Arc 3 A380, в которой таких блоков 8. Вместе они образуют 1024 шейдерных процессора в 128 EU, 32 ROP и 64 TMU. Память GDDR6 соединяется с ГП по 96-битной шине и обладает пропускной способностью 186 Гб/c. Карта уже способна достичь производительности современных бюджетных GeForce GTX1650 или Radeon RX6400, но в некоторых проектах результаты нестабильны — сказывается сырость драйверов, которые компания обещает «допилить» до конца года. Мобильные версии чипа под названиями A370M и A350M показывают результаты ниже: первый урезан по только по частоте, а второй — еще и по шейдерным блокам, там их всего 768. При этом у обоих гораздо меньше пропускная способность из-за применения более узкой 64-битной шины — всего 112 Гб/c.
В третьем квартале года готовятся к выходу старшие карты Alchemist. Это Arc 5 — A580 и A550M, а также топовые Arc 7 — A770, A770M и A730M. Старшая версия будет обладать 4096 шейдерными процессорами, сгруппированными в 512 EU, 128 ROP и 256 TMU, 64 блоками RT и 16 Гб 256-битной GDDR6 памяти с пропускной способностью 512 Гб/c. Остальные версии получат ГП с меньшим количеством блоков, объемом памяти и ее пропускной способностью. Ожидаемая производительность флагмана на старте — примерно на уровне RTX 3060 Ti.
Будущие поколения
На презентации нового семейства дискретной графики Intel объявила, что уже работает над следующими поколениями графики Xe и даже назвала их кодовые имена: после Alchemist следуют Battlemage, затем Celestial, и, наконец, — Druid.
Компания серьезно настроена развивать дискретную графику в будущем, за что можно простить ей первые «блины комом» в виде недоработанных драйверов Alchemist на выходе. Сейчас Intel занимается оптимизацией новой графики, но при этом говорит откровенно: архитектура Xe лучше всего справляется с проектами на современном DirectX 12. В случае со старыми играми, использующими прошлые версии DirectX, производительность будет немного ниже конкурентов. Впрочем, в старых проектах производительности Xe и так чаще всего достаточно, поэтому упор на современный API для новых моделей карт в 2022 году не выглядит странно.
Увы, первоначальные планы Intel выйти на рынок на равных с NVIDIA и AMD, не сбылись. Но до средних решений линейка карт Alchemist вполне дотянулась, что тоже неплохо для выхода на рынок дискретных моделей впервые за столько лет. Не стоит забывать, что в 2024 году Intel выпустило второе поколение карт Xe — Battlemage, которые учитывают прошлые ошибки и радуют более высокой производительностью. А пока мир замер в ожидании старших карт от компании, которые увидят свет уже совсем скоро.