Компьютер + Компьютерное железо

С этим тегом используют

985 постов сначала свежее

neo0071

1 месяц назад

Твой ПК тянул windows 2000?⁠⁠

Компьютер Windows Ностальгия Олдфаги Компьютерное железо Видео Короткие видео 2000-е

TechSavvyZone

1 месяц назад

Технологии : "Голосовой помощник" Распознавание речи⁠⁠

За последнее десятилетие распознавание голоса сделало огромный рывок. Гаджеты без особого труда понимают самые сложные фразы и предложения независимо от акцента и артикуляции. Как это им удается?

Обработка звука

Попытки распознавания голосовых команд предпринимались еще с середины прошлого века. И уже тогда было ясно, что перед распознаванием запись голоса следует обработать. Одни люди говорят громче, другие — тише. Также в реальных условиях всегда есть посторонние шумы, не имеющие отношения к человеческой речи. И отдать запись на распознавание «как есть» — только запутать ситуацию и увеличить вероятность ошибок. В чем же состоит обработка звука?

Оцифровка
Звук — это волны. С микрофона он идет в виде аналогового сигнала, а компьютеры с аналоговыми данными работать не умеют. Звук надо оцифровать. Для этого используются АЦП — аналого-цифровые преобразователи. На выходе АЦП звук преобразовывается в цифровой массив. При частоте дискретизации 44 кГц одна секунда звука превращается в 44000 чисел.

Фильтрация
Фильтрация заключается в отсеивании всех частот, не относящихся к человеческому голосу. Это довольно узкий диапазон, лежащий в пределах 75–500 Гц. Слышимый человеком диапазон звуков намного шире — 20–20000 Гц. В таком (или близком) диапазоне выдают сигнал большинство микрофонов. Так что фильтрация позволяет отсеять 97,5 % ненужной информации. Это намного ускоряет дальнейшую обработку сигнала.

Фильтрация может производиться и до оцифровки — с помощью аналоговых фильтров. Но цифровой метод надежнее.

Нормализация
Нормализация нужна, чтобы устранить влияние громкости звука на результат. Слабый сигнал усиливается. Сильный, наоборот, ослабляется. Итоговый сигнал имеет примерно одинаковую амплитуду для всех записей звука — как громких, так и тихих.

Распознавание методами математического анализа

До развития ИИ алгоритмы распознавания звука часто работали прямо со звуковым сигналом. Вот такого вида:

Для распознавания текста использовались различные методы математического анализа. Например, в базе данных сохранялись эталонные записи команд, и каждая новая запись сравнивалась с ними с помощью корреляционного анализа. Это позволяло легко найти среди эталонов наиболее подходящий и выполнить соответствующую команду. Способ хорошо работал с отдельными командами, представляющими собой неизменное слово или фразу. А вот с распознаванием обычной речи все было хуже.

Распознавание с помощью нейросетей

Нейросети работают примерно так же, как и человеческий мозг. Они хорошо выявляют качественные признаки и не очень хорошо — количественные. Человек с первого взгляда отличит кошку от собаки, а вот кучку из 50 спичек от кучки из 49 — вряд ли даже с десятого. И вот здесь с распознаванием голоса на основе цифрового сигнала возникают сложности.

Вот три записи. Среди них — два слова «собака», произнесенные разными голосами и одно слово «забота».

Задача выглядит несложной. Конечно же, второй и третий паттерны намного более похожи друг на друга, чем первый и второй или первый и третий. А значит — первый паттерн — «забота», а второй и третий — «собака»?

Нет. «Собака» — первый и третий. «Забота» — второй. Почему так? Потому что на записи мы в первую очередь обращаем внимание на амплитуды сигналов. Но это — всего лишь громкость. Смысловую нагрузку несет частота сигнала, а вот ее с первого взгляда на записи не видно. И со второго не видно. И вообще не видно до тех пор, пока вы не измерите расстояние между соседними пиками на графике.

Впрочем, решение этой задачи найдено давно — частотный анализ. Возьмем кусочек записи и посчитаем, с какой громкостью на нем звучит каждая частота. И изобразим это в виде графика.

Но такой график — все еще сложная для восприятия штука. А раз она сложна нам, то и нейросетям она тоже не понравится. Поэтому громкость изобразим в виде цвета. Теперь каждая запись предстает в таком виде:

«Собака»

«Забота»

Не правда ли, все стало проще? Нейросетям — тоже. С этими картинками уже вполне можно использовать те же алгоритмы, что позволяют нейросетям обнаруживать на фотографии лица или разбираться в дорожной обстановке.

Более того, такое представление записи позволяет искать не слова, а отдельные фонемы. Фонемы — это элементы, из которых состоит человеческая речь. В разных языках они разные, но их немного. В русском языке, например, их 42 (по некоторым исследованиям больше — 46–48).

Фонемы — это не то же, что и буквы. В разных словах одним и тем же буквам могут соответствовать разные фонемы. Но, распознав все фонемы, уже можно легко собрать из них слово.

Дальнейшая работа с распознанным текстом

Итак, благодаря нейросети мы смогли преобразовать запись голоса в осмысленный текст. Но ведь голосовой помощник на этом не останавливается. Он как-то понимает этот текст и осмысленно на него отвечает. Как это делается? Во-первых, текст токенизируется. Из него выделяются отдельные токены — смысловые единицы. Токенами могут быть слова, их сочетания и целые фразы — это зависит от модели нейросети и ее целей. В голосовых помощниках это обычно слова и пунктуационные знаки. Дальше токены текста проходят через эмбеддинг — каждому токену сопоставляется некий смысловой вектор в N-мерном пространстве. Например, один из простейших методов эмбеддинга предполагает использование двумерного массива:

Так, после эмбеддинга токен «Корова» получит вектор [-,100,0,10,100]. Теперь, приняв набор токенов «Луг, Молоко», нейросеть предположит, что речь идет о корове.

Eще, сравнивая токен «Корова» с другими токенами своего словаря, нейросеть заметит сходство вектора только с одним вариантом — соответствующим токену «Птица». Мы понимаем, что это произошло потому, что птица — тоже животное, и она тоже может обитать на лугу. В данной простейшей модели нейросеть не знает таких терминов, как «животное» и «обитать». Но это не мешает прийти ей к тому же выводу, что и человек.

Очевидно, что эффективность нейросети очень сильно зависит от размеров словаря и от правильности заполнения соответствующей матрицы. Это делается с помощью методов машинного обучения на больших массивах реальных данных. Нейросеть просматривает различные тексты и заполняет словарь на основе встречающихся слов. Например, несколько раз встретив в одном предложении слова «Корова» и «Луг», она увеличит число, стоящее на пересечении соответствующих столбцов и строк.

Теперь, когда каждому слову сопоставлен какой-то смысл, нейросеть может определить, что хотел от нее пользователь. Для этого запрос пропускается через семантический теггер, который определяет семантическую функцию каждого токена. Например, при запросе «Кто на лугу?» нейросеть по токенам «Кто» и «?» поймет, что ей задали вопрос. А «луг» она определит как основную информацию запроса и, сопоставив вектор соответствующего токена с остальными, выдаст ответ: «Корова».

Но чтобы поддерживать разговор, умения отвечать на вопросы мало. Нужно оставаться в контексте беседы, и голосовым помощникам это удается. Для этого используются рекуррентные нейронные сети. Такие сети содержат рекуррентные слои, кроме обычных выходов имеющие дополнительный выход для следующего просчета.

Вывод

Голосовые помощники могут вести с нами полноценный разговор и выглядеть при этом вполне разумными собеседниками. Но это иллюзия. Нейросети способны выдавать грамотные, разумные и взвешенные ответы, совершенно не понимая сути вопроса. Весь секрет — в современных технологиях и в обширной базе знаний в виде книг и изображений, хранящихся в сети Интернет.

Обучение нейросети требует немалых вычислительных ресурсов, а под словари и базы данных нужны целые массивы накопителей. Поэтому большинство голосовых помощников «живет» на серверах в дата-центрах. Общение же с пользователями происходит через Интернет. Именно поэтому полный функционал умных колонок доступен только при их подключении к Интернету.

Показать полностью 8

Технологии IT Компьютерное железо Компьютер Инженер Искусственный интеллект Голосовой помощник Голосовое управление Звук Распознавание голоса Тестирование Программа Длиннопост

TechSavvyZone

1 месяц назад

Продолжение поста «Технологии: "PCI-Express"»⁠⁠1

Продолжение поста «Технологии: "PCI-Express"» Инженер, Компьютерное железо, IT, Технологии, Компьютер, Производство, Электроника, Чип, Pci-e, Ответ на пост, Длиннопост

Теория — это хорошо, но практика — лучше. В следующей таблице рассмотрим комбинации современных процессоров с чипсетами, при которых все устройства, требующие высокой скорости обмена информацией с системой, получат полную пропускную способность по линиям PCI-E. Учитывать платы расширения, которым требуется для работы только одна линия — проводные и беспроводные сетевые адаптеры, звуковые карты и прочее — здесь не будем, так как данные устройства незначительно влияют на общую пропускную способность.

* - учитываются максимальные возможности чипсета. На некоторых материнских платах могут быть реализованы не все линии и слоты, позволяющие добиться такой конфигурации устройств.
** - можно отказаться от дискретной видеокарты или выделить ей меньшее количество линий. Тогда при установке в разъем видеокарты дополнительной платы-переходника для NVME SSD можно увеличить их количество в любой из систем.
*** - версия PCI-E зависит от реализации поддержки на конкретной материнской плате.
**** - возможно подключение еще одного NVME SSD без потерь для первого, но только на «половинной» скорости 2.0 x4.

Как видим, большинство чипсетов для массовых платформ рассчитано на одну видеокарту и один-два NVME SSD. Впрочем, с появлением новых платформ каналы связи с чипсетом расширяются, и к современным Core и Ryzen даже на «средних» чипсетах уже можно подключить по три, четыре, а то и более быстрых накопителя для использования параллельно без потерь производительности — лишь бы достаточное количество слотов было на материнской плате.

Однако видеокарт это не касается. Массовые платформы все так же предлагают только один канал x16, который тоже получает выигрыш от новых версий PCI-E, но похвастать разделением линий на два независимых канала x16 все так же не может. Конфигурации с несколькими видеокартами при полной скорости подключения последних все так же являются прерогативой HEDT-платформ. Которые, к тому же, позволяют управлять линиями PCI-E намного гибче, чем массовые, что открывает больше возможностей для кастомных конфигураций с большим количеством разных устройств.

Показать полностью 3

Инженер Компьютерное железо IT Технологии Компьютер Производство Электроника Чип Pci-e Ответ на пост Длиннопост

soviettovarish

1 месяц назад

Хочу новую систему⁠⁠

Хелло.
Решил себе собрать новую систему.
Не буржуй, поэтому будет два вопроса:
1.На что обновляться?
2.За сколько продать старую систему?

Так вот, цель нового пк - только игры.
Планирую играть в 2к и 144фпс
Спецы, подскажите сборку под данные требования.

Ну и для того, чтобы это осуществить нужно продать старую систему
Учитывая все детали - за сколько продавать?
Кулер ID-Cooling SE-224-XTS LGA1700/1200/115x/AM5/AM4 (120mm fan, 600-1500rpm, 70CFM, 28.9dBA, 4-pin PWM) RET
Корпус Zalman ZM-T7, черный
Материнская плата ASUS PRIME B760M-K D4, LGA 1700, Intel B760, mATX, Ret
Блок питания Deepcool PF 700 (R-PF700D-HA0B-EU)
Видеокарта GIGABYTE GeForce RTX 4070 GAMING OC 12G (GV-N4070GAMING OC-12GD), Retail
Оперативная память Adata DDR4 32GB (2x16Gb) 3600MHz
Процессор Intel Core i5-12400F OEM
SSD 953GB ADATA SX6000PNP

P.S. Не спорю, компьютер сейчас тянет, но уже не всегда на ультрах и не всегда стабильно 60фпс, поэтому и обновляюсь.

Компьютерное железо Сборка компьютера Игровой ПК Компьютер Видеокарта Текст

234

Darcie

1 месяц назад

Лига Геймеров

Команда надеваемых компьютеров Массачусетского Технологического Института. Девяностые⁠⁠

Компьютер Массачусетский Компьютерное железо 90-е Киберпанк

avalspro

1 месяц назад

С барского плеча⁠⁠

На днях пришли ко мне люди одной из организаций с просьбой установки ПО для их «нового» компьютера. Его им с барского плеча передала вышестоящая контора.

Комп был новым… в 2009 году. Стенд:

Intel Core 2 Duo E4500 2,2 GHz
2 GB DDR2 RAM
250 GB HDD

В него уже воткнули Windows 10 x64 и разделили том на 30 гигов и всё остальное. То есть на основном разделе 70 процентов места было уже занято. В блоке питания не работал кулер и корпус системника нагрелся очень сильно.

С барского плеча Компьютер, Хлам, Компьютерное железо, Длиннопост

Точно не знаю, но вышестоящие, скорее всего, отчитались, что оказали помощь с оснащением компьютерной техники. А на самом деле такую технику нужно списывать и утилизировать в соответствии с законодательством РФ, а услуга эта платная и, чтобы не заморачиваться и тратиться, прибегают вот к таким манипуляциям.

Позже оказалось, что ещё семь таких же системников передали другим нижестоящим конторам. На дворе заметьте 2025 год.

P.S. А в этом системнике сделал, что мог: добавил оперативы, заменил блок питания и переустановил систему.

Показать полностью 2

Компьютер Хлам Компьютерное железо Длиннопост

TechSavvyZone

1 месяц назад

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят?⁠⁠

Выпуск серии видеокарт RTX20 в свое время стал важнейшим событием в сфере компьютерных технологий. Десктопные видеокарты впервые получили отдельные тензорные ядра. Что это такое? Как работают эти ядра и для чего используются?

CUDA и тензорные ядра

Работа с графикой — специфическая задача для компьютерного «железа». Здесь требуется выполнять довольно однообразные команды с большим объемом данных. Архитектура CPU для этого подходит плохо. Из-за ограниченного числа ядер и АЛУ (арифметико-логических устройств) процессоры не могут быстро делать объемные операции по сложению и умножению.

Был необходим максимальный параллелизм — одновременная обработка данных. Одним из решений стали CUDA-ядра — технология, созданная Nvidia больше десяти лет назад. Эти ядра создали специально для параллельной работы. На чипе помещались сотни и тысячи CUDA-ядер, а их число стало одним из критериев оценки производительности видеокарты.

CUDA-ядра имеют высокоскоростной доступ к видеопамяти, так что обработка выполняется с минимальными задержками. Это важнейший показатель для быстрого вывода подготовленных кадров на монитор.

Однако обработка больших объемов данных нужна не только при выводе графики. Она требуется для научных вычислений, моделирования физических процессов и машинного обучения. Во всех этих задачах одна из главных операций — перемножение матриц.

Задача непростая. Скажем, для решения вышеописанного примера нужны целых 64 умножения и 48 сложений. Не говоря о том, что промежуточные результаты нужно еще где-то хранить. Для операций чтения и записи нужны дополнительные регистры и достаточно скоростная кэш-память.

Может ли с этой задачей справиться CPU? Вообще-то, да. Специально для таких вычислений в процессорах начали появляться инструкции MMX, SSE и (самые совершенные) AVX. Однако видеокарты с их многочисленными CUDA-ядрами — более предпочтительный вариант. Они могут распараллелить большую часть простых операций сложения и умножения. Но даже для них задача просчета матриц оставалась трудоемкой. Решением стали тензорные ядра.

Одно такое ядро способно перемножить две матрицы за один такт. В то время как CUDA-ядрам требуется несколько тактов.

Первое тензорное ядро представляло собой микроблок, выполнявший суммирование-произведение матриц 4x4. Могли использоваться значения FP16 (числа с плавающей запятой размером 16 бит) или умножение FP16 с добавлением FP32.

Размерность рабочих матриц невелика. Ядра при обработке реальных наборов данных обрабатывают небольшие блоки более крупных матриц, в итоге формируя окончательный ответ.

Решение оказалось крайне эффективным. Специалисты из Anandtech провели замеры производительности топовых решений от Nvidia — без тензорных ядер и с ними.

В операциях перемножения матриц (GEMM) прирост производительности с использованием тензорных ядер колоссальный.

Применение тензорных ядер

Научные вычисления

Тензорная математика активно используется в физике и инженерии для решения всех видов сложных вычислений. Например, в механике жидкостей, электромагнетизме, астрофизике, медицине и климатологии. В суперкомпьютерах для этих задач обычно используют крупные кластеры с тысячами высокопроизводительных процессоров уровня Xeon Platinum или AMD Epyc. Однако видеоускорители стали неотъемлемой частью практически любого суперкомпьютера. Подавляющее число машин из рейтинга Top500 работают на базе решений от Nvidia.

Машинное обучение

Задача глубокого обучения в самом простом смысле — это работа с математическими выражениями. Простейший вариант — нейронная сеть, состоящая из одного слоя с двумя нейронами и линейными функциями активации. Представлена она вот таким умножением вектора на матрицу:

Задача обучения сводится к поиску наилучших коэффициентов W. То есть предполагаются матричные операции.

На практике нейросети чаще всего многослойные, и математические выражения получаются куда сложнее. Однако принципиально используются все те же действия — умножение и сложение матриц. Тензорные ядра как раз ориентированы на эти действия.

Самый яркий пример — суперкомпьютер, созданный Microsoft совместно c OpenAI. В нем использовали 10 тысяч графических процессоров Nvidia V100. Именно этот компьютер применили для обучения ChatGPT-3. Продукты Nvidia можно найти в Microsoft Azure, Oracle Cloud и Google Cloud.

Илон Маск для своего ИИ Grok также задействует продукцию Nvidia. Изначально это был кластер на 20 тысяч графических процессоров H100. Недавно для обучения версии GROK 3 миллиардер запустил суперкомпьютер с сотней тысяч NVIDIA H100! Теперь вы можете понять, почему NVIDIA стала самой дорогой компанией и продолжает наращивать прибыль.

Инференс нейросети

Инференс — это запуск уже обученной модели, «скармливание» данных и получение результата. Процесс менее требователен к вычислительной мощности. Но здесь все так же используются матричные операции. Сюда входит распознавание текста (например, в голосовых помощниках), поиск объектов на изображении (распознавание лиц, номерных знаков), шумоподавление и не только.

Тензорные ядра и здесь предлагают высокую производительность. Они позволяют запускать «легкие» нейросети прямо на домашних видеокартах средневысокого ценового сегмента. Например, запустить Chat with RTX — тут достаточно RTX 30 или 40 серии с минимум 8 ГБ видеопамяти. Stable Diffusion также можно запустить локально на видеокартах. Однако производительность каждой модели зависит еще и от ПО. Оно не всегда в полной мере задействует те же тензорные или CUDA-ядра.

DLSS (Deep Learning Super Sampling)

Один из самых доступных вариантов инференса нейросетей — технология DLSS. Специально обученная на игре нейросеть запускается на тензорных ядрах видеокарты, повышая разрешение картинки в реальном времени. Игрок, в свою очередь, получает более высокий FPS. DLSS 3 работает только на видеокартах серии RTX40.

Где имеются тензорные ядра

Nvidia

Поскольку это авторская разработка «зеленых», то именно «тензорные ядра» можно найти лишь в продукции этой компании.

Впервые появились в Nvidia TITAN V в 2017 году — карта имела 640 ядер. После этого ядра стали неотъемлемой частью профессиональных ускорителей

С каждой новой архитектурой появлялось усовершенствованное поколение тензорных ядер. Так что сравнивать их число в рамках разных поколений некорректно. Есть и различия в поддерживаемых форматах данных. Первые ядра могли складывать матрицы с данными только FP16, а современные имеют поддержку куда больших форматов.

В десктопных и мобильных видеокартах технология стала доступна с приходом серии RTX20.

Именно благодаря тензорным ядрам пользовательские карты RTX можно использовать для работы с нейросетями. А также получить апскейл с использованием ИИ. Альтернативные технологии вроде XeSS и FSR базово специальных ядер не требуют.

AMD

Компания «красных» на рынок ИИ вышла относительно недавно. Аналогом тензорных ядер у них является Matrix Core Technologies, которая появилась в архитектуре CDNA 3.

Ядра Matrix Core Technologies пока встречаются только в AMD Instinct MI300A (912 штук) и MI300X (1216 штук). Новые ИИ-ускорители планируют поставить в немецкие суперкомпьютеры Hunter и Herder — в 2025 и 2027 годах соответственно. Сейчас же у немцев работают суперкомпьютеры Hawk и JUWELS на базе Nvidia A100.

Intel

У «синих» используются ядра XMX (Xe Matrix Extensions), созданные специально для матричных вычислений. На них аппаратно работает и фирменный апскейлер Intel XeSS. Встретить ядра XMX можно в линейке видеокарт ARC.

Ядра XMX используются и в Intel Xᵉ HPC 2, установленных в Data Center GPU Max. Графика Xe2-LPG будет встроена в процессоры Lunar Lake. Там также будут использоваться XMX-ядра для задач, связанных с работой ИИ.

Google

В компании не стали изобретать отдельные ядра, а нацелились сразу же на разработку полноценных плат. Они получили название TPU — Tensor Processing Unit. Эти платы специализируются на обработке матриц. Они подходят как для тренировки, так и выполнения нейросетей.