Что такое GFLOPS видеокарты

1 ответ(ов) в теме
Форум
moto
не в сети 4 часа
На сайте с 12.03.2017
Администратор
Тем 3533
Сообщения 13890
1
21:04

FLOPS (FLoating-point Operations Per Second) — количество операций с плавающей точкой, выполняемых за одну секунду. Именно этим значением характеризуется мощность (производительность) устройств, в нашем случае — видеокарт.

Плавающая точка, или же, в русскоязычных странах, плавающая запятая (дробную часть от целой отделяет запятая) — это вещественные числа (десятичные дроби) в машинном представлении.

1 FLOPS означает одну операцию (например, сложение) над вещественными числами, которая занимает 1 секунду.

Современные устройства способны выполнять миллионы операций в секунду, поэтому к размерности добавляются приставки системы СИ: TFLOPS (терафлопс), GFLOPS (гигафлопс) и т. д.

При этом, числа могут быть как 64-битные (FP64, двойная точность), так и 32-битные (FP32, одинарная точность) или 16-битные (FP16, половинная точность).

Де-факто, когда указывается производительность устройства, в большинстве случаев имеются в виду операции над вещественными числами одинарной точности — FP32.

Следует понимать, что количество терафлопсов характеризует теоретическую пиковую производительность. По сути, это состояние, при котором производятся только вычисления, без ожидания доступа к памяти, задержек, подготовки данных и прочего.

Чтобы узнать производительность видеокарты в гигафлопсах, нужно её частоту (ГГц) умножить на количество шейдерных процессоров (CUDA-ядер на картах NVidia, потоковых процессоров на AMD). Из-за того, что современные процессоры могут выполнять более одной операции за такт, результат нужно умножить на число этих операций. Современных игровые видеокарты способны выполнить 2 операции за машинный такт (например, сложение + умножение).

Такт — промежуток времени между соседними импульсами генератора. Частота 1100 МГц означает, что устройство генерирует 1100 миллионов импульсов (тактов) в секунду.

Теоретическую производительность видеокарт привожу в таблице.

Здесь можно увидеть несколько интересных моментов.

Во-первых, GeForce GTX 750 Ti оказывается мощнее современной GT 1030.

Во-вторых, Radeon RX 580 по производительности в гигафлопсах сравним с GeForce GTX 1070, хотя в играх выступает на уровне GeForce GTX 1060 с 6 ГБ видеопамяти. Почему так происходит? Дело в драйверах и оптимизации. Если хорошо оптимизировать софт, отставание можно нивелировать, что наблюдается в майнинге эфириума, и именно поэтому, при очередном росте этой криптовалюты, карты от AMD разлетаются как пирожки.

В-третьих, производительность самой мощной видеокарты Titan V (цена 3000$) оказывается всего на 16% выше GeForce GTX 1080 Ti (700$). Самое интересное, что в новостях распространилась информация о том, что Titan V предлагает производительность в 110 TFLOPS! Как же так, обман?

На самом деле, нет. Помимо обычных CUDA, новинка от NVidia содержит тензорные ядра. Подробнее об этом как-нибудь в другой раз, сейчас лишь отмечу, что данные ядра используются для нужд машинного обучения, а сама видеокарта позиционируется как адаптер для профессионального использования.

Форум
0
Вы не имеете права на публикацию сообщений в этой теме