Тема: Производительность NVIDIA GP100 может достигнуть 4 Тфлопс в режиме двойной точности  (Прочитано 455 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Онлайн BIOHAZARD

  • Ветеран-элита
  • *****
  • Сообщений: 12318
  • Поблагодарили: 230 раз(а)
  • Уважение: +59/-2
  • Пол: Мужской
  • Алкоголизм сильнее гравитации!
    • Просмотр профиля
 Как уже известно нашим читателям, производительность AMD Radeon R9 Fury X2 будет составлять 12 терафлопс. Но, во-первых, речь идёт исключительно о вычислениях одинарной точности, а во-вторых, сейчас многих интересует, на что же окажется способна NVIDIA, которая уже умудрилась продемонстрировать прототип автомобильного компьютера PX2 на базе архитектуры предыдущего поколения, хотя должна была показать Pascal. Тем не менее флагманский Pascal, он же GP100, действительно существует в кремнии, и уже появились данные, позволяющие оценить его на фоне других графических архитектур NVIDIA CUDA.

Ранние оценки архитектур NVIDIA

Представителю Beyond3D Forum удалось опубликовать несколько интересных слайдов. Самые ранние из них датированы 2014‒2015 гг. и интересны они, в первую очередь, сравнительной оценкой архитектур (гигафлопс/ватт). На тот момент эффективность будущих архитектур NVIDIA оценивалась следующим образом:

  • Tesla: 0,5;
  • Fermi: 2;
  • Kepler: 5,5;
  • Pascal: 14;
  • Volta: 22.

Как было разъяснено, речь идёт исключительно об обработке данных в режиме двойной точности (FP64). Собственно поэтому в список не попала архитектура Maxwel, практически лишённая каких-либо талантов в сфере двойных вычислений. Быстрейшей из существующих архитектур NVIDIA в этой области пока остается Kepler (ускоритель Tesla K40X достигает 6,1 гигафлопса на ватт). А вот от Pascal ожидаются серьёзные чудеса: до 42 Гфлопс в режиме FP32 SGEMM (Single precision floating General Matrix Multiply). От Voltra все ждут ещё более впечатляющих 73 гигафлопс на ватт.

Вычисления в смешанном режиме

А ведь есть ещё такая вещь, как HGEMM (Half Precision floating General Matrix Multiply, вычисления половинной точности). Мы знаем, что Pascal и следующие за ним графические архитектуры будут способны выполнять вычисления в смешанных режимах. Согласно последним данным, производительность Pascal в этой сфере составит до 85 Гфлопс на ватт, а у Voltra и вовсе достигнет 145 Гфлопс  на ватт.

Когда великий мудрец занимается незначительным делом - он тяготится им и рука невольно тянется к вину (с)
 


 


Поиск

 
SimplePortal 2.3.6 © 2008-2014, SimplePortal