Тесла двойной точности - PullRequest
       23

Тесла двойной точности

3 голосов
/ 11 августа 2010

Я ищу информацию о том, как аппаратная реализация двойной точности реализована в Tesla GPU. Я читал, что два потоковых процессора работают с одним двойным значением, но я не нашел официальной статьи от nvidia.

Заранее спасибо. PPS Почему большинство графических процессоров вычисляют только с одной точностью (потому что цвета могут храниться как RR.GG.BB.TT, где каждый символ является 8-битным значением)?

PS Google это для меня не помогло

Ответы [ 3 ]

3 голосов
/ 12 августа 2010

Не поддержка double - это не вопрос формата хранения, как вы сказали (RR.GG.BB.TT), а наличие встроенных встроенных функций (и, соответственно, выделенного оборудования) для обработки операций над double (add, mul, madd и т. Д.).

В любом случае, большинство графических процессоров поддерживает только одну точность, потому что большая часть рынка графических процессоров находится на игровом рынке, и геймерам не нужна двойная точность.Также большинство игроков ищут хорошее соотношение цена / качество.Внедрение DP является дорогостоящим с точки зрения бюджета транзисторов (и TDP), и если игры не используют двойную точность, это бессмысленно.

Вот почему вы видите высокопроизводительные графические процессоры ATI, поддерживающие двойные (HD 59xx и HD).58xx, но не для графических процессоров среднего и начального уровня, таких как HD 57xx и менее).

@ karlphillip: Да, вы правы, IEEE754 (вроде) для графических процессоров, таких как GTX 260, но нынешнее поколение ATI и NVIDIAподдерживает IEEE 754-2008 на высококлассных деталях.

Об аппаратной реализации, это секреты, которые IHV обычно не говорят:)

2 голосов
/ 12 августа 2010

Tesla - это не графический процессор, это линейка сопроцессоров с различными высокопроизводительными графическими процессорами.Если ваш Tesla имеет графический процессор Fermi внутри, он должен обладать хорошими характеристиками двойной точности.

См. Белую бумагу Fermi , стр. 9.

Для точности важнееобычные вычисления на GPU, потому что этого достаточно для таких приложений.

1 голос
/ 11 августа 2010

Согласно Wiki :

Для двойной точности (поддерживается только в более новых графических процессорах, таких как GTX 260 [12]), есть некоторые отклонения от стандарта IEEE 754: округление до ближайшего четного является единственным поддерживаемым режимом округления для обратного деления, и квадратный корень. При одинарной точности денормали и сигнальные NaN не поддерживаются; поддерживаются только два режима округления IEEE (четность и четность округления до ближайшего), и они указываются для каждой инструкции, а не в контрольном слове; и точность деления / квадратный корень немного ниже, чем одинарная точность.

Итак, они реализуют большую часть спецификации IEEE 754 , но фактическая реализация, вероятно, является закрытой и секретной.

...