Задержка кэша Fermi L2? - PullRequest
       77

Задержка кэша Fermi L2?

4 голосов
/ 19 июля 2011

Кто-нибудь знает связанную информацию о кеше L2 в Fermi?Я слышал, что он такой же медленный, как глобальная память, и использование L2 просто для увеличения пропускной способности памяти.Но я не могу найти никакого официального источника, чтобы подтвердить это.Кто-нибудь измерял задержку попадания L2?А как насчет размера, размера строки и других параметров?

В действительности, как ошибки чтения L2 влияют на производительность?В моем смысле L2 имеет значение только в приложениях с очень большой памятью.Пожалуйста, не стесняйтесь высказать свое мнение.

Спасибо

Ответы [ 2 ]

3 голосов
/ 16 января 2012

Этот поток в nvidia имеет некоторые измерения для характеристики производительности.Хотя это не официальная информация и, вероятно, не является точной на 100%, она дает хоть какое-то указание на поведение, поэтому я подумал, что это может быть полезно здесь (измерения в тактах):

1020 некэшированный (L1 включен, но не используется)

1020 без кэширования (L1 отключен)

365 L2 кэширован (L1 отключен)

88 L1 кэширован (L1 включен и используется)

Другой пост в той же теме дает такие результаты:

1060 без кэширования

248 L2

18 L1

0 голосов
/ 19 июля 2011

Это не так медленно, как глобальная память. У меня нет источника, явно говорящего об этом, но в руководстве по программированию CUDA говорится: «Запрос строки кэша обслуживается с пропускной способностью кэша L1 или L2 в случае попадания в кэш или пропускной способности памяти устройства в противном случае. " поэтому они должны отличаться, чтобы это имело какой-то смысл, и зачем NVIDIA ставить кеш с такой же скоростью глобальной памяти? В среднем было бы хуже из-за отсутствия кеша.

О задержке, которую я не знаю. Размер кэша L2 составляет 768 КБ, размер строки - 128 байт. Раздел F4 руководства по программированию CUDA содержит еще немного информации, особенно раздел F4.1 и F4.2. Руководство доступно здесь http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/CUDA_C_Programming_Guide.pdf

...