Обзор видеокарты Asus GeForce GTX 465 Voltage Tweak Edition - Эффективность кэширования |
Автор: Александр Мунин |
13.06.2010 11:49 |
Страница 3 из 23
Эффективность кэширования Нововведение, заключающееся в выделении кэша L1 и L2, помогает не только при вычислениях GPGPU, но также для того, чтобы хранить пустые запросы, таким образом, они не выдаются в память видеокарты. Как предполагается, это значительно повысит эффективность вычислений, особенно, в ситуациях со сложными расчетами геометрии. На изображении выше крупным планом показан увеличенный раздел кэша и уровень памяти в пределах каждого блока SM. Для размещения данных SM имеет 64 Кб общей, программируемой памяти, которая может быть конфигурирована двумя способами. Так, она может быть настроена, как 48 Кб общей памяти с 16 Кб кэша L1 или как 16 Кб общей памяти с 48 Кб кэша L1. Например, когда используются функции отличные от GPGPU, то SM использует конфигурацию кэша L1 16 Кб. Этот кэш L1, как предполагается, облегчает доступ к кэшу L2, а также упрощает операции со стеком, глобальную загрузку / хранение. Кроме того, у каждого текстурного модуля теперь имеется свой собственный высокопроизводительный кэш, который помогает увеличить скорость рендеринга. Благодаря архитектуре кэша L2 чип в состоянии сохранить большинство данных, необходимых для таких операций, как тесселяция, расчет теней и растеризация. Данные хранятся в L2 вместо того, чтобы помещаться в буфер (память DRAM), что замедлило бы процесс вычислений. Кэширование для GPU дает увеличение пропускной способности и убирает узкие места памяти, которые становятся заметны при выполнение многократных операций чтения и записи в память. Всего, у GF100 есть 768 Кб кэша L2, который динамически загружается в зависимости от загрузки. Также возможно использование кэша L1 и L2 для загрузки и хранения данных при передаче их от одного движка на другой. Таким образом, разгружается чип. Новый чип GeForce GF100 превосходит предыдущую архитектуру по всем параметрам. GT200 использовал кэш только для текстур и только для чтения, тогда как кэш L2 нового GPU перезаписываемый и позволяет кэшировать данные от текстур до ROP и почти все промежуточные. В отличие от GF100, чипы ATI серии Radeon HD 5000 помещает все данные для шейдеров в память и затем возвращает в ядро для растеризации. Это вызывает снижение производительности. Тем временем, чип NVIDIA в состоянии хранить данные для расчетов в кэше, не помещая их в память. Так, что же все это означает для конечного пользователя? В основном, это приводит к значительному увеличению эффективности использования памяти, так как пропускная способность освобождается от лишних запросов чтения и записи. Это может принести пользу GF100 в приложениях с высоким разрешением, высоким качеством картинки, где пропускная способность памяти становится критичной.
Понравилась новость? Поделись с друзьями! |
Обновлено 08.08.2010 10:14 |
Сообщите админу - выделите текст с ошибкой и нажмите Shift+Enter.
Спасибо!
13 Апр 2017 Прочее железо Hits:6390 Комментарии
28 Авг 2016 Прочее железо Hits:6559 Комментарии
24 Май 2016 Видеокарты Hits:5820 Комментарии
25 Фев 2016 Видеокарты Hits:12265 Комментарии
22 Фев 2016 Видеокарты Hits:8252 Комментарии
26 Сен 2010 Ноутбуки Hits:30595 Комментарии
06 Мар 2010 Видеокарты Hits:27888 Комментарии
20 Фев 2010 Ноутбуки Hits:25924 Комментарии
10 Апр 2010 Ноутбуки Hits:23854 Комментарии
03 Сен 2010 Ноутбуки Hits:22646 Комментарии