Обзор видеокарты Asus GeForce GTX 465 Voltage Tweak Edition - Эффективность кэширования

Автор: Александр Мунин

13.06.2010 11:49

Индекс материала
Обзор видеокарты Asus GeForce GTX 465 Voltage Tweak Edition
Подробный анализ архитектуры GF 100
Эффективность кэширования
Подробнее о блоках Raster и PolyMorph
Усовершенствования качества картинки
Усовершенствования качества картинки (продолжение)
Знакомство с NVIDIA Surround / 3D Vision Surround
GTX NVIDIA 465: Спецификации и позиционирование на рынке
Упаковка и комплектация Asus GTX 465
Подробный осмотр ASUS GTX 465 1 Гб
Тестовый стенд и софт
Aliens Versus Predator (DX11)
BattleField: Bad Company 2 (DX11)
DiRT 2 (DX11)
Far Cry 2 (DX10)
Just Cause 2 (DX10)
Metro 2033 (DX11)
Unigine: Heaven v2.0 (DX11)
Тест 8x MSAA (BF: BC2 / DiRT 2)
Тест 8x MSAA (Far Cry 2 / Just Cause 2)
Нагрев ядра и уровень шума
Результаты разгона Asus GTX 465
Заключение

Страница 3 из 23

Эффективность кэширования

Нововведение, заключающееся в выделении кэша L1 и L2, помогает не только при вычислениях GPGPU, но также для того, чтобы хранить пустые запросы, таким образом, они не выдаются в память видеокарты. Как предполагается, это значительно повысит эффективность вычислений, особенно, в ситуациях со сложными расчетами геометрии.

На изображении выше крупным планом показан увеличенный раздел кэша и уровень памяти в пределах каждого блока SM. Для размещения данных SM имеет 64 Кб общей, программируемой памяти, которая может быть конфигурирована двумя способами. Так, она может быть настроена, как 48 Кб общей памяти с 16 Кб кэша L1 или как 16 Кб общей памяти с 48 Кб кэша L1. Например, когда используются функции отличные от GPGPU, то SM использует конфигурацию кэша L1 16 Кб. Этот кэш L1, как предполагается, облегчает доступ к кэшу L2, а также упрощает операции со стеком, глобальную загрузку / хранение.

Кроме того, у каждого текстурного модуля теперь имеется свой собственный высокопроизводительный кэш, который помогает увеличить скорость рендеринга.

Благодаря архитектуре кэша L2 чип в состоянии сохранить большинство данных, необходимых для таких операций, как тесселяция, расчет теней и растеризация. Данные хранятся в L2 вместо того, чтобы помещаться в буфер (память DRAM), что замедлило бы процесс вычислений. Кэширование для GPU дает увеличение пропускной способности и убирает узкие места памяти, которые становятся заметны при выполнение многократных операций чтения и записи в память. Всего, у GF100 есть 768 Кб кэша L2, который динамически загружается в зависимости от загрузки. Также возможно использование кэша L1 и L2 для загрузки и хранения данных при передаче их от одного движка на другой. Таким образом, разгружается чип.

Новый чип GeForce GF100 превосходит предыдущую архитектуру по всем параметрам. GT200 использовал кэш только для текстур и только для чтения, тогда как кэш L2 нового GPU перезаписываемый и позволяет кэшировать данные от текстур до ROP и почти все промежуточные.

В отличие от GF100, чипы ATI серии Radeon HD 5000 помещает все данные для шейдеров в память и затем возвращает в ядро для растеризации. Это вызывает снижение производительности. Тем временем, чип NVIDIA в состоянии хранить данные для расчетов в кэше, не помещая их в память.

Так, что же все это означает для конечного пользователя? В основном, это приводит к значительному увеличению эффективности использования памяти, так как пропускная способность освобождается от лишних запросов чтения и записи. Это может принести пользу GF100 в приложениях с высоким разрешением, высоким качеством картинки, где пропускная способность памяти становится критичной.

<< Предыдущая - Следующая >>

Понравилась новость? Поделись с друзьями!

Обновлено 08.08.2010 10:14

Извините, у Вас недостаточно прав для комментирования.

Новости

Статьи и обзоры

Разное

Заметили ошибку в тексте?

Сообщите админу - выделите текст с ошибкой и нажмите Shift+Enter.
Спасибо!

Подписка на новости сайта

Переместить

Закрыть

Железный сайт

Понравилась новость? Поделись с друзьями!

Новости

Статьи и обзоры

Разное

Заметили ошибку в тексте?

Подписка на новости сайта

Авторизация

Последние статьи

Штатив Rekam Ecopod E-156

Обзор портативного жесткого диска Verbatim Store ‘n’ Go 1 Тб USB 3.0

Характеристики, производительность и цена NVIDIA GeForce 740

Характеристики, обзор и цена NVIDIA GeForce GTX 745

Характеристики, обзор и цена NVIDIA GeForse 8500 GT

Популярные статьи

Обзор ноутбука Lenovo G560

Обзор видеокарты Sapphire Radeon HD 5830 1Гб GDDR5

Установка Windows XP на ноутбук Acer Aspire 5315

Установка Windows XP на ноутбук Samsung R560

Обзор ноутбука ASUS UL20FT

Последние новости

Самое популярное