Обзор видеокарты Asus GeForce GTX 465 Voltage Tweak Edition - Подробный анализ архитектуры GF 100 |
Автор: Александр Мунин |
13.06.2010 11:49 |
Страница 2 из 23
Подробный анализ архитектуры GF 100 (структура ядра) Первое, на чем мы остановимся, это подробное описание архитектуры GeForce GF100, для понимания того, что представляет собой видеокарта от NVIDIA. На изображении выше схематически представлено то, что является основой любой платы GF100 - графическое ядро. Перед тем, как перейти к подробному рассмотрению блоков ядра, скажем, что оно делится на четыре кластера обработки графики (Graphic Processing Cluster или GPC). GPC, в свою очередь, делятся на потоковые мультипроцессоры (Streaming Multiprocessors), блоки растеризации. Каждый блок SM содержит 32 ядра CUDA (они же шейдерные процессоры в предыдущих поколениях). Так как в одном кластере GPC находится 4 блока SM, то общее количество шейдерных процессоров (CUDA) - 128. Тогда не трудно подсчитать, что общее количество ядер CUDA в GF100 равняется 512. Однако платы GTX 480 и GTX 470 довольствуются меньшим числом ядер (480 и 448 соответственно). А в новинке GTX 465 число CUDA сокращено еще больше. На периферии находится глобальный планировщик GigaThread Engine и шесть контроллеров памяти. Планировщик GigaThread Engine считывает команды CPU из оперативной памяти и копирует их в кадровый буфер видеокарты перед тем, как они будут переданы на обработку в соответствующие блоки. Ядро GF100 имеет шесть 64-бит контроллеров памяти GDDR5, что составляет в общей сложности 384 бит. Память GDDR5 с интерфейсом 384-бит обеспечивает достаточную пропускную способность, чтобы не быть узким местом, как это было в прошлых поколениях видеоадаптеров. Каждый блок SM содержит 32 ядра CUDA. Потоки, получаемые от GigaThread Engine, SM раздает группами по 32 штуки на обработку шейдерным процессорам (CUDA). Одна такая группа называется "варпом". На изображении выше видно, как происходит обработка данных ядрами и блоком SM, который может обрабатывать 32 параллельных потока. Ближе к основанию SM находятся кеш L1 / L2, Polymorph Engine и четыре текстурных модуля. Всего, максимальное число текстурных модулей в данной архитектуре 64 единицы. Это стало неожиданностью потому, что старшая архитектура GT200 поддерживала до 80 TMU. Однако NVIDIA осуществили множество усовершенствований архитектуры данных модулей. Их мы рассмотрим позднее. Независимо от блоков SM располагаются шесть специализированных модулей ROP по восемь единиц в каждом. В общей сложности получается 48 блоков ROP в противоположность 32-м в архитектуре GT200. Помимо этого отличие от GT200 заключается в том, что вместо того, работать с шиной памяти, блоки ROP связаны с общим кэшем L2, который обеспечивает быстрый доступ к данным.
Понравилась новость? Поделись с друзьями! |
Обновлено 08.08.2010 10:14 |
Сообщите админу - выделите текст с ошибкой и нажмите Shift+Enter.
Спасибо!
13 Апр 2017 Прочее железо Hits:6396 Комментарии
28 Авг 2016 Прочее железо Hits:6565 Комментарии
24 Май 2016 Видеокарты Hits:5826 Комментарии
25 Фев 2016 Видеокарты Hits:12269 Комментарии
22 Фев 2016 Видеокарты Hits:8257 Комментарии
26 Сен 2010 Ноутбуки Hits:30599 Комментарии
06 Мар 2010 Видеокарты Hits:27895 Комментарии
20 Фев 2010 Ноутбуки Hits:25929 Комментарии
10 Апр 2010 Ноутбуки Hits:23864 Комментарии
03 Сен 2010 Ноутбуки Hits:22649 Комментарии