В последние годы индустрия DRAM выглядит
одной из наиболее скандальных отраслей
hi-tech, по напряженности конкуренции
сравнявшись с битвами процессорных
гигантов. Новая технология памяти DDRII
обещает очередной виток «гонки стандартов»,
и в этой статье мы попробуем разобраться,
почему же эта технология так важна и что
принесет нам новая память.
Большинство компьютеров не могут
рассчитывать на десятки мегабайт
высокоскоростной и дорогостоящей SRAM в
качестве кэша энного уровня или на
контроллеры, объединяющие пропускную
способность множества каналов памяти, как у
их двоюродных братьев из мира hi-end-серверов.
Единственный выход – создание
быстродействующей, компактной и недорогой
оперативной памяти. Таким образом,
производители процессоров кровно
заинтересованы в появлении новых, все более
быстрых типов RAM и в ряде случаев оказывают
значительное влияние на продвижение более
перспективных стандартов. В
действительности любой современный
стандарт DRAM представляет собой компромисс
между потребностью в высокоскоростной
оперативной памяти и возможностями/желаниями
ее производителей, во многом
обусловленными рыночной конъюнктурой.
Сейчас Intel и многие ведущие компании-производители
микросхем памяти (Samsung, Micron, Elpida и другие)
пришли к согласию относительно выбора
наследницы DDR SDRAM – с их точки зрения, в 2004-05
годах DDRII должна стать доминирующим типом
памяти для настольных компьютеров,
серверов и рабочих станций.
Сравнительная
характеристика DDRII и DDR SDRAM |
|
DDRII SDRAM |
DDR SDRAM |
Скорость передачи
данных (на рязряд), Мбит/с |
400/553/(667) |
200/266/333/(400) |
Частота работы ядра,
МГц |
200/266/333 |
100/133/166/(200) |
Размер предвыборки,
бит |
4 |
2 |
Длина пакета |
4/8 |
4/8 |
Строб данных |
дифференциальный |
одиночный |
Напряжение питания, В |
1,8 |
2,5 |
Интерфейс ввода-вывода |
SSTL_18 |
SSTL_2 |
Энергопотребление
(max), мВт |
304 (на 533 Мбит/с) |
418 (на 266 Мбит/с) |
Упаковка чипов |
FBGA (без свинца) |
TSOP(II) |
Тайминги, набор
команд |
то же, что и у
DDR SDRAM |
- |
На первый взгляд, DDRII выглядит просто как
улучшенная DDR SDRAM – с увеличенными
частотами, уменьшенным энергопотреблением
и набором новых функций (ключевые
характеристики DDRII и DDR SDRAM приведены в
таблице ниже). Но в действительности под
привычными очертаниями скрывается
совершенно иная архитектура.
Предвыборка 4 бит (4-bit Prefetch)
Идея такова: при неизменной внутренней
частоте ядра памяти частота буферов ввода-вывода
удваивается; при этом за каждый такт
передается два блока данных (как в обычной
DDR). Получается, что по сравнению с частотой
синхронизации ядра ввод-вывод данных
осуществляется на четырехкратной скорости.
Гениальное изобретение, позволяющее одним
махом решить все проблемы микроэлектронной
промышленности? Не совсем. Хотя благодаря
этому ухищрению скорость потокового ввода-вывода
действительно учетверяется, латентность
преимущественно определяется собственной
частотой ядра, а она для 400-МГц DDRII, как и для
PC1600 DDR SDRAM и бабушки PC100 SDRAM, по-прежнему равна
100 МГц. Становятся понятными необычно
большие тайминги (тройка CL, tRCD, tRP) DDRII: как
вам 4-4-4 схема работы DDRII 400?! Все задержки
приводятся для частоты буферов, то есть той
частоты, с которой память общается с
контроллером (чипсетом), а она в нашем
случае в два раза больше реальной частоты
ядра. Поэтому 4-4-4 для DDRII 400 соответствует 2-2-2
для DDR PC1600 или SDR PC100, что составляет 20 нс.
Разумеется, увеличивать частоту буферов,
занимающих несколько процентов общей
площади кристалла, проще, чем поднимать
скорость всей памяти. Проще, как обычно,
значит дешевле - и совсем не обязательно для
нас с вами. Фактически производители чипов
памяти в очередной раз получили прекрасную
возможность продать PC100 в новой упаковке по
цене DDRII 400. Немного утешает, что
энергопотребление модулей будет меньше и в
массовое производство почти наверняка
пойдет более быстрая память – уже DDRII 533 по
сумме характеристик сегодня выглядит
весьма привлекательно. Заметим, что
латентность 3-3-3 DDR400 SDRAM (PC3200) примерно
соответствует латентности 4-4-4 DDRII 533. DDRII 400 –
явный аутсайдер.
Отложенный CAS и аддитивная латентность
(Posted CAS and Additive Latency)
Разработчики DDRII постарались учесть
некоторые недостатки обычного протокола
работы SDR/DDR-памяти, управляемой внешним
контроллером (чипсетом). При обычной работе
синхронной памяти при трех
последовательных запросах активации
банков возникает конфликт на управляющих
линиях, когда одновременно должны быть
посланы сигналы чтения для первого пакета
данных и активации банка для третьего. В
этом случае чипсет продолжает работу по
считыванию первого пакета, а активация
банка для третьего пакета происходит с
задержкой в один такт. В потоке считываемых
данных образуются пузыри, и шина
используется менее эффективно.
В схеме с отложенным CAS специальная схема
внутри чипа памяти отслеживает сигнал
активации банка, определяет величину
задержки, называемой аддитивной
латентностью, а затем та же встроенная
схема посылает сигнал чтения, и после
задержки CAS чипсет может считывать данные.
Такой механизм, реализованный в DDRII,
позволяет ей более эффективно использовать
шину. К сожалению, это происходит только при
последовательном обращении к разным банкам
памяти и в реальной работе памяти
встречается реже, чем хотелось бы. К тому же
выигрыш в один такт при пересылке трех
пакетов данных не выглядит фантастическим
достижением.
Недостатком новой памяти является
повышение латентности при записи: в отличие
от DDR SDRAM, где она обычно составляет один
такт, для DDRII латентность записи на единицу
меньше латентности чтения (иногда это
свойство называют Variable Write Latency, переменная
латентность записи), что в лучшем случае
составит три такта. Впрочем, это не
оказывает большого влияния на работу
процессора, так как запись осуществляется в
буферы чипсета.
Встроенная терминация (On-Die Termination)
Удвоенная частота синхронизации DDRII
приводит к тому, что многие решения, успешно
применявшиеся для поддержания качества
сигналов на частотах, характерных для DDR,
теперь недостаточно эффективны. Любой
сигнал, распространяющийся по реальной
шине, отражается от различных
неоднородностей, в частности от концов шины;
при этом отраженные сигналы
взаимодействуют с основным и друг с другом,
создавая некоторую интерференционную
картину. Для борьбы с отражениями
применяется терминация. Для шины памяти SDR и
DDR SDRAM терминаторы устанавливаются на
материнской плате (резисторы можно увидеть
между слотами DIMM); на схеме видно, что это
может приводить к отражениям от
неактивного в данный момент чипа памяти:
DDRII терминирует сигналы шины данных,
строба данных и маски записи внутри
кристалла микросхемы. Кроме снижения шумов,
такой подход, по заявлению создателей DDRII,
удешевляет разработку и снижает стоимость
материнских плат.
Внешняя калибровка формирователя (Off-Chip
Driver Calibration)
Для уменьшения влияния задержки
распространения сигнала по трассе в DDRII, в
отличие от DDR, применяется двунаправленное
дифференциальное стробирование сигналов
данных. При пониженном напряжении и росте
частоты на линиях шины усиливается перекос
(skew) восходящего и нисходящего сигналов, а
также происходят всплески напряжения,
превышающие установленные пределы. Для
борьбы с этими неприятными эффектами
используется внешняя калибровка (подстройка)
импеданса формирователя – OCD. Калибровка с
помощью внешнего прецизионного резистора
вдобавок позволяет нивелировать различия
чипов от разных производителей и в конечном
счете снижает перекосы сигналов.
Рассеиваемая мощность
Чипы DDRII будут упаковываться в новые
корпуса типа BGA – как DRDRAM и быстрая DDR-память,
устанавливаемая на графических платах. BGA-корпусировка
имеет ряд заметных преимуществ –
уменьшение электромагнитной интерференции,
индуктивности, большая помехозащищенность
и т. д. Разумеется, это опять-таки необходимо
для стабильной работы на высоких частотах.
Для уменьшения рассеиваемой мощности
рабочее напряжение DDRII снижено с 2.5 В до 1.8 В
по сравнению с DDR, что позволяет на время
забыть об охлаждении чипов памяти. Уже
сейчас многие высококлассные модули DDR SDRAM
оснащаются радиаторами, а в будущем, с
ростом степени интеграции микросхем эта
проблема только усугубится. Во всяком
случае, невысокая частота ядра DDRII вкупе с
пониженным напряжением имеет свой плюс –
модули памяти еще несколько лет смогут
обходиться без вентиляторов...
DDRII в реальной жизни
В конечном счете не так уж важно, какова
скорость ядра и какую схему калибровки
формирователей использует память, главное
– высокая производительность в реальных
приложениях. На первой диаграмме внизу
приведены латентности 32-битной 533-МГц DRDRAM
PC4200 (Tcac=8), DDR400 и DD266 (PC2100 и PC3200), а также PC133 SDRAM (без
задержек чипсета) в наилучших условиях –
попадание в открытую страницу. Конечно, это
всего лишь оценка в первом приближении –
реальная латентность будет намного больше;
кроме того, эта величина зависит от
алгоритма работы с памятью.


Обратимся к пиковой пропускной
способности разных типов памяти (см. вторую
диаграмму). Сразу выясним ситуацию с DDRII 400 и
PC133 SDRAM: обе обладают неприлично большой
латентностью, и если вторая безнадежно
устарела, то первая будет явно
мертворожденной из-за неспособности
составить конкуренцию активно
продвигаемой DDR400 (PC3200). DDRII 667 – почти
безоговорочный лидер.
DDRII 533 – это почти идеальная память для
современных Pentium 4 c шиной QPB 533 МГц. Однако в
течение этого года Intel обещает поднять
частоту шины для Pentium 4 до 800-МГц, а значит, и
DDRII 533, и DDRII 667 не смогут в полной мере
насытить их аппетит. Похоже, производителям
чипов DRAM в течение года придется осваивать
DDRII 800 (к чему есть все предпосылки)... либо Intel
и дальше будет использовать двухканальные
и асинхронные контроллеры памяти в своих
чипсетах.
С процессорами AMD ситуация сложнее.
Семейство K7 – Duron, Athlon, Athlon XP – вследствие
узкой по современным меркам шины EV6
неспособно эффективно использовать полосу
пропускания DDRII. Но это не должно нас
особенно расстраивать – самой платформе
Socket A ко времени выхода DDRII в свет уготовано
местечко в сегменте low-end. Ну а для
процессоров Hammer AMD пока не собирается
использовать DDRII, делая ставку на большой
кэш 2-го уровня и учитывая, что до старта DDRIIеще
целый год. Opteron – другое дело. Мощь
двухканального DDRII-контроллера с полосой
пропускания 8,5 Гбайт/с (почти 70 Гбит/с) в
сочетании с мегабайтом L2-кэша, поддержкой
SSE2 и 64-битной адресацией – система
получается действительно сбалансированной
и, умозрительно, более быстродействующей,
чем Intel Xeon. Ну и, наконец, кратко окинем
взглядом возможность применения DDRII в
качестве видеопамяти – полигона для любой
подающей надежды технологии DRAM. Тут DDRII
смотрится почти идеально – низкое
энергопотребление и сверхвысокая
пропускная способность делают ее явным
фаворитом. ATI, Nvidia и даже S3 в своих новейших
разработках ориентируются на DDRII. Почти
наверняка все наиболее мощные игровые
акселераторы к концу 2003 года будут оснащены
именно этим типом динамической памяти (или
ее разновидностью, GDDR3, с измененным
сигнальным интерфейсом).
Вместо эпилога
DDRII не революция. Об этом открыто заявляют
сами разработчики стандарта. Это следующий
логический шаг выжимания все большего
числа мегабайт в секунду из ячеек DRAM, со
своими плюсами и минусам. Почти все, что
дает нам DDRII в плане скорости, можно
реализовать с большими затратами в виде той
или иной формы двухканальной DDR-памяти (сравним
хотя бы подходы Radeon 9700 Pro и GeForce FX).
Преимущества DDRII – в низком
энергопотреблении, почти удвоенной
пропускной способности и относительно
невысокой себестоимости. Как обычно, сыр
опять получился небесплатным – память с
задержками 4-4-4 при всей своей невероятной
скорости передачи данных все же вызывает
легкое разочарование. Тем не менее, сильная
потребность в такой памяти есть уже сейчас,
и будущие графические и центральные
процессоры сполна используют всю полосу
пропускания DDRII SDRAM.
|