Модули оперативной памяти ddr ddr2. Характеристики и маркировка оперативной памяти

Новые поколения процессоров стимулировали разработку более скоростной памяти SDRAM (Synchronous Dynamic Random Access Memory) с тактовой частотой 66 МГц, а модули памяти с такими микросхемами получили название DIMM(Dual In-line Memory Module).
Для использования с процессорами Athlon, а потом и с Pentium 4, было разработано второе поколение микросхем SDRAM - DDR SDRAM (Double Data Rate SDRAM). Технология DDR SDRAM позволяет передавать данные по обоим фронтам каждого тактового импульса, что предоставляет возможность удвоить пропускную способность памяти. При дальнейшем развитии этой технологии в микросхемах DDR2 SDRAM удалось за один тактовый импульс передавать уже 4 порции данных. Причем следует отметить, что увеличение производительности происходит за счет оптимизации процесса адресации и чтения/записи ячеек памяти, а вот тактовая частота работы запоминающей матрицы не изменяется. Поэтому общая производительность компьютера не увеличивается в два и четыре раза, а всего на десятки процентов. На рис. показаны частотные принципы работы микросхем SDRAM различных поколений.

Существуют следующие типы DIMM:

    • 72-pin SO-DIMM (Small Outline Dual In-line Memory Module) - используется для FPM DRAM (Fast Page Mode Dynamic Random Access Memory) и EDO DRAM (Extended Data Out Dynamic Random Access Memory)

    • 100-pin DIMM - используется для принтеров SDRAM (Synchronous Dynamic Random Access Memory)

    • 144-pin SO-DIMM - используется для SDR SDRAM (Single Data Rate …) в портативних компьютерах

    • 168-pin DIMM - используется для SDR SDRAM (реже для FPM/EDO DRAM в рабочих станциях/серверах

    • 172-pin MicroDIMM - используется для DDR SDRAM (Double date rate)

    • 184-pin DIMM - используется для DDR SDRAM

    • 200-pin SO-DIMM - используется для DDR SDRAM и DDR2 SDRAM



    • 214-pin MicroDIMM - используется для DDR2 SDRAM

    • 204-pin SO-DIMM - используется для DDR3 SDRAM

    • 240-pin DIMM - используется для DDR2 SDRAM, DDR3 SDRAM и FB-DIMM (Fully Buffered) DRAM





    • 244-pin Mini-DIMM – для Mini Registered DIMM

    • 256-pin SO-DIMM - используется для DDR4 SDRAM

    • 284-pin DIMM - используется для DDR4 SDRAM

Чтобы нельзя было установить неподходящий тип DIMM-модуля, в текстолитовой плате модуля делается несколько прорезей (ключей) среди контактных площадок, а также справа и слева в зоне элементов фиксации модуля на системной плате. Для механической идентификации различных DIMM-модулей используется сдвиг положения двух ключей в текстолитовой плате модуля, расположенных среди контактных площадок. Основное назначение этих ключей - не дать установить в разъем DIMM-модуль с неподходящим напряжением питания микросхем памяти. Кроме того, расположение ключа или ключей определяет наличие или отсутствие буфера данных и т. д.

Модули DDR имеют маркировку PC. Но в отличие от SDRAM, где PC обозначало частоту работы (например PC133 – память предназначена для работы на частоте 133МГц), показатель PC в модулях DDR указывает на максимально достижимую пропускную способностью, измеряемую в мегабайтах в секунду.

DDR2 SDRAM

Название стандарта Тип памяти Частота памяти Частота шины Передача данных в секунду (MT/s)
PC2-3200 DDR2-400 100 МГц 200 МГц 400 3200 МБ/с
PC2-4200 DDR2-533 133 МГц 266 МГц 533 4200 МБ/с
PC2-5300 DDR2-667 166 МГц 333 МГц 667 5300 МБ/с
PC2-5400 DDR2-675 168 МГц 337 МГц 675 5400 МБ/с
PC2-5600 DDR2-700 175 МГц 350 МГц 700 5600 МБ/с
PC2-5700 DDR2-711 177 МГц 355 МГц 711 5700 МБ/с
PC2-6000 DDR2-750 187 МГц 375 МГц 750 6000 МБ/с
PC2-6400 DDR2-800 200 МГц 400 МГц 800 6400 МБ/с
PC2-7100 DDR2-888 222 МГц 444 МГц 888 7100 МБ/с
PC2-7200 DDR2-900 225 МГц 450 МГц 900 7200 МБ/с
PC2-8000 DDR2-1000 250 МГц 500 МГц 1000 8000 МБ/с
PC2-8500 DDR2-1066 266 МГц 533 МГц 1066 8500 МБ/с
PC2-9200 DDR2-1150 287 МГц 575 МГц 1150 9200 МБ/с
PC2-9600 DDR2-1200 300 МГц 600 МГц 1200 9600 МБ/с

DDR3 SDRAM

Название стандарта Тип памяти Частота памяти Частота шины Передач данных в секунду(MT/s) Пиковая скорость передачи данных
PC3-6400 DDR3-800 100 МГц 400 МГц 800 6400 МБ/с
PC3-8500 DDR3-1066 133 МГц 533 МГц 1066 8533 МБ/с
PC3-10600 DDR3-1333 166 МГц 667 МГц 1333 10667 МБ/с
PC3-12800 DDR3-1600 200 МГц 800 МГц 1600 12800 МБ/с
PC3-14400 DDR3-1800 225 МГц 900 МГц 1800 14400 МБ/с
PC3-16000 DDR3-2000 250 МГц 1000 МГц 2000 16000 МБ/с
PC3-17000 DDR3-2133 266 МГц 1066 МГц 2133 17066 МБ/с
PC3-19200 DDR3-2400 300 МГц 1200 МГц 2400 19200 МБ/с

В таблицах указываются именно пиковые величины, на практике они могут быть недостижимы.
Для комплексной оценки возможностей RAM используется термин пропускная способность памяти. Он учитывает и частоту, на которой передаются данные и разрядность шины и количество каналов памяти.

Пропускная способность = Частота шины x ширину канала x кол-во каналов

Для всех DDR — количество каналов = 2 и ширина равна 64 бита.
Например, при использовании памяти DDR2-800 с частотой шины 400 МГц пропускная способность будет:

(400 МГц x 64 бит x 2)/ 8 бит = 6400 Мбайт/с

Каждый производитель каждому своему продукту или детали дает его внутреннюю производственную маркировку, называемую P/N (part number) — номер детали.
Для модулей памяти у разных производителей она выглядит примерно так:

  • Kingston KVR800D2N6/1G
  • OCZ OCZ2M8001G
  • Corsair XMS2 CM2X1024-6400C5

На сайте многих производителей памяти можно изучить, как читается их Part Number.

Kingston Part Number Description
KVR1333D3D4R9SK2/16G 16GB 1333MHz DDR3 ECC Reg CL9 DIMM (Kit of 2) DR x4 w/TS

Получил вопрос от Александра Шилина:

Народ у меня такой вопрос, а если у меня на матери потолок написано 600+ то 667 планки пойдут? а то с 600 частотой я вообще не видел, видел только 667 и выше.

Если честно, то материнскую плату с поддержкой памяти с рабочей частотой не выше 600МГц найти не удалось, да и оперативная память с частотой 667МГц уже почти пропала из продажи.

А вот материнские платы, у которых в характеристиках заявлена поддержка DDR2 667/533/400, но ни слова не говорится о DDR2 800, найти удалось. Одной из таких плат является ASUS P5LD2 на чипсете Intel 945P.

Чипсет старенький, и, скорее всего, когда компьютер с такой материнской платой собирался, то в него было установлено не более 1Гб памяти, а то и вовсе лишь 512Мб. Однако желания увеличить производительность компьютера путем увеличения объема ОЗУ никто не отменял.

Только вот нет в магазинах памяти с требуемыми характеристиками DDR2 667/533/400, а есть только DDR2 800. Можно ли ее установить? Заработает ли?

Можно.

Чтобы в этом убедиться, запустим программу CPU-Z, которую я уже хвалил, когда писал о том . Только в этот раз откроем закладку SPD.

Вот пример для DDR2 PC2-5300, 667МГц:

DDR2 PC6400, 800МГц:

А вот память, официально промаркированная как DDR2 PC6400, 800МГц, но поддерживающая работу на частоте 1066МГц:

Самой интересной для нас в данном случае является строчка Frequency в разделе Timings Table. Только значение частоты (Frequency) надо умножить на 2, чтобы получить значения, указанные в прайсах и руководствах к мат. платам.

Вообще SPD — это система профилей, зашитый в оперативную память, которая сообщает материнской плате через BIOS, на какой частоте данная планка способна работать.

И тогда видно, что DDR2 PC2-5300, 667МГц может работать не только на частоте 667МГц, но и на 533МГц, и даже 400Мгц.

То же самое можно сказать и про DDR2 PC6400, 800МГц. Отсутствие в табличке упоминания о возможности работы на частоте 667МГц, вызвано, полагаю, экономей места.

Думаю, что и последняя планка заработает даже на частоте 400МГц. Только вот с экономической точки зрения покупать в этом случае очень странно.

Так что покупайте DDR2 PC6400, 800МГц и смело устанавливайте ее на материнскую плату с поддержкой только DDR2 667/533/400. Все прекрасно будет работать и даже более надежно, т.к. у такой планки будет ощутимый запас прочности, вместо работы на пределе. 🙂

комментариев 28

  1. Илья (29 июля 2009, 15:56)
  2. На платы с поддержкой лишь медленной памяти можно устанавливать быструю — просто она работать будет на максимально поддерживаемой мат. платой скорости (т.е. низкой).

  3. (29 июля 2009, 16:01)
  4. Илья, собственно говоря об этом и писал, только для того, чтобы не быть голословным, добавил несколько изображений. 🙂

  5. Антон Молодой (30 июля 2009, 11:30)
  6. >ASUS P5LD2 на чипсете Intel 945P.
    у меня именно такая мать 🙂

    >когда компьютер с такой материнской платой собирался, то в него было установлено не более 1Гб памяти, а то и вовсе лишь 512Мб.
    я, наверное, эбонутый. но у меня 3гб. люблю когда памяти МНОГО.

  7. (30 июля 2009, 13:40)
  8. Антон, гики не в счет. 🙂
    Я имел в виду стандартные конфиги, которые втюхиваются людям.

  9. Игорь (27 августа 2009, 00:56)
  10. В общем один редька запутался я в этой памяти. Ноут поддерживает 533Мгц, стояла дубль банка 512Мб PC4200 работала на 266Мгц. Поставил ентот PC6400 (800) думал будет работать на 533Мгц. А оно отнюдь не так — 399Мгц. Короче «нащёлкал» скринов налепил сюда: http://komp-kompyuterov.narod.ru/index.html Что там к чему? Или всё верно 400х2=800.=)…походу у меня просветление позднее. Тогда зачем дурят народ восмистамимегагерцами?

  11. (27 августа 2009, 07:01)
  12. Игорь, 800 — это, очевидно, при активации двухканального режима: 2 канала по 400МГц в сумме дают 800.

    В случае с ноутбуками все еще хитрее. Вот на этом скриншоте явно видно, что максимальная частота (RAM Max поддержка) — 533МГц. Т.е. в случае с одной планкой — 266МГц.

    Но расстраиваться не стоит. 🙂 2Гб в любом случае много лучше, чем 512Мб, а 800МГц сейчас стоят не дороже, чем 533.

  13. Игорь (28 августа 2009, 09:51)
  14. Ну по крайней мере вопрос с «хапаньем» из подкачки теперь решён. А то бывало тормозило не по детски.:)
    Ну короче не удалось мне вдоволь побаловаться новшеством. С ноутбуком случилось страшное.(матери кровь не проливал но..)К стати в следствие произошедшего при попытке открыть MP3 виндовым MP пишет что «не удалось выполнить операцию из за нехватки памяти».Ну, не издевательство ли?:)А плеер классик открывает нормально. И много чего нехорошего ещё присутствует. Ну это уже относится к проблемам виндовс или безопасности. Может здесь где есть соответствующая тема? Или тут по-оффтопим? Тогда отпшусь по проблеме глобально.

  15. (28 августа 2009, 09:55)
  16. Игорь (30 августа 2009, 04:06)
  17. Ну как говорится раз пошла такая пь…э…разбираловка. 🙂 Сначала итого 1-го эпизода; обьекты (папки, ярлыки и тд) как будто гвоздями прибиты и не перемещались никаким кликом, перестало работать «вставить» контекстного меню (всегда неактивно), в журналах ошибок не кликались эти самые ошибки чтоб посмотреть описание, при заходе в учётные записи пустое окно без выбора чего либо, в диспетчере задач отсутствие себя любимого во вкладке пользователи и вообще потеря прав администратора, частиная или полная хз (сообшение при попытке запуска приложения на диске D), процессов в диспетчере задач вместо +50 осталось 30+, периодические перезагрузки с синим экраном (быстро пролелькивающим, не успеваешь помотреть чего там понаписано), позже удалось выяснить код ошибок
    Код ошибки 10000050, параметр1 8f640cec, параметр2 00000001, параметр3 805b641a, параметр4 00000000.
    Код ошибки 10000050, параметр1 c399ff20, параметр2 00000000, параметр3 bf80dd9b, параметр4 00000000.
    примерно в таком духе, при попытке сканирования на вирусы тоже перезагрузки (собственно с ними и пробовал бороться 3 дня), сообщения о покоцанной файловой системе на С, ну и тд и тп. Главная проблемма была тексты с паролями/логинами изъять. Уже морально был готов к переписыванию в ручную, да вспомнив про диск с windows благополучно воспользовался мастером переноса файлов.(не так плохи мелкомягкие как они есть на самом деле=))) С чего это всё началось уже и не упомню, но точно после того как начал манипуляции с памятью, там ещё помнится было зависание чего-то, скандиск ну и пошло поехало. Пробовал и востановление системы делать- опять ошибка и перезагрузка. (сейчас в паде пишу и после каждого предложения Ctrl+S, потому как регулярно ребутит гадина:(). Всё описанное чёчилось с хоум эдишин, вторая XP(обрезанная которая гейм эдишин) тоже вообще почти не запускалась, жалуясь на покоцанный C. С безопасным режимом тоже толкового ничего не выходило. Помыкавшись я подтянул тяжёлую артиллерию и Acronis True Image Home 11.0 востановил посекторно логический C. Всё вроде стало нормально работать (хотя щас такой сумбур в голове что ничего не могу гарантировать:)) И вторая ось заработала. Обменял память (goodram) думаю мож планка была глючная. Вставил, вроде нормально всё в PC Wizard 2008 даже протестил, чего-то показала как моя старая 4200. Ну да ладно, подключился на DSL да давай закачивать обновки. Образик то акрониса был аж октября 2008, хоть и с почти всеми нужными прогами.Ну и вот я тут сижу напихиваю железного друга…и бац. Опять старая песня. Перезагрузки…мать…давно типа не было. Похожие коды, журнал ошибки приложений уже повреждён. Было зависание чего-то (опять мимо памяти моей:), скандиск почикал там чего-то. Правда в этот раз на диске папки его небыло той где такое 000 в конце.
    Вот я опять вернулся после ребута.:) Какая-то хрень хотела в интернет (он отключен), запретил в комодо. Потом зашёл в него же посмотреть подробнее что это было, кликнул в журнале…окно ошибки и перезагрузка. После сообщение ошибки savedump.exe и теперь там записи этого события нет. Что-то я уж и не знаю что и думать. Мож и вправду вирус какой. Может какой сцука(уже не сдерживаюсь) в MBR прописался? Ну там прописан акронис (востановление при загрузке). Правда запуск его с выбором F11(восстановления) 2-3 раза вчера был, а то и сейчас высвечивает MBR error 2. Мож тут чего и кроется? Короче всё, нет сил. Выкладываю и ложусь спать. Завтра (сегодня уже) снова востановлю аронисом и посмотрю как будет развиваться со старой памятью. ЗЫ К стати и мышку накануне приладил с кнопкой двойного клика…Может тут чего? =)))))) ЗЫЫ Задрало, никак не оторвусь. Опять перегрузило. И опять лез в нет какой-то синхронизатор мелкомягких. Что-то типа этого.ЗЫЫЫ Не мог огнелисом зайти ребутило, плюнул поставил свою оперативку. Вроде какие-то минуты держит.:) Та память такая горячинькая была…хотя ноут ведь.

  18. Игорь (30 августа 2009, 04:09)
  19. Каково я табаню уникальный контент?:) Правда абзацы не поделал…
    Тест глазок получился заодно.:))

  20. (30 августа 2009, 08:33)
  21. Игорь, это уже не похоже на память, особенно, учитывая ее замену.
    Это похоже на:

    1. Вирус. Хорошо бы загрузиться с какого-нибудь Live CD и провериться «Dr.Web CureIt!», благо ему установка не нужна.

    2. Но еще более это похоже на смерь жесткого диска. Проверку опять же лучше запускать с Live CD, но на крайний случай можно и просто виндовую попробовать. И утилиту от производителя HDD поискать.

  22. Игорь (30 августа 2009, 15:49)
  23. 3. И ещё это похоже на полтергейст.:)
    Короче память это, оперативка гудрамовская. Наверное несовместимость какая-то. Сейчас на своей родной Hyundai Electronics, настоящий фирменный кореец, с цивильной проштамповкой работает всё без сбоев уже с утра. Даже с ночи — как установил. И другая система запустилась без проблем- в Perfect World пробежался. Правда повреждения оставшиеся придётся устранять. В первый раз память свою возвращал на гораздо более убитую систему поэтому результата не было видимо.
    Протестировал систему- без сбоев. Остался журнал событий повреж-
    дённый. В Comodo Firewall тоже всё в норме и в его журнале. Доус-
    тановил комп некоторые обновления и после этого появилось раз-
    дражение. msfeedssync.exe ломится в сеть. Firefox использую IE
    вообще не запущен. Какого фига оно лезет ленты новостей проверять
    или что там. Ну а насчёт HDD, у меня здоровье оного 88%, но до кризиса работал нормально на мой взгляд. Может ему ставало плохо
    когда новую память прилаживал? В общем восстановлю каким образом
    ОС, обновлю всю остальную начинку и образ диска в акронисе. Потом мож ещё повтыкаю ентот гудрам, если до того не сдам назад. И надо думать какую память искать или вернее найти хоть что нибудь работающее под мою машину. В той точке только такая в наличии на ноутбуки. А CureIt знаем и пользуем, с тех пор как буквально пол-месяца назадt подхватил «нечто» (Neshta), замахал- ся лечить на двух компах. Сейчас проверял CureIt-ом- всё чисто.
    Правда он всегда ругается на Giljabi.exe из моей lg_swupdate директории. Но думаю тут нормально всё.:)

    ЗЫ Интересно в памяти не может быть вируса уже затаренного до меня? (типа от производителя) :))

  24. Игорь (1 сентября 2009, 19:30)
  25. Хех, в суматохе не была замечена такая деталь как объём памяти
    в одном слоте. Сейчас поставил 1Гб кингстон и пока всё ок. И думаю
    что и дальше будет ок. Теперь стало М1 и М2 а не так как на «PC Wizard 2008 физическая память_2Gb» скриншоте. С ещё одним «М1» Да
    и припоминаю что у меня поддерживат 2Гб, 1Гбх2. Т.е. в двух слотах.
    Осталось при случае поставить ещё одну в «дно» и вуаля- двухканаль-
    ная. Ну а потрапившие сюда по сабжу теперь будут знать какие ужасы
    могут последовать после казалось бы рутинной операции.

  26. Сергей (18 ноября 2009, 20:50)
  27. Здравствуйте, Владимир! Буду рад услышать ваш совет.
    Стоит планка памяти DDR1 3200, 512 Мб. Что лучше, установить еще одну планку с такими же характеристиками (DDR1 3200, 512 Мб) или планку на 1 Гб (чтобы получилось 1,5 Гб)? Кстати материнская плата (Foxconn P4M800P7MA-RS2) имеет 2 слота для DDR1 и два слота для DDR2. Имеет ли смысл устанавливать DDR2?

  28. (18 ноября 2009, 20:57)
  29. Сергей, лучше установить еще 1Гб и получить в итоге 1.5Гб.
    Разницы между DDR1 и DDR2 Вы скорее всего не заметите, а устанавливать одновременно оба типа памяти в большинстве случаев нельзя.

  30. Сергей (19 ноября 2009, 21:14)
  31. Спасибо. А какова вероятность, что новая планка 1Гб сработается со старой 512Мб? Я слышал, что лучше срабатываются друг с другом одинаковые по параметрам планки, плюс к тому же двойной канал.

  32. Игорь (24 ноября 2009, 16:58)
  33. Им абсолютно ничего не мешает сработаться если мать поддерживает такое колличество и в таких слотах. Память нужно наращивать под работающие приложения. Существенной разницы не будет между 1,5 и 2 Гб если при работе самого ёмкого расходуется например 1Гб. Разница будет если стоит 1Гб а при работающей проге берётся 1,5 Гб, т.е. «хапается» из подкачки и соответственно тормозит из за доступа к HDD. Смотреть: диспетчер задач->быстродействие->пик. Сколько при вашем работающем любимом тяжёлом он составляет сколько оперативки и надо.=)Двухканалка даёт прирост менее 10% если не путаю, что не суть как важно при вышеописанном. Ну это как говорится моё имхо, хотя рулит на нуболевелах юзеров.=)

  34. Сергей (25 февраля 2010, 00:57)
  35. 2. А вот тут сложнее. Есть вероятность, что производитель перестраховался. Или во время разработки материнской платы и написания документации просто не было возможности установить больше 4Гб памяти. Например, были модули только по 1Гб. И тогда может заработать и больше 4Гб.
    Но, может быть, у производителя были какие-то технические проблемы, из-за которых объем и был ограничен.
    Либо ищите отзывы о Вашей мат. плате по всему интернету, либо пробуйте. 🙂
  36. Артём (15 сентября 2010, 12:51)
  37. мат. плата моя как раз из той серии, что упоминается в этой статье Asus soket 775 P5LD2 SE. спасибо, Владимир)попробую.

  38. Антон (31 января 2013, 14:05)
  39. Здравствуйте, вопрос следующего характера:
    Материнка ASUS P5LD2 в ее описание написано что максимально можно установить память оперативную с частотой 667МГц, но я купил 2 планки по 2ГБ и частотой 800МГц, установил работа компьютера мне очень сильно понравилась т.к. раньше стоял 1Гб ОП.
    Но после этого стало пропадать место на жестком диске, а именно на диске «С» (на нем стоит виндовс ХР)
    Может ли это быть из-за ограничения Материнской платы?
    Или же я поймал какойто вирус? т.к. на данный момент касперский без лицензии ну тобишь не оплачен=не работает.

  40. (31 января 2013, 14:09)
  41. Антон, много места пропало?
    У Windows есть файл подкачки, он иногда может зависеть от размера оперативной памяти.
    Есть режим сна, когда все содержимое оперативной памяти сохраняется на жесткий диск — и система резервирует объем равный объему памяти всегда. Можно его отключить и место вернется.

    А может быть и просто какое-то совпадение.

  42. Vas! (19 мая 2013, 19:34)
  43. Доброго! Не подскажете ли: матплата Асус поддерживает память до 800 мгц, сейчас стоит 2 по 512 на 533 скорости (pc-4300). Можно ли расширить доставив 1 или 2 гб но 800й памяти т.к. зс-4300 купить негде. Заведется ли такая комбинация из 2х512мб на 533 и 1 или 2 гб на 800??? Спасибо.

  44. Opana (23 октября 2015, 15:43)
  45. Здравствуйте, у меня на мамке стоят слоты для DDR3 и DDR4, можно ли воткнуть к 8Gb*2 DDR4@3200MHz ещё 8Gb*2 DDR3@2133MHz

  46. Tony (27 марта 2017, 16:29)
  47. У меня вопрос, а будет ли это работать в ноутбуке Toshiba Satelit A 215? Там точно частота будет 667 герц у 800 герцовой планки, и есть ли риск что не заведётся вовсе? И вообще, туда можно впихнуть больше 4 гигов ОЗУ? Или там 4, — максимум?

  48. Гость (2 июля 2018, 10:22)
  49. Ха, P5RD2-VM не стартует с 800-й памятью (официально как раз потолок 667). Но у неё найден костыль — если воткнуть вместе одну 667, а другую 800, то всё работает.

  50. Вадим (10 октября 2018, 12:08)
  51. asrock 945gcm-s не поддерживает память 800 Мгц

Теоретические основы и первые результаты низкоуровневого тестирования

DDR2 — новый стандарт памяти, утвержденный (Joint Electronic Device Engineering Council), в состав которого входят многие производители микросхем и модулей памяти, а также чипсетов. Ранние версии стандарта были опубликованы уже в марте 2003 года, окончательно он был утвержден лишь в январе 2004 года и получил наименование DDR2 SDRAM SPECIFICATION, JESD79-2, ревизия A (). DDR2 основывается на хорошо известной и зарекомендовавшей себя технологии DDR (Double Data Rate). Можно даже сказать так: «DDR2 начинается там, где заканчивается DDR». Другими словами, первые DDR2 будут работать на частотах, являющихся пределом для текущего поколения памяти DDR-400 (стандарт PC3200, тактовая частота 200 МГц), а ее дальнейшие варианты существенно его превзойдут. Первым поколением памяти DDR2, уже производимым в настоящее время такими вендорами, как , и , являются ее разновидности DDR2-400 и DDR2-533, работающие на частотах 200 МГц и 266 МГц, соответственно. Далее ожидается появление нового поколения модулей DDR2-667 и DDR2-800, хотя отмечается, что они вообще вряд ли появятся и, тем более, получат широкое распространение даже к концу этого года.

Справедливости ради стоит заметить, что память типа DDR2, как таковая, появилась уже довольно давно — конечно же, имеется в виду память на видеокартах. Тем не менее, эта разновидность DDR2 (называемая GDDR2), на самом деле, является особым типом памяти, разработанным специально для рынка видеокарт и слегка отличающимся от «десктопного» варианта DDR2, которому и посвящен настоящий обзор. Общая информация

Итак, «десктопная» DDR2-SDRAM рассматривается как эволюционная замена текущего поколения памяти — DDR. Принцип ее функционирования абсолютно тот же — передача данных (на уровне модуля памяти) осуществляется по 64-разрядной шине по обеим частям синхросигнала (восходящему — «фронту», и нисходящему — «срезу»), что обеспечивает удвоенную эффективную скорость передачи данных по отношению к ее частоте. Разумеется, при этом в DDR2 реализован ряд нововведений, которые позволяют осуществить скачок к гораздо более высоким частотам (а, следовательно, большей пропускной способности) и большим емкостям массивов микросхем, с одной стороны, и уменьшенному энергопотреблению модулей, - с другой. За счет чего это достигается, мы увидим позже, а пока обратимся к «макроскопическим» фактам. Модули памяти типа DDR2 производятся в новом форм-факторе, в виде 240-контактных модулей DIMM, электрически не совместимых со слотами для модулей памяти типа DDR (по количеству выводов, расстоянию между выводами и цоколевке модулей). Таким образом, стандарт DDR2 не предусматривает обратной совместимости с DDR.

В представленной ниже таблице приведены утвержденные соглашения о наименованиях и спецификации первых трех стандартов DDR2. Легко заметить, что DDR2-400 характеризуется такой же пропускной способностью, как и ныне существующий тип памяти DDR-400.

Первые модули памяти DDR2 будут поставляться в вариантах 256 МБ, 512 МБ и 1 ГБ. Тем не менее, стандарт предусматривает возможность построения модулей существенно большей емкости — вплоть до 4 ГБ, которые, однако, являются специализированными модулями (не совместимыми с десктопными вариантами, по крайней мере, на данный момент). В дальнейшем ожидается появление модулей, обладающих еще большей емкостью.

Чипы DDR2 будут изготавливаться с использованием упаковки типа FBGA (Fine Ball Grid Array), более компактной, чем традиционный вариант TSOP-II, позволяющей достичь больших емкостей микросхем при меньшем размере и улучшенных электрических и термических характеристиках. Такой метод упаковки уже используется некоторыми производителями DDR в качестве варианта, но является рекомендованным к использованию с точки зрения стандарта JEDEC.

Потребляемое модулями DDR2 напряжение, согласно стандарту — 1.8 V, что значительно меньше по сравнению с напряжением питания устройств DDR (2.5 V). Вполне ожидаемым (хотя и не столь очевидным) следствием этого факта является уменьшение энергопотребления, что важно для производителей, как ноутбуков, так и крупных рабочих станций и серверов, где проблема рассеиваемой модулями памяти мощности занимает далеко не последнее место. DDR2 изнутри

Стандарт DDR2 включает в себя несколько важных изменений спецификации DDR, связанных с передачей данных, которые позволяют достигать более высоких частот при более низкой потребляемой мощности. Как именно достигается снижение рассеиваемой мощности при одновременном увеличении скорости модулей, мы рассмотрим прямо сейчас.

Выборка данных

Главным изменением в DDR2 является возможность выборки сразу 4 бит данных за такт (4n-prefetch), в противоположность 2-битной выборке (2n-prefetch), реализованной в DDR. По существу, это означает, что на каждом такте шины памяти DDR2 осуществляет пересылку 4 бит информации из логических (внутренних) банков микросхемы памяти в буферы ввода-вывода по одной линии интерфейса данных, тогда как обычная DDR способна переслать лишь 2 бита за такт на линию. Довольно закономерно возникает вопрос — если это так, то почему же тогда эффективная пропускная способность DDR2-400 оказывается такой же, как и у обычной DDR-400 (3.2 ГБ/с), а не удвоенной?

Для ответа на этот вопрос сначала рассмотрим, как работает обычная память типа DDR-400. В этом случае, как ядро памяти, так и буферы ввода-вывода функционируют на частоте 200 МГц, а «эффективная» частота внешней шины данных, благодаря технологии DDR, равна 400 МГц. По правилу 2n-prefetch, на каждом такте памяти (200 МГц) по каждой линии интерфейса данных в буфер ввода-вывода поступает 2 бита информации. Задачей этого буфера является мультиплексирование/демультиплексирование (MUX/DEMUX) потока данных — по-простому, «перегонка» узкого высокоскоростного потока в широкий низкоскоростной, и наоборот. Поскольку в микросхеме памяти типа DDR SDRAM логические банки имеют ширину шины данных, соединяющую их и усилитель уровня, в два раза шире, чем от защелок на чтение до внешнего интерфейса, буфер данных включает в себя мультиплексор типа 2-1. В общем случае, поскольку микросхемы памяти, в отличие от модулей, могут иметь разную ширину шины данных — обычно это x4/x8/x16/x32, применение такой схемы MUX/DEMUX (2-1), реализованной в DDR, означает, что внутренний поток данных шириной X и частотой передачи Y от массива преобразуется во внешний поток шириной X/2 и частотой 2Y. Это называется балансом по пиковой пропускной способности.

Рассмотрим теперь схему функционирования устройства микросхемы памяти типа DDR2 SDRAM, равночастотной и «равноширокой» (т.е. одинаковой ширины шины данных) относительно микросхемы DDR модуля памяти DDR-400. Прежде всего, отметим, что ширина внешней шины данных осталась абсолютно такой же — 1 бит/линию, как и ее эффективная частота (в рассматриваемом примере — 400 МГц). Собственно, этого уже достаточно для ответа на поставленный выше вопрос — почему теоретическая ПСП равночастотных модулей памяти типа DDR2 и DDR равны между собой. Далее, очевидно, что использование мультиплексора типа 2-1, применяемого в DDR SDRAM, в случае DDR2 SDRAM, осуществляющей выборку данных по правилу 4n-prefetch, уже не подходит. Вместо этого требуется введение более сложной схемы с дополнительной ступенью преобразования — мультиплексора типа 4-1. Это означает, что выход ядра стал шире в четыре раза внешнего интерфейса микросхемы и во столько же раз ниже по частоте функционирования. То есть, по аналогии с рассмотренным выше примером, в общем случае схема MUX/DEMUX 4-1 осуществляет преобразование внутреннего потока данных шириной X и частотой передачи Y от массива во внешний поток шириной X/4 и частотой 4Y.

Поскольку в этом случае ядро микросхем памяти синхронизируется на частоте, вдвое меньшей по отношению к внешней (100 МГц), тогда как в DDR синхронизация внутреннего и внешнего потока данных происходят на одной частоте (200 МГц), среди преимуществ такого подхода отмечается увеличение процента выхода годных чипов и снижение энергопотребления модулей. Кстати, это также позволяет объяснить, почему стандарт DDR2 предполагает существование модулей памяти с «эффективной» частотой 800 МГц — что вдвое выше, чем у текущего поколения памяти типа DDR. Ведь именно такой «эффективной» частоты DDR2 можно достичь уже сейчас, имея чипы памяти DDR-400, работающие на собственной частоте 200 МГц, если осуществлять выборку данных по правилу 4n-prefetch по схеме, рассмотренной выше.

Таким образом, DDR2 означает отказ от экстенсивного пути развития чипов памяти — в смысле, простого дальнейшего увеличения их частоты, которое существенно затрудняет производство стабильно работающих модулей памяти в большом количестве. На смену ему выдвигается интенсивный путь развития, связанный с расширением внутренней шины данных (что является обязательным и неизбежным решением при использовании более сложного мультиплексирования). Рискнем предположить, что в будущем вполне можно ожидать появление памяти типа «DDR4», осуществляющей выборку уже не 4-х, а сразу 8 бит данных из чипов памяти (по правилу 8n-prefetch, с использованием мультиплексора типа 8-1), и работающих на частоте уже не в 2, а в 4 раза меньшей по отношению к частоте буфера ввода-вывода:). Собственно, ничего нового в таком подходе нет — подобное уже встречалось в микросхемах памяти типа Rambus DRAM . Тем не менее, нетрудно догадаться, что оборотной стороной такого пути развития является усложнение устройства MUX/DEMUX буфера ввода-вывода, который в случае DDR2 должен осуществлять сериализацию четырех бит данных, считываемых параллельно. Прежде всего, это должно сказаться на такой немаловажной характеристике памяти, как ее латентность, что мы и рассмотрим ниже.

Внутричиповое терминирование

Стандарт DDR2 включает в себя и ряд других усовершенствований, улучшающих различные характеристики нового типа памяти, в том числе — электрические. Одним из таких новшеств является внутричиповое терминирование сигнала. Суть его заключается в том, что для устранения излишнего электрического шума (вследствие отражения сигнала от конца линии) на шине памяти для нагрузки линии используются резисторы не на материнской плате (как это было с предыдущими поколениями памяти), а внутри самих чипов. Эти резисторы деактивируются, когда чип находится в работе и, наоборот, активируются, как только микросхема входит в состояние ожидания. Поскольку гашение сигнала теперь осуществляется намного ближе к его источнику, это позволяет устранить электрические помехи внутри чипа памяти при передаче данных.

Кстати, в связи с технологией внутричипового терминирования нельзя не остановиться на таком моменте, как… тепловыделение модуля, на активное снижение которого, в общем-то, в первую очередь и рассчитан новый стандарт DDR2. Действительно, такая схема терминирования сигналов приводит к возникновению значительных статических токов внутри чипов памяти, что ведет к их разогреву. Что ж, это действительно так, хотя заметим, что мощность, потребляемая подсистемой памяти в целом , от этого вовсе не должна расти (просто тепло теперь рассеивается в другом месте). Проблема здесь немного в другом — а именно, в возможности повышения частоты функционирования таких устройств. Весьма вероятно, что именно поэтому первым поколением памяти DDR2 являются модули вовсе не DDR2-800, а лишь DDR2-400 и DDR2-533, для которых тепловыделение внутри чипов пока что остается на приемлемом уровне.

Добавочная задержка

Добавочная задержка (также известная как «отложенная выдача CAS») — еще одно усовершенствование, введенное в стандарт DDR2, которое призвано минимизировать простои планировщика команд при передаче данных из памяти/в память. Чтобы проиллюстрировать это (на примере чтения), рассмотрим для начала чтение данных с чередованием банков (Bank Interleave) из устройства типа DDR2 с добавочной задержкой, равной нулю, что эквивалентно чтению из обычной памяти типа DDR.

На первом этапе происходит открывание банка с помощью команды ACTIVATE вместе с подачей первой составляющей адреса (адреса строки), которая выбирает и активирует необходимый банк и строку в его массиве. В течение следующего цикла информация передается на внутреннюю шину данных и направляется на усилитель уровня. Когда усиленный уровень сигнала достигает необходимого значения (по истечении времени, именуемого задержкой между определением адреса строки и столбца, t RCD (RAS-to-CAS Delay) на исполнение может подаваться команда чтения с автоподзарядкой (READ with Auto-Precharge, RD_AP) совместно с адресом столбца, чтобы выбрать точный адрес данных, которые надо считать с усилителя уровня. После выставления команды чтения выполняется задержка строба выбора столбца — t CL (задержка сигнала CAS, CAS Latency), в течение которой данные, выбранные из усилителя уровня, синхронизируются и передаются на внешние выводы микросхемы. При этом может возникнуть ситуация, когда следующая команда (ACTIVATE) не может быть отправлена на исполнение, поскольку в данный момент времени еще не закончилось исполнение других команд. Так, в рассматриваемом примере, активация 2-го банка должна быть отложена на один такт, поскольку в этот момент уже исполняется команда чтения с автоподзарядкой (RD_AP) из банка 0. В конечном счете, это приводит к разрыву в последовательности выдачи данных по внешней шине, что снижает реальную пропускную способность памяти.

Для устранения подобной ситуации и увеличения эффективности работы планировщика команд в DDR2 вводится понятие добавочной (дополнительной) задержки, t AL . При ненулевом значении t AL устройство памяти отслеживает команды READ (RD_AP) и WRITE (WR_AP), но откладывает их исполнение на время, равное величине добавочной задержки. Различия в поведении микросхемы памяти типа DDR2 с двумя различными величинами t AL приведены на рисунке.

Верхний рисунок описывает режим функционирования микросхемы DDR2 при t AL = 0, что эквивалентно функционированию устройства микросхемы памяти типа DDR; нижний соответствует случаю t AL = t RCD - 1, стандартному для DDR2. При такой конфигурации, как видно из рисунка, команды ACTIVATE и READ могут поступать на исполнение одна за другой. Фактическая реализация команды READ будет отложена на величину добавочной задержки, т.е. реально она будет исполнена в тот же момент, как и на диаграмме сверху.

На следующем рисунке приведен пример считывания данных из микросхемы DDR2 в предположении t RCD = 4 такта, что соответствует t AL = 3 тактам. В этом случае, благодаря введению дополнительной задержки, команды ACTIVATE/RD_AP могут исполняться подряд, в свою очередь, позволяя выдавать данные непрерывным образом и максимизировать реальную пропускную способность памяти.

Задержка выдачи CAS

Как мы видели выше, DDR2, с точки зрения частоты внешней шины, работает на более высоких скоростях, чем DDR SDRAM. В то же время, поскольку новый стандарт не предполагает каких-либо существенных изменений в технологии производства самих чипов, статические задержки на уровне устройства DRAM должны оставаться более-менее постоянными. Типичная величина собственной задержки устройств DRAM типа DDR — 15 нс. Для DDR-266 (со временем цикла 7.5 нс.) это эквивалентно двум тактам, а для DDR2-533 (время цикла — 3.75 нс.) — четырем.

По мере дальнейшего увеличения частот памяти необходимо множить количество поддерживаемых значений задержки выдачи сигнала CAS (в сторону бо льших значений). Определенные стандартом DDR2 величины задержек CAS представлены в таблице. Они находятся в интервале целых чисел от 3 до 5 тактов; использование дробных задержек (кратных 0.5) в новом стандарте не допускается.

Задержки устройства DRAM выражаются размерностью цикла (t CK), т.е. равны произведению времени цикла на выбранное значение задержки CAS (t CL). Типичные значения задержек для устройств типа DDR2 попадают в интервал 12-20 нс., на основании которого и выбирается используемое значение задержки CAS. Использование бо льших величин задержки нецелесообразно из соображений производительности подсистемы памяти, а меньших — ввиду необходимости стабильной работы устройства памяти.

Задержка записи

Стандарт DDR2 также вносит изменения в спецификацию задержки записи (команды WRITE). Различия в поведении команды записи в устройствах DDR и DDR2 представлены на рисунке.

DDR SDRAM имеет задержку записи, равную 1 такту. Это означает, что устройство DRAM приступает к «захвату» информации по шине данных в среднем через один такт после поступления команды WRITE. Тем не менее, учитывая возросшую скорость устройств DDR2, этот промежуток времени оказывается слишком малым для того, чтобы устройство DRAM (а именно, его буфер ввода-вывода) могло успешно подготовиться к «захвату» данных. В связи с этим, стандарт DDR2 определяет задержку записи как задержку выдачи CAS за вычетом 1 такта (t WL = t CL - 1). Отмечается, что привязка задержки WRITE к задержке CAS не только позволяет достичь более высоких частот, но и упрощает синхронизацию команд чтения и записи (настройку таймингов Read-to-Write).

Восстановление после записи

Процедура записи в память типа SDRAM аналогична операции чтения с разницей в дополнительном интервале t WR , характеризующем период восстановления интерфейса после проведения операции (обычно это двухтактная задержка между окончанием выдачи данных на шину и инициированием нового цикла). Этот временной интервал, измеряемый от момента окончания операции записи до момента вхождения в стадию регенерации (Auto Precharge), обеспечивает восстановление интерфейса после проведения операции записи и гарантирует корректность ее выполнения. Отметим, что стандарт DDR2 не вносит изменений в спецификацию периода восстановления после записи.

Таким образом, задержки устройств типа DDR2 в целом можно считать одной из немногих характеристик, по которой новый стандарт проигрывает спецификации DDR. В связи с чем совершенно очевидно, что использование равночастотной DDR2 вряд ли будет иметь какие-либо преимущества в плане скорости по отношению к DDR. Как это обстоит на самом деле — как всегда, покажут результаты соответствующих тестов. Результаты тестирования в RightMark Memory Analyzer

Что ж, самое время теперь перейти к результатам тестирования, полученным в тестовом пакете версии 3.1. Напомним, что главными преимуществами этого теста по отношению к другим доступным тестам памяти является широкая функциональность, открытость методики (тест доступен всем желающим для ознакомления в виде ) и тщательно проработанная документация .

Конфигурации тестовых стендов и ПО

Тестовый стенд №1

  • Процессор: Intel Pentium 4 3.4 ГГц (ядро Prescott, Socket 478, FSB 800/HT, 1 МБ L2) на частоте 2.8 ГГц
  • Материнская плата: ASUS P4C800 Deluxe на чипсете Intel 875P
  • Память: 2x512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги 2.5-3-3-6)

Тестовый стенд №2

  • Процессор: Intel Pentium 4 3.4 ГГц (ядро Prescott, Socket 775, FSB 800/HT, 1 МБ L2) на частоте 2.8 ГГц
  • Материнская плата: Intel D915PCY на чипсете Intel 915
  • Память: 2x512 МБ PC2-4300 DDR2 SDRAM DIMM Samsung (тайминги 4-4-4-8)

Программное обеспечение

  • Windows XP Professional SP1
  • Intel Chipset Installation Utility 5.0.2.1003

Максимальная реальная пропускная способность памяти

Измерение максимальной реальной пропускной способности памяти проводилось с помощью подтеста Memory Bandwidth , пресеты Maximal RAM Bandwidth, Software Prefetch, MMX/SSE/SSE2 . Как говорит само название выбранных пресетов, в этой серии измерений используется стандартный метод оптимизации операций чтения из памяти — Software Prefetch, суть которого заключается в предварительной выборке данных, которые будут востребованы позже из оперативной памяти в L2 кэш процессора. Для оптимизации записи в память используется метод прямого сохранения данных (Non-Temporal Store), позволяющий избежать «засорения» кэша. Результаты с использованием регистров MMX, SSE и SSE2 оказались практически идентичными — для примера, ниже приведена картина, полученная на платформе Prescott/DDR2 с использованием SSE2.


Prescott/DDR2, максимальная реальная ПСП

Отметим, что существенных качественных отличий между DDR и DDR2 на равночастотных Prescott в этом тесте не наблюдается. Но более интересно то, что и количественные характеристики ПСП DDR-400 и DDR2-533 оказываются весьма близки! (см. таблицу). И это — несмотря на то, что память типа DDR2-533 имеет максимальную теоретическую ПСП 8.6 ГБ/с (в двухканальном режиме). Собственно, ничего удивительного в полученном результате мы не видим — ведь шина процессора — это по-прежнему 800 МГц Quad-Pumped Bus, а ее пропускная способность — 6.4 ГБ/с, поэтому именно она и является лимитирующим фактором.

Что касается эффективности операций записи, по отношению к чтению — легко увидеть, что она осталась такой же. Впрочем, это вновь выглядит вполне естественно, поскольку в данном случае предел ПСП на запись (2/3 от ПСП на чтение) явно задается микроархитектурными особенностями процессора Prescott.

Латентность памяти

Прежде всего, остановимся несколько подробнее на том, как и почему мы измеряли «истинную» латентность памяти, поскольку ее измерение на платформах Pentium 4 — на самом деле, далеко нетривиальная задача. А связано это с тем, что процессоры этого семейства, в частности, новое ядро Prescott, характеризуются наличием довольно «продвинутого» асинхронного аппаратного префетчера данных, весьма затрудняющего объективные измерения указанной характеристики подсистемы памяти. Очевидно, что использование методов последовательного обхода памяти (прямого либо обратного) для измерения ее латентности в данном случае совершенно не годятся — алгоритм Hardware Prefetch в этом случае работает с максимальной эффективностью, «маскируя» латентности. Использование случайных режимов обхода гораздо более оправдано, однако, истинно случайный обход памяти имеет другой существенный недостаток. Дело в том, что такое измерение выполняется в условиях практически 100% промаха D-TLB, а это вносит существенные дополнительные задержки, о чем мы уже писали . Поэтому единственным возможным вариантом (среди реализованных в RMMA методов) является псевдослучайный режим обхода памяти, при котором загрузка каждой последующей страницы осуществляется линейно (сводя на нет промахи D-TLB), тогда как обход в пределах самой страницы памяти является истинно случайным.

Тем не менее, результаты наших прошлых измерений показали, что даже такая методика измерений довольно сильно занижает значения латентности. Мы считаем, что это связано с еще одной особенностью процессоров Pentium 4, а именно, возможностью «захвата» сразу двух 64-байтных строк из памяти в L2-кэш при каждом обращении к ней. Для демонстрации этого явления на представленном ниже рисунке приведены кривые зависимости латентности двух последовательных обращений к одной и той же строке памяти от смещения второго элемента строки относительно первого, полученные на платформе Prescott/DDR2 с помощью теста D-Cache Arrival , пресет L2 D-Cache Line Size Determination .


Prescott/DDR2, прибытие данных по шине L2-RAM

Из них видно (кривая случайного обхода является наиболее показательной), что доступ ко второму элементу строки не сопровождается какими-либо дополнительными задержками до 60 байт включительно (что отвечает истинному размеру строки L2-кэша, 64 байта). Область 64-124 байт соответствует чтению данных из следующей строки памяти. Поскольку величины латентности в этой области увеличиваются лишь незначительно, это означает, что последующая строка памяти действительно «подкачивается» в L2-кэш процессора сразу вслед за запрашиваемой. Какой же можно сделать из всего этого практический вывод? Самый прямой: для того, чтобы «обмануть» эту особенность алгоритма Hardware Prefetch, работающую во всех случаях обхода памяти, достаточно просто обходить цепочку с шагом, равным так называемой «эффективной» длине строки L2-кэша, которая в нашем случае составляет 128 байт.

Итак, перейдем непосредственно к результатам измерений латентности. Для наглядности, приведем здесь графики разгрузки шины L2-RAM, полученные на платформе Prescott/DDR2.


Prescott/DDR2, латентность памяти, длина строки 64 байта


Prescott/DDR2, латентность памяти, длина строки 128 байт

Как и в случае тестов реальной ПСП, кривые латентности на другой платформе — Prescott/DDR — на качественном уровне выглядят абсолютно так же. Несколько отличаются лишь количественные характеристики. Самое время обратиться к ним.

* латентность в условиях отсутствия разгрузки шины L2-RAM

Нетрудно заметить, что латентность DDR2-533 оказалась выше, чем у DDR-400. Впрочем, ничего сверхъестественного здесь нет — согласно представленным выше теоретическим основам нового стандарта памяти DDR2, именно так оно и должно быть.

Различие в латентности между DDR и DDR2 почти незаметно при стандартном 64-байтном обходе памяти (3 нс. в пользу DDR), когда активно работает аппаратный префетчер, однако, при «двухстрочном» (128-байтном) обходе цепочки оно становится гораздо более заметным. А именно, минимум латентности DDR2 (55.0 нс) равен максимуму латентности DDR; если же сравнивать минимальные и максимальные латентности между собой, различие составляет примерно 7-9 нс (15-16%) в пользу DDR. В то же время, надо сказать, несколько удивляют практически равные значения «средней» латентности, полученные в условиях отсутствия разгрузки шины L2-RAM — причем как в случае 64-байтного обхода (с префетчем данных), так и 128-байтного (без такового). Заключение

Главный вывод, который напрашивается на основании полученных нами результатов первого сравнительного тестирования памяти DDR и DDR2, в общем виде можно сформулировать так: «время DDR2 еще не настало». Основная причина заключается в том, что пока бессмысленно бороться за увеличение теоретической ПСП путем наращивания частоты внешней шины памяти. Ведь шина текущего поколения процессоров по-прежнему функционирует на частоте 800 МГц, что ограничивает реальную пропускную способность подсистемы памяти на уровне 6.4 ГБ/с. А это значит, что в настоящее время нет смысла устанавливать модули памяти, обладающие большей теоретической ПСП, поскольку ныне существующая и широко применяемая память типа DDR-400 в двухканальном режиме полностью себя оправдывает, да и вдобавок имеет меньшую латентность. Кстати, о последней — увеличение частоты внешней шины памяти неизбежно связано с необходимостью введения дополнительных задержек, что, собственно, и подтверждают результаты наших тестов. Таким образом, можно считать, что использование DDR2 оправдает себя, как минимум, не ранее того момента, когда появятся первые процессоры с частотой шины 1066 МГц и выше, что позволит преодолеть ограничение, накладываемое скоростью шины процессора на реальную пропускную способность подсистемы памяти в целом.

Немецкая компания Qimonda - один из крупнейших производителей чипов памяти, имеет на сегодняшний день, пожалуй, самую широкую линейку этого типа продукции, включая и память для мобильных устройств, и весь спектр оперативной памяти для компьютеров, и видеопамять. Последняя, кстати, - вплоть до GDDR5, причем в официальном списке значатся уже две модели таких чипов - емкостью 512 и 1024 мегабита, а в графе готовности к поставкам стоит характерное «под заказ», и мы, конечно, знаем, для чего в настоящее время используются такие чипы.

Однако конечной продукцией, которая могла бы заинтересовать не только отраслевых потребителей, но и широкие пользовательские массы, являются не чипы памяти, а модули, процесс изготовления которых гораздо проще с технической точки зрения, но, тем не менее, не лишен своих особенностей. Именно поэтому под маркой производителей чипов (это равно касается не только Qimonda, но и Samsung, и Hynix), как правило, продаются лишь непритязательные внешне изделия, способные работать на штатных частотах, причем стабильно и надежно, но представляющие крайне ограниченный интерес в качестве объекта исследования. Мы, однако, решили познакомиться с именно такой парой модулей от Qimonda суммарным объемом 8 ГБ, и, собственно, выяснить: насколько сильно повлияет на скоростные характеристики увеличение плотности микросхем в сочетании с двухбанковой организацией модуля.

Рассуждать на тему: нужен ли кому-то, и зачем столь большой объем памяти, в рамках этой статьи мы не будем. Но если не касаться профессиональных запросов, для которых вполне может быть необходим и больший объем, а ограничиться исключительно впечатлениями «простого пользователя», не интересующегося даже результатами тестов, а лишь собственными ощущениями. То в таком случае, разительно бросающимся в глаза отличием, по сравнению с 4-гигабайтным объемом, является значительно сокращающееся время переключения между приложениями. Например, переключение из любой современной игры в интернет-браузер вместо десятков секунд занимает всего несколько секунд. Это, как минимум, приятно, а насколько необходимо, и стоит ли за это каким-либо образом платить (сами модули дороже, имеют менее высокие характеристики в разгоне по сравнению с распространенными модулями меньшего объема, также необходима установка 64-битной ОС) - решать пользователю. Информация о производителе модуля

Производитель модуля: Qimonda AG
Производитель микросхем модуля: Qimonda AG
Сайт производителя модуля: Внешний вид модуля

Part Number модуля

Руководство по расшифровке Part Number модулей памяти имеется в на сайте, где также перечислено большинство выпускаемых на данный момент модулей и описание характеристик. Впрочем, именно таких модулей, какие оказались в нашем распоряжении, в списке не оказалось (есть такие же 4-гигабайтные с поддержкой ECC, тогда как наши модули коррекцию ошибок не поддерживают).

Модули объемом 4 ГБ основаны на 16 микросхемах в BGA-упаковке в конфигурации 512M x 64. Производитель гарантирует стабильную работу модулей в режиме DDR2-800 при таймингах 5-5-5 (значение RAS в описании не упомянуто, а по SPD равно 18) и питающем напряжении 1,8 В, этот режим и выбран в микросхеме SPD в качестве режима по умолчанию. Продаются модули в OEM-варианте поставки, соответственно, никакого отбора и объединения в 2-канальные комплекты производитель не предлагает. Данные микросхемы SPD модуля

Описание общего стандарта SPD:

Описание специфического стандарта SPD для DDR2:

Параметр Байт Значение Расшифровка
Фундаментальный тип памяти 2 08h DDR2 SDRAM
Общее количество адресных линий строки модуля 3 0Fh 15 (RA0-RA14)
Общее количество адресных линий столбца модуля 4 0Ah 10 (CA0-CA9)
Общее количество физических банков модуля памяти 5 61h 2 физических банка
Внешняя шина данных модуля памяти 6 40h 64 бит
Уровень питающего напряжения 8 05h SSTL 1.8V
Минимальная длительность периода синхросигнала (t CK) при максимальной задержке CAS# (CL X) 9 25h 2.50 нс (400 МГц)
Тип конфигурации модуля 11 00h Non-ECC
Тип и способ регенерации данных 12 82h Очевидно, «имелось в виду» 82h, что соответствует значению 7.8125 мс - 0.5x сокращенная саморегенерация
Ширина внешнего интерфейса шины данных (тип организации) используемых микросхем памяти 13 08h x8
Ширина внешнего интерфейса шины данных (тип организации) используемых микросхем памяти ECC-модуля 14 00h Не определено
Длительность передаваемых пакетов (BL) 16 0Ch BL = 4, 8
Количество логических банков каждой микросхемы в модуле 17 08h 8
Поддерживаемые длительности задержки CAS# (CL) 18 70h CL = 6, 5, 4
Минимальная длительность периода синхросигнала (t CK) при уменьшенной задержке CAS# (CL X-1) 23 25h 2,5 нс (400 МГц)
Минимальная длительность периода синхросигнала (t CK) при уменьшенной задержке CAS# (CL X-2) 25 3Dh 3.75 нс (266.7 МГц)
Минимальное время подзарядки данных в строке (t RP) 27 32h 12.5 нс
5, CL = 6
5, CL = 5
3.33, CL = 4
Минимальная задержка между активизацией соседних строк (t RRD) 28 1Eh 7.5 нс
3, CL = 6
3, CL = 5
2 CL = 4
Минимальная задержка между RAS# и CAS# (t RCD) 29 32h 12.5 нс
5, CL = 6
5, CL = 5
3.33, CL = 4
Минимальная длительность импульса сигнала RAS# (t RAS) 30 2Dh 45.0 нс
18, CL = 6
18, CL = 5
12, CL = 4
Емкость одного физического банка модуля памяти 31 02h 2048 МБ
Период восстановления после записи (t WR) 36 3Ch 15.0 нс
6, CL = 6
6, CL = 5
4, CL = 4
Внутренняя задержка между командами WRITE и READ (t WTR) 37 1Eh 7.5 нс
3, CL = 6
3, CL = 5
2, CL = 4
Внутренняя задержка между командами READ и PRECHARGE (t RTP) 38 1Eh 7.5 нс
3, CL = 6
3, CL = 5
2, CL = 4
Минимальное время цикла строки (t RC) 41, 40 39h, 30h 57.5 нс
23, CL = 6
23, CL = 5
15.3, CL = 4
Период между командами саморегенерации (t RFC) 42, 40 C3h, 30h 195.0 нс
78, CL = 6
78, CL = 5
20.8, CL = 4
Максимальная длительность периода синхросигнала (t CK max) 43 80h 8.0 нс
Номер ревизии SPD 62 12h Ревизия 1.2
Идентификационный код производителя по JEDEC 64-71 7Fh, 00h Qimonda
Part Number модуля 73-90 - 64T512020EU25FA
Дата изготовления модуля 93-94 07h, 48h 2007 год, 48 неделя
Серийный номер модуля 95-98 1Ah, 02h,
9Ch, 14h
1A029C14h

В SPD поддерживаются три значения задержки сигнала CAS# - 6, 5 и 4. Первому и второму (CL X = 6 и 5) соответствует режим функционирования DDR2-800 (время цикла 2.5 нс, частота 400 МГц) с идентичной схемой остальных таймингов 5-5-18 (ровно), третьему значению задержки сигнала CAS# (CL X-1 = 4) соответствует режим DDR2-533 (время цикла 3,75 нс, частота 266,7 МГц) с нестандартной схемой таймингов 4-3,33-3,33-12, которую BIOS большинства плат будет интерпретировать как 4-4-4-12.

Номер ревизии SPD и идентификационный код производителя указаны верно, Part Number соответствуют указанному на самих модулях, а серийный номер отличается от приведенного на стикере.

Поддержка расширений SPD стандарта EPP в рассматриваемых модулях не предусмотрена.Конфигурация тестового стенда

  • процессор: AMD Phenom 9750 (Socket AM2+), 2,4 ГГц (200x12), степпинг B3;
  • чипсет: AMD 790FX;
  • материнская плата: ASUS M3A32-MVP Deluxe, версия BIOS 1201;
  • ОС: Windows XP SP2 x64.
Результаты исследования

В качестве штатного режима мы использовали рекомендованный производителем и наиболее логичный из сохраненных в SPD (DDR2-800 с таймингами 5-5-5-18). Испытания проводились в двух режимах контроллера памяти в процессоре Phenom: ganged (обеспечивающий более высокую производительность в режиме однопоточного доступа) и unganged (предпочтительный для многопоточных приложений, интенсивно обращающихся к памяти). Не преминули мы проверить и разгонный потенциал, хотя ожидать особых талантов в этой области от модулей высокой емкости вряд ли разумно.

Qimonda DDR2-800 2x4096МБ (HYS64T512020EU-25F-A) Apacer Giant DDR2-1066 2x2048МБ
Режим контроллера памяти Ganged Unganged Ganged Unganged Ganged Unganged
Частота памяти, МГц
(DDR2 МГц)
400
(800)
400
(800)
456
(912)
460
(920)
400
(800)
400
(800)
Частота ядер процессора, МГц
(DDR2 МГц)
2400 (200x12) 2400 (200x12) 2736 (228x12) 2760 (230x12) 2400 (200x12) 2400 (200x12)
Частота контроллера памяти в процессоре, МГц
(DDR2 МГц)
2000 (200x10) 2000 (200x10) 2280 (228x10) 2300 (230x10) 2000 (200x10) 2000 (200x10)
Тайминги памяти по умолчанию, напряжение 5-5-5-18-2T,
1,8 В
5-5-5-18-2T,
1,8 В
5-5-5-15-2T,
2,3 В
5-5-5-18-2T,
2,3 В
5-5-5-15-2T,
1,8 В
5-5-5-15-2T,
1,8 В
Минимальное напряжение при сохранении стабильности, В (не изучалось) (не изучалось) 2,26 В 2,22 В (не изучалось) (не изучалось)
Средняя ПСП на чтение (МБ/с),
1 ядро
6082 5535 6938 6354 6195 5760
Средняя ПСП на запись (МБ/с),
1 ядро
3469 3459 3960 3979 3548 3588
Макс. ПСП на чтение (МБ/с),
1 ядро
7014 6366 8000 7306 7149 6619
Макс. ПСП на запись (МБ/с),
1 ядро
4888 4953 5575 5700 4965 4983
Средняя ПСП на чтение (МБ/с),
4 ядра
10764 10715 12270 12406 10960 11078
Средняя ПСП на запись (МБ/с),
4 ядра
3506 4965 4000 5730 3550 5104
Макс. ПСП на чтение (w/PF, МБ/с),
4 ядра
11047 10749 12594 12454 11238 11105
Макс. ПСП на запись (NT, МБ/с),
4 ядра
6288 5604 7168 7228 6315 6315
Минимальная латентность псевдослучайного доступа, нс 36,4 38,8 32,0 33,9 35,7 37,0
Минимальная латентность случайного доступа * , нс 90,1 93,3 79,0 81,1 88,2 89,5

* размер блока 32 МБ

Для сравнения использовался комплект модулей меньшего объема (2 x 2048 МБ) от Apacer, как видите, отличие в производительности на равной частоте (DDR2-800) имеются, но минимальны. Внимательно приглядевшись, можно обнаружить разве что большее проседание скорости записи в режиме unganged у модулей от Qimonda.

Хотя сами модули явно не адресованы любителям разгона, то есть не имеют радиаторов и рекомендованных режимов работы с повышенными частотами и напряжением, разгон оказался возможен. И даже с лихвой может компенсировать разницу в производительности по сравнению с модулями меньшего объема (но, само собою, работающих на стандартной частоте).

Любопытно, что в режиме unganged в разгоне установлена стабильная работа на более высокой частоте, при этом удалось снизить напряжение с 2,3 В (которое считается негласным максимумом, длительная работа на более высоком напряжении может сократить срок службы модулей) до 2,2 В. Итоги

Модули памяти DDR2 объемом 4 ГБ (для получения двухканальной конфигурации объемом 8 ГБ) уже давно не являются экзотикой, да и цены имеют не заоблачные. И хотя наиболее распространенными в этой категории остаются модули с поддержкой ECC, рассчитанные на сегмент рабочих станций, нет никаких преград, при желании, получить такой объем и в обычном настольном компьютере. Во всяком случае, производительность и стабильность рассмотренных модулей от Qimonda оказались на высоте, так что этими параметрами пользователю жертвовать не придется.

Появлением на массовом рынке новых платформ все большую популярность приобретает память DDR2, которая постепенно начинает вытеснять память DDR. Первоначально существовала только память DDR2-400, на смену которой довольно быстро пришла память DDR2-533. А сейчас уже можно встретить память DDR2-667, DDR2-675, DDR2-750, DDR2-800, DDR2-900, DDR2-1000 и даже DDR2-1066. При этом отметим, что стандартизированной памятью в настоящее время является DDR2-533 и DDR2-667. В скором будущем будет также стандартизирована память DDR2-800, в связи с чем многие материнские платы уже поддерживают этот тип памяти. Остальные же типы памяти не стандартизированы, и не факт, что материнская плата способна поддержать эту память на заявленной тактовой частоте. Возникает вопрос: почему же производители памяти, соревнуясь друг с другом, стараются выпускать все более скоростную память? Ответ довольно прост — это маркетинговый ход. Ведь, по мнению рядового покупателя, чем выше тактовая частота, тем лучше. Но так ли это на самом деле и действительно ли производительность памяти целиком и полностью определяется ее тактовой частотой? Действительно ли сегодня востребована скоростная память типа DDR2-1000 или же это не более чем соревнование между производителями памяти?

Оказывается, что тактовая частота — далеко не единственная и даже не самая главная характеристика памяти, определяющая ее производительность. Куда более важной характеристикой является латентность памяти (тайминги памяти), и в этом смысле память DDR2-800 с большой латентностью будет менее производительной, чем память DDR2-667 с низкой латентностью.

Впрочем, чтобы разобраться во всех этих нюансах и выяснить, что такое латентность и почему эта характеристика более важна, чем тактовая частота, нам надлежит сначала понять, как работает оперативная память.

Что такое оперативная память

перативная память (или RAM-память —Random Access Memory) — это память с произвольным доступом.

Поскольку элементарной единицей информации является бит, оперативную память можно рассматривать как некий набор элементарных ячеек, каждая из которых способна хранить один информационный бит.

Элементарная ячейка оперативной памяти представляет собой конденсатор, способный в течение короткого промежутка времени сохранять электрический заряд, наличие которого можно ассоциировать с информационным битом. Проще говоря, при записи логической единицы в ячейку памяти конденсатор заряжается, при записи нуля — разряжается. При считывании данных конденсатор разряжается через схему считывания, и если заряд конденсатора был ненулевым, то на выходе схемы считывания устанавливается единичное значение.

Поскольку элементарной единицей информации для современных компьютеров является байт (восемь бит), то для простоты можно считать, что элементарная ячейка памяти, которая может адресоваться, хранит не бит, а байт информации. Таким образом, доступ в памяти производится не побитно, а побайтно.

Микросхемы памяти организованы в виде матрицы, напоминающий лист бумаги в клетку, причем пересечение столбца и строки матрицы задает одну из элементарных ячеек. Кроме того, современные чипы памяти имеют несколько банков, каждый из которых можно рассматривать как отдельную матрицу со своими столбцами и строками.

На рис. 1 показана упрощенная схема чипа памяти, в котором имеется четыре банка, каждый из которых содержит 8192 строки и 1024 столбца. Таким образом, емкость каждого банка — 8192x1024 = 8192 Кбайт = 8 Мбайт. Учитывая, что в чипе имеется четыре банка, получается, что полная емкость чипа составляет 32 Мбайт.

При обращении к той или иной ячейке памяти следует задать адрес нужной строки и столбца.

Для того чтобы получить доступ к ячейке памяти для записи или считывания информации, необходимо задать адрес этой ячейки. С учетом того, что в модуле памяти используется несколько чипов памяти, а в каждом чипе — несколько банков памяти, прежде всего необходимо указать, в каком чипе и банке находится ячейка. Для этого используют специальные сигналы CS, BA0 и BA1.

Сигнал CS позволяет выбрать требуемый чип памяти. Когда сигнал активен, возможен доступ к чипу памяти, то есть чип активируется. В противном случае чип памяти недоступен.

Сигналы BA0 и BA1 позволяют адресовать один из четырех банков памяти. Учитывая, что каждый сигнал может принимать одно из двух значений: 0 или 1, комбинации 00, 01, 10 и 11 позволяют задать адрес четырех банков памяти.

Когда выбраны чип и банк памяти, можно получить доступ к требуемой ячейке памяти, задав адрес столбца и строки. Адрес строки и столбца передается по специальной мультиплексированной шине адреса MA (Multiplexed Address).

Для считывания адреса строки на входы матрицы памяти подается специальный стробирующий импульс RAS (Row Address Strobe). Если точнее, то этот импульс представляет собой изменение уровня сигнала с высокого на низкий, то есть при переходе сигнала RAS с высокого уровня на низкий возможно считывание адреса строки.

При этом отметим, что само считывание адреса строки происходит не в момент изменения RAS-сигнала, а синхронизовано с положительным фронтом тактирующего импульса.

Аналогичным образом считывание адреса столбца происходит при изменении уровня сигнала (стробирующего импульса) CAS# (Column Address Strobe) с высокого значения на низкое и синхронизовано с положительным фронтом тактирующего импульса.

Кстати, заметим, что, поскольку все события памяти (считывание адреса строки и столбца, выдача или запись данных) синхронизованы с фронтами тактирующего импульса, память называется синхронной.

Импульсы RAS# и CAS# подаются последовательно друг за другом, причем импульс CAS# всегда следует за импульсом RAS#, то есть сначала происходит выбор строки, а затем — выбор столбца.

После считывания адреса строки и столбца ячейки памяти к ней возможен доступ для чтения или записи информации. Эти операции подобны друг другу, но для записи используется специальный разрешающий сигнал (стробирующий импульс) WE# (Write Enable). Если сигнал по напряжению меняется с высокого уровня на низкий, то в выбранную ячейку происходит запись информации. Если же сигнал WE# остается высоким, то происходит считывание информации с выбранной ячейки.

После того как все данные записаны или считаны с ячеек активной сроки, необходимо выполнить команду Precharge, которая закрывает активную строку и позволяет активировать следующую строку. Команды, используемые для записи или чтения, и соответствующие им состояния стробирующих импульсов представлены в табл. 1 и на рис. 2.

Таблица 1. Команды, используемые для записи или чтения ячеек памяти

Характеристики памяти

ак известно, главной характеристикой памяти является ее пропускная способность, то есть максимальное количество данных, которое можно считать из памяти или записать в память в единицу времени. Именно эта характеристика прямо или косвенно отражается в названии типа памяти.

Для того чтобы определить пропускную способность памяти, нужно умножить частоту системной шины на количество байт, передаваемых за один такт. Память SDRAM имеет 64-битную (8-байтную) шину данных.

К примеру, память DDR400 имеет пропускную способность 400 МГц x 8 байт = 3,2 Гбайт/с. Если память работает в двухканальном режиме, то теоретическая пропускная способность памяти удваивается, то есть для памяти DDR400 в двухканальном режиме она составляет 6,4 Гбайт/с. Теоретическая пропускная способность для различных типов памяти отображена в табл. 2.

Таблица 2. Соответствие типа памяти и теоретической пропускной способности

Казалось бы, чем больше пропускная способность памяти, тем лучше. Отчасти это справедливо, но лишь отчасти. Дело в том, что пропускная способность памяти должна быть сбалансирована с пропускной способностью процессорной шины. И если пропускная способность памяти превосходит пропускную способность процессорной шины, то именно процессорная шина становится узким местом в системе, ограничивая возможности памяти. Если рассматривать процессор Intel Pentium 4 или новые двухъядерные процессоры Intel Pentium D, то тактовая частота процессорной шины составляет 800 или 1066 МГц. Учитывая, что ширина шины составляет 64 бит (или 8 байт), получаем, что пропускная способность процессорной шины составляет 6,4 или 8,5 Гбайт/с. Из этого следует, что если в системе используется процессор с частотой FSB 800 МГц, то в одноканальном режиме для сбалансированного решения достаточно использовать память DDR2-800, а в двухканальном — DDR2-400.

Аналогичным образом, если в системе используется процессор с частотой FSB 1066 МГц, то в одноканальном режиме для сбалансированного решения потребуется использовать память DDR2-1066, а в двухканальном — достаточно памяти DDR2-533.

С учетом того, что типичной ситуацией является использование памяти в двухканальном режиме, память DDR2-533 вполне обеспечивает сбалансированное решение.

Возникает вопрос: если память DDR2-533 обеспечивает пропускную способность, согласующуюся с пропускной способностью процессорной шины, зачем тогда нужна более быстродействующая память? Дело в том, что до сих пор мы говорили лишь о теоретической, то есть о максимально возможной пропускной способности, которая реализуется только в случае последовательной передачи данных — когда данные передаются с каждым тактом. В реальной ситуации теоретический предел недостижим, поскольку, кроме этого, необходимо учитывать и такты, которые необходимы для получения доступа к самой ячейке памяти, а также для настроек модуля памяти. В связи с этим другими важными характеристиками памяти являются тайминги памяти или ее латентность.

Под латентностью принято понимать задержку между поступлением команды и ее реализацией. В этом смысле латентность можно сравнить с телефонным звонком. Время, которое проходит от набора номера (вызова абонента) и до ответа в трубке, — это и есть латентность телефонного вызова.

Латентность памяти, которая определяется ее таймингами, — это задержки, измеряемые в количествах тактов, между отдельными командами. Рассмотрим тайминги памяти более подробно. На рис. 3 показана последовательность команд при чтении или записи данных в память. Первоначально происходит активация нужной строки памяти (команда ACTIVE), для чего сигнал RAS переводится в низкий уровень и происходит считывание адреса строки. Далее следует команда записи (WRITE) или чтения (READ) данных, для чего сигнал CAS переводится в низкий уровень и в надлежащий уровень устанавливается сигнал WE. При установке CAS в низкий уровень после прихода положительного фронта тактирующего импульса происходит выборка адреса столбца, наличествующего в данный момент на шине адреса, и открывается доступ к нужному столбцу матрицы памяти. Однако команда чтения или записи не может следовать непосредственно за командой активации — требуется, чтобы между этими командами, то есть между импульсами RAS и CAS, существовал некий промежуток времени RAS to CAS Delay (задержка сигнала CAS относительно сигнала RAS). Эту задержку, измеряемую в тактах системной шины, принято обозначать tRCD.

После команды чтения (записи) данных и до выдачи первого элемента данных на шину (записи данных в ячейку памяти) проходит промежуток времени, который называется CAS Latency. Эта задержка измеряется в тактах системной шины и обозначается tCL. Каждый последующий элемент данных появляется на шине данных в очередном такте.

Завершение цикла обращения к банку памяти осуществляется подачей команды PRECHARGE, приводящей к закрытию строки памяти. После команды PRECHARGE и до поступления новой команды активации строки памяти должен пройти промежуток времени (tRP), называемый Row Precharge.

Еще один тип задержки, называемый ACTIVE to PRECHARGE delay, — это промежуток времени между командой активации строки памяти и командой PRECHARGE. Эта задержка обозначается tRAS и измеряется в тактах системной шины.

Ну и последний тип задержки, который необходимо упомянуть, — это скорость выполнения команд (Command Rate). Command Rate — это задержка в тактах системной шины между командой CS# выбора чипа и командой активации строки. Как правило, задержка Command Rate составляет один или два такта (1T или 2T).

Описанные задержки — RAS to CAS Delay (tRCD), CAS Latency (tCL) и Row Precharge (tRP) — определяют тайминги памяти, записываемые в виде последовательности tCL—tRCD—tRP—tRAS—Command Rate. К примеру, для модуля DDR400 (PC3200) тайминги могут быть следующими: 2-3-4-5-(1T). Это означает, что для данного модуля CAS Latency (tCL) составляет 2 такта, RAS to CAS Delay (tRCD) — 3 такта, Row Precharge (tRP) — 4 такта, ACTIVE to PRECHARGE delay (tRAS) — 5 тактов и Command Rate — 1 такт.

Понятно, что чем меньше тайминги, тем более быстродействующей является память. Поэтому если сравнивать память с таймингом 3-3-3-5-(1T) и память с таймингом 3-2-2-5-(1T), то последняя оказывается более быстродействующей.

Память SDR

азобравшись с такими важными характеристиками памяти, как ее тайминги, можно перейти непосредственно к принципам работы памяти. Несмотря на то что данная статья посвящена современной памяти DDR2, рассмотрение принципов работы памяти мы начнем с синхронной SDRAM-памяти типа SDR (Single Data Rate).

В SDR SDRAM-памяти обеспечивается синхронизация всех входных и выходных сигналов с положительными фронтами импульсов тактового генератора. Весь массив памяти SDRAM-модуля разделен на два независимых банка. Такое решение позволяет совмещать выборку данных из одного банка с установкой адреса в другом банке, то есть одновременно иметь две открытые страницы. Доступ к этим страницам чередуется (bank interleaving), и соответственно устраняются задержки, что обеспечивает создание непрерывного потока данных.

Наиболее распространенными типами SDRAM-памяти до недавнего времени являлись PC100 и PC133. Цифры 100 и 133 определяют частоту системной шины в мегагерцах (МГц), которую поддерживает эта память. По внутренней архитектуре, способам управления и внешнему дизайну модули памяти PC100 и PC133 полностью идентичны.

В SDRAM-памяти организована пакетная обработка данных, что позволяет производить обращение по новому адресу столбца ячейки памяти на каждом тактовом цикле. В микросхеме SDRAM имеется счетчик для наращивания адресов столбцов ячеек памяти, чтобы обеспечить быстрый доступ к ним.

В SDRAM-памяти ядро и буферы обмена работают в синхронном режиме на одной и той же частоте (100 или 133 МГц). Передача каждого бита из буфера происходит с каждым тактом работы ядра памяти.

Временная диаграмма работы памяти SDR SDRAM показана на рис. 4.

Память DDR

амять DDR SDRAM, которая пришла на смену памяти SDR, обеспечивает в два раза большую пропускную способность. Аббревиатура DDR (Double Data Rate) в названии памяти означает удвоенную скорость передачи данных. В DDR-памяти каждый буфер ввода-вывода передает два бита за один такт, то есть фактически работает на удвоенной тактовой частоте, оставаясь при этом полностью синхронизированным с ядром памяти. Такой режим работы возможен в случае, если эти два бита доступны буферу ввода-вывода на каждом такте работы памяти. Для этого требуется, чтобы каждая команда чтения приводила к передаче из ядра памяти в буфер сразу двух бит. С этой целью используются две независимые линии передачи от ядра памяти к буферам ввода-вывода, откуда биты поступают на шину данных в требуемом порядке.

Поскольку при таком способе организации работы памяти происходит предвыборка двух бит перед передачей их на шину данных, его также называют Pre-fetch 2 (предвыборка 2).

Для того чтобы осуществить синхронизацию работы ядра памяти и буферов ввода-вывода, используется одна и та же тактовая частота (одни и те же тактирующие импульсы). Только если в самом ядре памяти синхронизация осуществляется по положительному фронту тактирующего импульса, то в буфере ввода-вывода для синхронизации используется как положительный, так и отрицательный фронт тактирующего импульса (рис. 5). Таким образом, передача двух бит в буфер ввода-вывода по двум раздельным линиям осуществляется по положительному фронту тактирующего импульса, а их выдача на шину данных происходит как по положительному, так и по отрицательному фронту тактирующего импульса. Это обеспечивает в два раза более высокую скорость работы буфера и соответственно вдвое большую пропускную способность памяти (см. рис. 5).

Все остальные принципиальные характеристики DDR-памяти не изменились: структура нескольких независимых банков позволяет совмещать выборку данных из одного банка с установкой адреса в другом банке, то есть можно одновременно иметь две открытые страницы. Доступ к этим страницам чередуется (bank interleaving), что приводит к устранению задержек и обеспечивает создание непрерывного потока данных.

Память DDR2

сли следовать терминологии SDR (Single Data Rate), DDR (Double Data Rate), то память DDR2 было бы логично назвать QDR (Quadra Data Rate), поскольку этот стандарт подразумевает в четыре раза большую скорость передачи, то есть в стандарте DDR2 при пакетном режиме доступа данные передаются четыре раза за один такт. Для организации данного режима работы памяти необходимо, чтобы буфер ввода-вывода работал на учетверенной частоте по сравнению с частотой ядра памяти. Достигается это следующим образом: ядро памяти, как и прежде, синхронизируется по положительному фронту тактирующих импульсов, а с приходом каждого положительного фронта по четырем независимым линиям в буфер ввода-вывода передаются четыре бита информации (выборка четырех битов за такт). Сам буфер ввода-вывода тактируется на удвоенной частоте ядра памяти и синхронизируется как по положительному, так и по отрицательному фронту этой частоты. Иными словами, с приходом положительного и отрицательного фронтов происходит передача битов в мультиплексном режиме на шину данных (рис. 6). Это позволяет за каждый такт работы ядра памяти передавать четыре бита на шину данных, то есть вчетверо повысить пропускную способность памяти.

По сравнению с памятью DDR, память DDR2 позволяет обеспечить ту же пропускную способность, но при вдвое меньшей частоте ядра. К примеру, в памяти DDR400 ядро функционирует на частоте 200 МГц, а в памяти DDR2-400 — на частоте 100 МГц. В этом смысле память DDR2 имеет значительно большие потенциальные возможности для увеличения пропускной способности по сравнению с памятью DDR.

От теории к практике: память DDR2-667 Kingmax KLCD48F-A8EB5-ECAS

зучив теоретические аспекты функционирования современной памяти DDR2, перейдем от теории к практике. В качестве примера мы рассмотрим новую память SDRAM DDR2-667 компании Kingmax. Стенд для тестирования имел следующую конфигурацию:

  • процессор: Intel Pentium 4 570 (тактовая частота 3,8 ГГц, кэш L2 1 Мбайт);
  • частота FSB: 800 МГц;
  • материнская плата: MSI P4N Diamond;
  • чипсет: NVIDIA nForce4 SLI Intel Edition;
  • память: два модуля DDR2-667 Kingmax KLCD48F-A8EB5-ECAS объемом по 1 Гбайт каждый (двухканальный режим работы);
  • видеокарта: MSI NX6800 Ultra-T2D512E.

К сожалению, технической информации о модулях Kingmax KLCD48F-A8EB5-ECAS на сайте производителя маловато. Единственное, что удалось узнать, так это об организации модуля (8Ѕ128 Мбайт) и о значении параметра CAS Latency, которое составляет 5 тактов.

Для тестирования памяти мы использовали тестовый пакет RightMark Memory Analyzer v 3.55 и набор игровых бенчмарков: Half-Life 2, DOOM 3, FarCry 1.3, Unreal Tournament 2004 и 3DMark 2003. С целью увеличения нагрузки на процессор и память при тестировании использовалось разрешение 640Ѕ480 точек, а драйвер видеокарты настраивался на максимальную производительность.

Как выяснилось в процессе тестирования, модули памяти KLCD48F-A8EB5-ECAS имеют тайминги по умолчанию (by SPD) и составляют последовательность 5-5-5-13-(2T). Таким образом:

CAS Latency (tCL) — 5T;

RAS to CAS delay (tRCD) — 5T;

Row Precharge (tRP) — 5T;

Active to Precharge (tRAS) — 13T;

Command Rate — 2T.

Для того чтобы оценить потенциальные возможности модулей памяти по разгону (но без ущерба для стабильности), мы также провели тестирование в режиме с наименьшими таймингами, которые были определены методом проб и ошибок. Как выяснилось, минимальные тайминги, которые поддерживают данные модули памяти на тактовой частоте 667 МГц, составляют последовательность 4-3-3-5-(2T). Кроме того, мы провели разгон памяти по тактовой частоте, чтобы оценить максимально возможную тактовую частоту, поддерживаемую данными модулями при работе в двухканальном режиме.

Для тестирования с использованием тестового пакета RightMark Memory Analyzer v 3.55 использовались встроенные в бенчмарк пресеты:

RAM Performance Stream;

Average Memory Bandwidth, SSE2;

Maximal RAM Bandwidth, Software Prefetch, SSE2;

Average RAM Latency;

Minimal RAM Latency, 16 Mbyte Block, L1 Cache line.

С подробным описанием каждого пресета можно ознакомиться на сайтах www.rightmark.org или www.ixbt.com .

Результаты тестирования с использованием тестового пакета RightMark Memory Analyzer v 3.55 представлены в табл. 3.


с использованием тестового пакета RightMark Memory Analyzer v 3.55

Как следует из результатов тестирования, тайминги по умолчанию (by SPD) являются сильно завышенными. Уменьшение таймингов не оказывает влияния на стабильность работы модулей памяти, однако приводит к значительному увеличению пропускной способности памяти и к снижению латентности. Так, максимальная пропускная способность памяти при таймингах 5-5-5-13-(2T) составляет 5967,3 Мбайт/с (операция чтения, пресет Maximal RAM Bandwidth, Software Prefetch, SSE2). В то же время при уменьшении таймингов до 4-3-3-5-(2T) пропускная способность увеличивается до 6294,9 Мбайт/с, то есть на 5,5%. Отметим, что значение 6294,9 Мбайт/с близко к теоретическому пределу пропускной способности процессорной шины, которая в данном случае составляет 6,4 Гбайт/с.

Увеличение тактовой частоты до 710 МГц не оказывает влияния на стабильность в работе памяти, однако добиться значительного увеличения производительности памяти в данном случае не удается, что еще раз подтверждает тот факт, что изменение таймингов памяти оказывает существенно большее влияние на производительность памяти, нежели увеличение тактовой частоты.

Теперь обратимся к результатам игровых тестов (табл. 4). Как видите, уменьшение таймингов памяти позволяет (хотя и незначительно) увеличить результаты во всех игровых тестах. В то же время увеличение тактовой частоты памяти никак не отражается на результатах теста.

***

Итак, если говорить о рассмотренных модулях памяти Kingmax KLCD48F-A8EB5-ECAS, то можно констатировать, что в сочетании с материнской платой MSI P4N Diamond, а следовательно, и с чипсетом NVIDIA nForce4 SLI Intel Edition, эти модули обеспечивают гарантированно стабильную работу и прекрасно разгоняются путем уменьшения таймингов. Именно поэтому мы решили присвоить модулям Kingmax KLCD48F-A8EB5-ECAS знак «Редакция рекомендует».

Редакция выражает признательность компании Kingmax (www.kingmax.com ) за предоставление модулей памяти Kingmax KLCD48F-A8EB5-ECAS.