Altinkaya: турецкие корпуса для РЭА
РадиоЛоцман - Все об электронике

В поисках 'святого Грааля' в области памяти (Часть 2)

Первая часть
Вторая часть
Третья часть

Документация от Интел подтверждает полученные результаты

Мы убедились, что UNBuffered тесты показали лучшую производительность в конфигурациях с четырьмя модулями DIMM, чем с двумя во всех случаях с DDR400 и в более быстрых режимах на чипсетах 875/865. Но MemTest86 и стандартный тест не показали никаких улучшений при переходе от конфигурации с двумя двусторонними модулями DIMM к конфигурации с четырьмя модулями. Почему же мы верим тестам UNBuffered? Ответ удивительно прост, он заключается в руководствах по конфигурациям памяти к чипсетам i875P и i865P. Таблицы, которые Вы видите ниже, взяты из этих документов (в обоих документах они одинаковы). Данные о производительности в документации от Интел в точности совпали с нашим UNBuffered тестированием. Итак, мы убедились, что данные UNBuffered подтверждаются официальной документацией, в то время, как стандартный тест и MemTest86 не заметили различий в производительности между первой и второй конфигурацией (4 двухсторонних и 2 двухсторонних модуля).

Выбираем схему BMS для заряда литий-железофосфатных (LiFePO4) аккумуляторов

DDR400 Показатели производительности с 875/865
по документации Интел
Скорость
DDR
Кол-во модулейКоличество сторонРежимSC или DCПроизводительность
400 MHz4 2DynamicDual Channel1 (2 для 865)
400 MHz2 2DynamicDual Channel2 (1 для 865)
400 MHz4 1DynamicDual Channel2
400 MHz2 1DynamicDual Channel3
400 MHz4 любоеNormalDual Channel4
400 MHzлюбое2DynamicSingle Channel5
400 MHzлюбое1DynamicSingle Channel6
400 MHzлюбоелюбоеNormalSingle Channel7
DDR266/333 Показатели производительности с 875/865
по документации Интел
Скорость
DDR
Кол-во
модулей
Количество
сторон
РежимSC или DCПроизводительность
233/333 MHz22DynamicDual Channel1
233/333 MHz41DynamicDual Channel1
233/333 MHz21DynamicDual Channel2
233/333 MHz42DynamicDual Channel3
233/333 MHzлюбоелюбоеNormalDual Channel4
233/333 MHz2 (1 на каждый канал)любоеDynamicSingle Channel5
233/333 MHz12DynamicSingle Channel5
233/333 MHzлюбое1DynamicSingle Channel6
233/333 MHzлюбоелюбоеNormalSingle Channel7

Почему мы не тестировали варианты 5:4 или 3:2? На вопрос о производительности таких конфигураций, например, при работе с процессором 533FSB, даст ответ таблица для DDR266/333. При использовании DDR333/266 в качестве базовой скорости, два двухсторонних DIMM или четыре односторонних работают быстрее. Два односторонних модуля занимают второе место по производительности, а четыре двухсторонних DIMM - самая быстрая конфигурация при использовании DDR400 и более быстрых, в данном случае, занимает третье место.

Смешанные конфигурации

В общем, судя по документам, Интел рассчитывает, что Вы будете использовать два или четыре одинаковых DIMM. Действительность для большинства пользователей такова, что еще два одинаковых модуля - это реально, а вот четыре - маловероятно. В документации о смешанных конфигурациях памяти сказано только, что работать они будут, но значительно медленнее и при худшей синхронизации.

Чтобы получить представление о том, что происходит с производительностью при подключении разных модулей DIMM при стандартных значениях DDR400/800FSB, взгляните на следующую таблицу:

КонфигурацияЛучшая
синхронизация
UNBuffered
тест(MБ/с)
Отличие от одинаковых DIMM,
% (производительность)
2x256MB DS+
2x512MB DS
2-7-3-32094 INT
2148 FLT
-25%
2x256MB DS+
2x256MB SS
2.5-7-3-32064 INT
2132 FLT
-22%
2x512MB DS+
2x256MB SS
2.5-7-3-32097 INT
2150 FLT
-23%
4x256MB
Matched DS
2-7-3-32861 INT
2848 FLT
----

Производительность значительно падает при использовании различных пар модулей памяти, даже с двумя парами из одинаковых двухканальных модулей. Снижение показателей на 22-25% по сравнению с наилучшей конфигурацией - это не очень большая потеря. Естественно, в потере производительности виноваты и сами модули. Тем не менее, четыре одинаковых DIMM работают при синхронизации 2-7-2-2, что является далеко не лучшим показателем, который мы видели при работе с DDR400. На самом деле, двухсторонняя пара 2х512 МБ, которая применялась в смешанных тестах, работает как двухканальная пара при DDR400 с синхронизацией 2-5-2-2. Односторонняя пара из 256 МБ модулей DIMM работает лучше всего при синхронизации 2.5-6-3-2 в режиме DDR400. Это значит, что эти самые медленные односторонние модули показывают лучшие результаты в смешанных режимах, чем более быстрые.

В смешанных конфигурациях существует очень много вариаций с различной производительностью. В любом случае, Вы можете ясно увидеть по результатам, что очень хорошая производительность обеспечивается четырьмя одинаковыми модулями, а потери производительности при использовании двух разных модулей могут быть огромными.

Разгон FSB с одним, двумя и четырьмя DIMM

Теперь, зная, что у DDR400 или выше наилучшая производительность достигается при использовании четырех модулей, возникает вопрос, где же теряется производительность в конфигурациях с двумя или даже с одним модулем DIMM.

Разгон FSB, настройки теста
Процессор:Intel Pentium4 3.0C
800FSB
Hyperthreading
Intel Pentium4 2.6C
800FSB
Hyperthreading
Материнская плата:DFI 875PRO Lan
Party(875)
Asus P4P800
Deluxe (865)
Напряжение
(процессор):
1.60 В1.650 В
Память:OCZ3700 GOLD
DDR466
OCZ3700 GOLD
DDR466
vDIMM:1.70 В (MB limited)1.85 В (MB Limited)
Охлаждение:Thermalright
SLK-900U
CoolerMaster
HeatPipe
Блок питания:Vantec 520WPowmax 400W

 Pentium4 3.0C 800FSBPentium4 2.6C 800FSB
Кол-во DS
DIMM:
124124
Максимальная
Частота FSB:
992
(4x248)
CPU
Limited
992
(4x248)
CPU
Limited
968
(4x242)
1048
(4x262)
1032
(4x258)
1024
(4x256)
SPD или
ручной:
SPDSPDSPDSPDSPDSPD
CAS Latency:2.52.52.52.52.52.5
RAS to CAS
Delay:
333444
RAS
Precharge:
777777
Precharge
Delay:
333444

Несмотря на более скромные возможности по разгону, конфигурация с четырьмя DIMM остается наилучшей. Например, DDR516 в конфигурации с четырьмя модулями перекрывает по производительности DDR530 с двумя DIMM. Кстати, в тестах UnBuffered, четырехмодульная конфигурация показала на 7-10% лучшие результаты.

Выводы

Если Вы планируете работать с DDR400 в качестве базовой скорости и с 800FSB процессором, лучшая производительность будет при использовании четырех двухсторонних DIMM. Результаты наших тестов совпали с документами Интел.

DDR400 (1:1)
Производительность
Конфигурация
DIMM
Одно или
двухканальный
14 DSDual Channel
22 DS или 4 SSDual Channel
32 SSDual Channel
44 SS/DS
Смешанные
пары
Dual Channel
5Любой DSSingle Channel
6Любой SSSingle Channel

Вы можете использовать смешанные пары модулей DIMM. Это два модуля одного типа и два - другого. Производительность понижается на 22-25% по сравнению с четырьмя двухсторонними DIMM.

Если Вы планируете использовать односторонние модули, то удостоверьтесь, что у Вас есть четыре одинаковых модуля DIMM. Пара односторонних модулей в нашем рейтинге по результатам тестов заняла третье место и была практически такой же по производительности, как смешанные пары.

Ситуация изменится, если в ваших планах работа с процессором 533FSB P4 или же Вы собираетесь работать с памятью на частотах 333 или 266 МГц. С процессором 533FSB наиболее эффективная конфигурация состоит из двух двухсторонних DIMM.

DDR333/266
Производительность
Конфигурация
DIMM
Одно или
двухканальный
12 DS или 4 SSDual Channel
22 SSDual Channel
34 DSDual Channel
44 SS/DS
Смешанные Пары
Dual Channel
5Любой 1 или 2
DS или SS
(1 DIMM или 1 в
каждом канале)
Single Channel
6Любой 1 SSSingle Channel

Теперь, когда мы наконец-то определили наилучшую конфигурацию памяти для плат 875/865, мы рассмотрим высокоскоростную память DDR500 и DDR466, чтобы оценить, как она работает на этой платформе.

Когда мы работали над первой частью, самыми быстрыми модулями памяти, которые были у нас на тестировании, были DDR466, которые назывались OCZ 3700 Gold. Сейчас в нашем распоряжении находится память от пяти производителей, заявляющих, что она работает как DDR500. Мы даже видели анонсы Geil, посвященные PC4200 (DDR533). Интел узаконила DDR400, как стандарт для чипсетов 875/865, и, на данный момент, это официальный стандарт JEDEC. Более быстрые микросхемы памяти, зачастую - это те же DDR400, протестированные производителями на возможность работать при более высоких скоростях, вплоть до DDR500. Пока что нет официального стандарта на DDR500, но все производители используют платы на чипсетах 875/865 для проверки характеристик памяти при работе на высоких скоростях. Откровенно говоря, сейчас нет реальной необходимости в DDR500. Даже самые быстрые чипсеты для AMD nForce2 Ultra 400 и VIA KT600 и новые процессоры пока не показали настолько высокой производительности и реальной необходимости работать с памятью на такой скорости. Это может измениться с появлением на рынке процессоров Athlon64. На данный момент DDR500 - игровая площадка Интел, так как большинство решений рассчитано на работу с чипсетами 875/865.

Нам пришлось изменить способ тестирования, чтобы лучше оценить производительность модулей DDR500. Также добавлены тесты на производительность в играх и тест Number Crunching.

Итак, вооруженные самыми быстрыми модулями памяти от Adata, Corsair, Geil, Kingston, и OCZ, попробуем найти лучшую память для вашего компьютера на основе Canterwood(875) или Springdale (865).

Параметры тестов

При тестировании использовались следующие программы:

SiSoft Sandra Max3 UNBuffered Memory Test

В первой части мы рассказывали о важности этого теста, который зарекомендовал себя, как чувствительное средство для тестирования памяти. Для запуска этого теста, выключите все схемы буферизации.

SiSoft Sandra Max3 Standard Memory Test

Тестирование при включенном буфере сильно отличается от UNBuffered. Этот тест мы будем называть стандартным.

Super PI

Чистый набор чисел очень полезен для измерения системной полосы пропускания. Один из наиболее популярных тестеров такого рода - MPEG/DIVX тесты. Довольно трудно найти подобную программу, позволяющую изменять практически все свои параметры и выполнять такой большой набор тестов.

Quake3 Demo FOUR.dm_66

Это один из стандартных игровых тестов. Quake3 тоже реагирует на небольшие вариации в эффективности микросхем памяти.

Unreal Tournament 2003 Demo

Тест встроен в демо-версию игры. Unreal Tournament 2003 Demo. Он показывает отличия в производительности как в Flyby, так и Botmatch в испытаниях с памятью на других скоростях. Все стандарты работают при нашем стандартном разрешении 1024x768.

Материнская плата, процессор, периферия

В первой части мы применяли Abit IC7 для наших тестов 875 и Asus P4P800 Deluxe для тестов 865. Из-за ряда причин (например, другая FSB), мы решили использовать далее для тестирования только 875 чипсет. С этим начались наши первые проблемы. Abit IC7 вела себя очень странно при работе с памятью. Чтобы мы ни делали, мы не могли заставить ее работать на скорости большей 255 (1020 FSB). Мы разговаривали с Abit по поводу этой проблемы, и представители компании работали над BIOS, пытаясь исправить эту проблему. В некоторых наших тестах мы ожидали, что достигнем скорости 275, но барьер 255 оказался не преодолимым.

После этого, мы решили выбрать для тестирования материнскую плату DFI 875PRO LanParty. Системная плата не имела никаких проблем и легко преодолела границу 255. Но только одно напряжение 2.7 В для модулей памяти сильно ограничивает. Компания DFI заявила, что в ближайшем будущем появится усовершенствованная версия 875PRO. У этой платы будет расширен диапазон напряжений для модулей памяти.

Одна из новых материнских плат ASUS на чипсете 875 - ASUS P4C800-E. Эта плата обеспечивает GigaLan (через шину Интел CSA). Она содержит южный мост с Интел SATA Raid.

Наш 3.0С Pentium 4 800FSB был не очень удобным для тестирования DDR500. С максимальной частотой около 245 (980FSB), мы даже не смогли достичь заявленных скоростей памяти. Мы перешли на 2.4С 800FSB Pentium 4, который должен был хорошо работать с высокими скоростями. На плате ASUS P4C800-E, этот процессор достигал показателя 288 (1152FSB) при номинальном напряжении 1.525 В и показателя 298 (1192FSB) c напряжением 1.6 В. Мы были уверены, что эта конфигурация должна нам позволить достичь максимальных скоростей, возможных при использовании памяти DDR500. Мы даже не предполагали, что синхронизация достигнет не только 500, но и DDR596.

Когда тестирование будет закончено, мы выберем наиболее эффективные компоненты из тех, что были у нас в распоряжении. Для охлаждения процессора мы применили Thermalright SLK-900U и вентилятор Vantec Tornado с настраиваемой скоростью. Главной идеей было убрать все возможные беспокойства, связанные с охлаждением процессора во время разгона. В качестве видео карты мы использовали наш новый ATI Radeon 9800 PRO с 128 МБ памяти. Жесткие диски: пара Western Digital Raptor 10,000RPM Serial ATA, работающие в SATA RAID 0 (Striping) в конфигурации Интел ICH5R.

Конфигурация системы
Процессор:Intel Pentium 4 2.4GHz (800MHz FSB)
Память:2 x 512 MB Adata PC4000 (DS)
2 x 512 MB Corsair PC4000 (DS)
2 x 512 MB Geil PC4000 (DS)
4 x 256 MB Kingston PC4000 (SS)
2 x 512 MB OCZ PC4000 (DS)
4 x 256 MB OCZ PC3700 GOLD (DS)
Жесткие диски:Два диска Western Digital Raptor Serial ATA
36.7GB 10,000RPM в конфигурации Интел
ICH5R RAID 0
Скорость PCI/AGPФиксированная 33/66
Bus Master
Drivers:
875P Intel INF Update v5.00.1012, SATA RAID
Видеокарты:ATI 9800 PRO 128 MB, 128 MB aperture,
1024x768x32
Видеодрайвер:ATI Catalyst 3.6
Операционные системы:Windows XP Professional SP1
Системные платы:ASUS P4C800-E (875) с версией BIOS 1.010

Мы обратились к основным производителям микросхем памяти с просьбой предоставить нам модули памяти DDR500 или самые быстрые, которые у них есть. Все модули в обзоре были предоставлены нам для тестирования, кроме Adata PC4000. В качестве замены Adata прислала DDR450.

Скорость памяти, так ли это важно?

В компьютерной индустрии присутствует некоторый скептицизм по поводу скоростей памяти. Многие заявляют, что двухканальная 266 память работает быстрее, чем нужно, для большинства задач. Распространено еще одно высказывание, которое говорит о том, что память DD400(PC3200) обладает всей необходимой производительностью, нужной для решения большинства задач. Чтобы определить, имеют ли эти высказывания право на жизнь, мы решили сначала посмотреть на скорость памяти в наших тестах. Насколько это было возможно, мы хотели свести к нулю изменение производительности тестируемого модуля. Сам дизайн 875 и 865 чипсетов заставляет с этим повозиться. Поэтому мы четко ограничили установки для коэффициента памяти. Мы решили протестировать память при разных скоростях и попытаться найти максимальное значение FSB. Мы выбрали два DIMM 512 МБ DS OCZ 4000 и протестировали память при параметрах: 2.4 ГГц и 2.5-3-4-6-1. И при большом значении FSB: 1066FSB и при такой же синхронизации. Для стабильной работы при 1066FSB понадобилось напряжение 2.75 В. Мы решили повысить напряжение до 2.75 В при проведении всех тестов. В каждом наборе установок мы варьировали только скоростями памяти.

Двухсторонняя память

800FSB (2.4 ГГц) производительность при разных скоростях-2 x 512 MB DS DIMM
Memory
DDR
Speed
Quake3
fps
UT2003
Flyby
fps
UT2003
Botmatch
fps
Sandra
UNBuffered
Sandra
Standard
Buffered
Super
PI 2M
266 MHz300.30188.6665.55INT 1854
FLT 1814
INT 3759
FLT 3787
144
320 MHz313.70193.2667.57INT 2138
FLT 2123
INT 4254
FLT 4256
138
400 MHz328.07198.2769.16INT 2594
FLT 2640
INT 4700
FLT 4724
132

1066FSB (3.2ГГц) производительность при разных скоростях -2 x 512 MБ DS DIMM
Memory
DDR
Speed
Quake3
fps
UT2003
Flyby
fps
UT2003
Botmatch
fps
Sandra
UNBuffered
Sandra
Standard
Buffered
Super
PI 2M
355 MHz382.67235.8285.13INT 2415
FLT 2394
INT 5043
FLT 5039
107
426 MHz403.56239.9687.82INT 2924
FLT 2875
INT 5711
FLT 5688
104
533 MHz424.5249.2491.53INT 3532
FLT 3542
INT 6308
FLT 6252
100

Как Вы можете видеть из таблиц, расположенных выше, производительность в игровых тестах увеличивается с ускорением платы Интел 875. С переходом от процессора 800FSB, работающего с памятью 266, к процессору с той же циклической частотой, но работающим с памятью DDR400, показатели теста в Quake3 увеличились на 9%, а показания в UNBuffered - почти на 40%. При 1066FSB с увеличением скорости памяти от 355 до 533, мы наблюдаем еще большее увеличение показателей: 11% в Quake3 и 46 % в UNBuffered.

UT2003 в этих случаях также показал увеличение производительности на 32-39%. UNBuffered показал 90% увеличение в одинаковом диапазоне от 800/266 до 1066/533. Как мы видим в обоих игровых тестах, увеличение производительности, в большей мере, связано с процессором, чем с памятью. Но увеличение происходит достаточно резко. Super PI оказался более чувствительным, чем мы ожидали. Мы увидели увеличение показателей на 7-9% только при изменении параметров памяти при фиксированной частоте процессора (немногим меньше чем в Quake3).

Получается, что скорость памяти имеет значение и, причем, довольно существенное. Все тесты показали значительное увеличение производительности при улучшении параметров памяти. Это полностью подтверждалось, вплоть до самой большой скорости DDR533. Различия, если брать во внимание только память, оставляя неизменной частоту процессора, составляют в среднем 9-11%. Выбирая более быструю память, вы теперь сможете оценить выигрыш в производительности и сопоставить его с разницей в цене. Для одних задач такое увеличение производительности - капля в море, а для других - оно может оказаться весьма существенным.

Некоторые конфигурации было гораздо проще тестировать, чем остальные. Kingston обеспечил нас четырьмя односторонними модулями DDR500 DIMM, которые дали нам возможность разобраться в различиях в производительности между двумя версиями односторонних модулей. Мы рассмотрели производительность при 1000FSB/DDR500 и синхронизации 3-4-4-7-1.

1000FSB (3.0GHz)/DDR500 - Kingston PC4000
2 x 256 MB SS DIMMs vs. 4 x 256 MB SS DIMM
Кол-во
DIMM
Quake3
fps
Sandra
UNBuffered
Sandra
Standard
Buffered
Super
PI 2M
2386.30INT 2821
FLT 2786
INT 5830
FLT 5748
109
4394.57INT 3218
FLT 3195
INT 5841
FLT 5818
107

В то время, когда различия между Quake3 и Super PI незначительны, вспоминаем, что единственное различие здесь - четыре модуля вместо двух.

Сравнение двух односторонних с двумя двухсторонними модулями было проведено с помощью 2 x 256 MB SS OCZ PC4000 и 2 x 512 MB DS PC4000 при синхронизации 2.5-3-4-6 и напряжении 2.65 В. К сожалению, не было достаточного количества модулей, чтобы провести полностью аналогичное сравнение с абсолютно одинаковыми модулями.

1000FSB (3.0GHz)/DDR500 - OCZ PC4000
2 x 256 MB SS DIMM c 2 x 512 MB DS DIMM
Кол-во
DIMM
и конфигурация
Quake3
fps
Sandra
UNBuffered
Sandra
Standard
Buffered
Super
PI 2M
2 SS392.30INT 2918
FLT 2926
INT 5761
FLT 5868
109
2 DS400.10INT 3282
FLT 3324
INT 5965
FLT 5934
106

Снова различия не большие, кроме Quake3 и Super PI. Самой быстрой должна быть конфигурация на четырех двойных модулях. Чтобы провести тестирование в одинаковых условиях, нам пришлось тестировать модули 2 x 512 MB DS и 4 x 512 MB DS (PC3700) на 800FSB/DDR400 с включенной поддержкой технологии PAT в обоих вариантах, синхронизация 2-2-4-8, напряжение 2.75 В.

800FSB (2.4GHz)/DDR400 2 x 512 DS vs. 4 x 512 DS
Кол-во
DS
DIMM
Quake3
fps
UT2003
Flyby
fps
UT2003
Botmatch
fps
Sandra
UNBuffered
Sandra
Standard
Buffered
Super
PI 2M
2321.4196.3068.31INT 2683
FLT 2722
INT 4704
FLT 4691
133
4324.5197.6069.38INT 2830
FLT 2923
INT 4678
FLT 4717
132

Хоть разница в производительности здесь и мала, но все равно видно превосходство конфигурации 4 DS над 2 DS. Мы ожидали, что увидим большие различия на более высоких скоростях, а произошло обратное. Мы еще раз убедились, что включение игровых тестов не повлияло на ситуацию. Общепринятые тестовые системы дают правильные результаты, а игровые тесты не дают возможности оценить характеристики памяти, учитывая производительность системы в целом.

Окончание следует...

Первая часть
Вторая часть

AnadTech

Электронные компоненты. Бесплатная доставка по России
Для комментирования материалов с сайта и получения полного доступа к нашему форуму Вам необходимо зарегистрироваться.
Имя