SiSoftware.Sandra.Enterprise.v2007
|
SiSoftware.Sandra.Enterprise.v2007.5.10.98 | ||||
| 4CH-4GB-In | 4CH-4GB-Se | 2CH-4GB | 2CH-2GB | |
| Processor Arithmetic | ||||
| Dhrystone ALU(MIPS) | 34567 | 34569 | 34576 | 34571 |
| Whetstone iSSE3(MFLOPS) | 23112 | 23109 | 23109 | 23113 |
| Processor Multi-Media | ||||
| Integer x8 iSSE4(it/s) | 205123 | 205155 | 205129 | 205113 |
| Floating-Point x4 iSSE2(it/s) | 111132 | 111127 | 111141 | 111118 |
我们利用SiSoftware.Sandra.Enterprise.v2007中的Processor Arithmetic和Processor Multi-Media测试模块对于4个采用了不同FBDIMM配置的系统进行了测试,测试结果显示内存配置的差异对于整数性能和浮点运算的性能影响极小。
|
SiSoftware.Sandra.Enterprise.v2007.5.10.98 | ||||
| Memory Bandwidth (MB/s) | ||||
| 4CH-4GB-In | 4CH-4GB-Se | 2CH-4GB | 2CH-2GB | |
| RAM Int Buff iSSE2(MB/s) | 4152 | 3573 | 3957 | 3575 |
| RAM Float Buff iSSE2(MB/s) | 4158 | 3575 | 3966 | 3574 |
| Memory Latency | ||||
| Random Access (ns) | ||||
| Speed Factor | 83.2 | 83.4 | 86.6 | 83.3 |
| 1kB | 1.6 | 1.6 | 1.6 | 1.6 |
| 4kB | 1.6 | 1.6 | 1.6 | 1.6 |
| 16kB | 1.6 | 1.6 | 1.6 | 1.6 |
| 64kB | 7.6 | 7.6 | 7.6 | 7.6 |
| 256kB | 8.4 | 8.4 | 8.4 | 8.4 |
| 1MB | 8.6 | 8.6 | 8.6 | 8.6 |
| 4MB | 14.4 | 14.8 | 14.4 | 14.6 |
| 16MB | 118.5 | 118.8 | 120.2 | 118.9 |
| 64MB | 134.9 | 135.0 | 140.0 | 135.0 |
| Linear Access (ns) | ||||
| Speed Factor | 15.8 | 15.8 | 16.0 | 15.8 |
| 1kB | 1.6 | 1.6 | 1.6 | 1.6 |
| 4kB | 1.6 | 1.6 | 1.6 | 1.6 |
| 16kB | 1.6 | 1.6 | 1.6 | 1.6 |
| 64kB | 6.6 | 6.6 | 6.6 | 6.6 |
| 256kB | 6.6 | 6.6 | 6.6 | 6.6 |
| 1MB | 6.6 | 6.6 | 6.6 | 6.6 |
| 4MB | 7.3 | 7.4 | 7.4 | 7.4 |
| 16MB | 25.5 | 25.4 | 25.8 | 25.4 |
| 64MB | 25.6 | 25.5 | 25.9 | 25.5 |
| Cache and Memory (MB/s) | ||||
| Combined Index | 35179 | 33156 | 34824 | 32584 |
| 2KB | 169224 | 173717 | 170495 | 173453 |
| 4KB | 212754 | 212736 | 212713 | 212457 |
| 8KB | 226932 | 226418 | 226373 | 226080 |
| 16KB | 236478 | 236556 | 236495 | 236272 |
| 32KB | 234714 | 234686 | 234668 | 234312 |
| 64KB | 222290 | 222308 | 222282 | 221961 |
| 128KB | 173958 | 173963 | 173941 | 173685 |
| 256KB | 69226 | 69217 | 69225 | 69193 |
| 512KB | 68656 | 68636 | 68654 | 68594 |
| 1MB | 65802 | 65745 | 65798 | 65689 |
| 4MB | 54043 | 53848 | 54030 | 53742 |
| 16MB | 7008 | 6177 | 6949 | 5851 |
| 64MB | 4703 | 4016 | 4574 | 3846 |
| 256MB | 4430 | 3781 | 4297 | 3621 |
| 1GB | 3544 | 3016 | 3437 | 2899 |
Memory Bandwidth测试模块显示采用了4通道4GB内存并且开启了Interleave模式的系统内存带宽最高,达到了4.16GB/s左右。其次是采用了2通道4GB的系统,其内存带宽也达到了3.96GB/s。而同样是4通道4GB内存但是采用了Sequence模式的内存带宽有了明显的下降,只有3.57GB/s左右。2通道2GB系统的内存带宽也在3.57GB/s左右,说明这项测试对于内存容量也是比较敏感的。
Memory Latency测试包括不同容量的数据块的测试,一般的认为小于处理器缓存容量的数据块测试所得到的结果更多的收到处理器缓存性能的影响。而我们在测试过程中测试平台除了内存之外均相同,因此我们主要关注大于4MB以上的测试结果。测试结果显示,2通道4GB内存子系统延迟略长。
Cache and Memory测试结果也可以参照以上的方法分析,我们只要分析大于4MB的数据块的测试结果。其所表现出来的趋势同Memory Bandwidth测试结果一致。4CH-4GB-In最优,2CH-4GB次之。4CH-4GB-Se、2CH-2GB同前两者有明显的性能差异,而这两者相比2CH-2GB的性能更低一些。
ScienceMark v2.0 Membench
|
ScienceMark Membench | ||||
| 4CH-4GB-In | 4CH-4GB-Se | 2CH-4GB | 2CH-2GB | |
|
内存带宽(MB/s) |
2918.25 | 2898.23 | 2912.04 | 2898.40 |
|
L1 Cache Latency (ns) | ||||
|
32 Bytes Stride |
1.61 | 1.61 | 1.61 | 1.61 |
|
L2 Cache Latency(ns) | ||||
|
4 Bytes Stride |
1.61 | 1.61 | 1.61 | 1.61 |
|
16 Bytes Stride |
2.14 | 2.14 | 2.14 | 2.14 |
|
64 Bytes Stride |
5.89 | 5.89 | 5.89 | 5.89 |
|
256 Bytes Stride |
6.43 | 6.43 | 6.43 | 6.43 |
|
512 Bytes Stride |
6.43 | 6.43 | 6.43 | 6.43 |
|
Memory Latency(ns) | ||||
|
4 Bytes Stride |
1.61 | 1.61 | 1.61 | 1.61 |
|
16 Bytes Stride |
2.14 | 2.14 | 2.14 | 2.14 |
|
64 Bytes Stride |
6.96 | 6.43 | 6.43 | 6.43 |
|
256 Bytes Stride |
7.50 | 7.50 | 6.96 | 6.96 |
|
512 Bytes Stride |
8.04 | 8.04 | 7.50 | 8.04 |
|
Algorithm Bandwidth(MB/s) | ||||
|
Compiler |
2068.71 | 2059.99 | 2053.60 | 2058.30 |
|
REP MOVSD |
2086.70 | 2076.65 | 2082.37 | 2078.38 |
|
ALU Reg Copy |
2019.78 | 1997.56 | 2010.56 | 1997.12 |
|
MMX Reg Copy |
2045.38 | 2020.17 | 2039.44 | 2021.46 |
|
MMX Reg 3dNow |
- | - | - | - |
|
MMX Reg SSE |
2906.74 | 2863.19 | 2899.01 | 2862.47 |
|
SSE PAlign |
2897.37 | 2877.00 | 2888.64 | 2876.95 |
|
SSE PAlign SSE |
2918.25 | 2897.09 | 2912.04 | 2894.10 |
|
SSE2 PAlign |
2888.73 | 2865.60 | 2875.98 | 2864.78 |
|
SSE2 PAlign SSE |
2917.67 | 2898.23 | 2910.46 | 2898.40 |
|
MMX Block 4kb |
2460.69 | 2423.07 | 2434.24 | 2423.98 |
|
MMX Block 16kb |
2663.69 | 2638.66 | 2652.70 | 2638.24 |
|
SSE Block 4kb |
2452.03 | 2433.54 | 2438.05 | 2423.73 |
|
SSE Block 16kb |
2668.89 | 2645.91 | 2650.89 | 2645.23 |
ScienceMark v2.0 Membench的测试结果同Sisoftware Sandra 2007 Memory Bandwidth的测试结果所显示出来的趋势是相同的。4通道4GB内存并且开启了Interleave模式的系统(4CH-4GB-In)和2通道4GB内存的系统(2CH-4GB)的性能相近。4通道4GB内存采用Sequence模式的系统(4CH-4GB-Se)和2通道2GB内存的系统(2CH-2GB)性能相近。
Algorithm Bandwidth测试部分模拟了采用了不同指令集的应用的性能,其中的部分测试结果也能显示同上的趋势。但是部分测试因为所使用的数据块较小,比如MMX Block 4kb/16kb、SSE Block 4kb/16kb的测试结果都无法显示内存子系统之间的性能差异。
更多内容请看PCdog.com--win98使用技巧专题
