aoc ii ud i.3 : medidas de desempenho referências: hennessy, j. l., cap 4 - opc: a interface...
Post on 16-Apr-2015
108 Views
Preview:
TRANSCRIPT
AOC II
UD I.3 : MEDIDAS DE DESEMPENHOReferências: HENNESSY, J. L., Cap 4 - OPC: A interface HW&SW, 3ª edição, 2005.
STALLINGS, W., cap 11 – AOC.
http://www.cic.unb.br/docentes/juliana/cursos/oac
2
Tipos de Desempenho
. Tempo de Execução (Latência). - Tempo total para o computador executar
(rodar) um programa ou completar uma tarefa. - Desempenho da UCP, E/S, etc. . Vazão (Throughput) - Quantidade total de trabalhos (programas)
feitos (executados) em um determinado tempo. - Desempenho de servidores (processadores, SO,
etc.)
3
Definições de Desempenho
TEX : Tempo de Execução de um programa de teste em uma máquina X
DX = DesempenhoX = 1/TEX
DX/Y = Desempenho relativo de X em relação a Y
DX/Y = DX /DY = TEY/TEX
4
Temporização: relógio (clock)
5
Medidas em ciclos de clock (relógio)
T (período) = duração do ciclo de máquina (clock: relógio) em segundos
f (freqüência) = ciclos/segundo = Hertz = 1/T
NCC: número de ciclos de clock por programaDCC: duração do ciclo de clock
NCC = TE/DCC = TE*f
6
Ciclos por instrução (CPI)
Cada Programa Várias instruçõesCada instrução # (número) diferente de
ciclosCPI: Média de ciclos por instruçãoNIPP: # (número) de instruções por
programa NCC = NIPP*CPI TE = NCC/f = (NIPP*CPI)/f
7
Latência da instrução: LI• Cada instrução completa leva em média CPI ciclos de
máquina (clock).• Cada ciclo de máquina (clock) tem a duração de T
unidades de tempo• A Latência LI é o tempo gasto para executar uma
instrução sem pipeline, ou seja,
LIsp= CPI*T
• Um processador gasta um tempo TEsp para executar n instruções sem usar pipeline:
TEsp= n*CPI*T
8
Fatores de Desempenho
TE = segundos/programa = (NIPP*CPI)/f = NIPP*CPI*T
NIPP = instruções/programa CPI = ciclos de clock/ instrução T = segundos/ ciclo de clock
9
Banda Passante
• Taxa de rendimento ou vazão (“throughput”) do processador: ips (instruções por segundo), mips ou mflops.
• Memória: MB/s (Megabytes por segundo)
• Entrada e Saída (E/S): MB/s ou
Mb/s (Megabits por segundo)
10
Banda Passante do Processador (VAZÃO)
• É a taxa na qual as instruções são executadas, ou seja é número de instruções executadas por unidade de tempo. Exemplos:
- ips (instruções por segundo)
- mips (milhões de instruções por segundo)
- mflops (milhões de instruções de ponto flutuante por segundo)
• Sem usar o pipeline a vazão V de um processador pode ser dada por
V = 1/LI
11
Banda passante de memória (BPM)
LB = largura do barramento de dados (memória)
fBM : freqüência da banda de memória
BPM = LB * fBM
Medido em MB/s (Megabytes por segundo)
12
Banda passante de E/S (BPES)
LB = largura do barramento de dados de E/S
fBES : freqüência do barramento de E/S
BPES = LB * fBES
Medido em MB/s ou Mb/s (Megabits por segundo)
13
BenchMarksBenchMarks
- programas que permitem comparar o desempenho de computadores.
- Melhor programa de “benchmark”: aplicações reais
14
Conjuntos de BenchMarksConjuntos de BenchMarks
- Sintéticos: Whetstone e o Dhrystone. - SUPER-PI - SPEC (89, 92, 95, 2000 e 2005)
- Sandra 2005 (System ANalyser, Diagnostic and Reporting Assistant)
• PCMARK05, 3DMARK05, SYSmark (www.futuremark.com))
• DiskBench V2.4.3 (para HD)
15
SPECSPEC: : System Performance System Performance Evaluation CorporationEvaluation Corporation
Consórcio de empresas, criado em 1989, com o objetivo de melhorar a medida e as informações disponíveis sobre o desempenho de proces-sadores e computadores (http://www.spec.org)
16
Membros do consórcio SPECMembros do consórcio SPEC3DLabs * Acer Inc. * AMD * Apple * ATI * Azul Systems
* BEA Systems * Borland * Bull * Dell * EMC * Exanet * Fabric* Freescale * Fujitsu * HP * Hitachi * IBM * Intel * ION * JBoss * Microsoft * Mirapoint * NEC * Network Appliance * Novell * NVIDIA * Openwave Systems * Oracle * Panasas * PathScale * Portland Group * S3 Graphics Co., Ltd. * SAP AG * SGI * Sun* Super Micro * Sybase * Symantec* Unisys * Verisign *
17
Programas do SPEC 95 (1) Programas do SPEC 95 (1) - 8 programas inteiros na linguagem C (medida SPECint95)
go : Inteligência Artificial, joga o Go
M88ksim: Simulador do chip Motorola 88k (executa um programa de teste)
gcc: Compilador C Gnu gerando código para o SPARC
compress: Compressão e descompressão de arquivos na memória
li : Interpretador Lisp
ijpeg: Compressão e descompressão gráficas
perl: Manipula strings e números primos na linguagem Perl
vortex: Programa de banco de dados
18
Programas do SPEC 95 (2) Programas do SPEC 95 (2) - 10 Programas de ponto flutuante na linguagem F77 (medida SPECfp95):
tomcatv : Programa gerador de malhas
swim: Modelo para águas rasas com uma grade 513 x 513
su2cor: Física quântica (simulação do método de Monte Carlo)
hydro2d: Astrofísica (equações hidrodinâmicas de Naiver Stokes)
mgrid: Potenciais de campo (solução em 3-D)
applu: Equações diferenciais parciais parabólicas e elípticas
trub3d : Simula uma turbulência isotrópica homogênea em um cubo
apsi : Resolves problemas envolvendo temperatura, vento e poluição
fpppp : Química quântica
wave5: Física do plasma (simulação de partícula eletromagnética)
19
Exemplo 1 de Benchmark – Programas
3DMark2001 SE
PCMark04
Sandra 2004 versão 9.89
SYSmark2002
20
Exemplo 1 de Benchmark – Configuração
Configuração de Hardware Athlon 64 : Chaintech ZNF3-150(nForece3-150, BIOS de 13 /10/2003) Pentium 4 : Soyo P4I875P (Intel 875P, BIOS de 19/10/2003) Pentium 4 "Prescott": Intel D875PBZ (Intel 875P, BIOS P21) Memória: Dois módulos 256 MB PC3200 TwinMOS em configuração DDR Dual Channel. Disco rígido: Maxtor DiamondMax 9 Plus (60 GB, ATA-133) Placa de Vídeo: Gigabyte Radeon 9800 Pro Resolução de vídeo: 800x600x32
Configuração de Software Windows XP Professional em português, instalado em NTFS Service Pack 1A Direct X 9.0B Versão do driver nForce: 3.13 Versão do driver Inf Intel: 5.0.2.1003 Versão do driver de vídeo ATI: 7.95 (6.14.10.6396)
21
Exemplo 1 de Benchmark: Sandra 2004 (processador)
Mede a quantidade de instruções por segundo que o processador é capaz de executar, não considera como o processador é usado, isto é, não simula seu uso em programas comerciais.
22
Benchmark : Unidade de Ponto Flutuante (FPU)
O teste Inclui os cálculos necessários para a renderização de imagens tridimensionais, com os resultados do teste dados em instruções de ponto flutuante por segundo.
23
Simula a utilização de aplicativos reais
Benchmark: Desempenho Geral ( SYSmark2002)
24
Benchmark : 3DMark2001 SE (programas 3D)
Jogos 3D exigem o máximo de processamento matemático, vídeo 3D, disco e memória .
25
Exemplo 2 de Benchmark – Configuração
Processador Clock Interno Clock Externo Dados por Clock Cache L1 Cache L2 Cache L3
Athlon 64 3200+ 2 GHz 200 MHz 2 128 KB 1 MB Não
Athlon 64 3400+ 2,2 GHz 200 MHz 2 128 KB 1 MB Não
Athlon XP 3200+ 2,2 GHz 200 MHz 2 128 KB 512 KB Não
Pentium 4 3,2 GHz 3,2 GHz 200 MHz 4 158 KB 512 KB Não
Pentium 4 3,2 GHz "E" 3,2 GHz 200 MHz 4 166 KB 1 MB Não
Pentium 4 3,4 GHz 3,4 GHz 200 MHz 4 158 KB 512 KB Não
Pentium 4 Extreme Edition 3,2 GHz 3,2 GHz 200 MHz 4 158 KB 512 KB 2 MB
Pentium 4 Extreme Edition 3,4 GHz 3,4 GHz 200 MHz 4 158 KB 512 KB 2 MB
26
Exemplo 2 de Benchmark – Sandra 2005
27
Exemplo 3 de benchmark : PCMark04 (1)
SO : SO : MS Windows XP – Configuração de HW:
Processador Pentium 4 2.66GHz Pentium 4 2.80GHzPentium 4 Mobile
HT 3.06 GHz
VídeoNVIDIA GeForce FX
5200 Intel 82865GATI MOBILITY RADEON 9000
Memória 510 502 446
28
Exemplo 3 de benchmark : PCMark04 (2)
1736
1906,0
1795,0
570,0
2795
3406,0
3179,0
590,0
3405
4353,0
2371,0
876,0
0 1000 2000 3000 4000 5000
PCMark
CPU
Memory
Graphics
P4 3.06 HT
P4 2.8
P4 2.66
Exemplo 4 de benchmark AMD Opteron 250 2.4 GHz x Intel Xeon 3.6 GHz
Opteron 100 Series Opteron 200 Series Opteron 800 Series
HyperTransport channels 2x 200 MHz quad-pumped 3x 200 MHz quad-pumped 4x 200 MHz quad-pumped
Total bandwidth I/O 6.4 GB/s 9.6 GB/s 12.8 GB/s
Applications Single-processor Single-processorDual-processor
Single-processorDual-processorMulti-Processor( up to 8)
30
Processadores AMD Opteron -características
31
32
33
top related