arquitectura de computadores ii paulo marques departamento de eng. informática universidade de...
Post on 07-Apr-2016
218 Views
Preview:
TRANSCRIPT
Arquitectura de Computadores II
Paulo MarquesDepartamento de Eng. InformáticaUniversidade de Coimbrapmarques@dei.uc.pt
2004
/200
5
2. Aspectos sobre Desempenho
2
Qual dos seguintes aviões é o mais rápido?
AviãoLotação
(Passageiros)
Autonomia
(Km)
Velocidade
(Km/h)Boeing 777 375 7,408 976Boeing 747 470 6,640 976Concorde 132 6,400 2,160Douglas DC8
146 13,952 870
Throughput(Passageiros x
Km/h)
366,000458,720285,120127,020
O conceito de “performance” depende directamenteda métrica que estamos interessados em medir!
3
As Medidas Fundamentais
Throughput: Número de trabalhos completados por unidade de tempo
Tempo de Execução:Tempo que cada trabalho demora a executar
...Tempo de Resposta/Latência
4
Produtividade vs. Tempo de Resposta
5
Performance
A máquina X é n vezes mais rápida do que a máquina Y
A máquina X é p% mais rápida do que a máquina Y
O throughtput da máquina X é k vezes superior ao da máquina Y No mesmo intervalo de tempo, X executa k vezes mais
tarefas mais do que Y
X
Y
TempoTempon
X
Yp
TempoTempo
)1( 100
YY
XX
TempoTarefas
TempoTarefas
k
6
Avaliação de Performance
A única forma fidedigna A única forma fidedigna de avaliar a performance de avaliar a performance de um sistema é medindo de um sistema é medindo o tempo que o sistema o tempo que o sistema demora a executar demora a executar aplicações reaisaplicações reais
7
Benchmarks
Aplicações Reais Aplicações Reais modificadas (scripted) Kernels Toy Benchmarks Benchmark sintéticos
Os resultados têm de ser reproduzíveis!
8
Desktop PC Benchmarks
Business Winstone Home/Business User Netscape, Office, Corel, Wordperfect
CC Winstone Multimedia Content Creation Photoshop, Premiere, Navigator, Audio-Editing
Winbench Kernel-based CPU Performance + Video Performance + Disk
Performance
SPEC (SPEC92, SPEC95, SPEC2000) CPU-oriented Integer (CINT2000) / Floating Point (CFP2000)
Workload
9
Server Benchmarks
SPECRate
SPECWeb / SPECNFS
TPC-C
TPC-H
...
10
Top processors on SPEC2000 (July/04)
0
200
400
600
800
1000
1200
1400
1600
1800
Intel Pentium4 HT3.4GHz
ExtremeEdition(Mar/04)
AMD Opteron1502.4GHz (May/04)
Intel Xeon 3.2GHz(Feb/04)
Fujitsu SPARC64V1.9GHz (Jun/04)
Itanium2 1.5GHz(Dec/03)
IBM POWER4+1.9GHz (May/04)
Alpha 21264C1.2GHz (Nov/02)
PowerMac G52.0GHz (Dec/03)***
CPU
INT2
000
CPU INTEGER PERFORMANCE
11
Top processors on SPEC2000 (July/04)
0
500
1000
1500
2000
2500
HP / Itanium21.5GHz (Feb/04)
FujitsuSPARC64V
1.9GHz (Jun/04)
IBM POWER4+1.7GHz (May/04)
AMD Opteron2482.2GHz (May/04)
Pentium4 HT3.4GHz
ExtremeEdition(Mar/04)
Alpha213641.2GHz (May/03)
AMD AthlonFX-512.2GHz (Sep/03)
Xeon 3.2GHz(Apr/04)
CFP
2000
CPU FLOATING POINT PERFORMANCE
12
Deve-se poder modificar o código dos benchmarks?
No source code modifications
Source code modifications are allowed but almost impossible to do...
Source code modifications are allowed
Deve Reflectir a PráticaCorrente do Ambiente Alvo
13
E tendo a workload correcta?
Problema de quantificar a utilização de P1 e P2
Problema da normalização relativamente a uma máquina
Máquina A
Máquina B
Programa P1(segundos)
1 10
Programa P2(segundos)
1000 100
Tempo Total(segundos)
1001 110
14
O caso do MIPS
MIPS = Millions of Instructions Per Second
Dependente da arquitectura da máquina Dependente do próprio programa que é utilizado Que tipo de instruções? Podem ocorrer “inversões de performance”
15
Lei de Amdahl
Um computador passa 3/4 do tempo a fazer cálculos e 1/4 do tempo a ler e a escrever do disco.
Qual o upgrade a fazer? Um CPU 2x mais rápido Um disco 1000x mais rápido
E se for um CPU 1000x mais rápido?
16
Speedup & Lei Amdahl
NEW
OLD
TTSpeedup
OPTOPTNÃO
OLD
TTTSpeedup
_
Caso óptimo: 0
OPTNÃO
OLDMáximo T
TSpeedup_
Gravíssimo
17
Problema com a Lei de Amdahl
Temos uma tarefa que demora T segundos a executar. A fim de melhorar o sistema, N processadores são colocados a executar a tarefa em paralelo.
18
Problema com a Lei de Amdahl (2)
O speedup depende intrinsecamente da parte que não pode ser optimizada!!!
np
npT ppT
Tpnspeedup )1()1(
1),(
n: número de processadoresp: percentagem que não pode ser optimizada (paralelizada)T: tempo que demora correr o código num processador
19
Bad News!!!
Speedup vs. Percentage of Non-Parallel Code
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Number of Processors
Spee
dup
0%
5%
10%
20%
Linear Speedup
20
Speedup Máximo
Fracção Não Optimizável
SpeedupMáximo
0%
5% 2010% 1020% 525% 4
ppTT
TTSpeedup
OLD
OLD
OPTNÃO
OLDMáximo
10_
p: percentagem do sistema que não é optimizável
21
Lei de Gustafson-Barsis
Por vezes, podemos não conseguir executar uma tarefa em particular mais rapidamente, mas podemos conseguir executar muitas delas ao mesmo tempo... “9 women cannot have a baby in 1 month, but they can
have 9 babies in 9 months”
e.g. “Problemas Grande Desafios”, “web serving”, etc.
22
Material para ler
Computer Architecture: A Quantitative Approach Secções 1.5 e 1.6, Excepto:
Normalized Execution Time/Geometric Means CPU Performance Equation (já data anteriormente)
Recomendado: 1.9 (Fallacies and Pitfalls) Ver a discussão sobre MIPS
top related