la evolución del sistema que está cambiando el mundo hpc (high performance computing)
DESCRIPTION
TRANSCRIPT
NVIDIA® Quadro y Tesla
Soluciones para Profesionales
Análisis de Beneficios
Steve Harpster
Solutions Architect
XXIV Congreso de Telecomunicaciones
Octubre, 2009
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 2
NVIDIA HoyLíder de mundo en tecnologías visuales y cómputo de GPU
$4.1mil millones en ingresos FY08
Mas que 5,400 empleados
U$1.6 mil millones investigación y desarrollo en los 3 años pasados
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 3
Tesla®
Descubra y cómputo
Quadro®
Creación de contenidos digitales
GeForce®
Experiencia
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 4
Familias de GPU NVIDIA
3D Técnico Central
2D Profesional Servidor Corporativo
Quadro SDIQuadro G-SyncQuadro PlexMiddleware
NVIDIA Quadro NVS
NVIDIA Quadro FX
Soluciones Industriales
Consumidores:Entretenimiento
ProfesionalesDiseño & Creación:
Profesionales:HPC
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 5
NVIDIA Professional Market Solutions
NVIDIA SLI
NVIDIA HD SDI
NVDIA G-Sync
Movil/PC Portatil
Blades de Escritorio Remoto
PC de Escritorio
Servidores Gráficos Remotos
Power Desk Side
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 6
Canalización (Pipeline) de vídeo Digital con QuadroQuadro Digital Video pipeline
Transmisión y vídeo digital
Producción de película, postproducción
y acabado de cine
Mercados de nuevos medios
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 7
Estudio virtual de Transmisión (Broadcast)“Confiamos en las soluciones video digital de NVIDIA Quadro para entregar formatos del SD y de HD en una sola solución barata… dando a nuestros clientes los gráficos en tiempo real más rápidos con calidad.”
-- Paul Lacombe, President, Brainstorm
Images Courtesy of Brainstorm & Accuweather Images Courtesy of Brainstorm & NBC Universal
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 8
Live Broadcast- Transmisión en vivo
Images Courtesy of SportVision, NBC & IOC
“NVIDIA Quadro entregan la plataforma con la más de alta calidad y más confiable de la industria para producir efectos virtuales en tiempo real en transmisiones en vivo.”
-- Marv White, CTO SportVision
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 9
NVIDIA® Quadro® Digital Video Pipeline La primera solución basada en la GPU y integrada completamente
SISTEMA
QuadroSDI Salida
CPU
QuadroSDI Captura
API/Driver UnificadoGráficos(OGL & D3D): Captura, Proceso, Salida SDI VideoComputando (OGL, D3D, C, Open CL): procese la imagen
Beneficios- Envia vídeo
directamente a la memoria GPU
- Latencia es menos
- La utilización de la CPU es menos
- Drivers de un único proveedor
Quadro GPUCálculo y Gráficos
Memoria
SDI Video
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 10
Quadro Digital Video Pipeline in Broadcast
SYSTEM
CPUMemoria
HD-SDI
Transfiere PCIe
HD-SDI
Transfiere DVI
Images Courtesy of SportVision & MLBXXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 11
Quadro SDI CapturaCaptura de vídeo SDI directamente a Quadro GPU
Ruta más rápido para la vídeo captura a la memoria de Quadro GPUCaptura todos los formatos de vídeo SDI SMPTELa única solución para la captura de hasta 4 señales SDI4 Single Link, 2 Dual Link, 2 3G-SDI Single Link, 1 3G-SDI Dual Link
Conector de BNCCompatible con Quadro FX 5800,
4800, and 3800
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 12
Quadro SDI Output (Salida)Gráficos-a-Vídeo directamente desde Quadro
Compatible con formatos SD,HD,2K SDI SMPTE 2 conectores de BNC (75 Ohm)
2 Single link, 1 Dual link
Compatible con Quadro FX 5800, 4800, and 3800
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 13
Servicios de “streaming vídeo” de Internet en vivo
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 14
2002 2003 2004 2006 2007 20082005 2009 2010
Mejor rendimiento puro con la GPU que la CPU.
GPUNVIDIA Quadro FX 5800240 núcleos933 GFLOPS
CPUIntel Core i7 965
4 núcleos102 GFLOPS
CPU
GPU
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 15
Codificadores son la puerta de enlace a servicios nuevos de MultiMedia
SISTEMA
CPU
h.264
Memoria
Mejor rendimiento puro con la GPU que la CPU
HD-SDI
TransfierePCIe
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 16
Soluciones Profesionales NVIDIA
80% de Participación Global en el mercado de Gráficos Profesionales
La GPU Profesional de Elección para:
CAD/CAM
80%
DCC
90%
WS de Finanzas 85%
Visualización Petrolera
60%
Simulación Visual 75%Aprende de Quadro & AutoCAD y Adobe - www.nvidia.com/builtforpros
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 17
Liderazgo en Certificación ISV de Workstations Quadro FX
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 18
Familia Unificada de Quadro WS DT
NVIDIA Quadro FX 380
NVIDIA Quadro FX 3800
NVIDIA Quadro FX 1800
FX 580 FX 1800+ 2x Frame Buffer ( to 512MB)+ HD Video Connector (FX 1700 only)+ 1.3x Performance
FX 380 FX 580+ 2x DP + Dual Dual Link DVI+ 1.3x Performance
NVIDIA Quadro FX 580
FX 1900 FX 3800+ 3pin Stereo Connector+ SLI+ 1.3X Performance
FX 4800 FX 5800( 4GB)+ SDI/Genlock/Framelock+ 2x DVI, 1x DP
FX 3800 FX 4800+ (1.5GB)+ SDI/Genlock/Framelock+ 2x DP, 1x DVI
Ult
ra A
lto
Niv
el
Alt
o N
ive
lR
an
go
-M
ed
ioE
ntr
ad
a
*ESP as of 2/12/08 from www.Pricegrabber.com
FX 380256 MB Frame BufferDual Dual Link DVI
Quadro FX 4800
Quadro FX 5800
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
Productos NVIDIA Tesla Serie 10
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 20
Porque usa la GPU por computación
El modelo para computar de GPU es utilizar una CPU y un GPU junto en un modelo que computa heterogéneo.
La parte secuencial del aplicaciones funciona en la CPU y la parte computa muy intenso, funciona en el GPU.
De la perspectiva del usuario, el uso funciona más rápidamente porque está utilizando el rendimiento mas alto del GPU para alzar funcionamiento.
CUDA es una arquitectura de cómputo paralelo para fines generales que aprovecha el motor de cómputo paralelo de las unidades de procesamiento gráfico (GPU) para resolver muchos de los problemas de cómputo más complejos en una fracción del tiempo requerido por la CPU.
Cores = núcleos
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 21
1,400 millones de transistores
1 TeraFLOP de poder de procesamiento
240 núcleos
El procesador Tesla Serie 10
Procesador CUDA de NVIDIA de segunda generaciónXXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 22
.
Las aplicaciones en las áreas de electromagnetismo y electrodinámica utilizando GPU compatibles con CUDA se han implementado ampliamente en clientes como Motorola, Kodak, Nokia, etc. Por ejemplo, como muestran los gráficos, la aceleración de FDTD basada en la GPU se escala con el número de GPU
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 23
Hay varios proyectos en marcha encaminados a
acelerar códigos de química cuántica
utilizando GPUs con CUDA, lo que incluye
trabajos con Gaussian y GAMESS. Los gráficos
siguientes muestran los resultados más
representativos, seguidos de enlaces con aplicaciones y
publicaciones técnicas relativas al uso de CUDA
en química computacional.
l.
Hay varios proyectos en marcha encaminados a acelerar códigos de química cuántica utilizando GPUs con CUDA, lo que incluye trabajos con Gaussian y GAMESS. Los gráficos siguientes muestran los resultados más representativos, seguidos de enlaces con aplicaciones y publicaciones técnicas relativas al uso de CUDA en química computacional.
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 24
En la actualidad se está trabajando para utilizar código CUDA en aplicaciones de valoración de derivados, análisis de riesgos y trading algorítmico. A continuación presentamos los resultados de este trabajo junto con algunos gráficos representativos sobre generadores de números aleatorios y simulaciones Montecarlo.
Generadores de números aleatorios en el SDK de
CUDA
Valoración basada en
simulaciones Montecarlo
con SciFinance
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 25
Reconocimiento de imagen, procesamiento de señales y minería de datos (Data Mining) son aplicaciones perfectas para el cálculo de GPU.
“Hemos conseguido una aceleración de 75X con CUDA y Tesla sobre un 2,83 GHz Intel Core2”
Procesamiento de señales
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 26
Hay varios proyectos en marcha encaminados a acelerar códigos de química cuántica utilizando GPUs con CUDA, lo que incluye trabajos con Gaussian y GAMESS. Los gráficos siguientes muestran los resultados más representativos, seguidos de enlaces con aplicaciones y publicaciones técnicas relativas al uso de CUDA en química computacional.
Las aplicaciones de mecánica de fluidos para el cálculo de modelos climatológicos y oceánicos, como el modelo WRF (Weather Research and Forecasting), y las simulaciones de maremotos han experimentado avances extraordinarios que permiten acelerar su ejecución y sus niveles de precisión.
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 27
146X
Imágenes MédicasU of Utah
36X
Dinámica Molecular
U of Illinois, Urbana
18X
Transcodificación de Video
Elemental Tech
50X
Cómputo MATLABAccelerEyes
100X
AstrofísicaRIKEN
149X
Simulación financiera
Oxford
47X
Álgebra LinearUniversidad
Jaime
20X
3D UltrasonidoTechniscan
130X
Química CuanticaU of Illinois, Urbana
30X
Secuencia Genetica
U of Maryland
Incrementos en Rendimiento de 20x hasta 150x!
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 28
Procesador 1 x Tesla T10
Núcleos 240
Velocidad de Reloj
1.296 GHz
Rendimiento de Punto Flotante
933 GFlops Precisión Sencilla
78 GFlops Precisión Doble
Memoria 4.0 GB
Ancho de Banda
102 GB/sec máximo
I/O de Memoria512-bit, 800MHz GDDR3
TamañoFull ATX: 4.736” x
10.5”Dual slot wide
I/O de Sistema PCIe x16 Gen2
Uso de Energía 160 W
Procesador de Cómputo Tesla C1060
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 29
TeslaS1070
Servidor anfitrión
Tarjetas de Interfáz PCIe en servidor
CablesPCIe Gen2
Tarjeta de Interfáz de servidor PCIe
Gen2
Cable PCIe Gen2(0.5m largo)
Conectando Tesla S1070 a Servidor Anfitrión
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 30
Ciencias biológicas y equipos médicos
Productividad/ Misc
Exploración de petróleo
y gas EDA FinanzasCAE /
MatemáticoComunica-
ción
Max Planck
FDA
Robarts Research
Medtronic
AGC
Evolved machines
Smith-Waterman DNA
sequencing
AutoDock
NAMD/VMD
Folding@Home
Howard Hughes MedicalCRIBI
Genomics
GE Healthcare
Siemens
Techniscan
Boston Scientific
Eli Lilly
Silicon Informatics
Stockholm Research
Harvard
Delaware
Pittsburg
ETH Zurich
Institute Atomic Physics
CEA
NCSA
WRF Weather Modeling
OptiTex
Tech-XElemental
TechnologiesDimensional
Imaging
Manifold
Digisens
General Mills
Rapidmind
Rhythm & Hues
xNormal
Elcomsoft
LINZIK
Hess
TOTAL
CGG/Veritas
Chevron
Headwave
Acceleware
Seismic City
P-Wave Seismic Imaging
Mercury Computer
ffA
Synopsys
Nascentric
Gauda
CST
Agilent
Symcor
Level 3
SciComp
Hanweck
Quant Catalyst
RogueWave
BNP Paribas
AccelerEyes MathWorks
Wolfram
National Instruments
Ansys
Access Analytics
Tech-x
RIKEN
SOFA
Renault
Boeing
Nokia
RIM
Philips
Samsung
LG
Sony Ericsson
NTT DoCoMo
Mitsubishi
Hitachi
Radio Research Laborator
y
US Air Force
5000+ Clientes / ISVs
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 31
Generación siguienteCode Named “Fermi”
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 32
Arquitectura ‘Fermi’ El alma de un Supercomputer en un cuerpo de un GPU
3 mil millones transistores
Sobre 2x los corazones (núcleos) (512 totales)
Funcionamiento 8x mas con doble precision
ECC
L1 and L2 Caches
Anchura de banda de la memoria ~2x (GDDR5)
Hasta 1 Terabyte memoria de GPU
Núcleos (Kernels) concurrentes de la memoria de GPU, C++
DR
AM
I/F
HO
ST
I/F
Gig
a T
hre
adD
RA
M I
/F
DR
AM
I/FD
RA
M I/F
DR
AM
I/FD
RA
M I/F
L2
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 33
Mas grande y mas rápido
GDDR5 interfaz de la memoria2x más rápida que GDDR3
Hasta 1 Terabyte memoria de GPU
Funcionará en conjuntos de datos grandes D
RA
M I/
FG
iga
Th
read
HO
ST
I/F
DR
AM
I/F
DR
AM
I/FD
RA
M I/F
DR
AM
I/FD
RA
M I/F
L2
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 34
GigaThreadTM Hardware Thread Scheduler (HTS)
Maneja jerárquico millares de hilos simultáneamente activos
10x mas rapido en conmutación de contexto
Ejecución concurrente del núcleo
HTS
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 35
GigaThread Hardware Thread Scheduler
Ejecución serial del núcleo (kernels)
Ejecución paralela del núcleo (kernels)
Tim
e
Kernel 1
Kernel 1
Kernel 2
Kernel 2 Kernel 3
Kernel 3
Ker4
nel
Kernel 5
Kernel 5
Kernel 4
Kernel 2
Kernel 2
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
© NVIDIA Corporation 2008 NVIDIA Restricted Confidential 36
GPU Computing Applications
CUDA Parallel Computing Architecture
NVIDIA GPU with the CUDA Parallel Computing Architecture
C OpenCLtm Direct Compute Fortran
Java and Python
OpenCL is trademark of Apple Inc. used under license to the Khronos Group Inc.
C++
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009
Questions?Preguntas?
XXIV Congreso de Telecomunicaciones, Cartagena de Indias, Octubre 2009