implementando data mining con sql server 2012

21
Implementando Data Mining con SQL Server 2012 23/07/2014 César Oviedo Blanco MVP | MCT | MCSE | MCITP | MCTS CEO, Sensus Data & Analytics Business Intelligence LATAM

Upload: spanishpassvc

Post on 01-Jul-2015

455 views

Category:

Technology


1 download

DESCRIPTION

El desconocimiento es uno de los problemas más importantes en la adopción de las nuevas tecnologías. Y en la Minería de Datos giran una gran serie de mitos y miedos. Esta charla se enfoca en simplificar y exponer las bondades de la Minería de Datos, así como la implementación en SQL Server 2012.

TRANSCRIPT

Page 1: Implementando Data Mining con SQL Server 2012

Implementando Data Mining con SQL Server 2012

23/07/2014

César Oviedo Blanco

MVP | MCT | MCSE | MCITP | MCTS

CEO, Sensus Data & Analytics

Business Intelligence LATAM

Page 2: Implementando Data Mining con SQL Server 2012

Speaker

MVP César Oviedo

BI LATAM Community Manager

CEO Sensus Data & Analytics

MCT, MCSE, MCSA, MCITP, MCTSwww.businessintelligencelatam.com

/BusinessIntelligenceLatam

/groups/businessintelligencecr/

/BILATAM

Page 3: Implementando Data Mining con SQL Server 2012

Minería de Datos

3

Page 4: Implementando Data Mining con SQL Server 2012

Definición de Minería de Datos

“La minería de datos es el proceso de detectar información

procesable de grandes conjuntos de datos. Utiliza el análisis

matemático para deducir los patrones y tendencias que

existen en los datos. Normalmente, estos patrones no se

pueden detectar mediante la exploración tradicional de los

datos porque las relaciones son demasiado complejas o

porque hay demasiado datos.”

4

Page 5: Implementando Data Mining con SQL Server 2012

En qué consiste la Minería de Datos?

Page 6: Implementando Data Mining con SQL Server 2012

Usos Típicos

Predictive

analytics

Seek

profitable

customers

Understand

customer

needs

Anticipate

customer

churn

Predict

sales &

inventory

Build

effective

marketing

campaigns

Detect and

prevent

fraud

Correct

data

Page 7: Implementando Data Mining con SQL Server 2012

Algoritmos en SSAS

Algorithm Description

Decision Trees Finds the odds of an outcome based on values in a training set, presents visually

Association

Rules

Identifies relationships between cases

Clustering Classifies cases into distinctive groups based on any attribute sets

Naïve Bayes Clearly shows the differences in a particular variable for various data elements

Sequence

Clustering

Groups or clusters data based on a sequence of previous events

Time Series Analyzes and forecasts time-based data combining the power of ARTXP

(developed by Microsoft Research) for short-term predictions with ARIMA for

long-term accuracy.

Neural Nets Seeks to uncover non-intuitive relationships in data

Linear

Regression

Determines the relationship between columns in order to predict an outcome

Logistic

Regression

Determines the relationship between columns in order to evaluate the

probability that a column will contain a specific state

Page 8: Implementando Data Mining con SQL Server 2012

k-means (promedio como centroide)

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2.5

2.0

1.5

1.0

0.5

0

Iteración 1

Page 9: Implementando Data Mining con SQL Server 2012

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2.5

2.0

1.5

1.0

0.5

0

k-means (promedio como centroide)

Iteración 2

Page 10: Implementando Data Mining con SQL Server 2012

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2.5

2.0

1.5

1.0

0.5

0

k-means (promedio como centroide)

Iteración 3

Page 11: Implementando Data Mining con SQL Server 2012

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2.5

2.0

1.5

1.0

0.5

0

k-means (promedio como centroide)

Iteración 4

Page 12: Implementando Data Mining con SQL Server 2012

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2.5

2.0

1.5

1.0

0.5

0

k-means (promedio como centroide)

Iteración 5

Page 13: Implementando Data Mining con SQL Server 2012

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2.5

2.0

1.5

1.0

0.5

0

k-means (promedio como centroide)

Iteración 6

Page 14: Implementando Data Mining con SQL Server 2012

Patrones sin sentido

Clúster con sentido pues todos

fueron colonias de Gran Bretaña Clúster sin sentido pues no hay

relación entre los países

Page 15: Implementando Data Mining con SQL Server 2012

DEMO

15

Page 16: Implementando Data Mining con SQL Server 2012

Preguntas y Comentarios

16

Page 17: Implementando Data Mining con SQL Server 2012

Manténgase conectado a nosotros!

17

Visítenos en http://globalspanish.sqlpass.org

/SpanishPASSVC

lnkd.in/dtYBzev

/user/SpanishPASSVC

/SpanishPASSVC

Page 18: Implementando Data Mining con SQL Server 2012

Próximos Eventos

Los casos de uso para In-Memory OLTP

6 de AgostoWarner ChavesSQL Server MCM

Resumen

Introducción a la tecnología de In-Memory OLTP con demos de

comparaciones entre implementación 'Clasica' vs 'In-Memory'. Parte

de la sesión que Warner va a estar presentando en el próximo PASS

SUMMIT en Noviembre

Page 19: Implementando Data Mining con SQL Server 2012

Programa de Reconocimiento

Programa de Voluntario Sobresaliente

• PASS le invita a nominar a su voluntario favorito para ser “Voluntario Sobresaliente del Mes”

• Enviar nominaciones en todo momento a: [email protected]

Favor proveer:

• Información de contacto del nominado,

• una lista breve de los programas de PASS que a participado el nominado

• los años que lleva activo en la comunidad

• una corta descripción por el cual considera que esta persona debe ser reconocida

• Los nominados seleccionados serán anunciados en la edición del boletín PASS Connector y recibirán un

certificado de apreciación.

Page 21: Implementando Data Mining con SQL Server 2012

Manténganse Conectados!

• Solicite su suscripción gratuita en sqlpass.org

• Linked In: Professional Association for SQL Server

• Facebook: Professional Association for SQL Server Group

• Twitter: @SQLPASS

• The PASS Blog: sqlpass.org