implementando data mining con sql server 2012
DESCRIPTION
El desconocimiento es uno de los problemas más importantes en la adopción de las nuevas tecnologías. Y en la Minería de Datos giran una gran serie de mitos y miedos. Esta charla se enfoca en simplificar y exponer las bondades de la Minería de Datos, así como la implementación en SQL Server 2012.TRANSCRIPT
Implementando Data Mining con SQL Server 2012
23/07/2014
César Oviedo Blanco
MVP | MCT | MCSE | MCITP | MCTS
CEO, Sensus Data & Analytics
Business Intelligence LATAM
Speaker
MVP César Oviedo
BI LATAM Community Manager
CEO Sensus Data & Analytics
MCT, MCSE, MCSA, MCITP, MCTSwww.businessintelligencelatam.com
/BusinessIntelligenceLatam
/groups/businessintelligencecr/
/BILATAM
Minería de Datos
3
Definición de Minería de Datos
“La minería de datos es el proceso de detectar información
procesable de grandes conjuntos de datos. Utiliza el análisis
matemático para deducir los patrones y tendencias que
existen en los datos. Normalmente, estos patrones no se
pueden detectar mediante la exploración tradicional de los
datos porque las relaciones son demasiado complejas o
porque hay demasiado datos.”
4
En qué consiste la Minería de Datos?
Usos Típicos
Predictive
analytics
Seek
profitable
customers
Understand
customer
needs
Anticipate
customer
churn
Predict
sales &
inventory
Build
effective
marketing
campaigns
Detect and
prevent
fraud
Correct
data
Algoritmos en SSAS
Algorithm Description
Decision Trees Finds the odds of an outcome based on values in a training set, presents visually
Association
Rules
Identifies relationships between cases
Clustering Classifies cases into distinctive groups based on any attribute sets
Naïve Bayes Clearly shows the differences in a particular variable for various data elements
Sequence
Clustering
Groups or clusters data based on a sequence of previous events
Time Series Analyzes and forecasts time-based data combining the power of ARTXP
(developed by Microsoft Research) for short-term predictions with ARIMA for
long-term accuracy.
Neural Nets Seeks to uncover non-intuitive relationships in data
Linear
Regression
Determines the relationship between columns in order to predict an outcome
Logistic
Regression
Determines the relationship between columns in order to evaluate the
probability that a column will contain a specific state
k-means (promedio como centroide)
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2.5
2.0
1.5
1.0
0.5
0
Iteración 1
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2.5
2.0
1.5
1.0
0.5
0
k-means (promedio como centroide)
Iteración 2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2.5
2.0
1.5
1.0
0.5
0
k-means (promedio como centroide)
Iteración 3
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2.5
2.0
1.5
1.0
0.5
0
k-means (promedio como centroide)
Iteración 4
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2.5
2.0
1.5
1.0
0.5
0
k-means (promedio como centroide)
Iteración 5
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2.5
2.0
1.5
1.0
0.5
0
k-means (promedio como centroide)
Iteración 6
Patrones sin sentido
Clúster con sentido pues todos
fueron colonias de Gran Bretaña Clúster sin sentido pues no hay
relación entre los países
DEMO
15
Preguntas y Comentarios
16
Manténgase conectado a nosotros!
17
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
Próximos Eventos
Los casos de uso para In-Memory OLTP
6 de AgostoWarner ChavesSQL Server MCM
Resumen
Introducción a la tecnología de In-Memory OLTP con demos de
comparaciones entre implementación 'Clasica' vs 'In-Memory'. Parte
de la sesión que Warner va a estar presentando en el próximo PASS
SUMMIT en Noviembre
Programa de Reconocimiento
Programa de Voluntario Sobresaliente
• PASS le invita a nominar a su voluntario favorito para ser “Voluntario Sobresaliente del Mes”
• Enviar nominaciones en todo momento a: [email protected]
Favor proveer:
• Información de contacto del nominado,
• una lista breve de los programas de PASS que a participado el nominado
• los años que lleva activo en la comunidad
• una corta descripción por el cual considera que esta persona debe ser reconocida
• Los nominados seleccionados serán anunciados en la edición del boletín PASS Connector y recibirán un
certificado de apreciación.
http://www.sqlpass.org/summit/2014
November 4 - 7 |
Seattle, WA
Manténganse Conectados!
• Solicite su suscripción gratuita en sqlpass.org
• Linked In: Professional Association for SQL Server
• Facebook: Professional Association for SQL Server Group
• Twitter: @SQLPASS
• The PASS Blog: sqlpass.org