propuesta de tesis audante ramos, néstor rafael seminario de tesis i credit scoring para pymes...
Post on 01-Jan-2015
21 Views
Preview:
TRANSCRIPT
Propuesta de Tesis
Audante Ramos, Néstor Rafael
Seminario de Tesis I
Credit Scoring para Pymes Financieras
08 de noviembre de 2007
22 /31/31
Tesista:
• Audante Ramos, Néstor Rafael
Especialidad: Ingeniería de Sistemas
Universidad: Universidad Nacional de Ingeniería
Ciclo Relativo: 9no
e-mail: nrafael1@yahoo.es
33 /31/31
PROPUESTA
44 /31/31
Título
Credit Scoring para Pymes Financieras
55 /31/31
Justificación del Problema• La presente tesis justificaciones presenta las siguientes
justificaciones:• Las Instituciones Micro financieras No bancarias (IMFNB),
son las más dinámicas en el otorgamiento de créditos y servicios financieros para los agentes económicos que no son atendidos en el sistema financiero normal.
• Sin embargo, un problema que vienen enfrentando estas entidades financieras es la morosidad, la cual en el caso de las CMAC se situó en 5,1% en el 2006.
Capítulo 3 de Sampieri
66 /31/31
• Otra Justificación para realizar investigación consiste en el realizar una mejora en los métodos de cálculo que se utilizan para asignarle los scores a los clientes, que en la actualidad, en el Perú se realizan sólo con técnicas estadísticas y no hacen uso de las ventajas, en cuanto a precisión en el calculo, que nos presentan las técnicas de inteligencia artificial
77 /31/31
Ámbito de la investigación
• Alcance de la investigación:
Esta investigación es válida para PYMES financieras peruanas, pues es en base a las características y necesidades de las mismas que se desarrollará el modelo
Limitaciones de la Investigación
• Una de las limitaciones mayores que se presentan es que la información a la que se pretende acceder es de carácter sensible para las empresas financieras, por lo que los trámites para conseguirla podrían extender demasiado el tiempo de la investigación.
88 /31/31
La problemática• Se presenta una alta tasa de morosidad para el caso de
las entidades financiera PYMES, tanto así que el dinero que cobran por los intereses no logran a cubrir el riesgo en el que incurren.
• Los criterios de evaluación de un crédito se basan en cuestiones subjetivas más que en un modelo en concreto.
• Los intentos por realizar scoring en el Perú anteriormente han fracasado.
Capítulo 3 de Sampieri
99 /31/31
El Problema
• Para decidir si conceder o no productos financieros (ya sea prestamos, tarjetas de credito, etc.) a los clientes, las instituciones financieras consideran una serie de factores acerca del mismo
• La cuestión de fondo es: ¿Cómo unimos estos factores, para que de manera objetiva, matemática y científica (hasta donde sea posible) se pueda obtener una evaluación de crédito adecuada?
Capítulo 3 de Sampieri
1010 /31/31
Arból de Problemas
1111 /31/31
Objetivos
• Objetivo Superior
• Desarrollar un modelo que ayude a eliminar las pérdidas en instituciones financieras ocasionadas por la no cancelación de las deudas, y que a su vez permita ubicar a los clientes en determinados segmentos.
Capítulo 3 de Sampieri
1212 /31/31
Objetivo PrincipalBrindar una herramienta que permita categorizar clientes en base a un conjunto de tipologías y/o propensión para hacer un adecuado manejo de los mismos, las ventajas que se derivan de esto son:
• Menor nivel de riesgo de la Entidad: clientes nuevos de menor riesgo, cobranza preventiva, menor deterioro de cartera.
• Mejores niveles de recaudo de Cartera: Gracias a mejores clientes nuevos, mejores estrategias de cobranza, mayor retención de clientes.
• Mejor utilización de los recursos:Mejor utilización de los recursos: Conocimiento de clientes facilita dirección a mercado objetivo, menores gastos de aprobación (mayor agilidad y menos instancias), estrategias de cobranza mas eficientes, estrategias de mercado efectiva a clientes potenciales.
1313 /31/31
Objetivos Específicos• Presentar un modelo que permita identificar a clientes que
tengan la tipología de clientes rentables, para acogerlos, o incentivarlo a que consuman, o en todo caso incrementen el consumo, de nuestras tarjetas de crédito.
• Que el modelo permita también identificar aquellos clientes que tienen la tipología de clientes riesgosos para evitar cualquier tipo de fraude en el crédito asignado.
• Que el sistema proceda a catalogar a clientes en base a los criterios fijados por la institución financiera
1414 /31/31
METODOLOGIA DE LA INVESTIGACION
1515 /31/31
Tipo de Investigación• El tipo de investigación presentado en este estudio tiene
naturaleza correlacional pues se busca explicar cómo el comportamiento de un conjunto de variables independientes correlacionadas influyen la variable dependiente, que en este caso vendría a ser el resultado de la evaluación, es decir si el cliente se presenta como un buen o un mal riesgo.
• La definición de variables tanto de entrada (variables independientes y variables de entrada del modelo) y las de salida (variable dependiente y variables de salida del modelo), en el diseño tanto de la investigación como del experimento
1616 /31/31
Tipo de Diseño• La investigación a realizar tiene un carácter experimental,
pues lo que se busca es explicar cómo influyen las variables independientes en la variable dependiente.
Para nuestro caso tratamos de probar la precisión del modelo elaborado teniendo como variables de entrada la técnica a utilizar, los métodos de la técnica determinada, los parámetros del método elegido en caso los tuviera y el % de data de entrenamiento y el de prueba.
• También se busca establecer el modelo que resulta mas preciso resultante de la interacción de los métodos anteriormente mencionados.
• Para el caso particular de las variables del modelo se encuentran pre-establecidas, pero también se busca establecer cual de estas características son las que explican mejor el modelo.
1717 /31/31
DISEÑO DE LA INVESTIGACION
1818 /31/31
Objeto de la Investigación
• Nuestro objeto de investigación es: El cliente que solicita un producto en un momento determinado
en una institucion dada.
Capítulo 5 de Sampieri
1919 /31/31
Población
• Nuestra población la conforman todos los clientes de entidades financieras, sean estos Bancos, Cajas Municipales, Cajas Rurales, Cooperativas u otras PYMES Financieras
2020 /31/31
Muestra• Para poder plantear un modelo de credit scoring se
necesita datos históricos de clientes, y el punto de mira para conseguirlos estuvo en las entidades bancarias, pero el resultado del esfuerzo desplegado fue nulo puesto que se acogen al secreto de datos para no ceder información sobre sus clientes.
• Ante tal negativa, y el empeño por desarrollar el presente trabajo, recurrí a los datos que encontré en el CD del libro “Credit Scoring and its Aplications” que nos permite plantear y probar el modelo.
Capítulo 8, sampieri
2121 /31/31
Variables
• Las variables que incluimos en el diseño del experimento se pueden clasificar como:
• Variables Independientes• Variables Dependientes• Variables del modelo
Capítulo 7
2222 /31/31
Variables Independientes
• El método a aplicar para construir modelo de credit scoring (Redes neuronales, algoritmos genéticos, etc).
• El valor de los parámetros utilizados para construir el modelo. Por ejemplo: Para el caso de las redes neuronales, para los algoritmos de selección el parámetro sería el K del algoritmode K-Fold cross validation.
2323 /31/31
Variables dependiente
• El error calculado del pronóstico y por tanto la precisión del mismo.
2424 /31/31
Variables del modelo
• La data de prueba "`German Credit dataset"' consiste 20 de variables de entrada, entre variables continuas y categoricas, y una sola variable objetivo: El tipo riesgo del cliente (CreditRisk: Good or bar), la cual indica si el individuo representa un buen o mal riego:
• Un ejemplo de variable de entrada del modelo sería:
PURPOSE: Propósito para el que se solicitó el préstamo
0: auto(nuevo), 1: auto (usado), 2: alimentos/indumentaria, 3: radio/televisión, 4: cuestiones domésticas, 5: reparaciones, 6: educación, 7: vacaciones, 8: retraining, 9: negocios y X: otros.
En la siguiente figura se describe todas las variables
2525 /31/31
Variables del modelo
2626 /31/31
Diseño de la Investigación• La variable dependiente se convierte en independiente por
medio de la función Scoring, que se muestra en la figura:
2727 /31/31
Diseño de la Investigación• En la siguiente figura se presenta las combinaciones entre los
valores de las clases de métodos a usar y los parámetros a considerar
2828 /31/31
Diseño de la Investigación
• Diseñe su investigación indicando las variables independientes y dependientes que va ha usar.
• Un experimento es un estudio en el que al menos una variable es manipulada y las unidades son aleatoriamente asignadas a los distintos niveles o categorías de las variables manipuladas.
• Explique si su investigación es experimental o no
Capítulo 7 de sampieri
2929 /31/31
Hipótesis
• H1 : La precisión del modelo elaborado ser´a mayor al 80 %.
• H2 : Un modelo mixto de credit scoring ofrecerá mayor precisión que un modelo no estadístico o que un modelo sólo estadístico.
Capítulo 6 de Sampieri
3030 /31/31
Contraste Hipótesis
• H0 : La precisión del modelo elaborado no será mayor al 80 %.
• H0 : Un modelo mixto de credit scoring no nos ofrecerá mayor precisión que un modelo no
estadístico ni que un modelo solo estadístico.
3131 /31/31
Instrumentos de Medición• Sean los valores para la caracter´ıstica GOOD BAD:
Good = 1, Bad = 0.
3232 /31/31
Instrumentos de Medición
Existen las siguientes posibilidades:• La posibilidad de que algunos clientes que siendo un mal
riesgo sean considerados como un buen riesgo, ellos serian considerados como FALSOS POSITIVOS.
• La posibilidad de que algunos clientes que siendo un mal riesgo sean considerados como un mal riesgo, ellos serian considerados como FALSOS NEGATIVOS.
• La posibilidad de que algunos clientes que siendo un buen riesgo sean considerados como un mal riesgo, ellos serian considerados como VERDADEROS NEGATIVOS.
• La posibilidad de que algunos clientes que siendo un buen riesgo sean considerados como un buen riesgo, ellos serian considerados como VERDADEROS POSITIVOS.
3333 /31/31
Instrumentos de Medición• Podemos determinar los siguientes indicadores:• SENSIBILIDAD: Es la posibilidad en los buenos riesgos, de ser
catalogados como tales: a/(a + c)• ESPECIFICIDAD: Es la posibilidad en los malos riesgos, de salir
catalogados como tales: d/(b + c)• VALOR PREDICTIVO POSITIVO: La posibilidad de que aquellos
salgan como buenos riesgos, sean buenos riesgos. a/(a + b)• VALOR PREDICTIVO NEGATIVO: La posibilidad de que los que sena
catalogados como malos riesgos, sean malos riesgos d/(c + d)
Estos indicadores nos ayudarían a cuantificar el riesgo, dado que nuestro objetivo es:
• Maximizar la cantidad de verdaderos positivos• Minimizar la cantidad de falsos positivos
3434 /31/31
Indicadores
Indicadores
3535 /31/31
MODELO DE SOLUCION
3636 /31/31
Modelo de Solución
3737 /31/31
Modelo Solución
• Se realiza con anticipación la elección de la técnica o tratamiento a aplicar en a la data.
• Se realiza la limpieza de la data en crudo mediante un proceso de data cleaning.
• Se realiza la obtención de la muestra N.• Se realiza la normalización de la data en N • Se realiza un proceso de selección de
características para de esta manera quedarnos estudiando sólo aquellas características que expliquen mejor la data.
3838 /31/31
Modelo Solución• Al llegar a este paso se habrá obtenido un conjunto de
características a las que llamare D. Este grupo se dividirá usando alguna técnica de inteligencia artificial ( dependiendo de los parámetros del método) en data de entrada y data de entrenamiento
• Se corre la data de entrenamiento con el fin de entrenar a la red
• Se hace correr la red con la data de prueba, y luego se compara con la data de prueba
• Se compara los casos resultados de la corrida con la data original, considerándose como ´exito toda coincidencia entre data de entrenamiento y data de prueba.
• Se calcula el error obtenido con esta t´ecnica
3939 /31/31
PLANEACIÓN
4040 /31/31
Cronograma de trabajo
4141 /31/31
Recursos Necesarios
Algunos de los recursos (a mi juicio los más importantes) a obtener son:
• computadoras• licencias de matlab• licencias de SPSS• Internet• Suscripción a revistas científicas: IEEE, ACM• Libros, revistas y publicaciones científicas• personal de apoyo en la investigación• asesores de la investigación
4242 /31/31
Costos• Más que un presupuesto lo que se presenta en esta parte
es una cotización del monto a desembolsar para realizar la investigación
• La fuente de financiamiento va a ser propia
4343 /31/31
CONCLUSIONES
4444 /31/31
Conclusiones• La data que usamos para el desarrollo del experimento sirvió como
instrumento para construir un modelo y probar el mismo, sin embargo queda pendiente la validación del modelo con data real, es decir, data de instituciones financieras.
• Producto de la revisión de la literatura se comprobó que los métodos de credit scoring se están volviendo cada vez mas precisos, pero un problema por el cual no han resultado exitosas algunas experiencias se debe al factor humano, recordemos que el modelo busca agilizar y automatizar el proceso de asignación de riesgos, mejorar la precisión del mismo, pero un sistema es mas que eso y para que funcionen deben funcionar unidos hardware,software y procedimientos manuales.
• Los modelos de credit scoring aplicados actualmente pueden ganar m´as valor si se concibierancomo instrumentos que permitan viabilizar regulaciones como: Basilea II o SolvenciaII.
top related