fuzzy duplicates arbutus analyzer

28
Aproveche la Tecnología para mejorar la eficacia de la Auditoría Interna

Upload: jorge-amaya

Post on 13-Apr-2017

142 views

Category:

Software


5 download

TRANSCRIPT

Page 1: Fuzzy Duplicates Arbutus Analyzer

Aproveche la Tecnologíapara mejorar la eficacia de la

Auditoría Interna

Page 2: Fuzzy Duplicates Arbutus Analyzer

Tecnología: Fortalece la función de

Auditoría Interna

¿Qué es

Data Mining?

AI Proceso – ¿Dónde estamos ahora?

¿Dónde debemos ?

Conductores de la

Auditoría Interna (AI)

Contenido

Page 3: Fuzzy Duplicates Arbutus Analyzer

El entorno en que hacemos negocios hoy en día es más complejo que nunca

Page 4: Fuzzy Duplicates Arbutus Analyzer

Una visión fragmentada de riesgo no es sostenible; dado que esto impide una comprensión común del

riesgo a través de dominios y se opone a la toma de decisiones basada en riesgos

CRO

CFO

CIO

CCO

Riesgo de IT

Riesgos

Operativos

Auditoría

Comunidad de

Negocios

Conductade Riesgo

RiestoFinanciero

Cambios

Regulatorios

Page 5: Fuzzy Duplicates Arbutus Analyzer

Conductores claves

para el cambio de la Auditoría Interna

Las necesidades de las organizaciones para la mitigación de riesgos y

aseguramiento han cambiado dramáticamente…

– El riesgo estratégico es una de las principales preocupaciones de las Juntas Directivas,

sin embargo, la cantidad de información proporcionada al respecto, el valor a impactar,

las oportunidades y amenazas estratégicas a menudo son limitadas.

– Dirección Ejecutiva también se centra en los riesgos estratégicos, organizativos y

empresariales.

– La globalización, la expansión y el ritmo acelerado de los cambios están aumentando la

complejidad de los riesgos.

– Los riesgos más amplios: riesgos en torno controles financieros y el cumplimiento básica

se gestionan de manera más efectiva, mientras que hay algunas técnicas sólidas para

supervisar los riesgos más amplios.

– Hacer más con menos: hay crecientes presiones para reducir el costo del cumplimiento.

Page 6: Fuzzy Duplicates Arbutus Analyzer

Conductores clavesLa Transformación de la Función de Auditoría Interna

Brecha de habilitación

• Evaluación de riesgos tradicional / enfoque de planificación de auditoría: Reactivo vs. Proactivo

• No es impulsado por los riesgos del negocio

• Fuerte enfoque en las unidades y ubicaciones auditables

• Uso limitado de análisis de datos

• Limitadas formación y desarrollo

• Falta de priorización efectiva

• Falta de voluntad para el cambio

• No se centra en la mejora de procesos claves del negocio

Brecha de competencia

• Modelo de corta rotación

• Falta de una escala jerárquica adecuada en áreas claves:

- IT, IFRS, seguridad, impuestos, pensiones

- Detección y prevención de fraude

• Actividad de Auditoría = recursos disponibles

• Rol tradicional de la función de Auditoría interna con un alcance limitado

• Alineación con el plan estratégico e iniciativs de soporte

• Percepción de la industria / visión competitiva

¿Qué impulsa la brecha?

Ideas de

NegocioControl y

cumplimiento

Áreas CriticasNo-negotiable Relevancia del Negocio

Brecha de competencia

Brecha de habilitación

Brecha de la

transformaciónAsesor

estratégico y

de valor

La brecha de la

transformación impide que

muchas funciones de AI se

conviertan en estratégicas

y generen valor para la

gerencia ejecutiva y la

junta directiva.

Enfoques orientados a ayudar a cubrir la brecha que permita

mejorar el rendimiento.

Page 7: Fuzzy Duplicates Arbutus Analyzer

Conductores claves

Retos frente a DEA

AddConIT Cía. Ltda.

Data Assurance

Los Directores Ejecutivos de Auditoría (DEA) se enfrentan a variosretos en lo que a Auditoría Continua (AC), concierne:

• ¿Dónde empiezo?

• ¿Qué tecnologías, debo tener en cuenta?

• ¿Cuáles son las mejores prácticas para el aprovechamiento de análisis de datos en la auditoría interna?

• ¿Qué obstáculos, qué debo evitar?

• ¿Qué están haciendo mis competidores? ¿Hay puntos de referencia u otras directrices que puedo utilizar para ayudar a dirigir mi estrategia?

• ¿Qué hace un exitoso piloto AC?

Page 8: Fuzzy Duplicates Arbutus Analyzer

Marco del proceso de Auditoría Interna – Hoy

AddConIT Cía. Ltda.

Data Assurance

Evaluaciónde riesgos

anual

Plan de Auditoría

Trabajo de campo

La tecnología se está aplicando aquí

(en la administración de auditoría y análisis

de datos), para acelerar el proceso

de auditoría

ReportesCierre y Archivo

Proceso para utilizar los resultados de la evaluación de

riesgos del próximo año

Utilize información de auditorías pasadas para la actual (análisis de datos no

aprovechado en cada proyecto). Sin embargo, el intercambio de información

informa dentro del grupo

Page 9: Fuzzy Duplicates Arbutus Analyzer

Marco del proceso de Auditoría Interna – Futuro

AddConIT Cía. Ltda.

Data Assurance

La tecnología permite un enfoque de Auditoría interna con

una mayor oportunidad de identificación y respuesta de

riesgos

Evaluación de riesgos

EN CURSO• Monitorear los riesgos

claves (RC).

• Cambios en los RC que

indiquen cambio en el

perfil de riesgo.

Plan de Auditoría•Monitorear los

resultados para

cambiar la frecuencia

/ alcance de las

auditorías previstas

Reportes•Reportar cambios en

las tendencia de la

Administración

Trabajo de Campo

PERIÓDICO

Auditoría

Estratégica

Programa de

Auditoría

Continua

Ejecutar

Script

Automáticos

Excepciones

Reportes

Revisión

Reportes

Page 10: Fuzzy Duplicates Arbutus Analyzer

Análisis de datos• Análisis de datos ocasional.

Apoyo rutinario• Núcleo de competencias

técnicas en el

departamento.

• Resultados utilizados para

la actualización de la

evaluación de riesgos en

todo el proceso de

auditoría.

Estado inicial• Creación de expertos en

datos para el desarrollo de

rutinas de análisis de

datos.

• Ningún proceso para

incorporar a la metodología

de AI.

• Enfocado en AI.

Optimización

Completa• La tecnología permite la

plena integración en el

flujo de trabajo de

auditoría interna.

• Enfocado en el negocio.

Existe un amplio espectro de uso

de la tecnología en Auditoría

Continua.

Mejorar el uso de la tecnología

puede ayudar a mejorar la

eficiencia del proceso de

auditoría continua.

Madurez de la AuditoríaContinua

Page 11: Fuzzy Duplicates Arbutus Analyzer

¿Qué es Data Mining?

La minería de datos es el proceso de análisis de datos para extraer patrones ocultos. La minería de datos transforma los datos en información que se puede evaluar.

Definición

El objetivo es identificar las excepciones a las políticas, las ineficiencias del proceso, las debilidades de control, los problemas de calidad de datos, el potencial de riesgo de fraude y posibles oportunidades de ahorro de costos.

Objetivodel Data Mining

¿Hay empleados de su organización se hacen pasar por los proveedores de la empresa? Esta práctica está prohibida en la mayoría de organizaciones. En la prueba de búsqueda de coincidencias por aproximación, los campos de dirección de dos bases de datos han sido comparados para encontrar posibles coincidencias - y estafadores.

Identificar Áreas para el Data Mining

Page 12: Fuzzy Duplicates Arbutus Analyzer

¿Qué es Data Mining? (Descubrimiento de relaciones / patrones ocultos)

AddConIT Cía. Ltda.

Data Assurance

Tipos de entidad

• Proveedor

• Empleado

• Cliente

• Registro de cheques

• Negocios de Alto Riesgo

• Entidad de Alto Riesgo

Tipos de características

Proveedor 1 Proveedor 2Dirección

Proveedor 2 Empleado 1Nombre

Empleado 1 Empleado 2Cuenta bancaria

La agrupación de entidades coincidentes por tipo de propiedad.

A=B, B=C; Por lo tanto, A=B=C

A = Bob JonesB = Trucking Inc (Attn:

Robert Jones)C = NY Trucking Inc

Nombre Fecha de contratación

Dirección SSN

Teléfono ID

Fax DUNS Number

Cuenta bancaria User ID

Fecha de nacimiento Email

Page 13: Fuzzy Duplicates Arbutus Analyzer

Desafíos

Data Quality = calidad de los datos

AddConIT Cía. Ltda.

Data Assurance

Superar los problemas con la calidad de los datos y la normalización de datos(Combatir los falsos negativos)

• Perfiles de datos

• Limpieza y normalización de datos

• Verificación de datos

ID# Nombre Direcciones Ciudad Estado C postal Nota

5154155 Larry M. Bird 1234 17th Street NW Washinton DC 20006

A1617 Larry Bird, M., 1234 Seventeenth Street NW DX 20006 02111

5146261 Joe Smith 110 Eye St. N.W. Washington DC 20005 CHK ID

87121 Smith, Joe 110 I Street 1st floor DC FR Alert

87458 Smith & Smith Inc 500 9th St. S.E. Washington DC 20003

No hay consistenciacoherente en los nombres

Nombres de compañías

Informaciónimportantesepultada

Erroresortográficos

Datos en campo incorrecto

Errores en el ingresode los datos

Valoresfaltantes

Texto de formatolibre

No hay clave única

Page 14: Fuzzy Duplicates Arbutus Analyzer

Desafíosejemplo de limpieza de datos

• Nombres del personal

• Nombres normalizados de compañías

• Direcciones normalizadas

Page 15: Fuzzy Duplicates Arbutus Analyzer

Desafíosejemplo de coincidencias

• Coincidencias de nombres

• Coincidencias de direcciones

Page 16: Fuzzy Duplicates Arbutus Analyzer

• Sólo un pequeño porcentaje de las transacciones se revisan

• Utilización del azar en la selección de muestra - Puede identificar a sólo 1 tema y creer erróneamente que es un pequeño problema

1.

Muestreo

• Capacidad para buscar patrones y tendencias ocultas que pueden ser indicadores que no son visibles fácilmente.

• Se puede utilizar el análisis de tendencia inicial para tomar un enfoque centrado en la selección de la muestra (probar lo que realmente importa).

Limitacionesdel enfoquetradicional

Beneficio del Data MiningComponentedel proceso

de AI

• Pagos a ProveedoresRealizar tendencia inicial para identificar patrones inusuales (Top 50 proveedores - Cantidad y frecuencia)

Ejemplos de los resultadoso beneficios del uso del

Data Mining

Tecnología: Fortalece la función de Auditoría Interna

Page 17: Fuzzy Duplicates Arbutus Analyzer

•Gran inversion en tiempo para probar si el tamaño de la muestra es“apropiado” o “estadísticamentevalido”.

•Usted puede seleccionar y probar un alto volumen de transacciones y todavía así no identificar grandes hallazgos.

2.

PruebasManuales

• Capacidad para poner a prueba el 100% de las transacciones (Millones +) en unas horas.

• El alcance de las pruebas puede evolucionar a partir de análisis de muestras aleatorias para la validación de los resultados / errores.

• Validación puede evolucionar en Monitoreo Continuo.

• Mayor nivel de confort al explicar a los reguladores de cumplimiento de la empresa, Auditoría y actividades de Supervisión.

• Mejora la capacidad de identificar la causa raíz de los hallazgos.

Limitacionesdel enfoquetradicional

Beneficio del Data MiningComponentedel proceso

de AI

• Pagos a ProveedoresProbar el 100% de los pagos contra nombres de los empleados, las direcciones, las entidades de alto riesgo, etc. (Comparar entre datos de Proveedor / Empleado: exportar coincidencia a Excel)

Ejemplos de los resultadoso beneficios del uso del

Data Mining

Tecnología: Fortalece la función de Auditoría Interna

Page 18: Fuzzy Duplicates Arbutus Analyzer

3. Estimaciónde impacto

Componentedel proceso

de AI

• Puede ser limitado a "estimar" y "extrapolación" del impacto al probar muestras.

• Una alta tasa de error puede reducir el "nivel de confianza" de las estimaciones.

• Aumenta el impacto de los resultados como AI permite reportar el impacto completo del problema y no una estimación.

• Mejora la capacidad para clasificar correctamente un hallazgo (por ejemplo, bajo, medio, alto).

• Mejora la capacidad de priorizar los planes de acción de la Administración.

Limitaciones del enfoque

tradicional

Beneficio del Data Mining

• Errores en Contratos de proveedores AI identificalas tendencias actuales en los datos en cuanto al procesamiento de comprar y pagos está funcionando. Los resultados pueden ser comparados con las políticas del área de adquisiciones (Momento en que son pagadas las facturas)

Ejemplos de los resultadoso beneficios del uso del

Data Mining

Tecnología: Fortalece la función de Auditoría Interna

Page 19: Fuzzy Duplicates Arbutus Analyzer

Aplicaciones prácticas

Permiten extender sus pruebas al respecto de la búsqueda de datos "difusos,

borrosos, no muy claros" de una manera mucho más eficiente.

A continuación algunos ejemplos de esto:

Dataminig Coincidencia Aproximada (fuzzy

duplicates)

Page 20: Fuzzy Duplicates Arbutus Analyzer

Lecciones rápidas:

‘34567’ vs. ‘34576’ = 1

‘1230 Main Street’ vs. ‘123o Main St’ = 5

‘Rob’ vs. ‘Robert’ = 3

‘Gary1’ vs. ‘Mary|’ = 1

‘Gary’ vs. ‘Gary’ = 1

Damerau-Levenshtein Es el mínimo número de cambios para

convertir una cadena en otra, a través de Insertar, eliminar,

reemplazar, la transposición. Levenshtein modificado, realiza

la búsqueda de remplazos de I por 1 , O por 0 del etc.

Page 21: Fuzzy Duplicates Arbutus Analyzer

Lecciones rápidas:

Campos de dirección a menudo contienen descripciones

innecesarias, como la Oficina, #, Suite o Apartamento, o

puntuación adicional, como comas o puntos. La Función

NORMALIZE limpia automáticamente datos como estos:

ADDRESS NORMALIZED_ADDRESS

Suite 45, 123 W Main Street, Miami, Florida, USA 45 123 W MAIN ST MIAMI FL USA

#45 - 123 WEST MAIN ST, MIAMI FL US 45 123 W MAIN ST MIAMI FL USA

Apt.,45,123 W. Main Street, Miami,Florida,U.S.A.. 45 123 W MAIN ST MIAMI FL USA

Page 22: Fuzzy Duplicates Arbutus Analyzer

Fuzzy Duplicates

Prueba Resultados

Cuando el importe del pago esta cerca, pero no es

exactamente lo mismo

Donde podría haber un error de transposición de ingreso de

datos en el monto

Donde había un error de ingreso de datos de sustitución

alfanumérico

Donde dos direcciones son la misma dirección pero han

empezado de manera diferente en el archivo

Donde las direcciones es próxima, pero no exactamente

Igual

Proveedores que tienen un número de teléfono muy parecidos en

la misma ciudad

Page 23: Fuzzy Duplicates Arbutus Analyzer

• Abra la tabla Beta_Payments

• En el menú, seleccione Analizar> Duplicados

• Elija Invoice_Date, Vendor_Num y Amount como sus campos duplicados (recuerda, en este orden exacto)

• Haga clic en el botón "Más“

• Haga clic en el botón de opción CERCA y utilizar un valor de 10

• Asegúrese de que la casilla suprimir duplicados exactos se encuentre desactivada

• En el área de expresión, ingresar la siguiente expresión Amount> 1000

• Dar el archivo de salida un nombre significativo y haga clic en Aceptar. (Usted debe ver 2 registros)

Fuzzy Duplicates

cuando el importe del pago esta cerca, pero

no es exactamente lo mismo

Page 24: Fuzzy Duplicates Arbutus Analyzer

• Abra la tabla Beta_Payments

• En el menú, seleccione Analyzar> Duplicados

• Elija Invoice_Date, Vendor_Num y Amount como sus campos duplicados (recuerda, en este orden exacto)

• Haga clic en el botón "Más“

• Haga clic en el botón de opción SIMILAR y utilizar un valor de 1

• Asegúrese de que la casilla suprimir duplicados exactos se encuentre desactivada

• Dar el archivo de salida un nombre significativo y haga clic en Aceptar. (Usted debe ver 4 registros)

Fuzzy Duplicates

donde podría haber un error de transposición

de ingreso de datos en el monto

Page 25: Fuzzy Duplicates Arbutus Analyzer

• Abra la tabla Beta_Payments

• En el menú, seleccione Analyzar> Duplicados

• Elija Amount, Invoice_Date y Vendor_Num como sus campos

duplicados (recuerda, en este orden exacto)

• Haga clic en el botón "Más" y seleccione SIMILAR con un valor de 0

• Asegúrese de que la casilla suprimir duplicados exactos se encuentre

desactivada

• Dar archivo de salida un nombre significativo y haga clic en Aceptar.

(Usted debe ver 5 registros)

Fuzzy Duplicates

donde habría un error de ingreso de datos

de sustitución alfanumérico

Page 26: Fuzzy Duplicates Arbutus Analyzer

• Abra la tabla Beta_Vendor

• En primer lugar, desde el menú, seleccione Analyzar> Duplicados y elegir los campos City y Address (Usted debe obtener sin duplicados)

• Ahora, cree un campo calculado denominado "Address_SortNorm" que utiliza la siguiente expresión:

• SortNormalize (Address, 'Address_Substitution.txt')

• Realice otra prueba de duplicados utilizando City y Address_SortNorm como los campos duplicados (Recuerda, en este orden exacto)

• Usted debe ver 13 duplicados borrosos y haciendo clic en hipervínculo para la ciudad de Richmond debería ilustrar muy bien lo que la función sortnormalize puede hacer para evitar falsos positivos

Fuzzy Duplicates

donde dos direcciones son la misma

dirección pero han empezado de manera

diferente en el archivo

Page 27: Fuzzy Duplicates Arbutus Analyzer

• Abra la tabla Beta_Vendor

• En el menú, seleccione Analyzar> Duplicados y elija City y Address_SortNorm como los campos duplicados (Recuerda, en este orden exacto)

• Haga clic en el botón Más

• Haga clic en el botón de radio CERCA y utilizar un valor de 1

• Asegúrese de que la casilla suprimir duplicados exactos se encuentre desactivada

• En la Lista de campos: Seleccione Vendor_Name y Address

• Dar el archivo de salida un nombre significativo y haga clic en Aceptar. (Usted debe ver 69 registros)

Fuzzy Duplicates

donde las direcciones es cercana, pero no

exactamente igual

Page 28: Fuzzy Duplicates Arbutus Analyzer

• Abra la tabla Beta_Vendor

• En el menú, seleccione Analyzar> Duplicados y elija City y Phone como los campos duplicados (recuerda, en este orden exacto)

• Haga clic en el botón Más

• Haga clic en el botón de radio CERCA y utilizar un valor de 20

• Asegúrese de que la casilla suprimir duplicados exactos se encuentre desactivada

• En la Lista de campos: Seleccione Vendor_Name y Address

• Dar el archivo de salida un nombre significativo y haga clic en Aceptar.

(Usted debe ver 6 registros con nombres de empresas que están cerca, 5 de ellos de todos modos, nunca se dejarían atrapar usando pruebas duplicados estándar)

Fuzzy Duplicates

para encontrar proveedores que tienen un

número de teléfono muy parecidos en la

misma ciudad