|
Consultoria para la detección de Riesgos y Fraudes
1.- Introducción
Una herramienta de detección de riesgos puede ahorrar una gran cantidad de recursos a cualquier empresa que deba asumir riesgos o pagar liquidaciones por siniestros asociados a pólizas de seguros o contratos de salud o que sufra de estafas reiteradas como por ejemplo compañías de tarjetas de crédito o compañias de telefonia celular o fija. La identificación de situaciones anómalas, como por ejemplo, el cambio de perfil de consumo de un cliente en un momento adecuado, permite tomar acciones para evitar pérdidas, que pueden llegar a sumas considerables cuyo ahorro paga cualquier proyecto de implementación de técnicas de detección de riesgos insertadas en sistemas de información.
Cualquiera de estas empresas tiene grandes cantidades de datos, donde se almacenan tanto aquellas transacciones que no han presentado ningún problema como las que han sido identificadas como riesgosas o siniestrosas. En medio de todos ellos se encuentran escondidos patrones, que identificados y aplicados correctamente permitirán a una máquina detectar aquellos casos de altp riesgo para luego informarlos a quienes deben tomar las medidas que correspondan.
NEURONET dispone de consultores capacitados que pueden ayudar a su empresa en el proceso de descubrimiento de estos patrones y luego en la creación de una herramienta de software que haga uso de ellos y apoye la detección de riesgos.
Nuestra empresa puede apoyarlo en cualquiera de los pasos que propone la metodología KDD (Knowledge Discovery in Databases), estándar actual para el descubrimiento de conocimiento en grandes bases de datos (patrones). En la figura que se muestra a continuación se describe el proceso.

Los servicios que ofrece NEURONET pueden apoyar en cualquiera de las fases de la metodología. Por ejemplo, dentro de los 3 primeros pasos, podemos realizar:
• Selección de atributos de importancia (utilizando algoritmos y/o estudios con expertos).
• Reducción de dimensionalidad y determinación de características.
• Procesos de limpieza de datos.
• Generación de atributos de importancia no almacenados de forma explicita (por ejemplo promedio de gastos médicos por persona).
• Transformación de datos nominales a binarios.
En la etapa de minería podemos apoyar en la generación de modelos utilizando tecnologías de última generación como son las máquinas de soporte de vectores o redes neuronales. Ambas han demostrado ser exitosas en tareas de detección de fraudes en variadas aplicaciones como seguros médicos o tarjetas de crédito.
Por último NEURONET puede apoyar en la transformación del conocimiento adquirido durante el proceso en una herramienta que apoye los procesos de su empresa. Esta va a ser capaz de detectar fraudes utilizando los patrones descubiertos y avisar a quien sea necesario cuando se determine la ocurrencia de uno.
2. Tecnologías disponibles
En el caso particular de las técnicas de detección de fraudes, puede verse como un problema de clasificación donde cada nueva transacción debe catalogarse como fraudulenta o normal. Otra opción, es modelarlo como un problema de detección de anomalías, donde se debe determinar si una nueva transacción es diferente a aquellas consideradas normales (según datos históricos). La versión más conveniente depende de la disponibilidad de datos, de la estructura de estos y de los objetivos específicos de la organización.
Generalmente al plantear la detección de fraudes como un problema de clasificación se presentan dificultades con la distribución de datos, ya que el porcentaje de fraudes es mucho menor que el de transacciones normales. Esta dificultad puede ser solucionada de varias maneras, encontrándose entre las más utilizadas el entrenamiento ponderado o la selección ponderada de registros.
La primera tecnología que NEURONET recomienda como posible para enfrentar el problema de clasificación son las redes neuronales. Estas intentan simular la forma en que el cerebro humano realiza cálculos distribuyendo la información en un conjunto de neuronas interconectadas. Este tipo de modelos han mostrado ser exitosos en la detección de fraudes médicos y durante muchos años fueron la solución más utilizada para este problema, mostrando resultados sorprendentes.
Por otro lado, nuestra empresa, siempre consciente de los cambios tecnológicos, recomienda la utilización de support vector machine (máquinas de vectores de soporte), tecnología que soluciona alguno de los problemas de las redes neuronales y que es la tendencia actual en la minería de datos. La gran deficiencia de las redes neuronales es que sus métodos de entrenamiento no aseguran la obtención de un óptimo global (mejor modelo posible), problema que no tienen las maquinas de soporte de vectores.
Las máquinas de soporte de vectores funcionan llevando cada dato a un espacio de mayor dimensión, mediante una transformación o kernel, y luego encontrando el mejor híper plano capaz de dividir las clases en esta nueva representación. Una fuerte base matemática les permite asegurar que en un espacio lo suficientemente grande las clases serán divisibles fácilmente y que el híper plano encontrado es el mejor posible. En la siguiente imagen se muestra este concepto, donde datos en dos dimensiones son llevados a tres y luego un híper plano es encontrado.

Una dificultad que tiene el modelar la detección de fraudes como un problema de clasificación es que probablemente el sistema tendrá un buen funcionamiento con fraudes conocidos, encontrados antes del entrenamiento, pero no podrá detectar correctamente nuevos tipos. Por esta razón, en los primeros meses de uso mostrara excelentes resultados pero puede empeorar a medida que avanza el tiempo.
Como se mencionó anteriormente el problema también puede verse como una detección de anomalías. En este caso se intenta caracterizar de la mejor forma posible aquellas transacciones normales, para luego detectar si una nueva es extraña. De esta forma, para preparar el modelo solo se utilizan licencias que no han sido catalogadas como fraude. La gran ventaja de esta visión es que es posible detectar fraudes que nunca han sido vistos anteriormente, a diferencia de lo anterior donde solo se identificaran aquellos usados en el entrenamiento.
Para la generación de un modelo como este se recomienda la utilización de máquinas de soporte de vectores de una clase. Estas presentan una modificación a la estructura normal de este tipo de modelos que permite enfrentar datos de entrenamiento donde todos los registros pertenecen a la misma clase. Esta tecnología ya ha sido utilizada en la detección de fraudes con excelentes resultados. Además, está presente en paquetes de minería de datos comúnmente utilizados, como por ejemplo aquel distribuido por Oracle. También existe la posibilidad de hacerlo con una clase especial de redes neuronales denominadas “Replicator Neural Network”.
NEURONET es capaz de apoyar a su organización en la creación de cualquiera de estos modelos, utilizando software especializado, de última generación. Somos capaces de brindar servicios tanto en la utilización de herramientas comerciales como en aquellas con licencias de software libre (disminuyendo los gastos del proyecto).
Nuestra empresa actualmente pertenece al programa de Partners de Oracle, lo que nos convierte en una excelente opción si ya posee esta tecnología y confía en los productos de esta empresa. El paquete que provee Oracle para minería de datos permite el entrenamiento de máquinas de soporte de vectores desde tablas disponibles en la base de datos, pudiendo ser ejecutado desde códigos pl-sql o código java.
|