Las técnicas avanzadas en el cumplimiento de AML están revolucionando la forma en que las instituciones financieras detectan, monitorean y responden a actividades sospechosas, mejorando la precisión y reduciendo los falsos positivos.
Para implementar un enfoque basado en el riesgo para el cumplimiento de AML, incluido el conocimiento del cliente (KYC), las instituciones buscan cada vez más comprender el contexto profesional, institucional, político y social del cliente mediante el análisis de grandes cantidades de datos externos, incluidos información y medios de comunicación, archivos públicos, redes sociales y otras fuentes de datos de código abierto.
En entornos complejos o de Big Data, las instituciones pueden utilizar lenguajes especiales, herramientas y una combinación de técnicas para desarrollar e implementar versiones eficientes y mejoradas de los procesos de cumplimiento de emparejamiento y selección.
Técnicas Avanzadas en Cumplimiento AML
La lógica difusa se puede aplicar fácilmente a partir de scripts de codificación manual que están disponibles en varios lenguajes de programación y aplicaciones, que incluyen:
Pitón: Las bibliotecas de Python se pueden utilizar para ejecutar la coincidencia de cadenas de forma intuitiva. Con el kit de herramientas de Python de vinculación de registros, los usuarios o especialistas en cumplimiento pueden ejecutar varias técnicas de indexación, como la vecindad ordenada, el bloqueo y la identificación de duplicados mediante python.
Java: El uso de Java incluye varios algoritmos de similitud de cadenas, como el paquete java-string-similarity, que consta de algoritmos. Dichos algoritmos incluyen Levenshtein, Jaccard Index y Jaro-Wrinkler. Alternativamente, el algoritmo de Python FuzzyWuzzy se puede utilizar dentro de Java para ejecutar coincidencias.
Sobresalir: Excel se puede utilizar para realizar coincidencias y filtraciones. Las capacidades del complemento de búsqueda aproximada se pueden utilizar para ejecutar coincidencias aproximadas entre conjuntos de datos disponibles. El complemento tiene una interfaz simple, como la opción de seleccionar las columnas de salida, el número de coincidencias, el umbral de similitud, etc. La funcionalidad también puede dar un alto número de falsos positivos, ya que es posible que no identifique correctamente los duplicados, como ‘ATT CORP’ y ‘AT&T Inc.’.
Las instituciones pueden combinar diferentes técnicas para obtener resultados y soluciones de cumplimiento relevantes, y mejorar el proceso general de selección. La combinación de técnicas de coincidencia aproximada ayuda a realizar búsquedas y detecciones más precisas, y proporciona soluciones a Big Data, incluidos conjuntos de datos y campos de datos más complejos.
- La combinación de las técnicas de distancia de Levenshtein y distancia de Hamming puede ayudar a medir dos cadenas, con el número dado que representa qué tan lejos están las dos cuerdas de ser una coincidencia exacta, y determinar el código binario asignado a cada letra en cada cadena para calcular la puntuación de distancia.
- La combinación de las técnicas de Damerau-Levenshtein y Metaphone 3 puede ayudar a encontrar el número mínimo de operaciones que se necesitan para hacer que dos cadenas coincidan directamente, y convertir cualquier cadena en una codificación dependiendo de las salidas y sonidos presentes en un código alfabético.
- La combinación de métodos de variantes de nombre, como el método de clave común y los métodos de lista, puede ayudar a mejorar el proceso general de coincidencia de nombres, lo que puede resolver diferentes desafíos de coincidencia de nombres. Estos métodos reducen los nombres a una clave o código en función de su pronunciación en inglés, de modo que los nombres que suenan similares comparten la misma clave y enumeran todas las variaciones ortográficas posibles de cada componente de nombre para buscar nombres coincidentes en la lista de variaciones de nombres disponibles. Por ejemplo, el nombre John puede tener diferentes listas de nombres para usar, incluyendo John, Jon, Joan, etc.
Reflexiones finales
En el panorama cambiante del cumplimiento de la normativa contra el blanqueo de capitales, las instituciones están aprovechando los amplios conjuntos de datos externos para obtener información holística sobre la identidad multifacética de un cliente, que abarca desde los contextos profesionales hasta los sociales. Dentro de estos entornos de big data, la complejidad requiere herramientas y lenguajes especializados para mejorar los procesos de emparejamiento y selección. La lógica difusa emerge como una herramienta fundamental, con sus scripts de codificación manual accesibles en plataformas como Python, Java e incluso Excel. Sin embargo, el verdadero poder radica en la amalgama de varias técnicas.
Al entrelazar métodos como la distancia de Levenshtein con la distancia de Hamming o las técnicas de Damerau-Levenshtein con metaphone, las instituciones pueden lograr una mayor precisión en las coincidencias de datos. Además, la integración de los métodos de variantes de nombre, que tienen en cuenta las similitudes fonéticas y las variaciones ortográficas, fortalece el proceso de selección. A medida que las instituciones se esfuerzan por lograr un cumplimiento óptimo de la lucha contra el blanqueo de capitales, estos enfoques combinados prometen una mayor precisión y una reducción de las ambigüedades en la interpretación de los datos.