|
Alguna empresas le prometerán el "sumum" de la tecnología: - Falsa inteligencia artificial y promesas de informática distribuida que no es tal.
- Altos niveles de resultados a costa de altos esfuerzos en codificación manual.
- Cientos de Miles de poblaciones y varios millones de calles.
- Versioneros de muchos millones de entradas.
- Mantenimiento diario de sus maestros con los datos vivos de los Ayuntamientos.
- Empresas que se dedican a TODO.
- Solo en IDQ poseemos expertos titulados en IA (Inteligencia Artificial), aplicando técnicas de análisis convencial y computacional a nuestros procesos. (HMM: Hidden Markov Model, Smoothing, Levenshtein/Hamming, entre otros).
- Solo en IDQ obtenemos niveles de más de un 95% de efectividad en procesos automáticos reduciendo al máximo la codificación manual (<2%).
- En el estado Español SOLO EXISTEN cerca de 8.000 municipios y 60.000 poblaciones.
- En el estado Español SOLO EXISTEN cerca de 800.000 calles.
- Un versionero de más de 2.000.000 de registros (3 versiones de media por cada calle existente) es inefectivo e induce a errores.
- Las únicas fuentes válidas son INE y Correos, siendo las tareas de mantenimiento habitual con los ayuntamientos del estado Español (8.000 solo en municipios, 60.000 en poblaciones) tareas desde el punto de vista de coste dificilmente asumibles y efectivas, reduciendose a consultas sobre procesos vivos.
- En IDQ estamos ESPECIALIZADOS EXCLUSIVAMENTE en DATA CLEANING y en procesos de Calidad de Datos.
La limpieza de datos es mucho más que simplemente actualizar registros con datos buenos. Una limpieza de datos seria conlleva descomposición y reensamblaje de datos. Esta se puede dividir en seis pasos: separar en elementos, estandarizar, verificar, encontrar, agrupar y documentar. Estos seis pasos mencionados en la mayoría de los casos requieren de programas sofisticados y de gran cantidad de conocimientos de expertos contenidos en ellos. |