Estructuración automática de direcciones junio 2008 Informe Avance de Pre-Tesis Alumno: Juan Carlos Montalvo Lama Asesor de Tesis: Mg. Samuel Oporto Díaz
Antecedentes Las empresas exitosas actuales se caracterizan por la atención personalizada y oportuna a sus clientes. También estas dispuestas a invertir fuertes sumas de dinero para ello. Por ello buscan información relevante de sus clientes que les ayude a entender sus problemas y puedan ayudarlos. La tecnología es crucial para permitir extraer información relevante sus Bases de Datos. Empresas exitosas Grandes Inversiones Información Relevante Uso de Tecnologías
Descripción del problema
Motivación Muchas empresas dedicadas al Delivery tienen la necesidad de conocer la dirección de sus clientes. Los tiempos de entrega para las empresas de Delivery son muy cortos. Muchas veces las entregas de productos son erroneas por no conocer con certeza la dirección del cliente. Las bases de datos en muchas ocasiones sólo almacenan la información de la dirección de los clientes en cadenas de texto.
Problema No poder contar con información suficiente para identificar el destino de entrega de los productos. No contar con el tiempo suficiente para clasificar y validar la dirección del cliente. Introducción de errores propios del lenguaje cuando se registra la dirección del cliente. No poder analizar la información de la direccion al no estar estandarizada.
OBJETIVOS
Objetivo Superior Permitir extraer la mayor cantidad de información relevante de la dirección de un cliente desde una cadena de Texto.
Objetivo Principal El objetivo de la investigación es Estructurar de forma Automática las direcciones de los clientes a partir de una cadena de Texto.
Objetivo Secundarios Analizar y Clasificar la información no estructurada. Corregir los errores introducidos por el lenguaje. Corregir los errores introducidos por la digitación. Proveer de una Base de Datos de Direcciones con información validada.
MODELO SOLUCIÓN
Modelo General de Solución Prototipo Recolectar Datos Experimentar Fuentes de Datos Revisar Antecedentes Para abordar el problema seguiremos el siguiente método:
Modelo Solución Dirección Parsear Optimizar
Limpiar Dirección Permite suprimir caracteres especiales como: 1 . 2 ; Parsear Dirección Dirección Limpiar Jerarquizar Permite suprimir caracteres especiales como: 1 . 2 ; 3 á 4 é 5 í 6 ó 7 ú 8 ? 9 /
Jerarquizar Dirección Descomponer Dirección Buscar Palabras Rectoras Buscar Palabras Dependientes Construir Arboles de Jerarquía
Corrección de Dirección Optimizar Dirección Mapeo Morfológico Mapeo Fonético Corrección de Dirección Completar Dirección