|
S
in embargo, en muchas ocasiones esta información se esconde detrás de los datos o no está disponible, impidiendo ser conocida y utilizada (Anónimo 5, 2000). Generalmente los métodos de Data Mining apoyan a los usuarios en la búsqueda de información útil, la que se encuentra implícita en datos de clientes, productos y procesos comerciales, almacenados por las empresas en bases de datos locales.
El creciente número de aplicaciones sobre todo en los ámbitos de marketing y análisis de riesgo muestra que estos métodos no son únicamente aplicables en la área científica sino también en las empresas. Data Mining, "el análisis de datos ya existentes con el fin de apoyar y facilitar la toma de decisiones" (Anónimo 7, 2000), es una poderosa tecnología nueva con gran potencial para ayudar a las compañías a concentrarse en la información más importante de su Base de Información (Data Warehouse).
Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en los negocios tomar decisiones pro-activas y conducidas por un conocimiento acabado de la información (Knowlwdge driven). Las herramientas de Data Mining pueden responder a preguntas de negocios que tradicionalmente consumen demasiado tiempo para poder ser resueltas y a los cuales lo usuarios de esta información casi no están dispuestos aceptar. Estas herramientas exploran las bases de datos en busca de patrones ocultos, encontrando información predecible que un experto no puede llegar a encontrar porque se encuentra fuera de sus expectativas.
Muchas compañías ya colectan y refinan cantidades masivas de datos. Las técnicas de Data Mining pueden ser implementadas rápidamente en plataformas ya existentes de software y hardware para acrecentar el valor de las fuentes de información existentes y pueden ser integradas con nuevos productos y sistemas pues son traídos en línea.
Una vez que las herramientas de Data Mining fueron implementadas en computadoras cliente servidor de alta 'performance' o de procesamiento paralelo, pueden analizar base de datos masivos para brindar respuesta a preguntas tales como, ¿cuales clientes tienen mas probabilidad de responder al próximo mailing promocional, y por qué? y presentar los resultados en formas de tablas, con gráficas, reportes, texto, hipertexto, etc. ( Anónimo 6, 2000).
Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real. Data Mining toma este proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva.
Data Mining está listo para su aplicación en la comunidad de negocios porque esta soportado por tres tecnologías que ya están suficientemente maduras: Recolección masiva de datos, Potentes computadoras con multiprocesadores, Algoritmos de Data Mining. Los logaritmos de Data Mining utilizan técnicas que han existido por lo menos desde hace 10 años, pero que sólo han sido implementadas recientemente como herramientas maduras, confiables, entendibles que consistentemente son más efectivos que métodos estadísticos clásicos (Dr. Thearling, 1995).
"Se puede decir que el Data Mining es el descendiente y según algunos el sucesor de la estadística tal y como ésta se utiliza actualmente" (Anónimo 3, 2000). Estadística y Data Mining conducen al mismo objetivo, el de efectuar 'modelos' compactos y comprensibles que rindan cuenta de las relaciones establecidas entre la descripción de una situación y un resultado relacionado con dicha descripción.
Fundamentalmente, la diferencia entre ambas reside en que las técnicas del Data Mining construyen el modelo de manera automática mientras que las técnicas estadísticas 'clásicas' necesitan ser manejadas y orientadas por un estadístico profesional (Anónimo 3, 1999). Las técnicas de Data Mining permiten ganar tanto en 'performance' como en manejabilidad e incluso en tiempo de trabajo. La posibilidad de realizar uno mismo sus propios modelos sin necesidad de subcontratar ni ponerse de acuerdo con un estadístico proporciona una gran libertad a los usuarios profesionales.
Pero ¿por qué es el Data Mining una buena idea? Es una realidad que la información de las bases de datos, es decir, la información de la que disponen las empresas sobre su sector, los clientes, el mercado o la competencia, llega en cascadas a las bases de datos. Teniendo por lo tanto en cuenta que hoy en día la información y su eficaz tratamiento es lo más importante en la área de supervivencia dentro del entorno empresarial (Anónimo 4, 1999), con Data Mining, se puede extraer información oculta desde los datos y encontrar patrones de negocio desconocidos.
Con la implementación de estos elementos tecnológicos, la compañía puede adquirir importantes ventajas competitivas. Mientras mejor sea la información que posee sobre sus clientes, mayor conocimiento tendrá de sus necesidades, y de esa manera, la compañía podrá focalizar sus esfuerzos orientándolos hacia las inquietudes especificas de sus clientes. Pero además de una de las principales ventajas de Data Mining, sencillez y rapidez, dichas técnicas permiten trabajar con grandes cantidades de ejemplos (varios millones) sin ningún inconveniente. Por lo tanto la misión del Data Mining es "detallar la manera de acopiar, seleccionar y tratar la información, para transformarla en conocimiento" (Anónimo 4, 2000). También en prever comportamientos de clientes ante diversos planeamientos.
El Data Mining parte de la segmentación y análisis de las bases de datos para definir acciones, muy orientadas hacia el cliente; y su objetivo es el estudio consecuente de dicha información para hallar vínculos en un tiempo razonable con un costo mínimo.
Un ejemplo sería una compañía aérea que utiliza los métodos de Data Mining para analizar la ocupación de los asientos disponibles en el avión. Se revela con esto que esta ocupación no sólo depende de las estaciones del ano sino también de ciertos grupos de pasajeros. Ahora se pueden utilizar estos datos extraídos de archivos históricos, con el fin de obtener en el futuro una mejor planificación para la venta de tickets (Anónimo 7, 2000).
Las técnicas hasta ahora descritas sólo tratan datos numéricos o cualitativos. El 'text mining' surge ante el problema cada vez más apremiante de extraer información automáticamente a partir de masas de textos. La enorme cantidad de referencias recogidas durante una búsqueda en Internet ilustra muy bien este problema. La investigación literal simple se ha mostrado limitada desde hace ya mucho tiempo; hay muchos problemas como los errores de mecanografía, la sinonimia, las aceptaciones múltiples etc. Por lo tanto es necesario inyectarle a la computadora un cierto sentido común o "conocimiento del mundo". Aún en ese caso, la memoria y el poder de cálculo disponibles en nuestra época permiten ciertas soluciones que no siempre son las más elegantes pero sí potentes y rápidas (Anónimo 3, 1999).
¿Cuál es el futuro para Data Mining? Al final, mucho de lo que es llamado Data Mining lo más probable es que acabe como una herramienta estándar dentro del software del Data Warehouse, como sucedió con el 'spell checking software'. Sólo tenemos que regresarnos 10 años, muchas compañías hicieron un 'spell checking software'.
Normalmente uno compraba este programa por separado, especialmente para tu 'word processor', pero a veces este programa no era compatible con ciertos formatos. Poco a poco sin embargo, estos programas fueron más compatibles y por lo tanto su funcionalidad incrementó. Pero ahora ¿dónde se encuentran estas compañías de 'spell checkers'? ¿Dónde esta éste 'software'? Realmente no los vas a encontrar en ninguna tienda, hoy en día tus programas de Word ya incluyen este tipo de programas. Al mejorar los 'word processors' e incrementar su sofisticación y funcionalidad era natural que acabaran incluyendo el programa de 'spell checker' al sistema (Dr. Thearling, 1995).
Por lo tanto el futuro de Data Mining, puede seguir estos mismos pasos. La funcionalidad de base de datos va a empezar a incrementar y por lo tanto poco a poco las compañías de datawarehouse van ha estar más interesados en integrar Data Mining en sus productos. Esto puede darse a que en diez años solo van haber unas pocas compañías independientes de Data Mining en existencia. Los sobrevivientes realmente van hacer las que vieron hacia el futuro y desarrollaron una fuerte relación con la industria de database.
Por lo tanto podemos concluir que la llegada del Data Mining se considera como la última de la introducción de métodos cuantitativos, científicos en el mundo del comercio, industria y negocios. 'Desde ahora, todos los no-estadísticos es decir el 99.5% de nosotros pueden construir modelos exactos de algunas de sus actividades, para estudiarlas mejor, comprenderlas y mejorarlas' (Anónimo 3, 2000).
Por primea vez en la historia, las estadísticas escaparan a las manos de los especialistas. El arte del especialista se ha sustituido por nuevos métodos que aportan resultados de la misma calidad o mejores, todo ello sin necesidad de conocimientos especializados. El Data Mining es sin duda, la aplicación más útil de la potencia creciente de la computadora y pertenece al campo de investigación de mayor interés en la Informática Avanzada. 'Database marketing software aplications', van a crear un impacto tremendo en los negocios del futuro.
Aunque ya existe la tecnología base para el Data Mining, se sigue desarrollando para hacerse más accesible y fácil de usar para los hombres de negocio. De esta manera se va ha combinar la tecnología de Data Mining con el entendimiento de problemas de negocios, para así presentarles un resultado fácil de entender a todo aquel de negocios. A partir de ese momento la información de las bases de datos van a poder ser aprovechada de una mejor manera. Por lo tato se pudiera concluir que un Data Mining es indispensable para los negocios.
En un futuro, no tener acceso a este programa pudiera causar que tu compañía no pueda mantenerse en el nivel competitivo del la época. Es un programa bastante accesible, fácil de instalar y manejar, que poco a poco se ha ido adaptando cada vez más a el área de negocios. Por lo cual realmente no hay una razón por la cual no se debería de instalar en todo los negocios, no te perjudica sólo te ayuda.
Bibliografía
Alexander, Steve. (1997). Data Mining: Users find tangible rewards digging into data mines. [On-Line]. Available: http://www.infoworld.com
Anónimo 1. Case Studies: DaimlerChrystler Drives Information Discovery's Pattern Warehouse. [On-Line]. Available: http://www.datamining.com
Anónimo 2. Case Studies: E-TRADE Trades Data for knowledge with the Information Discovery System. [On-Line]. Available: http://www.datamining.com
Anónimo 3. Data Mining y Estaditica. (1999). [On-Line]. Available: http://www.pmsi.fr/dminits.htm.
Anónimo 4. Data mining. (1999). [On-Line]. Available: http://www.ediciones-deusto.es/oficina/oidsdien2.cfm.
Anónimo 5. Data Warehouse, Data Mining, OLAP. (2000). [On-Line]. Available: http://www.act.cl/html/soluc_data.html.
Anonimo 6. Data Mining. (2000). [On-Line]. Available: http://www.at-systems.es./soluciones/data_mining.htm.
Anónimo 7. InfotraX. (2000). [On-Line]. Available: http://www.InfotraX.de/espanol/produkte_s.htm.
LaMonica, Martin. (1997). Know Your Customers. [On-Line]. Available:
http://www.infoworld.com
Dr. Thearling. (1995). From Database Mining to the commercialization of Data Base. [On-Line]. Available: http://www.Altavista.com
Zavala, Mauricio. Modelamiento Predictivo. [On-Line]. Available: http://www.gm.et/bluetech/edicion11.3/Datamining
|