sábado, 1 de octubre de 2011

Análisis de Cluster con Excel | Minería de Datos [Parte I].

Uno de los aspecto importantes dentro de la minería de datos, está en el uso que se puede dar en área de marketing o áreas de riesgo de una empresa, este propósito lo podemos llevar a cabo con el  análisis de conglomerados (cluster en terminología inglesa) es el agrupar las observaciones de forma que los datos sean muy homogéneos dentro de los grupos (mínima varianza) y que estos grupos sean lo más heterogéneos posible entre ellos (máxima varianza). De este modo obtenemos una clasificación de los datos multivariante con la que podemos comprender mejor los mismos y la población de la que proceden. Podemos realizar análisis cluster de casos, un análisis cluster de variables o un análisis cluster por bloques si agrupamos variables y casos. El análisis cluster se puede utilizar para:
  • La taxonomía, agrupar especies naturales.
  • Para el marketing, clasificar consumidores tipo.
  • Medicina, clasificar seres vivos con los mismos síntomas y características patológicas.
  • Técnicas de reconocimiento de patrones.
  • Formar grupos de pixels en imágenes digitalizadas enviadas por un satélite desde un planeta para identificar los terrenos.
  • etc.
Una herramienta potente es el Excel, potenciado con algunos complementos pagos  o no pagos de Excel, en esta oportunidad hablaremos del complemento StatistiXL, el cual lo pueden hallar en el sitio: http://www.statistixl.com (existe versión de prueba por 30 días).

StatistiXL es un poderoso paquete de análisis de datos que se ejecuta como un complemento a las versiones Microsoft Excel de Windows. StatistiXL ha sido completamente diseñado y escrito por científicos a fin de satisfacer las exigentes necesidades de cualquiera que requiera el acceso a un robusto y versátil paquete de análisis estadístico que es rápido de aprender y fácil de usar. Con la riqueza de sus características, Excel proporciona un ambiente ideal para la entrada de datos, la manipulación y el cálculo y gracias al aprovechamiento de este ambiente familiar, statistiXL extiende este conjunto de características de alta potencia para abarcar el análisis estadístico sin la necesidad de aprender a utilizar una nueva aplicación desde cero. Los datos almacenados en hojas de cálculo existentes, pueden ser sometidos inmediatamente a una amplia gama de pruebas estadísticas (muchas de ellas no se ven con frecuencia en otros paquetes de análisis). Las pruebas proveídas por statistiXL incluyen (pero no están limitadas a) Análisis de Varianza, Análisis de Conglomerados, Tablas de contingencia, Correlación (Simple, parcial, múltiple y canónica), Estadística Descriptiva lineal y circular, Análisis de Discriminación Clasificación y Agrupación, Análisis de Factores, Pruebas de Bondad de Ajuste tales como Binomial, Circular, Normal y Poisson, Regresión lineal simple y múltiple, Comparación de regresiones, Pruebas no paramétricas tales como Friedman, Kruskal-Wallis y Mann-Whitney, Análisis de Componentes Principales, Pruebas T mono y multivariables.

StatistiXL también produce una amplia gama de gráficos incluidos, gráficos de Box y Whisker, Gráficos Scatter, Dendogramas de Conglomerados, gráficos de Probabilidad Normal y muchos otros. Existen numerosas opciones para formatear los resultados estándar que se obtienen de statistiXL y dado que estos resultados se colocan en hojas de Excel, usted puede utilizar las herramientas en las que ya está familiarizado, para organizar la salida como texto y gráfico y aún más, cambiar fuentes, reordenar las celdas, modificar la escala de los ejes de un gráfico, etc, etc Usted puede incluso utilizar los resultados para nuevos análisis utilizando ya sea statistiXL o cualquiera de las numerosas funciones propias de Excel.

0 comentarios:

Publicar un comentario

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Laundry Detergent Coupons