Uno de los aspecto importantes
dentro de la minería de datos, está en el uso que se puede dar en área de
marketing o áreas de riesgo de una empresa, este propósito lo podemos llevar a
cabo con el análisis de conglomerados
(cluster en terminología inglesa) es el agrupar las observaciones de forma que
los datos sean muy homogéneos dentro de los grupos (mínima varianza) y que
estos grupos sean lo más heterogéneos posible entre ellos (máxima varianza). De
este modo obtenemos una clasificación de los datos multivariante con la que
podemos comprender mejor los mismos y la población de la que proceden. Podemos
realizar análisis cluster de casos, un análisis cluster de variables o un análisis
cluster por bloques si agrupamos variables y casos. El análisis cluster se
puede utilizar para:
- La taxonomía, agrupar especies naturales.
- Para el marketing, clasificar consumidores tipo.
- Medicina, clasificar seres vivos con los mismos síntomas y características patológicas.
- Técnicas de reconocimiento de patrones.
- Formar grupos de pixels en imágenes digitalizadas enviadas por un satélite desde un planeta para identificar los terrenos.
- etc.
Una herramienta potente es el Excel, potenciado con algunos
complementos pagos o no pagos de Excel,
en esta oportunidad hablaremos del complemento StatistiXL,
el cual lo pueden hallar en el sitio: http://www.statistixl.com
(existe versión de prueba por 30 días).
StatistiXL es un poderoso paquete
de análisis de datos que se ejecuta como un complemento a las versiones
Microsoft Excel de Windows. StatistiXL ha sido completamente diseñado y escrito
por científicos a fin de satisfacer las exigentes necesidades de cualquiera que
requiera el acceso a un robusto y versátil paquete de análisis estadístico que
es rápido de aprender y fácil de usar. Con la riqueza de sus características,
Excel proporciona un ambiente ideal para la entrada de datos, la manipulación y
el cálculo y gracias al aprovechamiento de este ambiente familiar, statistiXL
extiende este conjunto de características de alta potencia para abarcar el
análisis estadístico sin la necesidad de aprender a utilizar una nueva
aplicación desde cero. Los datos almacenados en hojas de cálculo existentes,
pueden ser sometidos inmediatamente a una amplia gama de pruebas estadísticas
(muchas de ellas no se ven con frecuencia en otros paquetes de análisis). Las
pruebas proveídas por statistiXL incluyen (pero no están limitadas a) Análisis
de Varianza, Análisis de Conglomerados, Tablas de contingencia, Correlación
(Simple, parcial, múltiple y canónica), Estadística Descriptiva lineal y
circular, Análisis de Discriminación Clasificación y Agrupación, Análisis de
Factores, Pruebas de Bondad de Ajuste tales como Binomial, Circular, Normal y
Poisson, Regresión lineal simple y múltiple, Comparación de regresiones,
Pruebas no paramétricas tales como Friedman, Kruskal-Wallis y Mann-Whitney,
Análisis de Componentes Principales, Pruebas T mono y multivariables.
StatistiXL también produce una
amplia gama de gráficos incluidos, gráficos de Box y Whisker, Gráficos Scatter,
Dendogramas de Conglomerados, gráficos de Probabilidad Normal y muchos otros.
Existen numerosas opciones para formatear los resultados estándar que se
obtienen de statistiXL y dado que estos resultados se colocan en hojas de
Excel, usted puede utilizar las herramientas en las que ya está familiarizado,
para organizar la salida como texto y gráfico y aún más, cambiar fuentes,
reordenar las celdas, modificar la escala de los ejes de un gráfico, etc, etc
Usted puede incluso utilizar los resultados para nuevos análisis utilizando ya
sea statistiXL o cualquiera de las numerosas funciones propias de Excel.
0 comentarios:
Publicar un comentario