sábado, 1 de octubre de 2011

Análisis de Cluster con Excel | Minería de Datos [Parte I].

Uno de los aspecto importantes dentro de la minería de datos, está en el uso que se puede dar en área de marketing o áreas de riesgo de una empresa, este propósito lo podemos llevar a cabo con el  análisis de conglomerados (cluster en terminología inglesa) es el agrupar las observaciones de forma que los datos sean muy homogéneos dentro de los grupos (mínima varianza) y que estos grupos sean lo más heterogéneos posible entre ellos (máxima varianza). De este modo obtenemos una clasificación de los datos multivariante con la que podemos comprender mejor los mismos y la población de la que proceden. Podemos realizar análisis cluster de casos, un análisis cluster de variables o un análisis cluster por bloques si agrupamos variables y casos. El análisis cluster se puede utilizar para:
  • La taxonomía, agrupar especies naturales.
  • Para el marketing, clasificar consumidores tipo.
  • Medicina, clasificar seres vivos con los mismos síntomas y características patológicas.
  • Técnicas de reconocimiento de patrones.
  • Formar grupos de pixels en imágenes digitalizadas enviadas por un satélite desde un planeta para identificar los terrenos.
  • etc.
Una herramienta potente es el Excel, potenciado con algunos complementos pagos  o no pagos de Excel, en esta oportunidad hablaremos del complemento StatistiXL, el cual lo pueden hallar en el sitio: http://www.statistixl.com (existe versión de prueba por 30 días).

StatistiXL es un poderoso paquete de análisis de datos que se ejecuta como un complemento a las versiones Microsoft Excel de Windows. StatistiXL ha sido completamente diseñado y escrito por científicos a fin de satisfacer las exigentes necesidades de cualquiera que requiera el acceso a un robusto y versátil paquete de análisis estadístico que es rápido de aprender y fácil de usar. Con la riqueza de sus características, Excel proporciona un ambiente ideal para la entrada de datos, la manipulación y el cálculo y gracias al aprovechamiento de este ambiente familiar, statistiXL extiende este conjunto de características de alta potencia para abarcar el análisis estadístico sin la necesidad de aprender a utilizar una nueva aplicación desde cero. Los datos almacenados en hojas de cálculo existentes, pueden ser sometidos inmediatamente a una amplia gama de pruebas estadísticas (muchas de ellas no se ven con frecuencia en otros paquetes de análisis). Las pruebas proveídas por statistiXL incluyen (pero no están limitadas a) Análisis de Varianza, Análisis de Conglomerados, Tablas de contingencia, Correlación (Simple, parcial, múltiple y canónica), Estadística Descriptiva lineal y circular, Análisis de Discriminación Clasificación y Agrupación, Análisis de Factores, Pruebas de Bondad de Ajuste tales como Binomial, Circular, Normal y Poisson, Regresión lineal simple y múltiple, Comparación de regresiones, Pruebas no paramétricas tales como Friedman, Kruskal-Wallis y Mann-Whitney, Análisis de Componentes Principales, Pruebas T mono y multivariables.

StatistiXL también produce una amplia gama de gráficos incluidos, gráficos de Box y Whisker, Gráficos Scatter, Dendogramas de Conglomerados, gráficos de Probabilidad Normal y muchos otros. Existen numerosas opciones para formatear los resultados estándar que se obtienen de statistiXL y dado que estos resultados se colocan en hojas de Excel, usted puede utilizar las herramientas en las que ya está familiarizado, para organizar la salida como texto y gráfico y aún más, cambiar fuentes, reordenar las celdas, modificar la escala de los ejes de un gráfico, etc, etc Usted puede incluso utilizar los resultados para nuevos análisis utilizando ya sea statistiXL o cualquiera de las numerosas funciones propias de Excel.

martes, 23 de agosto de 2011

Vea el Cubo medio Lleno – Bussiness Inteligence

Excelente libro escrito por Salvador Ramos desde la web SolidQ.

En el primer capítulo hace una introducción a los conceptos centrales. ¿Qué es Business Intelligence? ¿Qué es un datawarehouse? ¿Qué es OLAP?   Son 20 páginas, por lo que puede leerse rápidamente.  Claro, corto y preciso.

El segundo capítulo describe la visión que tiene Microsoft sobre el Business Intelligence, que es bastante interesante, aunque refuerza los comentarios generales de que Microsoft ha podido efectuar mejores interfaces de usuario (Office), pero son incapaces de hacer un verdadera “herramienta BI” pensando en el usuario.

Finalmente, el autor se adentra con mayor profundidad en dos de los tres componentes que forman parte de SQL Server y que son el núcleo de esta plataforma: Integration Services como herramienta de ETL, y Analyisis Services como herramienta de OLAP y de minería de datos.

Lamentablemente, ha dejado para un segundo libro todo lo relacionado con Reporting Services como gestor empresarial de informes, Excel como herramienta de visualización, y Sharepoint como herramienta de distribución y colaboración.


Descargar Libro aquí

Sistemas Expertos e Ingeniería del Conocimiento con Excel

Sistemas Expertos Parte [1].

Son programas de computación que se derivan de una rama de la investigación informática llamada Inteligencia Artificial (IA). El objetivo científico de la IA es entender la inteligencia. Está referida a los conceptos y a los métodos de inferencia simbólica, o de razonamiento por computadora, y cómo el conocimiento usado para hacer esas inferencias será representado dentro de la máquina.


El término inteligencia cubre muchas habilidades conocidas, incluyendo la capacidad de solucionar problemas, de aprender y de entender lenguajes; la IA dirige todas estas habilidades. La mayoría de los esfuerzos en IA se han hecho en el área de solucionar los problemas, los conceptos y los métodos para construir los programas que razonan acerca de los problemas y que luego calculan una solución.


Los programas de IA que logran la capacidad experta de solucionar problemas aplicando las tareas específicas del conocimiento se llaman Sistemas Basado en Conocimiento o Sistemas Expertos. A menudo, el término sistemas expertos se reserva para los programas que contienen el conocimiento usado por los humanos expertos, en contraste al conocimiento recolectado por los libros de textos. Los términos, sistemas expertos (ES) y sistemas basados en conocimiento (KBS), se utilizan como sinónimos. Tomados juntos representan el tipo más extenso de aplicación de IA.


Ingeniería del Conocimiento

Es el arte de diseñar y construir los sistemas expertos donde los ingenieros del conocimiento son los desarrolladores.   La ingeniería del conocimiento es una parte aplicada de la ciencia de la inteligencia artificial (IA) que, a su vez, es parte de la informática.

Teóricamente, un ingeniero del conocimiento es un informático que sabe diseñar y poner programas en ejecución que incorporan técnicas de inteligencia artificial.

Hay hoy dos maneras de construir un sistema experto. Pueden ser construidas todo de una vez, o ser construidas usando partes de software de desarrollo conocido como una herramienta  o Shell (carcaza). Antes de hablar sobre estas herramientas, hablaremos concisamente lo que hacen los ingenieros del conocimiento.  Aunque existen diferentes estilos y métodos de ingeniería del conocimiento, el acercamiento básico es igual: un ingeniero del conocimiento se entrevista y observa a una persona experta o a un grupo de expertos y aprende lo que ellos saben y cómo razonan con su conocimiento. El ingeniero entonces traduce el conocimiento a un lenguaje útil para la computadora y diseña un motor de inferencia, una estructura del razonamiento que utilice apropiadamente el conocimiento.  Él también determina cómo integrar el uso del conocimiento incierto en el proceso del razonamiento y qué clase de explicación serían útiles para el usuario final.

Aplicación de los Sistemas Expertos.

El espectro de aplicaciones de la tecnología de los sistemas expertos a los problemas industriales y comerciales es tan amplio debido a la fácil caracterización del desafió.   Las aplicaciones encuentran su perfil en la mayoría de las áreas del trabajo del conocimiento. Las aplicaciones se agrupan en siete clases importantes.

domingo, 21 de agosto de 2011

Dar significado a sus datos con POWERPIVOT.

Esto significa obtener las respuestas que necesita,  obtener información más profunda sobre cualquier aspecto de negocio y comprimir los ciclos de decisión aprovechando características potentes de Powerpivot  al  procesar enormes cantidades de datos en segundos, carga incluso los más grandes conjuntos de datos desde prácticamente cualquier fuente, usando potentes nuevas capacidades analíticas, como expresiones de análisis de datos (DAX) que la mayoría de los procesadores de múltiples núcleos y gigabytes de memoria.

PowerPivot para Excel es una herramienta de análisis de datos que ofrece una potencia de cálculo y herramientas  Excel, directamente dentro de la aplicación de los usuarios ya conocen y aman: Microsoft Excel.    Es la forma más fácil de usar para efectuar análisis de datos, utilizando características de Excel familiares, ya saben, como la interfaz de usuario intuitiva de Officce, tabla dinámica y gráfico dinámicos.   Es la manera más rápida de generar herramientas de análisis rico e interactivo, fácilmente confundida con soluciones de TI, después de semanas de esfuerzo.   Es la forma correcta de lograr más profundos conocimientos del negocio.

PowerPivot y sus características para Excel 2010, permite potenciar su conocimiento y toma de decisiones, compartir y colaborar con confianza y ayudar a mejorar la eficiencia de TI:
Excel basado en análisis sin restricciones de memoria.
Supera las limitaciones existentes para el análisis masivo de datos en el escritorio con algoritmos de compresión eficaz para cargar incluso los más grandes conjuntos de datos en memoria.

Expresiones de análisis de datos (DAX).

Poderosas capacidades relacionales se pone en manos de los usuarios avanzados, que desean crear aplicaciones de análisis avanzados.


 Integración de SharePoint .

Permite a los usuarios compartir modelos de datos y análisis y si las soluciones están en SharePoint, puede configurar ciclos de actualización para asegurar que los datos siguen siendo actualizados automáticamente. 

 Fuentes de apoyo prácticamente ilimitada de datos.

Proporciona la base para cargar y combinar los datos de origen de cualquier ubicación para el análisis masivo de datos en el escritorio, incluyendo bases de datos relacionales, multidimensionales fuentes, servicios cloud, fuentes de datos, archivos Excel, texto y datos obtenidos dese la WEB.


Para ingresar a demo, se requiere password:  Pass@word1

Descargar demo explicativo utilidad POWERPIVOT

Formalidades archivo Excel para envío información Libro Compras a Servicio Impuestos Internos.

El Servicio de Impuestos Internos ha establecido algunas formalidades para preparar archivo Excel con datos del Libro de Compras.

En este instructivo se explica la construcción del archivo para carga de masiva de documentos al detalle de un Libro de Compras en el Portal de Facturación Electrónica MIPYME.
Formato.

El archivo a construir es de tipo .csv (texto separado por punto y coma) el cual puede editarse sin problemas en programas como Microsoft Excel y similares.

La primera línea de este archivo contiene los encabezados de columna, con el fin de facilitar el llenado de la información.  Los datos de los documentos deben ser ingresados por línea a partir de la fila número 2.
Descargar instructivo PDF para preparar archivo masivo en formato Excel

sábado, 20 de agosto de 2011

10 Atajos de Teclados de Excel - Imprescindibles

 La  mayoría de los usuarios de Excel sabe de la importancia de los atajos de teclado de Excel.  Si bien puede ser una buena idea conocer los 97 accesos diferentes de  Excel , el hecho es que no se usan todo el tiempo.  Por lo tanto, todo se reduce a memorizar los atajos más útiles que se usa la mayoría del tiempo.

En este post se comparten los 10 accesos directos más útiles al momento de  analizar datos, diseñar gráficos y dar formato a las hojas de trabajo.

 1.  CTRL +1 – Formato.

 CTRL +1, es realmente necesario cada vez que queremos dar formato a celdas, gráficos, cuadros de texto, o lo que desees formatear.

2.  CTRL + SHIFT + L - Activar/Desactivar un filtro.

La mayoría del tiempo, usamos filtros para hacer análisis ad-hoc de los datos.    Así que puedes activar o desactivar los filtros, pulsando CTRL + SHIFT + L

 3.  CTRL + teclas de flecha - Navegar por el libro activo.

Cuando se trata de trabajar con datos masivos, navegar puede significar poco eficaz.  Para eso puede utilizar la combinación de teclas CTRL + flecha.  También, se puede usar  CTRL + SHIFT + teclas de flecha para seleccionar un grupo de celdas.

 4.  ALT +  - Pegado Especial> Valores.

Para Copiar y pegar resulta realmente práctico usar las teclas de acceso rápido.   En ese caso veremos la funcionalidad de Pegado Especial:

·         Primero seleccionar el rango que queremos pegar.

·         Luego marcar las teclas Alt + E C, con esto seleccionamos los datos a copiar con Pegado Especial.

·         Por último pegar con CTRL + V    

 5.  F4 - Cambiar el estilo de una referencia de celda, mientras editas  fórmulas.

Si desea cambiar el estilo de una referencia de celda supongamos  (A2) cuando la está editando,  es decir cambiar una referencia relativa a una referencia absoluta ($ A $ 2), para eso mientras edita aplicamos tecla F4 y Excel cambia el estilo de referencia.  

 6.  F2 - Editar una celda.

Tan simple como eso.

 7.  F3 - Mostrar nombres.

 Si  estoy haciendo un modelo de panel de comandos con Excel, donde se definen varios nombres y usas con frecuencia estos nombres todo el tiempo.  Aquí es donde F3 viene muy bien.  Sólo tiene que pulsar F3, no importa donde se encuentre (fórmula de edición, formato condicional, validación de datos, etc) y se obtiene una lista de todos los nombres definidos.  Elige uno y pulsa Aceptar para añadirlo a la fórmula que estés escribiendo.

 8.  ALT + B + 3 – Agregar Hipervínculo.

Si utiliza Hipervínculos en su libro de trabajo y los  frecuentemente, sobre todo, si tiene más de un par de hojas.  Seleccione una celda o la forma y presione ALT + B +3 para lanzar el cuadro hipervínculo.  Escriba la URL de destino o la ubicación y ya está.

 9.  CTRL + T - Insertar Tabla.

Cuando se está usando un montón de datos y trabajando con tablas, es cómodo y útil aplicar CTRL + T y aparecerá el cuadro de Tabla.    Para utilizar este atajo, seleccionamos los datos a utilizar y  CTRL + T para que se cree la tabla.

 10.  ALT + 1 – Guardar.

No tiene sentido hacer algo elaborado en Excel si se olvidó de guardar.  Así que presione ALT +1.

Tener en consideración que dependiendo de la versión de Excel, es la combinación de teclas.  En este caso estos atajos de teclas están en función de Excel 2010.  

viernes, 19 de agosto de 2011

Tablero Interactivo con Hipervínculos - Dashboard [1]

Este ejemplo nos muestra una aplicación sofisticada de un Dashboard que contiene datos, un gráfico, un código de macro de una línea.

Para construir esta planilla se requieren 5 pasos para crear panel interactivo mediante hipervínculos:

Paso 1:  Configurar los datos.

Cualquier buen ejercicio gráfico o tablero debe comenzar con la configuración de los datos.   Así, lo primero que se debe hacer es configurar los datos.

Si observa cuidadosamente, sólo se tiene un gráfico y se cambian los datos de origen del gráfico en función de la opción usuario seleccionado.

Así que, suponiendo que tenga 4 series de datos: ventas, gastos, ganancias y número de clientes, se agregará una quinta serie.  Siempre aparecerán datos para la serie que el usuario seleccione.

Paso 2: Crear un gráfico para la data con las 5 series.   

Esto es muy simple. Acaba de crear un gráfico de los datos en la quinta columna. 
Paso 3: Crear el área del dashboard.
Esto es un poco complicado, pero fácil también.  Se debe crear un área de 4 columna (ya que tenemos 4 gráficos).
Paso 4: Crear el efecto Roll-over.
Ahora viene la parte mágica.   Se requiere una macro sencilla o UDF para cambiar la serie, basado en la selección que efectue el usuario cuando pasa el mouse sobre las opciones.


Paso 5: Agregar un formato condicional para resaltar el nombre de la serie seleccionada.
Esto es opcional, pero una vez que agregas el formato condicional, el tablero de mandos se ve interactivo.




 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Laundry Detergent Coupons