PRÁCTICA 1
Instalando el Software Weka
Nombre:
OBJETIVO
Conocer la forma de instalar el paquete de Weka y de esta manera dar un primer acercamiento
al software y sus múltiples herramientas para el análisis de datos y poder dar un apoyo a la
toma de decisiones.
INTRODUCCIÓN
La extracción de conocimiento a partir de fuentes masivas de datos. Para ello se emplean las
denominadas técnicas de minería de datos, que son algoritmos capaces de obtener relaciones
entre distintos atributos o conceptos para ayudar a la toma de decisiones. Además de las
técnicas estadísticas se estudian las técnicas de Minería de Datos (Data Mining) basadas en
técnicas de aprendizaje automático que se implementan en una herramienta de minería de
datos de libre distribución: WEKA.
Esta herramienta permite, a partir de ficheros de texto en un formato determinado, utilizar
distintos tipos de técnicas para extraer información. (García Herrero & Molina Lopez, 2012)
El paquete Weka contiene una colección de herramientas de visualización y algoritmos para
análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder
fácilmente a sus funcionalidades.
Esta versión original se diseñó inicialmente como herramienta para analizar datos procedentes
del dominio de la agricultura, pero la versión más reciente basada en Java (WEKA 3), que
empezó a desarrollarse en 1997, se utiliza en muchas y muy diferentes áreas, en particular con
finalidades docentes y de investigación.
Ilustración 1: Weka GUI 1999
DESARROLLO
Para poder usar este software abriremos la página oficial de Weka
([Link] en el apartado de versiones
estables utilizaremos la versión que no usa una máquina virtual (se instalará en la pc).
Ilustración 2: Pagina Weka Oficial de descarga 2019
Nota: En caso de usar Mac descargar del apartado Mac Os X.
Una vez hecho lo anterior nos redirigirá a una página en la cual después de 5seg iniciará la
descarga automáticamente como vemos en la siguiente imagen:
Ilustración 3: Descargando Weka
Cuando haya terminado la descarga se ejecutará como administrador el instalador y aparecerá
la pantalla del Asistente de Instalación:
Ilustración 4: Ventana de Instalación de Weka
Daremos clic en Next, después aparecerá la pantalla en la cual nos redacta la licencia publica
general y daremos clic en el botón “I Agree”.
Ilustración 5: Acuerdos de Licencia Weka 2019
En esta pantalla dejamos todo por default dando clic en Next al igual que en las
consecuentes.
Ilustración 6: Eligiendo los Componentes
Una vez que haya terminado la instalación daremos clic en next y después en finish.
Esta es la primera pantalla que nos mostrará una vez haya
terminado de instalar el software.
Posteriormente nos mostrará la siguiente pantalla:
Ilustración 7: Bienvenida de Weka
Ilustración 8: Ventana Principal
CONCLUSIONES
De manera breve, registrar las principales conclusiones obtenidas al término de esta
práctica.
BIBLIOGRAFÍA
Garcia Herrero, Jesús; Molina López, José Manuel “Técnicas de Analisis de Datos (2012)
Universidad Carlos III Madrid.
Acosta Franco, Javier. "Aplicación de los Sistemas Clasificadores tradicionales al análisis de
datos. Adquisición automática de reglas". Proyecto Fin de Carrera, Universidad Carlos III de
Madrid, 2002.
PRÁCTICA 2
Conociendo el Software Weka
Nombre:
OBJETIVO
Conocer cómo funciona el software Weka para poder hacer análisis sobre los metadatos de
alguna base de datos y así mismo poder aplicar filtros (Algoritmos) para mejorar el análisis de
los mismos.
INTRODUCCIÓN
El paquete Weka contiene una colección de herramientas de visualización y
algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de
usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un
front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de
programación, más unas utilidades para preprocesamiento de datos desarrolladas en C para
hacer experimentos de aprendizaje automático. Esta versión original se diseñó inicialmente
como herramienta para analizar datos procedentes del dominio de la agricultura, pero la
versión más reciente basada en Java (WEKA 3), que empezó a desarrollarse en 1997, se
utiliza en muchas y muy diferentes áreas, en particular con finalidades docentes y de
investigación. (Garcia Morate)
Las características de Weka son:
Está disponible libremente bajo la licencia pública general de GNU.
Es muy portable porque está completamente implementado en Java y puede correr en
casi cualquier plataforma.
Contiene una extensa colección de técnicas para preprocesamiento de datos y
modelado.
Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.
Weka soporta varias tareas estándar de minería de datos, especialmente, preprocesamiento de
datos, clustering, clasificación, regresión, visualización, y selección. Todas las técnicas de
Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano o
una relación, en la que cada registro de datos está descrito por un número fijo de atributos
(normalmente numéricos o nominales, aunque también se soportan otros tipos) (Garcia
Morate).
DESARROLLO
Por medio de la herramienta Weka precargue un repositorio de datos que viene como parte de
los ejemplos a usar y su funcionamiento. Dando clic en el botón de “Open file” y después en
la ventana selecciona la ruta “C:\Program Files\Weka-3-8\data” (Datasets) que es donde se
instaló Weka y seleccionará el archivo con nombre “[Link]”.
Ilustración 9: Carga de los Datos
El primer apartado que debe observa es el de Atributos (Attributes) en el cual aparecen todos
los aspectos que representan a una instancia y que darán un resultado (una predicción).
Ilustración 10: Apartado de Atributos de Weka
En caso de que requiera visualizar o modificar el set de datos (base de datos) hacer clic en el
botón “Edit”.
Ilustración 11: Ventana para editar los datos de entrada para Weka
Ilustración 12: Explorador de Weka con datos cargados
Tomando en cuenta lo anterior y con el set de datos cargados visualice cual es la
posibilidad de salir a jugar siendo que “temperatura=templado(mild)” o
“humedad=normal”.
CONCLUSIONES
De manera breve, registrar las principales conclusiones obtenidas al término de esta
práctica
BIBLIOGRAFIA
García Herrero, Jesús; Molina López, José Manuel “Técnicas de Análisis de Datos”
(2012) Universidad Carlos III Madrid.
Acosta Franco, Javier. "Aplicación de los Sistemas Clasificadores tradicionales al
análisis de datos. Adquisición automática de reglas". Proyecto Fin de Carrera,
Universidad Carlos III de Madrid, 2002.
Riquelme, José C.; Ruiz, Roberto; Gilbert, Karina. Minería de Datos: Conceptos y
Tendencias. Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial,
vol. 10, núm. 29, primavera 2006