Introducción
paramétrica, reglas de asociación, selección de características y algoritmos de
construcción.
• KNIME (Konstanz Information Miner). Es una plataforma de código abierto
para Ia integración de datos, procesamiento, análisis y exploración desarrollada
por Ia cátedra de Bioinformática y Minería de Información de Ia Universidad de
Konstanz, Alemania, usando prácticas de ingeniería de software, y actualmente
está siendo utilizada por más de seis mil profesionales en todo el mundo, tanto
de Ia industria como a nivel académico. Integra todos los módulos de análisis
del entorno Weka, y plugins adicionales permiten que se ejecuten R-scripts,
ofreciendo acceso a una vasta librería de rutinas estadísticas.
• Oracle Data Mining (ODM). Es una opción de sistema de gestión de base de datos
relacional (RDBMS) de Oracle Database Enterprise Edition (EE). Contiene varios
algoritmos de minería de datos y análisis de datos para clasificación, predicción,
regresión, asociaciones, selección de características, detección de anomalías,
extracción de características y análisis especializado. Estas implementaciones se
integran en el núcleo de Ia base de datos Oracle, y operan de forma nativa sobre
los datos almacenados en las tablas de bases de datos relacionales. El sistema
está organizado en torno a unas pocas operaciones genéricas que proporcionan
una interfaz unificada general de las funciones de minería de datos.
• IBM SPSS Modeler. Originalmente llamada SPSS Clementine de SPSS Inc., después
fue renombrada PASW Modeler, pero cuando en 2009 IBM adquirió SPSS Inc. fue
denominada IBM SPSS Modeler. IBM SPSS Modeler es una aplicación de software
de data mining de IBM. Es una herramienta de data mining y de análisis de texto,
utilizada para construir modelos predictivos. Tiene una interfaz visual que permite
a los usuarios utilizar algoritmos estadísticos y de data mining sin programar.
• SAS Enterprise Miner. Es una potente herramienta de apoyo en el proceso de
minería de datos con un diseño abierto y extensible con un amplio conjunto de
capacidades. Dispone de una interfaz de usuario fácil de usar, que permite a los
usuarios empresariales construir y valorar los mejores y más avanzados modelos
predictivos y descriptivos de manera rápida y fácil, mejorando Ia precisión de las
predicciones, y compartiendo información fiable para que los analistas de negocio
puedan mejorar Ia calidad de sus decisiones disponiendo de conclusiones e ideas
de forma rápida, autosuficiente y automatizada.
Específicamente, en España, las tecnologías big data arrancaron definitivamente en
2012, con gran aceleración del número de iniciativas, productos y servicios en 2013.
Sin embargo, la casi totalidad de las aún pocas iniciativas comerciales existentes en
España se basan en servicios a medida para la construcción de soluciones big data (en
algún caso alineado a la representación comercial de algún producto), o en soluciones
“verticales” sobre plataformas ya preimplementadas (soluciones para casos de uso
17
E-Books & Papers for Statisticians