ModelerScriptingAutomation PDF
ModelerScriptingAutomation PDF
1 Guía de
automatización y scripts Python
IBM
Nota
Antes de utilizar esta información y el producto al que da soporte, lea la información del apartado “Avisos” en la página
381.
Información de producto
Esta edición se aplica a la versión 18, release 1, modificación 1 de IBM SPSS Modeler y a todos los releases y las
modificaciones posteriores hasta que se indique lo contrario en nuevas ediciones.
Contenido
Capítulo 1. Scripts y lenguaje de scripts 1 Creación de nodos y modificación de rutas . . . . 31
Visión general de scripts . . . . . . . . . . 1 Creación de nodos . . . . . . . . . . . 31
Tipos de scripts . . . . . . . . . . . . . 1 Enlazar y desenlazar nodos . . . . . . . . 31
Scripts de ruta . . . . . . . . . . . . . . 1 Importar, sustituir y eliminar nodos . . . . . 33
Ejemplo de script de ruta: entrenamiento de una Atravesar los nodos de una ruta . . . . . . 33
red neuronal . . . . . . . . . . . . . 3 Borrado o eliminación de elementos . . . . . . 34
Límites de tamaño de código Jython . . . . . 4 Obtener información sobre los nodos . . . . . . 34
Scripts autónomos . . . . . . . . . . . . 4
Ejemplo de script autónomo: guardar y cargar un Capítulo 4. API de scripts. . . . . . . 37
modelo . . . . . . . . . . . . . . . 4 Introducción a la API de scripts . . . . . . . 37
Ejemplo de script autónomo: Generación de un Ejemplo 1: buscar nodos utilizando un filtro
modelo de selección de características . . . . . 5 personalizado . . . . . . . . . . . . . 37
Scripts de Supernodo . . . . . . . . . . . 5 Ejemplo 2: permitir a los usuarios obtener
Script de supernodo de ejemplo . . . . . . . 6 información de directorio o archivo basándose en
Creación de bucles y ejecución condicional en rutas . 6 sus privilegios . . . . . . . . . . . . . 37
Bucles en rutas . . . . . . . . . . . . 7 Metadatos: información sobre datos . . . . . . 38
Ejecución condicional en rutas . . . . . . . 11 Acceso a objetos generados . . . . . . . . . 41
Ejecutar e interrumpir scripts . . . . . . . . 12 Manejo de errores . . . . . . . . . . . . 42
Buscar y reemplazar . . . . . . . . . . . 12 Parámetros de ruta, sesión y Supernodo . . . . . 43
Valores globales . . . . . . . . . . . . . 46
Capítulo 2. Language de scripts . . . . 15 Trabajar con varias rutas: Scripts autónomos . . . 47
Visión general de lenguaje de script . . . . . . 15
Python y Jython . . . . . . . . . . . . . 15 Capítulo 5. Sugerencias para scripts 49
Scripts de Python . . . . . . . . . . . . 16 Modificación de ejecución de rutas . . . . . . 49
Operaciones . . . . . . . . . . . . . 16 Nodos de recorrido en bucle. . . . . . . . . 49
Listas . . . . . . . . . . . . . . . 16 Acceso a objetos en el Repositorio de IBM SPSS
Cadenas . . . . . . . . . . . . . . 17 Collaboration and Deployment Services . . . . . 50
Observaciones . . . . . . . . . . . . 18 Generación de una contraseña codificada . . . . 52
Sintaxis de las sentencias . . . . . . . . . 19 Comprobación de script . . . . . . . . . . 52
Identificadores . . . . . . . . . . . . 19 Scripts desde la línea de comandos . . . . . . 52
Bloques de código . . . . . . . . . . . 19 Compatibilidad con releases anteriores . . . . . 53
Pasar argumentos a un script . . . . . . . 20 Acceder a resultados de ejecución de la ruta . . . 53
Ejemplos . . . . . . . . . . . . . . 20 Modelo de contenido de tabla . . . . . . . 54
Métodos matemáticos . . . . . . . . . . 21 Modelo de contenido XML . . . . . . . . 55
Utilización de caracteres no ASCII . . . . . . 22 Modelo de contenido JSON . . . . . . . . 57
Programación orientada a objetos . . . . . . . 23 Modelo de contenido de estadísticas de columna
Definición de una clase . . . . . . . . . 24 y modelo de contenido de estadísticas por pares . 58
Creación de una instancia de clase. . . . . . 24
Añadir atributos a una instancia de clase . . . 24 Capítulo 6. Argumentos de la línea de
Definición de atributos de clase y métodos . . . 24
comandos . . . . . . . . . . . . . 63
Variables ocultas. . . . . . . . . . . . 25
Invocación del software . . . . . . . . . . 63
Heredado . . . . . . . . . . . . . . 25
Utilización de argumentos de la línea de comandos 63
Argumentos del sistema . . . . . . . . . 64
Capítulo 3. Scripts de IBM SPSS Argumentos de parámetros . . . . . . . . 65
Modeler . . . . . . . . . . . . . . 27 Argumentos de conexión del servidor . . . . 66
Tipos de scripts . . . . . . . . . . . . . 27 Repositorio de IBM SPSS Collaboration and
Rutas, rutas de supernodo y diagramas . . . . . 27 Deployment Services Argumentos de conexión . 67
Rutas . . . . . . . . . . . . . . . 27 Argumentos de conexión de IBM SPSS Analytic
Rutas de Supernodo . . . . . . . . . . 27 Server . . . . . . . . . . . . . . . 68
Diagramas. . . . . . . . . . . . . . 27 Combinación de varios argumentos . . . . . 68
Ejecución de una ruta . . . . . . . . . . . 27
El contexto de los scripts . . . . . . . . . . 28 Capítulo 7. Referencia de propiedades 69
Referencia a nodos existentes . . . . . . . . 29 Visión general de referencia de propiedades . . . 69
Buscar nodos . . . . . . . . . . . . . 29 Sintaxis para propiedades . . . . . . . . 69
Establecimiento de propiedades . . . . . . 30
iii
Ejemplos de las propiedades node y stream . . 71 propiedades de reprojectnode . . . . . . . . 148
Visión general de propiedades de nodo . . . . . 71 propiedades de restructurenode . . . . . . . 149
Propiedades de nodos comunes . . . . . . 71 propiedades de rfmanalysisnode . . . . . . . 149
propiedades de settoflagnode . . . . . . . . 151
Capítulo 8. Propiedades de ruta . . . . 73 propiedades de statisticstransformnode . . . . . 151
Propiedades timeintervalsnode (en desuso) . . . 152
Propiedades de transposenode . . . . . . . 156
Capítulo 9. Propiedades de nodos de
propiedades de typenode . . . . . . . . . 157
origen . . . . . . . . . . . . . . . 77
Propiedades comunes de nodos de origen . . . . 77
Capítulo 12. Propiedades de nodos
Propiedades de asimport . . . . . . . . . . 81
Propiedades del nodo cognosimport . . . . . . 82 Gráfico . . . . . . . . . . . . . . 163
propiedades de databasenode . . . . . . . . 84 Propiedades comunes del nodo Gráfico. . . . . 163
Propiedades de datacollectionimportnode . . . . 86 Propiedades de collectionnode. . . . . . . . 164
Propiedades de excelimportnode . . . . . . . 88 Propiedades de distributionnode . . . . . . . 165
Propiedades de extensionimportnode . . . . . . 89 Propiedades de evaluationnode . . . . . . . 166
Propiedades de fixedfilenode . . . . . . . . 92 Propiedades de graphboardnode . . . . . . . 168
Propiedades del nodo gsdata_import . . . . . . 94 Propiedades de histogramnode . . . . . . . 170
Propiedades de sasimportnode . . . . . . . . 94 Propiedades de mapvisualization . . . . . . . 171
propiedades de simgennode . . . . . . . . . 95 Propiedades de multiplotnode . . . . . . . . 175
Propiedades de statisticsimportnode . . . . . . 97 Propiedades de plotnode . . . . . . . . . 176
Propiedades del nodo tm1odataimport . . . . . 97 Propiedades de timeplotnode . . . . . . . . 178
Propiedades del nodo tm1import (en desuso) . . . 98 Propiedades eplotnode . . . . . . . . . . 179
Propiedades del nodo twcimport . . . . . . . 99 Propiedades tsnenode . . . . . . . . . . 180
Propiedades de userinputnode . . . . . . . 100 Propiedades de webnode . . . . . . . . . 182
Propiedades de variablefilenode . . . . . . . 100
Propiedades de xmlimportnode . . . . . . . 104 Capítulo 13. Propiedades de nodos de
Propiedades de dataviewimport . . . . . . . 104 modelado . . . . . . . . . . . . . 185
Propiedades comunes de nodos de modelado . . 185
Capítulo 10. Propiedades de nodos de propiedades de anomalydetectionnode . . . . . 185
operaciones con registros . . . . . . 107 propiedades de apriorinode . . . . . . . . 187
propiedades de appendnode . . . . . . . . 107 propiedades associationrulesnode . . . . . . 188
propiedades de aggregatenode . . . . . . . 107 propiedades de autoclassifiernode . . . . . . 191
propiedades de balancenode . . . . . . . . 108 Propiedades de ajustes de algoritmo. . . . . 192
Propiedades cplexoptnode . . . . . . . . . 109 propiedades de nodo de agrupación en clústeres
Propiedades derive_stbnode . . . . . . . . 111 automática . . . . . . . . . . . . . . 193
propiedades de distinctnode . . . . . . . . 113 propiedades de autonumericnode . . . . . . 194
Propiedades de extensionprocessnode . . . . . 115 Propiedades de bayesnetnode . . . . . . . . 196
propiedades de mergenode . . . . . . . . . 116 propiedades de c50node . . . . . . . . . . 198
propiedades rfmaggregatenode . . . . . . . 118 propiedades de carmanode . . . . . . . . . 199
propiedades de samplenode . . . . . . . . 120 propiedades de cartnode . . . . . . . . . 200
propiedades de selectnode . . . . . . . . . 122 propiedades de chaidnode . . . . . . . . . 203
propiedades de sortnode . . . . . . . . . 122 propiedades de coxregnode. . . . . . . . . 205
Propiedades de spacetimeboxes . . . . . . . 123 Propiedades de decisionlistnode . . . . . . . 206
Propiedades streamingtimeseries . . . . . . . 125 propiedades de discriminantnode . . . . . . 208
Propiedades de extensionmodelnode . . . . . 209
propiedades de factornode . . . . . . . . . 212
Capítulo 11. Propiedades de nodos de
propiedades de featureselectionnode . . . . . 213
operaciones con campos . . . . . . 133 propiedades de genlinnode . . . . . . . . . 215
propiedades de anonymizenode . . . . . . . 133 Propiedades de glmmnode . . . . . . . . . 218
properties autodataprepnode . . . . . . . . 134 Propiedades de gle . . . . . . . . . . . 222
propiedades de astimeintervalsnode . . . . . . 137 propiedades de kmeansnode . . . . . . . . 227
propiedades de binningnode . . . . . . . . 137 propiedades de knnnode . . . . . . . . . 228
propiedades de derivenode . . . . . . . . . 140 propiedades de kohonennode . . . . . . . . 229
propiedades de ensemblenode. . . . . . . . 142 Propiedades de linearnode . . . . . . . . . 231
propiedades de fillernode . . . . . . . . . 143 Propiedades de linearasnode . . . . . . . . 232
propiedades de filternode . . . . . . . . . 144 Propiedades de logregnode . . . . . . . . . 233
propiedades de historynode . . . . . . . . 145 propiedades de lsvmnode . . . . . . . . . 237
propiedades de partitionnode . . . . . . . . 146 propiedades de neuralnetnode. . . . . . . . 238
propiedades de reclassifynode . . . . . . . . 147 Propiedades de neuralnetwork . . . . . . . 241
propiedades de reordernode . . . . . . . . 148 propiedades de questnode . . . . . . . . . 242
Contenido v
Propiedades de smotenode . . . . . . . . . 356 Literales y comentarios . . . . . . . . . . 372
Propiedades xgboostlinearnode . . . . . . . 357 Operadores . . . . . . . . . . . . . . 372
Propiedades de xgboosttreenode . . . . . . . 358 Comandos condicionales y de bucle . . . . . . 373
Variables . . . . . . . . . . . . . . . 374
Capítulo 20. Propiedades de nodo Tipos modelo, resultado y nodo . . . . . . . 374
Spark . . . . . . . . . . . . . . . 361 Nombres de propiedades . . . . . . . . . 374
Referencias de nodos . . . . . . . . . . . 374
Propiedades isotonicasnode . . . . . . . . 361
Obtener y establecer propiedades. . . . . . . 375
Propiedades xgboostasnode . . . . . . . . 361
Edición de rutas . . . . . . . . . . . . 375
Operaciones de nodo . . . . . . . . . . 376
Capítulo 21. Propiedades de Bucle . . . . . . . . . . . . . . . . 377
supernodo . . . . . . . . . . . . 365 Ejecución de rutas . . . . . . . . . . . . 377
Acceso a objetos mediante el sistema de archivos y
Apéndice A. Referencia de nombres el repositorio . . . . . . . . . . . . . 378
de nodo . . . . . . . . . . . . . . 367 Operaciones de ruta . . . . . . . . . . 379
Nombres de nugget de modelo . . . . . . . 367 Operaciones de modelo . . . . . . . . . 379
Evitar nombres duplicados del modelo . . . . . 369 Operaciones de resultado de documento . . . 379
Nombres de tipo de resultados . . . . . . . 369 Otras diferencias entre scripts heredados y scripts
Python . . . . . . . . . . . . . . . 380
Apéndice B. Migración desde scripts
Avisos . . . . . . . . . . . . . . 381
de herencia a scripts Python. . . . . 371
Marcas comerciales . . . . . . . . . . . 382
Visión general de la migración de scripts de
Términos y condiciones para la documentación del
herencia . . . . . . . . . . . . . . . 371
producto . . . . . . . . . . . . . . . 383
Diferencias generales . . . . . . . . . . . 371
El contexto de los scripts . . . . . . . . . 371
Comparativa de comandos y funciones . . . . . 371 Índice. . . . . . . . . . . . . . . 385
Este capítulo proporciona descripciones de alto nivel y ejemplos de scripts de nivel de ruta, scripts
autónomos y scripts en Supernodos en la interfaz de IBM SPSS Modeler. Para obtener más información
sobre el lenguaje, la sintaxis y los comandos consulte los capítulos siguientes.
Nota:
No puede importar y ejecutar scripts creados en IBM SPSS Statistics dentro de IBM SPSS Modeler.
Tipos de scripts
IBM SPSS Modeler utiliza tres tipos de scripts:
v Los scripts de la ruta se guardan como una propiedad de ruta y se guardan y se cargan con una ruta
específica. Por ejemplo, puede escribir un script de ruta que automatice el proceso de entrenamiento y
aplicación de un nugget de modelo. También puede especificar que cuando se ejecute una ruta
particular, se ejecute el script, en lugar del contenido del lienzo de la ruta.
v Los scripts autónomos no están asociados a ninguna ruta en particular y se guardan en archivos de
texto externos. Puede utilizar un script autónomo, por ejemplo, para manipular varias rutas a la vez.
v Los scripts Supernodos se guardan como una propiedad de ruta de supernodo. Los scripts
Supernodos sólo están disponibles en supernodos terminales. Puede utilizar un script de supernodo
para controlar la secuencia de ejecución del contenido del supernodo. En supernodos no terminales
(origen o proceso), puede definir propiedades del supernodo o los nodos que contiene en su script de
ruta directamente.
Scripts de ruta
Los scripts se pueden utilizar para personalizar operaciones dentro de una ruta particular y se guardan
con esa ruta. Los scripts de la ruta se pueden utilizar para especificar un orden de ejecución particular
para los nodos terminales de una ruta. El cuadro de diálogo del script de ruta se utiliza para editar el
script que está guardado con la ruta actual.
Utilice los iconos de barra de herramientas en la parte superior del recuadro de diálogo del script de ruta
para las operaciones siguientes:
v Importar el contenido de un script autónomo preexistente en la ventana.
v Guardar un script como archivo de texto.
v Imprimir un script.
v Añadir script predeterminado.
v Editar un script (deshacer, cortar, copiar, pegar y otras funciones de edición comunes).
v Ejecutar el script completo actual.
v Ejecutar líneas concretas de un script.
v Detener un script durante la ejecución. (Este icono sólo está habilitado cuando un script se está
ejecutando).
v Comprobar la sintaxis del script y, si se encuentra algún error, mostrarlos para la revisión en el panel
inferior del recuadro de diálogo.
Nota: A partir de la versión 16.0, SPSS Modeler utiliza el lenguaje de scripts Python. Todas las versiones
anteriores a la 16.0 utilizaban un lenguaje de script exclusivo para SPSS Modeler, al que ahora se
denomina como script de legado. Según el tipo de script con el que trabaje, en la pestaña Ejecución
seleccione la modalidad de ejecución Predeterminada (script opcional) y, a continuación, seleccione
Python o Legacy.
Puede especificar si un script se va a ejecutar o no cuando se ejecuta la ruta. Para ejecutar el script cada
vez que se ejecuta la ruta, respectando el orden de ejecución del script, seleccione Ejecutar este script. De
este modo se proporciona una automatización a nivel de ruta para acelerar la generación del modelo. Sin
embargo, la configuración predeterminada es omitir el script durante la ejecución de la ruta. Incluso si
selecciona la opción Omitir este script, siempre puede ejecutar la ruta directamente desde este cuadro de
diálogo.
El editor de scripts incluye las siguientes características que ayudan a crear scripts:
v Resaltado de sintaxis. Se resaltan las palabras claves, los valores literales (tales como cadenas y
números) y los comentarios.
v Numeración de líneas.
v Coincidencia de bloques. Cuando se coloca el cursor al inicio de un bloque de programa, también se
resalta el bloque final correspondiente.
v Finalización automática sugerida.
Los colores y los estilos de texto que utiliza la función de resaltado de la sintaxis se pueden personalizar
utilizando las preferencias de visualización de IBM SPSS Modeler. Para acceder a las preferencia de
visualización, elija Herramientas > Opciones > Opciones de usuario y seleccione la pestaña Sintaxis.
La pestaña Depurar muestra mensajes de depuración y se puede utilizar para evaluar el estado del script
una vez que se haya ejecutado. La pestaña Depurar está formada por un área de texto de solo lectura y
Nota: La ejecución de una ruta fuera del panel del script no modifica el contexto del script del panel del
script. Los valores de las variables que se han creado como parte de la ejecución no son visibles dentro
del recuadro de diálogo de script.
Mediante un script de IBM SPSS Modeler se puede automatizar el proceso de comprobar el nugget de
modelo tras crearlo. Por ejemplo, el siguiente script de ruta para la ruta de demostración [Link]
(disponible en la carpeta /Demos/streams/ de su instalación de IBM SPSS Modeler) se puede ejecutar
desde el cuadro de diálogo de propiedades de ruta (Herramientas > Propiedades de ruta > Ruta):
stream = [Link]()
neuralnetnode = [Link]("neuralnetwork", None)
results = []
[Link](results)
appliernode = [Link](results[0], "Drug", 594, 187)
analysisnode = [Link]("analysis", "Drug", 688, 187)
typenode = [Link]("type", None)
[Link](appliernode, typenode, analysisnode)
[Link]([])
Es posible utilizar un script para crear y ejecutar una ruta desde cero, comenzando con un lienzo vacío.
Para obtener más información sobre el lenguaje de script en general, consulte Conceptos básicos del
lenguaje de scripts.
Asegúrese de escribir los scripts Jython utilizando buenas prácticas de codificación (por ejemplo
minimizando el código duplicado utilizando variables o funciones para calcular valores intermedios
comunes). Si es necesario, puede que sea necesario dividir el código en varios archivos de origen o
definirlo utilizando módulos porque éstos se compilan en archivos de código de bytes independientes.
Scripts autónomos
El cuadro de diálogo script autónomo se usa para crear o editar un script que se ha guardado como
archivo de texto. En él se muestra el nombre del archivo y se proporcionan recursos para la carga,
almacenamiento, importación y ejecución de scripts.
Los scripts autónomos y los de ruta comparten las mismas opciones de comprobación de sintaxis de
scripts y barra de herramientas. Consulte el tema “Scripts de ruta” en la página 1 para obtener más
información.
# First load the model builder stream from file and build a model
druglearn_stream = [Link](installation + "streams/[Link]", True)
results = []
druglearn_stream.findByType("c50", None).run(results)
# Now load the plot stream, read the model from file and insert it into the stream
drugplot_stream = [Link](installation + "streams/[Link]", True)
model = [Link]("[Link]", True)
modelapplier = drugplot_stream.createModelApplier(model, "Drug")
Nota: Para obtener más información sobre el lenguaje de scripts en general, consulte Conceptos básicos
del lenguaje de scripts.
[Link](statisticsimportnode, typenode)
[Link](typenode, featureselectionnode)
models = []
[Link](models)
# Assumes the stream automatically places model apply nodes in the stream
applynode = [Link]("applyfeatureselection", None)
tablenode = [Link]("table", "Table", [Link]() + 96,
[Link]())
[Link](applynode, tablenode)
[Link]([])
El script crea un nodo de origen para leer en los datos, utiliza un nodo Tipo para definir el rol del campo
response_01 hacia Destino y, a continuación, crea y ejecuta un nodo Selección de características. Este
script también conecta cada nodo y posiciones en el lienzo de la ruta para producir un diseño legible. El
nugget de modelo resultante se conecta al nodo Tabla, que indica los 15 campos más importantes, tal y
como determinan las propiedades selection_mode y top_n. Consulte el tema “propiedades de
featureselectionnode” en la página 213 para obtener más información.
Scripts de Supernodo
Puede crear y guardar scripts en cualquier supernodo de terminal utilizando el lenguaje de script de IBM
SPSS Modeler. Estos scripts sólo están disponibles para supernodos terminales y se suelen utilizar cuando
crea rutas de plantilla o para imponer un orden de ejecución especial del contenido del supernodo. Los
scripts de supernodo también permiten ejecutar más de un script en una ruta.
Por ejemplo, supongamos que necesita especificar el orden de ejecución de una ruta compleja y su
supernodo contiene varios nodos, incluyendo un nodo Val. globales, que se debe ejecutar antes de derivar
un nuevo campo utilizado en un nodo Gráfico. En este caso, puede crear un script de supernodo que
En un script de Supernodo, puede especificar las propiedades del nodo de la misma manera que otros
scripts. También puede cambiar y definir las propiedades de cualquier supernodo o sus nodos
encapsulados directamente desde un script de ruta. Consulte el tema Capítulo 21, “Propiedades de
supernodo”, en la página 365 para obtener más información. Este método funciona para supernodos de
origen y proceso y supernodos terminales.
Nota: Puesto que solo los supernodos de terminal pueden ejecutar sus propios scripts, la pestaña Scripts
del recuadro de diálogo Supernodo solo está disponible para los supernodos de terminal.
Script de Supernodo...
Pulse con el botón derecho del ratón en el lienzo del supernodo y en el menú contextual elija:
Script de Supernodo...
Nota: Puesto que tanto un bucle como una ejecución condicional están basados en scripts de segundo
plano, solo se aplican a una ruta entera cuando se ejecuta.
v Bucles Los bucles pueden utilizarse para automatizar tareas repetitivas. Por ejemplo, esto podría
suponer añadir un determinado número de nodos a una ruta y modificar un parámetro del nodo cada
vez. De forma opcional, podría controlarse la ejecución de una ruta o rama varias veces, como en los
ejemplos siguientes:
– Ejecutar la ruta un determinado número de veces y cambiar el origen cada vez.
– Ejecutar la ruta un determinado número de veces cambiando el valor de una variable cada vez.
– Ejecutar la ruta un determinado número de veces especificando un campo adicional en cada
ejecución.
– Construir un modelo un determinado número de veces y cambiar la configuración del modelo cada
vez.
v Ejecución condicional Puede utilizarse para controlar cómo ejecutan los nodos en función de
condiciones definidas previamente como, por ejemplo:
– Dependiendo de si un determinado valor es verdadero o falso, se controla la ejecución de un nodo.
– Definir si la iteración de nodos se ejecutará en paralelo o de forma secuencial.
Tanto bucles ejecuciones condicionales se configuran en la pestaña Ejecución dentro del cuadro de
diálogo Propiedades de ruta. Los nodos que se utilicen en bucles o de forma condicional aparecerán con
un símbolo adicional en el lienzo de rutas para indicar que forman parte de una ejecución por bucles o
condicional.
Si es la primera vez que configura los detalles de un bucle o de una ejecución condicional, en la pestaña
Ejecución seleccione el modo de ejecución Ejecución de bucles/condicional y después seleccione la
subpestaña Condicional o Bucles.
Bucles en rutas
Con la creación de bucles puede automatizar las tareas repetitivas en las rutas, por ejemplo:
v Ejecutar la ruta un determinado número de veces y cambiar el origen cada vez.
v Ejecutar la ruta un determinado número de veces cambiando el valor de una variable cada vez.
v Ejecutar la ruta un determinado número de veces especificando un campo adicional en cada ejecución.
Configurar las condiciones que deben cumplirse en la subpestaña Bucle de la pestaña Ejecución de la
ruta. Para visualizar la subpestaña, seleccione el modo de ejecución Ejecución en bucle/condicional.
Los requisitos de bucle que defina entrarán en vigor cuando se ejecute la ruta, si se ha establecido la
modalidad de ejecución Ejecución en bucle/condicional. De forma opcional, puede generar el código de
script para los requisitos de bucle y pegarlo en el editor de scripts pulsando Pegar... en el ángulo inferior
derecho de la subpestaña Bucle y la visualización de la pestaña Ejecución principal cambiará para
mostrar la modalidad de ejecución Predeterminada (script opcional) con el script en la parte superior de
la pestaña. Esto significa que puede definir bucles utilizando las diferentes opciones del cuadro de
diálogo de bucle antes de generar un script que puede personalizar adicionalmente en el editor de
scripts. Tenga en cuenta que cuando pulsa Pegar... los requisitos de bucle que ha definido también se
mostrarán en el script generado.
Importante: Las variables de bucle que establezca en una ruta de SPSS Modeler pueden sustituirse si se
ejecuta la ruta en un trabajo IBM SPSS Collaboration and Deployment Services. Esto se debe a que la
entrada del editor del trabajo IBM SPSS Collaboration and Deployment Services sobrescribe la entrada de
SPSS Modeler. Por ejemplo, si se establece una variable de bucle en la ruta para crear un nombre de
archivo de salida diferente para cada bucle, los archivos se especifican correctamente en SPSS Modeler,
pero son sustituidos por la entrada fija especificada en la pestaña Resultado del Gestor de despliegue de
IBM SPSS Collaboration and Deployment Services.
Para abrir el cuadro de diálogo, seleccione el botón Clave de iteración... en el ángulo inferior izquierdo
de la subpestaña Bucle o pulse con el derecho cualquier nodo de la ruta y seleccione Ejecución en
bucle/condicional > Definir clave de iteración (campos) o Ejecución en bucle/condicional > Definir
clave de iteración (valores). Si abre el cuadro de diálogo desde la ruta, algunos campos se completan
automáticamente, tales como el nombre del nodo.
Qué se ha de establecer. Elija el elemento cuyo valor se establecerá cada vez que se ejecute el bucle.
Puede seleccionar entre una de las opciones siguientes:
v Parámetro. Solo está disponible si se selecciona Parámetro de ruta - Campos o Parámetro de ruta -
Valores. Seleccione el parámetro necesario en la lista disponible.
v Nodo. Solo está disponible si se selecciona Propiedad del nodo - Campos o Propiedad del nodo -
Valores. Seleccione el nodo para el que desee configurar un bucle. Pulse el botón Examinar para abrir
el diálogo Seleccionar nodo y elija el nodo que desee. Si hay demasiados nodos en la lista, puede filtrar
la visualización para que únicamente se muestren los nodos de una de las siguientes categorías:
Origen, Proceso, Gráfico, Modelado, Resultados o Aplicar modelo.
v Propiedad. Solo está disponible si se selecciona Propiedad del nodo - Campos o Propiedad del nodo -
Valores. Seleccione la propiedad del nodo en la lista disponible.
Campos de uso. Solo está disponible si se selecciona Parámetro de ruta - Campos o Propiedad del nodo
- Campos. Seleccione el campo o los campos de un nodo que se utilizarán para proporcionar los valores
de iteración. Puede seleccionar entre una de las opciones siguientes:
v Nodo. Solo está disponible si se selecciona Parámetro de ruta - Campos. Seleccione el nodo que
contiene los detalles para los que desea configurar un bucle. Pulse el botón Examinar para abrir el
diálogo Seleccionar nodo y elija el nodo que desee. Si hay demasiados nodos en la lista, puede filtrar la
visualización para que únicamente se muestren los nodos de una de las siguientes categorías: Origen,
Proceso, Gráfico, Modelado, Resultados o Aplicar modelo.
v Lista de campos. Pulse el botón de lista de la columna derecha para visualizar el cuadro de diálogo
Seleccionar campos, donde puede seleccionar los campos del nodo para proporcionar los datos de
iteración. Para obtener más información, consulte “Selección de campos en iteraciones” en la página 10.
Valores de uso. Solo está disponible si se selecciona Parámetro de ruta - Valores o Propiedad del nodo -
Valores. En el campo seleccionado, seleccione el o los valores que se utilizarán como valores de iteración.
Puede seleccionar entre una de las opciones siguientes:
v Nodo. Solo está disponible si se selecciona Parámetro de ruta - Valores. Seleccione el nodo que
contiene los detalles para los que desea configurar un bucle. Pulse el botón Examinar para abrir el
diálogo Seleccionar nodo y elija el nodo que desee. Si hay demasiados nodos en la lista, puede filtrar la
visualización para que únicamente se muestren los nodos de una de las siguientes categorías: Origen,
Proceso, Gráfico, Modelado, Resultados o Aplicar modelo.
v Lista de campos. Seleccione el campo del nodo para proporcionar los datos de iteración.
v Lista de valores. Pulse el botón de lista de la columna derecha para visualizar el cuadro de diálogo
Seleccionar valores, donde puede seleccionar los valores del campo para proporcionar los datos de
iteración.
Cambiar. Seleccione el tipo de atributo que desea enmendar. Puede elegir Parámetro de ruta o Propiedad
del nodo.
v Si selecciona Parámetro de ruta, elija el parámetro necesario y, a continuación, utilizando una de las
opciones siguientes, si están disponibles en su ruta, defina cómo se debe establecer el valor de dicho
parámetro con cada iteración del bucle:
– Variable global. Seleccione la variable global en la que se debe establecer el parámetro de ruta.
– Casilla de resultados de tabla. Para que un parámetro de ruta sea el valor de una casilla de
resultados de tabla, seleccione la tabla en la lista y especifique la Fila y la Columna que se han de
utilizar.
– Especificar manualmente. Seleccione esta opción si desea especificar manualmente el valor que
tomará este parámetro en cada iteración. Cuando regrese a la subpestaña Bucle se habrá creado una
columna nueva en la que puede especificar el texto necesario.
v Si selecciona Propiedad del nodo, elija el nodo necesario y una de sus propiedades, a continuación,
establezca el valor que desea que se utilice para dicha propiedad. Establezca el nuevo valor de la
propiedad utilizando una de las opciones siguientes:
– Solo. El valor de la propiedad utilizará el valor de la clave de iteración. Para obtener más
información, consulte “Creación de una clave de iteración para bucles de rutas” en la página 8.
– Como prefijo de tallo. Utiliza el valor de la clave de iteración como un prefijo para lo que
especifique en el campo Tallo.
– Como sufijo de tallo. Utiliza el valor de la clave de iteración como un sufijo para lo que especifique
en el campo Tallo.
Si selecciona la opción de prefijo o de sufijo se le solicitará que añada el texto adicional en el campo
Tallo. Por ejemplo, si el valor de la clave de iteración es País de fabricación y selecciona Como prefijo
de tallo, puede entrar - ventas por modelo en este campo.
Ordenar por: puede ordenar campos disponibles para su visualización eligiendo una de las siguientes
opciones:
v Natural: el orden de los campos es aquél en que pasaron desde la parte anterior de la ruta de datos al
nodo actual.
v Nombre: ordena los campos siguiendo un orden alfabético para su visualización.
v Tipo: ordena los campos en función de su nivel de medición. Esta opción es útil cuando se seleccionan
campos con un nivel de medición en particular.
Seleccione los campos de la lista de uno en uno o mantenga pulsada la tecla Mayús o Ctrl mientras
selecciona otros campos para seleccionar varios campos. También puede utilizar los botones que se
muestran bajo la lista para seleccionar grupos de campos en función de su nivel de medición o
seleccionar y anular la selección de todos los campos de la tabla.
Tenga en cuenta que los campos disponibles para su selección se filtran para mostrar solo los campos que
son adecuados para el parámetro de ruta o la propiedad de nodo que se están utilizando. Por ejemplo, si
se está utilizando un parámetro de ruta que tiene un tipo de almacenamiento de cadena, solo se
mostrarán los campos que tengan un tipo de almacenamiento de cadena.
Configurar las condiciones que deben cumplirse en la subpestaña Condicional de la pestaña Ejecución de
la ruta. Para visualizar la subpestaña, seleccione el modo de ejecución Ejecución en bucle/condicional.
Los requisitos de ejecución condicional que defina entrarán en vigor cuando se ejecute la ruta, si se ha
establecido la modalidad de ejecución Ejecución en bucle/condicional. De forma opcional, puede generar
el código de script para los requisitos de ejecución condicional y pegarlo en el editor de scripts pulsando
Pegar... en el ángulo inferior derecho de la subpestaña Condicional; la visualización de la pestaña
Ejecución principal cambiará para mostrar la modalidad de ejecución Predeterminada (script opcional)
con el script en la parte superior de la pestaña. Esto significa que puede definir condiciones utilizando las
diferentes opciones del cuadro de diálogo de bucle antes de generar un script que puede personalizar
adicionalmente en el editor de scripts. Tenga en cuenta que cuando pulsa Pegar... los requisitos de bucle
que ha definido también se mostrarán en el script generado.
para abrir el cuadro de diálogo Añadir sentencia de ejecución condicional. En este diálogo
especifica la condición que se debe cumplir para que se ejecute el nodo.
2. En el cuadro de diálogo Sentencia de ejecución condicional, especifique lo siguiente:
a. Nodo. Seleccione el nodo para el que desee configurar una ejecución condicional. Pulse el botón
Examinar para abrir el diálogo Seleccionar nodo y elija el nodo que desee. Si hay demasiados
nodos en la lista, puede filtrar la visualización para que únicamente se muestren los nodos de una
de las siguientes categorías: Exportar, Gráfico, Modelado o Resultados.
b. Condición basada en. Especifique la condición que se debe cumplir para que se ejecute el nodo.
Puede elegir una de estas cuatro opciones: Parámetro de ruta, Variable global, Casilla de
resultados de tabla o Siempre verdadero. Los detalles que especifique en la mitad inferior del
cuadro de diálogo están controlados por la condición que elija.
v Parámetro de ruta. Seleccione el parámetro de la lista disponible y, a continuación, seleccione el
Operador para ese parámetro; por ejemplo, el operador puede ser Más, Igual, Menor que, Entre,
etc. A continuación especifique el Valor, o los valores mínimos o máximos, dependiendo del
operador seleccionado.
v Variable global. Seleccione la variable de la lista disponible; por ejemplo, esto podría incluir:
Media, Suma, Valor mínimo, Valor máximo o Desviación estándar. A continuación, seleccione
Operador y los valores necesarios.
v Casilla de resultados de tabla. Seleccione el nodo de tabla de la lista disponible y, a
continuación, seleccione la Fila y la Columna en la tabla. A continuación, seleccione Operador y
los valores necesarios.
v Siempre verdadero. Seleccione esta opción si siempre se ha de ejecutar el nodo. Si selecciona
esta opción, no hay parámetros adicionales que seleccionar.
3. Repita los pasos 1 y 2 tantas veces como sea necesario hasta que haya configurado todas las
condiciones que requiere. El nodo que ha seleccionado y la condición que se debe cumplir antes de
que se ejecute el nodo se muestran en el cuerpo principal de la subpestaña de las columnas Ejecutar
nodo y Si esta condición es verdadera respectivamente.
4. De forma predeterminada, los nodos y las condiciones se ejecutan en el orden en que aparecen. Para
subir o bajar un nodo y condición en la lista, pulse el nodo para seleccionarlo y, a continuación, utilice
la flecha arriba o la flecha abajo en la columna de la derecha de la subpestaña para cambiar el orden.
El botón "Ejecutar líneas seleccionadas" ejecuta una única línea, o un bloque de líneas adyacentes, que ha
seleccionado en el script:
Nota: Un script de supernodo se ejecuta cuando el supernodo se ejecuta, siempre que haya seleccionado
Ejecutar este script en el recuadro de diálogo Script de supernodo.
En el cuadro de diálogo de scripts de ruta, se activará el botón rojo de detención durante la ejecución de
scripts. Pulsando este botón, puede abandonar la ejecución del script y de cualquier ruta actual.
Buscar y reemplazar
El cuadro de diálogo Buscar/reemplazar está disponible en lugares donde edita texto de script o de
expresión, incluido el editor de scripts, el generador de expresiones CLEM o cuando define una plantilla
en el nodo Informe. Cuando edite texto en cualquiera de estas áreas, pulse Ctrl para acceder al cuadro
de diálogo, asegurándose de que el cursor está centrado en un área de texto. Por ejemplo, si trabaja en un
nodo Rellenar, puede acceder al cuadro de diálogo desde cualquiera de las áreas de texto de la pestaña
Configuración o desde el campo de texto del generador de expresiones.
1. Con el cursor en un área de texto, pulse Ctrl+F para acceder al cuadro de diálogo Buscar/reemplazar.
Opciones de búsqueda
Sólo palabras completas. Especifica si la operación de búsqueda tiene en cuenta el texto incluido dentro
de las palabras. Por ejemplo, si se selecciona, la búsqueda de fuego no será igual que cortafuegos ni que
corta-fuegos.
Sólo texto seleccionado. Controla el ámbito de la búsqueda al utilizar la opción Reemplazar todos.
Las expresiones regulares le permiten buscar caracteres especiales como caracteres de tabulador o de
nueva línea, clases o rangos de caracteres como de la a a la d, cualquier dígito o no dígito y límites como
el principio o el final de una línea. Se admiten los siguientes tipos de expresiones.
Tabla 1. Coincidencias de caracteres.
Caracteres Coincidencias
x El carácter x
\\ El carácter de barra inclinada invertida
\0n El carácter con valor octal 0n (0 <= n <= 7)
\0nn El carácter con valor octal 0nn (0 <= n <= 7)
\0mnn El carácter con valor octal 0mnn (0 <= m <= 3, 0 <= n <= 7)
\xhh El carácter con valor hexadecimal 0xhh
\uhhhh El carácter con valor hexadecimal 0xhhhh
\t El carácter de tabulador ('\u0009')
\n El carácter de nueva línea (avance de línea) ('\u000A')
\r El carácter de retorno de carro ('\u000D')
\f El carácter de avance de página ('\u000C')
\a El carácter de alerta (campana) ('\u0007')
\e El carácter de escape ('\u001B')
\cx El carácter de control correspondiente a x
Los scripts de IBM SPSS Modeler están escritos en el lenguaje de script Python. La implementación Java
de Python que IBM SPSS Modeler se denomina Jython. El lenguaje de script consta de las siguientes
características:
v Un formato para hacer referencia a nodos, rutas, proyectos, resultados y otros objetos de IBM SPSS
Modeler.
v Un conjunto de instrucciones o comandos de scripts que se puede utilizar para manipular tales objetos.
v Un lenguaje de expresión de script para establecer los valores de las variables, los parámetros y otros
objetos.
v Compatibilidad con comentarios, continuaciones y bloques de texto literal.
Las secciones siguientes describen el lenguaje de scripts Python, la implementación de Jython por parte
de Python y la sintaxis básica para empezar a crear scripts en IBM SPSS Modeler. Las secciones siguientes
recogen información sobre comandos y propiedades específicas.
Python y Jython
Jython es una implementación del lenguaje de scripts Python, escrito en el lenguaje Java e integrado con
la plataforma Java. Python es un potente lenguaje de script orientado a objetos. Jython es útil porque
proporciona las características de productividad de un lenguaje de script maduro y, a diferencia de
Python, se ejecuta en cualquier entorno que soporte una máquina virtual Java (JVM). Esto significa que
las bibliotecas Java de la máquina virtual Java están disponibles para utilizarlas cuando se escriben
programas. Con Jython, puede beneficiarse de esta diferencia y utilizar la sintaxis y la mayoría de las
características del lenguaje Python.
Como lenguaje de script, Python (y su implementación Jython) es fácil de aprender y ofrece una
codificación eficaz con la estructura mínima necesaria para crear un programa de ejecución. El código se
puede entrar de forma interactiva, es decir, una línea cada vez. Python es un lenguaje de script
interpretado; no hay ningún paso de precompilación, tal como existe en Java. Los programas de Python
simplemente son archivos de texto que se interpretan a medida que se entran (después de analizar los
errores de sintaxis). Las expresiones simples, tales como los valores definidos, y también las acciones más
complejas, tales como las definiciones de función, se ejecutan y están disponibles para su uso de forma
inmediata. Los cambios realizados en el código se pueden probar fácilmente. Sin embargo, la
interpretación del script tiene algunas desventajas. Por ejemplo, utilizar una variable no definida no es un
error del compilador, por lo tanto solo se detecta si (y cuando) se ejecuta la sentencia en la que se utiliza
la variable. En este caso, se puede editar y ejecutar el programa para depurar el error.
Python lo ve todo como un objeto, incluidos todos los datos y el código. Por lo tanto, puede manipular
estos objetos con líneas de código. Algunos tipos de selección, tales como los números y cadenas, se
consideran valores y no objetos, lo cual resulta más práctico, y Python da soporte a todo ello. Se da
soporte a un valor nulo. Este valor nulo tiene el nombre reservado de None.
Para obtener una introducción más detallada del lenguaje de script Python y Jython y algunos scripts de
ejemplo, consulte el tema [Link]
y el tema [Link] .
15
Scripts de Python
Esta guía del lenguaje de script de Python es una introducción a los componentes que tienen más
probabilidad de ser utilizados cuando se ejecutan scripts en IBM SPSS Modeler, incluidos conceptos y
principios básicos de programación. Le proporcionará los conocimientos suficientes para comenzar a
desarrollar sus propios scripts Python y utilizarlos en IBM SPSS Modeler.
Operaciones
a asignación se realiza mediante un signo de igual (=). Por ejemplo, para asignar el valor "3" a una
variable llamada "x" debe utilizar la siguiente sentencia:
x = 3
El signo igual también se utiliza para asignar datos de tipo de cadena a una variable. Por ejemplo, para
asignar el valor "a string value" a la variable "y" utilice la sentencia siguiente:
y = "a string value"
La tabla siguiente enumera algunas de las operaciones numéricas y de comparación utilizadas con más
frecuencia y sus descripciones.
Tabla 5. Operaciones numéricas y de comparación comunes
Operación Descripción
x < y ¿Es x menor que y?
x > y ¿Es x mayor que y?
x <= y ¿Es x menor que o igual a y?
x >= y ¿Es x mayor que o igual a y?
x == y ¿Es x igual a y?
x != y ¿Es x no igual a y?
x <> y ¿Es x no igual a y?
x + y Sumar y a x
x - y Restar y de x
x * y Multiplicar x por y
x / y Dividir x por y
x ** y Elevar x a la potencia de y
Listas
Las listas son secuencias de elementos. Una lista puede contener cualquier número de elementos, y los
elementos de la lista pueden ser cualquier tipo de objeto. Las listas también se pueden considerar como
matrices. El número de elementos de una lista puede aumentar o disminuir a medida que se añaden,
eliminan o sustituyen elementos.
Ejemplos
El número entre corchetes ([]) se considera un index y hace referencia a un elemento concreto de la lista.
Los elementos de una lista se indexan a partir de 0.
También puede seleccionar un rango de elementos de una lista; esto se denomina porciones. Por ejemplo,
x[1:3] selecciona el segundo y el tercer elemento de x. El índice final es uno más allá de la selección.
Cadenas
Una cadena es una secuencia inmutable de caracteres que se trata como un valor. Las cadenas dan soporte
a todas las funciones de secuencias inmutables y operadores que generan como resultado una nueva
serie. Por ejemplo, "abcdef"[1:4] da como resultado la salida "bcd".
Los literales de cadenas se definen mediante comillas simples o triples. Las cadenas definidas mediante
comillas simples no pueden abarcar líneas, mientras que las series definidas mediante comillas triples sí
que pueden. Una cadena puede estar entre comillas simples (’) o entre comillas dobles ("). Un carácter
entrecomillado puede contener el otro carácter entrecomillado o el carácter entrecomillado de escape, que
es el carácter de barra invertida (\).
Ejemplos
"Esta es una cadena"
’Esta también es una cadena’
"Es una cadena"
’Este manual se titula "Guía de scripts y automatización Python".’
"Estas son comillas de escape (\") en una cadena entrecomillada"
El analizador de Python automáticamente concatena varias cadenas separadas por un espacio en blanco.
Esto facilita la entrada se cadenas largas y la combinación de tipos de comillas en una sola cadena, por
ejemplo:
"Esta cadena utiliza ’ y " ’esta cadena utiliza ".’
Las cadenas dan soporte a varios métodos útiles. Algunos de estos métodos se proporcionan en la tabla
siguiente.
Tabla 6. Métodos de serie
Método Uso
[Link]() Mayúscula inicial s
[Link](ss {,start {,end}}) Recuento de apariciones de ss en s[start:end]
Observaciones
Los comentarios se introducen con el signo de almohadilla (#) o hash. Todo el texto que sigue al signo de
almohadilla en la misma línea se considera parte del comentario y se omite. Un comentario puede
comenzar en cualquier columna. El ejemplo siguiente muestra el uso de los comentarios:
#The HelloWorld application is one of the most simple
print ’Hello World’ # print the Hello World line
Las sentencias muy largas puede continuar en más de una línea. En este caso, la sentencia que ha de
continuar en la línea siguiente debe acabar con una barra invertida (\), por ejemplo:
x = "A loooooooooooooooooooong string" + \
"another looooooooooooooooooong string"
Cuando una estructura está encerrada entre paréntesis (()), corchetes ([]) o llaves ({}), la sentencia puede
continuar en una línea nueva después de cualquier coma, sin tener que insertar una barra invertida, por
ejemplo:
x = (1, 2, 3, "hello",
"goodbye", 4, 5, 6)
Identificadores
Los identificadores se utilizan para el nombre de las variables, funciones, clases y palabras clave. Los
identificadores pueden tener cualquier longitud, pero debe empezar con un carácter alfabético en
mayúsculas o minúsculas o el carácter de subrayado (_). Los nombres que empiezan con un carácter de
subrayado están generalmente reservados para los nombres internos o privados. Después del primer
carácter, el identificador puede contener cualquier número y combinación de caracteres alfabéticos, los
números del 0-9, y el carácter de subrayado.
Existen algunas palabras reservadas en Jython que no se pueden utilizar para el nombre de variables,
funciones o clases. Estas palabras entran en las siguientes categorías:
v Introducciones de sentencias: assert, break, class, continue, def, del, elif, else, except, exec,
finally, for, from, global, if, import, pass, print, raise, return, try y while
v Introducciones de parámetros: as, import y in
v Operadores: and, in, is, lambda, not y or
Bloques de código
Bloques de código son grupos de sentencias que se utilizan donde se esperan sentencias individuales. Los
bloques de código pueden seguir a cualquiera de las sentencias siguientes: if, elif, else, for, while, try,
except, def y class. Estas sentencias introducen el bloque de código con el carácter de dos puntos (:),
por ejemplo:
if x == 1:
y = 2
z = 3
elif:
y = 4
z = 5
Se utiliza la indentación para delimitar los bloques de código (en lugar de las llaves que se utilizan en
Java). Todas las líneas de un bloque han de indentarse en la misma posición. Esto es debido a que un
cambio en la indentación indica el final de un bloque de código. Normalmente la indentación es de
cuatro espacios por nivel. Se recomienda utilizar espacios para la indentación, en lugar de tabulaciones.
No se deben combinar espacios y tabulaciones. Las líneas del bloque de un módulo situado más al
extremo deben comenzar en la columna uno, de lo contrario, se genera el error SyntaxError.
En este ejemplo, el comando import importa toda la clase sys, por lo que se pueden utilizar los métodos
existentes para esta clase, tales como argv.
Ejemplos
La palabra clave print imprime los argumentos situados inmediatamente después de la misma. Si la
sentencia va seguida de una coma, no se incluye una línea nueva en los resultados. Por ejemplo:
print "Esto muestra el uso de una",
print " coma al final de una sentencia de impresión."
La sentencia for se utiliza para la iteración por un bloque de código. Por ejemplo:
mylist1 = ["one", "two", "three"]
for lv in mylist1:
print lv
continue
En este ejemplo, se asignan tres cadenas a la lista mylist1. Los elementos de la lista se imprimen a
continuación, con un elemento de cada línea. Esto genera el resultado siguiente:
uno
two
tres
En este ejemplo, el iterador lv toma el valor de cada elemento de la lista mylist1 por orden, mientras el
bucle for implementa el bloque de código de cada elemento. Un iterador puede ser cualquier
identificador válido de cualquier longitud.
La sentencia if es una sentencia condicional. Evalúa la condición y devuelve true o false, en función del
resultado de la evaluación. Por ejemplo:
En este ejemplo, se evalúa el valor del iterador lv. Si el valor de lv es two se devuelve una cadena
diferente a la cadena que se devuelve si el valor de lv no es two. Esto resulta en la siguiente salida:
The value of lv is not two, but one
The value of lv is two
The value of lv is not two, but three
Métodos matemáticos
Desde el módulo matemáticas puede acceder a métodos matemáticos útiles. Algunos de estos métodos se
proporcionan en la tabla siguiente. A menos que se especifique lo contrario, todos los valores se
devuelven como valores flotantes.
Tabla 7. Métodos matemáticos
Método Uso
[Link](x) Devuelve el punto más alto de x como un valor flotante,
que es el entero más pequeño mayor o igual a x
[Link](x, y) Devuelve x con el signo de y. copysign(1, -0.0)
devuelve -1
[Link](x) Devuelve el valor absoluto de x
[Link](x) Devuelve el factor de x. Si x es negativo o no es un
entero, se genera ValueError.
[Link](x) Devuelve el punto más bajo de x como un valor flotante,
que es el entero más alto menor o igual a x
[Link](x) Devuelve la mantisa (m) y el exponente (e) de x como el
par (m, e). m es un valor flotante y e es un entero, tal
como x == m * 2**e exactamente. Si x es cero, devuelve
(0,0, 0), de lo contrario 0,5 <= abs(m) < 1.
[Link](iterable) Devuelve una suma de coma flotante precisa de los
valores de iterable
[Link](x) Comprueba si el valor flotante x es positivo o negativo
infinito
[Link](x) Comprueba si el valor flotante x es NaN (no es un
número)
[Link](x, i) Devuelve x * (2**i). Esencialmente es la función
inversa de frexp.
[Link](x) Devuelve las partes de fracción y entero de x. Los dos
resultados llevan el signo de x y son flotantes.
[Link](x) Devuelve el valor Real de x, que se ha truncado en un
Integral.
[Link](x) Devuelve e**x
[Link](x[, base]) Devuelve el logaritmo de x para el valor dado de base.
Si no se especifica base, se devuelve el logaritmo natural
de x.
math.log1p(x) Devuelve el logaritmo natural de 1+x (base e)
math.log10(x) Devuelve el logaritmo de base-10 de x
Además de las funciones matemáticas, hay algunos métodos trigonométricos útiles. Estos métodos se
muestran en la siguiente tabla.
Tabla 8. Métodos trigonométricos
Método Uso
[Link](x) Devuelve el arco coseno de x en radianes
[Link](x) Devuelve el arcoseno de x en radianes
[Link](x) Devuelve el arco tangente de x en radianes
math.atan2(y, x) Devuelve atan(y / x) en radianes.
[Link](x) Devuelve el coseno de x en radianes.
[Link](x, y) Devuelve la norma euclidiana de sqrt(x*x + y*y). Esta
es la longitud del vector desde el origen al punto (x, y).
[Link](x) Devuelve el seno de x en radianes
[Link](x) Devuelve la tangente de x en radianes
[Link](x) Convierte el ángulo x de radianes a grados
[Link](x) Convierte el ángulo x de grados a radianes
[Link](x) Devuelve el coseno hiperbólico inverso de x
[Link](x) Devuelve el seno hiperbólico inverso de x
[Link](x) Devuelve la tangente hiperbólica inversa de x
[Link](x) Devuelve el coseno hiperbólico de x
[Link](x) Devuelve el coseno hiperbólico de x
[Link](x) Devuelve la tangente hiperbólica de x
También hay constantes matemáticas. El valor de [Link] es la constante matemática pi. El valor de
math.e es la constante matemática e.
La etiqueta es incorrecta porque Python ha convertido el propio literal de serie en una cadena ASCII.
Python permite que los literales de cadenas Unicode se especifiquen añadiendo un prefijo con el carácter
u antes del literal de cadena:
La utilización de Python y Unicode es un tema de gran volumen que no entra dentro del ámbito de este
documento. Existen muchas publicaciones y recursos en línea disponibles que describen detalladamente
este tema.
Python incluye las características siguientes para dar soporte a la programación orientada a objetos:
v Creación de objetos basada en clases. Las clases son plantillas para la creación de objetos. Los objetos
son estructuras de datos con el comportamiento asociado.
v Herencia con polimorfismo. Python da soporte a la herencia individual y múltiple. Todos los métodos
de instancias de Python son polimórficos y se pueden alterar temporalmente mediante subclases.
v Encapsulación con ocultación de datos. Python permite ocultar los atributos. Cuando se ocultan los
atributos, se puede acceder a los mismos desde fuera de la clase únicamente mediante los métodos de
la clase. Las clases implementan métodos para modificar los datos.
En Python, las clases se definen utilizando la sentencia class. La sentencia class tiene el formato
siguiente:
class name (superclasses): statement
o
class name (superclasses):
assignment
.
.
function
.
.
Cuando define una clase tiene la opción de proporcionar cero o más sentencias assignment. Estos crean
atributos de clase que comparten todas las instancias de la clase. Puede proporcionar cero o más
definiciones de function. Estas definiciones de función crean métodos. La lista de superclases es opcional.
El nombre de clase debe ser exclusivo en el mismo ámbito, esto es, dentro de un módulo, función o clase.
Puede definir varias variables para que hagan referencia a la misma clase.
Aquí, se utiliza la sentencia pass por que se requiere una sentencia para completar la clase, pero no se
requiere ninguna acción de programación.
def method1(self):
print MyClass.attr1 #reference the class attribute
def method2(self):
print MyClass.attr2 #reference the class attribute
Dentro de una clase, debe cualificar todas las referencias a los atributos de clase con el nombre de clase;
por ejemplo, MyClass.attr1. Todas las referencias a los atributos de la instancia deben cualificarse con la
variable self, por ejemplo, [Link]. Fuera de la clase, debe cualificar todas las referencias a los
atributos de clase con el nombre de clase (por ejemplo, MyClass.attr1) o con una instancia de la clase
(por ejemplo, x.attr1, donde x es una instancia de la clase). Fuera de la clase, todas las referencias a las
variables de la instancia deben cualificarse con una instancia de la clase, por ejemplo, [Link].
Variables ocultas
Los datos se pueden ocultar creando variables privadas. Solo la propia clase puede acceder a las variables
privadas. Si declara nombres con el formato __xxx o __xxx_yyy, estos es, con dos signos de subrayado
antes de los nombres, el analizador Python automáticamente añadirá el nombre de clase al nombre
declarado y creará las variables ocultas, por ejemplo:
class MyClass:
__attr = 10 #private class attribute
def method1(self):
pass
A diferencia de Java, en Python todas las referencias a variables de instancia deben estar calificadas con
self; no existe un uso implícito de this.
Heredado
La posibilidad de herencia de las clases es fundamental en la programación orientada a objetos. Python
da soporte a la herencia individual y múltiple. Herencia individual significa que solo puede haber una
superclase. Herencia múltiple significa que puede haber más de una superclase.
La herencia se implementa generando subclases de otras clases. Cualquier número de clases Python
pueden ser superclases. En la implementación de Jython en Python, solo se puede heredar directa o
indirectamente de una clase Java. No es necesario suministrar una superclase.
Cualquier atributo o método de una superclase también está en cualquier subclase y lo puede utilizar la
propia clase o cualquier cliente, siempre que el atributo o método no esté oculto. Se puede utilizar
cualquier instancia de una subclase; esto se denomina polimorfismo. Estas características permiten la
reutilización y facilitan la extensión.
Ejemplo
Existen diferentes métodos disponibles que puede utilizar en scripts en IBM SPSS Modeler lo que le
permite acceder a una amplia gama de funciones de SPSS Modeler. Estos métodos se utilizan también en
Capítulo 4, “API de scripts”, en la página 37 para crear funciones más avanzadas.
Rutas
Una ruta es el principal tipo de documento de IBM SPSS Modeler. Se puede guardar, cargar, editar y
ejecutar. Las rutas también pueden tener parámetros, valores globales, un script y otra información
asociada a ellos.
Rutas de Supernodo
Una ruta de Supernodo es el tipo de ruta que se utiliza en un Supernodo. Al igual que una ruta normal,
contiene nodos enlazados entre sí. Las rutas de Supernodo tienen una serie de diferencias respecto de una
ruta normal.
v Los parámetros y scripts están asociados al Supernodo propietario de la ruta de Supernodo en lugar de
a la propia ruta de Supernodo.
v Las rutas de Supernodo tienen nodos de conector de entrada y salida adicionales dependiendo del tipo
de Supernodo. Estos nodos de conector se utilizan en los flujos de información entrantes y salientes de
la ruta de Supernodo y se crean automáticamente cuando se crea el Supernodo.
Diagramas
El término diagrama abarca las funciones soportadas en rutas normales y en rutas de supernodo como,
por ejemplo, la adición y eliminación de nodos y la modificación de conexiones entre nodos.
27
stream = [Link]()
[Link](None)
En este ejemplo, la ruta se almacena en una variable denominada stream. Almacenar la ruta en una
variable resulta útil ya que un script se utiliza generalmente para modificar la ruta o los nodos
contenidos en una ruta. Si se crea una variable que almacena los resultados de la ruta, el script resultará
más conciso.
El módulo [Link] también define un modo de finalizar el script con un código de salida. La
función exit(exit-code) detiene la ejecución del script y devuelve el código de salida de entero
suministrado.
Uno de los métodos que se define para una ruta es runAll(List). Este método ejecuta todos los nodos
ejecutables. Los modelos o resultados que se generan mediante la ejecución de los nodos se añaden a la
lista suministrada.
Es común que la ejecución de ruta genere resultados, tales como modelos, gráficos y otros. Para capturar
este resultado, un script puede proporcionar una variable que se inicializa en una lista, por ejemplo:
Cuando se completa la ejecución, se puede acceder a todos los objetos generados por la ejecución en la
lista results.
Buscar nodos
Las rutas proporcionan varios modos de localizar un nodo existente. Estos métodos se resumen en la
siguiente tabla.
Tabla 10. Métodos para localizar un nodo existente
Método Tipo devuelto Descripción
[Link](type, label) Colección Devuelve una lista de todos los
nodos con el tipo y la etiqueta. El
tipo o la etiqueta pueden ser None, en
cuyo caso se utiliza el otro
parámetro.
[Link](filter, recursive) Colección Devuelve una colección de todos los
nodos que están aceptados por el
filtro especificado. Si el distintivo
recursivo es True, también se buscan
los supernodos contenidos en la ruta
especificada.
[Link](id) Nodo Devuelve el nodo con el ID
proporcionado o None si no existe
dicho nodo. La búsqueda se limita a
la ruta actual.
[Link](type, label) Nodo Devuelve el nodo con el tipo,
etiqueta o ambas cosas. El tipo o el
nombre pueden ser None, en cuyo
caso se utiliza el otro parámetro. Si
varios nodos dan como resultado una
coincidencia, se elige uno arbitrario y
se devuelve. Si ningún nodo da como
resultado una coincidencia, se
devuelve el valor None.
[Link](fromNodes) Colección Busca en la lista de nodos
suministrada y devuelve el conjunto
de nodos en sentido descendente de
los nodos suministrados. La lista
devuelta incluye los nodos
proporcionados originalmente.
Por ejemplo, si una ruta contiene un nodo Filtro único que el script necesita para acceso, el nodo Filtro se
puede encontrar utilizando el siguiente script:
stream = [Link]()
node = [Link]("filter", None)
...
Como alternativa, si se conoce el ID del nodo (tal como se muestra en la pestaña Anotaciones del cuadro
de diálogo del nodo) se puede utilizar el ID para buscar el nodo, por ejemplo:
stream = [Link]()
node = [Link]("id32FJT71G2") # the filter node ID
...
Establecimiento de propiedades
Los nodos, rutas, modelos y resultados tienen propiedades a las que se puede acceder y que, en la mayor
parte de los casos, se pueden establecer. Las propiedades suelen utilizarse para modificar el aspecto o el
comportamiento del objeto. En la tabla siguiente se resumen los métodos disponibles para establecer y
acceder a las propiedades de los objetos.
Tabla 11. Métodos para establecer y acceder a las propiedades de los objetos
Método Tipo devuelto Descripción
[Link](propertyName) Object Devuelve el valor de la propiedad
con nombre, o None si no existe tal
propiedad.
[Link](propertyName, No es aplicable Establece el valor de la propiedad
value) con nombre.
[Link](properties) No es aplicable Establece los valores de la propiedad
con nombre. Cada entrada de la
correlación de propiedades consta de
una clave que representa el nombre
de la propiedad y del valor que debe
asignarse a la propiedad.
[Link]( Object Devuelve el valor de la propiedad
propertyName, keyName) con nombre, o None si no existe dicha
propiedad o clave.
[Link]( No es aplicable Establece el valor de la propiedad
propertyName, keyName, value) con nombre y de la clave.
Por ejemplo, si desea establecer el valor de un nodo Archivo variable al comienzo de una ruta, puede
utilizar el siguiente script:
stream = [Link]()
node = [Link]("variablefile", None)
[Link]("full_filename", "$CLEO/DEMOS/DRUG1n")
...
Creación de nodos
Las rutas proporcionan varios modos de crear nodos. Estos métodos se resumen en la siguiente tabla.
Tabla 12. Métodos para crear nodos
Método Tipo devuelto Descripción
[Link](nodeType, name) Nodo Crea un nodo del tipo especificado y
lo añade a la ruta especificada.
[Link](nodeType, name, x, y) Nodo Crea un nodo del tipo especificado y
lo añade a la ruta especificada en la
ubicación especificada. Si x< 0 o y <
0, no se establece la ubicación.
[Link](modelOutput, Nodo Crea un nodo aplicador de modelos
name) que se deriva del objeto de resultados
del modelo proporcionado.
Por ejemplo, para crear un tipo de nodo nuevo en una ruta puede utilizar el siguiente script:
stream = [Link]()
# Create a new type node
node = [Link]("type", "My Type")
Los scripts Python admiten un conjunto de funciones parecido; el comando removeAll() se utiliza para
borrar las rutas, las salidas y los gestores de modelos. Por ejemplo:
v Para borrar el gestor de rutas:
session = [Link]()
[Link]()
v Para borrar el gestor de salidas:
session = [Link]()
[Link]().removeAll()
v Para borrar el gestor de modelos:
session = [Link]()
[Link]().removeAll()
Los métodos que se pueden utilizar para obtener el ID, el nombre y la etiqueta de un nodo se resumen
en la tabla siguiente.
Los métodos que se pueden utilizar para obtener información acerca de un nodo se resumen en la tabla
siguiente.
Tabla 17. Métodos para obtener información acerca de un nodo
Método Tipo devuelto Descripción
[Link]() cadena Devuelve el nombre de script de este
nodo. Este es el mismo nombre que
puede utilizarse para crear una nueva
instancia de este nodo.
[Link]() Booleana Devuelve True si es un nodo initial,
esto es, un nodo que aparece al inicio
de una ruta.
[Link]() Booleana Devuelve True si es un nodo in-line,
esto es, un nodo que aparece a mitad
de una ruta.
[Link]() Booleana Devuelve True si es un nodo terminal,
esto es, un nodo que aparece al final
de una ruta.
[Link]() int Devuelve el desplazamiento de la
posición x del nodo en la ruta.
Esta sentencia import es necesaria para muchos de los ejemplos de la API de scripts.
Se puede encontrar una guía completa de las clases, los métodos y parámetros que están disponibles a
través de la API de scripts en el documento Guía de referencia de la API de scripts Python de IBM SPSS
Modeler.
El ejemplo siguiente muestra cómo buscar nodos de una ruta que tienen habilitada la memoria caché de
nodo. La lista de nodos devuelta se puede utilizar para vaciar o inhabilitar las memorias caché de estos
nodos.
import [Link]
class CacheFilter([Link]):
"""A node filter for nodes with caching enabled"""
def accept(this, node):
return [Link]()
El ejemplo siguiente muestra cómo permitir que un usuario obtenga información de directorio o archivo
basándose en los privilegios del usuario que se conecta a IBM SPSS Modeler Server.
import [Link]
stream = [Link]()
sourceNode = [Link](’’)
session = [Link]()
fileSystem = [Link]()
37
parameter = [Link](’VPATH’)
serverDirectory = [Link](parameter)
files = [Link](serverDirectory)
for f in files:
if [Link]():
print ’Directory:’
else:
print ’File:’
[Link](’full_filename’,[Link]())
break
print [Link](),[Link]()
[Link]()
Los scripts también pueden acceder al modelo de datos inspeccionando los campos que entran en un
nodo o que salen de él. En algunos nodos coinciden los modelos de datos de entrada y salida; por
ejemplo, un nodo Ordenar se limita a cambiar el orden de los registros, sin alterar el modelo de datos.
Otros, como el nodo Derivar, pueden añadir nuevos campos. Otros, como el nodo Filtrar, pueden
renombrar o eliminar campos.
En el ejemplo siguiente, el script toma la ruta estándar IBM SPSS Modeler [Link] y, para cada
campo, construye un modelo descartando uno de los campos de entrada. Lo hace de la siguiente manera:
1. Accede al modelo de datos de salida del nodo Tipo.
2. Itera cada campo del modelo de datos de salida.
3. Modifica el nodo Filtro de cada campo de entrada.
4. Cambia el nombre del modelo que se construye.
5. Ejecuta el nodo de construcción de modelos.
Nota: Antes de ejecutar el script en la ruta [Link], no olvide establecer el lenguaje de script a
Python (la ruta se creó en una versión anterior de IBM SPSS Modeler, de modo que el lenguaje de script
de la ruta está establecido a Herencia).
import [Link]
stream = [Link]()
filternode = [Link]("filter", None)
typenode = [Link]("type", None)
c50node = [Link]("c50", None)
# Usar siempre un nombre de modelo personalizado
[Link]("use_model_name", True)
lastRemoved = None
fields = [Link]()
for field in fields:
# Si este es el campo de destino, se hace caso omiso del mismo
if [Link]() == [Link]:
continue
# Se elimina el campo
lastRemoved = [Link]()
[Link]("include", lastRemoved, False)
El objeto DataModel (modelo de datos) proporciona una serie de métodos de acceso a la información
relativa a los campos y columnas del modelo de datos. Estos métodos se resumen en la siguiente tabla.
Tabla 18. Métodos del objeto DataModel de acceso a la información relativa a campos o columnas
Método Tipo devuelto Descripción
[Link]() int Devuelve el número de columnas del
modelo de datos.
[Link]() Iterator Devuelve un iterador que devuelve
cada columna en el orden "natural"
de inserción. El iterador devuelve
instancias de Column.
[Link]() Iterator Devuelve un iterador que devuelve el
nombre de cada columna en el orden
"natural" de inserción.
[Link](nombre) Booleana Devuelve True si en este DataModel
existe una columna con el nombre
proporcionado y False en caso
contrario.
[Link](nombre) Column Devuelve la columna cuyo nombre es
el especificado.
[Link](nombre) ColumnGroup Devuelve el grupo de columnas
nombrado o None si no existe dicho
grupo de columnas.
[Link]() int Devuelve el número de grupos de
columnas de este modelo de datos.
[Link]() Iterator Devuelve un iterador que devuelve a
su vez cada grupo de columnas.
[Link]() Column[] Devuelve el modelo de datos como
un vector de columnas. Las columnas
van ordenadas según su orden
"natural" de inserción.
Cada campo (objeto Column) incluye una serie de métodos de acceso a la información de la columna. La
tabla que se muestra a continuación muestra una selección de los mismos.
Tabla 19. Métodos del objeto Column de acceso a la información de una columna
Método Tipo devuelto Descripción
[Link]() cadena Devuelve el nombre de la columna.
[Link]() cadena Devuelve la etiqueta de la columna o
una cadena vacía si no hay ninguna
etiqueta asociada a la columna.
[Link]() MeasureType Devuelve el tipo de medición de la
columna.
[Link]() StorageType Devuelve el tipo de almacenamiento
de la columna.
Observe que la mayoría de los métodos de acceso a la información de una columna tienen métodos
equivalentes definidos en el propio objeto DataModel. Por ejemplo, las dos sentencias siguientes son
equivalentes:
[Link]("unNombre").getModelingRole()
[Link]("unNombre")
En el ejemplo siguiente, la ruta [Link] se utiliza de nuevo como punto de partida para la ruta. En
este ejemplo, se ejecutan todos los nodos de la ruta y los resultados se almacenan en una lista. A
continuación, el script crea un bucle por los resultados y se guarda cualquier salida del modo resultante
de la ejecución como un archivo de modelo de IBM SPSS Modeler (.gm) y se exporta como PMML.
import [Link]
stream = [Link]()
label = [Link]()
algorithm = [Link]().getAlgorithmName()
La clase taskrunner proporciona un modo práctico de ejecutar diferentes tareas comunes. Los métodos
que están disponibles en esta clase se resumen en la tabla siguiente.
Tabla 20. Métodos de la clase taskrunner para realizar tareas comunes
Método Tipo devuelto Descripción
[Link](name, autoConnect, Ruta Crea y devuelve una nueva ruta.
autoManage) Tenga en cuenta que el código que
debe crear las rutas de forma privada
sin que las vea el usuario debe
establecer el distintivo autoManage en
False.
[Link]( No es aplicable Exporta la descripción de la ruta a un
documentOutput, filename, archivo utilizando el formato de
fileFormat) archivo especificado.
[Link](modelOutput, No es aplicable Exporta el modelo a un archivo
filename, fileFormat) utilizando el formato de archivo
especificado.
[Link](stream, No es aplicable Exporta la ruta a un archivo
filename, fileFormat) utilizando el formato de archivo
especificado.
Manejo de errores
El lenguaje Python proporciona manejo de errores mediante el bloque de código try...except. Se puede
utilizar en los scripts para capturar excepciones y manejar los problemas que podrían ocasionar la
finalización del script.
En el script de ejemplo siguiente, se realiza un intento para recuperar un modelo desde el Repositorio de
IBM SPSS Collaboration and Deployment Services. Esta operación puede hacer que se genere una
excepción, por ejemplo, es posible que las credenciales de inicio de sesión en el repositorio no se hayan
configurado correctamente o que la ruta del repositorio sea errónea. En el script, esto puede generar una
excepción ModelerException (todas las excepciones que genera IBM SPSS Modeler se derivan de
[Link]).
import [Link]
session = [Link]()
try:
repo = [Link]()
m = [Link]("/some-non-existent-path", None, None, True)
# print goes to the Modeler UI script panel Debug tab
print "Everything OK"
except [Link], e:
print "An error occurred:", [Link]()
Nota: Algunas operaciones de scripts pueden generar excepciones Java estándar, estas excepciones no se
derivan de ModelerException. Para capturar estas excepciones, se puede utilizar un bloque except
adicional que capture todas las excepciones Java, por ejemplo:
import [Link]
session = [Link]()
try:
repo = [Link]()
m = [Link]("/some-non-existent-path", None, None, True)
# print goes to the Modeler UI script panel Debug tab
print "Everything OK"
except [Link], e:
En el ejemplo siguiente, el script agrega algunos datos Telco para averiguar qué región tiene los datos de
promedio de ingresos más bajos. A continuación, se establece un parámetro de ruta con esta región. Este
parámetro de ruta se utiliza en un nodo Seleccionar para excluir dicha región de los datos, antes de que
se cree un modelo de abandono en el resto.
La primera parte del script de ejemplo crea el parámetro de ruta que contendrá la región con el promedio
de ingresos más bajo. El script también crea los nodos de la rama de agregación y la rama de creación de
modelos y los conecta.
import [Link]
stream = [Link]()
# Crear primero la rama de agregación para calcular el promedio de ingresos por región
statisticsimportnode = [Link]("statisticsimport", "SPSS File", 114, 142)
[Link]("full_filename", "$CLEO_DEMOS/[Link]")
[Link]("use_field_format_for_storage", True)
[Link](statisticsimportnode, aggregatenode)
[Link](aggregatenode, tablenode)
[Link](statisticsimportnode, selectnode)
[Link](selectnode, typenode)
[Link](typenode, c50node)
La parte siguiente del script de ejemplo ejecuta el nodo Tabla al final de la rama de agregación.
La parte siguiente del script de ejemplo accede a la salida de la tabla que ha generado la ejecución del
nodo Tabla. A continuación, el script itera por las filas de la tabla, buscando la región con el promedio de
ingresos más bajo.
# Ejecutar el nodo tabla para generar una sola tabla como salida
table = results[0]
# la salida de la tabla contiene un RowSet que permite acceder a valores como filas y columnas
rowset = [Link]()
min_income = 1000000.0
min_region = None
La parte siguiente del script utiliza la región con el promedio de ingresos más bajo para establecer el
parámetro de ruta "LowestRegion" creado anteriormente. El script ejecuta el constructor de modelos
excluyendo la región especificada de los datos de formación.
# Comprobar que se ha asignado un valor
if min_region != None:
[Link]("LowestRegion", min_region)
else:
[Link]("LowestRegion", -1)
stream = [Link]()
# Crear primero la rama de agregación para calcular el promedio de ingresos por región
statisticsimportnode = [Link]("statisticsimport", "SPSS File", 114, 142)
[Link]("full_filename", "$CLEO_DEMOS/[Link]")
[Link]("use_field_format_for_storage", True)
[Link](statisticsimportnode, aggregatenode)
[Link](aggregatenode, tablenode)
[Link](statisticsimportnode, selectnode)
[Link](selectnode, typenode)
[Link](typenode, c50node)
# Ejecutar el nodo tabla para generar una sola tabla como salida
table = results[0]
# la salida de la tabla contiene un RowSet que permite acceder a valores como filas y columnas
rowset = [Link]()
min_income = 1000000.0
min_region = None
Valores globales
Los valores globales se utilizan para calcular diferentes estadísticas de resumen para los campos
especificados. Se puede acceder a estos valores de resumen desde cualquier lugar de la ruta. Los valores
globales son similares a los parámetros de ruta, ya que se puede acceder a los mismos por nombre a
través de la ruta. Se diferencian de los parámetros de ruta en que los valores asociados se actualizan
automáticamente cuando se ejecuta uno nodo Establecer globales, en lugar de asignarlos mediante script
o desde la línea de comandos. Se accede a los valores globales de una ruta invocando el método
getGlobalValues() de la ruta.
[Link] define el tipo de estadísticas de resumen disponibles. Están disponibles las siguientes
estadísticas de resumen:
v MAX: el valor máximo del campo.
v MEAN: el valor medio del campo.
v MIN: el valor mínimo del campo.
v STDDEV: la desviación estándar del campo.
v SUM: la suma de los valores del campo.
Por ejemplo, el script siguiente accede el valor medio del campo "income" que calcula un nodo Val.
globales:
import [Link]
globals = [Link]().getGlobalValues()
mean_income = [Link]([Link], "income")
El siguiente script autónomo abre dos rutas. Una de estas rutas crea un modelo y la segunda ruta traza la
distribución de los valores predichos.
# Change to the appropriate location for your system
demosDir = "C:/Program Files/IBM/SPSS/Modeler/18.1.1/DEMOS/streams/"
session = [Link]()
tasks = [Link]()
# Open the model build stream, locate the C5.0 node and run it
buildstream = [Link](demosDir + "[Link]", True)
c50node = [Link]("c50", None)
results = []
[Link](results)
# Now open the plot stream, find the Na_to_K derive and the histogram
plotstream = [Link](demosDir + "[Link]", True)
derivenode = [Link]("derive", None)
histogramnode = [Link]("histogram", None)
# Create a model applier node, insert it between the derive and histogram nodes
# then run the histgram
El ejemplos siguiente muestra cómo también puede iterar en las rutas abiertas (todas las rutas abiertas en
la pestaña Rutas). Tenga en cuenta que esto solo está soportado en scripts autónomos.
for stream in [Link]():
print [Link]()
Estos scripts pueden emplearse en cualquier ruta que tenga un nodo Filtrar, incluso si no hay campos
filtrados. Simplemente, añada un nodo Filtrar que recorra todos los campos para cambiar todos los
nombres de campo a mayúsculas.
# Alternative 1: using the data model nameIterator() function
stream = [Link]()
for node in [Link]():
if ([Link]() == "filter"):
# nameIterator() returns the field names
for field in [Link]().nameIterator():
newname = [Link]()
[Link]("new_name", field, newname)
# Alternative 2: using the data model iterator() function
stream = [Link]()
for node in [Link]():
if ([Link]() == "filter"):
# iterator() returns the field objects so we need
# to call getColumnName() to get the name
for field in [Link]().iterator():
newname = [Link]().upper()
[Link]("new_name", [Link](), newname)
El script recorre en bucle los nodos de la ruta actual y comprueba cada nodo para ver si es un Filtro. Si
es así, el script recorre en bucle cada campo del nodo y utiliza la función [Link]() o
[Link]().upper() para cambiar el nombre a mayúsculas.
49
Acceso a objetos en el Repositorio de IBM SPSS Collaboration and
Deployment Services
Si tiene una licencia para Repositorio de IBM SPSS Collaboration and Deployment Services, puede
almacenar y recuperar objetos del repositorio utilizando comandos de script. Utilice el repositorio para
gestionar el ciclo de vida de los modelos de minería de datos y los objetos predictivos relacionados en el
contexto de aplicaciones empresariales, herramientas y soluciones.
Para acceder al repositorio, en primer lugar, debe configurar una conexión válida con el mismo, a través
del menú Herramientas de la interfaz de usuario de SPSS Modeler o a través de la línea de comandos. Si
desea obtener más información, consulte “Repositorio de IBM SPSS Collaboration and Deployment
Services Argumentos de conexión” en la página 67.
En un script, utilice las funciones retrieve* para acceder a distintos objetos, incluyendo rutas, modelos,
salidas y nodos. Se muestra un resumen de las funciones de recuperación en la tabla siguiente.
Tabla 23. Recuperar funciones de script
Tipo de objeto Función de repositorio
Ruta [Link](String path, String version, String label, Boolean autoManage)
Modelo [Link](String path, String version, String label, Boolean autoManage)
Resultado [Link](String path, String version, String label, Boolean autoManage)
Nodo [Link](String path, String version, String label, ProcessorDiagram
diagram)
Por ejemplo, puede recuperar una ruta del repositorio con la función siguiente:
stream = [Link]("/projects/retention/risk_score.str", None, "production", True)
Este ejemplo recupera la ruta risk_score.str de la carpeta especificada. La etiqueta production identifica
qué versión de la ruta recuperar, y el último parámetro especifica que SPSS Modeler va a gestionar la
ruta (por ejemplo, por lo que la ruta aparece en la pestaña Rutas si la interfaz de usuario de SPSS
Modeler es visible). Como alternativa, para utilizar una versión específica sin etiquetar:
stream = [Link]("/projects/retention/risk_score.str", "0:2015-10-12 [Link].281",
None, True)
Nota: Si ambos parámetros, el de versión y el de etiqueta, son None,se devuelve la última versión.
Para utilizar scripts para almacenar objetos en el repositorio, utilice las funciones store*. Se muestra un
resumen de las funciones de almacenamiento en la tabla siguiente.
Por ejemplo, puede almacenar una nueva versión de la ruta risk_score.str con la función siguiente:
versionId = [Link](stream,
"/projects/retention/risk_score.str", "test")
Este ejemplo almacena una nueva versión de la ruta, asocia la etiqueta "test" a la misma y devuelve el
marcador de la versión para la versión recién creada.
Nota: Si no desea asociar una etiqueta a la nueva versión, pase None para la etiqueta.
Al utilizar las carpetas dentro del repositorio, puede organizar objetos en grupos lógicos y hacer que sea
más fácil ver qué objetos están relacionados. Cree carpetas utilizando la función createFolder(), como en
el ejemplo siguiente:
newpath = [Link]("/projects", "cross-sell")
Este ejemplo crea una carpeta nueva que se llama "cross-sell" en la carpeta "/projects". La función
devuelve la vía de acceso completa de la carpeta nueva.
Puede bloquear un objeto desde un script para evitar que otros usuarios actualicen cualquiera de las
versiones existentes o creen nuevas versiones. También puede desbloquear un objeto que haya bloqueado.
[Link](REPOSITORY_PATH)
[Link](URI)
Como cuando se almacenan y se recuperan objetos, RUTA_REPOSITORIO le ofrece la ubicación del objeto en
el repositorio. La ruta debe estar entre comillas y utilizar barras inclinadas como delimitadores. No
distingue entre mayúsculas y minúsculas.
[Link]("/myfolder/[Link]")
[Link]("/myfolder/[Link]")
Tenga en cuenta que el bloqueo de objetos se aplica a todas las versiones de un objeto: no puede
bloquear o desbloquear versiones por separado.
A través de la interfaz de usuario, está disponible una herramienta para generar contraseñas codificadas
basándose en el algoritmo Blowfish (consulte [Link] si desea más
información). Una vez codificada, puede copiar y almacenar la contraseña en archivos de script y
argumentos de líneas de comando. La propiedad de nodo epassword utilizada para databasenode y
databaseexportnode almacena la contraseña codificada.
1. Para generar una contraseña codificada, en el menú Herramientas seleccione:
Codificar contraseña...
2. Especifique una contraseña en el cuadro de texto Contraseña.
3. Pulse en Codificar para generar una codificación aleatoria de la contraseña.
4. Pulse en el botón Copiar para copiar la contraseña codificada al Portapapeles.
5. Pegue la contraseña en el script o parámetro deseado.
Comprobación de script
Puede comprobar rápidamente la sintaxis de todos los tipos de scripts pulsando en el botón de
comprobación de la barra de herramientas del cuadro de diálogo Script de ruta.
En la comprobación por script se avisa de cualquier error que se detecte en el código y se sugieren
recomendaciones de mejora. Para ver la línea con errores, pulse en los comentarios, en la mitad inferior
del cuadro de diálogo. Los errores se señalan en rojo.
Es posible que los scripts creados en esta versión no funcionen en versiones anteriores.
Si un script creó una liberación antigua utiliza un comando que se ha sustituido desde entonces (o
desaprobado), la forma antigua se seguirá admitiendo, pero aparecerá un mensaje de advertencia. Por
ejemplo, la palabra clave antigua generated se ha sustituido por model, y clear generated se ha
sustituido por clear generated palette. Los scripts que utilizan las formas antiguas se seguirán
ejecutando, pero se mostrará una advertencia.
Por ejemplo, muchos resultados de modelo predictivo utilizan una variante de XML llamada PMML para
representar información sobre el modelo, tal como qué campos utiliza un árbol de decisiones en cada
bifurcación o cómo están conectadas las neuronas de una red neuronal y con qué intensidades. Los
resultados del modelo que utilizan PMML proporcionan un modelo de contenido XML que se puede
utilizar para acceder a esa información. Por ejemplo:
stream = [Link]()
# Suponga que la ruta contiene un nodo generador de modelos C5.0
# y que el origen de datos, los predictores y los destinos ya se han
# configurado
modelbuilder = [Link]("c50", None)
results = []
[Link](results)
modeloutput = results[0]
# Ahora que tenemos el objeto de salida del modelo C5.0, acceda al modelo
# de contenido pertinente
cm = [Link]("PMML")
IBM SPSS Modeler es compatible con los modelos de contenido siguientes en los scripts:
v Modelo de contenido de tabla: proporciona acceso a datos tabulares simples representados como filas
y columnas
Capítulo 5. Sugerencias para scripts 53
v Modelo de contenido XML: proporciona acceso a contenido almacenado en formato XML
v Modelo de contenido JSON: proporciona acceso a contenido almacenado en formato JSON
v Modelo de contenido de estadísticas de columna: proporciona acceso a estadísticas de resumen sobre
un campo determinado
v Modelo de contenido de estadísticas de columna por pares: proporciona acceso a estadísticas de
resumen entre dos campos o valores entre dos campos separados
API
Tabla 25. API
Devolver Método Descripción
int getRowCount() Devuelve el número de filas en esta
tabla.
int getColumnCount() Devuelve el número de columnas en
esta tabla.
Cadena getColumnName(int columnIndex) Devuelve el nombre de la columna
en el índice de columna especificado.
El índice de columna comienza en el
0.
StorageType getStorageType(int columnIndex) Devuelve el tipo de almacenamiento
de la columna en el índice
especificado. El índice de columna
comienza en el 0.
Object getValueAt(int rowIndex, int Devuelve el valor en los índices de
columnIndex) fila y columna especificados. Los
índices de fila y columna comienzan
en el 0.
void reset() Desecha cualquier almacenamiento
interno asociado con este modelo de
contenido.
Nodos y salidas
Esta tabla lista los nodos que crean salidas que incluyen este tipo de modelo de contenido.
Tabla 26. Nodos y salidas
Nombre de nodo Nombre de resultado ID de contenedor
tabla tabla "tabla"
Script de ejemplo
stream = [Link]()
from [Link] import StorageType
El modelo de contenido XML permite acceder a componentes utilizando expresiones XPath. Las
expresiones XPath son series que definen qué elementos o atributos son necesarios para el solicitante. El
modelo de contenido XML hace que sea transparente la creación de diversos objetos y expresiones de
compilación que normalmente son necesarios para el soporte de XPath. Esto hace que sea más sencillo
hacer llamadas desde scripts Python.
El modelo de contenido XML incluye una función que devuelve el documento XML como serie de
caracteres. Esto permite que los usuarios del script Python utilicen su biblioteca preferida de Python para
analizar XML.
API
Tabla 27. API
Devolver Método Descripción
Cadena getXMLAsString() Devuelve el XML en forma de serie
de caracteres.
Nodos y salidas
Esta tabla lista los nodos que crean salidas que incluyen este tipo de modelo de contenido.
Tabla 28. Nodos y salidas
Nombre de nodo Nombre de resultado ID de contenedor
La mayoría de constructores de La mayoría de modelos generados "PMML"
modelos
"autodataprep" n/d "PMML"
El código del script Python para acceder al contenido puede tener este aspecto:
results = []
[Link](results)
modeloutput = results[0]
cm = [Link]("PMML")
API
Tabla 29. API
Devolver Método Descripción
Cadena getJSONAsString() Devuelve el contenido JSON como
serie de caracteres.
Object getObjectAt(<Lista de objetos> Devuelve el objeto situado en la vía
path, JSONArtifact artifact) de acceso especificada. El artefacto
throws Exception raíz proporcionado puede ser nulo,
en cuyo caso se utiliza la raíz del
contenido. El valor devuelto puede
ser una serie literal, un entero, un
número real, un valor booleano o un
artefacto JSON (ya sea un objeto
JSON o una matriz JSON).
Tabla hash (key:object, getChildValuesAt(<Lista de Devuelve los valores hijo de la vía de
value:object> objetos> path, JSONArtifact acceso especificada si la vía conduce
artifact) throws Exception a un objeto JSON, o devuelve nulo en
caso contrario. Las claves de la tabla
son series, mientras que el valor
asociado puede ser una serie literal,
un entero, un número real, un valor
booleano o un artefacto JSON (ya sea
un objeto JSON o una matriz JSON).
Lista de objetos getChildrenAt(<Lista de objetos> Devuelve la lista de objetos situados
path path, JSONArtifact artifact) en la vía de acceso especificada si la
throws Exception vía conduce a una matriz JSON, o
devuelve nulo en caso contrario. Los
valores devueltos pueden ser una
serie literal, un entero, un número
real, un valor booleano o un artefacto
JSON (ya sea un objeto JSON o una
matriz JSON).
void reset() Desecha cualquier almacenamiento
interno asociado con el modelo de
contenido (por ejemplo, un objeto
DOM almacenado en memoria
caché).
Si existe un nodo generador de salida que crea salida en formato JSON, se puede utilizar lo siguiente
para acceder a información sobre un conjunto de libros:
results = []
[Link](results)
output = results[0]
cm = [Link]("jsonContent")
Algunos valores sólo son adecuados para estadísticas de una sola columna, mientras que otros sólo son
adecuados para estadísticas por pares.
Qué modelos de contenido y estadísticas se pueden utilizar depende de las prestaciones del nodo en
cuestión y de los valores contenidos en ese nodo.
La API ColumnStatsContentModel
Tabla 30. La API ColumnStatsContentModel.
Devolver Método Descripción
List<StatisticType> getAvailableStatistics() Devuelve las estadísticas disponibles
en este modelo. No todos los campos
tendrán necesariamente valores para
todas las estadísticas.
List<String> getAvailableColumns() Devuelve los nombres de columna
para los que se han calculado
estadísticas.
Number getStatistic(String column, Devuelve los valores estadísticos
StatisticType statistic) asociados a la columna.
void reset() Desecha cualquier almacenamiento
interno asociado con el modelo de
contenido.
La API PairwiseStatsContentModel
Tabla 31. La API PairwiseStatsContentModel.
Devolver Método Descripción
List<StatisticType> getAvailableStatistics() Devuelve las estadísticas disponibles
en este modelo. No todos los campos
tendrán necesariamente valores para
todas las estadísticas.
List<String> getAvailablePrimaryColumns() Devuelve los nombres de columna
primaria para los que se han
calculado estadísticas.
List<Object> getAvailablePrimaryValues() Devuelve los valores de la columna
primaria para la que se han calculado
estadísticas.
List<String> getAvailableSecondaryColumns() Devuelve los nombres de columna
secundaria para los que se han
calculado estadísticas.
Nodos y salidas
Esta tabla lista los nodos que generan datos de salida y que incluyen este tipo de modelo de contenido.
Tabla 32. Nodos y salidas.
Nombre de nodo Nombre de resultado ID de contenedor Notas
"means" "means" "columnStatistics"
(nodo Medias)
"means" "means" "pairwiseStatistics"
(nodo Medias)
"dataaudit" "means" "columnStatistics"
(nodo Auditoría de datos)
"statistics" "statistics" "columnStatistics" Sólo se genera cuando se
(nodo Estadísticas) examinan campos
determinados.
"statistics" "statistics" "pairwiseStatistics" Sólo se genera cuando se
(nodo Estadísticas) correlacionan campos.
Script de ejemplo
from [Link] import StatisticType
stream = [Link]()
results = []
[Link](results)
statsoutput = results[0]
statscm = [Link]("columnStatistics")
if (statscm != None):
cols = [Link]()
stats = [Link]()
print "Column stats:", cols[0], str(stats[0]), " = ", [Link](cols[0], stats[0])
60 IBM SPSS Modeler 18.1.1 Guía de automatización y scripts Python
statscm = [Link]("pairwiseStatistics")
if (statscm != None):
pcols = [Link]()
scols = [Link]()
stats = [Link]()
corr = [Link](pcols[0], scols[0], [Link])
print "Pairwise stats:", pcols[0], scols[0], " Pearson = ", corr
Los argumentos disponibles (modificadores) permiten conectar con un servidor, cargar rutas, ejecutar
scripts o especificar otros parámetros, según sea necesario.
Hay varios tipos de argumentos de línea de comandos disponibles que se describen más adelante en esta
sección.
Tabla 33. Tipos de argumentos de línea de comandos.
Tipo de argumento Dónde se describe
Argumentos del sistema Consulte el tema “Argumentos del sistema” en la página
64 para obtener más información.
Argumentos de parámetros Consulte el tema “Argumentos de parámetros” en la
página 65 para obtener más información.
Argumentos de conexión del servidor Consulte el tema “Argumentos de conexión del servidor”
en la página 66 para obtener más información.
Argumentos de conexión de Repositorio de IBM SPSS Consulte el tema “Repositorio de IBM SPSS
Collaboration and Deployment Services Collaboration and Deployment Services Argumentos de
conexión” en la página 67 para obtener más información.
Argumentos de conexión de IBM SPSS Analytic Server Consulte el tema “Argumentos de conexión de IBM SPSS
Analytic Server” en la página 68 para obtener más
información.
Por ejemplo, se pueden utilizar las marcas -server, -stream y -execute para conectar con un servidor y, a
continuación, cargar y ejecutar una ruta, de la siguiente forma:
modelerclient -server -hostname myserver -port 80 -username dminer
-password 1234 -stream [Link] -execute
Tenga en cuenta que al ejecutarse en una instalación cliente local, no se necesitan argumentos de conexión
con el servidor.
Los valores de parámetros que contienen espacios se pueden poner entre comillas dobles, por ejemplo:
modelerclient -stream [Link] -Pusername="Joe User" -execute
63
También puede ejecutar scripts y estados de IBM SPSS Modeler de esta forma, utilizando las marcas
-state y -script respectivamente.
Nota: Si utiliza un parámetro estructurado en un comando, delante de las comillas debe poner barras
invertidas. Así evitará que se quiten las comillas durante la interpretación de la serie.
Nota: Los directorios predeterminados también se pueden establecer en la interfaz de usuario. Para
acceder a las opciones en el menú Archivo, seleccione Definir directorio o Definir directorio de servidor.
Desde la línea de comandos puede cargar varias rutas, estados y resultados en el inicio repitiendo el
argumento relevante para cada objeto cargado. Por ejemplo, para cargar y ejecutar dos rutas llamadas
[Link] y [Link], utilizaría el siguiente comando:
modelerclient -stream [Link] -stream [Link] -execute
Dado que puede cargar determinados objetos de un archivo o desde el Repositorio de IBM SPSS
Collaboration and Deployment Services (si dispone de licencia), el prefijo de nombre de archivo spsscr:
y, si lo desea, file: (para objetos en disco) indica a IBM SPSS Modeler donde buscar el objeto. El prefijo
funciona con las siguientes marcas:
v -stream
v -script
v -output
v -model
v -project
Puede utilizar el prefijo para crear un URI que especifique la ubicación del objeto, por ejemplo, -stream
"spsscr:///folder_1/scoring_stream.str". La presencia del prefijo spsscr: requiere que se especifique
una conexión válida a Repositorio de IBM SPSS Collaboration and Deployment Services en el mismo
comando. Así, por ejemplo, el comando completo sería:
modelerclient -spsscr_hostname myhost -spsscr_port 8080
-spsscr_username myusername -spsscr_password mypassword
-stream "spsscr:///folder_1/scoring_stream.str" -execute
Recuerde que en la línea de comandos debe utilizar un URI. El REPOSITORY_PATH más simple no se admite.
(Sólo funciona en scripts.) Para obtener más detalles sobre los URI para objetos en el Repositorio de IBM
SPSS Collaboration and Deployment Services, consulte el tema “Acceso a objetos en el Repositorio de
IBM SPSS Collaboration and Deployment Services” en la página 50.
Argumentos de parámetros
Los parámetros se pueden utilizar como marcas durante la ejecución de la línea de comandos de IBM
SPSS Modeler. En los argumentos de la línea de comandos, la marca -P se utiliza para denotar un
parámetro del tipo -P <nombre>=<valor>.
Por ejemplo, puede proporcionar contraseñas y nombres de usuario de orígenes de datos como una
marca de la línea de comandos, por ejemplo:
modelerclient -stream [Link] -P:[Link]="{\"ORA 10gR2\",user1,mypsw,false}"
El formato es el mismo que el del parámetro datasource de la propiedad de nodo databasenode. Para
obtener más información, consulte: “propiedades de databasenode” en la página 84.
Nota: Si el nodo tiene nombre, debe encerrar el nombre del nodo entre comillas dobles y utilizar una
barra inclinada invertida como carácter de escape antes de las comillas. Por ejemplo, si el nodo de origen
de datos del ejemplo anterior tiene el nombre Source_ABC, la entrada sería la siguiente:
modelerclient -stream [Link] -P:databasenode.\"Source_ABC\".datasource="{\"ORA 10gR2\",
user1,mypsw,true}"
También se requiere una barra inclinada invertida delante de las comillas que identifican un parámetro
estructurado, como en el siguiente ejemplo de origen de datos de TM1:
clemb -server -hostname [Link] -port 28053 -username administrator
-execute -stream C:\Share\TM1_Script.str -P:tm1import.pm_host="[Link]
-P:tm1import.tm1_connection={\"SData\",\"\",\"admin\",\"apple\"}
-P:tm1import.selected_view={\"SalesPriorCube\",\"salesmargin%\"}
Ejemplos
Tenga en cuenta que para conectarse a un clúster de servidores necesita Coordinator of Processes a través
de IBM SPSS Collaboration and Deployment Services, de modo que debe utilizar el argumento -cluster
junto con las opciones de conexión de repositorio (spsscr_*). Consulte el tema “Repositorio de IBM SPSS
Collaboration and Deployment Services Argumentos de conexión” en la página 67 para obtener más
información.
Tabla 35. Argumentos de conexión del servidor.
Argumento Comportamiento/Descripción
-server Ejecuta IBM SPSS Modeler en el modo servidor, conectando con un servidor
público utilizando las marcas -hostname, -port, -username, -password y -domain.
-hostname <nombre> Nombre de host del equipo servidor. Disponible en el modo servidor solamente.
-use_ssl Especifica que la conexión debería utilizar SSL (secure socket layer). La marca es
opcional, el parámetro predeterminado no utiliza SSL.
-port <número> Número de puerto del servidor especificado. Disponible en el modo servidor
solamente.
La siguiente tabla enumera los argumentos que pueden utilizarse para configurar la conexión.
Tabla 36. Argumentos de conexión de Repositorio de IBM SPSS Collaboration and Deployment Services
Argumento Comportamiento/Descripción
-spsscr_hostname <nombre del host o El nombre del host o la dirección IP del servidor en que se ha instalado
dirección IP> Repositorio de IBM SPSS Collaboration and Deployment Services.
-spsscr_port <número> Número de puerto en el que el Repositorio de IBM SPSS Collaboration
and Deployment Services acepta las conexiones (normalmente 8080 de
forma predeterminada).
-spsscr_use_ssl Especifica que la conexión debería utilizar SSL (secure socket layer). La
marca es opcional, el parámetro predeterminado no utiliza SSL.
-spsscr_username <nombre> Nombre de usuario con el que iniciar sesión en el Repositorio de IBM
SPSS Collaboration and Deployment Services.
-spsscr_password <contraseña> Contraseña con la que iniciar sesión en el Repositorio de IBM SPSS
Collaboration and Deployment Services.
-spsscr_epassword <contraseña Contraseña cifrada con la que iniciar sesión en el Repositorio de IBM
codificada> SPSS Collaboration and Deployment Services.
Nota: La ubicación predeterminada de Analytic Server se obtiene de SPSS Modeler Server. Los usuarios
también pueden definir sus propias conexiones de Analytic Server a través de Herramientas >
Conexiones de Analytic Server.
La siguiente tabla enumera los argumentos que pueden utilizarse para configurar la conexión.
Tabla 37. Argumentos de conexión de IBM SPSS Analytic Server
Argumento Comportamiento/Descripción
-analytic_server_username Nombre de usuario con el que iniciar sesión en IBM SPSS Analytic
Server.
-analytic_server_password La contraseña con la que se inicia sesión en IBM SPSS Analytic Server.
-analytic_server_epassword La contraseña codificada con la que se inicia sesión en IBM SPSS
Analytic Server.
-analytic_server_credential Las credenciales utilizadas para iniciar sesión en IBM SPSS Analytic
Server.
Ponga el nombre del archivo y la ruta del archivo de comandos entre comillas si hay que incluir espacios,
de la siguiente forma:
modelerclient @ "C:\Archivos de programa\IBM\SPSS\Modeler\nn\scripts\my_command_file.txt"
El archivo de comandos puede contener todos los argumentos especificados previamente a nivel
individual en el inicio. Por ejemplo:
-stream [Link]
-Porder.full_filename=APR_orders.dat
-[Link]=APR_report.txt
-execute
En el contexto de los scripts de IBM SPSS Modeler, las propiedades de nodos y rutas se suelen llamar
parámetros de intervalo. En esta guía, se denominan propiedades de nodos y rutas.
Si desea obtener más información sobre el lenguaje de scripts, consulte Lenguaje de scripts.
o:
[Link](PROPERTY, KEY, VALUE)
o:
VARIABLE = [Link](PROPERTY, KEY)
donde OBJECT es un nodo o salida, PROPERTY es el nombre de la propiedad de nodo al que la expresión se
refiere, y KEY es el valor de la clave para las propiedades clave. Por ejemplo, la siguiente sintaxis se
utiliza para buscar el nodo de filtro y, a continuación, establecer el valor predeterminado para incluir
todos los campos y filtrar el campo Age en los datos en sentido descendente:
filternode = [Link]().findByType("filter", None)
[Link]("default_include", True)
[Link]("include", "Age", False)
Todos los nodos utilizados en IBM SPSS Modeler pueden encontrarse utilizando la función
findByType(TYPE, LABEL) de la ruta. Al menos debe especificarse TYPE o LABEL.
Propiedades estructuradas
Hay dos formas en las que los scripts utilizan propiedades estructuradas para mejorar la claridad durante
el análisis:
v Otorgando estructura a los nombres de las propiedades para los nodos complejos, como Tipo, Filtro o
Equilibrar.
69
v Proporcionando un formato para especificar varias propiedades a la vez.
Los scripts para los nodos con tablas y otras interfaces complejas, como, por ejemplo, los nodos Tipo,
Filtro o Equilibrar, deben seguir una estructura determinada para realizar el análisis correctamente. Estas
propiedades necesitan un nombre más complejo que el de un solo identificador. Este nombre se
denomina clave. Por ejemplo, en un nodo Filtrar, cada campo disponible (en la parte superior) se activa o
desactiva. Para poder consultar esta información, el nodo Filtrar almacena un elemento de información
por campo (independientemente de que el campo sea verdadero o falso). Esta propiedad debe tener (o se
le ha dado) el valor True o False. Supongamos que un nodo Filtrar denominado minodo tiene (en la parte
superior) un campo denominado Edad. Para desactivar esto, establezca la propiedad include, con la clave
Age, en el valor False, del modo siguiente:
[Link]("include", "Age", False)
Si hay muchos nodos, puede asignar más de una propiedad de nodo o ruta al mismo tiempo. Esto se
denomina comando de conjunto múltiple o bloque de conjuntos.
En algunos casos, una propiedad estructurada puede ser bastante compleja. A continuación se muestra un
ejemplo:
[Link]("keys", [["K", "Descending"], ["Age", "Ascending"],
["Na", "Descending"]])
Otra ventaja de las propiedades estructuradas es la capacidad de definir varias propiedades en un nodo
antes de que éste sea estable. De forma predeterminada, un conjunto múltiple define todas las
propiedades del bloque antes de realizar una acción basada en una configuración de propiedades
individuales. Por ejemplo, al definir un nodo Archivo fijo, el uso de dos pasos para definir las
propiedades del campo daría lugar a errores porque el nodo no será constante hasta que las dos
configuraciones sean válidas. La definición de las propiedades como un conjunto múltiple salva este
problema al definir ambas propiedades antes de actualizar el modelo de datos.
Abreviaturas
Las abreviaturas estándar se utilizan en la sintaxis para las propiedades de nodos. El aprendizaje de las
abreviaturas le ayudará en la creación de scripts.
Tabla 38. Abreviaturas estándar utilizadas en toda la sintaxis
Abreviatura Significado
abs Valor absoluto
lon Longitud
min Mínimo
máx Máximo
correl Correlation
covar Covariance
núm Número o numérico
pct Porcentaje
transp Transparencia
xval Validación cruzada
var Varianza o variable (en nodos de origen)
El ejemplo s:sample.max_size muestra que no es necesario deletrear los tipos de nodos al completo.
El ejemplo [Link] muestra que algunos nombres de intervalo se pueden estructurar por sí
mismos, en aquellos casos en que los atributos de un nodo sean más complejos que los intervalos
individuales con valores individuales. Dichos intervalos se denominan estructurados o complejos.
Las propiedades específicas del Supernodo se tratan aparte como con los demás nodos. Consulte el tema
Capítulo 21, “Propiedades de supernodo”, en la página 365 para obtener más información.
Ejemplo
La propiedad de nodo se utiliza para hacer referencia a los nodos en la ruta actual. El siguiente script de
ruta muestra un ejemplo:
stream = [Link]()
annotation = [Link]("annotation")
[Link]("annotation", annotation)
El ejemplo anterior utiliza la propiedad node para crear una lista con todos los nodos de la ruta y escribir
dicha lista en las anotaciones. La anotación generada tendrá el siguiente aspecto:
Esta ruta se llama "druglearn" y contiene los siguientes nodos:
stream_rewriting_optimise_clem_ booleano
ejecución
stream_rewriting_optimise_syntax_ booleano
ejecución
enable_parallelism booleano
sql_generation booleano
database_caching booleano
sql_logging booleano
sql_generation_logging booleano
sql_log_native booleano
sql_log_prettyprint booleano
record_count_suppress_input booleano
record_count_feedback_interval entero
use_stream_auto_create_node_ booleano Si es true, se utilizan los valores
valores específicos de la ruta, de lo contrario,
se utilizan las preferencias de
usuario.
create_model_applier_for_new_ booleano Si es true, cuando un constructor de
modelos modelos crea un modelo nuevo y no
tiene enlaces de actualización activos,
se añade un nuevo aplicador de
modelos.
Nota: Si utiliza IBM SPSS Modeler
Batch versión 15, debe añadir de
forma explícita el aplicador de
modelos dentro de su script.
create_model_applier_update_links createEnabled Define el tipo de enlace creado
createDisabled cuando se añade automáticamente un
doNotCreate nodo aplicador de modelos.
Ejemplo 1
varfilenode = [Link]().create("variablefile", "Var. File")
[Link]("full_filename", "$CLEO_DEMOS/DRUG1n")
[Link]("check", "Age", "None")
[Link]("values", "Age", [1, 100])
[Link]("type", "Age", "Range")
[Link]("direction", "Age", "Input")
Ejemplo 2
Este script presupone que el archivo de datos especificado contiene un campo Region que representa una
cadena de varias líneas.
from [Link] import StorageType
from [Link] import MeasureType
# Cree un nodo Archivo de variables que lee el conjunto de datos que contiene
# el campo "Region"
varfilenode = [Link]().create("variablefile", "My Geo Data")
[Link]("full_filename", "C:/mydata/[Link]")
[Link]("treat_square_brackets_as_lists", True)
77
Tabla 42. Propiedades comunes de nodos de origen (continuación).
Nombre de la propiedad Tipo de datos Descripción de la propiedad
type Range Tipo de campo. Si se establece esta propiedad como
Flag Default, se borrará cualquier configuración del parámetro
Set values y si value_mode tiene el valor Specify, se
Sin tipo restablecerá a Read. Si value_mode se establece en Pass o
Discrete Read, la configuración de type no le afectará.
Conjunto ordenado
Predeterminado Formato de uso:
[Link]
storage Desconocido Propiedad con clave de solamente lectura para el tipo de
Cadena almacenamiento de campos.
Entero
Real Formato de uso:
Hora [Link]
Fecha
Marca de tiempo
check Ninguno Propiedad con clave para la comprobación del rango y el
Nullify tipo de campo.
Coerce
Descartar Formato de uso:
Warn [Link]
Abort
values [value value] Para un campo continuo (rango), el primer valor es el
mínimo y el último valor es el máximo. Para campos
nominales (conjunto), especifique todos los valores. Para
los campos marca, el primer valor representa falso y el
último, verdadero. La configuración de esta propiedad
establece de forma automática la propiedad value_mode
en Specify. El almacenamiento se determina en función
del primer valor de la lista, por ejemplo, si el primer
valor es una cadena, el almacenamiento se establece en
Cadena.
Formato de uso:
[Link]
value_mode Leer Determina la forma en que se han establecido los valores
Pasar para un campo en la siguiente lectura de datos.
Leer+
Actual Formato de uso:
Especifica NODO.value_mode.NOMBRECAMPO
Tenga en cuenta que no puede establecer esta propiedad
directamente en Specify. Para utilizar valores específicos,
establezca la propiedad values.
default_value_mode Leer Especifica el método predeterminado para configurar los
Pasar valores de todos los campos.
Formato de uso:
NODO.default_value_mode
Formato de uso:
NODO.extend_values.NOMBRECAMPO
value_labels cadena Se utiliza para especificar una etiqueta de valor. Tenga
en cuenta que estos valores se deben especificar primero.
enable_missing tag Cuando está definida como T, activa el seguimiento de
los valores perdidos para el campo.
Formato de uso:
NODO.enable_missing.NOMBRECAMPO
missing_values [value value ...] Especifica los valores de datos que denotan los datos
perdidos.
Formato de uso:
NODO.missing_values.NOMBRECAMPO
range_missing tag Cuando esta propiedad se establece como T, especifica si
se define un rango de valores perdidos (en blanco) para
un campo.
Formato de uso:
NODO.range_missing.NOMBRECAMPO
missing_lower cadena Si range_missing es verdadero, especifica el límite
inferior del rango de valores perdidos.
Formato de uso:
NODO.missing_lower.NOMBRECAMPO
missing_upper cadena Si range_missing es verdadero, especifica el límite
superior del rango de valores perdidos.
Formato de uso:
NODO.missing_upper.NOMBRECAMPO
null_missing tag Cuando esta propiedad se establece en T, los valores
nulos (valores no definidos que se muestran como
$null$ en el software) se consideran valores perdidos.
Formato de uso:
NODO.null_missing.NOMBRECAMPO
whitespace_missing tag Cuando esta propiedad está definida como T, los valores
que solamente contienen un espacio en blanco (espacios,
tabulaciones y líneas nuevas) se consideran valores
perdidos.
Formato de uso:
NODO.whitespace_missing.NOMBRECAMPO
description cadena Se utiliza para especificar la descripción o etiqueta de un
campo.
Ejemplo:
set minodo:filternode.default_include = false
include tag Propiedad con clave que se utiliza para determinar si los
campos individuales se han incluido o se han filtrado:
[Link].
new_name cadena
measure_type Range / Esta propiedad con clave es similar a type en cuanto a
[Link] que puede utilizarse para definir la medición asociada al
Discrete / campo. La diferencia es que, en los scripts Python, la
[Link] función de establecimiento puede pasar también uno de
Flag / [Link] los valores MeasureType, mientras que la función de
Set / [Link] obtención siempre devolverá los valores MeasureType.
OrderedSet /
MeasureType.ORDERED_SET
Typeless /
[Link]
Collection /
[Link]
Geospatial /
[Link]
collection_measure Range / Para campos de recopilación (listas con profundidad 0),
[Link] esta propiedad con clave define el tipo de medición
Flag / [Link] asociado con los valores subyacentes.
Set / [Link]
OrderedSet /
MeasureType.ORDERED_SET
Typeless /
[Link]
geo_type Point En campos geoespaciales, esta propiedad con clave
Multipunto define el tipo del objeto geoespacial representado por
Cadena lineal este campo. Debería ser coherente con la profundidad de
Cadena multilínea lista de los valores.
Polígono
Multipolígono
has_coordinate_system booleano En campos geoespaciales, esta propiedad define si este
campo tiene un sistema de coordenadas
coordinate_system cadena En campos geoespaciales, esta propiedad con clave
define el sistema de coordenadas para este campo.
Propiedades de asimport
El origen de Analytic Server permite ejecutar una ruta en un sistema de archivos distribuido de Hadoop
(HDFS en sus siglas inglesas).
Ejemplo
[Link]("use_default_as", False)
[Link]("connection",
["false","[Link]","9080","analyticserver","ibm","admin","admin","false","","","",""])
Tabla 43. Propiedades de asimport.
Propiedades de asimport Tipo de datos Descripción de la propiedad
data_source cadena Nombre del origen de datos.
use_default_as booleano Si se establece en True, utiliza la conexión
de Analytic Server predeterminada
configurada en el archivo [Link] de
servidor. Si se establece en False, utiliza
la conexión de este nodo.
Ejemplo
node = [Link]("cognosimport", "My node")
[Link]("cognos_connection", ["[Link]
True, "", "", ""])
[Link]("cognos_package_name", "/Public Folders/GOSALES")
[Link]("cognos_items", ["[GreatOutdoors].[BRANCH].[BRANCH_CODE]",
"[GreatOutdoors]
.[BRANCH].[COUNTRY_CODE]"])
Tabla 44. propiedades del nodo cognosimport.
Propiedades del nodo
cognosimport Tipo de datos Descripción de la propiedad
mode Datos Especifica si se importarán los datos de
Informe Cognos (valor predeterminado) o informes.
donde:
Cognos_server_URL es la URL del servidor
de Cognos que contiene el origen.
login_mode indica si se utiliza el inicio de
sesión anónimo, y es true o false; si se
establece en true, los campos siguientes
deben establecerse en "".
namespace especifica el proveedor de
autenticación de seguridad utilizado para
registrarse en el servidor.
username y password son los utilizados para
registrarse en el servidor de Cognos.
Donde stored_credential_name es el
nombre de una credencial de Cognos del
repositorio.
cognos_package_name cadena La ruta y el nombre del paquete de Cognos
desde el que está importando objetos de
datos, por ejemplo:
/Public Folders/GOSALES
Nota: solo es válida la barra diagonal.
cognos_items ["campo","campo", ... ,"campo"] El nombre de uno o más objetos de datos
que van a importarse. El formato de campo
es [espacio de nombre].[asunto de
consulta].[elemento de consulta]
cognos_filters campo El nombre de uno o más filtros que van a
aplicarse antes de importar datos.
Formato:
[["param1", "valor"],...,["paramN", "valor"]]
cognos_report_directory campo La ruta de Cognos de una carpeta o paquete
de la que importar informes, por ejemplo:
/Public Folders/GOSALES
Nota: solo es válida la barra diagonal.
cognos_report_name campo La ruta y nombre dentro de la ubicación del
informe de un informe que se ha de
importar.
cognos_report_parameters lista Valores de parámetros de informe. Los pares
nombre-valor van encerrados entre
corchetes, los pares múltiples están
separados por comas y toda la cadena está
encerrada entre corchetes.
Formato:
[["param1", "valor"],...,["paramN", "valor"]]
propiedades de databasenode
El nodo Base de datos se puede utilizar para importar datos de una serie de otros paquetes
utilizando ODBC (Open Database Connectivity), incluyendo Microsoft SQL Server, Db2,
Oracle y otros.
Ejemplo
import [Link]
stream = [Link]()
nnode = [Link]("database", "My node")
[Link]("mode", "Table")
[Link]("query", "SELECT * FROM drug1n")
[Link]("datasource", "Drug1n_db")
[Link]("username", "spss")
[Link]("password", "spss")
[Link]("tablename", ".Drug1n")
Tabla 45. propiedades de databasenode.
Propiedades de databasenode Tipo de datos Descripción de la propiedad
mode Tabla Especifique Table para conectarse a una tabla
Query de base de datos mediante los controles del
cuadro de diálogo, o Query para realizar una
consulta a la base de datos seleccionada
mediante SQL.
Nota: Si el nombre de la base de datos (en la propiedad datasource) contiene uno o más espacios, puntos
(llamados también "punto y aparte") o subrayados, puede utilizar el formato de "barra inclinada invertida
y comillas dobles" para tratarlo como una cadena. Por ejemplo: "{\"db2v9.7.6_linux\"}" o: "{\"TDATA
131\"}". Además, encierre siempre los valores de cadena de datasource entre dobles comillas y llaves,
como en el ejemplo siguiente: "{\"SQL Server\",spssuser,abcd1234,false}".
Nota: Si el nombre de la base de datos (en la propiedad datasource) contiene espacios, entonces en vez
de las propiedades individuales para datasource, username y password, utilice un único origen de datos
en el siguiente formato:
Utilice este formato también si está cambiando el origen de datos, sin embargo, si tan sólo desea cambiar
el nombre de usuario o contraseña, puede usar las propiedades username o password.
Propiedades de datacollectionimportnode
El nodo Importación de datos de Data Collection importa datos de encuesta basándose en el
modelo de datos de Data Collection utilizado por productos de investigación de mercado. Se
debe instalar la biblioteca de datos de Data Collection para utilizar este nodo.
Ejemplo
node = [Link]("datacollectionimport", "My node")
[Link]("metadata_name", "mrQvDsc")
[Link]("metadata_file", "C:/Program Files/IBM/SPSS/DataCollection/DDL/Data/
Quanvert/Museum/[Link]")
[Link]("casedata_name", "mrQvDsc")
[Link]("casedata_source_type", "File")
[Link]("casedata_file", "C:/Program Files/IBM/SPSS/DataCollection/DDL/Data/
Quanvert/Museum/[Link]")
[Link]("import_system_variables", "Common")
[Link]("import_multi_response", "MultipleFlags")
Tabla 47. propiedades de datacollectionimportnode.
propiedades de
datacollectionimportnode Tipo de datos Descripción de la propiedad
metadata_name cadena El nombre del MDSC. El valor especial
DimensionsMDD indica que se debería utilizar el
documento de metadatos de Data Collection
estándar. Otro posibles valores podrían ser:
mrADODsc
mrI2dDsc
mrLogDsc
mrQdiDrsDsc
mrQvDsc
mrSampleReportingMDSC
mrSavDsc
mrSCDsc
mrScriptMDSC
Propiedades de excelimportnode
El nodo de importación Excel importa datos de Microsoft Excel en formato de archivo .xlsx.
No es necesario un origen de datos ODBC.
Ejemplos
#Para usar un rango con nombre:
node = [Link]("excelimport", "My node")
[Link]("excel_file_type", "Excel2007")
[Link]("full_filename", "C:/[Link]")
[Link]("use_named_range", True)
[Link]("named_range", "DRUG")
[Link]("read_field_names", True)
Propiedades de extensionimportnode
python_script = """
cxt = [Link]()
if [Link]():
[Link](_schema)
else:
df = [Link]()
if df is None:
drugList=[(1,23,’F’,’HIGH’,’HIGH’,0.792535,0.031258,’drugY’), \
(2,47,’M’,’LOW’,’HIGH’,0.739309,0.056468,’drugC’),\
(3,47,’M’,’LOW’,’HIGH’,0.697269,0.068944,’drugC’),\
(4,28,’F’,’NORMAL’,’HIGH’,0.563682,0.072289,’drugX’),\
(5,61,’F’,’LOW’,’HIGH’,0.559294,0.030998,’drugY’),\
(6,22,’F’,’NORMAL’,’HIGH’,0.676901,0.078647,’drugX’),\
(7,49,’F’,’NORMAL’,’HIGH’,0.789637,0.048518,’drugY’),\
(8,41,’M’,’LOW’,’HIGH’,0.766635,0.069461,’drugC’),\
(9,60,’M’,’NORMAL’,’HIGH’,0.777205,0.05123,’drugY’),\
(10,43,’M’,’LOW’,’NORMAL’,0.526102,0.027164,’drugY’)]
sqlcxt = [Link]()
rdd = [Link]().parallelize(drugList)
print ’pyspark read data count = ’+str([Link]())
df = [Link](rdd, _schema)
[Link](df)
"""
[Link]("python_syntax", python_script)
Ejemplo de R
#### Ejemplo de script de R
[Link]("syntax_type", "R")
R_script = """# ’JSON Import’ Node v1.0 for IBM SPSS Modeler
# Paquete ’RJSONIO’ creado por Duncan Temple Lang - [Link]
# Paquete ’plyr’ creado por Hadley Wickham [Link]
# Desarrollador de nodo: Danil Savine - IBM Extreme Blue 2014
# Descripción: Este nodo le permite importar a SPSS datos de una tabla de un JSON.
# Instalar función para paquetes
packages <- function(x){
x <- [Link]([Link]()[[2]])
if (!require(x,[Link]=TRUE)){
[Link](pkgs=x,repos="[Link]
require(x,[Link]=TRUE)
}
}
# paquetes
packages(RJSONIO)
packages(plyr)
### Esta función se utiliza para generar automáticamente el dataModel
getMetaData <- function (data) {
if (dim(data)[1]<=0) {
[Link]("r_syntax", R_script)
Tabla 49. Propiedades de extensionimportnode
Propiedades de extensionimportnode Tipo de datos Descripción de la propiedad
syntax_type R Especifica qué script se ejecuta: R o
Python Python (R es el valor
predeterminado).
r_syntax string Sintaxis de scripts R a ejecutar.
python_syntax string Sintaxis de scripts Python a
ejecutar.
Propiedades de fixedfilenode
El nodo Archivo fijo importa datos desde archivos de texto de campo fijo; esto es, archivos
cuyos campos no están delimitados pero empiezan en la misma posición y tienen una
longitud fija. Los datos heredados o generados por la máquina se suelen almacenar en
formato de campo fijo.
Ejemplo
node = [Link]("fixedfile", "My node")
[Link]("full_filename", "$CLEO_DEMOS/DRUG1n")
[Link]("record_len", 32)
[Link]("skip_header", 1)
[Link]("fields", [["Age", 1, 3], ["Sex", 5, 7], ["BP", 9, 10], ["Cholesterol",
12, 22], ["Na", 24, 25], ["K", 27, 27], ["Drug", 29, 32]])
[Link]("decimal_symbol", "Period")
[Link]("lines_to_scan", 30)
Tabla 50. propiedades de fixedfilenode.
Propiedad de fixedfilenode Tipo de datos Descripción de la propiedad
record_len number Especifica el número de caracteres de cada
registro.
line_oriented tag Omite el carácter de nueva línea al final de
cada registro.
decimal_symbol Predeterminado Tipo de separador decimal utilizado en el
Comma origen de datos.
Period
skip_header number Especifica el número de líneas que se
ignorarán al principio del primer registro. Esto
resulta útil para ignorar las cabeceras de
columna.
auto_recognize_datetime tag Especifica si las fechas o las horas se
identifican automáticamente en los datos de
origen.
lines_to_scan number
campos list Propiedad estructurada.
full_filename cadena Nombre completo del archivo que se va a leer,
incluido el directorio.
Propiedades de sasimportnode
El nodo importar SAS importa datos SAS a IBM SPSS Modeler.
Ejemplo
propiedades de simgennode
El nodo de generación de simulación proporciona una manera fácil de generar datos, ya sea
desde cero utilizando las distribuciones o estadísticas especificada por el usuario o
automáticamente utilizando las distribuciones obtenidas de la ejecución de un nodo de
simulación de ajuste sobre datos históricos. Esto es útil cuando desea evaluar el resultado de
un modelo predictivo en caso de dudas sobre las entradas del modelo.
distribution es una declaración de nombre de distribución seguido por una lista con parejas de nombres
de atributo y valores. Cada distribución se define de la siguiente forma:
[distributionname, [[par1], [par2], [par3]]]
Por ejemplo, para crear un nodo que genere un solo campo con una distribución binomial puede utilizar
el siguiente script:
simgen_node1 = [Link]().createAt("simgen", u"Sim Gen", 200, 200)
simgen_node1.setPropertyValue("fields", [["Education", "Real", False, ["Binomial", [["n", 32],
["prob", 0.7]]], "", ""]])
La distribución binomial tiene 2 parámetros: n y prob. Puesto que binomial no admite los valores mínimo
y máximo, éstos se suministran como una serie vacía.
Los ejemplos siguientes muestran todos los tipos de distribución posibles. Tenga en cuenta que el umbral
se especifica como thresh en NegativeBinomialFailures y en NegativeBinomialTrial.
stream = [Link]()
La correlación puede ser cualquier número entre +1 y -1. Puede especificar tantas correlaciones como
desee. Las correlaciones no especificadas se establecen en cero. Si alguno de los campos se desconocen, el
valor de la correlación debe establecerse en la matriz de correlación (o tabla) y se muestra en texto rojo.
Cuando hay campos desconocidos, no es posible ejecutar el nodo.
Propiedades de statisticsimportnode
El nodo IBM SPSS StatisticsArchivo lee los datos desde un formato de archivo .sav que utiliza
IBM SPSS Statistics y archivos caché guardados en IBM SPSS Modeler, que también puede
utilizar el mismo formato.
Las propiedades de este nodo están descritas en “Propiedades de statisticsimportnode” en la página 347.
Por ejemplo:
setPropertyValue("selected_columns",
["Measures"])
selected_rows ["campo" "campo"] Especifique las filas seleccionadas:
Nota: Este nodo estaba en desuso en Modeler 18.0. El nombre del script del nodo de sustitución es
tm1odataimport.
Tabla 55. propiedades del nodo tm1import.
Propiedades del nodo tm1import Tipo de datos Descripción de la propiedad
pm_host cadena Nota: sólo para la versión 16.0 y 17.0
Por ejemplo:
TM1_import.setPropertyValue("tm1_connection",
[’Planning Sample’, "admin", "apple"])
selected_view ["campo" "campo"] Una propiedad de la lista que contiene los detalles
del cubo TM1 seleccionado y el nombre de la vista
de cubo donde los datos se importarán en SPSS.
Por ejemplo:
TM1_import.setPropertyValue("selected_view",
[’plan_BudgetPlan’, ’Goal Input’])
Por ejemplo:
setPropertyValue("selected_columns",
["Measures"])
selected_rows ["campo" "campo"] Especifique las filas seleccionadas:
Ejemplo
node = [Link]("userinput", "My node")
[Link]("names", ["test1", "test2"])
[Link]("data", "test1", "2, 4, 8")
[Link]("custom_storage", "test1", "Integer")
[Link]("data_mode", "Ordered")
Tabla 57. propiedades de userinputnode.
Propiedad de userinputnode Tipo de datos Descripción de la propiedad
datos
nombres Intervalo estructurado que establece o
devuelve una lista de nombres de campos
generados por el nodo.
custom_storage Desconocido Intervalo con clave que establece o devuelve el
Cadena almacenamiento para un campo.
Entero
Real
Hora
Fecha
Marca de tiempo
data_mode Combined Si se especifica Combined, los registros se
Ordered generarán para cada combinación de valores
del conjunto y valores mínimos y máximos. El
número de registros generados será igual al
producto del número de valores de cada
campo. Si se especifica Ordered, se tomará un
valor de cada columna para cada registro con
el fin de generar una fila de datos. El número
de registros generados será igual al número
más grande de valores asociados a un campo.
Los campos que tengan menos valores de
datos se rellenarán con valores nulos.
values Nota: Esta propiedad ya no se utiliza, y no
debe usarse; en su lugar, se usa
[Link].
Propiedades de variablefilenode
El nodo Archivo variable lee datos desde los archivos de texto de campo libre, esto es,
campos cuyos registros contienen un número constante de campos pero un número variado
de caracteres. Este nodo resulta también útil para los archivos con texto de cabecera de
longitud fija y determinados tipos de anotaciones.
Ejemplo
Ejemplo
node = [Link]("xmlimport", "My node")
[Link]("full_filename", "c:/import/[Link]")
[Link]("records", "/author/name")
Tabla 59. propiedades de xmlimportnode.
propiedades de xmlimportnode Tipo de datos Descripción de la propiedad
read single Lee un único archivo de datos (valor
directorio predeterminado) o todos los archivos XML de
un directorio.
recurse tag Especifica si leer además archivos XML de
todos los subdirectorios del directorio
especificado.
full_filename cadena (obligatorio) Ruta completa y nombre de
archivo del archivo XML a importar (si read =
single).
directory_name cadena (obligatorio) Ruta completa y nombre del
directorio desde el que importar los archivos
XML (si read = directory).
full_schema_filename cadena Ruta completa y nombre de archivo del
archivo XSD o DTD desde el que leer la
estructura XML. Si omite este parámetro, se
leerá la estructura desde el archivo de origen
XML.
records cadena Expresión XPath ([Link]. /author/name) para
definir el límite del registro. Cada vez que este
elemento se encuentra en el archivo de origen
se crea un nuevo registro.
mode read Lee todos los datos (valor predeterminado) o
specify especifica qué elementos leer.
campos Lista de elementos (elementos y atributos) para
importar. Cada elemento de la lista es una
expresión XPath.
Propiedades de dataviewimport
El nodo Vista de datos importa datos de Vista de datos en IBM SPSS Modeler.
Ejemplo
Ejemplo
node = [Link]("append", "My node")
[Link]("match_by", "Name")
[Link]("match_case", True)
[Link]("include_fields_from", "All")
[Link]("create_tag_field", True)
[Link]("tag_field_name", "Append_Flag")
Tabla 61. propiedades de appendnode.
Propiedad de appendnode Tipo de datos Descripción de la propiedad
match_by Position Se pueden añadir conjuntos de datos basándose
Name en la posición que tienen los campos en el origen
de datos principal o el nombre de los campos en
los conjuntos de datos de entrada.
match_case tag Activa la coincidencia de mayúsculas y
minúsculas al hacer coincidir nombres de
campos.
include_fields_from Main
Todos
create_tag_field tag
tag_field_name cadena
propiedades de aggregatenode
El nodo Agregar reemplaza una secuencia de registros de entrada con registros de salida
agregados y resumidos.
Ejemplo
node = [Link]("aggregate", "My node")
# dbnode es un nodo de importación de base de datos configurado
[Link](dbnode, node)
[Link]("contiguous", True)
[Link]("keys", ["Drug"])
[Link]("aggregates", "Age", ["Sum", "Mean"])
107
[Link]("inc_record_count", True)
[Link]("count_field", "index")
[Link]("extension", "Aggregated_")
[Link]("add_as", "Prefix")
Tabla 62. propiedades de aggregatenode.
Propiedad de aggregatenode Tipo de datos Descripción de la propiedad
keys lista Enumera los campos que se pueden usar como
claves en la agregación. Por ejemplo, si Sexo y
Región son los campos clave, cada combinación
exclusiva de V y M con las regiones N y S (cuatro
combinaciones exclusivas) tendrá un registro
agregado.
contiguous tag Seleccione esta opción si sabe que todos los
registros con los mismos valores clave se
agrupan en la entrada (por ejemplo, si la entrada
se clasifica en los campos clave). Con ello puede
mejorar el rendimiento.
aggregates Enumera los campos numéricos cuyos valores se
añadirán, así como los modos de agregación
elegidos.
aggregate_exprs Propiedad con clave que aplica claves al nombre
de campo derivado con la expresión agregada
utilizada para calcularla. Por ejemplo:
[Link]
("aggregate_exprs", "Na_MAX", "MAX(’Na’)")
extensión cadena Especifica un prefijo o sufijo para campos
agregados duplicados (consulte un ejemplo a
continuación).
add_as Suffix
Prefix
inc_record_count tag Crea un campo adicional que indica la cantidad
de registros de entrada agregados para
conformar cada registro agregado.
count_field cadena Especifica el nombre del campo de recuento de
registros.
allow_approximation Booleana Permite la aproximación de estadísticas de
ordenación cuando se realiza la agregación en
Analytic Server
bin_count entero Especifica el número de intervalos a utilizar en la
aproximación
propiedades de balancenode
El nodo Equilibrar corrige los desequilibrios de un conjunto de datos para que cumpla una
condición determinada. La directiva de equilibrado ajusta la proporción de registros si una
condición es verdadera por el factor determinado.
Ejemplo
Nota: Si las cadenas (que utilizan comillas dobles) están incrustadas en la expresión, han de estar
precedidas del carácter de escape " \ ". El carácter " \ " es también el carácter de continuación de línea,
que puede utilizar para alinear los argumentos para mayor claridad.
Propiedades cplexoptnode
El nodo Optimización de CPLEX proporciona la capacidad de utilizar la optimización basada
en CPLEX (matemática compleja) a través de un archivo de modelo OPL (Optimization
Programming Language - Lenguaje de programación de optimización). Esta funcionalidad
está disponible en el producto IBM Analytical Decision Management, pero ahora también
puede utilizar el nodo CPLEX en SPSS Modeler sin necesitar IBM Analytical Decision
Management.
Propiedades derive_stbnode
El nodo Cajas-espacio-tiempo deriva Cajas-espacio-tiempo de los campos latitud, longitud e
indicación de fecha y hora. Las Cajas-espacio-tiempo también pueden identificarse como
lugares comunes.
Ejemplo
node = [Link]().createAt("derive_stb", "My node", 96, 96)
propiedades de distinctnode
El nodo Distinguir se puede usar para eliminar registros duplicados pasando el primero de
los registros distintos a la ruta de datos o descartando el primer registro y pasando cualquier
duplicado a la ruta de datos en su lugar.
Ejemplo
node = [Link]("distinct", "My node")
[Link]("mode", "Include")
[Link]("fields", ["Age" "Sex"])
[Link]("keys_pre_sorted", True)
Tabla 66. propiedades de distinctnode.
Propiedad de distinctnode Tipo de datos Descripción de la propiedad
mode Incluir Se puede incluir el primer nodo distinto en la
Descartar ruta o descartar el primer nodo distinto y pasar
en su lugar todos los registros duplicados a la
ruta de datos.
grouping_fields lista Enumera los campos utilizados para determinar
si los registros son idénticos.
Nota: Esta propiedad está en desuso desde IBM
SPSS Modeler 16 y posterior.
composite_value Intervalo estructurado Vea el ejemplo que se muestra a continuación.
composite_values Intervalo estructurado Vea el ejemplo que se muestra a continuación.
Ejemplos:
[Link]("composite_value", "Age", ["First"])
[Link]("composite_value", "Age", ["last"])
[Link]("composite_value", "Age", ["Total"])
[Link]("composite_value", "Age", ["Average"])
[Link]("composite_value", "Age", ["Min"])
[Link]("composite_value", "Age", ["Max"])
[Link]("composite_value", "Date", ["Earliest"])
[Link]("composite_value", "Date", ["Latest"])
[Link]("composite_value", "Code", ["FirstAlpha"])
[Link]("composite_value", "Code", ["LastAlpha"])
Las opciones personalizadas requieren más de un argumento, añadidos como una lista, por ejemplo:
[Link]("composite_value", "Name", ["MostFrequent", "FirstRecord"])
[Link]("composite_value", "Date", ["LeastFrequent", "LastRecord"])
[Link]("composite_value", "Pending", ["IncludesValue", "T", "F"])
[Link]("composite_value", "Marital", ["FirstMatch", "Married", "Divorced",
"Separated"])
[Link]("composite_value", "Code", ["Concatenate"])
[Link]("composite_value", "Code", ["Concatenate", "Space"])
[Link]("composite_value", "Code", ["Concatenate", "Comma"])
[Link]("composite_value", "Code", ["Concatenate", "UnderScore"])
Propiedades de extensionprocessnode
process_script = """
import [Link]
from [Link] import *
cxt = [Link]()
if [Link]():
_schema = StructType([StructField("Age", LongType(), nullable=True), \
StructField("Sex", StringType(), nullable=True), \
StructField("BP", StringType(), nullable=True), \
StructField("Na", DoubleType(), nullable=True), \
StructField("K", DoubleType(), nullable=True), \
StructField("Drug", StringType(), nullable=True)])
[Link](_schema)
else:
df = [Link]()
print [Link][:]
_newDF = [Link]("Age","Sex","BP","Na","K","Drug")
print _newDF.dtypes[:]
[Link](_newDF)
"""
[Link]("python_syntax", process_script)
Ejemplo de R
#### Ejemplo de script de R
[Link]("syntax_type", "R")
[Link]("r_syntax", """day<-[Link](modelerData$dob, format="%Y-%m-%d")
next_day<-day + 1
modelerData<-cbind(modelerData,next_day)
var1<-c(fieldName="Next day",fieldLabel="",fieldStorage="date",fieldMeasure="",fieldFormat="",
fieldRole="")
modelerDataModel<-[Link](modelerDataModel,var1)""")
propiedades de mergenode
El nodo Fundir toma varios registros de entrada y crea un registro de salida único que
contiene todos o algunos de los campos de entrada. Es útil para fusionar datos desde
diferentes orígenes, como datos de clientes internos y datos demográficos adquiridos.
Ejemplo
node = [Link]("merge", "My node")
# supongamos que customerdata y salesdata son nodos de importación de base de datos configurados
[Link](customerdata, node)
[Link](salesdata, node)
[Link]("method", "Keys")
[Link]("key_fields", ["id"])
[Link]("common_keys", True)
[Link]("join", "PartialOuter")
[Link]("outer_join_tag", "2", True)
[Link]("outer_join_tag", "4", True)
[Link]("single_large_input", True)
[Link]("single_large_input_tag", "2")
[Link]("use_existing_sort_keys", True)
[Link]("existing_sort_keys", [["id", "Ascending"]])
propiedades rfmaggregatenode
El nodo Adición de RFM (actualidad, frecuencia, monetario) permite tomar datos de
transacciones históricas de clientes, deshacerse de los datos no utilizados y combinar todos
los datos de transacciones restantes en una única fila que indica cuándo hizo negociaciones
con los clientes por última vez, cuántas transacciones hicieron y el valor monetario total de
dichas transacciones.
Ejemplo
node = [Link]("rfmaggregate", "My node")
[Link]("relative_to", "Fixed")
[Link]("reference_date", "2007-10-12")
[Link]("id_field", "CardID")
[Link]("date_field", "Date")
[Link]("value_field", "Amount")
[Link]("only_recent_transactions", True)
[Link]("transaction_date_after", "2000-10-01")
Tabla 69. propiedades rfmaggregatenode.
propiedades rfmaggregatenode Tipo de datos Descripción de la propiedad
relative_to Fixed Especifica la fecha a partir de la que se calculará
Today la actualidad de las transacciones.
reference_date date Sólo está disponible si se selecciona Fixed en
relative_to.
contiguous tag Si los datos se han clasificado previamente de
forma que todos los registros con el mismo ID
aparecen en la ruta de datos, al seleccionar esta
opción acelerará el procesamiento.
id_field campo Especifica el campo que desea utilizar para
identificar el cliente y sus transacciones.
date_field campo Especifica el campo de fecha que se utilizará
para calcular la actualidad.
value_field campo Especifica el campo que se utilizará para calcular
el valor monetario.
extensión cadena Especifica un prefijo o sufijo para campos
agregados duplicados.
add_as Suffix Especifica si la extensión se debe añadir como
Prefix sufijo o prefijo.
discard_low_value_records tag Permite utilizar la configuración
discard_records_below.
Propiedades de Rprocessnode
El nodo Transformación R le permite tomar datos de una
ruta de IBM(r) SPSS(r) Modeler y modificar los datos
utilizando su propio script R personalizado. Una vez
modificados los datos, se devuelven a la cadena.
Ejemplo
node = [Link]("rprocess", "My node")
[Link]("custom_name", "my_node")
[Link]("syntax", """day<-[Link](modelerData$dob, format="%Y-%m-%d")
next_day<-day + 1
modelerData<-cbind(modelerData,next_day)
var1<-c(fieldName="Next day",fieldLabel="",fieldStorage="date",fieldMeasure="",fieldFormat="",
fieldRole="")
modelerDataModel<-[Link](modelerDataModel,var1)""")
[Link]("convert_datetime", "POSIXct")
propiedades de samplenode
El nodo Muestrear selecciona un subconjunto de registros. Se admite una variedad de tipos
de muestras, entre las que se incluyen las muestras estratificadas, agrupadas en clústeres y no
aleatorias (estructuradas). El muestreo puede ser de gran utilidad para mejorar el rendimiento
y para seleccionar grupos de registros o transacciones relacionadas para un análisis.
Ejemplo
/* Create two Sample nodes to extract
different samples from the same data */
Complex
mode Incluir Incluye o descarta los registros que reúnan la
Descartar condición especificada.
sample_type Primero Especifica el método de muestreo.
OneInN
RandomPct
first_n entero Se incluirán o descartarán los registros hasta el
punto de corte especificado.
propiedades de selectnode
El nodo Seleccionar selecciona o descarta un subconjunto de registros de la ruta de datos en
función de una condición específica. Por ejemplo, podría seleccionar los registros que
pertenezcan a una región de ventas determinada.
Ejemplo
node = [Link]("select", "My node")
[Link]("mode", "Include")
[Link]("condition", "Age < 18")
Tabla 72. propiedades de selectnode.
Propiedad de selectnode Tipo de datos Descripción de la propiedad
mode Incluir Especifica si incluir o descartar los registros
Descartar seleccionados.
condition cadena Condición para incluir o descartar registros.
propiedades de sortnode
Los nodos Ordenar organizan registros en orden ascendente o descendente atendiendo a los
valores de uno o varios campos.
Ejemplo
node = [Link]("sort", "My node")
[Link]("keys", [["Age", "Ascending"], ["Sex", "Descending"]])
[Link]("default_ascending", False)
[Link]("use_existing_keys", True)
[Link]("existing_keys", [["Age", "Ascending"]])
Tabla 73. propiedades de sortnode.
Propiedad de sortnode Tipo de datos Descripción de la propiedad
keys lista Especifica los campos que desea ordenar. Si no se
especifica ninguna dirección, se utilizará la
predeterminada.
default_ascending tag Especifica el orden de clasificación
predeterminado.
Propiedades de spacetimeboxes
Las cajas-espacio-tiempo (STB) son una extensión de las ubicaciones espaciales demarcadas
mediante Geohash. En concreto, una STB es una cadena alfanumérica que representa una
región de forma regular de espacio y tiempo.
Hangouts
latitude_field campo
longitude_field campo
timestamp_field campo
Suffix
hangout_density densidad Densidad única (ver más arriba)
id_field campo
qualifying_duration 1DAY Esto debe ser una serie.
12HOURS
8HOURS
6HOURS
4HOURS
2HOURS
1HOUR
30MIN
15MIN
10MIN
5MIN
2MIN
1MIN
30SECS
15SECS
10SECS
5SECS
2SECS
1SECS
Propiedades streamingtimeseries
El nodo Serie temporal de modalidad continua crea y puntúa modelos de serie temporal en
un solo paso.
Nota: Este nodo Serie temporal de modalidad continua sustituye el nodo Resolución de TS
original que estaba en desuso en la versión 18 de SPSS Modeler.
Ejemplo
stream = [Link]()
varfilenode = [Link]("variablefile", "File", 96, 96)
[Link]("full_filename", "$CLEO/DEMOS/DRUG1n")
node = [Link]("anonymize", "My node", 192, 96)
# Anonimizar nodo requiere los campos de entrada al establecer los valores
[Link](varfilenode, node)
[Link]("enable_anonymize", "Age", True)
[Link]("transformation", "Age", "Random")
[Link]("set_random_seed", "Age", True)
[Link]("random_seed", "Age", 123)
[Link]("enable_anonymize", "Drug", True)
[Link]("use_prefix", "Drug", True)
[Link]("prefix", "Drug", "myprefix")
Tabla 77. propiedades de anonymizenode
Propiedades de anonymizenode Tipo de datos Descripción de la propiedad
enable_anonymize flag Cuando se establece en True, activa la anonimización de los
valores de los campos (equivale a seleccionar Sí para dicho
campo en la columna Anonimizar valores).
use_prefix flag Cuando se establece en True, se utilizará un prefijo
personalizado, si es que se ha establecido uno. Se aplica a los
campos que se anonimizarán mediante el método Hash y es
equivalente a elegir el botón de radio Personalizado en el
cuadro de diálogo Reemplazar valores correspondiente a dicho
campo.
prefix cadena Equivale a escribir un prefijo en el cuadro de texto del cuadro
de diálogo Reemplazar valores. El prefijo predeterminado es el
valor predeterminado, si no se ha especificado otra cosa.
transformation Random Determina si los parámetros de transformación que se aplican a
Fixed un campo anonimizado mediante el método Transformar serán
aleatorios o fijos.
set_random_seed flag Cuando se establece en True, se utilizará el valor inicial
especificado (si transformation también se ha establecido en
Random).
random_seed entero Cuando set_random_seed se establece en True, esta es la
semilla para el número aleatorio.
scale número Cuando transformation se establece en Fixed, se utiliza este
valor para "scale by" (escalar por). El valor máximo de la escala
suele ser 10, pero puede reducirse para evitar desbordamientos.
133
Tabla 77. propiedades de anonymizenode (continuación)
Propiedades de anonymizenode Tipo de datos Descripción de la propiedad
translate número Cuando transformation se establece en Fixed, se utiliza este
valor para "translate" (convertir). El valor máximo de traslación
suele ser 1000, pero puede reducirse para evitar
desbordamientos.
properties autodataprepnode
El nodo de preparación automática de datos (ADP) puede analizar sus datos e identificar los
valores fijos, cribar los campos problemáticos o que no serán útiles y derivar nuevos atributos
cuando sea necesario y mejorar el rendimiento mediante técnicas de cribado y muestreo
inteligente. Puede utilizar el nodo de forma totalmente automática, permitiendo que el nodo
seleccione y aplique valores fijos, o bien puede tener una vista previa de los cambios antes de
que se apliquen y aceptarlos o rechazarlos.
Ejemplo
node = [Link]("autodataprep", "My node")
[Link]("objective", "Balanced")
[Link]("excluded_fields", "Filter")
[Link]("prepare_dates_and_times", True)
[Link]("compute_time_until_date", True)
[Link]("reference_date", "Today")
[Link]("units_for_date_durations", "Automatic")
Tabla 78. properties autodataprepnode
properties autodataprepnode Tipo de datos Descripción de la propiedad
objective Balanced
Speed
Exactitud
Personalizado
custom_fields flag Si es verdadero, le permite especificar el
objetivo, la entrada y otros campos del nodo
actual. Si es falso, se utiliza la configuración
actual de un nodo Tipo situado en un punto
anterior de la ruta.
target campo Especifica un campo de objetivo único.
inputs [field1 ... fieldN] Campos de entrada o predictor utilizados por
el modelo.
use_frequency flag
frequency_field campo
use_weight flag
weight_field campo
excluded_fields Filter
Ninguno
if_fields_do_not_match StopExecution
ClearAnalysis
prepare_dates_and_times flag Controla el acceso a todos los campos de
fecha y hora
compute_time_until_date flag
propiedades de astimeintervalsnode
Utilice el nodo Intervalos de tiempo para especificar intervalos y derive un nuevo campo de
tiempo para el cálculo y la previsión. Se admite una gama completa de intervalos de tiempo
que abarca desde segundos a años.
propiedades de binningnode
El nodo Intervalos crea automáticamente nuevos campos nominales (conjunto) en función de
los valores de uno o más campos continuos (rango numérico) existentes. Por ejemplo, puede
transformar un campo de ingresos continuo en un campo categórico nuevo que contenga
grupos de ingresos como desviaciones desde la media. Una vez creados los intervalos para el
campo nuevo, puede generar un nodo Derivar en función de los puntos de corte.
Ejemplo
node = [Link]("binning", "My node")
[Link]("fields", ["Na", "K"])
[Link]("method", "Rank")
[Link]("fixed_width_name_extension", "_binned")
[Link]("fixed_width_add_as", "Suffix")
[Link]("fixed_bin_method", "Count")
[Link]("fixed_bin_count", 10)
[Link]("fixed_bin_width", 3.5)
[Link]("tile10", True)
propiedades de derivenode
El nodo Derivar modifica los valores de datos o crea campos nuevos desde uno o más
campos existentes. Crea campos del tipo fórmula, marca, nominal, estado, recuento y
condicional.
Ejemplo 1
# Crear y configurar un nodo de campo Derivar marca
node = [Link]("derive", "My node")
[Link]("new_name", "DrugX_Flag")
[Link]("result_type", "Flag")
[Link]("flag_true", "1")
[Link]("flag_false", "0")
[Link]("flag_expr", "’Drug’ == \"drugX\"")
Ejemplo 2
Este script presupone que existen dos columnas numéricas denominadas XPos e YPos que representan las
coordenadas X e Y de un punto (por ejemplo, donde se ha producido un evento). El script crea un nodo
Derivar que calcula una columna geoespacial de coordenadas X e Y que representan dicho punto en un
sistema de coordenadas específico:
stream = [Link]()
# Otro código de configuración de ruta
node = [Link]("derive", "Location", 192, 96)
[Link]("new_name", "Location")
[Link]("formula_expr", "[’XPos’, ’YPos’]")
[Link]("formula_type", "Geospatial")
# Ahora que hemos definido el tipo de medición general, defina los
# detalles del objeto geoespacial
[Link]("geo_type", "Point")
[Link]("has_coordinate_system", True)
[Link]("coordinate_system", "ETRS_1989_EPSG_Arctic_zone_5-47")
Tabla 81. propiedades de derivenode
Propiedad de derivenode Tipo de datos Descripción de la propiedad
new_name cadena Nombre del campo nuevo.
propiedades de ensemblenode
El nodo Conjunto combina dos o más nugget de modelo para obtener predicciones más
precisas que pueden conseguirse de cualquier modelo.
Ejemplo
# Crear y configurar un nodo Conjunto
# Utilizar este nodo con los modelos en demos\streams\pm_module\pm_binaryclassifier.str
node = [Link]("ensemble", "My node")
[Link]("ensemble_target_field", "response")
[Link]("filter_individual_model_output", False)
[Link]("flag_ensemble_method", "ConfidenceWeightedVoting")
[Link]("flag_voting_tie_selection", "HighestConfidence")
Tabla 82. propiedades de ensemblenode.
propiedades de ensemblenode Tipo de datos Descripción de la propiedad
ensemble_target_field campo Especifica el campo objetivo de todos
los modelos utilizados en el conjunto.
filter_individual_model_output tag Especifica si los resultados de
puntuación de los modelos
individuales se deben eliminar.
propiedades de fillernode
El nodo Rellenar sustituye valores de campos y cambia el almacenamiento. Puede sustituir los
valores en función de una condición CLEM, como @BLANK(@FIELD). También puede sustituir
todos los espacios vacíos o valores nulos por un valor específico. Un nodo Rellenar suelen
utilizarse junto con un nodo Tipo para sustituir valores perdidos.
Ejemplo
node = [Link]("filler", "My node")
[Link]("fields", ["Age"])
[Link]("replace_mode", "Always")
[Link]("condition", "(\"Age\" > 60) and (\"Sex\" = \"M\"")
[Link]("replace_with", "\"old man\"")
Tabla 83. propiedades de fillernode
Propiedad de fillernode Tipo de datos Descripción de la propiedad
campos lista Campos del conjunto de datos cuyos valores
se van a examinar y sustituir.
propiedades de filternode
El nodo Filtrar filtra (descarta) campos, vuelve a nombrar campos y correlaciona campos de
nodo de origen a otro.
Ejemplo
node = [Link]("filter", "My node")
[Link]("default_include", True)
[Link]("new_name", "Drug", "Chemical")
[Link]("include", "Drug", False)
Esto hará que el nodo pase los campos Edad y Sexo y descarte el resto. Ahora, imagine que ejecuta de
nuevo el mismo script, pero designa dos campos diferentes:
node = [Link]().create("filter", "Filter")
[Link]("default_include", False)
# Incluir estos dos campos en la lista
for f in ["BP", "Na"]:
[Link]("include", f, True)
De esta forma, se añadirán dos campos más al filtro, de manera que pasan un total de cuatro campos
(Edad, Sexo, PS y Na). En otras palabras, al volver a establecer el valor de default_include en False no se
restablecen automáticamente todos los campos.
Si lo desea, si ahora cambia default_include a True (ya sea usando un script o en el cuadro de diálogo
del nodo Filtrar), cambiará el comportamiento de forma que los cuatro campos enumerados
anteriormente no se incluirían, sino que quedarían descartados. Si no está seguro, se recomienda
experimentar con los controles del cuadro de diálogo del nodo Filtrar para entender esta interacción.
propiedades de historynode
El nodo Historial se utiliza para crear campos nuevos que contienen datos de los campos de
registros anteriores. Los nodos Historial se suelen utilizar para los datos secuenciales, como
los datos de series temporales. Antes de utilizar un nodo Historial, puede desear ordenar los
datos utilizando un nodo Ordenar.
Ejemplo
node = [Link]("history", "My node")
[Link]("fields", ["Drug"])
[Link]("offset", 1)
[Link]("span", 3)
[Link]("unavailable", "Discard")
[Link]("fill_with", "undef")
Tabla 85. propiedades de historynode
Propiedad de historynode Tipo de datos Descripción de la propiedad
campos lista Campos para los que desea un historial.
offset número Especifica el último registro anterior al
registro actual desde el que desea extraer
valores del campo histórico.
span número Especifica el número de registros anteriores
de los que desea extraer valores.
unavailable Descartar Para tratar registros que no tienen valores de
Leave historial, suele hacer referencia a los primeros
Fill registros (en la parte superior del conjunto de
datos), de los que no hay registros previos
que utilizar como historial.
fill_with String Especifica un valor o cadena que utilizar en el
Number caso de los registros en los que no existen
valores de historial disponibles.
Ejemplo
node = [Link]("partition", "My node")
[Link]("create_validation", True)
[Link]("training_size", 33)
[Link]("testing_size", 33)
[Link]("validation_size", 33)
[Link]("set_random_seed", True)
[Link]("random_seed", 123)
[Link]("value_mode", "System")
Tabla 86. propiedades de partitionnode
Propiedad de partitionnode Tipo de datos Descripción de la propiedad
new_name cadena Nombre del campo de partición generado por el
nodo.
create_validation flag Especifica si se debe crear una partición de
validación.
training_size entero Porcentaje de registros (0-100) que se van a
asignar a la partición de entrenamiento.
testing_size entero Porcentaje de registros (0-100) que se van a
asignar a la partición de comprobación.
validation_size entero Porcentaje de registros (0-100) que se van a
asignar a la partición de entrenamiento. Se
ignora si no se crea una partición de validación.
training_label cadena Etiqueta para la partición de entrenamiento.
testing_label cadena Etiqueta para la partición de comprobación.
validation_label cadena Etiqueta para la partición de validación. Se
ignora si no se crea una partición de validación.
value_mode Sistema Especifica los valores utilizados para representar
SystemAndLabel cada partición en los datos. Por ejemplo, el
Label entero del sistema 1, la etiqueta Entrenamiento o
una combinación de los dos, 1_Entrenamiento,
pueden representar la muestra de entrenamiento.
set_random_seed Booleana Especifica si se debe utilizar una semilla aleatoria
especificada por el usuario.
random_seed entero Valor de semilla aleatoria especificada por el
usuario. Para que se pueda utilizar este valor,
set_random_seed se debe establecer en True.
enable_sql_generation Booleana Especifica si se utiliza la retrotracción SQL para
asignar registros a particiones.
propiedades de reclassifynode
El nodo Reclasificar transforma un conjunto de valores categóricos en otro. La reclasificación
es útil para contraer categorías o reagrupar datos para su análisis.
Ejemplo
node = [Link]("reclassify", "My node")
[Link]("mode", "Multiple")
[Link]("replace_field", True)
[Link]("field", "Drug")
[Link]("new_name", "Chemical")
[Link]("fields", ["Drug", "BP"])
[Link]("name_extension", "reclassified")
[Link]("add_as", "Prefix")
[Link]("reclassify", "drugA", True)
[Link]("use_default", True)
[Link]("default", "BrandX")
[Link]("pick_list", ["BrandX", "Placebo", "Generic"])
Tabla 87. propiedades de reclassifynode
Propiedad de reclassifynode Tipo de datos Descripción de la propiedad
mode Single Single reclasifica las categorías de un campo.
Múltiples Multiple activa las opciones que permiten la
transformación de varios campos al mismo
tiempo.
replace_field flag
field cadena Sólo se utiliza en modo Single.
new_name cadena Sólo se utiliza en modo Single.
campos [campo1 campo2 ... Sólo se utiliza en modo Multiple.
campon]
name_extension cadena Sólo se utiliza en modo Multiple.
add_as Suffix Sólo se utiliza en modo Multiple.
Prefix
reclasificar cadena Propiedad estructurada para valores de
campos.
use_default flag Utiliza el valor predeterminado.
valor predeterminado cadena Especifica un valor predeterminado.
propiedades de reordernode
El nodo Reorg. campos define el orden natural utilizado para mostrar los campos en la parte
posterior de la ruta. Este orden afecta a la visualización de los campos en diversas
ubicaciones, como las tablas, las listas y el selector de campos. Esta operación resulta útil al
trabajar con conjuntos de datos amplios que hacen más visibles los campos de interés.
Ejemplo
node = [Link]("reorder", "My node")
[Link]("mode", "Custom")
[Link]("sort_by", "Storage")
[Link]("ascending", False)
[Link]("start_fields", ["Age", "Cholesterol"])
[Link]("end_fields", ["Drug"])
Tabla 88. propiedades de reordernode
Propiedad de reordernode Tipo de datos Descripción de la propiedad
mode Custom Se pueden ordenar los valores de forma
Automático automática o especificar un orden
personalizado.
sort_by Name
Tipo
Storage
ascending flag
start_fields [campo1 campo2 ... Los campos nuevos se han insertado después
campon] de estos campos.
end_fields [campo1 campo2 ... Los campos nuevos se han insertado antes de
campon] estos campos.
propiedades de reprojectnode
En SPSS Modeler, elementos como las funciones espaciales Creador de expresiones, el nodo
de Predicción espacio-temporal (STP) y el nodo Visualización de mapas utilizan el sistema de
coordenadas proyectado. Utilice el nodo Reproyectar para cambiar el sistema de coordenadas
de los datos que importa y que utilizan un sistema de coordenadas geográficas.
propiedades de restructurenode
El nodo Reestructurar convierte un campo nominal o marca en un grupo de campos que se
puede rellenar con los valores todavía de otro campo. Por ejemplo, para un campo
determinado llamado tipo de pago, con valores de crédito, efectivo, y débito, se crearían tres
campos nuevos (crédito, efectivo, débito), que contendría cada uno el valor del pago real
realizado.
Ejemplo
node = [Link]("restructure", "My node")
[Link]("fields_from", "Drug", ["drugA", "drugX"])
[Link]("include_field_name", True)
[Link]("value_mode", "OtherFields")
[Link]("value_fields", ["Age", "BP"])
Tabla 90. propiedades de restructurenode
Propiedad de restructurenode Tipo de datos Descripción de la propiedad
fields_from [category category
category]
all
include_field_name flag Indica si se debe usar el nombre del campo en
el nombre de campo reestructurado.
value_mode OtherFields Indica el modo de definir los valores para los
Flags campos reestructurados. Con OtherFields,
debe especificar los campos que se van a usar
(consulte a continuación). Con Flags, los
valores son marcas numéricas.
value_fields lista Es necesario en caso de que value_mode sea
OtherFields. Especifica los campos que se van
a usar como campos de valores.
propiedades de rfmanalysisnode
El nodo Análisis de RFM (actualidad, frecuencia, monetario) permite determinar
cuantitativamente qué clientes son los mejores examinando cuándo ha sido la compra más
reciente de un cliente (actualidad), cuántas veces suele comprar (frecuencia) y cuánto gasta el
cliente en todas las transacciones (valor monetario).
Ejemplo
node = [Link]("rfmanalysis", "My node")
[Link]("recency", "Recency")
[Link]("frequency", "Frequency")
[Link]("monetary", "Monetary")
recalculate_bins Always
IfNecessary
add_outliers flag Sólo está disponible si recalculate_bins se
define como IfNecessary. Si se selecciona, los
registros por debajo del intervalo más inferior se
añaden al intervalo inferior y los registros por
encima, se añaden al intervalo superior.
binned_field Recency
Frequency
Monetary
recency_thresholds valor valor Sólo está disponible si recalculate_bins se
define como Siempre. Especifica los umbrales
superior e inferior de los intervalos de
actividades recientes. El umbral superior de un
intervalo se utiliza como el umbral inferior del
siguiente, por ejemplo, [10 30 60] definiría dos
intervalos, el primer intervalo con los umbrales
superior e inferior de 10 y 30, con los umbrales
del segundo intervalo de 30 y 60.
frequency_thresholds valor valor Sólo está disponible si recalculate_bins se
define como Siempre.
monetary_thresholds valor valor Sólo está disponible si recalculate_bins se
define como Siempre.
Ejemplo
node = [Link]("settoflag", "My node")
[Link]("fields_from", "Drug", ["drugA", "drugX"])
[Link]("true_value", "1")
[Link]("false_value", "0")
[Link]("use_extension", True)
[Link]("extension", "Drug_Flag")
[Link]("add_as", "Suffix")
[Link]("aggregate", True)
[Link]("keys", ["Cholesterol"])
Tabla 92. propiedades de settoflagnode
Propiedad de settoflagnode Tipo de datos Descripción de la propiedad
fields_from [category category
category]
all
true_value cadena Especifica el valor para verdadero utilizado
por el nodo al configurar una marca. El valor
predeterminado es T (del inglés 'True').
false_value cadena Especifica el valor para falso utilizado por el
nodo al configurar una marca. El valor
predeterminado es F (del inglés 'False').
use_extension flag Utiliza una extensión como sufijo o prefijo
para el nuevo campo de marca.
extensión cadena
add_as Suffix Especifica si la extensión es un sufijo o un
Prefix prefijo.
aggregate flag Agrupa registros en función de campos clave.
Si algún registro se establece como verdadero,
se activarán todos los campos de marca de un
grupo.
keys lista Campos clave.
propiedades de statisticstransformnode
El nodo Transformación Statistics ejecuta una selección de comandos de sintaxis de IBM SPSS
Statistics en los orígenes de datos de IBM SPSS Modeler. Este nodo requiere una copia de
IBM SPSS Statistics con licencia.
Ejemplo
node = [Link]("timeintervals", "My node")
[Link]("interval_type", "SecondsPerDay")
[Link]("days_per_week", 4)
[Link]("week_begins_on", "Tuesday")
[Link]("hours_per_day", 10)
[Link]("day_begins_hour", 7)
[Link]("day_begins_minute", 5)
[Link]("day_begins_second", 17)
[Link]("mode", "Label")
[Link]("year_start", 2005)
[Link]("month_start", "January")
[Link]("day_start", 4)
[Link]("pad", "AGE", "MeanOfRecentPoints")
[Link]("agg_mode", "Specify")
[Link]("agg_set_default", "Last")
Tabla 93. propiedades de timeintervalsnode.
Propiedad de timeintervalsnode Tipo de datos Descripción de la propiedad
interval_type Ninguno
Períodos
CyclicPeriods
Años
Trimestres
Meses
DaysPerWeek
DaysNonPeriodic
HoursPerDay
HoursNonPeriodic
MinutesPerDay
MinutesNonPeriodic
SecondsPerDay
SecondsNonPeriodic
mode Label Determina si desea etiquetar los registros de
Create manera consecutiva o crear la serie según
una fecha, marca de tiempo o campo de
tiempo concretos.
campo campo Al crear la serie a partir de los datos,
especifica el campo que informa de la fecha
u hora de cada registro.
period_start entero Especifica el intervalo de inicio para
períodos o períodos cíclicos.
cycle_start entero Ciclo de inicio de los períodos cíclicos.
year_start entero En el caso de los tipos de intervalo que
procedan, el año en que el primer intervalo
tiene lugar.
Propiedades de transposenode
El nodo Transponer intercambia los datos en filas y columnas de manera que los registros se
conviertan en campos y los campos en registros.
Ejemplo
node = [Link]("transpose", "My node")
[Link]("transposed_names", "Read")
[Link]("read_from_field", "TimeLabel")
[Link]("max_num_fields", "1000")
[Link]("id_field_name", "ID")
Tabla 94. Propiedades de transposenode
Propiedad de transposenode Tipo de datos Descripción de la propiedad
transpose_method enum Especifica el método de transposición: Normal
(normal), CASE a VAR (casetovar) o VAR a
CASE (vartocase).
transposed_names Prefix Propiedad para el método de transposición
Leer normal. Se pueden generar nuevos nombres de
campo automáticamente a partir de un prefijo
concreto o bien se pueden leer desde un campo
existente en los datos.
prefix string Propiedad para el método de transposición
normal.
num_new_fields integer Propiedad para el método de transposición
normal. Al usar un prefijo, especifica el número
máximo de campos nuevos que se van a crear.
read_from_field field Propiedad para el método de transposición
normal. Campo del que se leen los nombres.
Debe tratarse de un campo instanciado o, de lo
contrario, se producirá un error al ejecutar el
nodo.
max_num_fields integer Propiedad para el método de transposición
normal. Al leer nombres de un campo, especifica
un límite superior con el fin de evitar que se
genere un número desmesurado de campos.
propiedades de typenode
El nodo Tipo especifica propiedades y metadatos de campo. Por ejemplo, puede especificar
un nivel de medición (continuo, nominal, ordinal o marca) para cada campo, establecer las
opciones para gestionar valores perdidos y nulos del sistema, establecer el rol de un campo
con fines de modelado, especificar las etiquetas de valor y campo y especificar los valores de
un campo.
Ejemplo
node = [Link]("type", "My node", 50, 50)
[Link]("check", "Cholesterol", "Coerce")
[Link]("direction", "Drug", "Input")
[Link]("type", "K", "Range")
[Link]("values", "Drug", ["drugA", "drugB", "drugC", "drugD", "drugX",
"drugY", "drugZ"])
[Link]("null_missing", "BP", False)
Observe que en algunos casos puede que sea necesario instanciar totalmente el nodo Tipo para que otros
nodos funcionen adecuadamente, como, por ejemplo, la propiedad fields from del nodo Marcas.
Simplemente conecte un nodo Tabla y ejecútelo para instanciar los campos:
tablenode = [Link]("table", "Table node", 150, 50)
[Link](node, tablenode)
[Link](None)
[Link](tablenode)
Tabla 95. Propiedades de typenode.
Propiedad de
typenode Tipo de datos Descripción de la propiedad
dirección Input Propiedad con clave para los roles de los
Destino campos.
Both Nota: Los valores In y Out han quedado
Ninguno en desuso. Es posible que ya no puedan
Partition utilizarse en futuras versiones.
Split
Frequency
RecordID
type Range El nivel de medición del campo
Flag (anteriormente denominado el "tipo" de
Set campo). Si se establece type en
Sin tipo Default, se borrará cualquier
Discrete valor del parámetro values,
OrderedSet y si value_mode tiene el valor
Predeterminado Specify, se restablecerá en Read.
Si value_mode se establece en Pass
o Read, el establecimiento de type
no afectará a value_mode.
Nota: Los tipos de datos utilizados
internamente difieren de los que son
visibles en el nodo tipo. La
correspondencia es la siguiente: Range ->
Continuous Set - > Nominal OrderedSet ->
Ordinal Discrete- > Categorical
almacenamiento Desconocido Propiedad con clave de solamente lectura
Cadena para el tipo de almacenamiento de
Entero campos.
Real
Hora
Fecha
Marca de tiempo
check Ninguno Propiedad con clave para la comprobación
Nullify del rango y el tipo de campo.
Coerce
Descartar
Warn
Abort
Los campos opcionales, como un campo de superposición para gráficos, se pueden desactivar
estableciendo el valor de la propiedad en "" (cadena vacía), tal y como se muestra en el siguiente
ejemplo:
[Link]("color_field", "")
Especificación de colores
Los colores de los títulos, pies, fondos y etiquetas se pueden especificar mediante las cadenas
hexadecimales que comiencen con el símbolo almohadilla (#). Por ejemplo, para establecer el fondo del
gráfico en cielo azul, debe utilizar la siguiente instrucción:
[Link]("graph_background", "#87CEEB")
Aquí, los dos primeros dígitos, 87, especifican el contenido rojo, los dos del medio, CE, especifican el
contenido verde y los dos últimos, EB, el contenido azul. Cada dígito puede tomar un valor del rango 0-9
o A-F. Juntos, estos valores pueden especificar red-green-blue, o RGB o color.
163
Nota: Al especificar colores en RVA, puede utilizar el selector de campos en la interfaz de usuario para
determinar el código de color correcto. Basta con colocarse sobre el color para ver un texto con la
información deseada.
Propiedades de collectionnode
El nodo Colección muestra la distribución de valores de un campo numérico relativo a los
valores de otro. (Crea gráficos parecidos a los histogramas.) Es útil para ilustrar una variable
o un campo cuyos valores cambian con el tiempo. Con los gráficos 3D también puede incluir
un eje simbólico que muestra las distribuciones por categoría.
Ejemplo
node = [Link]("collection", "My node")
# Pestaña "Gráfico"
[Link]("three_D", True)
[Link]("collect_field", "Drug")
[Link]("over_field", "Age")
[Link]("by_field", "BP")
[Link]("operation", "Sum")
# Sección "Superponer"
[Link]("color_field", "Drug")
[Link]("panel_field", "Sex")
[Link]("animation_field", "")
# pestaña "Opciones"
[Link]("range_mode", "Automatic")
[Link]("range_min", 1)
[Link]("range_max", 100)
[Link]("bins", "ByNumber")
[Link]("num_bins", 10)
[Link]("bin_width", 5)
Tabla 97. propiedades de collectionnode
Propiedad de collectionnode Tipo de datos Descripción de la propiedad
over_field campo
over_label_auto flag
over_label cadena
collect_field campo
collect_label_auto flag
collect_label cadena
three_D flag
by_field campo
by_label_auto flag
by_label cadena
operation Sum
Media
Mín
Máx
SDev
color_field cadena
panel_field cadena
Propiedades de distributionnode
El nodo Distribución muestra las instancias de valores simbólicos (categóricos), como el tipo
de hipoteca o el género. Normalmente, podría usar el nodo Distribución para mostrar los
desequilibrios de los datos, que pueden rectificarse mediante el nodo Equilibrar antes de crear
un modelo.
Ejemplo
node = [Link]("distribution", "My node")
# Pestaña "Gráfico"
[Link]("plot", "Flags")
[Link]("x_field", "Age")
[Link]("color_field", "Drug")
[Link]("normalize", True)
[Link]("sort_mode", "ByOccurence")
[Link]("use_proportional_scale", True)
Tabla 98. propiedades de distributionnode
Propiedades de distributionnode Tipo de datos Descripción de la propiedad
plot SelectedFields
Flags
x_field campo
color_field campo Campo de superposición.
normalize flag
sort_mode ByOccurence
Alphabetic
use_proportional_scale flag
Ejemplo
node = [Link]("evaluation", "My node")
# Pestaña "Gráfico"
[Link]("chart_type", "Gains")
[Link]("cumulative", False)
[Link]("field_detection_method", "Name")
[Link]("inc_baseline", True)
[Link]("n_tile", "Deciles")
[Link]("style", "Point")
[Link]("point_type", "Dot")
[Link]("use_fixed_cost", True)
[Link]("cost_value", 5.0)
[Link]("cost_field", "Na")
[Link]("use_fixed_revenue", True)
[Link]("revenue_value", 30.0)
[Link]("revenue_field", "Age")
[Link]("use_fixed_weight", True)
[Link]("weight_value", 2.0)
[Link]("weight_field", "K")
Tabla 99. propiedades de evaluationnode.
Propiedad de evaluationnode Tipo de datos Descripción de la propiedad
chart_type Gains
Response
Lift
Profit
ROI
ROC
inc_baseline tag
field_detection_method Metadata
Name
use_fixed_cost tag
cost_value number
cost_field cadena
use_fixed_revenue tag
revenue_value number
revenue_field cadena
use_fixed_weight tag
weight_value number
weight_field campo
Nota: Si establece una propiedad que no es válida para el tipo de gráfico (por ejemplo, si especifica
y_field para un histograma), se ignora dicha propiedad.
Nota: En la IU, en la pestaña Detallado de muchos tipos de gráfico distintos, hay un campo Resumen;
los scripts no soportan dicho campo en la actualidad.
Ejemplo
node = [Link]("graphboard", "My node")
[Link]("graph_type", "Line")
[Link]("x_field", "K")
[Link]("y_field", "Na")
Propiedades de histogramnode
El nodo Histograma muestra las instancias de valores de los campos numéricos. Se suele
utilizar para explorar los datos antes de las manipulaciones y la generación de modelos. Al
igual que con el nodo Distribución, con frecuencia el nodo Histograma detecta desequilibrios
en los datos.
Ejemplo
node = [Link]("histogram", "My node")
# Pestaña "Gráfico"
[Link]("field", "Drug")
[Link]("color_field", "Drug")
[Link]("panel_field", "Sex")
[Link]("animation_field", "")
# pestaña "Opciones"
[Link]("range_mode", "Automatic")
[Link]("range_min", 1.0)
[Link]("range_max", 100.0)
[Link]("num_bins", 10)
[Link]("bin_width", 10)
[Link]("normalize", True)
[Link]("separate_bands", False)
Tabla 101. propiedades de histogramnode
Propiedad de histogramnode Tipo de datos Descripción de la propiedad
field campo
Propiedades de mapvisualization
El nodo Visualización de mapas puede aceptar varias conexiones de entrada y visualizar
datos geoespaciales en un mapa como una serie de capas. Cada capa es un único campo
geoespacial; por ejemplo, la capa base podría ser el mapa de un país, y por encima puede
tener una capa de carreteras, una capa de ríos y una capa de ciudades.
Nominal/Categórico:
v Modo
v Mín
v Máx
Distintivo:
v True si es verdadero
v False si es falso
custom_storage cadena Establece el tipo de almacenamiento general del
campo. El valor predeterminado es List. Si se ha
especificado List, los controles
custom_value_storage y list_depth siguientes
están inhabilitados.
custom_value_storage cadena Establece los tipos de almacenamiento de los
elementos de la lista, en lugar de los campos
como un todo. EL valor predeterminado es Real.
Propiedades de multiplotnode
El nodo G. múltiple crea un gráfico que muestra varios campos Y sobre un campo X único.
Los campos Y están representados como líneas coloreadas; cada uno equivale a un nodo
Gráfico con el estilo establecido en Línea y el Modo para X establecido en Ordenar. Los
gráficos múltiples son útiles cuando quiere explorar la fluctuación de varias variables a través
del tiempo.
Ejemplo
node = [Link]("multiplot", "My node")
# Pestaña "Gráfico"
[Link]("x_field", "Age")
[Link]("y_fields", ["Drug", "BP"])
[Link]("panel_field", "Sex")
# Sección "Superponer"
[Link]("animation_field", "")
[Link]("tooltip", "test")
[Link]("normalize", True)
[Link]("use_overlay_expr", False)
[Link]("overlay_expression", "test")
[Link]("records_limit", 500)
[Link]("if_over_limit", "PlotSample")
Tabla 103. propiedades de multiplotnode
Propiedad de multiplotnode Tipo de datos Descripción de la propiedad
x_field campo
y_fields lista
panel_field campo
animation_field campo
normalize flag
use_overlay_expr flag
Propiedades de plotnode
El nodo Gráfico muestra la relación entre los campos numéricos. Puede crear un gráfico
mediante puntos (un diagrama de dispersión) o líneas.
Ejemplo
node = [Link]("plot", "My node")
# Pestaña "Gráfico"
[Link]("three_D", True)
[Link]("x_field", "BP")
[Link]("y_field", "Cholesterol")
[Link]("z_field", "Drug")
# Sección "Superponer"
[Link]("color_field", "Drug")
[Link]("size_field", "Age")
[Link]("shape_field", "")
[Link]("panel_field", "Sex")
[Link]("animation_field", "BP")
[Link]("transp_field", "")
[Link]("style", "Point")
# Pestaña "Resultados"
[Link]("output_mode", "File")
[Link]("output_format", "JPEG")
[Link]("full_filename", "C:/temp/graph_output/plot_output.jpeg")
Tabla 104. propiedades de plotnode.
Propiedad de plotnode Tipo de datos Descripción de la propiedad
x_field campo Especifica una etiqueta personalizada para el eje x.
Disponible solamente para etiquetas.
y_field campo Especifica una etiqueta personalizada para el eje y.
Disponible solamente para etiquetas.
Propiedades de timeplotnode
El nodo Gráfico de tiempo muestra uno o más conjuntos de datos de series temporales.
Normalmente, primero se utilizaría un nodo Intervalos de tiempo para crear un campo
EtiquetaTiempo, que se utilizaría para etiquetar el eje x.
Ejemplo
node = [Link]("timeplot", "My node")
[Link]("y_fields", ["sales", "men", "women"])
[Link]("panel", True)
[Link]("normalize", True)
[Link]("line", True)
[Link]("smoother", True)
[Link]("use_records_limit", True)
[Link]("records_limit", 2000)
# Appearance settings
[Link]("symbol_size", 2.0)
Propiedades eplotnode
El nodo Gráfico electrónico (Beta) muestra la relación entre campos numéricos. Es similar al
nodo Gráfico, pero sus opciones difieren y su salida utiliza una nueva interfaz de gráficos
específica a este nodo. Utilice el nodo de nivel beta para probar las nuevas características de
realización de gráficos.
Propiedades tsnenode
t-SNE (vecino estocástico con t distribuida incorporado) es una herramienta para visualizar
datos de alta dimensión. Convierte afinidades de puntos de datos a probabilidades. Este nodo
t-SNE en SPSS Modeler se implementa en Python y requiere la biblioteca scikit-learn©
Python.
Propiedades de webnode
El nodo Malla muestra la fuerza de las relaciones entre los valores de dos o más campos
simbólicos (categóricos). El gráfico utiliza líneas de varios anchos para indicar la fuerza de la
conexión. Podría utilizar un nodo Malla, por ejemplo, para explorar las relaciones existentes
entre la compra de un conjunto de elementos en un sitio de comercio electrónico.
Ejemplo
node = [Link]("web", node "My ")
# Pestaña "Gráfico"
[Link]("use_directed_web", True)
[Link]("to_field", "Drug")
[Link]("fields", ["BP", "Cholesterol", "Sex", "Drug"])
[Link]("from_fields", ["BP", "Cholesterol", "Sex"])
[Link]("true_flags_only", False)
[Link]("line_values", "Absolute")
[Link]("strong_links_heavier", True)
# pestaña "Opciones"
[Link]("max_num_links", 300)
[Link]("links_above", 10)
[Link]("num_links", "ShowAll")
[Link]("discard_links_min", True)
[Link]("links_min_records", 5)
[Link]("discard_links_max", True)
[Link]("weak_below", 10)
[Link]("strong_above", 19)
[Link]("link_size_continuous", True)
[Link]("web_display", "Circular")
Tabla 108. propiedades de webnode
Propiedad de webnode Tipo de datos Descripción de la propiedad
use_directed_web flag
campos lista
to_field campo
from_fields lista
true_flags_only flag
line_values Absolute
OverallPct
PctLarger
PctSmaller
strong_links_heavier flag
propiedades de anomalydetectionnode
El nodo Detección de anomalías identifica casos extraños, o valores atípicos, que no se ajustan
a patrones de datos "normales". Con este nodo, es posible identificar valores atípicos aunque
no se ajusten a ningún patrón previamente conocido o no se realice una búsqueda exacta.
185
Ejemplo
node = [Link]("anomalydetection", "My node")
[Link]("anomaly_method", "PerRecords")
[Link]("percent_records", 95)
[Link]("mode", "Expert")
[Link]("peer_group_num_auto", True)
[Link]("min_num_peer_groups", 3)
[Link]("max_num_peer_groups", 10)
Tabla 110. propiedades de anomalydetectionnode
Propiedades de anomalydetectionnode Valores Descripción de la propiedad
inputs [campo1 ... campoN] Los modelos de detección de anomalías
criban registros basándose en los campos
de entrada especificados. No utilizan un
campo objetivo. Los campos de
ponderación y frecuencia tampoco se
usan. Consulte el tema “Propiedades
comunes de nodos de modelado” en la
página 185 para obtener más
información.
mode Expert
Simple
anomaly_method IndexLevel Especifica el método utilizado para
PerRecords determinar el valor de corte para marcar
NumRecords los registros como anómalos.
index_level número Especifica el valor de corte mínimo con
el que se van a marcar anomalías.
percent_records número Establece el umbral para marcar registros
de acuerdo al porcentaje de registros en
los datos de entrenamiento.
num_records número Establece el umbral para marcar registros
de acuerdo al número de registros en los
datos de entrenamiento.
num_fields entero El número de campos de los que se va a
informar por cada registro anómalo.
impute_missing_values flag
adjustment_coeff número Valor que se usa para equilibrar la
ponderación relativa asignada a los
campos categóricos y continuos al
calcular la distancia.
peer_group_num_auto flag Calcula automáticamente el número de
grupos de homólogos.
min_num_peer_groups entero Especifica el número mínimo de grupos
de homólogos empleado cuando
peer_group_num_auto se establece en
True.
max_num_per_groups entero Especifica el número máximo de grupos
de homólogos.
num_peer_groups entero Especifica el número de grupos de
homólogos empleado cuando
peer_group_num_auto se establece en
False.
propiedades de apriorinode
El nodo Apriori extrae un conjunto de reglas de los datos y destaca aquellas reglas con un
mayor contenido de información. Apriori ofrece cinco métodos diferentes para la selección de
reglas y utiliza un sofisticado esquema de indización para procesar eficientemente grandes
conjuntos de datos. En los problemas de mucho volumen, Apriori se entrena más
rápidamente, no tiene un límite arbitrario para el número de reglas que puede retener y
puede gestionar reglas que tengan hasta 32 precondiciones. Apriori requiere que todos los
campos de entrada y salida sean categóricos, pero ofrece un mejor rendimiento ya que está
optimizado para este tipo de datos.
Ejemplo
node = [Link]("apriori", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("partition", "Test")
# Para no transaccionales
[Link]("use_transactional_data", False)
[Link]("consequents", ["Age"])
[Link]("antecedents", ["BP", "Cholesterol", "Drug"])
# Para transaccionales
[Link]("use_transactional_data", True)
[Link]("id_field", "Age")
[Link]("contiguous", True)
[Link]("content_field", "Drug")
# "Model" tab
[Link]("use_model_name", False)
[Link]("model_name", "Apriori_bp_choles_drug")
[Link]("min_supp", 7.0)
[Link]("min_conf", 30.0)
[Link]("max_antecedents", 7)
[Link]("true_flags", False)
[Link]("optimize", "Memory")
# "Expert" tab
[Link]("mode", "Expert")
[Link]("evaluation", "ConfidenceRatio")
[Link]("lower_bound", 7)
propiedades associationrulesnode
El nodo Reglas de asociación es similar al nodo Apriori; sin embargo, a diferencia de Apriori,
el nodo Reglas de asociación puede procesar datos de lista. Además, el nodo Reglas de
asociación puede utilizarse con IBM SPSS Analytic Server para procesar datos de gran tamaño
y aprovechar el proceso en paralelo de mayor velocidad.
Ejemplo
node = [Link]("autoclassifier", "My node")
[Link]("ranking_measure", "Accuracy")
[Link]("ranking_dataset", "Training")
[Link]("enable_accuracy_limit", True)
[Link]("accuracy_limit", 0.9)
[Link]("calculate_variable_importance", True)
[Link]("use_costs", True)
[Link]("svm", False)
Tabla 113. propiedades de autoclassifiernode.
Propiedades de autoclassifiernode Valores Descripción de la propiedad
objetivo campo En objetivos de marca, el nodo
Clasificador binario requiere un único
campo objetivo y uno o más campos
de entrada. También se puede
especificar campos de ponderación y
frecuencia. Consulte el tema
“Propiedades comunes de nodos de
modelado” en la página 185 para
obtener más información.
ranking_measure Exactitud
Area_under_curve
Profit
Lift
Num_variables
ranking_dataset Entrenamiento
Test
number_of_models entero Número de modelos que se incluirán
en el nugget de modelo. Especifique
un entero entre 1 y 100.
calculate_variable_importance tag
enable_accuracy_limit tag
accuracy_limit entero Entero entre 0 y 100.
enable_ area_under_curve _limit tag
area_under_curve_limit number Número real entre 0,0 y 1,0.
enable_profit_limit tag
profit_limit number Entero mayor que 0.
enable_lift_limit tag
lift_limit number Número real mayor que 1,0.
enable_number_of_variables_limit tag
Por ejemplo:
[Link]("neuralnetwork", "method", "MultilayerPerceptron")
Los nombres de algoritmos del nodo Clasificador automático son cart, chaid, quest, c50, logreg,
decisionlist, bayesnet, discriminant, svm y knn.
Los nombres de algoritmos del nodo Autonumérico son cart, chaid, neuralnetwork, genlin, svm,
regression, linear y knn.
Los nombres de algoritmos del nodo Autoclúster son twostep, k-means y kohonen.
Las propiedades de algoritmos que contienen puntos u otros signos de puntuación deben encerrarse entre
comillas simples. Por ejemplo:
[Link]("logreg", "tolerance", "1.0E-5")
Nota: En los casos en los que determinadas opciones de algoritmos no están disponibles en el nodo
Clasificador automático o cuando sólo se puede especificar un único valor, en lugar de un intervalo de
valores, se aplican los mismos límites que tienen los scripts cuando se accede al nodo de la manera
estándar.
Ejemplo
node = [Link]("autocluster", "My node")
[Link]("ranking_measure", "Silhouette")
[Link]("ranking_dataset", "Training")
[Link]("enable_silhouette_limit", True)
[Link]("silhouette_limit", 5)
Tabla 114. propiedades de nodo de agrupación en clústeres automática
Propiedades de autoclusternode Valores Descripción de la propiedad
evaluación campo Nota: Solo nodo Agrupación en clústeres
automática. Identifica el campo cuyo valor
de importancia se calculará. Como
alternativa, se puede utilizar para
identificar la calidad con la que el clúster
diferencia el valor de este campo y, por lo
tanto; la calidad con la que el modelo
predecirá este campo.
ranking_measure Silhouette
Num_clusters
Size_smallest_cluster
Size_largest_cluster
Smallest_to_largest
Importance
ranking_dataset Entrenamiento
Prueba
propiedades de autonumericnode
El nodo Autonumérico calcula y compara modelos para resultados de rango numérico
continuo utilizando cierto número de métodos diferentes. El nodo funciona de la misma
manera que el nodo Clasificador automático, lo que le permite seleccionar los algoritmos que
desee utilizar y experimentar con varias combinaciones de opciones en una única pasada de
modelado. Los algoritmos admitidos incluyen redes neuronales, C&RT, CHAID, regresión
lineal, regresión lineal generalizada y máquinas de vectores de soporte (SVM). Los modelos se
pueden comparar basándose en la correlación, el error relativo o el número de variables
utilizado.
Ejemplo
Propiedades de bayesnetnode
El nodo Red bayesiana le permite crear un modelo de probabilidad combinando pruebas
observadas y registradas con conocimiento del mundo real para establecer la probabilidad de
instancias. El nodo se centra en las redes Naïve Bayes aumentado a árbol (TAN) y de manto
de Markov que se utilizan principalmente para la clasificación.
Ejemplo
node = [Link]("bayesnet", "My node")
[Link]("continue_training_existing_model", True)
[Link]("structure_type", "MarkovBlanket")
[Link]("use_feature_selection", True)
# pestaña Experto
[Link]("mode", "Expert")
[Link]("all_probabilities", True)
[Link]("independence", "Pearson")
Tabla 116. Propiedades de bayesnetnode
Propiedades de bayesnetnode Valores Descripción de la propiedad
inputs [campo1 ... campoN] Los modelos de red bayesiana utilizan
un único campo objetivo y uno o más
campos de entrada. Los campos
continuos se establecen en intervalos
automáticamente. Consulte el tema
“Propiedades comunes de nodos de
modelado” en la página 185 para obtener
más información.
continue_training_existing_model flag
structure_type TAN Seleccione la estructura que desea
MarkovBlanket utilizar cuando cree la red bayesiana.
use_feature_selection flag
parameter_learning_method Likelihood Especifica el método utilizado para
Bayes calcular las tablas de probabilidad
condicional entre nodos donde se
conocen los valores de los elementos
padre.
mode Expert
Simple
missing_values flag
all_probabilities flag
propiedades de buildr
El nodo Crear R le permite especificar script R
personalizado para realizar la creación de modelos y la
puntuación de modelos desplegados en IBM SPSS
Modeler.
Ejemplo
node = [Link]("buildr", "My node")
[Link]("score_syntax", """
result<-predict(modelerModel,newdata=modelerData)
modelerData<-cbind(modelerData,result)
var1<-c(fieldName="NaPrediction",fieldLabel="",fieldStorage="real",fieldMeasure="",
fieldFormat="",fieldRole="")
modelerDataModel<-[Link](modelerDataModel,var1)""")
Tabla 117. propiedades de buildr.
Propiedades de buildr Valores Descripción de la propiedad
build_syntax cadena Sintaxis de scripts R para la creación del
modelo.
score_syntax cadena Sintaxis de scripts R para la puntuación del
modelo.
convert_flags StringsAndDoubles Opción para convertir campos de
LogicalValues distintivos.
propiedades de c50node
El nodo C5.0 genera un árbol de decisión o un conjunto de reglas. El modelo divide la
muestra basándose en el campo que ofrece la máxima ganancia de información en cada nivel.
El campo objetivo debe ser categórico. Se permiten varias divisiones en más de dos
subgrupos.
Ejemplo
node = [Link]("c50", "My node")
# "Model" tab
[Link]("use_model_name", False)
[Link]("model_name", "C5_Drug")
[Link]("use_partitioned_data", True)
[Link]("output_type", "DecisionTree")
[Link]("use_xval", True)
[Link]("xval_num_folds", 3)
[Link]("mode", "Expert")
[Link]("favor", "Generality")
[Link]("min_child_records", 3)
# pestaña "Costes"
[Link]("use_costs", True)
[Link]("costs", [["drugA", "drugX", 2]])
Tabla 118. propiedades de c50node
Propiedad de c50node Valores Descripción de la propiedad
target campo Los modelos C50 utilizan un único campo
objetivo y uno o más campos de entrada.
También se puede especificar un campo de
ponderación. Consulte el tema
“Propiedades comunes de nodos de
modelado” en la página 185 para obtener
más información.
output_type DecisionTree
RuleSet
group_symbolics flag
use_boost flag
propiedades de carmanode
El modelo CARMA extrae un conjunto de reglas de los datos sin necesidad de especificar
campos de entrada ni de objetivo. A diferencia de Apriori el nodo CARMA ofrece
configuraciones de generación basadas en el soporte de las reglas (soporte tanto para el
antecedente como el consecuente) en lugar de hacerlo sólo respecto al soporte del
antecedente. Esto significa que las reglas generadas se pueden utilizar en una gama de
aplicaciones más amplia, por ejemplo, para buscar una lista de productos o servicios
(antecedentes) cuyo consecuente es el elemento que se desea promocionar durante esta
temporada de vacaciones.
Ejemplo
node = [Link]("carma", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("use_transactional_data", True)
[Link]("inputs", ["BP", "Cholesterol", "Drug"])
[Link]("partition", "Test")
# "Model" tab
[Link]("use_model_name", False)
[Link]("model_name", "age_bp_drug")
[Link]("use_partitioned_data", False)
[Link]("min_supp", 10.0)
[Link]("min_conf", 30.0)
[Link]("max_size", 5)
# Opciones de experto
[Link]("mode", "Expert")
[Link]("use_pruning", True)
propiedades de cartnode
El nodo de árbol de clasificación y regresión (C&R) genera un árbol de decisión que permite
predecir o clasificar observaciones futuras. El método utiliza la partición reiterada para dividir
los registros de entrenamiento en segmentos minimizando las impurezas en cada paso, donde
un nodo se considera "puro" si el 100% de los casos del nodo corresponden a una categoría
específica del campo objetivo. Los campos de entrada y objetivo pueden ser continuos (rango
numérico) o categóricos (nominal, ordinal o marca). Todas las divisiones son binarias (sólo se
crean dos subgrupos).
Ejemplo
node = [Link]("cart", "My node", 200, 100)
# "Fields" tab
[Link]("custom_fields", True)
[Link]("target", "Drug")
[Link]("inputs", ["Age", "BP", "Cholesterol"])
use_max_depth Predeterminado
Personalizado
max_depth entero Máxima profundidad del árbol, desde 0 a
1000. Sólo se utiliza si use_max_depth =
Custom.
prune_tree flag Poda del árbol para evitar sobreajustes.
Ejemplo
filenode = [Link]("variablefile", "My node", 100, 100)
[Link]("full_filename", "$CLEO_DEMOS/DRUG1n")
node = [Link]("chaid", "My node", 200, 100)
[Link](filenode, node)
[Link]("custom_fields", True)
[Link]("target", "Drug")
[Link]("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
[Link]("use_model_name", True)
[Link]("model_name", "CHAID")
[Link]("method", "Chaid")
[Link]("model_output_type", "InteractiveBuilder")
[Link]("use_tree_directives", True)
[Link]("tree_directives", "Test")
[Link]("split_alpha", 0.03)
[Link]("merge_alpha", 0.04)
[Link]("chi_square", "Pearson")
[Link]("use_percentage", False)
[Link]("min_parent_records_abs", 40)
[Link]("min_child_records_abs", 30)
[Link]("epsilon", 0.003)
[Link]("max_iterations", 75)
[Link]("split_merged_categories", True)
[Link]("bonferroni_adjustment", True)
Tabla 121. propiedades de chaidnode
Propiedad de chaidnode Valores Descripción de la propiedad
target campo Los modelos CHAID requieren un único
campo objetivo y uno o más campos de
entrada. También se puede especificar un
campo de frecuencia. Consulte el tema
“Propiedades comunes de nodos de
modelado” en la página 185 para obtener
más información.
continue_training_existing_model flag
objective Standard psm se utiliza para conjuntos de datos de
Aumento grandes dimensiones y requiere una
Agregación autodocimante conexión al Servidor.
psm
model_output_type Single
InteractiveBuilder
use_tree_directives flag
tree_directives cadena
method Chaid
ExhaustiveChaid
Ejemplo
node = [Link]("coxreg", "My node")
[Link]("survival_time", "tenure")
[Link]("method", "BackwardsStepwise")
# pestaña Experto
[Link]("mode", "Expert")
[Link]("removal_criterion", "Conditional")
[Link]("survival", True)
Tabla 122. propiedades de coxregnode
Propiedades de coxregnode Valores Descripción de la propiedad
survival_time campo Los modelos de regresión de Cox
requieren un único campo con los
tiempos de supervivencia.
target campo Los modelos de regresión de Cox
requieren un único campo objetivo y uno
o más campos de entrada. Consulte el
tema “Propiedades comunes de nodos de
modelado” en la página 185 para obtener
más información.
method Intro
Stepwise
BackwardsStepwise
grupos campo
model_type MainEffects
Personalizado
custom_terms ["BP*Sexo" "BP*Edad"]
mode Expert
Simple
max_iterations número
p_converge 1.0E-4
1.0E-5
1.0E-6
1.0E-7
1.0E-8
0
p_converge 1.0E-4
1.0E-5
1.0E-6
1.0E-7
1.0E-8
0
Propiedades de decisionlistnode
El nodo Lista de decisiones identifica subgrupos, o segmentos, que muestran una mayor o
menor posibilidad de proporcionar un resultado binario relacionado con la población global.
Por ejemplo, puede buscar clientes que tengan menos posibilidades de abandonar o más
posibilidades de responder favorablemente a una campaña. Puede incorporar su conocimiento
empresarial al modelo añadiendo sus propios segmentos personalizados y previsualizando
modelos alternativos uno junto a otro para comparar los resultados. Los modelos de listas de
decisiones constan de una lista de reglas en las que cada regla tiene una condición y un
resultado. Las reglas se aplican en orden, y la primera regla que coincide determina el
resultado.
Ejemplo
node = [Link]("decisionlist", "My node")
[Link]("search_direction", "Down")
[Link]("target_value", 1)
[Link]("max_rules", 4)
[Link]("min_group_size_pct", 15)
Ejemplo
node = [Link]("discriminant", "My node")
[Link]("target", "custcat")
[Link]("use_partitioned_data", False)
[Link]("method", "Stepwise")
Tabla 124. propiedades de discriminantnode
Propiedades de discriminantnode Valores Descripción de la propiedad
target campo Los modelos discriminantes requieren un
único campo objetivo y uno o más campos
de entrada. Los campos de ponderación y
frecuencia no se usan. Consulte el tema
“Propiedades comunes de nodos de
modelado” en la página 185 para obtener
más información.
method Intro
Por pasos
mode Simple
Valores avanzados
prior_probabilities AllEqual
ComputeFromSizes
covariance_matrix WithinGroups
SeparateGroups
medias flag Opciones de estadísticos del cuadro de
diálogo Salida avanzada.
univariate_anovas flag
box_m flag
within_group_covariance flag
within_groups_correlation flag
separate_groups_covariance flag
total_covariance flag
fishers flag
unstandardized flag
casewise_results flag Opciones de clasificación del cuadro de
diálogo Salida avanzada.
limit_to_first número El valor predeterminado es 10.
summary_table flag
leave_one_classification flag
combined_groups flag
separate_groups_covariance flag Opción de matrices Covarianza de grupos
separados.
Propiedades de extensionmodelnode
build_script = """
import json
import [Link]
from [Link] import LabeledPoint
from [Link] import DenseVector
from [Link] import DecisionTree
cxt = [Link]()
df = [Link]()
target = "Drug"
predictors = ["Age","BP","Sex","Cholesterol","Na","K"]
def metaMap(row,schema):
col = 0
meta = []
for (cname, ctype) in schema:
if ctype == ’string’:
[Link](set([row[col]]))
else:
[Link]((row[col],row[col]))
col += 1
return meta
def metaReduce(meta1,meta2,schema):
col = 0
meta = []
for (cname, ctype) in schema:
if ctype == ’string’:
[Link](meta1[col].union(meta2[col]))
else:
[Link]((min(meta1[col][0],meta2[col][0]),max(meta1[col][1],meta2[col][1])))
col += 1
return meta
def setToList(v):
if isinstance(v,set):
return list(v)
return v
lookup = {}
for i in range(0,len(schema)):
lookup[schema[i][0]] = i
def row2LabeledPoint(dm,lookup,target,predictors,row):
target_index = lookup[target]
tval = dm[target_index].index(row[target_index])
pvals = []
for predictor in predictors:
predictor_index = lookup[predictor]
if isinstance(dm[predictor_index],list):
pval = dm[predictor_index].index(row[predictor_index])
else:
pval = row[predictor_index]
[Link](pval)
return LabeledPoint(tval,DenseVector(pvals))
treeModel = [Link](
lps,
numClasses=predictorClassCount,
categoricalFeaturesInfo=getCategoricalFeatureInfo(metadata, lookup, predictors),
impurity=’gini’,
maxDepth=5,
maxBins=100)
_outputPath = [Link]()
[Link]([Link](), _outputPath)
[Link]("TreeModel", _outputPath)
[Link]("[Link]",[Link](metadata), mimeType="application/json")\
.setModelContentFromString("[Link]",[Link]())
"""
[Link]("python_build_syntax", build_script)
Ejemplo de R
#### Ejemplo de script de R
[Link]("syntax_type", "R")
[Link]("r_build_syntax", """modelerModel <- lm(modelerData$Na~modelerData$K,modelerData)
modelerDataModel
modelerModel
""")
Tabla 125. Propiedades de extensionmodelnode
Propiedades de extensionmodelnode Valores Descripción de la propiedad
syntax_type R Especifica qué script se ejecuta: R o Python
Python (R es el valor predeterminado).
r_build_syntax cadena Sintaxis de scripts R para la creación de
modelos.
r_score_syntax cadena Sintaxis de scripts R para la puntuación de
modelos.
python_build_syntax cadena Sintaxis de scripts Python para la creación
de modelos.
python_score_syntax cadena Sintaxis de scripts Python para la
puntuación de modelos.
convert_flags StringsAndDoubles Opción para convertir campos de
LogicalValues distintivos.
convert_missing flag Opción para convertir los valores que faltan
al valor R NA.
convert_datetime flag Opción para convertir las variables con los
formatos de fecha o de fecha y hora para
formatos de fecha/hora R.
convert_datetime_class POSIXct Opciones para especificar a qué formato se
POSIXlt convierten las variables con los formatos de
fecha o de fecha y hora.
output_html flag Opción para visualizar gráficos en una
pestaña en el nugget de modelo R.
output_text flag Opción para escribir salida de texto de la
consola R en una pestaña del modelo R.
Ejemplo
node = [Link]("factor", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("inputs", ["BP", "Na", "K"])
[Link]("partition", "Test")
# "Model" tab
[Link]("use_model_name", True)
[Link]("model_name", "Factor_Age")
[Link]("use_partitioned_data", False)
[Link]("method", "GLS")
# Opciones de experto
[Link]("mode", "Expert")
[Link]("complete_records", True)
[Link]("matrix", "Covariance")
[Link]("max_iterations", 30)
[Link]("extract_factors", "ByFactors")
[Link]("min_eigenvalue", 3.0)
[Link]("max_factor", 7)
[Link]("sort_values", True)
[Link]("hide_values", True)
[Link]("hide_below", 0.7)
# Sección "Rotación"
[Link]("rotation", "DirectOblimin")
[Link]("delta", 0.3)
[Link]("kappa", 7.0)
Tabla 126. propiedades de factornode
Propiedad de factornode Valores Descripción de la propiedad
inputs [field1 ... fieldN] Los modelos PCA/Factorial utilizan una
lista de campos de entrada, pero no de
campos objetivo. Los campos de
ponderación y frecuencia no se usan.
Consulte el tema “Propiedades comunes de
nodos de modelado” en la página 185 para
obtener más información.
method PC
ULS
GLS
ML
PAF
Alpha
Image
mode Simple
Valores avanzados
propiedades de featureselectionnode
El nodo Selección de características filtra los campos de entrada para su eliminación en
función de un conjunto de criterios (como el porcentaje de valores perdidos); a continuación,
clasifica el grado de importancia del resto de entradas de acuerdo con un objetivo específico.
Por ejemplo, a partir de un conjunto de datos dado con cientos de entradas potenciales,
¿cuáles tienen mayor probabilidad de ser útiles para el modelado de resultados de pacientes?
Ejemplo
node = [Link]("featureselection", "My node")
[Link]("screen_single_category", True)
[Link]("max_single_category", 95)
[Link]("screen_missing_values", True)
[Link]("max_missing_values", 80)
[Link]("criteria", "Likelihood")
[Link]("unimportant_below", 0.8)
Para obtener un ejemplo más detallado que cree y aplique un modelo de Selección de características,
consulte en.
Tabla 127. propiedades de featureselectionnode
Propiedad de featureselectionnode Valores Descripción de la propiedad
target campo Los modelos de selección de
características ordenan predictores por
rangos con respecto a su objetivo
específico. Los campos de ponderación y
frecuencia no se usan. Consulte el tema
“Propiedades comunes de nodos de
modelado” en la página 185 para obtener
más información.
screen_single_category flag En caso de establecer True, filtra campos
que tienen demasiados registros dentro
de la misma categoría respecto al
número total de registros.
max_single_category número Especifica el umbral que se utiliza
cuando screen_single_category es True.
screen_missing_values flag Si se establece en True, filtra campos con
demasiados valores perdidos, expresados
como un porcentaje del número total de
registros.
max_missing_values número
screen_num_categories flag Si se establece en True, filtra campos con
demasiadas categorías respecto al
número total de registros.
max_num_categories número
screen_std_dev flag Si se establece en True, filtra campos con
una desviación estándar menor o igual
que el mínimo especificado.
min_std_dev número
screen_coeff_of_var flag Si se establece en True, filtra campos con
un coeficiente de varianza menor o igual
que el mínimo especificado.
min_coeff_of_var número
criterios Pearson Al clasificar los predictores categóricos
Likelihood en función de un objetivo categórico,
CramersV especifica la medida en la que se basa el
Lambda valor de importancia.
unimportant_below número Especifica los valores p de umbral
utilizados para clasificar las variables
como importantes, marginales o sin
importancia. Acepta valores de 0,0 a 1,0.
important_above número Acepta valores de 0,0 a 1,0.
unimportant_label cadena Especifica la etiqueta para la clasificación
como 'Sin importancia'.
marginal_label cadena
propiedades de genlinnode
El modelo lineal generalizado amplía el modelo lineal general, de manera que la variable
dependiente está relacionada linealmente con los factores y las covariables mediante una
determinada función de enlace. Además, el modelo permite que la variable dependiente tenga
una distribución no normal. Cubre la funcionalidad de un amplio número de modelo
estadísticos, incluyendo regresión lineal, regresión logística, modelos log lineales para
recuento de datos y modelos de supervivencia censurados por intervalos.
Ejemplo
node = [Link]("genlin", "My node")
[Link]("model_type", "MainAndAllTwoWayEffects")
[Link]("offset_type", "Variable")
[Link]("offset_field", "Claimant")
Tabla 128. propiedades de genlinnode
Propiedades de genlinnode Valores Descripción de la propiedad
target campo Los modelos lineales generalizados
requieren un único campo objetivo, que
debe ser un campo nominal o marca, y uno
o más campos de entrada. También se
puede especificar un campo de
ponderación. Consulte el tema
“Propiedades comunes de nodos de
modelado” en la página 185 para obtener
más información.
use_weight flag
weight_field campo El tipo de campo es únicamente continuo.
target_represents_trials flag
include_intercept flag
mode Simple
Valores avanzados
distribution BINOMIAL IGAUSS: De Gauss inversa.
GAMMA NEGBIN: Negative binomial.
IGAUSS
NEGBIN
NORMAL
POISSON
TWEEDIE
MULTINOMIAL
negbin_para_type Especifica
Estimate
negbin_parameter número El valor predeterminado es 1. Debe
contener un número real no negativo.
tweedie_parameter número
link_function IDENTITY CLOGLOG: log-log complementario.
CLOGLOG LOGC: complemento log.
LOG NEGBIN: Negative binomial.
LOGC NLOGLOG: Log-log negativo.
LOGIT CUMCAUCHIT: Cauchit acumulada.
NEGBIN CUMCLOGLOG: Log-log complementario
NLOGLOG acumulado.
ODDSPOWER CUMLOGIT: Logit acumulado.
PROBIT CUMNLOGLOG: Log-log negativo acumulado.
POWER CUMPROBIT: Probit acumulado.
CUMCAUCHIT
CUMCLOGLOG
CUMLOGIT
CUMNLOGLOG
CUMPROBIT
potencia número El valor debe ser real y distinto de cero.
method Hybrid
Fisher
NewtonRaphson
Propiedades de glmmnode
Un modelo lineal mixto generalizado (GLMM) amplía el modelo lineal de modo que el
objetivo pueda tener una distribución no normal, esté linealmente relacionado con los factores
y covariables mediante una función de enlace especificada y las observaciones se puedan
correlacionar. Los modelos lineales mixtos generalizados cubren una amplia variedad de
modelos, desde modelos de regresión lineal simple hasta modelos multinivel complejos para
datos longitudinales no normales.
Propiedades de gle
Un modelo lineal mixto generalizado (GLMM) amplía el modelo lineal de modo que el
objetivo pueda tener una distribución no normal, esté linealmente relacionado con los factores
y covariables mediante una función de enlace especificada y las observaciones se puedan
correlacionar. Los modelos lineales mixtos generalizados cubren una amplia variedad de
modelos, desde modelos de regresión lineal simple hasta modelos multinivel complejos para
datos longitudinales no normales.
propiedades de kmeansnode
El nodo K-medias agrupa conjuntos de datos en grupos distintos (o clústeres). El método
define un número fijo de clústeres, de forma iterativa asigna registros a los clústeres y ajusta
los centros de los clústeres hasta que no se pueda mejorar el modelo. En lugar de intentar
predecir un resultado, los modelos de k-medias utilizan un proceso conocido como
aprendizaje no supervisado para revelar los patrones del conjunto de campos de entrada.
Ejemplo
node = [Link]("kmeans", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("inputs", ["Cholesterol", "BP", "Drug", "Na", "K", "Age"])
# "Model" tab
[Link]("use_model_name", True)
[Link]("model_name", "Kmeans_allinputs")
[Link]("num_clusters", 9)
[Link]("gen_distance", True)
[Link]("cluster_label", "Number")
[Link]("label_prefix", "Kmeans_")
[Link]("optimize", "Speed")
# "Expert" tab
[Link]("mode", "Expert")
[Link]("stop_on", "Custom")
[Link]("max_iterations", 10)
[Link]("tolerance", 3.0)
[Link]("encoding_value", 0.3)
Tabla 131. propiedades de kmeansnode
Propiedad de kmeansnode Valores Descripción de la propiedad
inputs [field1 ... fieldN] Los modelos de K-Medias realizan un
análisis de clústeres en un conjunto de
campos de entrada pero no utilizan ningún
campo objetivo. Los campos de
ponderación y frecuencia no se usan.
Consulte el tema “Propiedades comunes de
nodos de modelado” en la página 185 para
obtener más información.
num_clusters número
gen_distance flag
propiedades de knnnode
El nodo k de modelado de vecino (KNN) asocia el nuevo caso con la categoría o valor de los
objetos k junto a él en el espacio de predictores, donde k es un entero. Los casos parecidos
están próximos y los que no lo son están alejados entre sí.
Ejemplo
node = [Link]("knn", "My node")
# Objectives tab
[Link]("objective", "Custom")
# Settings tab - Neighbors panel
[Link]("automatic_k_selection", False)
[Link]("fixed_k", 2)
[Link]("weight_by_importance", True)
# Settings tab - Analyze panel
[Link]("save_distances", True)
Tabla 132. propiedades de knnnode
Propiedades de knnnode Valores Descripción de la propiedad
de errores PredictTarget
IdentifyNeighbors
objective Balance
Speed
Exactitud
Personalizado
normalize_ranges flag
use_case_labels flag Seleccione esta casilla de verificación para
activar la siguiente opción.
case_labels_field campo
identify_focal_cases flag Seleccione esta casilla de verificación para
activar la siguiente opción.
focal_cases_field campo
propiedades de kohonennode
El nodo Kohonen genera un tipo de red neuronal que se puede usar para agrupar un
conjunto de datos en grupos distintos. Cuando la red se termina de entrenar, los registros que
son similares se deberían cerrar juntos en el mapa de resultados, mientras que los registros
que son diferentes aparecerían aparte. Puede observar el número de observaciones capturadas
por cada unidad en el nugget de modelo para identificar unidades fuertes. Esto le
proporcionará una idea del número apropiado de clústeres.
Ejemplo
node = [Link]("kohonen", "My node")
# "Model" tab
[Link]("use_model_name", False)
[Link]("model_name", "Symbolic Cluster")
[Link]("stop_on", "Time")
Ejemplo
node = [Link]("linear", "My node")
# Build Options tab - Objectives panel
[Link]("objective", "Standard")
# Build Options tab - Model Selection panel
[Link]("model_selection", "BestSubsets")
[Link]("criteria_best_subsets", "ASE")
# Build Options tab - Ensembles panel
[Link]("combining_rule_categorical", "HighestMeanProbability")
Tabla 134. Propiedades de linearnode.
Propiedades de linearnode Valores Descripción de la propiedad
objetivo campo Especifica un campo de objetivo único.
Propiedades de linearasnode
Los modelos de regresión lineal predicen un objetivo continuo tomando como base las
relaciones lineales entre el destino y uno o más predictores.
Propiedades de logregnode
La regresión logística es una técnica de estadístico para clasificar los registros en función los
valores de los campos de entrada. Es análoga a la regresión lineal pero toma un campo
objetivo categórico en lugar de uno numérico.
Ejemplo multinomial
node = [Link]("logreg", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("target", "Drug")
[Link]("inputs", ["BP", "Cholesterol", "Age"])
[Link]("partition", "Test")
# "Model" tab
[Link]("use_model_name", True)
[Link]("model_name", "Log_reg Drug")
[Link]("use_partitioned_data", True)
[Link]("method", "Stepwise")
[Link]("logistic_procedure", "Multinomial")
[Link]("multinomial_base_category", "BP")
[Link]("model_type", "FullFactorial")
[Link]("custom_terms", [["BP", "Sex"], ["Age"], ["Na", "K"]])
[Link]("include_constant", False)
Ejemplo binomial
node = [Link]("logreg", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("target", "Cholesterol")
[Link]("inputs", ["BP", "Drug", "Age"])
[Link]("partition", "Test")
# "Model" tab
[Link]("use_model_name", False)
[Link]("model_name", "Log_reg Cholesterol")
[Link]("multinomial_base_category", "BP")
[Link]("use_partitioned_data", True)
[Link]("binomial_method", "Forwards")
[Link]("logistic_procedure", "Binomial")
[Link]("binomial_categorical_input", "Sex")
[Link]("binomial_input_contrast", "Sex", "Simple")
[Link]("binomial_input_category", "Sex", "Last")
[Link]("include_constant", False)
# "Expert" tab
[Link]("mode", "Expert")
[Link]("scale", "Pearson")
[Link]("scale_value", 3.0)
[Link]("all_probabilities", True)
[Link]("tolerance", "1.0E-7")
# "Convergence..." section
[Link]("max_iterations", 50)
[Link]("l_converge", "1.0E-3")
[Link]("p_converge", "1.0E-7")
# "Output..." section
scale Ninguno
UserDefined
Pearson
Deviance
scale_value number
all_probabilities tag
tolerance 1.0E-5
1.0E-6
1.0E-7
1.0E-8
1.0E-9
1.0E-10
min_terms number
use_max_terms tag
max_terms number
entry_criterion Puntuación
LR
removal_criterion LR
Wald
probability_entry number
probability_removal number
binomial_probability_entry number
binomial_probability_removal number
requirements HierarchyDiscrete HierarchyAll
Containment
Ninguno
max_iterations number
max_steps number
p_converge 1.0E-4
1.0E-5
1.0E-6
1.0E-7
1.0E-8
0
l_converge 1.0E-1
1.0E-2
1.0E-3
1.0E-4
1.0E-5
0
delta number
iteration_history tag
history_steps number
propiedades de lsvmnode
El nodo Máquina de vectores de soporte lineal (LSVM) le permite clasificar datos en uno o
dos grupos sin que haya un ajuste por exceso. LSVM es lineal y funciona bien con conjuntos
de datos grandes, como aquellos con un gran número de registros.
propiedades de neuralnetnode
Importante: En este release está disponible una versión más reciente del nodo de modelado Red
neuronal, con características mejoradas, y se describe en la siguiente sección (red neuronal). Aunque aún
puede generar y puntuar un modelo con la versión anterior, recomendamos que actualice sus scripts para
que se use la nueva versión. Los detalles de la versión anterior se conservan aquí como referencia.
Ejemplo
node = [Link]("neuralnet", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("targets", ["Drug"])
[Link]("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
# "Model" tab
Ejemplo
node = [Link]("neuralnetwork", "My node")
# Build Options tab - Objectives panel
[Link]("objective", "Standard")
# Build Options tab - Ensembles panel
[Link]("combining_rule_categorical", "HighestMeanProbability")
Tabla 139. Propiedades de neuralnetwork
Propiedades de neuralnetworknode Valores Descripción de la propiedad
targets [field1 ... fieldN] Especifica campos objetivo.
inputs [field1 ... fieldN] Campos de predictor utilizados por el
modelo.
splits [campo1 ... fieldN Especifica el campo o campos para utilizar
en el modelado de divisiones.
use_partition flag Si se ha definido un campo de partición,
esta opción garantiza que sólo se utilizarán
los datos de la partición de entrenamiento
para la generación del modelo.
continue flag Continuar entrenando modelo existente.
objective Standard psm se utiliza para conjuntos de datos de
Agregación autodocimante grandes dimensiones y requiere una
Aumento conexión al Servidor.
psm
method MultilayerPerceptron
RadialBasisFunction
use_custom_layers flag
first_layer_units número
second_layer_units número
use_max_time flag
max_time número
use_max_cycles flag
max_cycles número
use_min_accuracy flag
min_accuracy número
combining_rule_categorical Voting
HighestProbability
HighestMeanProbability
combining_rule_continuous Media
Mediana
component_models_n número
propiedades de questnode
El nodo QUEST proporciona un método de clasificación binario para generar árboles de
decisión; está diseñado para reducir el tiempo de procesamiento necesario para realizar los
análisis de C&RT y reducir la tendencia de los métodos de clasificación de árboles para
favorecer a las entradas que permitan realizar más divisiones. Los campos de entrada pueden
ser continuos (rango numérico), sin embargo el campo objetivo debe ser categórico. Todas las
divisiones son binarias.
Ejemplo
node = [Link]("quest", "My node")
[Link]("custom_fields", True)
[Link]("target", "Drug")
[Link]("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
[Link]("model_output_type", "InteractiveBuilder")
[Link]("use_tree_directives", True)
[Link]("max_surrogates", 5)
[Link]("split_alpha", 0.03)
[Link]("use_percentage", False)
[Link]("min_parent_records_abs", 40)
[Link]("min_child_records_abs", 30)
[Link]("prune_tree", True)
[Link]("use_std_err", True)
[Link]("std_err_multiplier", 3)
propiedades randomtrees
El nodo Árboles aleatorios es similar al nodo C&RT existente; sin embargo, el nodo Árboles
aleatorios se ha diseñado para procesar grandes cantidades de datos (Big Data) para crear un
solo árbol y mostrar el modelo resultante en el visor de la salida que se ha añadido en SPSS
Modeler versión 17. El nodo Árboles aleatorios genera un árbol de decisión que se utiliza
para predecir o clasificar observaciones futuras. El método utiliza la partición reiterada para
dividir los registros de entrenamiento en segmentos minimizando las impurezas en cada paso,
donde un nodo se considera puro si el 100% de los casos del nodo corresponden a una
categoría específica del campo objetivo. Los campos de entrada y objetivo pueden ser
continuos (rango numérico) o categóricos (nominal, ordinal o marca). Todas las divisiones son
binarias (sólo se crean dos subgrupos).
Propiedades de regressionnode
La regresión lineal es una técnica de estadístico común utilizada para resumir datos y realizar
predicciones ajustando una superficie o línea recta que minimice las discrepancias existentes
entre los valores de salida reales y los predichos.
Nota: El nodo Lineal reemplazará al nodo Regresión en una versión futura. Recomendamos que a partir
de ahora utilice modelos lineales para la regresión lineal.
Ejemplo
node = [Link]("regression", "My node")
# "Fields" tab
[Link]("custom_fields", True)
[Link]("target", "Age")
[Link]("inputs", ["Na", "K"])
[Link]("partition", "Test")
[Link]("use_weight", True)
[Link]("weight_field", "Drug")
# "Model" tab
[Link]("use_model_name", True)
[Link]("model_name", "Regression Age")
[Link]("use_partitioned_data", True)
[Link]("method", "Stepwise")
[Link]("include_constant", False)
# "Expert" tab
[Link]("mode", "Expert")
[Link]("complete_records", False)
[Link]("tolerance", "1.0E-3")
# "Stepping..." section
[Link]("stepping_method", "Probability")
[Link]("probability_entry", 0.77)
[Link]("probability_removal", 0.88)
[Link]("F_value_entry", 7.0)
[Link]("F_value_removal", 8.0)
# "Output..." section
[Link]("model_fit", True)
[Link]("r_squared_change", True)
[Link]("selection_criteria", True)
[Link]("descriptives", True)
propiedades de sequencenode
El nodo Secuencia encuentra reglas de asociación en datos secuenciales o en datos ordenados
en el tiempo. Una secuencia es una lista de conjuntos de elementos que tiende a producirse
en un orden previsible. Por ejemplo, si un cliente compra una cuchilla y una loción para
después del afeitado, probablemente comprará crema para afeitar la próxima vez que vaya a
comprar. El nodo Secuencia se basa en el algoritmo de reglas de asociación de CARMA, que
utiliza un método de dos pasos para encontrar las secuencias.
Ejemplo
node = [Link]("sequence", "My node")
# "Fields" tab
[Link]("id_field", "Age")
[Link]("contiguous", True)
[Link]("use_time_field", True)
[Link]("time_field", "Date1")
[Link]("content_fields", ["Drug", "BP"])
[Link]("partition", "Test")
# "Model" tab
[Link]("use_model_name", True)
[Link]("model_name", "Sequence_test")
[Link]("use_partitioned_data", False)
[Link]("min_supp", 15.0)
[Link]("min_conf", 14.0)
[Link]("max_size", 7)
[Link]("max_predictions", 5)
# "Expert" tab
[Link]("mode", "Expert")
[Link]("use_max_duration", True)
[Link]("max_duration", 3.0)
[Link]("use_pruning", True)
[Link]("pruning_value", 4.0)
[Link]("set_mem_sequences", True)
[Link]("mem_sequences", 5.0)
[Link]("use_gaps", True)
[Link]("min_item_gap", 20.0)
[Link]("max_item_gap", 30.0)
propiedades de slrmnode
El nodo Modelo de respuesta de autoaprendizaje (SLRM) permite crear un modelo en el que
un solo caso nuevo o un pequeño número de casos nuevos se pueden utilizar para volver a
calcular el modelo sin tener que entrenar de nuevo el modelo utilizando todos los datos.
Ejemplo
node = [Link]("slrm", "My node")
[Link]("target", "Offer")
[Link]("target_response", "Response")
[Link]("inputs", ["Cust_ID", "Age", "Ave_Bal"])
propiedades de statisticsmodelnode
El nodo Modelo Statistics permite analizar y trabajar con sus datos ejecutando los
procedimientos de IBM SPSS Statistics que producen PMML. Este nodo requiere una copia de
IBM SPSS Statistics con licencia.
Las propiedades de este nodo están descritas en “propiedades de statisticsmodelnode” en la página 348.
propiedades de stpnode
El nodo Predicción espacio-temporal (STP) utiliza datos que contienen datos de ubicación,
campos de entrada para la predicción (predictores), un campo de hora y un campo de
objetivo. Cada ubicación tiene muchas filas en los datos que representan los valores de cada
predictor en cada tiempo de medición. Después de analizar los datos, se puede utilizar para
predecir los valores de objetivo en cualquier ubicación dentro de los datos de forma que se
utilizan en el análisis.
Si lo establece en Y, se inhabilitan
todos los controles de agregación.
agg_range_default Sum Determina el método de agregación
Media predeterminado que se utiliza para los
Min campos continuos. Los campos
Max continuos que no estén incluidos
Mediana específicamente en la agregación
1stQuartile predeterminada se agregarán usando
3rdQuartile el método aquí indicado.
propiedades de svmnode
El nodo Máquina de vectores de soporte (SVM) le permite clasificar datos en uno o dos
grupos sin que haya un ajuste por exceso. SVM funciona bien con conjuntos de datos
grandes, como aquellos con un gran número de campos de entrada.
Ejemplo
node = [Link]("svm", "My node")
# pestaña Experto
[Link]("mode", "Expert")
[Link]("all_probabilities", True)
[Link]("kernel", "Polynomial")
[Link]("gamma", 1.5)
Tabla 146. propiedades de svmnode.
Propiedades de svmnode Valores Descripción de la propiedad
all_probabilities tag
calculate_adjusted_ tag
propensities
adjusted_propensity_partition Test
Validation
Propiedades de tcmnode
El modelado causal temporal intenta descubrir relaciones causales clave en datos de series
temporales. En el modelado causal temporal, especifique un conjunto de series de objetivos y
un conjunto de entradas candidato para estos objetivos. El procedimiento crea un modelo de
serie temporal autorregresivo para cada objetivo e incluye solo estas entradas que tienen la
relación causal más significativa con el objetivo.
Ejemplo
node = [Link]("timeseries", "My node")
[Link]("method", "Exsmooth")
[Link]("exsmooth_model_type", "HoltsLinearTrend")
[Link]("exsmooth_transformation_type", "None")
Tabla 149. propiedades de timeseriesnode
Propiedades de timeseriesnode Valores Descripción de la propiedad
targets campo El nodo Serie temporal
prevé uno o más objetivos,
utilizando opcionalmente
uno o más campos de
entrada como predictores.
Los campos de frecuencia y
ponderación no se usan.
Consulte el tema
“Propiedades comunes de
nodos de modelado” en la
página 185 para obtener más
información.
continue flag
method ExpertModeler
Exsmooth
Arima
Reuse
propiedades de treeas
El nodo Tree-AS es similar al nodo CHAID existente; sin embargo, el nodo Tree-AS se ha
designado para procesar grandes cantidades de datos (Big Data) para crear un solo árbol y
mostrar el modelo resultante en el visor de salida que se ha añadido en SPSS Modeler versión
17. El nodo genera un árbol de decisiones utilizando estadísticas de chi-cuadrado (CHAID)
para identificar divisiones opcionales. Este uso de CHAID puede generar árboles no binarios,
lo que significa que algunas divisiones generarán más de dos ramas. Los campos de entrada
y objetivo pueden ser continuos (rango numérico) o categóricos. CHAID exhaustivo es una
modificación de CHAID que examina con mayor precisión todas las divisiones posibles,
aunque necesita más tiempo para realizar los cálculos.
Propiedades de twostepnode
El nodo Bietápico es un método de agrupación en clústeres de dos pasos. El primer paso es
hacer una única pasada por los datos para comprimir los datos de entrada de la fila en un
conjunto de subclústeres administrable. El segundo paso utiliza un método de agrupación en
clústeres jerárquica para fundir progresivamente los subclústeres en clústeres cada vez más
grandes. El bietápico tiene la ventaja de estimar automáticamente el número óptimo de
clústeres para los datos de entrenamiento. Puede gestionar tipos de campos mixtos y grandes
conjuntos de datos eficazmente.
Ejemplo
node = [Link]("twostep", "My node")
[Link]("custom_fields", True)
[Link]("inputs", ["Age", "K", "Na", "BP"])
[Link]("partition", "Test")
[Link]("use_model_name", False)
[Link]("model_name", "TwoStep_Drug")
[Link]("use_partitioned_data", True)
[Link]("exclude_outliers", True)
[Link]("cluster_label", "String")
[Link]("label_prefix", "TwoStep_")
[Link]("cluster_num_auto", False)
[Link]("max_num_clusters", 9)
[Link]("min_num_clusters", 3)
[Link]("num_clusters", 7)
Propiedades de twostepAS
El clúster bietápico es una herramienta de exploración diseñada para descubrir las
agrupaciones naturales (o clústeres) de un conjunto de datos que, de otra manera, no sería
posible detectar. El algoritmo que emplea este procedimiento incluye varias atractivas
características que lo hacen diferente de las técnicas de agrupación en clústeres tradicionales,
como el tratamiento de variables categóricas y continuas, la selección automática de número
de clústeres y la escalabilidad.
Distance_jump
Mínimo
Máximo
feature_importance_method use_clustering_criterion_setting
effect_size
use_random_seed Booleano
random_seed número entero
distance_measure Euclidean
Loglikelihood
include_outlier_clusters Booleano Default=True
num_cases_in_feature_tree_leaf_ número entero Default=10
is_less_than
top_perc_outliers número entero Default=5
initial_dist_change_threshold número entero Default=0
leaf_node_maximum_branches número entero Default=8
non_leaf_node_maximum_branches número entero Default=8
max_tree_depth número entero Default=3
adjustment_weight_on_measurement_ level número entero Default=6
memory_allocation_mb número Default=512
delayed_split Booleano Default=True
fields_to_standardize [f1 ... fN]
adaptive_feature_selection Booleano Default=True
featureMisPercent número entero Default=70
coefRange número Default=0,05
percCasesSingleCategory número entero Default=95
numCases número entero Default=24
include_model_specifications Booleano Default=True
include_record_summary Booleano Default=True
include_field_transformations Booleano Default=True
excluded_inputs Booleano Default=True
evaluate_model_quality Booleano Default=True
show_feature_importance bar chart Booleano Default=True
show_feature_importance_ word_cloud Booleano Default=True
show_outlier_clusters Booleano Default=True
interactive_table_and_chart
show_outlier_clusters_pivot_table Booleano Default=True
across_cluster_feature_importance Booleano Default=True
across_cluster_profiles_pivot_ table Booleano Default=True
Propiedades de applyanomalydetectionnode
Los nodos de modelado Detección de anomalías pueden utilizarse para generar un nugget de modelo
Detección de anomalías. El nombre de script de este nugget de modelo es applyanomalydetectionnode. Para
obtener más información sobre los scripts para el propio nodo de modelado, consulte “propiedades de
anomalydetectionnode” en la página 185
Tabla 153. propiedades de applyanomalydetectionnode.
Propiedades de applyanomalydetectionnode Valores Descripción de la propiedad
anomaly_score_method FlagAndScore Determina que resultados se crean para
FlagOnly puntuación.
ScoreOnly
num_fields entero Campos para informar.
discard_records tag Indica si los registros se descartan del resultado
o no.
discard_anomalous_records tag Indicador de cuando descartar los registros
anómalos o no anómalos. El valor
predeterminado es off, que significa que se
descartan los registros no anómalos. En caso
contrario, si es on, se descartan los registros
anómalos. Esta propiedad se activa sólo si la
propiedad discard_records se activa.
Propiedades de applyapriorinode
Los nodos de modelado Apriori pueden utilizarse para generar un nugget de modelo Apriori. El nombre
de script de este nugget de modelo es applyapriorinode. Para obtener más información sobre los scripts
para el propio nodo de modelado, consulte “propiedades de apriorinode” en la página 187
Tabla 154. propiedades de applyapriorinode.
Propiedades de applyapriorinode Valores Descripción de la propiedad
max_predictions número (entero)
ignore_unmatached tag
allow_repeats tag
check_basket NoPredictions
Predictions
NoCheck
criterio Confianza
Soporte
RuleSupport
Lift
Capacidad de
despliegue
271
Propiedades de applyassociationrulesnode
El nodo de modelado de reglas de asociación se puede utilizar para generar un nugget de modelo de
reglas de asociación. El nombre de script de este nugget de modelo es applyassociationrulesnode. Para
obtener más información sobre los scripts para propio nodo de modelado, consulte “propiedades
associationrulesnode” en la página 188.
Tabla 155. propiedades de applyassociationrulesnode
Propiedades de
applyassociationrulesnode Tipo de datos Descripción de la propiedad
max_predictions entero El número máximo de reglas que se pueden
aplicar a cada entrada de la puntuación.
criterio Confianza Seleccione la medida utilizada para determinar la
Rulesupport fuerza de las reglas.
Lift
Conditionsupport
Capacidad de despliegue
allow_repeats Booleana Determine si las reglas con la misma predicción
se incluyen en la puntuación.
check_input NoPredictions
Predictions
NoCheck
Propiedades de applyautoclassifiernode
Los nodos de modelado de clasificador automático se pueden utilizar para crear un nugget de modelo
Clasificador automático. El nombre de script de este nugget de modelo es applyautoclassifiernode. Para
obtener más información sobre los scripts para el propio nodo de modelado, “propiedades de
autoclassifiernode” en la página 191
Tabla 156. propiedades de applyautoclassifiernode.
Propiedades de
applyautoclassifiernode Valores Descripción de la propiedad
flag_ensemble_method Voting Especifica el método utilizado para
ConfidenceWeightedVoting determinar la puntuación del
RawPropensityWeightedVoting conjunto. Este conjunto sólo se aplica
HighestConfidence si el objetivo seleccionado es un
AverageRawPropensity campo de marca.
flag_voting_tie_selection Random Si se selecciona un método de
HighestConfidence votación, especifica cómo se
RawPropensity resolverán los empates. Este conjunto
sólo se aplica si el objetivo
seleccionado es un campo de marca.
set_ensemble_method Voting Especifica el método utilizado para
ConfidenceWeightedVoting determinar la puntuación del
HighestConfidence conjunto. Este conjunto sólo se aplica
si el objetivo seleccionado es un
campo de conjunto.
set_voting_tie_selection Random Si se selecciona un método de
HighestConfidence votación, especifica cómo se
resolverán los empates. Este conjunto
sólo se aplica si el objetivo
seleccionado es un campo nominal.
Propiedades de applyautonumericnode
Los nodos de modelado autonumérico se pueden utilizar para crear un nugget de modelo Autonumérico.
El nombre de script de este nugget de modelo es applyautonumericnode. Para obtener más información
sobre los scripts para el propio nodo de modelado, “propiedades de autonumericnode” en la página 194
Tabla 157. propiedades de applyautonumericnode.
Propiedades de
applyautonumericnode Valores Descripción de la propiedad
calculate_standard_error tag
Propiedades de applybayesnetnode
Los nodos de modelado de red bayesiana pueden utilizarse para generar un nugget de modelo de red
bayesiana. El nombre de script de este nugget de modelo es applybayesnetnode. Para obtener más
información sobre los scripts para el propio nodo de modelado, consulte “Propiedades de bayesnetnode”
en la página 196.
Tabla 158. propiedades de applybayesnetnode.
Propiedades de applybayesnetnode Valores Descripción de la propiedad
all_probabilities tag
raw_propensity tag
adjusted_propensity tag
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applyc50node
Los nodos de modelado C5.0 pueden utilizarse para generar un nugget de modelo C5.0. El nombre de
script de este nugget de modelo es applyc50node. Para obtener más información sobre los scripts para el
propio nodo de modelado, consulte “propiedades de c50node” en la página 198.
Tabla 159. propiedades de applyc50node.
Propiedades de applyc50node Valores Descripción de la propiedad
sql_generate Nunca Se utiliza para establecer las opciones de
NoMissingValues generación de SQL durante la ejecución del
conjunto de reglas.
calculate_conf tag Disponible cuando la generación de SQL
está activada. Esta propiedad incluye los
cálculos de confianza en el árbol generado.
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applycartnode
Se pueden utilizar los nodos de modelado C&RT para generar un nugget de modelo C&RT. El nombre de
script de este nugget de modelo es applycartnode. Para obtener más información sobre los scripts para el
propio nodo de modelado, consulte “propiedades de cartnode” en la página 200.
Tabla 160. propiedades de applycartnode.
Propiedades de applycartnode Valores Descripción de la propiedad
enable_sql_generation Nunca Se utiliza para establecer las opciones de
MissingValues generación de SQL durante la ejecución del
NoMissingValues conjunto de reglas.
calculate_conf tag Disponible cuando la generación de SQL
está activada. Esta propiedad incluye los
cálculos de confianza en el árbol generado.
display_rule_id tag Añade un campo en el resultado de
puntuación que indica el ID para el nodo
terminal al que se asigna cada registro.
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applychaidnode
Los nodos de modelado CHAID pueden utilizarse para generar un nugget de modelo CHAID. El nombre
de script de este nugget de modelo es applychaidnode. Para obtener más información sobre los scripts para
el propio nodo de modelado, consulte “propiedades de chaidnode” en la página 203.
Tabla 161. propiedades de applychaidnode.
Propiedades de applychaidnode Valores Descripción de la propiedad
enable_sql_generation Nunca Se utiliza para establecer las opciones de
MissingValues generación de SQL durante la ejecución del
conjunto de reglas.
calculate_conf tag
display_rule_id tag Añade un campo en el resultado de
puntuación que indica el ID para el nodo
terminal al que se asigna cada registro.
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applydecisionlistnode
Los nodos de modelado Lista de decisiones pueden utilizarse para generar un nugget de modelo Lista de
decisiones. El nombre de script de este nugget de modelo es applydecisionlistnode. Para obtener más
información sobre los scripts para el propio nodo de modelado, consulte “Propiedades de
decisionlistnode” en la página 206.
Tabla 163. propiedades de applydecisionlistnode.
Propiedades de
applydecisionlistnode Valores Descripción de la propiedad
enable_sql_generation tag Cuando se establece en true, IBM SPSS
Modeler intenta enviar el modelo Lista de
decisiones a SQL.
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applydiscriminantnode
Los nodos de modelado Discriminante pueden utilizarse para generar un nugget de modelo
Discriminante. El nombre de script de este nugget de modelo es applydiscriminantnode. Para obtener más
información sobre los scripts para el propio nodo de modelado, consulte “propiedades de
discriminantnode” en la página 208.
Tabla 164. propiedades de applydiscriminantnode.
Propiedades de
applydiscriminantnode Valores Descripción de la propiedad
calculate_raw_propensities tag
calculate_adjusted_propensities tag
score_script = """
import json
import [Link]
from [Link] import LabeledPoint
from [Link] import DenseVector
from [Link] import DecisionTreeModel
from [Link] import StringType, StructField
cxt = [Link]()
if [Link]():
_schema = [Link]()
_schema.[Link](StructField("Prediction", StringType(), nullable=True))
[Link](_schema)
else:
df = [Link]()
_modelPath = [Link]("TreeModel")
metadata = [Link]([Link]("[Link]"))
schema = [Link][:]
target = "Drug"
predictors = ["Age","BP","Sex","Cholesterol","Na","K"]
lookup = {}
for i in range(0,len(schema)):
lookup[schema[i][0]] = i
def row2LabeledPoint(dm,lookup,target,predictors,row):
target_index = lookup[target]
tval = dm[target_index].index(row[target_index])
pvals = []
for predictor in predictors:
predictor_index = lookup[predictor]
if isinstance(dm[predictor_index],list):
pval = row[predictor_index] in dm[predictor_index] and
dm[predictor_index].index(row[predictor_index]) or -1
else:
pval = row[predictor_index]
[Link](pval)
return LabeledPoint(tval, DenseVector(pvals))
def addPrediction(x,dm,lookup,target):
_schema = [Link]()
_schema.[Link](StructField("Prediction", StringType(), nullable=True))
rdd2 = [Link](predictions).map(lambda x:addPrediction(x, metadata, lookup, target))
outDF = [Link]().createDataFrame(rdd2, _schema)
[Link](outDF)
"""
[Link]("python_syntax", score_script)
Ejemplo de R
#### Ejemplo de script de R
[Link]("r_syntax", """
result<-predict(modelerModel,newdata=modelerData)
modelerData<-cbind(modelerData,result)
var1<-c(fieldName="NaPrediction",fieldLabel="",fieldStorage="real",fieldMeasure="",
fieldFormat="",fieldRole="")
modelerDataModel<-[Link](modelerDataModel,var1)""")
Tabla 165. Propiedades de applyextension
Propiedades de applyextension Valores Descripción de la propiedad
r_syntax cadena Sintaxis de scripts R para la
puntuación del modelo.
python_syntax cadena Sintaxis de scripts Python para la
puntuación de modelo.
use_batch_size flag Habilitar uso de proceso por lotes.
batch_size entero Especifique el número de registros de
datos que se deben incluir en cada
lote.
convert_flags StringsAndDoubles Opción para convertir campos de
LogicalValues distintivos.
convert_missing flag Opción para convertir valores
perdidos al valor NA de R.
convert_datetime flag Opción para convertir las variables
con los formatos de fecha o de fecha
y hora para formatos de fecha/hora
R.
convert_datetime_class POSIXct Opciones para especificar a qué
POSIXlt formato se convierten las variables
con los formatos de fecha o de fecha
y hora.
Propiedades de applyfactornode
Los nodos de modelado PCA/Factorial pueden utilizarse para generar un nugget de modelo
PCA/Factorial. El nombre de script de este nugget de modelo es applyfactornode. No existe ninguna otra
propiedad para este nugget de modelo. Para obtener más información sobre los scripts para el propio
nodo de modelado, consulte “propiedades de factornode” en la página 212.
Propiedades de applygeneralizedlinearnode
Los nodos de modelado lineal generalizado (genlin) pueden utilizarse para generar un nugget de modelo
lineal generalizado. El nombre de script de este nugget de modelo es applygeneralizedlinearnode. Para
obtener más información sobre los scripts para el propio nodo de modelado, consulte “propiedades de
genlinnode” en la página 215.
Tabla 167. propiedades de applygeneralizedlinearnode.
Propiedades de
applygeneralizedlinearnode Valores Descripción de la propiedad
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applyglmmnode
Los nodos de modelado GLMM pueden utilizarse para generar un nugget de modelo GLMM. El nombre
de script de este nugget de modelo es applyglmmnode. Para obtener más información sobre los scripts para
el propio nodo de modelado, consulte “Propiedades de glmmnode” en la página 218.
Tabla 168. Propiedades de applyglmmnode.
Propiedades de applyglmmnode Valores Descripción de la propiedad
confidence onProbability Base para calcular el valor de confianza de
onIncrease la puntuación: probabilidad más alta
predicha, o la diferencia entre la
probabilidad más alta predicha y la
segunda probabilidad más alta.
score_category_probabilities tag Si es True, genera las probabilidades
predichas para objetivos categóricos. Se
crea un campo para cada categoría. El valor
predeterminado es False.
max_categories entero Número máximo de categorías para el que
se van a predecir las probabilidades. Sólo
se utiliza si score_category_probabilities
es True.
Propiedades de applygle
Los nodos de modelado GLE pueden utilizarse para generar un nugget de modelo GLE. El nombre de
script de este nugget de modelo es applygle. Para obtener más información sobre los scripts para el propio
nodo de modelado, consulte “Propiedades de gle” en la página 222.
Tabla 169. Propiedades de applygle
Propiedades de applygle Valores Descripción de la propiedad
enable_sql_generation udf Se utiliza para establecer las opciones de
native generación de SQL durante la ejecución de
ruta. Elija si desea realizar una retrotracción
a la base de datos y puntuar utilizando un
adaptador de puntuación de SPSS Modeler
Server (si está conectado a una base de
datos con un adaptador de puntuación
instalado) o puntuar dentro de SPSS
Modeler.
Propiedades de applykmeansnode
Los nodos de modelado K-medias pueden utilizarse para generar un nugget de modelo K-medias. El
nombre de script de este nugget de modelo es applykmeansnode. No existe ninguna otra propiedad para
este nugget de modelo. Para obtener más información sobre los scripts para el propio nodo de modelado,
consulte “propiedades de kmeansnode” en la página 227.
Propiedades de applykohonennode
Los nodos de modelado Kohonen pueden utilizarse para generar un nugget de modelo Kohonen. El
nombre de script de este nugget de modelo es applykohonennode. No existe ninguna otra propiedad para
este nugget de modelo. Para obtener más información sobre los scripts para el propio nodo de modelado,
consulte “propiedades de c50node” en la página 198.
Propiedades de applylinearnode
Los nodos de modelado lineal pueden utilizarse para generar un nugget de modelo lineal. El nombre de
script de este nugget de modelo es applylinearnode. Para obtener más información sobre los scripts para el
propio nodo de modelado, consulte “Propiedades de linearnode” en la página 231.
Tabla 171. Propiedades de applylinearnode.
Propiedades de linear Valores Descripción de la propiedad
use_custom_name tag
custom_name cadena
enable_sql_generation udf Se utiliza para establecer las opciones de
native generación de SQL durante la ejecución de
puresql ruta. Las opciones se van a retrotraer a la
base de datos y la puntuación mediante el
adaptador de puntuación SPSS® Modeler
Server (si está conectado a una base de
datos con un adaptador de puntuación
instalado), para puntuar en SPSS Modeler,
o para retrotraer a la base de datos y
puntuar mediante SQL.
Propiedades de applylinearasnode
Los nodos de modelado Linear-AS pueden utilizarse para generar un nugget de modelo Linear-AS. El
nombre de script de este nugget de modelo es applylinearasnode. Para obtener más información sobre los
scripts para el propio nodo de modelado, consulte “Propiedades de linearasnode” en la página 232.
Tabla 172. Propiedades de applylinearasnode
Propiedad applylinearasnode Valores Descripción de la propiedad
enable_sql_generation udf El valor predeterminado es udf.
native
Propiedades de applylsvmnode
Los nodos de modelado LSVM pueden utilizarse para generar un nugget de modelo LSVM. El nombre
de script de este nugget de modelo es applylsvmnode. Para obtener más información sobre los scripts para
el propio nodo de modelado, consulte “propiedades de lsvmnode” en la página 237.
Tabla 174. propiedades de applylsvmnode
Propiedades de applylsvmnode Valores Descripción de la propiedad
calculate_raw_propensities flag Especifica si deben calcularse puntuaciones de
propensión en bruto.
enable_sql_generation udf Especifica si debe puntuarse utilizando el
native adaptador de puntuación (si está instalado) o
en proceso, o puntuar fuera de la base de
datos.
Propiedades de applyneuralnetnode
Los nodos de modelado Red neuronal pueden utilizarse para generar un nugget de modelo Red
neuronal. El nombre de script de este nugget de modelo es applyneuralnetnode. Para obtener más
información sobre los scripts para el propio nodo de modelado, consulte “propiedades de neuralnetnode”
en la página 238.
Precaución: Una versión más reciente del nodo de modelado Red neural, con características mejoradas,
está disponible en esta versión y se describe en la sección siguiente (applyneuralnetwork). Aunque la
versión anterior sigue estando disponible, le recomendamos actualizar sus scripts para que se usen la
nueva versión. En este documento se incluyen detalles de la versión anterior como referencia, pero en
versiones futuras dejará de ser compatible.
Tabla 175. propiedades de applyneuralnetnode.
Propiedades de applyneuralnetnode Valores Descripción de la propiedad
calculate_conf tag Disponible cuando la generación de SQL está
activada. Esta propiedad incluye los cálculos
de confianza en el árbol generado.
enable_sql_generation tag
nn_score_method Diferencia
SoftMax
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applyocsvmnode
Los nodos SVM de una clase se pueden utilizar para generar un nugget de modelo SVM de una clase. El
nombre de script de este nugget de modelo es applyocsvmnode. No existe ninguna otra propiedad para
este nugget de modelo. Para obtener más información sobre los scripts para el propio nodo de modelado,
consulte “Propiedades de ocsvmnode” en la página 351.
Propiedades de applyquestnode
Los nodos de modelado QUEST pueden utilizarse para generar un nugget de modelo QUEST. El nombre
de script de este nugget de modelo es applyquestnode. Para obtener más información sobre los scripts para
el propio nodo de modelado, consulte “propiedades de questnode” en la página 242.
Tabla 177. propiedades de applyquestnode.
Propiedades de applyquestnode Valores Descripción de la propiedad
enable_sql_generation Nunca Se utiliza para establecer las opciones de
MissingValues generación de SQL durante la ejecución del
NoMissingValues conjunto de reglas.
calculate_conf tag
display_rule_id tag Añade un campo en el resultado de
puntuación que indica el ID para el nodo
terminal al que se asigna cada registro.
Propiedades de applyr
Los nodos de modelado R pueden utilizarse para generar un nugget de modelo R. El nombre de script de
este nugget de modelo es applyr. Para obtener más información sobre los scripts para el propio nodo de
modelado, consulte “propiedades de buildr” en la página 197.
Tabla 178. propiedades de applyr
Propiedades de applyr Valores Descripción de la propiedad
score_syntax cadena Sintaxis de scripts R para la
puntuación del modelo.
convert_flags StringsAndDoubles Opción para convertir campos de
LogicalValues distintivos.
convert_datetime flag Opción para convertir las variables
con los formatos de fecha o de fecha
y hora para formatos de fecha/hora
R.
convert_datetime_class POSIXct Opciones para especificar a qué
POSIXlt formato se convierten las variables
con los formatos de fecha o de fecha
y hora.
convert_missing flag Opción para convertir los valores que
faltan al valor R NA.
use_batch_size flag Habilite el uso del proceso por lotes
batch_size entero Especifique el número de registros de
datos que se incluirán en cada lote
Propiedades applyrandomtrees
El nodo de modelador Árboles aleatorios se puede utilizar para generar un nugget del modelo Árboles
aleatorios. El nombre de script de este nugget de modelo es applyrandomtrees. Para obtener más
información sobre los scripts para el propio nodo de modelado, consulte “propiedades randomtrees” en
la página 244.
Tabla 179. propiedades applyrandomtrees
Propiedades applyrandomtrees Valores Descripción de la propiedad
calculate_conf flag Esta propiedad incluye cálculos de
confianza en el árbol generado.
enable_sql_generation udf Se utiliza para establecer las opciones de
native generación de SQL durante la ejecución de
ruta. Elija si desea realizar una retrotracción
a la base de datos y puntuar utilizando un
adaptador de puntuación de SPSS Modeler
Server (si está conectado a una base de
datos con un adaptador de puntuación
instalado) o puntuar dentro de SPSS
Modeler.
propiedades de applyselflearningnode
Los nodos de modelado de modelo de respuesta de autoaprendizaje (SLRM) pueden utilizarse para
generar un nugget de modelo SLRM. El nombre de script de este nugget de modelo es
applyselflearningnode. Para obtener más información sobre los scripts para el propio nodo de modelado,
consulte “propiedades de slrmnode” en la página 249.
Tabla 180. propiedades de applyselflearningnode.
Propiedades de applyselflearningnode Valores Descripción de la propiedad
max_predictions number
randomization number
scoring_random_seed number
sort ascending Especifica si se mostrarán primero las ofertas
descending con las puntuaciones más altas o más bajas.
model_reliability tag Tiene en cuenta la opción de fiabilidad del
modelo de la pestaña Configuración.
Propiedades de applysequencenode
Los nodos de modelado Secuencia pueden utilizarse para generar un nugget de modelo Secuencia. El
nombre de script de este nugget de modelo es applysequencenode. No existe ninguna otra propiedad para
este nugget de modelo. Para obtener más información sobre los scripts para el propio nodo de modelado,
consulte “propiedades de sequencenode” en la página 248.
Propiedades de applysvmnode
Los nodos de modelado SVM pueden utilizarse para generar un nugget de modelo SVM. El nombre de
script de este nugget de modelo es applysvmnode. Para obtener más información sobre los scripts para el
propio nodo de modelado, consulte “propiedades de svmnode” en la página 254.
Tabla 181. propiedades de applysvmnode.
Propiedades de applysvmnode Valores Descripción de la propiedad
all_probabilities tag
calculate_raw_propensities tag
calculate_adjusted_propensities tag
Propiedades de applystpnode
El nodo de modelado STP puede utilizarse para generar un nugget de modelo asociado, que muestra la
salida del modelo en el Visor de salida. El nombre de script de este nugget de modelo es applystpnode.
Para obtener más información sobre los scripts para el propio nodo de modelado, consulte “propiedades
de stpnode” en la página 250.
Propiedades de applytcmnode
Los nodos de modelado temporal causal (TCM) pueden usarse para generar un nugget de modelo TCM.
El nombre de script de este nugget de modelo es applytcmnode. Para obtener más información sobre los
scripts para el propio nodo de modelado, consulte “Propiedades de tcmnode” en la página 255.
Tabla 183. Propiedades de applytcmnode
Propiedades de applytcmnode Valores Descripción de la propiedad
ext_future booleano
ext_future_num entero
noise_res booleano
conf_limits booleano
target_fields lista
target_series lista
Propiedades applyts
El nodo de modelado Serie temporal se puede utilizar para generar un nugget de modelo Serie temporal.
El nombre de scripts de este nugget de modelo es applyts. Para obtener más información sobre los scripts
para el propio nodo de modelado, consulte “Propiedades ts” en la página 259.
Tabla 184. propiedades applyts
Propiedades applyts Valores Descripción de la propiedad
extend_records_into_future Booleana
ext_future_num entero
compute_future_values_input Booleana
forecastperiods entero
noise_res booleano
conf_limits booleano
target_fields lista
target_series lista
includeTargets campo
Propiedades de applytreeas
Los nodos de modelado Tree-AS pueden utilizarse para generar un nugget de modelo Tree-AS. El nombre
de script de este nugget de modelo es applytreenas. Para obtener más información sobre los scripts para el
propio nodo de modelado, consulte “propiedades de treeas” en la página 265.
Tabla 186. propiedades de applytreeas
Propiedades de applytreeas Valores Descripción de la propiedad
calculate_conf flag Esta propiedad incluye cálculos de
confianza en el árbol generado.
display_rule_id flag Añade un campo en el resultado de
puntuación que indica el ID para el nodo
terminal al que se asigna cada registro.
enable_sql_generation udf Se utiliza para establecer las opciones de
native generación de SQL durante la ejecución de
ruta. Elija si desea realizar una retrotracción
a la base de datos y puntuar utilizando un
adaptador de puntuación de SPSS Modeler
Server (si está conectado a una base de
datos con un adaptador de puntuación
instalado) o puntuar dentro de SPSS
Modeler.
Propiedades de applytwostepnode
Los nodos de modelado Bietápico pueden utilizarse para generar un nugget de modelo Bietápico. El
nombre de script de este nugget de modelo es applytwostepnode. No existe ninguna otra propiedad para
este nugget de modelo. Para obtener más información sobre los scripts para el propio nodo de modelado,
consulte “Propiedades de twostepnode” en la página 267.
Propiedades de applytwostepAS
Los nodos de modelado Bietápico AS pueden utilizarse para generar un nugget de modelo Bietápico AS.
El nombre de script de este nugget de modelo es applytwostepAS. Para obtener más información sobre los
scripts para el propio nodo de modelado, consulte “Propiedades de twostepAS” en la página 268.
Tabla 187. Propiedades de applytwostepAS
Propiedades de applytwostepAS Valores Descripción de la propiedad
enable_sql_generation udf Se utiliza para establecer las opciones de
native generación de SQL durante la ejecución de
ruta. Las opciones son para retrotraer a la
base de datos y puntuar utilizando un
adaptador de puntuación de SPSS® Modeler
Server (si está conectado a una base de
datos con un adaptador de puntuación
instalado) o para puntuar en SPSS Modeler.
Propiedades de applyxgboostlinearnode
Los nodos XGBoost Linear se pueden utilizar para generar un nugget de modelo de XGBoost Linear. El
nombre de script de este nugget de modelo es applyxgboostlinearnode. No existe ninguna otra propiedad
para este nugget de modelo. Para obtener más información sobre los scripts para el propio nodo de
modelado, consulte “Propiedades xgboostlinearnode” en la página 357.
Por ejemplo, el siguiente fragmento de script muestra la creación de un modelo de árboles de decisión de
Microsoft mediante la interfaz de scripts de IBM SPSS Modeler:
stream = [Link]()
msbuilder = [Link]("mstreenode", "MSBuilder", 200, 200)
[Link]("analysis_server_name", ’localhost’)
[Link]("analysis_database_name", ’TESTDB’)
[Link]("mode", ’Expert’)
[Link]("datasource", ’LocalServer’)
[Link]("target", ’Drug’)
[Link]("inputs", [’Age’, ’Sex’])
[Link]("unique_field", ’IDX’)
[Link]("custom_fields", True)
[Link]("model_name", ’MSDRUG’)
Las siguientes propiedades son comunes a los nodos de modelado de bases de datos de Microsoft.
Tabla 188. Propiedades comunes de nodos de Microsoft
Propiedades comunes de nodo de
Microsoft Valores Descripción de la propiedad
analysis_database_name cadena Nombre de la base de datos de Analysis Services.
analysis_server_name cadena Nombre del host de Analysis Services.
use_transactional_data flag Especifica si los datos de entrada están en formato
tabular o transaccional.
inputs lista Campos de entrada de datos tabulares.
target campo Campo predicho (no aplicable a nodo Clúster de MS o
nodos de Agrupación en clústeres de secuencias).
Árbol de decisión de MS
No hay propiedades específicas para los nodos del tipo mstreenode. Consulte las propiedades comunes
de Microsoft que se indican al comienzo de esta sección.
Clúster de MS
No hay propiedades específicas para los nodos del tipo msclusternode. Consulte las propiedades
comunes de Microsoft que se indican al comienzo de esta sección.
Reglas de asociación de MS
Las siguientes propiedades específicas están disponibles para los nodos del tipo msassocnode:
Tabla 189. propiedades de msassocnode
Propiedades de msassocnode Valores Descripción de la propiedad
id_field campo Identifica todas las transacciones en los datos.
trans_inputs lista Los campos de entrada de datos transaccionales.
transactional_target campo Campo predicho (datos transaccionales).
Bayesiano ingenuo de MS
No hay propiedades específicas para los nodos del tipo msbayesnode. Consulte las propiedades comunes
de Microsoft que se indican al comienzo de esta sección.
Regresión lineal de MS
No hay propiedades específicas para los nodos del tipo msregressionnode. Consulte las propiedades
comunes de Microsoft que se indican al comienzo de esta sección.
Red neuronal de MS
No hay propiedades específicas para los nodos del tipo msneuralnetworknode. Consulte las propiedades
comunes de Microsoft que se indican al comienzo de esta sección.
Regresión logística de MS
No hay propiedades específicas para los nodos del tipo mslogisticnode. Consulte las propiedades
comunes de Microsoft que se indican al comienzo de esta sección.
No hay propiedades específicas para los nodos del tipo mstimeseriesnode. Consulte las propiedades
comunes de Microsoft que se indican al comienzo de esta sección.
Clúster de secuencias de MS
Las siguientes propiedades específicas están disponibles para los nodos del tipo mssequenceclusternode:
Tabla 190. propiedades de mssequenceclusternode
Propiedades de mssequenceclusternode Valores Descripción de la propiedad
id_field campo Identifica todas las transacciones en los datos.
input_fields lista Los campos de entrada de datos transaccionales.
sequence_field campo Identificador de secuencia.
target_field campo Campo predicho (datos tabulares).
Estos parámetros se derivan de SQL Server. Para ver los parámetros relevantes para cada nodo:
1. Coloque un nodo de origen de base de datos en el lienzo.
2. Abra el nodo de origen de base de datos.
3. Seleccione un origen válido en la lista desplegable Origen de datos.
4. Seleccione una tabla válida en la lista Nombre de tabla.
5. Pulse en Aceptar para cerrar el nodo de origen de base de datos.
6. Conecte un nodo de modelado de bases de datos de Microsoft cuyas propiedades desee conocer.
7. Abra el nodo de modelado de bases de datos.
8. Seleccione la pestaña Experto.
Árbol de decisión de MS
Tabla 191. Propiedades de Árbol de decisión de MS
Propiedades de applymstreenode Valores Descripción
analysis_database_name cadena Este nodo se puede puntuar directamente en una ruta.
Regresión lineal de MS
Tabla 192. Propiedades de Regresión lineal de MS
Propiedades de
applymsregressionnode Valores Descripción
analysis_database_name cadena Este nodo se puede puntuar directamente en una ruta.
Red neuronal de MS
Tabla 193. Propiedades de Red neuronal de MS
Propiedades de
applymsneuralnetworknode Valores Descripción
analysis_database_name cadena Este nodo se puede puntuar directamente en una ruta.
Regresión logística de MS
Tabla 194. Propiedades de Regresión logística de MS
Propiedades de applymslogisticnode Valores Descripción
analysis_database_name cadena Este nodo se puede puntuar directamente en una ruta.
Series temporales de MS
Tabla 195. Propiedades de MS Time Series
Propiedades de
applymstimeseriesnode Valores Descripción
analysis_database_name cadena Este nodo se puede puntuar directamente en una ruta.
Clúster de secuencias de MS
Tabla 196. Propiedades de Agrupación en clústeres de secuencias de MS
propiedades de
applymssequenceclusternode Valores Descripción
analysis_database_name cadena Este nodo se puede puntuar directamente en una ruta.
Las siguientes propiedades están disponibles para los nodos del tipo oranbnode.
Tabla 198. propiedades de oranbnode
Propiedades de oranbnode Valores Descripción de la propiedad
singleton_threshold número 0.0–1.0.*
pairwise_threshold número 0.0–1.0.*
priors Datos
Equal
Personalizado
custom_priors structured Propiedad estructurada de la siguiente forma:
set :oranbnode.custom_priors = [[drugA 1][drugB
2][drugC 3][drugX 4][drugY 5]]
Las siguientes propiedades están disponibles para los nodos del tipo oraabnnode.
Tabla 199. propiedades de oraabnnode
Propiedades de oraabnnode Valores Descripción de la propiedad
model_type SingleFeature
MultiFeature
NaiveBayes
use_execution_time_limit flag *
execution_time_limit entero El valor debe ser mayor que 0.*
max_naive_bayes_predictors entero El valor debe ser mayor que 0.*
max_predictors entero El valor debe ser mayor que 0.*
priors Datos
Equal
Personalizado
Las siguientes propiedades están disponibles para los nodos del tipo orasvmnode.
Tabla 200. propiedades de orasvmnode
Propiedades de orasvmnode Valores Descripción de la propiedad
active_learning Enable
Disable
kernel_function Lineal
Gaussian
Sistema
normalization_method zscore
minmax
none
kernel_cache_size entero Solamente kernel gaussiano. El valor
debe ser mayor que 0.*
convergence_tolerance número El valor debe ser mayor que 0.*
use_standard_deviation flag Solamente kernel gaussiano.*
standard_deviation número El valor debe ser mayor que 0.*
use_epsilon flag Solamente modelos de regresión.*
epsilon número El valor debe ser mayor que 0.*
use_complexity_factor flag *
complexity_factor número *
use_outlier_rate flag Solamente variantes de una clase.*
outlier_rate número Solamente variantes de una clase.
0.0–1.0.*
weights Datos
Equal
Personalizado
custom_weights structured Propiedad estructurada de la
siguiente forma:
set :orasvmnode.custom_weights =
[[drugA 1][drugB 2][drugC 3][drugX
4][drugY 5]]
Las siguientes propiedades están disponibles para los nodos del tipo oraglmnode.
Tabla 201. Propiedades de oraglmnode
Propiedades de oraglmnode Valores Descripción de la propiedad
normalization_method zscore
minmax
none
missing_value_handling ReplaceWithMean
UseCompleteRecords
use_row_weights flag *
row_weights_field campo *
save_row_diagnostics flag *
row_diagnostics_table cadena *
coefficient_confidence número *
use_reference_category flag *
reference_category cadena *
ridge_regression Auto *
Off
On
parameter_value número *
vif_for_ridge flag *
Las siguientes propiedades están disponibles para los nodos del tipo oradecisiontreenode.
Tabla 202. Propiedades de oradecisiontreenode
Propiedades de oradecisiontreenode Valores Descripción de la propiedad
use_costs flag
impurity_metric Entropy
Gini
term_max_depth entero 2–20.*
term_minpct_node número 0.0–10.0.*
term_minpct_split número 0.0–20.0.*
term_minrec_node entero El valor debe ser mayor que 0.*
term_minrec_split entero El valor debe ser mayor que 0.*
display_rule_ids flag *
Las siguientes propiedades están disponibles para los nodos del tipo oraoclusternode.
Tabla 203. Propiedades de oraoclusternode
Propiedades de oraoclusternode Valores Descripción de la propiedad
max_num_clusters entero El valor debe ser mayor que 0.
max_buffer entero El valor debe ser mayor que 0.*
sensitivity número 0.0–1.0.*
K-medias de Oracle
Las siguientes propiedades están disponibles para los nodos del tipo orakmeansnode.
Tabla 204. Propiedades de orakmeansnode
Propiedades de orakmeansnode Valores Descripción de la propiedad
num_clusters entero El valor debe ser mayor que 0.
normalization_method zscore
minmax
none
distance_function Euclidean
Cosine
NMF de Oracle
Las siguientes propiedades están disponibles para los nodos del tipo oranmfnode.
Tabla 205. Propiedades de oranmfnode
Propiedades de oranmfnode Valores Descripción de la propiedad
normalization_method minmax
none
use_num_features flag *
num_features entero 0–1. El algoritmo estima el valor predeterminado a
partir de los datos.*
random_seed número *
num_iterations entero 0–500.*
Apriori de Oracle
Las siguientes propiedades están disponibles para los nodos del tipo oraapriorinode.
Tabla 206. Propiedades de oraapriorinode
Propiedades de oraapriorinode Valores Descripción de la propiedad
content_field campo
id_field campo
max_rule_length entero 2–20.
min_confidence número 0.0–1.0.
min_support número 0.0–1.0.
use_transactional_data flag
No hay propiedades específicas para los nodos del tipo oramdlnode. Consulte las propiedades comunes
de Oracle que se indican al comienzo de esta sección.
Las siguientes propiedades están disponibles para los nodos del tipo oraainode.
Tabla 207. Propiedades de oraainode
Propiedades de oraainode Valores Descripción de la propiedad
custom_fields flag Si es verdadero, le permite especificar el objetivo, la
entrada y otros campos del nodo actual. Si es falso,
se utiliza la configuración actual de un nodo Tipo
situado en un punto anterior de la ruta.
selection_mode ImportanceLevel
ImportanceValue
TopN
select_important flag Si selection_mode se establece en ImportanceLevel,
determina si se seleccionan los campos importantes.
important_label cadena Especifica la etiqueta para la clasificación como
"important".
select_marginal flag Si selection_mode se establece en ImportanceLevel,
determina si se seleccionan los campos marginales.
marginal_label cadena Especifica la etiqueta para la clasificación como
"marginal".
important_above número 0.0–1.0.
O-clúster de Oracle
K-medias de Oracle
La siguiente propiedad está disponible para los nodos del tipo applyoranmfnode:
Tabla 209. propiedades de applyoranmfnode
Propiedades de applyoranmfnode Valores Descripción de la propiedad
display_all_features flag
Apriori de Oracle
Este nugget de modelo no se puede aplicar en los scripts.
LMD de Oracle
donde:
<dsn> es el nombre del origen de datos
<username> y <psw> son el nombre de usuario y la
contraseña para la base de datos
<catname> es el nombre de catálogo
<conn_attribs> son los atributos de conexión
true | false indica si la contraseña es necesaria.
El valor predeterminado es la
ponderación de 1 para todas las
clases.
pruning_measure Acc El valor predeterminado es Acc
wAcc (precisión). wAcc alternativo (precisión
ponderada) tiene en cuenta las
ponderaciones de clase mientras se
aplica la poda.
K-medias de Netezza
Las siguientes propiedades están disponibles para los nodos del tipo netezzakmeansnode.
Tabla 212. Propiedades de netezzakmeansnode
Propiedades de netezzakmeansnode Valores Descripción de la propiedad
distance_measure Euclidean Método que se debe utilizar para medir la distancia
Manhattan entre puntos de datos.
Canberra
máximo
num_clusters entero Número de clústeres que se deben crear; el valor
predeterminado es 3.
max_iterations entero Número de iteraciones de algoritmos después de los
cuáles se debe detener la prueba del modelo; el valor
predeterminado es 5.
rand_seed entero Semilla aleatoria que se debe utilizar para replicar los
resultados del análisis; el valor predeterminado es 12345.
Las siguientes propiedades están disponibles para los nodos del tipo netezzabayesnode.
Tabla 213. Propiedades de netezzabayesnode
Propiedades de netezzabayesnode Valores Descripción de la propiedad
base_index entero Identificador numérico asignado al primer campo de
entrada de gestión interna; el valor predeterminado es
777.
sample_size entero Tamaño de la muestra que se tomará si el número de
atributos es muy grande; el valor predeterminado es
10.000.
display_additional_information flag Si es verdadero, muestra información adicional sobre el
progreso en un cuadro de diálogo de mensaje.
type_of_prediction best Tipo de algoritmo de predicción que se utilizará: el
vecinos mejor (vecino más correlacionado), vecinos (predicción
nn-neighbors ponderada de vecinos), o vecinos NN (vecinos no
nulos).
Las siguientes propiedades están disponibles para los nodos del tipo netezzanaivebayesnode.
Tabla 214. propiedades de netezzanaivebayesnode
Propiedades de
netezzanaivebayesnode Valores Descripción de la propiedad
compute_probabilities flag Si es verdadero, produce un campo de nivel de
confianza (probabilidad) y el campo de predicción.
use_m_estimation flag Si es verdadero, utiliza la técnica m-estimation para
evitar probabilidades de cero durante el cálculo.
KNN de Netezza
Las siguientes propiedades están disponibles para los nodos del tipo netezzaknnnode.
Tabla 215. Propiedades de netezzaknnnode
Propiedades de netezzaknnnode Valores Descripción de la propiedad
weights structured Propiedad estructurada que se utiliza para asignar
ponderaciones a clases individuales. Ejemplo:
set :[Link] = [[drugA 0.3][drugB
0.6]]
distance_measure Euclidean Método que se utiliza para medir la distancia entre
Manhattan puntos de datos.
Canberra
Máximo
num_nearest_neighbors entero Número de vecinos más próximos de un caso concreto;
el valor predeterminado es 3.
standardize_measurements flag Si es verdadero, estandariza las mediciones de campos
de entrada continuos antes de calcular los valores de
distancia.
PCA de Netezza
Las siguientes propiedades están disponibles para los nodos del tipo netezzapcanode.
Tabla 217. Propiedades de netezzapcanode
Propiedades de netezzapcanode Valores Descripción de la propiedad
center_data flag Si es verdadero (opción predeterminada), ejecuta el
centrado de datos (también conocido como "sustracción
de media") antes del análisis.
perform_data_scaling flag Si es verdadero, ejecuta la adaptación de los datos antes
del análisis. De esta forma el análisis será menos
arbitrario si las diferentes variables se miden en
unidades diferentes.
force_eigensolve flag Si es verdadero, utiliza un método menos preciso, pero
más rápido para encontrar componentes principales.
pc_number entero El número principal de componentes al que se reducirá
el conjunto de datos; el valor predeterminado es 1.
Las siguientes propiedades están disponibles para los nodos del tipo netezzaregtreenode.
Tabla 218. Propiedades de netezzaregtreenode
Propiedades de netezzaregtreenode Valores Descripción de la propiedad
max_tree_depth entero Número máximo de niveles que
puede crecer el árbol por debajo del
nodo raíz; el valor predeterminado es
10.
split_evaluation_measure Variance Medida de clase de impureza, se
utiliza para evaluar la mejor
ubicación para dividir el árbol; el
valor predeterminado (y la única
opción actualmente) es Variance.
min_improvement_splits número Cantidad mínima para reducir la
impureza antes de que se cree la
nueva división en el árbol.
min_instances_split entero El número mínimo de registros que
se pueden dividir.
pruning_measure mse Método que se utilizará para la poda.
r2
pearson
spearman
prune_tree_options allTrainingData El valor predeterminado es utilizar
partitionTrainingData allTrainingData para calcular la
useOtherTable precisión del modelo. Utilice
partitionTrainingData para
especificar un porcentaje de datos de
prueba por utilizar, o useOtherTable
para utilizar un conjunto de datos de
prueba desde una tabla específica de
la base de datos.
perc_training_data número Si prune_tree_options se establece en
PercTrainingData, especifica el
porcentaje de datos que se utilizará
para entrenamiento.
prune_seed entero Semilla aleatoria que se debe utilizar
para replicar los resultados del
análisis si prune_tree_options se
establece en PercTrainingData; el
valor predeterminado es 1.
pruning_table cadena Nombre de tabla de un conjunto de
datos de poda separado para estimar
la precisión del modelo.
compute_probabilities flag Si es verdadero, especifica que las
varianzas de las clases asignadas se
deben incluir en el resultado.
Las siguientes propiedades están disponibles para los nodos del tipo netezzalineregressionnode.
Tabla 219. Propiedades de netezzalineregressionnode
Propiedades de
netezzalineregressionnode Valores Descripción de la propiedad
use_svd flag Si es verdadero, utiliza la matriz de descomposición de
valores singulares en lugar de la matriz original, para
mayor velocidad y precisión numérica.
include_intercept flag Si es verdadero (valor predeterminado), aumenta la
precisión global de la solución.
calculate_model_diagnostics flag Si es verdadero, calcula el diagnóstico del modelo.
Las siguientes propiedades están disponibles para los nodos del tipo netezzatimeseriesnode.
Tabla 220. Propiedades de netezzatimeseriesnode
Propiedades de
netezzatimeseriesnode Valores Descripción de la propiedad
time_points campo El campo de entrada que contiene los
valores de fecha u hora de la serie
temporal.
time_series_ids campo El campo de entrada que contiene
diversos ID de series temporales;
utilice esta opción si la entrada
contiene más de una serie temporal.
model_table campo Nombre de la tabla de base de datos
en la que se guardará el modelo de
series temporales de Netezza.
description_table campo Nombre de la tabla de entrada que
contiene los nombres y las
descripciones de las series
temporales.
seasonal_adjustment_table campo Nombre de la tabla de salida en la
que se guardarán los valores
ajustados calculados por los
algoritmos de suavizado exponencial
o de descomposición de tendencia
estacional.
algorithm_name SpectralAnalysis o spectral Algoritmo que hay que utilizar para
ExponentialSmoothing o esmoothing el modelado de series temporales.
ARIMA
SeasonalTrendDecomposition o std
trend_name N Tipo de tendencia del suavizado
A exponencial:
DA N - none
M A - aditivo
DM DA -aditivo amortiguado
M - multiplicativo
DM - multiplicativo amortiguado
Ejemplo:
set NZ_DT1.timerange_setting =
’SP’
set NZ_DT1.earliest_time =
’1921-01-01’
set NZ_DT1.latest_time =
’2121-01-01’
arima_setting SD Valor para el algoritmo ARIMA (sólo
SP se utiliza si algorithm_name se
establece en ARIMA):
SD - determinado por el sistema
SP - especificado por el usuario
sd_symbol
sq_symbol
p entero ARIMA: grados no estacionales de
autocorrelación.
q entero ARIMA: valor de derivación no
estacional.
d entero ARIMA: número no estacional de
órdenes de media móvil presentes en
el modelo.
sp entero ARIMA: grados estacionales de
autocorrelación.
sq entero ARIMA: valor de derivación
estacional.
sd entero ARIMA: número estacional de
órdenes de media móvil presentes en
el modelo.
advanced_setting SD Determina cómo se manejan los
SP valores avanzados:
SD - determinado por el sistema
SP - especificado por el usuario
mediante period, units_period y
forecast_setting.
Ejemplo:
set NZ_DT1.advanced_setting = ’SP’
set NZ_DT1.period = 5
set NZ_DT1.units_period = ’d’
punto entero Longitud de ciclo estacional,
especificado junto con units_period.
No aplicable para análisis espectrales.
units_period ms Unidades en que se expresa period:
s ms - milisegundos
min s - segundos
h min - minutos
d h - horas
semana d - días
q wk - semanas
y q - trimestres
y - años
Las siguientes propiedades están disponibles para los nodos del tipo netezzaglmnode.
Tabla 221. Propiedades de netezzaglmnode
Propiedades de netezzaglmnode Valores Descripción de la propiedad
dist_family bernoulli El tipo de distribución. El valor
de gauss predeterminado es bernoulli.
poisson
negativebinomial
wald
gamma
dist_params número Valor del parámetro de distribución
que hay que utilizar. Sólo se aplica si
distribution es Negativebinomial.
trials entero Sólo se aplica si distribution es
Binomial. Cuando la respuesta
objetivo es un número de eventos
que tienen lugar en un conjunto de
ensayos, el campo target contiene el
número de eventos, y el campo
trials contiene el número de
ensayos.
Ejemplo:
[[["K","BP","Sex","K"],[0,0,0,0]],
[["Age","Na"],[0,0]]]
intercept flag Si es true, incluye la interceptación
en el modelo.
Otras las propiedades del nugget de modelo son las mismas que las del nodo de modelado
correspondiente.
Esta sección describe las propiedades de scripts disponibles para los nodos de resultados.
propiedades de analysisnode
El nodo Análisis evalúa la capacidad de los modelos predictivos para generar predicciones
precisas. Los nodos Análisis realizan varias comparaciones entre los valores predichos y los
valores reales para uno o más nugget de modelo. También pueden comparar modelos
predictivos entre sí.
Ejemplo
node = [Link]("analysis", "My node")
# Pestaña Análisis
[Link]("coincidence", True)
[Link]("performance", True)
[Link]("confidence", True)
[Link]("threshold", 75)
[Link]("improve_accuracy", 3)
[Link]("inc_user_measure", True)
# "Definir medida del usuario..."
[Link]("user_if", "@TARGET = @PREDICTED")
[Link]("user_then", "101")
[Link]("user_else", "1")
[Link]("user_compute", ["Mean", "Sum"])
[Link]("by_fields", ["Drug"])
# Pestaña "Resultados"
[Link]("output_format", "HTML")
[Link]("full_filename", "C:/output/analysis_out.html")
Tabla 224. propiedades de analysisnode.
Propiedad de analysisnode Tipo de datos Descripción de la propiedad
output_mode Screen Se utiliza para especificar la
File ubicación objetivo para el resultado
generado desde el nodo de
resultados.
use_output_name tag Especifica si se utiliza un nombre
de resultado personalizado.
output_name cadena Si use_output_name es verdadero,
especifica el nombre que se va a
utilizar.
output_format Text (.txt) Se utiliza para especificar el tipo de
HTML (.html) resultado.
Output (.cou)
by_fields lista
313
Tabla 224. propiedades de analysisnode (continuación).
Propiedad de analysisnode Tipo de datos Descripción de la propiedad
full_filename cadena Nombre del archivo de resultados,
si se trata de resultados HTML, de
datos o de disco.
coincidence tag
performance tag
evaluation_binary flag
confidence tag
umbral number
improve_accuracy number
inc_user_measure tag
user_if expr
user_then expr
user_else expr
user_compute [Mean Sum Min Max
SDev]
propiedades de dataauditnode
El nodo Auditoría de datos permite echar un primer vistazo exhaustivo a los datos,
incluyendo estadísticos de resumen, histogramas y distribución para cada campo, así como
información sobre valores atípicos, valores perdidos y extremos. Los resultados se muestran
en una matriz fácil de leer que se puede ordenar y utilizar para generar nodos de preparación
de datos y gráficos de tamaño completo.
Ejemplo
filenode = [Link]("variablefile", "File", 100, 100)
[Link]("full_filename", "$CLEO_DEMOS/DRUG1n")
node = [Link]("dataaudit", "My node", 196, 100)
[Link](filenode, node)
[Link]("custom_fields", True)
[Link]("fields", ["Age", "Na", "K"])
[Link]("display_graphs", True)
[Link]("basic_stats", True)
[Link]("advanced_stats", True)
[Link]("median_stats", False)
[Link]("calculate", ["Count", "Breakdown"])
[Link]("outlier_detection_method", "std")
[Link]("outlier_detection_std_outlier", 1.0)
[Link]("outlier_detection_std_extreme", 3.0)
[Link]("output_mode", "Screen")
Tabla 225. propiedades de dataauditnode.
Propiedad de dataauditnode Tipo de datos Descripción de la propiedad
custom_fields tag
campos [campo1 ... campoN]
overlay campo
python_script = """
import json
import [Link]
cxt = [Link]()
df = [Link]()
schema = [Link][:]
print df
"""
[Link]("python_syntax", python_script)
Ejemplo de R
#### Ejemplo de script de R
[Link]("syntax_type", "R")
[Link]("r_syntax", "print(modelerData$Age)")
Tabla 226. Propiedades de extensionoutputnode
Propiedades de extensionoutputnode Tipo de datos Descripción de la propiedad
syntax_type R Especifica qué script se ejecuta: R o
Python Python (R es el valor
predeterminado).
r_syntax string Sintaxis de scripts R para la
puntuación del modelo.
python_syntax string Sintaxis de scripts Python para la
puntuación de modelo.
convert_flags StringsAndDoubles Opción para convertir campos de
LogicalValues distintivos.
convert_missing flag Opción para convertir valores
perdidos al valor NA de R.
convert_datetime flag Opción para convertir las variables
con los formatos de fecha o de
fecha y hora para formatos de
fecha/hora R.
convert_datetime_class POSIXct Opciones para especificar a qué
POSIXlt formato se convierten las variables
con los formatos de fecha o de
fecha y hora.
propiedades de matrixnode
El nodo Matriz crea una tabla que muestra las relaciones entre campos. Se suele utilizar
normalmente para mostrar las relaciones entre dos campos simbólicos, pero también puede
mostrar relaciones entre campos de marcas o entre campos numéricos.
Ejemplo
node = [Link]("matrix", "My node")
# Pestaña "Configuración"
[Link]("fields", "Numerics")
[Link]("row", "K")
[Link]("column", "Na")
[Link]("cell_contents", "Function")
[Link]("function_field", "Age")
[Link]("function", "Sum")
# Pestaña "Aspecto"
[Link]("sort_mode", "Ascending")
[Link]("highlight_top", 1)
[Link]("highlight_bottom", 5)
[Link]("display", ["Counts", "Expected", "Residuals"])
[Link]("include_totals", True)
# Pestaña "Resultados"
[Link]("full_filename", "C:/output/matrix_output.html")
[Link]("output_format", "HTML")
[Link]("paginate_output", True)
[Link]("lines_per_page", 50)
Tabla 227. propiedades de matrixnode.
Propiedades de matrixnode Tipo de datos Descripción de la propiedad
campos Seleccionado
Flags
Caracteres numéricos
row campo
column campo
Ejemplo
node = [Link]("means", "My node")
[Link]("means_mode", "BetweenFields")
[Link]("paired_fields", [["OPEN_BAL", "CURR_BAL"]])
[Link]("label_correlations", True)
[Link]("output_view", "Advanced")
[Link]("output_mode", "File")
[Link]("output_format", "HTML")
[Link]("full_filename", "C:/output/means_output.html")
Tabla 228. propiedades de meansnode.
Propiedad de meansnode Tipo de datos Descripción de la propiedad
means_mode BetweenGroups Especifica el tipo de estadístico de
BetweenFields las medias que se va a ejecutar en
los datos.
test_fields [field1 ... fieldn] Especifica el campo de prueba si
means_mode se establece en
BetweenGroups.
grouping_field campo Especifica el campo de agrupación.
paired_fields [[field1 field2] Especifica los pares de campos que
[campo3 campo4] se usan si means_mode se establece
...] en BetweenFields.
label_correlations tag Determina si las etiquetas de
correlación se muestran en el
resultado. Esta configuración se
aplica únicamente si means_mode se
establece en BetweenFields.
correlation_mode Probability Determina si las correlaciones
Absolute deben etiquetarse según la
probabilidad o según el valor
absoluto.
weak_label cadena
medium_label cadena
strong_label cadena
weak_below_probability number Si correlation_mode se establece en
Probability, determina el valor de
corte para las correlaciones débiles.
Debe tratarse de un valor
comprendido entre 0 y 1; por
ejemplo, 0,90.
strong_above_probability number Valor de corte para correlaciones
fuertes.
propiedades de reportnode
El nodo Informe crea informes con formato que contienen texto fijo, así como datos y otras
expresiones derivadas de los datos. Puede especificar el formato del informe utilizando
plantillas de texto para definir el texto fijo y las construcciones de resultados de datos. Puede
proporcionar formato de texto personalizado utilizando etiquetas HTML de la plantilla y
configurando opciones en la pestaña Resultado. Puede incluir valores de datos y otros
resultados condicionales mediante el uso de expresiones CLEM en la plantilla.
Ejemplo
node = [Link]("report", "My node")
[Link]("output_format", "HTML")
[Link]("full_filename", "C:/report_output.html")
[Link]("lines_per_page", 50)
[Link]("title", "Report node created by a script")
[Link]("highlights", False)
propiedades de routputnode
El nodo Routput permite analizar datos y resultados de la
puntuación del modelo utilizando su propio script R
personalizado. El resultado del análisis puede ser en texto
o en gráficos. El resultado se añade a la pestaña
Resultado del panel de gestor. De forma alternativa, el
resultado se puede redirigir a un archivo.
propiedades de setglobalsnode
El nodo Val. globales explora los datos y calcula los valores de resumen que se pueden
utilizar en expresiones CLEM. Por ejemplo, puede utilizar este nodo para calcular estadísticos
para un campo denominado edad y, a continuación, utilizar la media global de edad en
expresiones CLEM insertando la función @GLOBAL_MEAN(edad).
Ejemplo
node = [Link]("setglobals", "My node")
[Link]("globals", "Na", ["Max", "Sum", "Mean"])
[Link]("globals", "K", ["Max", "Sum", "Mean"])
[Link]("globals", "Age", ["Max", "Sum", "Mean", "SDev"])
[Link]("clear_first", False)
[Link]("show_preview", True)
Tabla 231. propiedades de setglobalsnode.
Propiedad de setglobalsnode Tipo de datos Descripción de la propiedad
globals [Sum Mean Min Max Propiedad estructurada en la que
SDev] los campos que se van a establecer
deben hacer referencia a la sintaxis
siguiente:
[Link](
"globals", "Age", ["Max", "Sum",
"Mean", "SDev"])
clear_first tag
show_preview tag
propiedades de simevalnode
El nodo de evaluación de simulación evalúa un campo de destino predicho y presenta
información sobre la distribución y correlación del campo de destino.
propiedades de simfitnode
El nodo de simulación de ajuste examina la distribución de las estadísticas de los datos de
cada campo y genera (o actualiza) un nodo de generación de simulación, con la mejor
distribución de ajuste asignada a cada campo. El nodo de generación de simulación se puede
utilizar, a continuación, para generar datos simulados.
propiedades de statisticsnode
El nodo Estadísticos ofrece información básica de resumen acerca de los campos numéricos.
Calcula estadísticos de resumen para campos individuales y correlaciones entre campos.
Ejemplo
node = [Link]("statistics", "My node")
# Pestaña "Configuración"
[Link]("examine", ["Age", "BP", "Drug"])
[Link]("statistics", ["mean", "sum", "sdev"])
[Link]("correlate", ["BP", "Drug"])
# "Etiquetas de correlación..." section
[Link]("label_correlations", True)
[Link]("weak_below_absolute", 0.25)
[Link]("weak_label", "lower quartile")
[Link]("strong_above_absolute", 0.75)
[Link]("medium_label", "middle quartiles")
[Link]("strong_label", "upper quartile")
# Pestaña "Resultados"
[Link]("full_filename", "c:/output/statistics_output.html")
[Link]("output_format", "HTML")
Tabla 234. propiedades de statisticsnode.
Propiedad de statisticsnode Tipo de datos Descripción de la propiedad
use_output_name tag Especifica si se utiliza un nombre
de resultado personalizado.
output_name cadena Si use_output_name es verdadero,
especifica el nombre que se va a
utilizar.
output_mode Screen Se utiliza para especificar la
File ubicación objetivo para el resultado
generado desde el nodo de
resultados.
output_format Text (.txt) Se utiliza para especificar el tipo de
HTML (.html) resultado.
Output (.cou)
full_filename cadena
Propiedades de statisticsoutputnode
El nodo Resultados de Statistics le permite llamar a un procedimiento de IBM SPSS Statistics
para analizar los datos de IBM SPSS Modeler. Se puede acceder a una gran variedad de
procedimientos analíticos de IBM SPSS Statistics. Este nodo requiere una copia de IBM SPSS
Statistics con licencia.
Las propiedades de este nodo están descritas en “Propiedades de statisticsoutputnode” en la página 348.
propiedades de tablenode
El nodo Tabla muestra los datos en formato de tabla, que también se puede escribir en un
archivo. Esto es útil en cualquier momento en que necesite inspeccionar sus valores de datos
o exportarlos en un formato fácilmente legible.
Ejemplo
node = [Link]("transform", "My node")
[Link]("fields", ["AGE", "INCOME"])
[Link]("formula", "Select")
[Link]("formula_log_n", True)
[Link]("formula_log_n_offset", 1)
Tabla 236. propiedades de transformnode.
propiedades de transformnode Tipo de datos Descripción de la propiedad
campos [ field1... fieldn] Campos que se utilizarán en la
transformación.
formula Todos Indica si se deben calcular todas
Select las transformaciones o sólo las
seleccionadas.
formula_inverse flag Indica si se debe utilizar la
transformación inversa.
formula_inverse_offset número Indica el desplazamiento de los
datos que se utilizará en la
fórmula. De forma predeterminada
es 0, a menos que el usuario
especifique un valor.
formula_log_n flag Indica si debe utilizarse la
transformación logn.
formula_log_n_offset número
formula_log_10 flag Indica si debe utilizarse la
transformación log10.
formula_log_10_offset número
formula_exponential flag Indica si se debe utilizar la
transformación exponencial (ex).
formula_square_root flag Indica si se debe utilizar la
transformación de raíz cuadrada.
use_output_name flag Especifica si se utiliza un nombre
de resultado personalizado.
output_name string Si use_output_name es verdadero,
especifica el nombre que se va a
utilizar.
output_mode Screen Se utiliza para especificar la
File ubicación objetivo para el resultado
generado desde el nodo de
resultados.
output_format HTML (.html) Se utiliza para especificar el tipo de
Output (.cou) resultado.
Propiedades de asexport
La exportación de Analytic Server permite ejecutar una ruta en el sistema de archivos distribuido de
Hadoop (HDFS).
Ejemplo
[Link]("use_default_as", False)
[Link]("connection",
["false","[Link]","9080","analyticserver","ibm","admin","admin","false","","","",""])
Tabla 238. Propiedades de asexport.
Propiedades de asexport Tipo de datos Descripción de la propiedad
data_source cadena Nombre del origen de datos.
export_mode cadena Especifica si se añaden (append) los datos
exportados al origen de datos existente o
si se sobrescriben (overwrite) al origen
de datos existente.
use_default_as booleano Si se establece en True, utiliza la conexión
de Analytic Server predeterminada
configurada en el archivo [Link] de
servidor. Si se establece en False, utiliza
la conexión de este nodo.
331
Tabla 238. Propiedades de asexport (continuación).
Propiedades de asexport Tipo de datos Descripción de la propiedad
connection ["string","string","string", Una propiedad de la lista que contiene los
"string","string","string","string", detalles de conexión de Analytic Server. El
"string","string","string", "string" formato es: ["is_secure_connect",
,"string"] "server_url", "server_port",
"context_root", "consumer",
"user_name", "password",
"use-kerberos-auth",
"kerberos-krb5-config-file-path",
"kerberos-jaas-config-file-path",
"kerberos-krb5-service-principal-
name", "enable-kerberos-debug"] Donde:
is_secure_connect: indica si se utiliza la
conexión segura y es true o false.
use-kerberos-auth: indica si se utiliza
autenticación Kerberos y es true o false.
enable-kerberos-debug: indica si se
utiliza el modo de depuración de la
autenticación Kerberos y es true o false.
Para este nodo, debe definir una conexión de Cognos y una conexión ODBC.
donde:
Cognos_server_URL es la URL del
servidor de Cognos que contiene el
origen.
login_mode indica si se utiliza el inicio de
sesión anónimo, y es true o false; si se
establece en true, los campos siguientes
deben establecerse en "".
namespace especifica el proveedor de
autenticación de seguridad utilizado para
registrarse en el servidor.
username y password son los utilizados
para registrarse en el servidor de Cognos.
Donde stored_credential_name es el
nombre de una credencial de Cognos
del repositorio.
cognos_package_name cadena La ruta y el nombre del paquete de
Cognos al que está exportando datos, por
ejemplo:
/Public Folders/MyPackage
cognos_datasource cadena
cognos_export_mode Publicar
ExportFile
cognos_filename cadena
Las propiedades de la conexión ODBC son idénticas a las indicadas para databaseexportnode en la
sección siguiente, a excepción de la propiedad datasource, que no es válida.
propiedades de databaseexportnode
El nodo Exportar base de datos escribe datos en orígenes de datos relacionales compatibles
con ODBC. Para escribir en un origen de datos ODBC, el origen de datos debe existir y debe
tener permiso para escribir en él.
Ejemplo
’’’
Se asume que se ha configurado un origen de datos denominado "Miorigendedatos"
’’’
stream = [Link]()
db_exportnode = [Link]("databaseexport", "DB Export", 200, 200)
applynn = [Link]("applyneuralnetwork", None)
[Link](applynn, db_exportnode)
# pestaña Exportar
db_exportnode.setPropertyValue("username", "user")
db_exportnode.setPropertyValue("datasource", "MyDatasource")
db_exportnode.setPropertyValue("password", "password")
db_exportnode.setPropertyValue("table_name", "predictions")
db_exportnode.setPropertyValue("write_mode", "Create")
db_exportnode.setPropertyValue("generate_import", True)
db_exportnode.setPropertyValue("drop_existing_table", True)
db_exportnode.setPropertyValue("delete_existing_rows", True)
db_exportnode.setPropertyValue("default_string_size", 32)
Nota: Para algunas bases de datos, puede especificar que se crearán tablas de bases de datos para la
exportación con compresión (por ejemplo, el equivalente a CREATE TABLE MYTABLE (...) COMPRESS YES;
en SQL). Las propiedades use_compression y compression_mode se proporcionan para dar soporte a esta
característica, como se indica a continuación.
Tabla 241. Propiedades de databaseexportnode utilizando funciones de compresión.
Propiedades de databaseexportnode Tipo de datos Descripción de la propiedad
use_compression Booleana Si se establece en True, crea tablas para la
exportación con compresión.
compression_mode Row Establece el nivel de compresión de las bases
Page de datos de SQL Server.
Predeterminado Establece el nivel de compresión de las bases
Direct_Load_Operations de datos de Oracle. Tenga en cuenta que los
All_Operations valores OLTP, Query_High, Query_Low,
Básico Archive_High y Archive_Low requieren un
OLTP mínimo de Oracle 11gR2.
Query_High
Query_Low
Archive_High
Archive_Low
Ejemplo que muestra cómo cambiar el comando CREATE INDEX para un índice específico:
Propiedades de datacollectionexportnode
El nodo de exportación Data Collection abre los datos en el formato utilizado por el software
de investigación de mercados Data Collection. Debe estar instalada una biblioteca de datos de
Data Collection para utilizar este nodo.
Ejemplo
stream = [Link]()
datacollectionexportnode = [Link]("datacollectionexport", "Data Collection", 200, 200)
[Link]("metadata_file", "c:\\[Link]")
[Link]("merge_metadata", "Overwrite")
[Link]("casedata_file", "c:\\[Link]")
[Link]("generate_import", True)
[Link]("enable_system_variables", True)
Tabla 242. propiedades de datacollectionexportnode
propiedades de datacollectionexportnode Tipo de datos Descripción de la propiedad
metadata_file cadena Nombre del archivo de metadatos
que se va a exportar.
merge_metadata Overwrite
MergeCurrent
enable_system_variables flag Especifica si el archivo .mdd
exportado debe incluir las variables
de sistema de Data Collection.
casedata_file cadena Nombre del archivo .sav donde se
exportan los datos de casos.
generate_import flag
Propiedades de excelexportnode
El nodo de exportación Excel genera datos en el formato de archivo .xlsx de Microsoft Excel.
Si lo desea, puede elegir iniciar automáticamente Excel y abrir el archivo exportado cuando se
ejecute el nodo.
Ejemplo
stream = [Link]()
excelexportnode = [Link]("excelexport", "Excel", 200, 200)
[Link]("full_filename", "C:/output/[Link]")
Propiedades de extensionexportnode
cxt = [Link]()
df = [Link]()
print [Link][:]
_newDF = [Link]("Age","Drug")
[Link]("python_syntax", python_script)
Ejemplo de R
#### Ejemplo de script de R
[Link]("syntax_type", "R")
[Link]("r_syntax", """[Link](modelerData, "C:/[Link]")""")
Tabla 244. Propiedades de extensionexportnode
Propiedades de extensionexportnode Tipo de datos Descripción de la propiedad
syntax_type R Especifica qué script se ejecuta: R o
Python Python (R es el valor
predeterminado).
r_syntax string Sintaxis de scripts R a ejecutar.
python_syntax string Sintaxis de scripts Python a
ejecutar.
convert_flags StringsAndDoubles Opción para convertir campos de
LogicalValues distintivos.
convert_missing flag Opción para convertir valores
perdidos al valor NA de R.
convert_datetime flag Opción para convertir las variables
con los formatos de fecha o de
fecha y hora para formatos de
fecha/hora R.
convert_datetime_class POSIXct Opciones para especificar a qué
POSIXlt formato se convierten las variables
con los formatos de fecha o de
fecha y hora.
Propiedades de outputfilenode
El nodo Archivo sin formato produce datos en un archivo de texto delimitado. Esto es útil
para exportar datos que se pueden leer con otro software de hoja de cálculo o de análisis.
Ejemplo
stream = [Link]()
outputfile = [Link]("outputfile", "File Output", 200, 200)
[Link]("full_filename", "c:/output/flatfile_output.txt")
[Link]("write_mode", "Append")
[Link]("inc_field_names", False)
[Link]("use_newline_after_records", False)
[Link]("delimit_mode", "Tab")
[Link]("other_delimiter", ",")
[Link]("quote_mode", "Double")
[Link]("other_quote", "*")
[Link]("decimal_symbol", "Period")
[Link]("generate_import", True)
inc_field_names flag
use_newline_after_records flag
delimit_mode Comma
Tab
Space
Other
other_delimiter carácter
quote_mode Ninguno
Single
Double
Other
other_quote flag
generate_import flag
codificación StreamDefault
SystemDefault
"UTF-8"
Propiedades de sasexportnode
El nodo Exportar SAS produce datos en formato SAS, para leerlos en SAS o en un paquete de
software compatible con SAS. Hay tres formatos de archivo SAS disponibles: SAS para
Windows/OS2, SAS para UNIX o SAS versión 7/8.
Ejemplo
stream = [Link]()
sasexportnode = [Link]("sasexport", "SAS Export", 200, 200)
[Link]("full_filename", "c:/output/SAS_output.sas7bdat")
[Link]("format", "SAS8")
[Link]("export_names", "NamesAndLabels")
[Link]("generate_import", True)
Tabla 246. propiedades de sasexportnode
Propiedades de sasexportnode Tipo de datos Descripción de la propiedad
format Windows Campos de etiquetas de propiedad
UNIX de variantes.
SAS7
SAS8
full_filename cadena
export_names NamesAndLabels Se utiliza para correlacionar los
NamesAsLabels nombres de campos de IBM SPSS
Modeler que se vayan a exportar a
nombres de variables de IBM SPSS
Statistics o SAS.
Propiedades de statisticsexportnode
El nodo Exportar Statistics ofrece los resultados en formato IBM SPSS Statistics .sav o .zsav.
Los archivos .sav o .zsav se pueden leer con IBM SPSS Statistics Base y otros productos. Este
es también el formato utilizado para los archivos caché de IBM SPSS Modeler.
Las propiedades de este nodo están descritas en “Propiedades de statisticsexportnode” en la página 349.
Ejemplo: setPropertyValue("selected_measure",
"Measures")
Por ejemplo:
TM1_export.setPropertyValue("tm1_connection",
[’Planning Sample’, "admin" "apple"])
selected_cube campo El nombre del cubo al que está exportando datos.
Por ejemplo:
TM1_export.setPropertyValue("selected_cube",
"plan_BudgetPlan")
Ejemplo: setPropertyValue("selected_measure",
"Measures")
Propiedades de xmlexportnode
El nodo de exportación XML exporta datos a un archivo en formato XML. También puede
crear un nodo de origen XML para leer los datos exportados a la ruta.
Ejemplo
stream = [Link]()
statisticsimportnode = [Link]("statisticsimport", "SAV Import", 200, 200)
[Link]("full_filename", "C:/data/[Link]")
[Link]("import_names", True)
[Link]("import_data", True)
Tabla 250. propiedades de statisticsimportnode.
propiedades de statisticsimportnode Tipo de datos Descripción de la propiedad
full_filename cadena El nombre completo del archivo, incluyendo la
ruta.
contraseña cadena La contraseña. El parámetro password se debe
establecer antes que el parámetro
file_encrypted.
file_encrypted tag Indica si el archivo está protegido con
contraseña.
import_names NamesAndLabels Método para gestionar nombres y etiquetas de
LabelsAsNames variables.
import_data DataAndLabels Método para gestionar valores y etiquetas.
LabelsAsData
use_field_format_for_storage Booleana Especifica si se utiliza la información de
formato de campo de IBM SPSS Statistics al
importar.
propiedades de statisticstransformnode
El nodo Transformación Statistics ejecuta una selección de comandos de sintaxis de IBM SPSS
Statistics en los orígenes de datos de IBM SPSS Modeler. Este nodo requiere una copia de
IBM SPSS Statistics con licencia.
Ejemplo
stream = [Link]()
statisticstransformnode = [Link]("statisticstransform", "Transform", 200, 200)
[Link]("syntax", "COMPUTE NewVar = Na + K.")
[Link]("new_name", "NewVar", "Mixed Drugs")
[Link]("check_before_saving", True)
347
Tabla 251. propiedades de statisticstransformnode
propiedades de statisticstransformnode Tipo de datos Descripción de la propiedad
syntax cadena
check_before_saving flag Valida la sintaxis introducida antes
de guardar las entradas. Muestra
un mensaje de error si la sintaxis
no es válida.
default_include flag Consulte el tema “propiedades de
filternode” en la página 144 para
obtener más información.
include flag Consulte el tema “propiedades de
filternode” en la página 144 para
obtener más información.
new_name cadena Consulte el tema “propiedades de
filternode” en la página 144 para
obtener más información.
propiedades de statisticsmodelnode
El nodo Modelo Statistics permite analizar y trabajar con sus datos ejecutando los
procedimientos de IBM SPSS Statistics que producen PMML. Este nodo requiere una copia de
IBM SPSS Statistics con licencia.
Ejemplo
stream = [Link]()
statisticsmodelnode = [Link]("statisticsmodel", "Model", 200, 200)
[Link]("syntax", "COMPUTE NewVar = Na + K.")
[Link]("new_name", "NewVar", "Mixed Drugs")
Propiedades de statisticsoutputnode
El nodo Resultados de Statistics le permite llamar a un procedimiento de IBM SPSS Statistics
para analizar los datos de IBM SPSS Modeler. Se puede acceder a una gran variedad de
procedimientos analíticos de IBM SPSS Statistics. Este nodo requiere una copia de IBM SPSS
Statistics con licencia.
Propiedades de statisticsexportnode
El nodo Exportar Statistics ofrece los resultados en formato IBM SPSS Statistics .sav o .zsav.
Los archivos .sav o .zsav se pueden leer con IBM SPSS Statistics Base y otros productos. Este
es también el formato utilizado para los archivos caché de IBM SPSS Modeler.
Ejemplo
stream = [Link]()
statisticsexportnode = [Link]("statisticsexport", "Export", 200, 200)
[Link]("full_filename", "c:/output/SPSS_Statistics_out.sav")
[Link]("field_names", "Names")
[Link]("launch_application", True)
[Link]("generate_import", True)
Tabla 253. propiedades de statisticsexportnode.
propiedades de
statisticsexportnode Tipo de datos Descripción de la propiedad
full_filename cadena
file_type sav Guardar el archivo en formato sav o zsav. Por ejemplo:
zsav [Link]("file_type","sav")
encrypt_file flag Indica si el archivo está protegido con contraseña.
password cadena La contraseña.
351
Tabla 254. Propiedades de ocsvmnode (continuación)
Propiedades de ocsvmnode Tipo de datos Descripción de la propiedad
degree integer Grado de función de kernel polinómica. Este
parámetro sólo está habilitado para el kernel
poly. Especifique cualquier entero. El valor
predeterminado es 3.
shrinking Booleana Especifica si se debe utilizar la opción
heurística de reducción. Especifique true o
false. El valor predeterminado es false.
enable_cache_size Booleana Habilita el parámetro cache_size. Especifique
true o false. El valor predeterminado es
false.
cache_size float Tamaño de caché de kernel en MB. El valor
predeterminado es 200.
enable_random_seed Booleana Habilita el parámetro random_seed. Especifique
true o false. El valor predeterminado es
false.
random_seed integer Semilla de aleatorización a utilizar al
reorganizar datos para la estimación de
probabilidad. Especifique cualquier entero.
pc_type string Tipo del gráfico de coordenadas paralelas. Los
valores posibles son independent o general.
lines_amount integer Número máximo de líneas a incluir en el
gráfico. Especifique un entero entre 1 y 1000.
lines_fields_custom Booleana Habilita el parámetro lines_fields, que le
permite especificar campos personalizados
para mostrarlos en el resultado gráfico. Si se
establece en false, se mostrarán todos los
campos. Si se establece en true, sólo se
mostrarán los campos especificados con el
parámetro lines_fields. Por razones de
rendimiento, se visualizará un máximo de 20
campos.
lines_fields field Lista de nombres de campo a incluir en el
gráfico como ejes verticales.
enable_graphic Booleana Especifique true o false. Habilita el resultado
gráfico (inhabilite esta opción si desea ahorrar
tiempo y reducir el tamaño de archivo de
corriente).
enable_hpo Booleana Especifique true o false para habilitar o
inhabilitar las opciones de HPO. Si está
establecido en true, Rbfopt se aplicará para
descubrir el "mejor" modelo SVM de una clase
automáticamente, que alcanza el valor de
objetivo de destino que ha definido el usuario
con el parámetro target_objval siguiente.
target_objval float El valor de función de objetivo (índice de
errores del modelo en las muestras) que se
desea alcanzar (por ejemplo, el valor del
óptimo desconocido). Establezca este
parámetro en el valor apropiado si el óptimo
es desconocido (por ejemplo, 0.01).
max_iterations integer Número máximo de iteraciones para intentar el
modelo. El valor predeterminado es 1000.
Propiedades rfnode
Propiedades tsnenode
t-SNE (vecino estocástico con t distribuida incorporado) es una herramienta para visualizar
datos de alta dimensión. Convierte afinidades de puntos de datos a probabilidades. Este nodo
t-SNE en SPSS Modeler se implementa en Python y requiere la biblioteca scikit-learn©
Python.
Propiedades de smotenode
El nodo SMOTE (Synthetic Minority Over-sampling Technique) proporciona un algoritmo de
sobremuestreo para tratar con conjuntos de datos desequilibrados. Proporciona un método
avanzado para equilibrar los datos. El nodo de proceso SMOTE en SPSS Modeler se
implementa en Python y necesita la biblioteca de Python imbalanced-learn©.
Propiedades xgboostasnode
361
Tabla 261. propiedades xgboostasnode (continuación)
Propiedades xgboostasnode Tipo de datos Descripción de la propiedad
boosterType cadena El tipo de amplificador para utilizar. Las
opciones disponibles son gbtree, gblinear o
dart. El valor predeterminado es gbtree.
numBoostRound entero El número de rondas para amplificar.
Especifique un valor de 0 o superior. El valor
predeterminado es 10.
scalePosWeight Double Controle el equilibrio entre ponderaciones
positivas y negativas. El valor predeterminado
es 1.
randomseed entero Semilla utilizada por el generador de números
aleatorios. El valor predeterminado es 0.
objectiveType cadena El objetivo de aprendizaje. Los valores posibles
son reg:linear,⌂ reg:logistic,⌂ reg:gamma,⌂
reg:tweedie, count:poisson, ⌂rank:pairwise,
binary:logistic o multi. Tenga en cuenta que
para objetivos de marca, sólo se puede utilizar
binary:logistic o multi. Si se utiliza multi, el
resultado de puntuación mostrará los tipos de
objetivo de XGBoost multi:softmax y
multi:softprob. El valor predeterminado es
reg:linear.
evalMetric cadena Las métricas de evaluación para datos de
validación. Se asignará una métrica
predeterminada de acuerdo con el objetivo.
Los valores posibles son rmse, mae, logloss,
error, merror, mlogloss, auc, ndcg, map o
gamma-deviance. El valor predeterminado es
rmse.
lambda Double Término de regularización L2 sobre
ponderaciones. El aumento de este valor hará
que el modelo sea más conservador.
Especifique cualquier número 0 o superior. El
valor predeterminado es 1.
alpha Double Término de regularización L1 sobre
ponderaciones. El aumento de este valor hará
que el modelo sea más conservador.
Especifique cualquier número 0 o superior. El
valor predeterminado es 0.
lambdaBias Double Término de regularización L2 sobre el sesgo. Si
se utiliza el tipo de amplificador gblinear, está
disponible este parámetro d e amplificador
lineal de sesgo lambda. Especifique cualquier
número 0 o superior. El valor predeterminado
es 0.
treeMethod cadena Si se utiliza el tipo de amplificador gbtree o
dart, está disponible este parámetro de método
de árbol para el crecimiento del árbol (y los
otros parámetros de árbol que siguen).
Especifica el algoritmo de construcción de
árbol XGBoost para utilizar. Las opciones
disponibles son auto, exact o approx. El valor
predeterminado es auto.
Parámetros de Supernodos
Puede utilizar scripts para crear o establecer parámetros de Supernodo utilizando el formato general:
[Link]("minvalue", 30)
Puede establecer las propiedades de determinados nodos encapsulados dentro un supernodo accediendo
al diagrama hijo dentro del Supernodo. Por ejemplo, imaginemos que tiene un Supernodo de origen que
incluye un nodo de archivo de variables encapsulado para leer los datos. Puede pasar el nombre del
archivo para leer (especificado mediante la propiedad full_filename ) accediendo al diagrama hijo y
buscando el nodo relevante como se indica a continuación:
childDiagram = source_supernode.getChildDiagram()
varfilenode = [Link]("variablefile", None)
[Link]("full_filename", "c:/[Link]")
Creación de supernodos
Si desea crear un supernodo y su contenido de cero, puede hacerlo de forma similar a la creación del
supernodo, accediendo al diagrama hijo y creando los nodos que desee. También debe asegurarse de que
los nodos del diagrama del supernodo estén también vinculados a los nodos de los conectores de entrada
y/o de salida. Por ejemplo, si desea crear un proceso Supernodo:
process_supernode = [Link]().createAt("process_super", "My SuperNode", 200, 200)
childDiagram = process_supernode.getChildDiagram()
filternode = [Link]("filter", "My Filter", 100, 100)
[Link](filternode)
[Link](filternode)
365
366 IBM SPSS Modeler 18.1.1 Guía de automatización y scripts Python
Apéndice A. Referencia de nombres de nodo
Esta sección ofrece una referencia de todos los nombres de script de los nodos de IBM SPSS Modeler.
Tenga en cuenta que estos nombres se utilizan específicamente para hacer referencia a los nugget de
modelo en la paleta Modelos (en la esquina superior derecha de la ventana de IBM SPSS Modeler). Para
hacer referencia a los nodos de modelo que se han añadido a una ruta para la puntuación, se utiliza un
conjunto diferente de nombres con el prefijo apply.... Consulte el tema Propiedades de nodos de nugget
de modelo para obtener más información.
Nota: En circunstancias normales, se recomienda hacer referencia a los modelos por nombre y tipo para
evitar confusiones.
Tabla 263. Nombres de nugget de modelo (paleta de modelado).
Nombre del modelo Modelo
anomalydetection Anomalía
a priori A priori
autoclassifier Clasificado automático
autocluster Agrupación en clústeres automática
autonumeric Autonumérico
bayesnet Red bayesiana
c50 C5.0
carma Carma
árbol cr Árbol C&R
chaid CHAID
coxreg Regresión de Cox
decisionlist Lista de decisiones
discriminant Discriminante
factor PCA/Factorial
featureselection Sel. características
genlin Regresión lineal generalizada
glmm GLMM
kmeans K-medias
knn k: vecino más cercano
kohonen Kohonen
lineal Lineal
logreg Regresión logística
neuralnetwork Red neuronal
367
Tabla 263. Nombres de nugget de modelo (paleta de modelado) (continuación).
Nombre del modelo Modelo
quest QUEST
regresión Regresión lineal
secuencia Secuencia
slrm Modelo de respuesta de autoaprendizaje
statisticsmodel Modelo de IBM SPSS Statistics
svm Máquina de vectores de soporte
timeseries Serie temporal
twostep Dos fases
El comportamiento de la ejecución de scripts puede variar entre SPSS Modeler y IBM SPSS Collaboration
and Deployment Services cuando haya referencias de modelo ambiguas. El cliente de SPSS Modeler
incluye la opción "Reemplazar modelo anterior", que reemplaza automáticamente los modelos que tengan
el mismo nombre (por ejemplo, cuando un script se itera a través de un bucle para producir un modelo
diferente cada vez). Sin embargo, esta opción no está disponible cuando el mismo script se ejecuta en
IBM SPSS Collaboration and Deployment Services. Puede evitar esta situación cambiando el nombre del
modelo generado en cada iteración para evitar referencias ambiguas a los modelos o borrando el modelo
actual (por ejemplo, añadiendo una instrucción clear generated palette) antes del final del bucle.
Diferencias generales
Una gran parte del diseño de los scripts de herencia se debe a los scripts de comandos del sistema
operativo. Los scripts de herencia están orientados a líneas y, aunque existen algunas estructuras de
bloque, por ejemplo if...then...else...endif y for...endfor, generalmente la indentación no es
importante.
En los scripts Python, la indentación es importante y las líneas que pertenecen al mismo bloque lógico se
deben indentar en el mismo nivel.
Nota: Debe prestar atención cuando copie y pegue el código Python. En el editor, una línea que se ha
indentado utilizando pestañas puede parecer la misma que una línea que se ha indentado utilizando
espacios. Sin embargo, el script Python generará un error porque no se considera que la indentación de
las líneas sea la misma.
En los scripts Python el contexto de script se proporciona de forma explícita mediante el módulo
[Link]. Por ejemplo, un script Python de ruta puede acceder a la ruta que ejecuta el script
mediante el código siguiente:
s = [Link]()
A continuación podrán invocarse funciones relacionadas con la ruta a través del objeto devuelto.
Python utiliza funciones que suelen invocarse a través de un objeto (módulo, clase u objeto) que define la
función, por ejemplo:
stream = [Link]()
typenode = [Link]("type", "Type)
filternode = [Link]("filter", None)
[Link](nodotipo, nodofiltro)
[Link]("Compute Total")
371
Literales y comentarios
Algunos de los literales y comandos de comentarios que normalmente se utilizan en IBM SPSS Modeler
tienen sus equivalentes en los scripts Python. Esto puede ayudarle a convertir los scripts de SPSS
Modeler de herencia existentes en scripts Python para utilizarlos en IBM SPSS Modeler 17.
Tabla 266. Correlación de scripts de herencia con scripts Python para literales y comentarios.
Scripts de herencia scripts Python
Entero, por ejemplo 4 El mismo
Flotante, por ejemplo, 0,003 El mismo
Cadenas entre comillas simples, por ejemplo, 'Hola' El mismo
Nota: Los literales de cadena que contengan caracteres
que no sean ASCII deberán tener el prefijo u para
garantizar que se representen en Unicode.
Cadenas entre comillas dobles, por ejemplo, “Hola de El mismo
nuevo" Nota: Los literales de cadena que contengan caracteres
que no sean ASCII deberán tener el prefijo u para
garantizar que se representen en Unicode.
Cadenas largas, por ejemplo, El mismo
“””Estas es una cadena
que abarca varias
líneas”””
Listas, por ejemplo, [1 2 3] [1, 2, 3]
Referencia de variable, por ejemplo, set x = 3 x = 3
Continuación de línea (\), por ejemplo, x = [ 1, 2,\
set x = [1 2 \ 3, 4]
3 4]
Comentario de bloque, por ejemplo, """ Este es un comentario largo
/* Éste es un comentario largo a través de una línea. """
a través de una línea. */
Comentario de línea, por ejemplo, set x = 3 # make x = 3 # make x 3
x 3
undef Ninguno
true True
false False
Operadores
Algunos de los comandos de operadores que normalmente se utilizan en IBM SPSS Modeler tienen sus
comandos equivalentes en los scripts Python. Esto puede ayudarle a convertir los scripts de SPSS
Modeler de herencia existentes en scripts Python para utilizarlos en IBM SPSS Modeler 17.
Tabla 267. Correlación de scripts de herencia con scripts Python para operadores.
Scripts de herencia scripts Python
NUM1 + NUM2 NUM1 + NUM2
LIST + ITEM [Link](ITEM)
LIST1 + LIST2 [Link](LIST2)
NUM1 – NUM2 NUM1 – NUM2
LIST - ITEM [Link](ITEM)
NUM1 * NUM2 NUM1 * NUM2
Variables
En los scripts heredados, las variables se declaran antes de ser referenciadas, por ejemplo:
var minodo
set minodo = create typenode at 96 96
En los scripts Python, las variables se crean la primera vez que se referencian, por ejemplo:
minodo = [Link]("type", "Type", 96, 96)
En los scripts heredados, las referencias a variables deben eliminarse explícitamente mediante el operador
^, por ejemplo:
var minodo
set minodo = create typenode at 96 96
set ^[Link]."Age" = Input
Al igual que en la mayoría de lenguajes de script, esto no es necesario en los scripts Python, por ejemplo:
minodo = [Link]("type", "Type", 96, 96)
[Link]("direction","Age","Input")
El API de IBM SPSS Modeler en Python no incluye el sufijo node, de modo que el nodo Derivar tiene el
tipo derive, por ejemplo:
feature_name_node = [Link]("derive", "Feature", 96, 96)
La única diferencia en los tipos de nombre entre los scripts Python y los heredados es la ausencia del
sufijo de tipo.
Nombres de propiedades
Los nombres de las propiedades son los mismos en scripts heredados y en scripts Python. Por ejemplo,
en el nodo Archivo variable, la propiedad que define la ubicación del archivo es full_filename en ambos
entornos de creación de scripts.
Referencias de nodos
Muchos scripts de herencia utilizan una búsqueda implícita para buscar y acceder al nodo que se ha de
modificar. Por ejemplo, los comandos siguientes buscan en la ruta actual un nodo Type con la etiqueta
"Type", a continuación, establecen la dirección (o el rol de modelado) del campo "Age" como entrada y el
campo "Drug" como destino, esto es, el valor predicho:
set ’Type’:[Link]."Age" = Input
set ’Type’:[Link]."Drug" = Target
En los scripts Python, los objetos de nodo se han de localizar de forma explícita antes de llamar a la
función para establecer el valor de propiedad, por ejemplo:
Nota: En este caso, "Target" debe estar encerrado entre comillas en la cadena.
Los scripts Python pueden utilizar de forma alternativa la enumeración ModelingRole del paquete
[Link].
Aunque la versión de los scripts Python puede ser más verbosa, el rendimiento de tiempo de ejecución es
mejor ya que la búsqueda del nodo generalmente solo se realiza una vez. En el ejemplo de scripts de
herencia, la búsqueda del nodo se realiza para cada comando.
También está soportado buscar nodos por ID (el ID de nodo se puede ver en la pestaña Anotaciones del
diálogo del nodo). Por ejemplo, en los scripts de herencia:
# id65EMPB9VL87 es el ID de un nodo Type
set @[Link]."Age" = Input
En los scripts Python, se obtiene el mismo resultado utilizando las funciones setPropertyValue() y
setKeyedPropertyValue(), por ejemplo:
[Link](propiedad, valor)
[Link](propiedad-con claves, clave, valor)
En los scripts de herencia, se puede acceder a los valores de las propiedades utilizando el comando get,
por ejemplo:
var n v
set n = get node :filternode
set v = ^[Link]
En los scripts Python, se obtiene el mismo resultado utilizando la función getPropertyValue(), por
ejemplo:
n = [Link]("filter", None)
v = [Link]("name")
Edición de rutas
En los scripts de herencia, se utiliza el comando create para crear un nodo nuevo, por ejemplo:
var agg select
set agg = create aggregatenode at 96 96
set select = create selectnode at 164 96
En los scripts Python, las rutas tienen varios métodos para crear nodos, por ejemplo:
stream = [Link]()
agg = [Link]("aggregate", "Aggregate", 96, 96)
select = [Link]("select", "Select", 164, 96)
En los scripts Python, se utiliza el método link para crear enlaces entre nodos, por ejemplo:
[Link](agg, select)
En los scripts de herencia, se utiliza el comando disconnect para eliminar enlaces entre nodos, por
ejemplo:
disconnect ^agg from ^select
En los scripts Python, se utiliza el método unlink para eliminar enlaces entre nodos, por ejemplo:
[Link](agg, select)
En los scripts de herencia, se utiliza el comando position para posicionar los nodos en el lienzo de rutas
o entre nodos, por ejemplo:
position ^agg at 256 256
position ^agg between ^myselect and ^mydistinct
En los scripts Python, se obtiene el mismo resultado utilizando dos métodos separados: setXYPosition y
setPositionBetween. Por ejemplo:
[Link](256, 256)
[Link](myselect, mydistinct)
Operaciones de nodo
Algunos de los comandos de operaciones de nodo que normalmente se utilizan en IBM SPSS Modeler
tienen sus comandos equivalentes en los scripts Python. Esto puede ayudarle a convertir los scripts de
SPSS Modeler de herencia existentes en scripts Python para utilizarlos en IBM SPSS Modeler 17.
Tabla 269. Correlación de scripts de herencia con scripts Python para operaciones de nodo.
Scripts de herencia scripts Python
create especificaciónodo at x y [Link](tipo, nombre)
[Link](tipo, nombre, x, y)
[Link](tipo, nombre, preNode, postNode)
[Link](modelo, nombre)
connect desdeNodo to aNodo [Link](desdeNodo, aNodo)
delete nodo [Link](nodo)
disable nodo [Link](nodo, False)
enable nodo [Link](nodo, True)
disconnect desdeNodo from aNodo [Link](desdeNodo, aNodo)
[Link](nodo)
duplicate nodo [Link]()
execute nodo [Link](nodos, resultados)
[Link](resultados)
flush nodo [Link]()
position nodo at x y [Link](x, y)
position nodo between nodo1 and nodo2 [Link](nodo1, nodo2)
rename nodo as nombre [Link](nombre)
for i in items
println ^i
endfor
Los scripts Python también dan soporte a diferentes tipos de bucles. El script siguiente es un ejemplo de
un bucle de valor contado en un script Python:
i = 1
while i <= 10:
print i
i += 1
El bucle de secuencia es muy flexible y cuando se combina con los métodos de la API de IBM SPSS
Modeler puede dar soporte a la mayoría de los casos de uso scripts de herencia. El siguiente ejemplo
muestra cómo utilizar un bucle de secuencia en scripts Python para iterar por los campos de salida de un
nodo:
node = [Link]().findByType("filter", None)
for column in [Link]().columnIterator():
print [Link]()
Ejecución de rutas
Durante la ejecución de la ruta, el modelo o los objetos de resultados que se generan se añaden a uno de
los gestores de objeto. En el script existente, el script debe localizar los objetos creados desde el gestor de
objeto, o acceder al resultado generado más recientemente desde el nodo que ha generado el resultado.
La ejecución de rutas en Python es diferente, ya que cualquier objeto de modelo o resultados que genere
la ejecución se devuelve una lista que se pasa a la función de ejecución. Esto hace que resulte más
sencillo acceder a los resultados de la ejecución de la ruta.
En los scripts de herencia, la ejecución de ruta se puede finalizar con el comando exit con un código de
entero opcional, por ejemplo:
exit 1
En los scripts Python, se puede obtener el mismo resultado con el script siguiente:
[Link](1)
En los scripts Python, existe la clase TaskRunner, accesible desde la sesión, que puede utilizarse para
realizar tareas similares, por ejemplo:
taskrunner = [Link]().getTaskRunner()
s = [Link]("c:/my streams/[Link]", True)
Para guardar un objeto en los scripts heredados, puede utilizarse el comando save, por ejemplo:
save stream s as "c:/my streams/new_modeling.str"
Las operaciones basadas en un Repositorio de IBM SPSS Collaboration and Deployment Services se
soportan en los scripts heredados mediante los comandos retrieve y store, por ejemplo:
var s
set s = retrieve stream "/my repository folder/my_stream.str"
store stream ^s as "/my repository folder/my_stream_copy.str"
En los scripts Python, se accede a la funcionalidad equivalente a través del objeto Repository asociado a
la sesión, por ejemplo:
session = [Link]()
repo = [Link]()
s = [Link]("/my repository folder/my_stream.str", None, None, True)
[Link](s, "/my repository folder/my_stream_copy.str", None)
Nota: El acceso al repositorio exige que la sesión se haya configurado con una conexión de repositorio
válida.
Operaciones de modelo
Algunos de los comandos de operación de modelo que normalmente se utilizan en IBM SPSS Modeler
tienen sus comandos equivalentes en los scripts Python. Esto puede ayudarle a convertir los scripts de
SPSS Modeler de herencia existentes en scripts Python para utilizarlos en IBM SPSS Modeler 17.
Tabla 271. Correlación de scripts de herencia con scripts Python para operaciones de modelo.
Scripts de herencia scripts Python
open model vía de acceso [Link](vía de acceso,
autoGestionar)
save modelo as vía de acceso [Link](modelo, vía de acceso)
retrieve model vía de acceso [Link](vía de acceso, versión,
etiqueta, autoGestionar)
store modelo as vía de acceso [Link](modelo, vía de acceso,
etiqueta)
Los scripts heredados proporcionan cierto soporte de carga de objetos de estado (combinaciones de rutas y
modelos). Los objetos de estado han caído en desuso desde IBM SPSS Modeler 8.0. Los scripts Python no
soportan objetos de estado.
Los scripts Python proporcionan las siguientes funciones adicionales no disponibles en los scripts
heredados:
v Definiciones de clase y función.
v Manejo de errores.
v Soporte más sofisticado de entrada/salida.
v Módulos externos y de terceros.
Es posible que IBM no ofrezca los productos, servicios o características que se tratan en este documento
en otros países. El representante local de IBM le puede informar sobre los productos y servicios que están
actualmente disponibles en su localidad. Cualquier referencia a un producto, programa o servicio de IBM
no pretende afirmar ni implicar que solamente se pueda utilizar ese producto, programa o servicio de
IBM. En su lugar, se puede utilizar cualquier producto, programa o servicio funcionalmente equivalente
que no infrinja los derechos de propiedad intelectual de IBM. Sin embargo, es responsabilidad del usuario
evaluar y comprobar el funcionamiento de todo producto, programa o servicio que no sea de IBM.
IBM puede tener patentes o solicitudes de patente en tramitación que cubran la materia descrita en este
documento. Este documento no le otorga ninguna licencia para estas patentes. Puede enviar preguntas
acerca de las licencias, por escrito, a:
Para consultas sobre licencias relacionadas con información de doble byte (DBCS), póngase en contacto
con el departamento de propiedad intelectual de IBM de su país o envíe sus consultas, por escrito, a:
Esta información puede incluir imprecisiones técnicas o errores tipográficos. Periódicamente, se efectúan
cambios en la información aquí y estos cambios se incorporarán en nuevas ediciones de la publicación.
IBM puede realizar en cualquier momento mejoras o cambios en los productos o programas descritos en
esta publicación sin previo aviso.
Las referencias hechas en esta publicación a sitios web que no son de IBM se proporcionan sólo para la
comodidad del usuario y no constituyen de modo alguno un aval de esos sitios web. La información de
esos sitios web no forma parte de la información de este producto de IBM y la utilización de esos sitios
web se realiza bajo la responsabilidad del usuario.
IBM puede utilizar o distribuir la información que se le proporcione del modo que considere adecuado
sin incurrir por ello en ninguna obligación con el remitente.
381
Los titulares de licencias de este programa que deseen tener información sobre el mismo con el fin de
permitir: (i) el intercambio de información entre programas creados independientemente y otros
programas (incluido este) y (ii) el uso mutuo de la información que se ha intercambiado, deberán ponerse
en contacto con:
Esta información estará disponible, bajo las condiciones adecuadas, incluyendo en algunos casos el pago
de una cuota.
El programa bajo licencia que se describe en este documento y todo el material bajo licencia disponible
los proporciona IBM bajo los términos de las Condiciones Generales de IBM, Acuerdo Internacional de
Programas Bajo Licencia de IBM o cualquier acuerdo equivalente entre las partes.
Los ejemplos de datos de rendimiento y de clientes citados se presentan solamente a efectos ilustrativos.
Los resultados reales de rendimiento pueden variar en función de las configuraciones específicas y
condiciones de operación.
La información relacionada con productos no IBM se ha obtenido de los proveedores de esos productos,
de sus anuncios publicados o de otras fuentes disponibles públicamente. IBM no ha probado esos
productos y no puede confirmar la exactitud del rendimiento, la compatibilidad ni ninguna otra
afirmación relacionada con productos no IBM. Las preguntas sobre las posibilidades de productos que no
son de IBM deben dirigirse a los proveedores de esos productos.
Las declaraciones sobre el futuro rumbo o intención de IBM están sujetas a cambio o retirada sin previo
aviso y representan únicamente metas y objetivos.
Esta información contiene ejemplos de datos e informes utilizados en operaciones comerciales diarias.
Para ilustrarlos lo máximo posible, los ejemplos incluyen los nombres de las personas, empresas, marcas
y productos. Todos estos nombres son ficticios y cualquier parecido con personas o empresas comerciales
reales es pura coincidencia.
Marcas comerciales
IBM, el logotipo de IBM e [Link] son marcas registradas o marcas comerciales de International Business
Machines Corp., registradas en muchas jurisdicciones en todo el mundo. Otros nombres de productos y
servicios podrían ser marcas registradas de IBM u otras compañías. En Internet hay disponible una lista
actualizada de las marcas registradas de IBM, en "Copyright and trademark information", en
[Link]/legal/[Link].
Adobe, el logotipo Adobe, PostScript y el logotipo PostScript son marcas registradas o marcas comerciales
de Adobe Systems Incorporated en Estados Unidos y/o otros países.
Intel, el logotipo de Intel, Intel Inside, el logotipo de Intel Inside, Intel Centrino, el logotipo de Intel
Centrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium y Pentium son marcas comerciales o marcas
registradas de Intel Corporation o sus filiales en Estados Unidos y otros países.
Linux es una marca registrada de Linus Torvalds en Estados Unidos, otros países o ambos.
Microsoft, Windows, Windows NT, y el logotipo de Windows son marcas comerciales de Microsoft
Corporation en Estados Unidos, otros países o ambos.
Java y todas las marcas comerciales y los logotipos basados en Java son marcas comerciales o registradas
de Oracle y/o sus afiliados.
Aplicabilidad
Estos términos y condiciones son adicionales a los términos de uso del sitio web de IBM.
Uso personal
Estas publicaciones se pueden reproducir para uso personal no comercial siempre que se conserven todos
los avisos de propiedad. No puede distribuir, visualizar ni realizar trabajos derivados de estas
publicaciones, ni de partes de las mismas, sin el consentimiento expreso de IBM.
Uso comercial
Puede reproducir, distribuir y visualizar estas publicaciones únicamente dentro de la empresa a condición
de que se conserven todos los avisos de propiedad. No puede realizar trabajos derivados de estas
publicaciones, ni de partes de las mismas, ni reproducirlas, distribuirlas o visualizarlas fuera de su
empresa sin el consentimiento expreso de IBM.
Derechos
Excepto de la forma explícitamente otorgada en este permiso, no se otorga ningún permiso, licencia ni
derecho, ni explícito ni implícito, sobre las publicaciones ni a ninguna otra información, datos, software u
otra propiedad intelectual contenida en ellas.
IBM se reserva el derecho de retirar los permisos aquí otorgados siempre que, a su discreción, el uso de
las publicaciones sea perjudicial para su interés o cuando, según determine IBM, las instrucciones
anteriores no se sigan correctamente.
No puede descargar, exportar ni volver a exportar esta información si no es cumpliendo totalmente todas
las leyes y regulaciones aplicables, incluyendo las leyes y regulaciones de exportación de los Estados
Unidos.
Avisos 383
384 IBM SPSS Modeler 18.1.1 Guía de automatización y scripts Python
Índice
A CLEM
scripts 1
G
acceder a los resultados de la ejecución Clúster de secuencias de MS GLE, modelos
de ruta propiedades de scripts de nodos 291 propiedades de scripts de nodos 222,
modelo de contenido de tabla 54 comando clear generated palette 53 279
modelo de contenido JSON 57 comando de conjunto múltiple 69
modelo de contenido XML 55 comando for 49
acceder a resultados de ejecución de la
ruta 53, 58
comando retrieve 50 I
comando store 50 IBM SPSS Modeler
adición de atributos 24 comentarios 18 ejecución desde la línea de
API de creación de scripts comprobación de errores comandos 63
acceso a objetos generados 41 scripts 52 identificadores 19
buscar 37 configuración de propiedades 30 inheritance 25
ejemplo 37 contraseñas instrucciones 19
introducción 37 adición a scripts 52 interrupción de scripts 12
manejo de errores 42 codificadas 66
metadatos 38 contraseñas codificadas
obtener un directorio 37
parámetros de ruta 43
adición a scripts 52
creación de nodos 31, 33
J
parámetros de sesión 43 crear una clase 24 Jython 15
parámetros de Supernodos 43
scripts autónomos 47
valores globales 46
varias rutas 47 D L
definición de atributos 24 línea de comandos
applyextension, propiedades 276
definir métodos 24 ejecutar IBM SPSS Modeler 63
applyocsvm, propiedades 282
definir una clase 24 lista de argumentos 64, 66, 67, 68
applyxgboostlinearnode,
derive_stbnode parámetros 65
propiedades 287
propiedades 111 scripts 52
applyxgboosttreenode, propiedades 287
Diagramas 27 varios argumentos 68
Árbol de decisión de MS
listas 16
propiedades de scripts de nodos 289,
291
argumentos E M
archivo de comandos 68 ejecución condicional de rutas 6, 11
conexión con el servidor 66 Ejecución de rutas 27 marcas
conexión de IBM SPSS Collaboration ejecución de scripts 12 argumentos de la línea de
and Deployment Services ejemplos 20 comandos 63
Repository 67 exportModelToFile 41 combinación de varias marcas 68
Conexión del repositorio de IBM SPSS extensionexportnode, propiedades 339 métodos matemáticos 21
Analytic Server 68 extensionimportnode, propiedades 89 migrar
sistema 64 extensionmodelnode, propiedades 209 acceder a objetos 378
atravesar los nodos 33 extensionoutputnode, propiedades 316 borrar rutas, salida y gestores de
extensionprocessnode, propiedades 115 modelos 34
bucle 377
B comandos 371
conceptos básicos 371
bloques de código 19 F configuración de propiedades 375
bucles función lowertoupper 49 contexto de los scripts 371
uso en scripts 49 funciones diferencias generales 371
bucles en rutas 6, 7 bucle 373 editar rutas 375
buscar nodos 29 comentarios 372 ejecución de rutas 377
condicionales 373 funciones 371
literales 372 nombres de propiedad 374
C operaciones de modelo 379 obtener propiedades 375
cadenas 17 operaciones de nodo 376 referencias de nodos 374
cambio entre minúsculas y operaciones de resultado de repositorio 378
mayúsculas 49 documento 379 sistema de archivos 378
campos operaciones de ruta 379 tipos de modelos 374
desactivación de los scripts 163 operadores 372 tipos de nodo 374
caracteres que no son ASCII 22 referencias de objeto 372 tipos de salida 374
clave de iteración funciones de cadena 49 variables 374
bucle en scripts 8 varios 380
385
modelado de bases de datos 289 Modelos de clasificador automático modelos de secuencias
modelo de contenido de tabla 54 propiedades de scripts de nodos 272 propiedades de scripts de nodos 248,
modelo de contenido JSON 57 modelos de detección de anomalías 284
modelo de contenido XML 55 propiedades de scripts de nodos 185, modelos de selección de características
modelos 271 aplicación 5
nombres de scripts 367, 369 Modelos de IBM SPSS Statistics propiedades de scripts de nodos 213,
modelos apriori propiedades de scripts de nodos 348 278
propiedades de scripts de nodos 187, modelos de K-medias scripts 5
271 propiedades de scripts de nodos 227, modelos de serie temporal
Modelos Apriori de Oracle 279 propiedades de scripts de nodos 259,
propiedades de scripts de nodos 293, modelos de K-medias de Netezza 285
299 propiedades de scripts de nodos 300, modelos de serie temporal de modalidad
modelos autonuméricos 311 continua
propiedades de scripts de nodos 194 Modelos de K-medias de Oracle propiedades de scripts de nodos 125
Modelos autonuméricos propiedades de scripts de nodos 293, modelos de series temporales
propiedades de scripts de nodos 273 299 propiedades de scripts de nodos 259,
Modelos bayesianos adaptativos de modelos de la máquina de vectores de 263, 285
Oracle soporte Modelos de series temporales de Netezza
propiedades de scripts de nodos 293, propiedades de scripts de nodos 254, propiedades de scripts de nodos 300
299 284 modelos del vecino más próximo
modelos bietápicos modelos de la máquina de vectores de propiedades de scripts de nodos 228
propiedades de scripts de nodos 267, soporte lineal modelos discriminantes
286 propiedades de scripts de nodos 237, propiedades de scripts de nodos 208,
modelos bietápicos AS 281 275
propiedades de scripts de nodos 268, modelos de listas de decisiones modelos generados
286 propiedades de scripts de nodos 206, nombres de scripts 367, 369
modelos C5.0 275 Modelos GLMM
propiedades de scripts de nodos 198, Modelos de máquinas de vectores de propiedades de scripts de nodos 218,
273 soporte de Oracle 278
modelos CARMA propiedades de scripts de nodos 293, modelos KNN
propiedades de scripts de nodos 199, 299 propiedades de scripts de nodos 280
274 modelos de Microsoft Modelos KNN de Netezza
modelos causales temporales propiedades de scripts de nodos 289, propiedades de scripts de nodos 300,
propiedades de scripts de nodos 255 291 311
modelos CHAID Modelos de Netezza modelos kohonen
propiedades de scripts de nodos 203, propiedades de scripts de nodos 300 propiedades de scripts de nodos 229
274 Modelos de NMF de Oracle modelos Kohonen
Modelos de agrupación en clústeres propiedades de scripts de nodos 293, propiedades de scripts de nodos 280
divisivo de Netezza 299 modelos lineales
propiedades de scripts de nodos 300, modelos de Oracle propiedades de scripts de nodos 231,
311 propiedades de scripts de nodos 293 280
modelos de árbol aleatorio modelos de red bayesiana modelos lineales generalizados
propiedades de scripts de nodos 244, propiedades de scripts de nodos 196 propiedades de scripts de nodos 215,
283 Modelos de red bayesiana de Netezza 278
modelos de árbol C&R propiedades de scripts de nodos 300, Modelos lineales generalizados de
propiedades de scripts de nodos 200, 311 Netezza
274 modelos de red neuronal propiedades de scripts de nodos 300
Modelos de árbol de decisión de Oracle propiedades de scripts de nodos 238, Modelos lineales generalizados de Oracle
propiedades de scripts de nodos 293, 281 propiedades de scripts de nodos 293
299 Modelos de redes bayesianas modelos linear-AS
modelos de árboles de decisión de propiedades de scripts de nodos 273 propiedades de scripts de nodos 232,
Netezza Modelos de regresión de Cox 280
propiedades de scripts de nodos 300, propiedades de scripts de nodos 205, modelos LSVM
311 275 propiedades de scripts de nodos 237
Modelos de árboles de regresión de modelos de regresión lineal Modelos Oracle AI
Netezza propiedades de scripts de nodos 246, propiedades de scripts de nodos 293
propiedades de scripts de nodos 300, 283, 284 Modelos para LMD de Oracle
311 Modelos de regresión lineal de Netezza propiedades de scripts de nodos 293,
modelos de Autoclúster propiedades de scripts de nodos 300, 299
propiedades de scripts de nodos 273 311 modelos PCA
Modelos de bayesiano ingenuo de modelos de regresión logística propiedades de scripts de nodos 212,
Netezza propiedades de scripts de nodos 233, 277
propiedades de scripts de nodos 300, 281 Modelos PCA de Netezza
311 modelos de respuesta de autoaprendizaje propiedades de scripts de nodos 300,
Modelos de bayesiano ingenuo de Oracle propiedades de scripts de nodos 249, 311
propiedades de scripts de nodos 293, 284
299
Índice 387
nodo Sim Fit orden de ejecución propiedades de applylinearasnode 280
propiedades 323 modificación con scripts 49 Propiedades de applylinearnode 280
nodo Sim Gen orden de ejecución de rutas propiedades de applylogregnode 281
propiedades 95 modificación con scripts 49 propiedades de applylsvmnode 281
nodo Simulación de generación orientado a objetos 23 propiedades de
propiedades 95 applymslogisticnode 291
nodo sort propiedades de
propiedades 122
nodo STP
P applymsneuralnetworknode 291
propiedades de
palabra clave generada 53
propiedades 250 applymsregressionnode 291
parámetros 5, 69, 71, 73
nodo t-SNE propiedades de
scripts 16
propiedades 180, 354 applymssequenceclusternode 291
Supernodos 365
nodo Tabla propiedades de
parámetros de intervalo 5, 69, 71
propiedades 325 applymstimeseriesnode 291
pasar argumentos 20
nodo Tipo propiedades de applymstreenode 291
preparación automática de datos
propiedades 157 propiedades de
propiedades 134
nodo Transponer applynetezzabayesnode 311
properties autodataprepnode 134
propiedades 156 propiedades de
propiedad [Link] 49
nodo Val. globales applynetezzadectreenode 311
propiedades
propiedades 322 propiedades de
nodos de modelado de bases de
nodo XGBoost-AS applynetezzadivclusternode 311
datos 289
propiedades 361 propiedades de
nodos Filtrar 69
nodos applynetezzakmeansnode 311
ruta 73
desenlazar nodos 31 propiedades de
scripts 69, 71, 185, 271, 331
enlazar nodos 31 applynetezzaknnnode 311
scripts comunes 71
importación 33 propiedades de
Supernodos 365
información 34 applynetezzalineregressionnode 311
propiedades applyrandomtrees 283
recorrido en bucle en scripts 49 propiedades de
propiedades applyts 285
referencia de nombres 367 applynetezzanaivebayesnode 311
propiedades associationrulesnode 188
suprimir 33 propiedades de
Propiedades cplexoptnode 109
volver a poner 33 applynetezzapcanode 311
propiedades de aggregatenode 107
nodos de exportación propiedades de
propiedades de analysisnode 313
propiedades de scripts de nodos 331 applynetezzaregtreenode 311
propiedades de
nodos de gráficos propiedades de applyneuralnetnode 281
anomalydetectionnode 185
propiedades de los scripts 163 propiedades de
propiedades de anonymizenode 133
nodos de modelado applyneuralnetworknode 282
propiedades de appendnode 107
propiedades de scripts de nodos 185 propiedades de applyoraabnnode 299
propiedades de
nodos de origen propiedades de
applyanomalydetectionnode 271
propiedades 77 applyoradecisiontreenode 299
propiedades de applyapriorinode 271
nodos de resultados propiedades de
propiedades de
propiedades de los scripts 313 applyorakmeansnode 299
applyassociationrulesnode 272
nombres de campos propiedades de applyoranbnode 299
propiedades de
cambio entre minúsculas y propiedades de applyoranmfnode 299
applyautoclassifiernode 272
mayúsculas 49 propiedades de
propiedades de
nugget applyoraoclusternode 299
applyautoclusternode 273
propiedades de scripts de nodos 271 propiedades de applyorasvmnode 299
propiedades de
nugget de nodo de reglas de asociación propiedades de applyquestnode 282
applyautonumericnode 273
propiedades 272 propiedades de applyr 283
propiedades de applybayesnetnode 273
nugget de nodo STP propiedades de
propiedades de applyc50node 273
propiedades 284 applyregressionnode 284
propiedades de applycarmanode 274
nuggets de modelo propiedades de
propiedades de applycartnode 274
nombres de scripts 367, 369 applyselflearningnode 284
propiedades de applychaidnode 274
propiedades de scripts de nodos 271 propiedades de applysequencenode 284
propiedades de applycoxregnode 275
propiedades de applystpnode 284
propiedades de
propiedades de applysvmnode 284
applydecisionlistnode 275
O propiedades de
Propiedades de applytcmnode 285
propiedades de
O-clúster de Oracle applydiscriminantnode 275
applytimeseriesnode 285
propiedades de scripts de nodos 293, propiedades de applyfactornode 277
propiedades de applytreeas 286
299 propiedades de
propiedades de applytwostepAS 286
objetos de resultados applyfeatureselectionnode 278
propiedades de applytwostepnode 286
nombres de scripts 369 propiedades de
propiedades de apriorinode 187
objetos del modelo applygeneralizedlinearnode 278
propiedades de asexport 331
nombres de scripts 367, 369 Propiedades de applygle 279
propiedades de asimport 81
ocsvmnode, propiedades 351 Propiedades de applyglmmnode 278
propiedades de astimeintervalsnode 137
operaciones 16 propiedades de applykmeansnode 279
propiedades de autoclassifiernode 191
Optimización de CPLEX, nodo propiedades de applyknnnode 280
propiedades de autonumericnode 194
propiedades 109 propiedades de applykohonennode 280
Índice 389
Repositorio de IBM SPSS Collaboration servidor
and Deployment Services (continuación) argumentos de la línea de
scripts 50 comandos 66
resultados de ejecución de la ruta, sistema
acceder 53, 58 argumentos de la línea de
modelo de contenido de tabla 54 comandos 64
modelo de contenido JSON 57 sistema de coordenadas de reproyección
modelo de contenido XML 55 propiedades 148
rutas SMOTE, nodo
bucle 6, 7 propiedades 356
comando de conjunto múltiple 69 smotenode, propiedades 356
ejecución 27 supernodo 69
ejecución condicional 6, 11 Supernodo
modificándose 31 ruta 27
propiedades 73 Supernodos
scripts 1, 27 configuración de propiedades 365
parámetros 365
propiedades 365
S rutas 27
scripts 1, 5, 6, 27, 365
script
SVM de una clase, nodo
abreviaturas utilizadas 70
propiedades 351
bucles visuales 6, 7
clave de iteración 8
comprobación de errores 52
conceptos básicos 1, 15 T
ejecución condicional 6, 11 twcimport, propiedades de nodo 99
en Supernodos 5
interfaz de usuario 1, 4, 5
nodos de resultados 313
orden de ejecución de rutas 49
V
variable de iteración
propiedades comunes 71
bucle en scripts 9
scripts de herencia 372, 373, 376, 379
variables
scripts Python 372, 373, 376, 379
scripts 16
selección de campos 10
variables ocultas 25
sintaxis 16, 17, 18, 19, 20, 21, 22, 23,
24, 25
variable de iteración 9
scripts X
almacenamiento 1 XGBoost Linear, nodo
bucle 6, 7 propiedades 357
clave de iteración 8 XGBoost Tree, nodo
compatibilidad con versiones propiedades 358
anteriores 53 xgboostlinearnode, propiedades 357
contexto 28 xgboosttreenode, propiedades 358
desde la línea de comandos 52
Diagramas 27
ejecución 12
ejecución condicional 6, 11
importación desde archivos de
texto 1
interrupción 12
modelos de selección de
características 5
nodos de gráficos 163
rutas 1, 27
rutas de supernodo 27
scripts autónomos 1, 27
Scripts de Supernodo 1, 27
selección de campos 10
variable de iteración 9
scripts autónomos 1, 4, 27
seguridad
contraseñas codificadas 52, 66
Series temporales de MS
propiedades de scripts de nodos 291
Impreso en España