0% encontró este documento útil (0 votos)
67 vistas10 páginas

Glosario 10

Data analysis terms and definitions are provided, including concepts like data science, data analytics, data modeling, data visualization, and data ethics. Terms are defined such as datasets, metrics, algorithms, and data types. The document serves as a glossary of computational data analysis terms from A to Z.

Cargado por

Luis
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
67 vistas10 páginas

Glosario 10

Data analysis terms and definitions are provided, including concepts like data science, data analytics, data modeling, data visualization, and data ethics. Terms are defined such as datasets, metrics, algorithms, and data types. The document serves as a glossary of computational data analysis terms from A to Z.

Cargado por

Luis
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Glosario

Análisis computacional de datos


Términos y definiciones

A
Agenda: Una lista de citas programadas.

Alcance del trabajo (SOW): Esquema acordado de las tareas a realizar durante un proyecto.

Algoritmo: Proceso o conjunto de reglas a seguir para una tarea específica.

Análisis computacional de datos: La ciencia de los datos.

Análisis de datos: La recopilación, transformación y organización de los datos para sacar


conclusiones, hacer predicciones e impulsar una toma de decisiones fundamentada.

Análisis de déficits: Método para examinar y evaluar el estado actual de un proceso con el fin
de identificar las oportunidades de mejora en el futuro.

Analista de datos: Alguien que recopila, transforma y organiza los datos para sacar
conclusiones, hacer predicciones e impulsar la toma de decisiones fundamentada.

Anonimización de datos: El proceso de proteger los datos privados o confidenciales de las


personas eliminando información que pueda asociarse a ellas.

Apertura: El aspecto de la ética de datos que promueve el acceso libre a los datos, su uso y
también el uso compartido.

Archivo de audio: Almacenamiento en audio digitalizado generalmente en MP3, AAC u otro


formato comprimido.

Archivo de video: Conjunto de imágenes, archivos de audio y otros datos generalmente


codificados en un formato comprimido, por ejemplo, MP4, MV4, MOV, AVI o FLV.

Atributo: Característica o calidad de los datos que se usa para etiquetar una columna en una
tabla.

B
Base de datos relacional: Base de datos que contiene una serie de tablas que se pueden
conectar para formar relaciones.

Base de datos: Recopilación de datos almacenados en un sistema informático.

Bordes: Líneas que se pueden agregar alrededor de dos o más celdas en una hoja de cálculo.

C
Campo: Información de una fila o columna de una hoja de cálculo; en una tabla de datos, suele
ser una columna de la tabla.

Causa raíz: La razón por la que ocurre un problema.

Ciclo de vida de los datos: Secuencia de etapas por las que pasan los datos, que incluye
planificar, capturar, gestionar, analizar, archivar y destruir.

Ciencia de datos: Campo de estudio que utiliza datos sin procesar para crear nuevas formas
de modelar y entender lo desconocido.

Conjunto de datos: Una colección de datos que pueden ser manipulados o analizados como
una unidad.

Consentimiento: El aspecto de la ética de datos que considera el derecho de una persona de


conocer cómo y por qué se utilizarán sus datos personales antes de estar de acuerdo de
proporcionarlos.

Consulta: Solicitud de datos o información de una base de datos.

CONTAR: Función de la hoja de cálculo que cuenta el número de celdas en un rango que
cumplen con un criterio específico.

Contexto: La condición en la que algo existe o sucede.

Controlador de relleno: Cuadro en la esquina inferior derecha de una celda seleccionada de


una hoja de cálculo que se puede arrastrar pasando por celdas vecinas para seguir una
instrucción.

Cookie: Pequeño archivo almacenado en una computadora que contiene información acerca
de sus usuarios.

D
Datos abiertos: Datos que están disponibles para el público.
Datos booleanos: Tipo de datos con solo dos valores posibles, generalmente verdadero o
falso.

Datos continuos: Datos que se miden y que pueden tener casi cualquier valor numérico.

Datos cualitativos: Medida subjetiva y explicativa de una cualidad o característica.

Datos cuantitativos: Medida específica y objetiva, como un número, cantidad o rango.

Datos de primera fuente: Datos recopilados por una persona o por un grupo utilizando sus
propios recursos.

Datos de segunda fuente: Datos que recopila un grupo directamente de su audiencia y que,
luego, se venden.

Datos de terceros: Datos proporcionados de fuentes externas que no los recopilaron


directamente.

Datos discretos: Datos que se cuentan y tienen un número limitado de valores.

Datos en formato ancho: Conjunto de datos en el que cada tema tiene una sola fila con varias
columnas para describir los valores de los distintos atributos del tema.

Datos en formato largo: Conjunto de datos en el que cada fila constituye un punto en el
tiempo por sujeto, es decir que cada sujeto tiene datos en varias filas.

Datos estructurados: Datos organizados de cierta forma, por ejemplo, en filas y columnas.

Datos externos: Los datos que se alojan y generan fuera de una organización.

Datos internos: Datos alojados en los sistemas propios de una empresa.

Datos no estructurados: Datos que no se organizan de forma que sea fácil identificarlos.

Datos nominales: Tipo de datos cualitativos que se categorizan sin un orden establecido.

Datos ordinales: Datos cualitativos con un orden o escala establecidos.

Datos: Una colección de hechos.

Destrezas analíticas: Cualidades y características asociadas al uso de hechos para resolver


problemas.

Diseño de datos: Cómo se organiza la información.

Dominio del problema: Área de análisis que abarca cada actividad que afecta a un problema
o se ve afectada por él.

E
Ecosistema de datos: Los distintos elementos que interactúan entre sí para producir,
gestionar, almacenar, organizar, analizar y compartir datos.

Ecuación: Cálculo que implica suma, resta, multiplicación o división (también se denomina
expresión matemática).

Elemento de datos: Cierta información dentro de un conjunto de datos.

Encabezado: La primera fila en una hoja de cálculo que hace referencia al tipo de datos en
cada columna.

Equidad: Cualidad del análisis de datos que no genera sesgos ni los reafirma.

Estrategia de datos: La gestión de las personas, los procesos y las herramientas que se usan
en el análisis de datos.

Ética de datos: Normas justificadas respecto de lo que está bien y lo que está mal a la hora de
recopilar, compartir y usar datos.

Ética: Normas justificadas respecto de lo que está bien y lo que está mal. Por lo general,
presuponen lo que deben hacer los seres humanos, usualmente en términos de derechos,
obligaciones, beneficios para la sociedad, equidad o virtudes específicas.

Expresión matemática: Cálculo que implica la suma, resta, multiplicación o división (también
denominada “ecuación”).

F
Filtrado: Proceso que muestra solo los datos que cumplen con un criterio específico mientras
oculta el resto.

Fórmula: Conjunto de instrucciones que se utilizan para realizar un cálculo utilizando los datos
de una hoja de cálculo.

Foto digital: Una imagen electrónica o computarizada, generalmente en formato BMP o JPG.

Fuente de datos correctos: Fuente de datos confiable, original, integral, actual y citada
(ROCCC).

Fuente de datos erróneos: Fuente de datos que no es confiable, original, integral, actual ni
citada (ROCCC).

Función matemática: Función que se utiliza como parte de una fórmula matemática.

Función: Comando preestablecido que realiza automáticamente un proceso o tarea


especificado utilizando los datos de una hoja de cálculo.
G
Gráfico dinámico: Gráfico creado a partir de los campos de una tabla dinámica.

H
Hoja de cálculo: Una hoja de cálculo digital.

I
Informe: Conjunto estático de datos que se entrega periódicamente a los interesados.

Ingresos: Cantidad total de ingresos generados por la venta de mercaderías o servicios.

Interesados: Personas que invierten tiempo y recursos en un proyecto y se interesan por su


resultado.

Interoperabilidad de los datos: Factor clave que conlleva el uso satisfactorio de los datos
abiertos entre empresas y gobiernos.

J
K
L
Lenguaje de consulta estructurado (SQL): Lenguaje de programación informática utilizado
para comunicarse con una base de datos.

Lenguaje de consulta: Lenguaje de programación informática utilizado para comunicarse con


una base de datos.

M
Macrodatos: Conjuntos de datos grandes, complejos que generalmente implican largos
períodos de tiempo, que permiten que los analistas de datos aborden los problemas
comerciales de gran alcance.
MAX: Función de la hoja de cálculo que muestra el valor numérico mayor de un rango de
celdas.

Mentalidad técnica: La capacidad de dividir las cosas en pasos o piezas más pequeñas y
trabajar con ellas de forma ordenada y lógica.

Metodología SMART: Herramienta para determinar la eficacia de una pregunta según sea
específica, mensurable, orientada a la acción, pertinente y con plazos determinados.

Métrica: Tipo de datos únicos y cuantificables que se utiliza para medición.

Microdatos: Puntos de datos pequeños, específicos, que generalmente involucran un breve


período y que son útiles para tomar decisiones diarias.

MIN: Función de la hoja de cálculo que muestra el valor numérico menor de un rango de
celdas.

Modelo de datos: Herramienta para organizar los elementos de datos y la forma en que se
relacionan entre ellos.

Muestra: En el análisis computacional de datos, segmento de una población que la representa


toda.

Muestreo imparcial: Muestra de la población que la representa en su totalidad.

N
Nube: Lugar para mantener los datos en línea, en lugar de tenerlos en el disco duro de una
computadora.

O
Objetivo medible: Objetivo medible establecido por una empresa y evaluado mediante
métricas.

Observación: Los atributos que describen una pieza de datos contenida en una fila de una
tabla.

Oficina del Censo de los Estados Unidos: Agencia del Departamento de Comercio de los
Estados Unidos que funciona como proveedor principal de datos de calidad sobre las personas
y la economía a nivel nacional.

Operador: Símbolo que designa la operación o cálculo a realizarse.

Orden de operaciones: Uso de paréntesis para agrupar los valores de la hoja de cálculo a fin
de aclarar el orden en el que deben realizarse las operaciones.
Ordenación: El proceso de organizar los datos en un orden significativo para que sea más fácil
entenderlos, analizarlos y visualizarlos.

P
Panel: Herramienta que monitorea los datos entrantes en vivo.

Pensamiento analítico: El proceso de identificar y definir un problema, para luego resolverlo


mediante el uso de datos de manera organizada, paso a paso.

Pensamiento estructurado: El proceso de reconocer el problema o la situación actuales,


organizar la información disponible, revelar déficits y oportunidades, e identificar opciones.

Píxel: En imágenes digitales, es un área pequeña de iluminación en una pantalla de


visualización que, cuando se combina con otras áreas adyacentes, forma una imagen digital.

Población: En análisis computacional de datos, todos los valores de datos posibles en un


conjunto de datos.

Pregunta con límite de tiempo: Pregunta que especifica un plazo a analizar.

Pregunta específica: Pregunta simple, significativa y enfocada en un solo tema o en algunas


ideas estrechamente relacionadas entre sí.

Pregunta injusta: Pregunta en la que se hacen suposiciones o que es difícil de responder


honestamente.

Pregunta medible: Pregunta cuyas respuestas se pueden cuantificar y evaluar.

Pregunta orientada a la acción: Pregunta cuyas respuestas conducen al cambio.

Pregunta principal: Pregunta que orienta a las personas hacia cierta respuesta.

Pregunta relevante: Pregunta que tiene importancia para el problema que se debe resolver.

Privacidad de los datos: Preservación de la información sobre los datos de una persona cada
vez que ocurre una transacción de datos.

Proceso de análisis de datos: Las seis fases de preguntar, preparar, procesar, analizar,
compartir y actuar cuyo propósito es el de obtener conocimiento que propicie la toma de
decisiones informada.

PROMEDIO: Función de una hoja de cálculo que muestra el resultado de un promedio de los
valores de un rango seleccionado.

Propiedad: El aspecto de la ética de datos que presupone que cada persona es dueña de los
datos sin procesar que proporciona y que tiene control primordial sobre su uso, procesamiento
y uso compartido.
Q
R
Rango: Conjunto de dos o más celdas en una hoja de cálculo.

Redes sociales: Sitios web y aplicaciones en los que los usuarios crean y comparten
contenido o interactúan entre sí.

Referencia de celda: Una celda o un rango de celdas en una hoja de cálculo que se utiliza
generalmente en las fórmulas y funciones.

Reformulación: Proceso de replantear un problema o desafío, que se redirecciona luego hacia


una posible resolución.

Registro: Conjunto de datos relacionados en una tabla de datos, generalmente sinónimo de


“fila”.

Reglamento General de Protección de Datos de la Unión Europea (GDPR): Organismo


formulador de políticas en la Unión Europea, creado para ayudar a proteger a las personas y
sus datos.

Retorno de la inversión (ROI): Fórmula que utiliza las métricas de inversión y ganancias para
evaluar el éxito de una inversión.

S
Sesgo de confirmación: La tendencia de buscar o interpretar la información de manera que
confirma creencias preexistentes.

Sesgo de interpretación: Tendencia a interpretar situaciones ambiguas de manera positiva o


negativa.

Sesgo de los datos: Cuando una preferencia a favor o en contra de una persona, un grupo de
personas o una cosa sesga sistemáticamente los resultados del análisis de datos en una cierta
dirección.

Sesgo del investigador: Tendencia de distintas personas a observar las cosas de forma
diferente (también se denomina “sesgo del observador”).

Sesgo del muestreo: Representar en mayor o en menor medida a ciertos miembros de una
población debido a que se trabaja con una muestra que no representa a la población en su
totalidad.
Sesgo del observador: Tendencia de distintas personas a observar las cosas de forma
diferente (también se denomina “sesgo del investigador”).

Sesgo: Preferencia consciente o no a favor o en contra de una persona, un grupo de personas


o una cosa.

SQL: (Ver “Lenguaje de consulta estructurado”).

SUMA: Función de una hoja de cálculo que suma los valores de un rango de celdas
seleccionadas.

T
Tabla dinámica: Herramienta de resumen de datos que se utiliza para clasificar, reorganizar,
agrupar, contar, totalizar o promediar datos.

Tarea empresarial: La pregunta o el problema que el análisis de datos resuelve para un


negocio.

Tasa de rotación: Ritmo en el que los empleados abandonan voluntariamente una empresa.

Tipo de datos de texto: Secuencia de caracteres y puntuación que contiene información


textual (también denominado “tipo de datos de cadena”).

Tipo de datos en cadena: Secuencia de caracteres y puntuación que contiene información


textual (también denominado “tipo de datos de texto”).

Tipo de datos: Atributo que describe los datos según sus valores, su lenguaje de
programación o las operaciones que puede realizar.

Tipos de problemas: Distintos problemas a los que se enfrenta el analista de datos, que
incluyen categorizar elementos, descubrir conexiones, hallar patrones, identificar temas, hacer
predicciones y detectar algo inusual.

Toma de decisiones basada en datos: Uso de datos para guiar la estrategia empresarial.

Toma de decisiones inspirada en datos: Exploración de diferentes fuentes de datos para


descubrir qué tienen en común.

Transparencia de la transacción: Aspecto de la ética de datos que presupone que se deben


explicar todas las actividades de procesamiento de datos y los algoritmos a la persona que
proporciona los datos y que también presupone que esta persona debe comprenderlos.

U
V
Vigencia: El aspecto de la ética de datos que presupone que las personas deben conocer las
transacciones financieras resultantes del uso de sus datos personales y la magnitud de esas
transacciones.

Visualización de datos: La representación gráfica de los datos.

Visualización: (Consulta la visualización de datos).

W
X
Y
Z

También podría gustarte