0% encontró este documento útil (0 votos)

95 vistas8 páginas

DATOS

Cargado por

durandcley10

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

95 vistas8 páginas

DATOS

Cargado por

durandcley10

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

1.

DATOS
Voluntarios: Los datos dados voluntariamente son información proporcionada
explícitamente por los consumidores en una interacción directa con la empresa. Permite a
los profesionales de marketing identificar las necesidades, los deseos y los deseos de un
cliente.

Observados: Los expertos en marketing pueden aprender más sobre los comportamientos
y hábitos de los consumidores a través de la observación directa.

Deducidos: Los datos deducidos se recopilan sobre el usuario sin su entrada expresa,
generalmente generados sistemáticamente en función de los historiales de búsqueda, las
compras y la actividad de los medios sociales. Los datos deducidos se basan en
suposiciones bien informadas.

Formas de visualizar los datos

1. Para comparar dos conjuntos de datos. Utilice gráficos de líneas cuando la
cantidad de puntos de datos sea alta y desee mostrar una tendencia en los datos a lo
largo del tiempo.

Casos de uso para gráficos de líneas:

 Las ventas trimestrales de una empresa durante los últimos cinco años.
 El número de clientes por semana en el primer año de una nueva tienda minorista.
 Cambios en el precio de una acción desde la apertura hasta la campana de cierre.

2. Los gráficos de columna se colocan de forma vertical. Para mostrar el valor

numérico de un punto de datos específico y comparar ese valor en categorías similares.

Casos de uso para gráficos de columnas:

 Ingreso por país, como se muestra en el ejemplo del gráfico.

 Las ventas del año pasado de las cuatro principales compañías automotrices en los
EE. UU.
 Puntajes promedio de las pruebas de los estudiantes para cada una de las seis
clases de matemáticas.

3. Los gráficos de barras son similares a columnas, excepto que los datos se
muestran horizontalmente. Los gráficos de barras también permiten una comparación
sencilla entre varios puntos de datos. Las etiquetas de puntos de datos en el gráfico de
barras horizontal están en el lado izquierdo y son más legibles cuando la etiqueta
contiene texto en lugar de valores.

Casos de uso para gráficos de barras:

 Producto interno bruto (PIB) de las 25 naciones con mayores ingresos.

 El número de automóviles en un concesionario vendidos por cada representante
de ventas.
 Calificaciones del examen para cada alumno en una clase de matemática.
4. Los gráficos circulares muestran partes de un todo. Cada porción, o segmento, del
“pastel”, representa un porcentaje del número total. La suma total de los segmentos
debe ser igual al 100%. Un gráfico circular muestra los diferentes valores de una
variable determinada.

Algunos casos de uso que ilustran la comparación de la información con un gráfico circular
incluyen:

 Categorías de gastos anuales para una corporación (por ejemplo, alquiler,

administración, servicios públicos, producción)
 Las fuentes de energía de un país (por ej., petróleo, carbón, gas, energía solar,
energía eólica)
 Resultados de una encuesta para el tipo de película favorita (por ejemplo, acción,
romance, comedia, drama, ciencia ficción)
5. Los diagramas de dispersión son muy populares para las visualizaciones de
correlación o cuando desea mostrar la distribución, o todos los valores posibles, de una
gran cantidad de puntos de datos. Los diagramas de dispersión también son útiles para
demostrar el agrupamiento o identificar valores atípicos en los datos.

Algunos casos de uso que ilustran la visualización de la distribución de muchos puntos de

datos con un gráfico de dispersión incluyen:

 Comparación de las expectativas de vida de los países con su PIB (Producto

Interno Bruto).
 Comparación de las ventas diarias de helado con la temperatura exterior
promedio durante varios días.
 Comparar el peso con la altura de cada persona en un grupo grande.

Discreto versus Continuo

¿Qué afirmación es una descripción precisa de variables discretas?

Son cuantitativas con un conjunto finito de valores.

 La cantidad de empleados en cada departamento son datos discretos porque tiene una
cantidad limitada de valores posibles.
 La temperatura dentro de la tienda es un dato continuo porque la temperatura puede
estar en un rango infinito de valores.
 La distancia recorrida por una bicicleta en movimiento son datos continuos porque el
peso puede estar en un rango infinito de valores.
 La cantidad de clientes que compraron bicicletas son datos discretos porque tienen
una cantidad limitada de valores posibles.
Datos Estructurados y No Estructurados
Datos Estructurados

Los datos estructurados representan entre el 10% y el 20% de los datos generados y tienen
tipos de datos y patrones claramente definidos que facilitan su almacenamiento y organización
en columnas y filas. Esta organización facilita la búsqueda y el análisis de datos estructurados.
Las fuentes de datos estructurados incluyen registros de ventas, sistemas de reserva de líneas
aéreas y control de inventario. Los datos estructurados generalmente se almacenan en bases
de datos relacionales como bases de datos de Lenguaje de Consulta Estructurado (SQL) o en
hojas de cálculo como Microsoft Excel.

Datos No Estructurados

Los datos no estructurados constituyen la mayoría de los datos generados, aproximadamente

el 80%, y no se pueden organizar en filas y columnas. Esto hace que los datos no estructurados
sean difíciles de buscar, administrar y analizar. Las fuentes de datos no estructurados incluyen
imágenes, archivos PDF, datos de sensores y publicaciones en medios sociales. Los datos no
estructurados generalmente se almacenan en una base de datos no relacional, también
conocida como base de datos NoSQL.

2. DATOS MASIVOS
Datos masivos (Big Data) es un término utilizado para describir los volúmenes masivos de datos
digitales generados, recopilados y procesados. El término datos masivos describe datos que se
mueven demasiado rápido, son simplemente demasiado grandes o demasiado complejos para
almacenarse, procesarse o analizarse con aplicaciones tradicionales de almacenamiento y
análisis de datos. Algunos ejemplos de datos masivos incluyen datos generados por
publicaciones en cuentas de medios sociales, como Facebook y Twitter, y las calificaciones
otorgadas a productos en sitios de comercio electrónico como el mercado de Amazon.
 El volumen describe la cantidad de datos que se transporta y se almacena.
 La veracidad es el proceso de evitar que los datos inexactos estropeen sus conjuntos de
datos

Canalizaciones de Datos
Los ingenieros de datos administran los datos a través de una canalización de datos. La
canalización de datos tiene tres etapas: ingestión, transformación y almacenamiento. Estas
excluyen etapas en cualquier análisis que deba realizarse.

ORDEN: Ingestión, Transformación, Almacenamiento, Análisis

APRENDIZAJE AUTOMATICO

Supervisado
Los algoritmos de aprendizaje automáticos supervisados son los más
utilizados para el análisis predictivo. El aprendizaje automático supervisado
requiere la interacción humana para etiquetar los datos leídos para un
aprendizaje supervisado preciso. En el aprendizaje supervisado, el modelo se
enseña con ejemplos mediante el uso de conjuntos de datos de entrada y
salida procesados por expertos humanos, generalmente científicos de datos. El
modelo aprende las relaciones entre los datos de entrada y salida y luego
utiliza esa información para formular predicciones basadas en nuevos
conjuntos de datos. Por ejemplo, un modelo de clasificación puede aprender a
identificar plantas después de recibir capacitación en un conjunto de datos de
imágenes correctamente etiquetadas con las especies de plantas y otras
características de identificación.

Los métodos de aprendizaje automático supervisados suelen resolver

problemas de regresión y clasificación:

 Los problemas de regresión implican estimar la(s) relación(es)

matemática(s) entre una variable continua y una o más variables. Esta
relación matemática luego puede calcular los valores de una variable
desconocida dados los valores conocidos de las demás. Los ejemplos
de problemas que utilizan la regresión incluyen la estimación de la
posición y la velocidad de un automóvil mediante GPS, la predicción de
la trayectoria de un tornado mediante datos meteorológicos o la
predicción del valor futuro de una acción mediante datos históricos y de
otro tipo.
 Los problemas de clasificación consisten en una variable discreta
desconocida. Por lo general, el problema consiste en estimar qué
muestra específica pertenece a un conjunto de clases predefinidas.
Ejemplos de clasificación son el filtrado de correo electrónico en spam o
no spam, el diagnóstico de patologías a partir de pruebas médicas o la
identificación de rostros en una imagen.

no supervisado
Los algoritmos de aprendizaje automático no supervisados no requieren
expertos humanos, sino que descubren patrones en los datos de forma
autónoma. El aprendizaje no supervisado se ocupa principalmente de datos sin
etiquetar. El modelo debe funcionar por sí solo para encontrar patrones e
información. Algunos ejemplos de problemas resueltos con métodos no
supervisados son el agrupamiento en clústeres y la asociación:

 Métodos de agrupación en clústeres - La agrupación en clústeres es

la agrupación de datos que tienen características similares. Ayuda a
segmentar los datos en grupos ya analizar cada uno para encontrar
patrones. Por ejemplo, los algoritmos de agrupación identifican grupos
de usuarios en función de su historial de compras en línea y luego
envían anuncios dirigidos a cada miembro.
 Métodos de asociación - La asociación consiste en descubrir grupos
de elementos frecuentemente observados juntos. Los minoristas en
línea usan asociaciones para sugerir compras adicionales a un usuario
en función del contenido de su carrito de compras.

 Refuerzo
 El aprendizaje por refuerzo enseña a la máquina a través de la prueba
y el error mediante la retroalimentación de sus acciones y experiencias,
también conocida como aprendizaje de errores. Implica asignar valores
positivos a los resultados deseados y valores negativos a los efectos no
deseados. El resultado son soluciones optimas; el sistema aprende a
evitar resultados adversos y buscar lo positivo. Las aplicaciones
prácticas del aprendizaje por refuerzo incluyen la creación de
inteligencia de ratificación para juegos de video, robótica y
automatización industrial.

Roles en las Profesiones de Análisis de

Datos
Analista de Datos

Los analistas de datos consultan, procesan, proporcionan informes y resumen y

visualizan datos. Utilicen las herramientas y los métodos existentes para
resolver un problema. Ayudan a las personas, como los analistas de negocio, a
comprender consultas específicas con informes y gráficos ad hoc. Los analistas
de datos deben comprender los principios estadísticos básicos, la limpieza de
diferentes tipos de datos, la visualización y el análisis exploratorio de datos. En
resumen, los analistas de datos analizan los datos para ayudar a las empresas
y otras organizaciones a tomar decisiones informadas.

Ingeniero de Datos

Los ingenieros de datos son responsables de crear y poner en funcionamiento

las canalizaciones de datos para recopilar y organizar los datos. Garantizan la
accesibilidad y la disponibilidad de datos de calidad para científicos de datos y
analistas de datos mediante la integración de datos de fuentes dispares y
realizando la limpieza y transformación de datos. Las habilidades necesarias
para los roles de ingeniería de datos incluyen comprender la arquitectura, las
herramientas y los métodos de ingestión, transformación y almacenamiento de
datos; y dominio de múltiples lenguajes de programación (incluidos Python y
Scala). En resumen, los ingenieros de datos crean y operan la infraestructura
de datos necesaria para preparar los datos para su posterior análisis por parte
de analistas de datos y científicos.

Científico de Datos

Los científicos de datos aplican las estadísticas, el aprendizaje automático y los

enfoques analíticos para responder las preguntas esenciales de la
empresa. Los científicos de datos interpretan y entregan los resultados de sus
hallazgos mediante el uso de técnicas de visualización, la creación de
aplicaciones de ciencia de datos o la narración de historias emocionantes sobre
las soluciones a sus problemas de datos (empresariales). Trabajan con los
conjuntos de datos de diferentes tamaños, y ejecutan algoritmos en los grandes
conjuntos de datos. Los científicos de datos deben estar al día con las últimas
tecnologías de automatización y aprendizaje automático. Los requisitos para
desempeñar estos roles incluyen habilidades estadísticas y analíticas,
conocimientos de programación (Python, R, Java) y familiaridad con Hadoop,
un conjunto de utilidades de software de código abierto que facilita el trabajo
con grandes cantidades de datos. Los científicos de datos son expertos en
datos que organizan y ofrecen valor a partir de los datos.

¿Cuál es el rol de un analista de datos?

Consultar y procesar datos, proporcionar informes, resumir y visualizar datos.

¿Cuál es el papel de un científico de datos?

Aplicar estadísticas, aprendizaje automático, técnicas de visualización y

enfoques analíticos para responder preguntas críticas comerciales.

¿Cuál es el rol de un ingeniero de datos?

Desarrollar y poner en funcionamiento tuberías de datos para recopilar y

organizar datos.

También podría gustarte

DN0113 - Tema - 3a Fundamentos y Visualización de Datos
Aún no hay calificaciones
DN0113 - Tema - 3a Fundamentos y Visualización de Datos
38 páginas
Apuntes - Cisco Ciencia de Datos
Aún no hay calificaciones
Apuntes - Cisco Ciencia de Datos
34 páginas
Analítica y Minería de Datos
Aún no hay calificaciones
Analítica y Minería de Datos
23 páginas
Análisis y Visualización de Datos
Aún no hay calificaciones
Análisis y Visualización de Datos
6 páginas
Tipos de Gráficos Estadísticos
Aún no hay calificaciones
Tipos de Gráficos Estadísticos
17 páginas
Modulo 1 Ciencia de Datos
Aún no hay calificaciones
Modulo 1 Ciencia de Datos
11 páginas
Tema 1
Aún no hay calificaciones
Tema 1
6 páginas
Visualizacion
Aún no hay calificaciones
Visualizacion
60 páginas
Gráficos de barras y líneas: Guía esencial
Aún no hay calificaciones
Gráficos de barras y líneas: Guía esencial
12 páginas
Cuestionarios IBM JF
Aún no hay calificaciones
Cuestionarios IBM JF
13 páginas
Resúmenes
Aún no hay calificaciones
Resúmenes
19 páginas
Entregable 1 Estadistica en Analitica
Aún no hay calificaciones
Entregable 1 Estadistica en Analitica
8 páginas
Big Data y Estadistica DanielPena UC3M
Aún no hay calificaciones
Big Data y Estadistica DanielPena UC3M
70 páginas
Ciencia de Datos y RStudio: Guía Básica
Aún no hay calificaciones
Ciencia de Datos y RStudio: Guía Básica
54 páginas
Estadística Descriptiva para Negocios
Aún no hay calificaciones
Estadística Descriptiva para Negocios
35 páginas
Cuaderno Del Estudiante
Aún no hay calificaciones
Cuaderno Del Estudiante
23 páginas
La Importancia de Los Datos y Su Uso en La Toma de Decisiones
Aún no hay calificaciones
La Importancia de Los Datos y Su Uso en La Toma de Decisiones
6 páginas
Guía de Análisis y Visualización de Datos
Aún no hay calificaciones
Guía de Análisis y Visualización de Datos
10 páginas
Clasificación y Modelado de Datos
Aún no hay calificaciones
Clasificación y Modelado de Datos
10 páginas
Presentación Grupal Programación 1-1
Aún no hay calificaciones
Presentación Grupal Programación 1-1
22 páginas
Ev 1 AplTec
Aún no hay calificaciones
Ev 1 AplTec
17 páginas
Ensayo Cuantitativo Cualitativo
Aún no hay calificaciones
Ensayo Cuantitativo Cualitativo
7 páginas
Gráficos Estadísticos: Tipos y Usos
Aún no hay calificaciones
Gráficos Estadísticos: Tipos y Usos
9 páginas
Aci3097 c2 Apunteacademico 2024
Aún no hay calificaciones
Aci3097 c2 Apunteacademico 2024
19 páginas
Ciencia y Análisis de Datos: Claves y Tipos
Aún no hay calificaciones
Ciencia y Análisis de Datos: Claves y Tipos
11 páginas
Herramientas y Técnicas de Visualización de Datos
Aún no hay calificaciones
Herramientas y Técnicas de Visualización de Datos
7 páginas
Inteligencia de Negocios EXAMENES
100% (1)
Inteligencia de Negocios EXAMENES
7 páginas
Informatica Consutla
Aún no hay calificaciones
Informatica Consutla
8 páginas
SAS-Tecnicas de Visualización de Datos
100% (1)
SAS-Tecnicas de Visualización de Datos
26 páginas
Trabajo Sobre Gráficos Estadísticos 1
Aún no hay calificaciones
Trabajo Sobre Gráficos Estadísticos 1
10 páginas
Geba U1 A2 Crha - 2
Aún no hay calificaciones
Geba U1 A2 Crha - 2
12 páginas
Actividad, Semana 4 Cuadro de Doble Entrada en Word 9
Aún no hay calificaciones
Actividad, Semana 4 Cuadro de Doble Entrada en Word 9
7 páginas
Apuntes Graficos
Aún no hay calificaciones
Apuntes Graficos
7 páginas
Unidad 1-2 PDF
Aún no hay calificaciones
Unidad 1-2 PDF
28 páginas
Guía de Gráficos Estadísticos en Economía
Aún no hay calificaciones
Guía de Gráficos Estadísticos en Economía
4 páginas
DataAnalytics Clase 0 - Examen de Ingreso
Aún no hay calificaciones
DataAnalytics Clase 0 - Examen de Ingreso
8 páginas
Visualización de Datos y Storytelling
Aún no hay calificaciones
Visualización de Datos y Storytelling
5 páginas
SOLUCION GUIA 14 Fase de Analisis Gestión Empresarial
Aún no hay calificaciones
SOLUCION GUIA 14 Fase de Analisis Gestión Empresarial
21 páginas
Pasos Estadistica
Aún no hay calificaciones
Pasos Estadistica
20 páginas
Tipos y Usos de Gráficos Estadísticos
Aún no hay calificaciones
Tipos y Usos de Gráficos Estadísticos
11 páginas
Guia Completa para Tu Carrera en Datos Caterina Abanoni
Aún no hay calificaciones
Guia Completa para Tu Carrera en Datos Caterina Abanoni
58 páginas
Introduccion Pruebas de Normalidad 2025 01
Aún no hay calificaciones
Introduccion Pruebas de Normalidad 2025 01
16 páginas
Ciencia de Datos
Aún no hay calificaciones
Ciencia de Datos
2 páginas
Analisis Datos Preprocesamiento
Aún no hay calificaciones
Analisis Datos Preprocesamiento
79 páginas
Introducción A La Ciencia de Datos - Datos
Aún no hay calificaciones
Introducción A La Ciencia de Datos - Datos
7 páginas
Analisis Exploratorio de Datos Univariad
Aún no hay calificaciones
Analisis Exploratorio de Datos Univariad
57 páginas
Presentación Visualizacion 14052021
Aún no hay calificaciones
Presentación Visualizacion 14052021
44 páginas
Guía de Gráficos Estadísticos y Variables
Aún no hay calificaciones
Guía de Gráficos Estadísticos y Variables
12 páginas
Estadistica Unidad 1 y 2
Aún no hay calificaciones
Estadistica Unidad 1 y 2
427 páginas
T-CDM 23 001055 01
Aún no hay calificaciones
T-CDM 23 001055 01
15 páginas
Introducción a R para Ciencia de Datos
Aún no hay calificaciones
Introducción a R para Ciencia de Datos
12 páginas
Módulo II Tipos de Graficos Estadísticos
Aún no hay calificaciones
Módulo II Tipos de Graficos Estadísticos
35 páginas
Análisis y Construcción de Bases de Datos
Aún no hay calificaciones
Análisis y Construcción de Bases de Datos
7 páginas
Procesamiento y Análisis de Datos
Aún no hay calificaciones
Procesamiento y Análisis de Datos
47 páginas
Mapa Conceptual Estadistica Descrptiva
Aún no hay calificaciones
Mapa Conceptual Estadistica Descrptiva
6 páginas
Taller 2
Aún no hay calificaciones
Taller 2
10 páginas
Ciencia de Datos para Gente Sociable - Antonio Vazquez Brust PDF
Aún no hay calificaciones
Ciencia de Datos para Gente Sociable - Antonio Vazquez Brust PDF
112 páginas
Características del Big Data en Empresas
Aún no hay calificaciones
Características del Big Data en Empresas
15 páginas
Sesion Nociones Basicas de Estadistica Taller
Aún no hay calificaciones
Sesion Nociones Basicas de Estadistica Taller
6 páginas
Resolución de Problemas de Datos Matemáticos
Aún no hay calificaciones
Resolución de Problemas de Datos Matemáticos
9 páginas
Ejemplo de Estimación Del Tránsito de Diseño S
Aún no hay calificaciones
Ejemplo de Estimación Del Tránsito de Diseño S
15 páginas
Lista de Cotejo
100% (1)
Lista de Cotejo
8 páginas
Resumen Del Tema #3 PPS Virtual 2022
Aún no hay calificaciones
Resumen Del Tema #3 PPS Virtual 2022
8 páginas
Orígenes y funciones de los test psicológicos
Aún no hay calificaciones
Orígenes y funciones de los test psicológicos
92 páginas
Población de San Luis 2022
Aún no hay calificaciones
Población de San Luis 2022
160 páginas
EVALUACIÓN FINAL - Estadística Aplicada para La Gestión-1 (Recuperado Automáticamente)
Aún no hay calificaciones
EVALUACIÓN FINAL - Estadística Aplicada para La Gestión-1 (Recuperado Automáticamente)
6 páginas
ESTADO DEL ARTE DE LA INVESTIGACION. Paul Grados Cruz
Aún no hay calificaciones
ESTADO DEL ARTE DE LA INVESTIGACION. Paul Grados Cruz
5 páginas
Estadística
Aún no hay calificaciones
Estadística
6 páginas
Fundamentos de Investigación en Psicología
Aún no hay calificaciones
Fundamentos de Investigación en Psicología
30 páginas
Examen Final Estadística Politecnico
Aún no hay calificaciones
Examen Final Estadística Politecnico
19 páginas
Variables Aleatorias: Conceptos y Ejemplos
Aún no hay calificaciones
Variables Aleatorias: Conceptos y Ejemplos
94 páginas
Cuadro Comparativo de Tipos de Investigación
Aún no hay calificaciones
Cuadro Comparativo de Tipos de Investigación
3 páginas
Análisis Estadístico en Pronósticos Empresariales
Aún no hay calificaciones
Análisis Estadístico en Pronósticos Empresariales
3 páginas
Plan Curricular de Razonamiento Abstracto
Aún no hay calificaciones
Plan Curricular de Razonamiento Abstracto
4 páginas
Fase 4 - 228002 - 01
Aún no hay calificaciones
Fase 4 - 228002 - 01
10 páginas
Guía Estadística para Aprendices SENA
Aún no hay calificaciones
Guía Estadística para Aprendices SENA
27 páginas
2.8 Intervalo de Confianza para La Diferencia de Proporciones PX
Aún no hay calificaciones
2.8 Intervalo de Confianza para La Diferencia de Proporciones PX
4 páginas
Taller 3. Est 3
Aún no hay calificaciones
Taller 3. Est 3
4 páginas
CE86 - Semana 01 - Sesión 02
Aún no hay calificaciones
CE86 - Semana 01 - Sesión 02
17 páginas
Ejercicios Unidad 1
Aún no hay calificaciones
Ejercicios Unidad 1
6 páginas
Estadística en Ingeniería Electrónica
Aún no hay calificaciones
Estadística en Ingeniería Electrónica
12 páginas
Tema 5 Actividad1
Aún no hay calificaciones
Tema 5 Actividad1
11 páginas
Clase N.15
Aún no hay calificaciones
Clase N.15
27 páginas
Probabilidades en Distribución Normal
Aún no hay calificaciones
Probabilidades en Distribución Normal
11 páginas
MODULO III - Demografía
Aún no hay calificaciones
MODULO III - Demografía
9 páginas
Historia de Las Mentalidades
Aún no hay calificaciones
Historia de Las Mentalidades
11 páginas
Regresión CART vs Lineal: Comparativa
Aún no hay calificaciones
Regresión CART vs Lineal: Comparativa
85 páginas
Examen SPSS para Trabajadores UNJBG
Aún no hay calificaciones
Examen SPSS para Trabajadores UNJBG
11 páginas