TALLER Nº 1
Probabilidad y Estadistica (NRC9528)
Clasificacion de variables, tablas de frecuencias y
graficos
PROFESOR/ES RESPONSABLE/S:
LUIS ERNESTO PAJKURIC VITEZIC
ESTUDIANTE/S:
CONSTANZA LAMAS AGUILERA.
RUT: 20.260.494-3
FRANCO ARANGUZ GONZALEZ
RUT: 18.221.841-3
FABIAN OLIVARES
JORGE NORAMBUENA
ABRIL 2024 1
INDICACIONES
Estimado/a estudiante este estudio de caso corresponde a la evaluación
calificación como Ejercicio 1 dentro del plan de evaluación de la asignatura.
Este caso debe ser resuelto en grupos de máximo 3 integrantes, del
mismo NRC, no se considerar a la evaluación si los integrantes son de
distintos NRC.
La fecha y hora de entrega señalada por su profesor(a) de asignatura es
impostergable.
El informe digital, puede estar construido en algún procesador de texto,
o bien pueden ser escaneos de sus desarrollos manuales. El informe
debe tener portada, con el nombre completo de los integrantes, NRC al
cual pertenecen, nombre y sigla de la asignatura y logo UDLA.
En este informe debe estar desarrollo y respuestas de cada una de las
actividades, No es necesario volver a escribir las preguntas.
Todos los cálculos realizados deben estar en un archivo Excel, el cual
debe entregar en conjunto con el informe a través del aula virtual
(sección Evaluaciones, Ejercicio 1).
El nombre de ambos archivos debe tener el siguiente formato incluyendo
los integrantes del grupo: Taller1 AES5007 NRC APELLIDO1
APELLIDO2 APELLIDO3
Para cada actividad y pregunta debe argumentar la respuesta dada.
Toda copia, en parte o en su totalidad, entre trabajos será sancionada
con nota 1,0.
Cada actividad tiene un puntaje asignado. Puntaje ideal de la evaluación
60 puntos.
Se carga un archivo por grupo.
ABRIL 2024 2
RESULTADOS DE APRENDIZAJE
RAA1: Identificar los diferentes tipos de variables y sus representaciones en
tablas y gráficos, a través del uso de criterios estadísticos.
RAA2: Analizar tablas y gráficos de problemas relacionados con el área de las
ciencias de la economía e ingeniería, mediante la aplicación de criterios
estadísticos.
Indicaciones:
Se sugiere utilizar Excel para realizar los cálculos. Asimismo, entregue
sus respuestas como un informe
En los gráficos debe incluir título, etiquetas y nombres de los ejes, si
corresponden.
ABRIL 2024 3
CONTEXTO
La Inteligencia Artificial (IA), representada por modelos como ChatGPT y
ChatBing, desempeñará un papel crucial en el futuro laboral. Estas
herramientas transformarán la comunicación y la interacción con la información.
Aunque automatizan tareas, también crean futuras oportunidades en redacción,
traducción y análisis. Sin embargo, surgen desafíos éticos y de desinformación.
La coexistencia entre humanos y máquinas requerirá adaptación y nuevas
habilidades. En resumen, la IA será una asistente para los trabajadores que
podrán emplearla con creatividad y conciencia ética.
La IA puede adaptarse a empresas de cualquier tamaño, automatizando tareas
repetitivas en las pequeñas y optimizando procesos en las grandes. Su
adopción impulsa la productividad al analizar datos y ofrecer recomendaciones.
Además, acelera el desarrollo de proyectos y crea nuevos roles laborales. En
resumen, la IA mejora la eficiencia y crea oportunidades, transformando la
forma en que trabajamos.
Una función muy útil de la IA es proyectar situaciones o escenarios futuros. Si
bien, proyectar exactamente lo que pasara es imposible, la IA puede generar
proyecciones de los datos que poseemos en la web hasta el 2023 y predecir
como variara futuramente.
La (IA) ha transformado la forma en que las empresas operan y toman
decisiones. Ejemplos concretos incluyen a Amazon, que utiliza la IA para
mejorar la experiencia del cliente y optimizar su cadena de suministro; Coca-
Cola, que analiza datos de ventas para reducir costos; Google, cuyos
algoritmos mejoran los resultados de búsqueda; Microsoft, que emplea la IA en
Office 365 y Azure para traducción y detección de fraudes. Además de eso,
Netflix y Spotify, que personalizan recomendaciones de contenido y listas de
reproducción, respectivamente.
Estudiantes de Ingeniería Comercial están interesados en usar el chat Bing de
Microsoft para inferir como será el futuro laboral. Siguiendo tutoriales de
YouTube, redactaron el siguiente prompt (línea de comando para interactuar
con el chat)1 con el fin de generar una pequeña base de datos:
Prompt: “Basado en la información oficial y verificada por instituciones serias,
construye una matriz en formato csv de 50 observaciones para las siguientes
variables: (1) tamaño de la empresa (pequeña, mediana, grande), uso o no uso
de Inteligencia Artificial (Si, No), eficiencia (de 0 % a 100 %), edad promedio de
los trabajadores. Esta base de datos debe proyectar la realidad laboral al año
2040. Menciona las fuentes en las cuales te basaste”.
ABRIL 2024 4
ACTIVIDADES
✎ Actividad 1 (20 puntos):
Considere las variables Tamaño de la Empresa y Uso de IA. 1.
1) Clasifique las variables. (2 puntos).
2) Construya una tabla de frecuencias absolutas, relativas y relativas
porcentual para cada una de las variables. (6 puntos).
3) De las tablas, ¿cuál es el tamaño de la empresa más frecuente de los
datos que proyecto el Chat Bing? (2 puntos).
4) ¿Cuáles son los porcentajes de empresas que usaran y no usaran IA?
(2 puntos).
5) Construya un gráfico adecuado, (con todos sus elementos) para cada
una de las variables. (4 puntos).
6) Entregue una interpretación de cada grafico realizando dos
conclusiones relevantes. (4 puntos)
ABRIL 2024 5
✎ Actividad 2 (20 puntos):
Considere la variable Eficiencia (%).
1) Clasifique la variable. (2 puntos).
2) Construya una tabla de frecuencias por intervalos completa para la
variable Eficiencia. Emplea la regla de Sturges. (5 puntos).
3) Interprete ℎ3 % y 𝐹4 %. (4 puntos).
4) De la tabla, ¿cuál es el intervalo de eficiencia más frecuente? (2 puntos).
5) Construya un histograma (con todos sus elementos) para la variable.
Para este gráfico, considera la misma cantidad de intervalos que en la
tabla de frecuencias que construiste anteriormente (4 puntos).
6) Interprete el histograma realizando tres conclusiones relevantes (haga
alusión al rango de la variable, mayor frecuencia y menor frecuencia)
(3 puntos).
ABRIL 2024 6
✎ Actividad 3 (20 puntos):
Las siguientes actividades tienen objetivo comparar la edad promedio y la
eficiencia de empresas que usaran y no usaran algoritmos de IA.
1) Toma la base de datos original, abre una hoja diferente y crea dos
columnas con las siguientes indicaciones:
- Crea una columna con la eficiencia de las empresas que usan IA.
- Crear otra columna con la eficiencia de las empresas que no usan IA.
- Calcula los promedios y los coeficientes de variación de las
eficiencias de empresas que usan y no usan IA. (4 puntos).
- ¿Se puede afirmar que las empresas que usan IA serán en promedio
más eficiente que aquellas empresas que no usan IA? ¿Qué ocurrirá
con la dispersión entre estos grupos? (6 puntos).
2) Esta actividad es análoga a la anterior. Toma la base de datos original,
abre una hoja diferente y dos columnas con las siguientes indicaciones:
- Crea una columna con la edad promedio de los trabajadores de las
empresas que usan IA.
- Cea otra columna con la edad promedio de los trabajadores de las
empresas que no usan IA.
- Calcula los promedios y los coeficientes de variación de las edades
de trabajadores de empresas que usan y no usan IA (4 puntos).
- ¿Se puede afirmar que las empresas que usan IA serán en promedio
más joven que aquellas empresas que no usan IA? ¿Qué ocurre con
la dispersión entre estos grupos? (6 puntos).
ABRIL 2024 7
DESARROLLO ACTIVIDAD Nº1
1) Clasificación de variables:
Tamaño de la Empresa: Es una variable cualitativa nominal, ya que las
empresas se clasifican en pequeñas, medianas y grandes sin un orden
específico.
Uso de IA: También es una variable cualitativa nominal, ya que indica si
la empresa utiliza o no Inteligencia Artificial, sin un orden específico.
2) Construya una tabla de frecuencias por intervalos completa para la
variable Eficiencia e identifícalas. (Emplea la regla de Sturges)
Primero, calculamos el número de intervalos usando la regla de Sturges:
�=1+log2(�)k=1+log2(n)
Donde �k es el número de intervalos y �n es el número de
observaciones. En este caso, como hay 50 observaciones:
�=1+log2(50)≈1+5.64≈6k=1+log2(50)≈1+5.64≈6
Entonces, usaremos 6 intervalos para construir las tablas de
frecuencias.
Tabla para la variable tamaño de la empresa:
ABRIL 2024 8
Tabla para variable el uso de IA:
3) De las tablas, ¿cuál es el tamaño de la empresa más frecuente de los datos
que proyecto el Chat Bing?
En los datos proyectados por el Chat Bing, tanto las empresas medianas
como las grandes son las más frecuentes, con 17 observaciones cada una.
4) ¿Cuáles son los porcentajes de empresas que usaran y no usaran IA?
El 50% de las empresas usarán IA, mientras que el otro 50% no la utilizará
5) Construya un gráfico adecuado, (con todos sus elementos) para cada una
de las variables.
Para "Tamaño de la Empresa": Un gráfico de barras sería adecuado para
mostrar la frecuencia de cada tamaño de empresa.
ABRIL 2024 9
Para "Uso de IA": Un gráfico de pastel sería adecuado para mostrar la
proporción de empresas que usan y no usan IA.
6) Entregue una interpretación de cada grafico realizando dos conclusiones
relevantes
Gráfico de Tamaño de la Empresa:
Se observa que hay una distribución relativamente uniforme entre
empresas pequeñas, medianas y grandes, lo que indica cierta diversidad
en los datos proyectados.
Gráfico de Uso de IA:
La mitad de las empresas utilizarán IA, lo que sugiere una adopción
generalizada de esta tecnología en el futuro laboral proyectado por el
Chat Bing. Por otro lado, la otra mitad de las empresas no utilizará IA, lo
que puede indicar cierta resistencia o limitaciones en la adopción de esta
tecnología en ciertos sectores o empresa.
ABRIL 2024 10
DESARROLLO ACTIVIDAD Nº2
Considere la variable Eficiencia (%).
1) Clasifique la variable:
Clasificación de la variable: "Eficiencia (%)" es una variable cuantitativa
continua.
2)Construya una tabla de frecuencias por intervalos completa para la variable
Eficiencia. Emplea la regla de Sturges.
3)Interprete ℎ3 % y 𝐹4 %.
El 12 de las empresas tienen una eficiencia entre el 0,24% y el 0,76%
El 0,12% indica que de las empresas tienen una eficiencia de este porcentaje entre 4
empresas que utilizan IA
4) De la tabla, ¿cuál es el intervalo de eficiencia más frecuente?
Para determinar cuál es el intervalo más frecuente, podemos observar la columna de
"Frecuencia" y encontrar el intervalo con la frecuencia más alta. En este caso, el
intervalo más frecuente es el que tiene la mayor frecuencia, que es el intervalo de 60 -
69 de eficiencia, con una frecuencia de 18.
5) Construya un histograma (con todos sus elementos) para la variable. Para este
gráfico, considera la misma cantidad de intervalos que en la tabla de frecuencias que
construiste anteriormente.
ABRIL 2024 11
6) Interprete el histograma realizando tres conclusiones relevantes (haga alusión al
rango de la variable, mayor frecuencia y menor frecuencia).
Basándonos en los datos proporcionados en el histograma, podemos realizar varias
conclusiones sobre los intervalos de eficiencia:
1. Intervalo más frecuente: El intervalo de 60 - 69 de eficiencia es el más frecuente, con
una frecuencia de 18 categorizaciones
2. Eficiencia de recolección de datos: Dado que la frecuencia acumulada alcanza el
100%, podemos concluir que todos los datos han sido recolectados y registrados
correctamente.
3. Representatividad: La muestra parece ser representativa de una población específica
en términos de distribución por eficiencia lo que indica que la muestra podría
proporcionar una imagen precisa de la población en estudio en términos de esta.
ABRIL 2024 12
DESARROLLO ACTIVIDAD Nº3
1. Toma la base de datos original, abre una hoja diferente y crea dos columnas con las
siguientes indicaciones:
a) Calcula los promedios y los coeficientes de variación de las eficiencias de empresas
que usan y no usan IA.
ABRIL 2024 13
b) ¿Se puede afirmar que las empresas que usan IA serán en promedio más eficiente que
aquellas empresas que no usan IA? ¿Qué ocurrirá con la dispersión entre estos grupos?
Media (Promedio):
Para las empresas que usan IA: 40,1 años.
Para las empresas que no usan IA: 38,9 años.
Podemos observar que el promedio de edad para las empresas que usan IA es
ligeramente mayor que el de aquellas que no lo hacen.
Coeficiente de Variación (CV):
Para las empresas que usan IA: 16,1%.
Para las empresas que no usan IA: 25,9%.
El coeficiente de variación mide la dispersión relativa de los datos en relación con su
media. Un coeficiente de variación más bajo indica una menor dispersión relativa. En
este caso, el grupo de empresas que utiliza IA tiene un coeficiente de variación más
bajo, lo que sugiere una menor dispersión en las edades en comparación con las
empresas que no usan IA.
Basándonos en estos datos, podríamos afirmar que las empresas que utilizan IA podrían
ser, en promedio, más eficientes en términos de edad de sus empleados, ya que tienen
un promedio ligeramente más alto y una dispersión relativa más baja en comparación
con las empresas que no utilizan IA. Sin embargo, es importante tener en cuenta que la
eficiencia de una empresa depende de muchos otros factores además de la edad de sus
empleados, por lo que esta conclusión podría no ser definitiva sin un análisis más
detallado.
ABRIL 2024 14
2. Esta actividad es análoga a la anterior. Toma la base de datos original, abre una hoja
diferente y dos columnas con las siguientes indicaciones:
a) Calcula los promedios y los coeficientes de variación de las edades de trabajadores
de empresas que usan y no usan IA
ABRIL 2024 15
b) ¿Se puede afirmar que las empresas que usan IA serán en promedio más joven que
aquellas empresas que no usan IA? ¿Qué ocurre con la dispersión entre estos grupos?
Para determinar si las empresas que utilizan IA son, en promedio, más jóvenes que
aquellas que no la utilizan, así como analizar la dispersión entre estos grupos, podemos
examinar las medidas estadísticas proporcionadas:
Basándonos en estos valores de media, podemos observar que las empresas que utilizan
IA tienen un promedio de edad ligeramente mayor en comparación con aquellas que no
la utilizan.
El coeficiente de variación mide la dispersión relativa de los datos en relación con su
media. Un coeficiente de variación más bajo indica una menor dispersión relativa. En
este caso, el grupo de empresas que utiliza IA tiene un coeficiente de variación más
bajo, lo que sugiere una menor dispersión en las edades en comparación con las
empresas que no utilizan IA.
Basándonos en estos datos, no podemos afirmar que las empresas que utilizan IA sean
en promedio más jóvenes que aquellas que no la utilizan, ya que el promedio de edad es
ligeramente mayor para el grupo de empresas que usan IA. Sin embargo, podemos
observar que hay una menor dispersión en las edades dentro del grupo de empresas que
utilizan IA en comparación con aquellas que no lo hacen.
Promedio de edad (Media):
Para las empresas que usan IA: 40,1 años.
Para las empresas que no usan IA: 38,9 años.
Coeficiente de Variación (CV):
Para las empresas que usan IA: 16,1%.
Para las empresas que no usan IA: 25,9%.
ABRIL 2024 16