La información que a continuación se le presenta es para que la estudie por su propia cuenta y bajo
su propio ritmo. Este tipo de enseñanza se llama Auto Aprendizaje y se ha elaborado con la
finalidad de que usted lo use como guía de estudio para apoyar los temas desarrollados en sus
clases presenciales. Este Módulo de Auto Aprendizaje es importante porque:
Permite administrar su propio tiempo
El contenido programático se distribuye
a su conveniencia.
Permite la consulta de otro material
bibliográfico para incrementar su
conocimiento.
El módulo cuenta con diversos temas de Estadística y cada uno de los cuales presenta la siguiente
información:
Número y nombre de la unidad de aprendizaje.
Conocimientos previos que debe poseer.
Contenido programático, competencias a desarrollar y los objetivos a lograr.
La información correspondiente al tema.
Ejemplos ilustrativos que debes analizar con mucha atención.
Los ejercicios de refuerzo que debes desarrollar una vez hayas leído y analizado la
información con el fin de que fijes los procesos inmersos y realimentes los conceptos.
Al final del módulo aparecerán las fechas asignadas de las actividades de carácter sumativa
y formativa con sus correspondientes instrumentos de evaluación.
¡Te exhorto a estudiar con responsabilidad, perseverancia e interés!
DATOS INFORMATIVOS DEL MÓDULO 1
¡Analizo datos y determino el grado de relación de las
Nombre del Módulo:
variables!
Fecha de utilización: Del: 24 de marzo del 2025 Al: 19 de abril del 2025.
Horas de dedicación: 20 (5 horas semanales)
Año: Primero, 2025 Carrera: Licenciatura en Contabilidad.
Unidad de Aprendizaje: Análisis de Regresión y de Correlación.
Modalidad de Formación: Presencial: ╳ No presencial:
Comprender y aplicar los métodos matemáticos fundamentales para
Objetivos analizar el tipo y grado de relación cómo están vinculadas las variables
Competenciales: para identificar patrones que regulan su comportamiento en el
entorno comercial o administrativa.
Identifica con seguridad patrones y establece el tipo de relación entre una
secuencia de datos.
Describe la naturaleza que relaciona un conjunto de datos mediante el análisis
crítico.
Estudia el comportamiento de una serie de datos y determina el modelo lineal
usando las estrategias de regresión apropiada.
Resultados de
Observa y reconoce con precisión situaciones del entorno comercial o
Aprendizaje: administrativo que permita medir el grado de cohesión de diversas variables
para realizar predicciones o la buena toma de decisiones.
Participa activamente y de forma integrada en la construcción de un modelo
matemático que estudie el comportamiento de una serie de datos extraídos de
una situación real que permita determinar las condiciones necesarias para
predecir resultados o la toma de decisiones plausibles.
Diagnóstica:
Técnica del cuestionario.
Bitácora de aprendizaje.
Lluvia de ideas.
Formativa:
Construcción de mapas semánticos.
Foro académico.
Quiz interactivos en línea.
Evaluación
Laboratorios experienciales.
Modelaciones de situaciones contextuales con ayuda de
aplicaciones o herramientas web.
Taller colaborativos y participativos.
Técnica PNI.
Lecturas complementarias.
Sumativa:
Prueba parcial No. 1.
https://www.est-aplicada.faud.unsj.edu.ar/wp-
Referencia Bibliográfica: content/uploads/2020/05/UNIDAD-3-Parte-ERICA-2020.pdf
Uso de las herramientas básicas del Office, EXCEL.
Uso de la calculadora científica.
Tabulación de datos de forma manual.
En la actualidad, en el área de la Administración se busca la calidad, la eficiencia y eficacia de la
productividad, así como en la aplicación de los sistemas de gestión de calidad orientados a la toma
de decisiones, por lo cual es imprescindible la aplicación de la Estadística tanto descriptiva y en cierta
medida la estadística inferencial, ya que éstas proporcionan los elementos de confiabilidad que
científicamente deben sustentar una decisión tomada.
Tener en cuenta que el objetivo de la estadística como disciplina es brindar soporte en:
a) Planificación de la búsqueda y obtención de la información.
b) Organizar y sistematizar la información para su descripción y análisis.
c) A partir de la información organizada, efectuar inferencias a través de la estimación y
contrastación de la hipótesis.
El modelo de toma de decisión de un tema o problema específico requiere el soporte que proporciona
la Estadística, que involucra desde la toma de muestra propiamente hasta la corroboración de la
decisión a un nivel de confiabilidad definido.
Su aplicación es muy diversa, en muchas áreas del conocimiento científico, cultural, humanístico y
tecnológico se emplea esta disciplina. Por ejemplo, en los diarios locales se ven publicadas las tasas
de crecimiento económico, los porcentajes de incremento de natalidad o defunciones, los índices de
los mercados bursátiles y muchas otras más.
1. Elabora con seguridad la gráfica de dispersión o de nubes para representar los pares ordenados
(x, y).
2. Utiliza con precisión el método de los mínimos cuadrados para determinar la ecuación de
regresión lineal.
3. Determina analíticamente el error inducido por la influencia de las variables intervinientes.
4. Predice usando las fórmulas apropiadas el valor ajustado de la variable dependiente y
empleando la ecuación de la recta de regresión.
5. Representa con precisión conceptual la recta de regresión lineal sobre el gráfico de dispersión.
El Análisis de Regresión es una técnica estadística para investigar la relación funcional entre dos
o más variables, ajustando algún modelo matemático. La regresión lineal simple utiliza una sola
variable de regresión y el caso más sencillo es el modelo de línea recta. Supóngase que se tiene un
conjunto de n pares de observaciones (x, y), se busca encontrar una recta que describa de la
mejor manera cada uno de esos pares observados.
En la práctica dos o más variables pueden estar relacionadas. Por ejemplo, el peso de los alumnos
dependerá de su altura, la cantidad de semillas plantadas dependerá de la cantidad de plantas que
germinen, la longitud de una circunferencia dependerá de la longitud de su radio o bien la presión
de una masa de gas depende de su volumen y de su temperatura.
Una variable es una expresión matemática que usualmente se denota con letras minúsculas del
alfabeto y nos indica que ésta puede asumir cualquier valor.
Ejemplos de variables:
1. Presión arterial de los niños menores de 14 años.
2. Cantidad de personas desempleadas en un país.
3. Flujo de dinero producido en una entidad bancaria durante 1 día.
4. Rapidez de un río.
Las variables tienen diversas tipologías.
A. Según su nivel de medida se clasifican en:
Cualitativas: hace alusión a aquellas cualidades o atributos, no se las puede
medir numéricamente. Ejemplos: Tipo de libros que usted prefiere leer, color de los
ojos de una persona, tipo de vivienda, género, estado civil.
Estas variables se subdividen en:
Cualitativa nominal: no siguen un orden específico. Ejemplo, los colores de
camisetas de los equipos de fútbol, estado civil de una persona (casado, viudo,
divorciado, soltero, unido)
Cualitativa ordinal: siguen un orden o jerarquía. Ejemplo, el nivel socio
económico de una persona (alta, media, baja), medalla obtenida en una olimpiada
universitaria de matemática (oro, plata, bronce)
Cualitativa binaria: son dicotómicas, dos variables. Ejemplo, género de
una persona (masculino, femenino), percepción del servicio hospitalario brindado
(conforme, no conforme)
Cuantitativas: estas variables surgen de la medición. Pueden ser de dos tipos.
Continua: este tipo de variables puede adquirir valores existentes entre dos
números. Por ejemplo, cantidad de dinero generado en la bolsa, estatura de una
persona, cantidad de antibiótico suministrado a un paciente, longitud de una falange.
Discreta: esta variable no puede adquirir valores intermedios entre dos números,
sino aislados. Surgen del conteo o de la numeración. Ejemplos, cantidad de personas
que asisten a un congreso, número de textos que un alumno compra durante su
carrera universitaria, cantidad de sillas de una escuela.
B. Por su influencia.
Independientes: los valores de este tipo de variables no dependen del de otras, son
representadas en el eje de las abscisas y en las funciones con la letra “x”. Ejemplo, cantidad
de comida que ingiere un gato.
Dependientes: los valores de estas variables, en cambio, son determinados por los que
adquieran las otras variables. Se las representa en el eje de las ordenadas y se las
representa con la letra “y” en las funciones. Ejemplo, calificación de una persona en un
examen de matemáticas.
C. Otra índole.
Intervinientes: es un tipo de variable que actúa como factor explicativo de un efecto
sobre un fenómeno, pero no puede ser observado o estudiado directamente ni manipulados.
Su influencia solo puede ser inferida a partir de sus efectos sobre la variable dependiente.
Moderadoras: es aquella que modifica la relación entre la variable independiente (de
primer orden) y la dependiente.
Por ejemplo. Supongamos que se desea estudiar la relación existente entre la
cantidad de gasolina que utiliza un vehículo y la velocidad que emplee este.
Tipo de Variable Característica
Independiente Cantidad de gasolina.
Dependiente Velocidad del vehículo.
Interviniente Temperatura ambiental.
Moderadora Tipo de carretera.
El Diagrama de Dispersión es un gráfico que representa pares ordenados (x, y) de valores
observados. También recibe el nombre de “Nube de Puntos”. Se elabora usando un plano
cartesiano (dos rectas que se cortan perpendicularmente, es decir, forman entre ambas rectas
ángulo de 90°) y sobre el eje de las abscisas se enumera proporcionalmente y se ubican los valores
de la variable independiente (x) y sobre el eje numerado de las ordenadas se ubican los valores de
la variable dependiente (y).
Eje y
Eje x
Tipos de Gráfico de Dispersión.
1. Lineal Positivo: establece una relación de proporcionalidad directa entre las variables
de estudio, esto es, si la variable independiente se incrementa de valor numérico también
se incrementa la dependiente o bien si disminuye de valor la variable independiente, se
disminuye la variable dependiente.
2. Lineal Negativa: se indica una proporcionalidad inversa entre las variables. Esto es, el
aumento de una representa la disminución numérica de la otra variable o viceversa.
3. Correlación Compleja: existe una asociación entre las variables pera ésta no es de tipo
lineal. En términos estadísticos esta relación entre las variables recae sobre funciones
matemáticas más complejas denominadas “trascendental” y en esta tipología pueden
ubicarse las de tipo logarítmicas, exponenciales o parabólicas.
4. Sin correlación: no existe relación entre las variables de estudio. Por lo general, la
gráfica de dispersión se muestra como una nube de puntos paralelo al eje de las abscisas.
Ejemplo: Represente mediante un diagrama de dispersión la relación entre la cantidad de datos
suministrados en la elaboración de una factura y la cantidad de errores de la empresa Inversiones
Smith S. A., en el mes de marzo del 2017.
Cantidad de datos (x) 8 15 15 12 10 25 20 8
Número de errores (y) 3 2 5 4 7 6 4 2
Veamos el gráfico:
Gráfico de Dispersión
NÚMERO DE ERRORES ENCONTRADOS EN LA
ELABORACIÓN DE FACTURAS DE LA
EMPRESA INVERSIONES SMITH S. A., marzo del
2025
8
7
Número de errores
6
5
4
3
2
1
0
0 5 10 15 20 25 30
Cantidad de Datos Aportados
Cuando dos variables se relacionan, matemáticamente se representa de la forma 𝑦 = 𝑓(𝑥). Bajo
el supuesto que dos variables estadísticas, para la cual x afecta la respuesta de y. Consideremos
como el error o perturbación aleatoria que provoca que la asociación no sea perfecta. Los errores
son variables independientes distribuidas normalmente con media cero y desviación estándar ().
El modelo matemático que establece la asociación lineal entre las variables tiene la forma:
y = mx + b +
Para la cual:
x: variable independiente
y: variable dependiente
m: pendiente de la recta (inclinación)
b: es el 𝑦 intercepto, es decir, donde la recta corta al eje de las ordenadas.
El objetivo principal del método de regresión lineal es determinar el valor de la pendiente y del y
intercepto en esa ecuación y uno de los métodos que nos permite realizar este procedimiento es
el de:
Consiste en determinar aquellos estimadores de m y b que minimizan la suma de cuadrados de los
errores . Es decir, los estimadores y de m y b, respectivamente deben ser tales que ∑ 𝑥 2 sean
mínimas.
Sabemos que:
𝑦 = 𝑚𝑥 + 𝑏 + 𝑒
Luego, = 𝑦 − 𝑚𝑥 − 𝑏
Elevando al cuadrado resulta, ∑ 𝜀 2 = ∑(𝑦 − 𝑚𝑥 − 𝑏)2
Este mecanismo matemático nos permite determinar la ecuación de regresión lineal, de la forma:
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝒎=
𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2
El símbolo matemático griego sigma nos indica que debemos realizar una sumatoria de números.
𝒃 = 𝑦̅ − 𝑚𝑥̅
Para la cual:
𝑥̅ : Indica el promedio o media aritmética de los valores de x.
𝑦̅: Promedio o media aritmética de los valores de y.
Ejemplo: Asumiendo que existe una relación lineal entre la cantidad de datos suministrados en
la elaboración de una factura y la cantidad de errores de la empresa Inversiones Smith S. A., en
el mes de marzo del 2025. Determine:
1) La ecuación de regresión lineal por el método de mínimos cuadrados.
2) Ajuste los valores de y.
3) Trace sobre el diagrama de dispersión la recta.
Tabla:
Cantidad de datos (x) 8 15 15 12 10 25 20 8
Número de errores (y) 3 2 5 4 7 6 4 2
Solución:
1) Ecuación de la recta de regresión lineal.
Cantidad de Número de
datos errores ∑ 𝒙𝟐 ∑ 𝒙𝒚 ∑ 𝒚𝟐
∑𝒙 ∑𝒚
8 3 64 24 9
15 2 225 30 4
15 5 225 75 25
12 4 144 48 16
10 7 100 70 49
25 6 625 150 36
20 4 400 80 16
8 1 64 8 1
113 32 1847 485 156
Determinemos la pendiente:
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 8(485) − (113)(32) 3880 − 3616 264
𝒎= 2 2
= 2
= = = 0,1315 = 𝟎, 𝟏𝟑
𝑛 ∑ 𝑥 − (∑ 𝑥 ) 8(1847) − (113) 14776 − 12769 2007
Primero determinemos el valor de la media aritmética de x y de y, respectivamente:
∑ 𝑥 113
𝑥̅ = = = 14,125 = 14,13
𝑛 8
∑ 𝑦 32
𝑦̅ = = =4
𝑛 8
Ahora, determinemos el valor de y – intercepto.
𝒃 = 𝑦̅ − 𝑚𝑥̅ = 4 − (0,13)(14,13) = 4 − 1,8369 = 2,1631 = 2,16
Luego, la ecuación de regresión lineal simple tiene la forma:
𝑦 = 𝑚𝑥 + 𝑏
𝒚 = 𝟎, 𝟏𝟑𝒙 + 𝟐, 𝟏𝟒
2) Ajuste de puntos: Para ajustar los nuevos valores de y vamos a proceder a sustituir los
valores x dados en la tabla en la ecuación de regresión lineal, tal como sigue:
𝑦 = 0,13𝑥 + 2,14
𝑦 = 0,13(𝟖) + 2,14 = 1,04 + 2,14 = 3,18 = 3,2
𝑦 = 0,13(𝟏𝟎) + 2,14 = 1,30 + 2,14 = 3,44 = 3,4
𝑦 = 0,13(𝟏𝟐) + 2,14 = 1,56 + 2,14 = 3,70 = 3,7
𝑦 = 0,13(𝟏𝟓) + 2,14 = 1,95 + 2,14 = 4,09 = 4,1
𝑦 = 0,13(𝟐𝟎) + 2,14 = 2,60 + 2,14 = 4,74 = 4,7
𝑦 = 0,13(𝟐𝟓) + 2,14 = 3,25 + 2,14 = 5,39 = 5,4
Elaboramos una nueva tabla con los valores dados de x y los nuevos valores ajustados de y:
Cantidad de datos (x) Errores ajustados (y)
8 3,2
10 3,4
12 3,7
15 4,1
20 4,7
25 5,4
3) Tracemos la recta de regresión lineal sobre el diagrama de dispersión.
Gráfico de Dispersión
NÚMERO DE ERRORES ENCONTRADOS EN LA ELABORACIÓN DE
FACTURAS DE LA
EMPRESA INVERSIONES SMITH S. A., marzo del 2017
8
6
Número de errores
0
0 5 10 15 20 25 30
Cantidad de Datos Aportados
El concepto de correlación se refiere al grado en que se relacionan dos o más variables. Esto
sugiere la necesidad de utilizar algún índice numérico que lo cuantifique y este se denomina
coeficiente de correlación.
El comúnmente empleado es el “Coeficiente de Pearson” y se determina mediante la fórmula:
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑟=
√[𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2 ][𝑛 ∑ 𝑦 2 − (∑ 𝑦)2 ]
Interpretación: Condiciones:
1. Si 0<r<0,5 no hay relación entre las variables.
2. Si 0,5<r<1 hay una fuerte relación y positiva.
3. Si -05<r<0, no hay relación.
4. Si -1<r<-0,5 la relación es fuerte y negativa.
De nuestro ejemplo anterior, calculemos el valor del coeficiente de Pearson:
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑟=
√[𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2 ][𝑛 ∑ 𝑦 2 − (∑ 𝑦)2 ]
8(485) − (113)(32) 3880 − 3616 264 264
𝑟= = = = = 𝟎, 𝟑𝟗
√8(1847) − (113)2 × 8(156) − (32)2 √2007 × 224 √449568 671
Como el valor de 0,39 está por encima de 0 (cero) pero menor de 0,5 se puede inferir que no
existe relación entre la cantidad de datos aportados y la cantidad de errores cometidos en la
elaboración de facturas de la empresa Inversiones Smith S. A.
Nombre:
Escala valorativa
Criterio Con mucha La mayoría
A veces Nunca
frecuencia de las veces
Asisto y soy puntual a mis clases de Estadística.
Participó activamente en cada experiencia de
aprendizaje que se realizan.
Cumplo con reflexionar el material de lectura y analizo
los ejemplos modelados para lograr una mejor
comprensión del tema.
Investigo información adicional del proporcionado en
clases.
Me esfuerzo por resolver la guía de aprendizaje o los
ejercicios de refuerzo.
Formulo preguntas o planteo mis dudas con base a lo
estudiado fuera o dentro del aula de clases.
De la siguiente lista, indique si se trata de una variable cualitativa o cuantitativa. En el caso de las
cualitativas diga si es nominal, ordinal o binaria. Si es cuantitativa, diga si es discreta o si es continua.
Variable Tipo Sub Tipo
Estado civil de una persona.
Profesión que se ejerce.
Ingreso familiar mensual.
Edad cronológica de los alumnos
universitarios.
Clases de insectos.
Tipo de viviendas unifamiliares.
Número de habitantes.
Duración de una carrera universitaria.
Calificaciones obtenidas en un curso.
Categorías profesionales.
Especies botánicas.
Calificaciones obtenidas por los alumnos
universitarios.
Altura de un edificio.
Rango de una persona dedicada a la
milicia.
Grado de temperatura de un líquido.
Buscador de internet preferido.
Nivel de productividad comercial.
Para cada una de las situaciones presentadas, identifique las variables dependientes, independientes
y las intervinientes.
Situación Independiente Dependiente Interviniente
“En ambientes de alta
motivación, el nivel de
calidad del aprendizaje de
Matemática de un
estudiante depende del
grado de interés que posea
por el tema
El desarrollo de una planta
de maíz depende del nivel
de agua y calor que recibe
durante los primeros dos
meses de vida, siempre que
las condiciones de suelo
sean óptimas.
En mercados altamente
competitivos, la velocidad
de crecimiento del mercado
editorial infantil está dada
por la diversificación de los
productos que se ofrecen a
ese público.
Para cada uno de los diagramas, diga si la posible relación entre las variables es directa, inversa,
compleja o no existe relación.
Se le aportan una serie de datos que relaciona la edad de una persona y la cantidad de libros que ha
comprado en los últimos 5 años. Observe y analice la tabla de datos.
Edad
18 19 20 20 21 22 22 23 24 25
(𝒙 )
No. De
libros 14 13 13 12 11 12 11 10 9 9
(𝒚)
a. En la siguiente cuadricula, represente los datos.
b. La dispersión de los datos refleja un comportamiento, ¿directa, inversa, compleja o no existe
relación?
Para cada conjunto de pares de datos estadísticos, realice lo siguiente:
a. Elabore el diagrama de dispersión.
b. Determine los valores numéricos de:
∑𝑥 ∑𝑦
∑ 𝑥2 ∑ 𝑦2
𝑥̅ 𝑦̅
∑ 𝑥𝑦
c. Calcule los valores numéricos de:
Pendiente m
Y - intercepto B
Coeficiente de Pearson r
d. Escriba la ecuación de la recta de regresión lineal: 𝒚 = 𝒎𝒙 + 𝒃
e. Determine los valores numéricos de los y – ajustados, empleando la ecuación: 𝑦 = 𝑚𝑥 + 𝑏
f. Diga si las variables están o no relacionadas y según el valor de correlación de Pearson (r)
responda, ¿qué tipo de relación existe entre las variables dadas?
Problema 1. Los siguientes pares de datos muestran el índice predictivo que resultaron al ingresar a
la Universidad de Panamá y las calificaciones que obtuvieron en la primera prueba académica en el
curso de Estadística Descriptiva correspondientes a los estudiantes de primer año de la Licenciatura
en Recursos Humanos.
Índice
predictivo x 2,3 0,98 1,12 0,77 0,65 0,38 1,56 3,00 0,39 0,89 0,97 1,38 2,28
Calificación
Obtenida y 87 71 56 61 75 49 47 62 81 59 75 60 78
Problema 2. Los siguientes pares de datos muestran la relación entre la edad de una persona y la
cantidad de días ausentes durante el 2016 a su puesto de trabajo en la sección de ventas de la
Empresa Inversiones Smith, S. A.
Edad x 27 61 37 23 46 58 29 36 64 40
Días ausentes y 15 6 10 18 9 7 14 11 5 8
Problema 3. Los siguientes datos muestran la relación entre la cantidad de dinero invertido (en miles
de balboas) en un negocio de bienes raíces y la tasa de ganancia en las ventas de apartamentos en
un área lujosa de la ciudad de Panamá.
Inversión x 14,5 21,2 11,6 31,7 46,8 31,4 40 21 16,3 32,1
Ganancia y 0,70 0,83 0,62 1,10 1,27 1,02 1,15 0,80 0,71 1,04
Problema 4. Los siguientes datos muestran la relación entre el consumo mensual de gasolina de 91
octanos en el Ministerio de Gobierno y Justicia y la temperatura promedio en grados Fahrenheit, en el
año 2010.
Galones x 275 364 164 41 94 231 367 301 238 121 31 204 441 323 53
°F y 40 27 40 73 64 34 9 8 23 63 65 41 21 38 58
Problema 5. Los siguientes datos muestran la relación entre la calificación quiz de matemática básica
y la calificación obtenida en el primer examen parcial, en la Universidad de Panamá en el año 2014.
Quiz x 16 20 16 17 19 12 14 11 15 15 15 17 13
Parcial y 92 100 77 84 82 89 73 70 63 68 49 87 36