TECNOLÓGICO NACIONAL DE MÉXICO EN CELAYA
EXAMEN CUARTO PARCIAL
PROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA
INGENIERÍA EN GESTIÓN EMPRESARIAL
GRUPO C
MAESTRA. HILDA ALEJANDRA ARAIZA HERRERA
INTEGRANTES:
DURÁN MEJÍA BRISSA MIRANDA
GONZÁLEZ GAYTÁN ANDREA MICHELLE
LEÓN GUERRERO KATTY ALIZETH
MARTÍNEZ VERA BRIANDY MICHELLE
MOLINA BARROSO ALONDRA
INDÍCE.
INTRODUCCIÓN. ................................................................................................... 3
OBJETIVO............................................................................................................... 4
PROCEDIMIENTO. ................................................................................................. 7
CONCLUSIÓN. ..................................................................................................... 12
BIBLIOGRAFÍA. .................................................................................................... 15
INTRODUCCIÓN.
La correlación y la regresión lineales simple son métodos estadísticos que estudian
la relación lineal existente entre dos variables, subyacen en multitud de métodos
estadísticos, pues generalizan la idea de dependencia funcional.
La regresión y la correlación lineal se emplean en diversas disciplinas como la
ingeniería e incluso en la medicina comprendiendo una forma de estimación y se
suelen utilizar para resolver una cantidad infinita de problemas, mientras que la
regresión se encarga de la relación que hay entre variables, la correlación mide el
grado de relación lineal entre dos o más variables, dando como resultado la fuerza
y sentido de la relación.
El término correlación se refiere al grado de variación conjunta existente entre dos
o más variables. En un modelo de regresión lineal se interpreta como el porcentaje
de variación de la variable dependiente. Para estudiarla es necesario disponer de
parámetros que permitan cuantificar dicha relación y uno de estos parámetros es la
covarianza, que indica el grado de variación conjunta de dos variables aleatorias.
En el caso de la regresión, es necesario hacer una selección adecuada de las
variables, pues si tomamos variables que no tengan ninguna relación dará un
resultado ilógico, es decir, no tendrá sentido.
Se le denomina también análisis de regresión a cualquier método estadístico que
establezca una ecuación permitiendo estimar el valor desconocido de una variable
a partir del valor conocido de una o más variable. Casi siempre el análisis de
correlación con el análisis de regresión se utiliza en conjunto para medición de la
eficacia que la línea de regresión explica la variación de la variable dependiente, Y.
Dentro de su uso y aplicación de estos métodos se exige un estudio exhaustivo de
las posibles relaciones entre las variables. Puede ocurrir que se relaciones dos
variables cualesquiera que no tengan nada que, y que de la casualidad de que
desde el punto de vista estadístico exista correlación perfecta, pero desde el punto
de vista teórico no se pueden relacionar ni realizar ningún estudio coherente. El
objetivo último de la regresión es la predicción o pronóstico sobre el comportamiento
de una variable para un valor determinado de la otra. Así si la recta de regresión de
Y/X es: y
Y= ̅Y + Sxy / SX2(X-̅X) o bien Y= a + b X
La predicción de y para X=X0 será=
Y0= ̅Y + Sxy / SX2 (X0-̅X) o bien Y= a + b X0
Es claro que la finalidad de esta predicción será tanto mayor, en principio, cuanto
mejor sea la correlación entre las variables. Por tanto, una medida aproximada de
la bondad de la predicción dada por R2 (Coeficiente de determinación lineal).
OBJETIVO.
El objetivo principal del siguiente trabajo es entender, comprender y percibir los
principios que rigen el control de calidad de diversos procesos para mantener y
mejorar la efectividad y eficiencia de cada uno de estos. Aplicando así el uso de
gráficas de dispersión, estimación de mínimos cuadrados y el cálculo del coeficiente
de correlación que nos ayudará a dar una interpretación de los resultados y
conclusiones de los problemas presentados. Además de estudiar, examinar y aislar
la relación que existe entre las variables aplicando el uso de regresión lineal.
Competencia 5.
Conocer los principios que rigen el control de calidad de diversos procesos para
mantener y mejorar la efectividad y eficiencia de procesos.
Desafío 4.
Determinar la relación que existe entre la temperatura y el tiempo al calentar dos
kilogramos de agua con un calentador de resistencia eléctrica.
Material.
Termómetro
Cronómetro
Recipiente con capacidad mayor a 3
litros
Báscula
Calentador
Agua
PROCEDIMIENTO.
Se toman dos litros de agua del grifo y se mide su masa con la báscula (como ya
se mencionó se emplearon dos kilogramos). Se dispone el agua en el recipiente
junto con el termómetro y se espera un par de minutos (para que alcance el equilibrio
térmico). Se toma la temperatura del agua. Se coloca el calentador dentro del agua
y se conecta. Se toman medidas de temperatura cada 15 segundos hasta llegar a
los 300 segundos. Véase la imagen de arriba.
Precauciones.
La actividad es muy sencilla y únicamente se debe tener cuidado por dos razones:
en primer lugar, el calentador de resistencia conduce una corriente eléctrica grande
y encandece por su alta temperatura y, en segundo lugar, se usa agua caliente. Es
muy importante señalar que las quemaduras con agua son de las más graves (por
su alta capacidad calorífica específica) y que por ende deben tomarse todas las
precauciones posibles. En ninguna circunstancia debe meterse o sacarse el
calentador cuando está conectado y el agua está caliente.
Recabar datos.
Con los datos recabados realice lo siguiente:
A) La gráfica de dispersión
B) Determine la ecuación de la recta y represente en la gráfica, “debe mostrar
los cálculos en su reporte”
C) Calcule la ecuación de estimación de mínimos cuadrados que debe usar para
predecir la temperatura en el segundo 390s, 402s
D) Determine el coeficiente de correlación e indique. ¿Qué tan bien se
correlaciona las variables seleccionadas?
El coeficiente de correlación es 0,294774388, lo que indica una correlación positiva
débil. Esto significa que existe alguna relación, pero no fuerte. El coeficiente de
determinación es 0,08689194, lo que significa que aproximadamente el 8,69% de la
variabilidad de una variable en el modelo de regresión lineal puede explicarse por
la otra variable. Esto muestra que las variables independientes tienen pocas
posibilidades de explicar la variabilidad de la variable dependiente. Entonces
podemos decir que, en su caso la relación entre el coeficiente de correlación y el
coeficiente de determinación es que existe una correlación positiva débil entre las
variables, pero sólo el 8,69% de la variabilidad en una variable del modelo puede
ser explicada por la otra variable.
E) Defina qué tan bueno es el ajuste de los datos, use r², determine en qué
medida una variable afecta a la otra.
El ajuste de los datos de acuerdo a R2 nos da un 8.68% por lo que no es confiable
el modelo para predicciones futuras, ya que cuenta con un porcentaje muy bajo.
CONCLUSIÓN.
En conclusión, los diagramas de dispersión se utilizan comúnmente para visualizar
la relación entre dos variables y buscar posibles patrones o tendencias. Si existe
una correlación positiva entre las variables si una variable aumenta, la otra variable
también aumenta. Si existe correlación negativa entre las variables si una variable
aumenta y la otra disminuye. Si no existe una relación clara si no se observa un
patrón claro entre las variables representadas en el gráfico es que no existe una
relación lineal entre ellas. La forma general de la ecuación de una recta es y = mx
b, donde "m" representa la pendiente de la recta y "b" es la ordenada del origen.
Analizando la ecuación de una recta podemos obtener información sobre su
pendiente, la posición de la recta en el plano y su comportamiento. Por ejemplo, si
la pendiente es positiva, la línea sube de izquierda a derecha, mientras que si la
pendiente es negativa, la línea desciende. Además, la intersección con el eje y
representa el valor de "y" cuando "x" es igual a 0, lo que nos da información sobre
la intersección con el eje vertical. Si la ordenada al punto inicial es cero, entonces
la recta pasa por el punto inicial. El coeficiente de correlación y el coeficiente de
determinación son dos medidas estadísticas utilizadas para analizar la relación
entre dos variables. El coeficiente de correlación (r) es una medida de la fuerza y
dirección de la relación lineal entre dos variables. Sus valores son entre -1 y 1. Los
valores cercanos a 1 indican una fuerte correlación positiva y los valores cercanos
a -1 indican una fuerte correlación negativa. Valores cercanos a 0 significan que no
existe una relación lineal entre las variables. Por otro lado, el coeficiente de
determinación (r^2) es una medida del porcentaje de variación de una variable que
puede explicarse por otra variable en un modelo de regresión lineal. Su valor varía
de 0 a 1, donde 0 significa que las variables independientes no explican ninguna
variación en la variable dependiente y 1 significa que las variables independientes
explican toda la variación en la variable dependiente. El método de mínimos
cuadrados para estimar ecuaciones esta ecuación se utiliza para predecir el valor
de la variable dependiente (Y) en función del valor de la variable independiente (X).
La forma general de la ecuación de mínimos cuadrados es la siguiente: Y = a + bX.
Y representa la variable dependiente que queremos predecir, X representa las
variables independientes que utilizamos para hacer predicciones, a es la
intersección de la línea de regresión con el eje Y (el valor de Y cuando X es igual a
0). b es la pendiente de la recta de regresión y muestra cómo cambia Y cuando X
aumenta. Para encontrar los valores de a y b, utilice el método de mínimos
cuadrados, que minimiza la suma de los cuadrados de las diferencias entre el valor
real de Y, y el valor calculado por la ecuación. Siempre que se cumplan ciertas
condiciones y supuestos del modelo de regresión, la ecuación puede predecir el
valor futuro de Y basándose en el valor conocido de X. En conclusión, con nuestro
ejercicio y con los conocimientos podemos decir que, en su caso la relación entre el
coeficiente de correlación y el coeficiente de determinación es que existe una
correlación positiva débil entre las variables, pero sólo el 8,69% de la variabilidad
en una variable del modelo puede ser explicada por la otra variable.
CONCLUSION
In conclusion, scatter plots are commonly used to visualize the relationship between
two variables and look for possible patterns or trends. If there is a positive correlation
between the variables, if one variable increases, the other variable also increases.
If there is a negative correlation between the variables if one variable increases and
the other decreases. If there is no clear relationship, if a clear pattern is not observed
between the variables represented in the graph, it means that there is no linear
relationship between them. The general form of the equation of a line is y = mx b,
where "m" represents the slope of the line and "b" is the ordinate of the origin. By
analyzing the equation of a line we can obtain information about its slope, the
position of the line in the plane and its behavior. For example, if the slope is positive,
the line goes up from left to right, while if the slope is negative, the line goes down.
Additionally, the y-intercept represents the value of "y" when "x" is equal to 0, which
gives us information about the vertical axis intercept. If the ordinate to the initial point
is zero, then the line passes through the initial point. The correlation coefficient and
the determination coefficient are two statistical measures used to analyze the
relationship between two variables. The correlation coefficient (r) is a measure of the
strength and direction of the linear relationship between two variables. Their values
are between -1 and 1. Values close to 1 indicate a strong positive correlation and
values close to -1 indicate a strong negative correlation. Values close to 0 mean that
there is no linear relationship between the variables. On the other hand, the
coefficient of determination (r^2) is a measure of the percentage of variation in a
variable that can be explained by another variable in a linear regression model. Its
value ranges from 0 to 1, where 0 means that the independent variables do not
explain any variation in the dependent variable and 1 means that the independent
variables explain all the variation in the dependent variable. The least squares
method for estimating equations This equation is used to predict the value of the
dependent variable (Y) based on the value of the independent variable (X). The
general form of the least squares equation is as follows: Y = a + bX. Y represents
the dependent variable we want to predict, X represents the independent variables
we use to make predictions, a is the intersection of the regression line with the Y
axis (the value of Y when X equals 0). b is the slope of the regression line and shows
how Y changes as X increases. To find the values of a and b, use the least squares
method, which minimizes the sum of the squares of the differences between the
actual value of Y and the value calculated by the equation. As long as certain
conditions and assumptions of the regression model are met, the equation can
predict the future value of Y based on the known value of correlation coefficient and
the coefficient of determination is that there is a weak positive correlation between
the variables, but only 8.69% of the variability in one variable in the model can be
explained by the other variable.
BIBLIOGRAFÍA.
(s.f.). Obtenido de [Link]
función coeficientes de determinación. (2019). Obtenido de
[Link]
Orodi, O. (2020). coeficiente de correlación. Obtenido de [Link]
ucpdHED3M?si=gVsQ5z6YMYujZ6gj
(funcion coeficientes de determinacion , 2019) (htt)
(Orodi, 2020)