0% encontró este documento útil (0 votos)
87 vistas7 páginas

Algebra Lineal

Este documento presenta información sobre el método de regresión lineal por mínimos cuadrados. Explica cómo este método encuentra los parámetros de una línea recta que mejor se ajusta a un conjunto de datos experimentales mediante la minimización de la suma de los cuadrados de los residuos. Además, proporciona ejemplos y tareas relacionadas con aplicar este método para modelar relaciones entre variables biológicas y de crecimiento de bacterias.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
87 vistas7 páginas

Algebra Lineal

Este documento presenta información sobre el método de regresión lineal por mínimos cuadrados. Explica cómo este método encuentra los parámetros de una línea recta que mejor se ajusta a un conjunto de datos experimentales mediante la minimización de la suma de los cuadrados de los residuos. Además, proporciona ejemplos y tareas relacionadas con aplicar este método para modelar relaciones entre variables biológicas y de crecimiento de bacterias.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD ESTATAL DE MILAGRO

Proyecto
APROXIMACIÓN POR MÍNIMOS CUADRADOS
Docente
Msc. Byrone Almeida Salazar
Materia
Algebra lineal
Estudiante
Milton Villa
Cinthia Bone
Christian Aguirre
Jersy Freire
Melanny Romero
Milagro – ecuador
2019

1
Introducción
En las ciencias biológicas es esencial estudiar las relaciones entre distintos parámetros con el
objetivo de tener indicadores con valor predictivo, descubrir conexiones de causa- efecto, o
conocer el estado de un sistema según una variable relacionada al mismo. Esto conlleva una
apreciable cantidad de trabajo a realizar. Las mediciones y observaciones experimentales
raramente se comportan de manera exacta según una fórmula, y uno de los recursos que queda
al experimentador es lograr hallar la fórmula que mejor se aproxime al comportamiento dado
por las mediciones.

Por ejemplo, en 2015 se publicó un estudio sobre el efecto tóxico que tiene la concentración de
nitratos en los cultivos del camarón de cola blanca (Litopenaeus Vannamei), sobre el
crecimiento de los mismos. Se determinó que la tasa de crecimiento semanal G (en gr/semana)
decrece a medida que se incrementa la concentración de nitratos N (en mg/L), según la
expresión:(Vannamei, 2017)

G = 0,874− 0,0007 × N

La Figura 1 ilustra los resultados de ese estudio:

Figura

En Figura 1, los pequeños círculos indican los datos reales medidos, mientras que la líne recta
corresponde a la función lineal que mejor se aproxima a los datos medidos, no necesariamente
que contenga dichos puntos.

REGRESIÓN LINEAL
Suponga que se dispone de dos secuencias de mediciones x e y:

con correspondencia entre mediciones (a la i-ésima medida xi corresponde la medición yi).


Suponga que hay evidencia experimental de una relación lineal entre los vectores dados, de
modo que se desea encontrar una expresión de tipo y = mx + b (lineal), cuya gráfica represente
mejor el conjunto de puntos (xi , yi ) de las mediciones tomadas.

Si la relación fuera exacta, y las mediciones perfectas y sin errores, se cumpliría que:

y1 = b+ mx1 , y2 = b+ mx2 , ... yn = b+ mxn

2
pero en la vida real esto nunca se cumple, por lo cual, al evaluar los xi en la recta = mx + b se
producen como resultado ˆyi que no son iguales a los yi :

¿Cuáles son los valores de los parámetros m y b que producen la menor distancia entre los yi y
los y ˆi ? Es decir, que minimizan la distancia entre y y y ˆ ,|| y − ˆy|| .

La expresión y ˆ = Au corresponde a un sistema de ecuaciones lineales, con An×2 , y donde y ˆ


es un vector de Rn que pertenece a la imagen de A. Así también, Im(A) es un subespacio de
dimensión menor o igual que 2, pues A solo tiene dos columnas.

Según el teorema de la Aproximación de la Norma, la distancia y − ˆy es mínima cuando y − ˆy


es perpendicular a Im(A) .

3
Tarea 1 :
Enuncie y demuestre el Teorema de la Aproximación de la Norma.

Sea u el vector minimiza|| y − ˆy|| , es decir, se cumple que:

Au ⊥ (y − Au) ,

o: Au,(y − Au) = 0

Aplicando las propiedades del producto interno:

Au,y − Au, Au = 0

uT(AT y – AT Au) = 0

lo cual se cumple para cualquier u, solo si AT y = AT Au . Y el vector u es:

u = (ATA)−1ATy

Tarea 2:
Justificar por qué se afirma que necesariamente AT y = AT Au .

estos cálculos muestran que cada solución por mínimos cuadrados de au=y satisface la
ecuación:

aj·(y−Aû)=0, y ajT·(y−Aû)=0.

Puesto que cualquier ajTes una fila de AT.

AT(y−Aû)=0

ATy−ATAû=0

Estos cálculos muestran que cada solución por mínimos cuadrados de au=y satisface la
ecuación:

AT· A ·u=ATy
Teorema1: La matriz AT A es invertible si los n puntos de datos (xi, yi) no son colineales

Tarea 3: Demostrar el Teorema 1. ????

Û es una solución por mínimos cuadrados de Au = ŷ si y sólo si ŷ es una solución de las


ecuaciones normales:

ATAû=ATy

El conjunto de soluciones por mínimos cuadrados de Au=ycoincide con elconjunto no vacío de


soluciones de las ecuaciones normales

4
AT· A ·u=ATy

El sistema anterior, podría tener infinitas soluciones en algunos casos. Elsiguiente teorema
indica las circunstancias en las cuales es única la solución alproblema y cómo determinar la
solución de mínimos cuadrados.

Teorema
A tendrá columnas linealmente independientes si y sólo si AT A es [Link] este caso, la
solución por mínimos cuadrados es única y puede calcularse con:

(¿¿T A)−1ATy

û=¿

Teorema 1: La matriz AT A es invertible si los n puntos de datos (xi, yi) no son colineales.

Tarea 3:
Demostrar el Teorema [Link] ATA una matriz invertible de 2x2, se tiene

A= 1 x1

1 x2

⋮ x0

Como no toda xi=xj, las columnas de A son linealmente independientes.

Ahora

ATA=( )( ) ( )

Si ATA no es invertible => det(ATA)=0. Esto conduce a:

x(¿¿i)2=0n∑i=1nxi2−∑i=1n¿

(¿¿i)2

n∑i=1nxi2=∑i=1n¿

Sea u=(1 1 ⋮) y x=(x1 x2 ⋮),

Entonces

(1 1 ⋮)(1 1 ⋮)=1+1+1=n(‖u‖2)= u ∗ u = n,

‖x‖2=∑i=1nxi2∧u∗x=∑i=1nxi

Lo cual implica que

x (¿¿i)2n∑i=1nxi2=∑i=1n¿

Puede escribirse como:

5
u|x|2=|u∗x|2

√u|x|2=√|u∗x|2

√u|x|=|u||x|

Pero como u=(1 1 ⋮ ), la √u=(√1 √1 ⋮ )y √u=u

Entonces |u x|=|u||x|

Por desigualdad de Cauchy-Schaurz se sabe que

|ux|≤|u||x|en donde|ux|=|u||x|⟺x

es una constante y múltiple de u. Pero u y x las definimos como columnas de A y vimos que
ellas eran Linealmente Independientes. El resultado es una contradicción que demuestra el
Teorema.

Tarea 4:
Deducir la formulación para la regresión cuadrática, cuando se quiere relacionar dos secuencias
de mediciones x e y mediante la expresión yi = c + bxi + axi2 . ¿Qué forma tienen en este caso
las matrices A y u en la ecuación ˆy = Au? ¿Cuál es la expresión para el vector u que minimiza
la distancia entre y ey ˆ ?

Tarea 5:
Estudios sobre nutrición mineral de las plantas de arroz han determinado que la concentración
de sulfuros en el terreno de cultivo afecta la altura de la planta (en cm), y el rendimiento de
arroz producido (en gramos por planta). Si la relación entre Rendimiento y concentración de
fertilizante (en mg/Kg) es de tipo cuadrático, encuéntrese la función de rendimiento, basado en
los datos de la tabla siguiente:

La relación entre la altura de la planta y la concentración de fertilizante también es cuadrática,


halle la función de altura según los datos de la tabla dada.

MONITOREO DE CRECIMIENTO CONTROLADO DE BACTERIAS


En un laboratorio de análisis de contaminación y control de calidad alimentaria se estudia la tasa
de crecimiento de la bacteria Escherichia Coli como una función de la concentración de glucosa.

La tasa de crecimiento V (en h–1) y las concentraciones de glucosa s (en µM) se proveen en el
archivo anexo. El investigador principal hipotiza que estas dos variables están relacionadas
mediante las relaciones cinética Michaelis-Menten:

El diagrama de los datos no se ajusta a los modelos conocidos de regresión lineal o cuadrática
por lo cual se decide graficar también los datos en el formato (1/V) en función de (1/s). Aplique
los métodos de aproximación por mínimos cuadrados para obtener una expresión que permita
calcular la tasa de crecimiento V en h–1, a partir de las mediciones de concentración de glucosa
s en µM. Provea las respuestas requeridas en Entregables.

6
Referencias bibliográficas

Vannamei, L. (2017). . En Figura 1, los pequeños círculos indican los datos reales medidos,
mientras que la líne recta corresponde a la función lineal que mejor se aproxima a los
datos medidos, no necesariamente que contenga dichos puntos. 1–5.

También podría gustarte