0% encontró este documento útil (0 votos)
16 vistas20 páginas

Math Stats

Estadisticas

Cargado por

Diegote1
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
16 vistas20 páginas

Math Stats

Estadisticas

Cargado por

Diegote1
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Algebra Lineal

Escalar: Magnitud que queda definida unicamente con un valor y sus unidades
Vector: Colección ordenada de números en una dimensión (eje 0)
Matriz: Colección ordenada de números de dos dimensiones, cada elemento se identifica
mediante dos índice. Se componen de un número de filas (m) y un número de columnas
(n) y el producto de estas dimensiones indica el número de elementos. El eje 0 recorre la
matriz por columnas y el eje 1, por filas.
Tensor: Colección ordenada de números en tres [Link] necesitan tres números
para identificar a ún elemento, siendo el primero el que define a ue matriz pertenece, el
segundo la fila y el tercero la columna.
Multiplicación Matricial
El resultado de la multiplicación de dos matrices, A y B, tiene como resultado otra matriz C.
Para poder realizar la multiplicación matricial A por B es necesario que el número de columnas de A
tiene que ser igual al número de filas de B, la matriz resultado C tendrá tantas filas como tenía A y
tantas columnnas como tenía B.
A(mxn) B(nxp) =C(mxp)
La multiplicación matricial es distributiva

Quiere decir que se obtiene el mismo resultado si se multiplica la matriz A por el resultao de la suma
de B y C que si se multiplica A por B y A por C y se suma el resultado de ambas operaciones.
A(B+C) = AB + AC

También es asociativa, se obtiene el mismo resultado si se multiplica A por el resultado de multiplicar


B por C que si primero se multiplica A por B y este reultado se multiplica por C
A(BC) = (AB)C

No es conmutativa, puesto que a veces ni si quiera se cumple la condición de igualad entre filas y
columnas. Por ejemplo si A es una matriz 3x2 y B2x4 la multiplicación AB es posible pero BA no.
AB != BA
Matriz identidad y matriz inversa
La matriz identidad es aquella que su diagonal principal, aquellos elementos con indice de filas
columnas igual (A11,A22...Ann), es igual a 1 y el resto de elementos es 0.
Para crear la matriz identidad del tamaño deseado Numpy dispone de la función [Link](a)
donde a es el tamaño de la matriz cuadrada que desea generar.
por ejemplo para crear la matriz identidad 10x10
Si quisieras generar una matriz no cuadrada cuyos elementos
diagonales sean unos, se puede utilizar la función [Link](f,c).

La matriz inversa de A, A -1 , es aquella que al multiplicarla por la matriz sin invertir obtiene como
resultado la matriz identidad.
A -1 ·A = I
Se puede calcular la matriz inversa de A mediante la función [Link](A)
Matriz Transpuesta
La matriz transpuesta, A T , es aquella matriz que surge como reultado de intercmbiar las filas por
columnas y las columnas por filas.
Se puede calcular mediante la función [Link]()
Norma
Las normas son funciones que se caracterizan por las siguientes propiedades:

Las normas devuelven valores no negativos porque es la magnitud o la longitud de un vector que
no puede ser negativo.
Las normas son 0 si y solo si el vector es un vector cero.
Las normas siguen la desigualdad del triángulo, es decir, la norma de la suma de dos (o más)
vectores es menor o igual que la suma de las normas de los vectores individuales. Simplemente
establece que geométricamente, el camino más corto entre dos puntos es una línea.
Representado por la ecuación:
∥ ∥∥∥ ∥∥
a+b ≤ a + b

donde ayb son dos vectores y las barras verticales generalmente denotan la norma.
La norma de un vector multiplicada por un escalar es igual al valor absoluto de este escalar
multiplicado por la norma del vector.
Norma L0
Poner p = 0 en la fórmula nos dará la norma L⁰.
Cualquier cosa elevada a la potencia 0 devolverá 1 excepto 0. L⁰ no es realmente una norma porque
no exhibe la característica # 4 (descrita arriba). Multiplicar una constante nos dará ese número en sí.

Norma L1
Poner p = 1 nos da la norma L¹. Esencialmente, la fórmula calcularía la suma de los valores absolutos
del vector.
Fórmula: | x | ₁ = (∑ᵢ | xᵢ |)
Se utiliza para calcular el error absoluto medio.

Norma L2
También conocida como norma euclidiana. Esta es una norma ampliamente utilizada en el
aprendizaje automático que se utiliza para calcular la raíz del error cuadrático medio.
La fórmula sería calcular la raíz cuadrada de la suma de los cuadrados de los valores del vector.
∥∥x ₂ = (∑ᵢ xᵢ²) ¹ / ²
Norma L2 al cuadrado
La norma L2 al cuadrado es simplemente la norma L2 pero sin la raíz cuadrada. Elevar al
cuadrado la norma L2 calculada anteriormente nos dará la norma L2.
Es conveniente porque elimina la raíz cuadrada y terminamos con la suma simple de cada valor al
cuadrado del vector.
La norma euclidiana al cuadrado (Norma L2 al cuadrado) se usa ampliamente en el aprendizaje
automático en parte porque se puede calcular con la operación vectorial x ᵀ x.

Norma L∞
Esta es la norma L∞ que simplemente devuelve el valor absoluto del elemento más grande del vector.
La fórmula se convierte en:
‖X‖∞ = maxᵢ | xᵢ |
Determinante
El determinante es un número real, que solo puede ser calculado para matrices cuadradas (mismo
número de filas que de columnas), se obtiene de restar la multiplicación de los elementos de la
diagoal principal de la matriz y la multiplicación de los elementos de los elementos de la diagonal
secundaria de la misma matriz.
Para calcularlo Numpy dispone de la función [Link](matriz)

Traza
La traza de una matriz es la suma de los elementos de la diagonal principal.
Se calcula [Link](A)
Valores propios
Los vectores propios o eigenvectores son los vectores representativos de una matriz mayor. Cada
vector propio tiene asociado un valor propio (eigenvalor) que indica que cantidad de variavilidad
explica dicho vector porpio. Además los valores propios son el resultado de diagonalizar la matriz.
eigen_valores, eigen_vectores=[Link](matriz)

Fancy indexing Sacar valores por posiciones que se le pasen


Sistema de Ecuaciones

Es posible resolver sistema de ecuaciones


mediante matrices. Dado el sistema:
2x1+3x2=8
x1-2x2=-10
se puede expresar como:
A=[Link]([[2,3],[1,-2]])
b=[Link]([[8],[-10]])

Para resolverlo se puede:


calcular la inversa de A (con [Link](A)) y
realizar el producto escalar con b ([Link](b))
b (2 x 1)=A(2 x 2) * X (2 x 1),
X=A-1B
X=[Link](A).dot(b)

Utilizar el método [Link](A,b)


ESTADÍSTICA
Rango
.ptp(): Calcula el rango, siendo este la diferencia
entre el valor máximo y el mínimo de la matriz.
Tambien se puede encontrar el rango de cada fila
.ptp(m,axis=1) y de cada columna .ptp(m,axis=0)

Media
La media es el valor promedio de un conjunto de
datos numéricos, calculada como la suma del
conjunto de valores dividida entre el número total de
valores.
Mediana
Es el número intermedio de un grupo de números; es
decir, la mitad de los números son superiores a la
mediana y la mitad de los números tienen valores
menores que la mediana.
Moda
Es el valor más repetido del conjunto de datos. Necesitamos importar stats del paquete Scipy y poner el array
como 1-D (puedes usar el atributo flatten())
Percentil
Es una distribución de los datos. Si calculamos el percentil 25 da como resultado el dato que tiene el 25% de
los datos menores que el y el 75% mayores. El percentil 50 debe coincidir con la media puesto que la mitad
de datos es inferior a este resultado y la otra midad superior.
Desviacion estándar
Mide la separación en la distribución de los datos, es decir, la separación de cada elemento respecto de la
media.
Correlación
Indica hasta que punto están relacionadas linealmente dos variables. La más utilizada es la correlación de
Pearson (r) que toma valores entre -1 y 1. Cuanto más cercano sea el valor a -1 o 1, mayor es la relación lineal
entre las variables.
PROBABILIDAD Independencia: Se dice que dos sucesos aleatorios son
independientes entre sí cuando la probabilidad de cada uno
Lo primero será definir algunos conceptos básicos de
de ellos no está influida porque el otro suceso ocurra o no, es
probabilidad:
decir, cuando ambos sucesos no están relacionados.

Variables aleatorias: Como su nombre indica es una variable


Esperado, Varianza y Covarianza
que toma valores aleatorios.
La esperanza matemática (también llamada esperanza, valor
Distribución de probabilidad: Es una descripción de la cantidad
esperado, media poblacional o media) de una variable
de veces que una o varias variables aleatorias toman cada uno de
aleatoria X , es el número E[X] que formaliza la idea de valor
sus posibles valores.
medio de un fenómeno aleatorio. Es un concepto análogo a
Probabilidad marginal: Es la distribución de probabilidad de un
la media aritmética de un conjunto de datos.
subconjunto de los posibles valores que puede tomar la variable.
La varianza mide como de cerca se encuentran los valores
Teniendo 2 variables, la probabilidad de que ocurra cada uno de
de una variable de su valor esperado. Cuanto más pequeña
los estados de una de las variables, sin tener en cuenta la otra.
sea la varianza, más cercano al valor esperado estarán los
Probabilidad condicionada: Es la probabilidad de cada uno de
posibles valores de la variable. La raiz cuadrada de la varianza
los estados de una de las variables (X), respecto de uno de los
es la desviación estandar.
valores posibles de la otra variable (Y). P(X|Y)
La covarianza indica cuanta relación lineal existe entre las
Regla de la cadena: Toda distribución de probabilidad de varias
variables.
variables aleatorias puede ser descompuesta en probabilidades
condicionadas respecto de una única variable.

P(a,b,c)=P(A|C)P(B|C)P(C)
Distribución de probabilidad comunes
Existen varias distribuciones de probabilidad muy útiles en machine learning

Distribución de bernuilli o A continuación se muestra un ejemplo gráfico de


la probabilidad que lleguen tarde 0,1,2,3,4 o 5
binominal niños. Siendo la probabilidad que llegue tarde un
Una distribución binomial es una distribución de
alumno 0.4, el número de ensayos 5 y r variará
probabilidad ampliamente utilizada de una
de 0 a 5 segun el caso de estudio.
variable aleatoria discreta (asignación definida a
cada posibilidad de un experimento), esa es la
distribución binomial. Esta describe varios
procesos de interés para los administradores,
porque ayuda a aplicar comprensión de la
incertidumbre y probabilidad en la toma de
decisiones.
Distribucción de Poisson

La distribución de Poisson fue desarrollada


por Siméon‐Denis Poisson (1781‐1840). Esta
distribución de probabilidades es muy
utilizada para situaciones donde los sucesos
son impredecibles o de ocurrencia aleatoria.
En general, utilizaremos la distribución de
Poisson como aproximación de
experimentos binomiales donde el número

de pruebas es muy alto (n ∞), pero la

probabilidad de éxito muy baja (p 0).
Distribución multinominal
La distribución multinomial o distribución multinómica es una generalización de la distribución
binomial. En lugar de solo existir probabilidad de éxito o probabilidad de fracaso existen diferentes
opciones y cada una de ellas tienen una probabilidad de ocurrir. Por ejemplo, para un dado podemos
aplicar una distribución binomial si solo nos interesa cuantas veces sale el 6 (p=1/6) o una multinominal
para ver cuantas veces sale cada cara (p=[1/6, 1/6, 1/6, 1/6, 1/6, 1/6])
Distribución Gaussiana o Normal
Distribución normal, distribución de Gauss, distribución gaussiana o distribución de Laplace-Gauss, a
una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en
estadística y en la teoría de probabilidades.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un
determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de
una función gaussiana.
Distribución Exponencial
La distribución exponencial es una distribución continua que se utiliza para modelar tiempos de
espera para la ocurrencia de un cierto evento. Esta distribución al igual que la distribución geométrica
tiene la propiedad de pérdida de memoria. La distribución exponencial es un caso particular de la
distribución gamma

También podría gustarte