0% encontró este documento útil (0 votos)
78 vistas36 páginas

Métodos Matemáticos en IA y Energía

Este documento presenta una introducción al tema 1 de la asignatura "Métodos Matemáticos de la Inteligencia Artificial" de la Maestría en Electricidad de la Universidad Nacional de Loja. Introduce conceptos básicos de estadística como tipos de datos, distribución de frecuencias, medidas de localización y dispersión que serán utilizados para el análisis exploratorio de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
78 vistas36 páginas

Métodos Matemáticos en IA y Energía

Este documento presenta una introducción al tema 1 de la asignatura "Métodos Matemáticos de la Inteligencia Artificial" de la Maestría en Electricidad de la Universidad Nacional de Loja. Introduce conceptos básicos de estadística como tipos de datos, distribución de frecuencias, medidas de localización y dispersión que serán utilizados para el análisis exploratorio de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD NACIONAL DE LOJA

FACULTAD DE LA ENERGÍA, LAS INDUSTRIAS Y LOS RECURSOS NATURALES


NO RENOVABLES

MAESTRÍA EN ELECTRICIDAD
MENSIÓN EN SISTEMAS ELÉCTRICOS DE POTENCIA

NOMBRE DE LA ASIGNATURA
TEMA 1: MÉTODOS MATEMÁTICOS DE LA INTELIGENCIA ARTIFICIAL

DOCENTE: ING. RAÚL CUBILLO BETANCOURT, MSc


CORREO: [email protected]

PERIODO: Agosto 2021


INTRODUCCIÓN

En el 2001 la Academia de Ingeniería de EEUU por votación


mayoritaria reconoció que la red eléctrica es el máximo logro
de la ingeniería en el siglo XX
Las redes eléctricas son una de las máquinas más complejas
en existencia. Son millones los componentes que integran su
cadena de suministro

Sus condiciones de operación cambian, cada segundo,


minuto, hora, día…
CIENCIA DE DATOS

• 1750 – 1970: Probabilidad y Estadística


• 1970 – 1990: Análisis de Datos (Exploratory Data
• Analysis), SQL
• 1990 – 2000: OLAP (Online Analytical Processing)
• 2000 – 2005: Minería de Datos, Business Intelligence
• 2005 – 2011: Modelos Predictivos, Analytics
• 2011 – 2015: Big Data, Big Data Analytics
• 2015 – presente: Ciencia de Datos o Ingeniería de Datos
ANÁLISIS DE DATOS

Contar historia con Datos


OLAP - PROCESAMIENTO ANALITICO EN LINEA

Análisis de grandes cantidades de


datos usando estructuras
multidimensionales,
MINERIA DE DATOS

La minería de datos o exploración


de datos es un campo de la
estadística y las ciencias de la
computación referido al proceso
que intenta descubrir patrones en
grandes volúmenes de conjuntos de
datos
MODELOS PREDICTIVOS, ANALYTICS

El análisis de datos es un proceso que consiste


en inspeccionar, limpiar y transformar datos
con el objetivo de resaltar información útil, para
sugerir conclusiones y apoyo en la toma de
decisiones
BIG DATA

1.Volumen
2.Velocidad
3.Variedad de los datos
4.Veracidad de los datos
5.Viabilidad
6.Visualización de los datos
7.Valor de los datos
CIENCIA DE DATOS

La ciencia de datos es un campo interdisciplinario


que involucra métodos científicos, procesos y
sistemas para extraer conocimiento o un mejor
entendimiento de datos en sus diferentes formas, ya
sea estructurados o no estructurados
LOS DATOS EN LOS SISTEMAS ELECTRICOS
LOS DATOS EN LOS SISTEMAS ELECTRICOS
LOS DATOS EN LOS SISTEMAS ELECTRICOS
MAESTRÍA EN ELECTRICIDAD

TEMA 1: ANÁLISIS EXPLORATORIO DE DATOS


1. Definiciones Básicas, Teoría de Probabilidad y Estadística
2. Tipos de Datos
3. Valores atípicos
4. Características de los Datos
5. Distribución de frecuencias
6. Representación Gráfica de los Datos
7. Medidas de Localización
8. Medidas de Dispersión
9. Medidas de Forma

“Algún día el pensamiento estadístico será tan necesario para los ciudadanos
eficientes como la habilidad para leer y escribir”
H.G. Wells
1
INTRODUCCIÓN

https://prezi.com/cljkusgdotjn/linea-del-tiempo-historia-de-la-estadistica-y-la-probabilidad/
INTRODUCCIÓN

LÓGICA - MATEMÁTICA ANÁLISIS UNIVARIANTE

ESTADÍSTICA ANÁLISIS MULTIVARIANTE

OTRAS CIENCIAS SERIES DE TIEMPO


DEFINICIONES BÁSICAS
• Unidad muestral o experimental: Es el objeto básico sobre el cual es el estudio o experimento se lleva a cabo.
• Población o universo: Es el grupo entero al que se desea describir o del que se desea obtener el análisis y conclusiones.
• Muestra: Es un grupo de unidades seleccionadas de la población de acuerdo con un plan o regla con el objetivo de
obtener conclusiones sobre la población de la cual proviene.
• Estrato: Dividir una población en distintos subgrupos, cuyos subgrupos son excluyentes.
• Tamaño muestral: Es el número de unidades que constituyen la muestra.

ESTRATO

POBLACIÓN
(N)

MUESTRA
(n)
MAPA CONCEPTUAL
• Parámetro: Es el valor numérico que se define para describir una característica de una población.
• Estadístico: Es una medida que se calcula para describir una característica de la población a partir de una muestra
TIPOS DE DATOS

1. Cualitativos (Descriptivos o Categóricos): Describen características que no son medibles.


1.1 Nominales: Representan Categorías, que difieren por una cualidad (ej: sexo, estado civil)
1.2 Ordinales: Son no numéricas, tienen un orden pero no existe una distancia o intervalo. Ej: (bachiller,
licenciado, ingeneiro, master)
2. Cuantitativos (Numéricos): Describen características que son medibles.
2.1 Discretos: Si los valores u observaciones son distintas y separadas, pueden ser contados.
2.2 Continuos: Si los valores u observaciones pueden tomar cualquier valor en un intervalo considerado.
LOS DATOS - Notación

Variables ( j )

Individuos ( i )
CARACTERÍSTICAS DE LOS DATOS

1. LOCALIZACIÓN: Es la posición relativa que ellos presentan, por el valor que tiene como punto medio.
2. DISPERSIÓN: Es el grado de diseminación de los valores individuales alrededor del centro de las
observaciones.
3. SIMETRIA y ASIMETRIA: Representa la distribución de un conjunto de datos, por encima o por debajo de u
punto medio.
DISTRIBUCIÓN DE FRECUENCIAS

• x1 , x2 ,…, xk deben estar ordenados ascendentemente

• σ𝑛𝑖=1 𝑛𝑖 = 𝑛
𝑛𝑖
• 𝑓𝑖 = 𝑛
Valor de la variable Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa
( xi ) Absoluta ( ni ) acumulada ( Ni ) Relativa ( fi ) Acumulada ( Fi )
x1 n1 N1 = n1 f1 F1 = f1
x2 n2 N2 = N1+n2 f2 F2 = F1+f2
⁝ ⁝ ⁝ ⁝ ⁝
xk nk Nk = Nk-1+nk fk Fk = Fk-1+fk
Total n 1

SIMPLIFICACIÓN POR CLASES • Número de clases: (k)


𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛
• Longitud de clase 𝐴 = 𝑘

• Extremos de intervalos 𝐿𝑗 = 𝐿𝑗−1 + 𝐴, 𝑗 = 1, 2 , … , 𝑘


EJERCICIO 1.1 DISTRIBUCIÓN DE FRECUENCIAS

a) Desarrollar la tabla de distribución de frecuencias, de las siguientes observaciones.


b) Definir un número de clases (k)
c) Calcular la longitud de la clase
d) Construir las clases
e) Determinar las frecuencias de cada clase

32,9 33,4 33,2 33,3 32,8 33,1 33,5 33,3 33,5


33,5 33,6 33,1 33,6 33,4 33,6 33,8 33,9 33,3
33,2 33,6 33,2 34,4 33,5 33,4 33,1 33,2 33,6
33,5 33,7 33,8 33 33,7 33,1 33,6 33,3 33,6
33,8 33,3 33,7 34,1 33,2 33,2 33,6 32,9 33,4
32,9 33,9 33,2 33,5 33,9 34 33,6 33,2 33,1
33,1 34,1 33,6 33,5 33,7 33,7 33,4 33,3 33,4
34,0 33,5 33,4 33,3 33,4 33,6 33,6 33,7 33,4
33,5 33,6 33,2 33,1 33,6 33,5 33,6 33,1 33,8
33,7 33,3 33,1 33,3 33 33,3 33,4 33,5 33,0
REPRESENTACIÓN GRÁFICA DE LOS DATOS
MEDIDAS DE LOCALIZACIÓN

PROMEDIO O MEDIA ARITMÉTICA MEDIANA (Q2)

• Ordenar n observaciones de manera


creciente.
• impar: 𝑛 = 2𝑚 + 1
• par: 𝑛 = 2𝑚
𝑛
+ 𝑁𝑖−1
Observaciones Frecuencia absoluta
𝑀𝑒𝑑 = 𝐿𝑖−1 + 2 𝐴
𝑛𝑖
x1 n1
𝐿𝑖−1 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
x2 n2 𝑁𝑖−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
⁝ ⁝ 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑛𝑎
A = es la longitud de la clase mediana
xk nk

MODA
σ𝑘𝑖=1 𝑛𝑖 𝑥𝑖 https://es.wikipedia.org/wiki/Media_a
𝑥ҧ = ritm%C3%A9tica#/media/Archivo:Visu
𝑛 alisation_mode_median_mean.svg
Es aquel valor con mayor frecuencia
absoluta.
MEDIDAS DE LOCALIZACIÓN

MEDIA GEOMÉTRICA MEDIA ARMÓNICA

Es la raíz n-ésima del producto de todos los Es el reciproco de la media aritmética de


números; es recomendada para datos de los recíprocos de esos n valores.
progresión geométrica, para promediar
razones, interés compuesto y números
índice

MEDIA GEOMÉTRICA PONDERADA

Promediar variables como porcentajes, tasas, números índices, es Promediar variables como productividades, velocidades, tiempos
decir variables que representan variaciones acumulativas rendimientos, cambios, etc.

https://es.wikipedia.org/wiki/Media_geométrica
https://es.wikipedia.org/wiki/Media_armónica
PERCENTILES, CUARTILES, QUINTILES
PERCENTILES (Pk) CUARTILES (Qk)
Son cada uno de los 99 valores que dividen a la distribución de los Son valores que dividen a la distribución de los datos en 4 partes,
datos en 100 partes iguales. cada una de las cuales engloba 25%

Datos no agrupados, en tabla de datos individuales

𝑛𝑘 𝑛𝑘
=𝑡+𝑟 t = parte entera de
100 100 QUINTILES (qk)
𝑥𝑗 + 𝑥𝑗+1
, 𝑠𝑖 𝑟 = 0 Son valores que dividen a la distribución de los datos en 5 partes,
𝑃𝑘 = ቐ 2 cada una de las cuales engloba 20%
𝑥𝑗+1 , 𝑠𝑖 𝑟 > 0

Datos agrupados, en clases


𝑛𝑘
− 𝑁𝑘−1
𝑃𝑘 = 𝐿𝑘−1 + 100 𝐴
𝑛𝑘
MEDIDAS DE DISPERSIÓN
Desviación Estándar o desviación típica (s) Rango (R)

𝑛 𝑅𝑎𝑛𝑔𝑜 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛


1
𝑠= ෍ 𝑥𝑖 − 𝑥ҧ 2 𝑅𝑎𝑛𝑔𝑜
𝑛−1 𝑠≈ , 𝑝𝑎𝑟𝑎 𝑛 ≤ 16
𝑖=1 𝑛
𝑅𝑎𝑛𝑔𝑜
𝑠≈ , 𝑝𝑎𝑟𝑎 16 < 𝑛 < 100
Datos agrupados, en tabla de frecuencias 4

Rango intercuartil (RIQ)


𝑛
1 2
𝑠= ෍ 𝑛𝑖 𝑥𝑖 − 𝑥ҧ 𝑅𝐼𝑄 = 𝑄3 − 𝑄1
𝑛−1
𝑖=1
Coeficiente de variación
𝑥1 𝑥5 𝑠
𝑥3 𝑥𝑛 𝐶𝑉 =
𝑥𝑘 𝑥ҧ
𝑥ҧ Permite comparar las mediciones de una misma magnitud en
distintas unidades o por distintos individuos
𝑥2
𝐶𝑉 ≤ 1 𝑑𝑎𝑡𝑜𝑠 ℎ𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑜𝑠
𝑥4
𝐶𝑉 ≥ 1,5 𝑑𝑎𝑡𝑜𝑠 ℎ𝑒𝑡𝑒𝑟𝑜𝑔𝑒𝑛𝑒𝑜𝑠 (∗)
MEDIDAS DE FORMA - ASIMETRÍA
Coeficiente de asimetría de Fisher CAF Coeficiente de asimetría de Pearson CAp

El coeficiente de asimetría de una variable mide el grado de El coeficiente de asimetría Pearson de una variable mide la
asimetría de la distribución de sus datos en torno a su media diferencia entre la media y la moda respecto a la dispersión
de los datos.
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 3

𝑛 𝑥ҧ − 𝑚𝑜𝑑(𝑋)
𝐶𝐴𝐹 = 𝐶𝐴𝑃 =
𝑠3 𝑠

𝐶𝐴𝐹 > 0 𝐶𝐴𝐹 = 0 𝐶𝐴𝐹 < 0

https://www.universoformulas.com/estadistica/descriptiva/asimetria-curtosis/
MEDIDAS DE FORMA - CURTOSIS

La curtosis (o apuntamiento) es una medida de forma que mide cuán


escarpada o achatada está una curva o distribución.

σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 4

𝐴𝑝 = 𝑛 −3
𝑠4

Leptocurtica: si 𝐴𝑝 >0 es más apuntada que la normal

Mesocurtica: si 𝐴𝑝 = 0 es más apuntada normal

Platicurtica: si 𝐴𝑝 < 0 es menos apuntada que la normal


valores extremos valores extremos
EJERCICIO 1.2 DISTRIBUCIÓN DE FRECUENCIAS

Sobre la información de tabla de datos determinar:


a) Calcular el valor promedio.
b) Calcular la media geométrica
c) Calcular la media armónica
d) Determinar la mediana
e) Determinar los cuartiles inferior y superior
f) Calcular la Varianza
g) Determinar Coeficiente de Asimetría
h) Determinar la Kurtosis

Medida 1,45 1,48 1,5 1,53 1,55 1,57 1,6 1,63 1,65
Frecuencia 2 4 5 8 12 7 4 3 1
REPRESENTACIONES GRÁFICAS

Diagrama de balanza

min 𝑥ҧ − 𝑠 𝑥ҧ 𝑥ҧ − 𝑠 max

Diagrama de caja
MAESTRÍA EN ELECTRICIDAD
TRABAJO 1
ENTREGA: VIERNES 17 SEPTIEMBRE 2021
TEMA: ANALISIS DE DATOS DE LA DEMANDA DE LA EER SUR
4500,0

4000,0

3500,0

3000,0

2500,0

2000,0

1500,0

1000,0
11-03 00:00 31-03 00:00 20-04 00:00 10-05 00:00 30-05 00:00 19-06 00:00 09-07 00:00

También podría gustarte