UNIVERSIDAD NACIONAL DE LOJA
FACULTAD DE LA ENERGÍA, LAS INDUSTRIAS Y LOS RECURSOS NATURALES
NO RENOVABLES
MAESTRÍA EN ELECTRICIDAD
MENSIÓN EN SISTEMAS ELÉCTRICOS DE POTENCIA
NOMBRE DE LA ASIGNATURA
TEMA 1: MÉTODOS MATEMÁTICOS DE LA INTELIGENCIA ARTIFICIAL
DOCENTE: ING. RAÚL CUBILLO BETANCOURT, MSc
CORREO:
[email protected] PERIODO: Agosto 2021
INTRODUCCIÓN
En el 2001 la Academia de Ingeniería de EEUU por votación
mayoritaria reconoció que la red eléctrica es el máximo logro
de la ingeniería en el siglo XX
Las redes eléctricas son una de las máquinas más complejas
en existencia. Son millones los componentes que integran su
cadena de suministro
Sus condiciones de operación cambian, cada segundo,
minuto, hora, día…
CIENCIA DE DATOS
• 1750 – 1970: Probabilidad y Estadística
• 1970 – 1990: Análisis de Datos (Exploratory Data
• Analysis), SQL
• 1990 – 2000: OLAP (Online Analytical Processing)
• 2000 – 2005: Minería de Datos, Business Intelligence
• 2005 – 2011: Modelos Predictivos, Analytics
• 2011 – 2015: Big Data, Big Data Analytics
• 2015 – presente: Ciencia de Datos o Ingeniería de Datos
ANÁLISIS DE DATOS
Contar historia con Datos
OLAP - PROCESAMIENTO ANALITICO EN LINEA
Análisis de grandes cantidades de
datos usando estructuras
multidimensionales,
MINERIA DE DATOS
La minería de datos o exploración
de datos es un campo de la
estadística y las ciencias de la
computación referido al proceso
que intenta descubrir patrones en
grandes volúmenes de conjuntos de
datos
MODELOS PREDICTIVOS, ANALYTICS
El análisis de datos es un proceso que consiste
en inspeccionar, limpiar y transformar datos
con el objetivo de resaltar información útil, para
sugerir conclusiones y apoyo en la toma de
decisiones
BIG DATA
1.Volumen
2.Velocidad
3.Variedad de los datos
4.Veracidad de los datos
5.Viabilidad
6.Visualización de los datos
7.Valor de los datos
CIENCIA DE DATOS
La ciencia de datos es un campo interdisciplinario
que involucra métodos científicos, procesos y
sistemas para extraer conocimiento o un mejor
entendimiento de datos en sus diferentes formas, ya
sea estructurados o no estructurados
LOS DATOS EN LOS SISTEMAS ELECTRICOS
LOS DATOS EN LOS SISTEMAS ELECTRICOS
LOS DATOS EN LOS SISTEMAS ELECTRICOS
MAESTRÍA EN ELECTRICIDAD
TEMA 1: ANÁLISIS EXPLORATORIO DE DATOS
1. Definiciones Básicas, Teoría de Probabilidad y Estadística
2. Tipos de Datos
3. Valores atípicos
4. Características de los Datos
5. Distribución de frecuencias
6. Representación Gráfica de los Datos
7. Medidas de Localización
8. Medidas de Dispersión
9. Medidas de Forma
“Algún día el pensamiento estadístico será tan necesario para los ciudadanos
eficientes como la habilidad para leer y escribir”
H.G. Wells
1
INTRODUCCIÓN
https://prezi.com/cljkusgdotjn/linea-del-tiempo-historia-de-la-estadistica-y-la-probabilidad/
INTRODUCCIÓN
LÓGICA - MATEMÁTICA ANÁLISIS UNIVARIANTE
ESTADÍSTICA ANÁLISIS MULTIVARIANTE
OTRAS CIENCIAS SERIES DE TIEMPO
DEFINICIONES BÁSICAS
• Unidad muestral o experimental: Es el objeto básico sobre el cual es el estudio o experimento se lleva a cabo.
• Población o universo: Es el grupo entero al que se desea describir o del que se desea obtener el análisis y conclusiones.
• Muestra: Es un grupo de unidades seleccionadas de la población de acuerdo con un plan o regla con el objetivo de
obtener conclusiones sobre la población de la cual proviene.
• Estrato: Dividir una población en distintos subgrupos, cuyos subgrupos son excluyentes.
• Tamaño muestral: Es el número de unidades que constituyen la muestra.
ESTRATO
POBLACIÓN
(N)
MUESTRA
(n)
MAPA CONCEPTUAL
• Parámetro: Es el valor numérico que se define para describir una característica de una población.
• Estadístico: Es una medida que se calcula para describir una característica de la población a partir de una muestra
TIPOS DE DATOS
1. Cualitativos (Descriptivos o Categóricos): Describen características que no son medibles.
1.1 Nominales: Representan Categorías, que difieren por una cualidad (ej: sexo, estado civil)
1.2 Ordinales: Son no numéricas, tienen un orden pero no existe una distancia o intervalo. Ej: (bachiller,
licenciado, ingeneiro, master)
2. Cuantitativos (Numéricos): Describen características que son medibles.
2.1 Discretos: Si los valores u observaciones son distintas y separadas, pueden ser contados.
2.2 Continuos: Si los valores u observaciones pueden tomar cualquier valor en un intervalo considerado.
LOS DATOS - Notación
Variables ( j )
Individuos ( i )
CARACTERÍSTICAS DE LOS DATOS
1. LOCALIZACIÓN: Es la posición relativa que ellos presentan, por el valor que tiene como punto medio.
2. DISPERSIÓN: Es el grado de diseminación de los valores individuales alrededor del centro de las
observaciones.
3. SIMETRIA y ASIMETRIA: Representa la distribución de un conjunto de datos, por encima o por debajo de u
punto medio.
DISTRIBUCIÓN DE FRECUENCIAS
• x1 , x2 ,…, xk deben estar ordenados ascendentemente
• σ𝑛𝑖=1 𝑛𝑖 = 𝑛
𝑛𝑖
• 𝑓𝑖 = 𝑛
Valor de la variable Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa
( xi ) Absoluta ( ni ) acumulada ( Ni ) Relativa ( fi ) Acumulada ( Fi )
x1 n1 N1 = n1 f1 F1 = f1
x2 n2 N2 = N1+n2 f2 F2 = F1+f2
⁝ ⁝ ⁝ ⁝ ⁝
xk nk Nk = Nk-1+nk fk Fk = Fk-1+fk
Total n 1
SIMPLIFICACIÓN POR CLASES • Número de clases: (k)
𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛
• Longitud de clase 𝐴 = 𝑘
• Extremos de intervalos 𝐿𝑗 = 𝐿𝑗−1 + 𝐴, 𝑗 = 1, 2 , … , 𝑘
EJERCICIO 1.1 DISTRIBUCIÓN DE FRECUENCIAS
a) Desarrollar la tabla de distribución de frecuencias, de las siguientes observaciones.
b) Definir un número de clases (k)
c) Calcular la longitud de la clase
d) Construir las clases
e) Determinar las frecuencias de cada clase
32,9 33,4 33,2 33,3 32,8 33,1 33,5 33,3 33,5
33,5 33,6 33,1 33,6 33,4 33,6 33,8 33,9 33,3
33,2 33,6 33,2 34,4 33,5 33,4 33,1 33,2 33,6
33,5 33,7 33,8 33 33,7 33,1 33,6 33,3 33,6
33,8 33,3 33,7 34,1 33,2 33,2 33,6 32,9 33,4
32,9 33,9 33,2 33,5 33,9 34 33,6 33,2 33,1
33,1 34,1 33,6 33,5 33,7 33,7 33,4 33,3 33,4
34,0 33,5 33,4 33,3 33,4 33,6 33,6 33,7 33,4
33,5 33,6 33,2 33,1 33,6 33,5 33,6 33,1 33,8
33,7 33,3 33,1 33,3 33 33,3 33,4 33,5 33,0
REPRESENTACIÓN GRÁFICA DE LOS DATOS
MEDIDAS DE LOCALIZACIÓN
PROMEDIO O MEDIA ARITMÉTICA MEDIANA (Q2)
• Ordenar n observaciones de manera
creciente.
• impar: 𝑛 = 2𝑚 + 1
• par: 𝑛 = 2𝑚
𝑛
+ 𝑁𝑖−1
Observaciones Frecuencia absoluta
𝑀𝑒𝑑 = 𝐿𝑖−1 + 2 𝐴
𝑛𝑖
x1 n1
𝐿𝑖−1 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
x2 n2 𝑁𝑖−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
⁝ ⁝ 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑛𝑎
A = es la longitud de la clase mediana
xk nk
MODA
σ𝑘𝑖=1 𝑛𝑖 𝑥𝑖 https://es.wikipedia.org/wiki/Media_a
𝑥ҧ = ritm%C3%A9tica#/media/Archivo:Visu
𝑛 alisation_mode_median_mean.svg
Es aquel valor con mayor frecuencia
absoluta.
MEDIDAS DE LOCALIZACIÓN
MEDIA GEOMÉTRICA MEDIA ARMÓNICA
Es la raíz n-ésima del producto de todos los Es el reciproco de la media aritmética de
números; es recomendada para datos de los recíprocos de esos n valores.
progresión geométrica, para promediar
razones, interés compuesto y números
índice
MEDIA GEOMÉTRICA PONDERADA
Promediar variables como porcentajes, tasas, números índices, es Promediar variables como productividades, velocidades, tiempos
decir variables que representan variaciones acumulativas rendimientos, cambios, etc.
https://es.wikipedia.org/wiki/Media_geométrica
https://es.wikipedia.org/wiki/Media_armónica
PERCENTILES, CUARTILES, QUINTILES
PERCENTILES (Pk) CUARTILES (Qk)
Son cada uno de los 99 valores que dividen a la distribución de los Son valores que dividen a la distribución de los datos en 4 partes,
datos en 100 partes iguales. cada una de las cuales engloba 25%
Datos no agrupados, en tabla de datos individuales
𝑛𝑘 𝑛𝑘
=𝑡+𝑟 t = parte entera de
100 100 QUINTILES (qk)
𝑥𝑗 + 𝑥𝑗+1
, 𝑠𝑖 𝑟 = 0 Son valores que dividen a la distribución de los datos en 5 partes,
𝑃𝑘 = ቐ 2 cada una de las cuales engloba 20%
𝑥𝑗+1 , 𝑠𝑖 𝑟 > 0
Datos agrupados, en clases
𝑛𝑘
− 𝑁𝑘−1
𝑃𝑘 = 𝐿𝑘−1 + 100 𝐴
𝑛𝑘
MEDIDAS DE DISPERSIÓN
Desviación Estándar o desviación típica (s) Rango (R)
𝑛 𝑅𝑎𝑛𝑔𝑜 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
1
𝑠= 𝑥𝑖 − 𝑥ҧ 2 𝑅𝑎𝑛𝑔𝑜
𝑛−1 𝑠≈ , 𝑝𝑎𝑟𝑎 𝑛 ≤ 16
𝑖=1 𝑛
𝑅𝑎𝑛𝑔𝑜
𝑠≈ , 𝑝𝑎𝑟𝑎 16 < 𝑛 < 100
Datos agrupados, en tabla de frecuencias 4
Rango intercuartil (RIQ)
𝑛
1 2
𝑠= 𝑛𝑖 𝑥𝑖 − 𝑥ҧ 𝑅𝐼𝑄 = 𝑄3 − 𝑄1
𝑛−1
𝑖=1
Coeficiente de variación
𝑥1 𝑥5 𝑠
𝑥3 𝑥𝑛 𝐶𝑉 =
𝑥𝑘 𝑥ҧ
𝑥ҧ Permite comparar las mediciones de una misma magnitud en
distintas unidades o por distintos individuos
𝑥2
𝐶𝑉 ≤ 1 𝑑𝑎𝑡𝑜𝑠 ℎ𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑜𝑠
𝑥4
𝐶𝑉 ≥ 1,5 𝑑𝑎𝑡𝑜𝑠 ℎ𝑒𝑡𝑒𝑟𝑜𝑔𝑒𝑛𝑒𝑜𝑠 (∗)
MEDIDAS DE FORMA - ASIMETRÍA
Coeficiente de asimetría de Fisher CAF Coeficiente de asimetría de Pearson CAp
El coeficiente de asimetría de una variable mide el grado de El coeficiente de asimetría Pearson de una variable mide la
asimetría de la distribución de sus datos en torno a su media diferencia entre la media y la moda respecto a la dispersión
de los datos.
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 3
𝑛 𝑥ҧ − 𝑚𝑜𝑑(𝑋)
𝐶𝐴𝐹 = 𝐶𝐴𝑃 =
𝑠3 𝑠
𝐶𝐴𝐹 > 0 𝐶𝐴𝐹 = 0 𝐶𝐴𝐹 < 0
https://www.universoformulas.com/estadistica/descriptiva/asimetria-curtosis/
MEDIDAS DE FORMA - CURTOSIS
La curtosis (o apuntamiento) es una medida de forma que mide cuán
escarpada o achatada está una curva o distribución.
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 4
𝐴𝑝 = 𝑛 −3
𝑠4
Leptocurtica: si 𝐴𝑝 >0 es más apuntada que la normal
Mesocurtica: si 𝐴𝑝 = 0 es más apuntada normal
Platicurtica: si 𝐴𝑝 < 0 es menos apuntada que la normal
valores extremos valores extremos
EJERCICIO 1.2 DISTRIBUCIÓN DE FRECUENCIAS
Sobre la información de tabla de datos determinar:
a) Calcular el valor promedio.
b) Calcular la media geométrica
c) Calcular la media armónica
d) Determinar la mediana
e) Determinar los cuartiles inferior y superior
f) Calcular la Varianza
g) Determinar Coeficiente de Asimetría
h) Determinar la Kurtosis
Medida 1,45 1,48 1,5 1,53 1,55 1,57 1,6 1,63 1,65
Frecuencia 2 4 5 8 12 7 4 3 1
REPRESENTACIONES GRÁFICAS
Diagrama de balanza
min 𝑥ҧ − 𝑠 𝑥ҧ 𝑥ҧ − 𝑠 max
Diagrama de caja
MAESTRÍA EN ELECTRICIDAD
TRABAJO 1
ENTREGA: VIERNES 17 SEPTIEMBRE 2021
TEMA: ANALISIS DE DATOS DE LA DEMANDA DE LA EER SUR
4500,0
4000,0
3500,0
3000,0
2500,0
2000,0
1500,0
1000,0
11-03 00:00 31-03 00:00 20-04 00:00 10-05 00:00 30-05 00:00 19-06 00:00 09-07 00:00