Funciones Estadísticas Con Python

El documento presenta funciones estadísticas en Python utilizando bibliotecas como NumPy, statistics y Pandas. Se explica cómo NumPy permite realizar cálculos estadísticos eficientes con arrays n-dimensionales, mientras que la librería statistics es adecuada para cálculos más simples en listas y tuplas. Pandas se destaca por su capacidad para manipular y analizar datos estructurados, ofreciendo funciones para resumir estadísticas descriptivas de manera efectiva.

Cargado por

danielagranados626

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

63 vistas4 páginas

Funciones Estadísticas Con Python

Cargado por

danielagranados626

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Preparatoria La Paz

Informática Aplicada a la Ciencia y a la Industria

Ing. Cristian Iván Domínguez Castillo
Funciones estadísticas en python

Con las herramientas aprendidas hasta este momendo, eres capaz de organizar cualquier tipo de información
en listas, data frames y estructuras que te permiten leer datos utilizando Python. Es momento de aplicar este
conocimiento para utilizar funciones estadísticas.

Python permite analizar datos estadisticos de diversar formas, algunas de estas formas se explican a
continuación:

Numpy
NumPy, abreviatura de Numerical Python, proporciona el objeto array n-dimensional (ndarray), una estructura
de datos más rápida y eficiente en memoria que las listas estándar de Python para trabajar con grandes
volúmenes de datos numéricos. Esto permite realizar cálculos estadísticos a gran escala de forma muy veloz.

Estadística Descriptiva Básica

NumPy incluye funciones optimizadas para calcular medidas estadísticas fundamentales en un array de datos:
Función Equivalente (ignora
Categoría Descripción
(Método/Módulo) NaN)
Tendencia
[Link](a) Calcula la Media Aritmética (promedio) de los elementos. [Link](a)
Central
[Link](a) Calcula la Mediana (valor central de los datos ordenados). [Link](a)
[Link](a,
Calcula la Media Ponderada (si se especifican pesos). -
weights=...)
Calcula la Desviación Estándar (raíz cuadrada de la
Dispersión [Link](a) [Link](a)
varianza).
Calcula la Varianza (dispersión cuadrática respecto a la
[Link](a) [Link](a)
media).
[Link](a) Calcula el Rango (Peak-to-Peak: Máximo - Mínimo). -
Posición [Link](a) o [Link](a) Encuentra el valor Mínimo del array o a lo largo de un eje. -
[Link](a) o
Encuentra el valor Máximo del array o a lo largo de un eje. -
[Link](a)
[Link](a, q) Calcula el Q-ésimo Percentil (ej. q=25 para el primer cuartil). [Link](a, q)
[Link](a, q) Calcula los Cuantiles (similar al percentil). [Link](a, q)
[Link](a) Devuelve el índice del valor mínimo. -
[Link](a) Devuelve el índice del valor máximo. -
Calcula el Coeficiente de Correlación de Pearson entre dos
Relación [Link](x, y) -
variables.
[Link](m) Calcula la Matriz de Covarianza. -
Cuenta el número de ocurrencias (frecuencia) de cada valor
Frecuencia [Link](x) -
no negativo.

Generación de Datos y Simulación

NumPy también es esencial para la generación de números aleatorios a partir de diversas distribuciones de
probabilidad (como la normal, uniforme, binomial, etc.) usando el módulo [Link]. Esto es crucial para:
• Simulaciones de Monte Carlo: Modelar escenarios complejos.
• Pruebas de Hipótesis y Muestreo: Crear conjuntos de datos simulados para validación.
Base para Bibliotecas Avanzadas
NumPy actúa como el bloque de construcción fundamental para otras bibliotecas de Python de nivel superior
utilizadas en estadística y ciencia de datos, como SciPy (que añade funciones estadísticas más avanzadas,
pruebas de hipótesis y distribuciones) y Pandas (que proporciona estructuras de datos para el análisis de datos
estructurados).
Ejemplo de estadisitica descriptiva en python con Numpy.
Statistics

La librería statistics de Python no es tan rápida ni completa como NumPy para el trabajo con arrays grandes, es
la librería estándar de Python para cálculos estadísticos.

Funciones Estadísticas de la Librería Estándar de Python

La librería statistics (debes importarla como import statistics as st) está diseñada para un cálculo estadístico
más simple en listas y tuplas de Python. No maneja arrays n-dimensionales de forma nativa ni tiene el foco en
la velocidad de NumPy.

Categoría Función Descripción

Tendencia
[Link](data) Calcula la Media Aritmética (promedio) de los datos.
Central
Calcula la media usando coma flotante, es más rápido que
[Link](data)
[Link]().
[Link](data) Calcula la Mediana (valor central de los datos ordenados).
[Link](data) Calcula la Moda (el valor que ocurre con más frecuencia).
Devuelve una lista de las modas, útil si hay múltiples valores más
[Link](data)
comunes.
Calcula la Desviación Estándar Muestral (usan $N-1$ en el
Dispersión [Link](data)
denominador).
Calcula la Desviación Estándar Poblacional (usan $N$ en el
[Link](data)
denominador).
[Link](data) Calcula la Varianza Muestral.
[Link](data) Calcula la Varianza Poblacional.
Relación [Link](x, y) Calcula la Covarianza muestral entre dos variables.
Calcula el Coeficiente de Correlación de Pearson entre dos
[Link](x, y)
variables.
[Link](data, Divide los datos en $n$ intervalos equiprobables (por defecto,
Posición
n=4) calcula cuartiles).

Diferencia Clave con NumPy

La principal diferencia es que statistics trabaja con las estructuras de datos nativas de Python (listas, tuplas) y
sus funciones se centran más en estadísticas básicas descriptivas. En cambio, NumPy está optimizado para los
ndarray (arrays multidimensionales) y es la herramienta de elección para el análisis de grandes conjuntos de
datos y cálculos de álgebra lineal.

Ejemplo de estadisitica descriptiva en python con statistics.

Pandas

Pandas es la librería de facto para la manipulación y el análisis de datos estructurados (tabulares) en Python. Se
basa en NumPy, por lo que hereda su velocidad y eficiencia para el cálculo numérico.

• Estructura de Datos: Las dos estructuras principales son el DataFrame (tabla de datos con filas y columnas
etiquetadas) y la Series (una única columna o array etiquetado).

• Estadística Descriptiva: En estadística, Pandas permite agrupar, limpiar y resumir datos fácilmente. Su
función estrella es .describe(), que proporciona un resumen rápido de las medidas de tendencia central,
dispersión y posición para todas las columnas numéricas de un DataFrame.

• Valores Faltantes: Pandas tiene un manejo robusto y explícito de los valores faltantes (NaN), que son
ignorados por defecto en casi todas sus funciones estadísticas.

Funciones estadísticas de pandas en python.

Método de Pandas
Categoría Descripción
(Series/DataFrame)
Resumen Genera un resumen estadístico de 8 puntos (count,
.describe()
Completo mean, std, min, max, cuartiles).
Tendencia
.mean() Media Aritmética.
Central
.median() Mediana.
.mode() Moda (devuelve una Series si hay múltiples modas).
Dispersión .std() Desviación Estándar (muestral por defecto, ddof=1).
.var() Varianza (muestral por defecto, ddof=1).
Posición .min() / .max() Mínimo / Máximo.
.quantile(q) Calcula el cuantil o percentil (ej. 0.25 para el Q1).
Coeficiente de Correlación (en un DataFrame,
Relación .corr()
devuelve la matriz).
.cov() Matriz de Covarianza.
Ejemplo de estadistica descriptiva con Pandas.

También podría gustarte

Estadística Descriptiva - Jupyter Notebook
Aún no hay calificaciones
Estadística Descriptiva - Jupyter Notebook
14 páginas
Estadística en Python: Tutorial Básico
100% (1)
Estadística en Python: Tutorial Básico
30 páginas
Taller de Métodos Cuantitativos: Clase 1
Aún no hay calificaciones
Taller de Métodos Cuantitativos: Clase 1
13 páginas
Dokumen - Tips Estadistica Con Python I
Aún no hay calificaciones
Dokumen - Tips Estadistica Con Python I
14 páginas
Introducción a Machine Learning y Python
Aún no hay calificaciones
Introducción a Machine Learning y Python
78 páginas
Probabilidad y Estadística Con Python
100% (1)
Probabilidad y Estadística Con Python
29 páginas
Manipulación de Datos con Pandas en Python
100% (1)
Manipulación de Datos con Pandas en Python
67 páginas
Análisis Estadístico con Python y Pandas
Aún no hay calificaciones
Análisis Estadístico con Python y Pandas
12 páginas
Estadística Descriptiva en Phyton
Aún no hay calificaciones
Estadística Descriptiva en Phyton
3 páginas
Agabriela - Arriaga - Unidad 3 - Actividad - 3 PROGRAMAS PARA EL ANÁLISIS ESTADÍSTICO
Aún no hay calificaciones
Agabriela - Arriaga - Unidad 3 - Actividad - 3 PROGRAMAS PARA EL ANÁLISIS ESTADÍSTICO
9 páginas
Analítica de Datos con Python: Estadísticos
Aún no hay calificaciones
Analítica de Datos con Python: Estadísticos
26 páginas
Curso de Análisis de Datos con Python
Aún no hay calificaciones
Curso de Análisis de Datos con Python
19 páginas
Medidas Estadísticas y Funciones en Matlab
Aún no hay calificaciones
Medidas Estadísticas y Funciones en Matlab
6 páginas
Análisis Exploratorio de Datos en Python
Aún no hay calificaciones
Análisis Exploratorio de Datos en Python
70 páginas
Guía Completa de NumPy y Regresión en Python
Aún no hay calificaciones
Guía Completa de NumPy y Regresión en Python
10 páginas
Guía de NumPy y Pandas para Análisis de Datos
Aún no hay calificaciones
Guía de NumPy y Pandas para Análisis de Datos
32 páginas
Uso de pd.cut en análisis de datos
Aún no hay calificaciones
Uso de pd.cut en análisis de datos
64 páginas
Herramientas de Análisis de Datos en Python
Aún no hay calificaciones
Herramientas de Análisis de Datos en Python
62 páginas
Funciones y Gráficos en Python
Aún no hay calificaciones
Funciones y Gráficos en Python
17 páginas
Análisis de Datos con Python y Pandas
Aún no hay calificaciones
Análisis de Datos con Python y Pandas
29 páginas
Tema 10 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 10 - Guia de Inteligencia Artificial
16 páginas
Análisis de Histogramas y Estadísticas en MATLAB
Aún no hay calificaciones
Análisis de Histogramas y Estadísticas en MATLAB
7 páginas
Estadística Descriptiva y Matlab en Práctica
Aún no hay calificaciones
Estadística Descriptiva y Matlab en Práctica
6 páginas
Repaso de Análisis de Datos en Pandas
Aún no hay calificaciones
Repaso de Análisis de Datos en Pandas
39 páginas
3 3.1.4.6 Lab - Descriptive Statistics in Python Mark
100% (1)
3 3.1.4.6 Lab - Descriptive Statistics in Python Mark
8 páginas
Chat GPT Python Ayuda
Aún no hay calificaciones
Chat GPT Python Ayuda
4 páginas
Una Cosa Ahi
Aún no hay calificaciones
Una Cosa Ahi
3 páginas
Pandas Numpy
Aún no hay calificaciones
Pandas Numpy
30 páginas
Unidad 2 Py
Aún no hay calificaciones
Unidad 2 Py
10 páginas
Introducción a Python y Pandas en UTEC
Aún no hay calificaciones
Introducción a Python y Pandas en UTEC
47 páginas
Introducción a Pandas en Python
Aún no hay calificaciones
Introducción a Pandas en Python
12 páginas
Técnicas Multivariantes Herramientas Ofimáticas
Aún no hay calificaciones
Técnicas Multivariantes Herramientas Ofimáticas
32 páginas
Guía de Análisis de Datos con Python
Aún no hay calificaciones
Guía de Análisis de Datos con Python
5 páginas
Curso Python para Análisis de Datos
Aún no hay calificaciones
Curso Python para Análisis de Datos
47 páginas
Instalación y Métodos de Matplotlib
Aún no hay calificaciones
Instalación y Métodos de Matplotlib
8 páginas
Tablas y Gráficos en R
Aún no hay calificaciones
Tablas y Gráficos en R
24 páginas
Laboratorio S10 - Colab
Aún no hay calificaciones
Laboratorio S10 - Colab
30 páginas
Tarea 01 Investigación Librerias
Aún no hay calificaciones
Tarea 01 Investigación Librerias
11 páginas
Exploración de Datos con Python y Pandas
Aún no hay calificaciones
Exploración de Datos con Python y Pandas
2 páginas
Unidad 3 Uso Libreria Pandas
Aún no hay calificaciones
Unidad 3 Uso Libreria Pandas
18 páginas
Uso de Numpy en Python para cálculos
Aún no hay calificaciones
Uso de Numpy en Python para cálculos
29 páginas
Presentacion Capitulo 5
Aún no hay calificaciones
Presentacion Capitulo 5
114 páginas
Pandas Cheatsheet
Aún no hay calificaciones
Pandas Cheatsheet
2 páginas
Estadística para Mantenimiento Industrial
Aún no hay calificaciones
Estadística para Mantenimiento Industrial
39 páginas
Símbolos y Conclusiones en Gráficos
Aún no hay calificaciones
Símbolos y Conclusiones en Gráficos
4 páginas
Técnicas de Ciencia de Datos en Python
Aún no hay calificaciones
Técnicas de Ciencia de Datos en Python
8 páginas
Análisis de Datos de Bicicletas Usadas
Aún no hay calificaciones
Análisis de Datos de Bicicletas Usadas
12 páginas
EDA Basico Con Python
Aún no hay calificaciones
EDA Basico Con Python
16 páginas
Preprocesamiento de Datos en Python
Aún no hay calificaciones
Preprocesamiento de Datos en Python
3 páginas
Análisis de Archivos CSV con Python
Aún no hay calificaciones
Análisis de Archivos CSV con Python
19 páginas
Estadísticas en R: Funciones y Ejemplos
Aún no hay calificaciones
Estadísticas en R: Funciones y Ejemplos
10 páginas
Visualización de Datos en Python
Aún no hay calificaciones
Visualización de Datos en Python
48 páginas
Gráficos y Análisis de Datos con Python
Aún no hay calificaciones
Gráficos y Análisis de Datos con Python
20 páginas
Apuntes
Aún no hay calificaciones
Apuntes
9 páginas
Estadística Básica e Introducción a R
Aún no hay calificaciones
Estadística Básica e Introducción a R
11 páginas
Introducción a Numpy y Pandas en Python
Aún no hay calificaciones
Introducción a Numpy y Pandas en Python
11 páginas
2.1. Introducción A Matplotlib
Aún no hay calificaciones
2.1. Introducción A Matplotlib
27 páginas
Proyecto - Numpy 2 en Python - Librerias - Usos - Ejemplos
Aún no hay calificaciones
Proyecto - Numpy 2 en Python - Librerias - Usos - Ejemplos
32 páginas
Apunte de Python
Aún no hay calificaciones
Apunte de Python
5 páginas
En Blanco 38
Aún no hay calificaciones
En Blanco 38
2 páginas
Portada Reporte Psicología
Aún no hay calificaciones
Portada Reporte Psicología
1 página
Rúbrica Proyecto Física IV
Aún no hay calificaciones
Rúbrica Proyecto Física IV
1 página
Reporte Psicológico TBI
Aún no hay calificaciones
Reporte Psicológico TBI
8 páginas
Formato Respuesta A Derecho de Peticion
Aún no hay calificaciones
Formato Respuesta A Derecho de Peticion
2 páginas
Guía Completa sobre Redes de Ordenadores
Aún no hay calificaciones
Guía Completa sobre Redes de Ordenadores
3 páginas
Redes: Balanceo, Redundancia y STP
Aún no hay calificaciones
Redes: Balanceo, Redundancia y STP
12 páginas
Ejercicios sobre Direccionamiento IP y Redes
Aún no hay calificaciones
Ejercicios sobre Direccionamiento IP y Redes
4 páginas
05 - Practica - 5 - 1 Packettracert Iot Smart Home
Aún no hay calificaciones
05 - Practica - 5 - 1 Packettracert Iot Smart Home
17 páginas
Herramientas Aula Virtual Escenario 1
Aún no hay calificaciones
Herramientas Aula Virtual Escenario 1
13 páginas
Manual de Usuario SIAPER en Línea
Aún no hay calificaciones
Manual de Usuario SIAPER en Línea
241 páginas
Indicadores de Gestión TIC en Invima
Aún no hay calificaciones
Indicadores de Gestión TIC en Invima
1 página
Base de Datos para Gestión de Personal
Aún no hay calificaciones
Base de Datos para Gestión de Personal
47 páginas
Guía de uso y activación de ClinicalKey
Aún no hay calificaciones
Guía de uso y activación de ClinicalKey
11 páginas
HDD Regenerator 2011: Descarga y Uso
Aún no hay calificaciones
HDD Regenerator 2011: Descarga y Uso
4 páginas
Gestión de Tareas en Microsoft Project
Aún no hay calificaciones
Gestión de Tareas en Microsoft Project
17 páginas
Lustrador Automático de Zapatos Clean Shoes
Aún no hay calificaciones
Lustrador Automático de Zapatos Clean Shoes
28 páginas
Licencia Sin Goce de Haber - MEMORANDO 2025
Aún no hay calificaciones
Licencia Sin Goce de Haber - MEMORANDO 2025
1 página
Fase2 - Bases de Datos
Aún no hay calificaciones
Fase2 - Bases de Datos
15 páginas
Guía Completa de Scrum para Proyectos Ágiles
Aún no hay calificaciones
Guía Completa de Scrum para Proyectos Ágiles
49 páginas
Ficha Técnica N15
Aún no hay calificaciones
Ficha Técnica N15
4 páginas
Criterios para Organizar Archivos de Gestión
Aún no hay calificaciones
Criterios para Organizar Archivos de Gestión
9 páginas
Redes de Computadoras Ii
Aún no hay calificaciones
Redes de Computadoras Ii
3 páginas
Hoja de Requerimiento
0% (1)
Hoja de Requerimiento
4 páginas
Guía de Uso de Lector eLibro
Aún no hay calificaciones
Guía de Uso de Lector eLibro
30 páginas
Extensión de Archivos Publisher
Aún no hay calificaciones
Extensión de Archivos Publisher
2 páginas
Recargas y Pines de Contenido en Colombia
Aún no hay calificaciones
Recargas y Pines de Contenido en Colombia
15 páginas
MAYA 1018 EV I696REV.2doc
92% (13)
MAYA 1018 EV I696REV.2doc
77 páginas
Reparar Una Memoria Extraible
Aún no hay calificaciones
Reparar Una Memoria Extraible
11 páginas
Bases de datos en plataformas digitales
Aún no hay calificaciones
Bases de datos en plataformas digitales
3 páginas
Clases de Direcciones IP
Aún no hay calificaciones
Clases de Direcciones IP
8 páginas
Requerimientos para Sistema de Empleados SENA
Aún no hay calificaciones
Requerimientos para Sistema de Empleados SENA
6 páginas
Introducción a Audacity y su uso en audio
Aún no hay calificaciones
Introducción a Audacity y su uso en audio
6 páginas
Introducción a la Criptografía Básica
Aún no hay calificaciones
Introducción a la Criptografía Básica
59 páginas