0% encontró este documento útil (0 votos)

300 vistas21 páginas

Manual Pandas

Pandas es una librería de Python diseñada para trabajar con datos tabulares a través de estructuras como Series y DataFrame. Proporciona herramientas para la creación, manipulación, acceso y análisis de datos, incluyendo métodos para gestionar datos faltantes y realizar transformaciones. Aunque este manual cubre funcionalidades comunes, Pandas ofrece una amplia gama de herramientas adicionales para el análisis de datos.

Cargado por

entera2013

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

300 vistas21 páginas

Manual Pandas

Cargado por

entera2013

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Pandas: Una librería de Python que proporciona

estructuras de datos como Series y DataFrame,

especialmente diseñadas para trabajar con datos
tabulares y heterogéneos. Además, proporciona
herramientas intuitivas para el análisis y la
manipulación de datos.
Estructura de datos en Pandas

Las dos estructura principales de pandas son: Series y DataFrame.

Series DataFrame
Es un objeto unidimensional de Se corresponde con una tabla de 2
estilo array, que contiene una dimensiones. Tiene un índice de fila y
secuencia de valores del mismo tipo otro de columna; se podría considerar
y un array asociado de etiquetas de como un diccionario de objetos Series
datos, correspondiente a su índice. que comparten todos el mismo índice.

Series A

index
DataFrame
index

data
Series B

index data

data
Creación de Series

import pandas as pd

Con un array Con un array de numpy

Con un diccionario de Python

Con algunos elementos de un diccionario

Con un escalar
Acceso a los elementos de una
Serie

Cada elemento de un objeto Series tiene un identificador único denominado

index label.

s["num4"] s.loc["num2"] s[0] s.iloc[3]

12 4 2 12
Por atributo Por posición

s[['num1','num2']] s[[2,3]]
Creación de un DataFrame

import pandas as pd

# Creación de un DataFrame inicializando con un diccionario

# Creación de un DataFrame inicializándolo con una lista de listas de Python

Las columnas e
índices deben
especificarse por
separado.
Acceso a los elementos de un
DataFrame

Indexación, selección, filtrado de las columnas de un DF

df["edad"] df[["edad","estatura"]] df["edad"]>40

df[df["edad"]>40]
Acceso a los elementos de un
DataFrame

Indexación, selección, filtrado de las filas de un DF

df.loc["Juan"] df.iloc[0] df.iloc[0:2]

df.loc[["Juan","Lucia"]]
Reindexación en un DataFrame

Reindexación de un DF

reindex puede alterar el

índice (fila), las
columnas o ambas cosas.

Las columnas se pueden reindexar con la palabra clave columns:

B
Métodos de ordenamiento en
Series y DataFrame

obj.sort_index() obj.sort_values()

Con un dataframe es posible ordenar por el índice de cada eje:

df.sort_index()
DF df.sort_index(axis="columns")

ordena alfabéticamente
Eliminación de ejes en un
DataFrame

Eliminación de un eje de un DF
Cargar, copiar y guardar un
DataFrame

Cargar un
DataFrame

# Copia del DataFrame df_ventas en df_copy

Copiar un
DataFrame

Nota: Al modificar un elemento de

df_copy no se modifica df_ventas

Guardar el DataFrame
como CSV y JSON
Métodos de información
general

info(): Permite obtener

una visión general del
contenido de un DF.

Columns: Retorna un objeto

DF index con los nombres de
todas las columnas del DF.

dtypes: Devuelve una Serie

con el tipo de dato de cada
columna.

df_ventas.info() df_ventas.columns

df_ventas.index df_ventas.shape
RangeIndex(start=0, stop=7, step=1) (7, 7)

df_ventas.head() Muestra los 5 primeros registros del DF

df_ventas.dtypes

df_ventas.tail() Muestra los 5 últimos registros del DF

Métodos estadísticos
descriptivos

Muestra un resumen estadístico

descriptivo, principalmente de las
columnas numéricas de un DF.
Valores únicos y recuentos de
valores

unique: Calcula un array de valores únicos.

value_counts: Devuelve valores únicos como

índice y frecuencias como valores.
Aplicación y asignación de
funciones

Con la función se esta multiplicando la

cantidad por el precio unitario Con la función se esta sumando 5 a
cada elemento de la columna cantidad
Modificaciones de un
DataFrame

# Añadir una nueva columna al DataFrame # Añadir una nueva columna calculada al DataFrame

# Añadir una nueva columna creando un DataFrame nuevo

# Eliminar una nueva columna del DataFrame nuevo

Nuevo DataFrame (df_new)

Gestión de datos faltantes en
un DataFrame

df_empleados.isna()
El método isna nos proporciona
una serie booleana con True,
donde los valores son nulos.
Gestión de datos faltantes en
un DataFrame

Filtrar datos faltantes

En un DataFrame, dropna En Series, dropna devuelve la serie solo

elimina por defecto cualquier fila que con los valores de datos e índice no
contiene un valor faltante. nulos.

df_empleados.dropna()
s.dropna() s[s.notna()]
Gestión de datos faltantes en
un DataFrame

Rellenado de datos ausentes

Se suele emplear el método fillna, el cual permite rellenar los “huecos” de

distintas maneras. Reemplaza los valores ausentes por otro valor indicado.

valor indicado

df.fillna(0)

df.fillna({1: 0.5, 2: 0.9}) # Imputación de datos utilizando las estadísticas de la media.

Transformación de datos

Método Replace Valor a reemplazar

Valor de
reemplazo

Método Rename

Replace mediante
listas o diccionarios
NOTA

Los temas abordados en este manual corresponden a

algunos de los métodos y funcionalidades que se suelen
emplear con mayor frecuencia en el análisis de datos con
pandas. Sin embargo, la librería pandas ofrece una
amplia variedad de herramientas adicionales que
pueden explorarse a mayor profundidad según las
necesidades de cada proyecto.

También podría gustarte

M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
Aún no hay calificaciones
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
55 páginas
M1 - Clase 04 - PANDAS
Aún no hay calificaciones
M1 - Clase 04 - PANDAS
50 páginas
01 - Librería Pandas
Aún no hay calificaciones
01 - Librería Pandas
43 páginas
Guía de Uso de Pandas para Ciencia de Datos
Aún no hay calificaciones
Guía de Uso de Pandas para Ciencia de Datos
41 páginas
Maneja y Analiza Datos Con DataFrames de Pandas y Python
Aún no hay calificaciones
Maneja y Analiza Datos Con DataFrames de Pandas y Python
3 páginas
Pandas Cheatsheet
Aún no hay calificaciones
Pandas Cheatsheet
2 páginas
Unidad 2 Manipulación de Datos Con Pandas
Aún no hay calificaciones
Unidad 2 Manipulación de Datos Con Pandas
34 páginas
Tema 11 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 11 - Guia de Inteligencia Artificial
13 páginas
Guía de Pandas para Análisis de Datos
100% (1)
Guía de Pandas para Análisis de Datos
67 páginas
Parte4 Pandas
Aún no hay calificaciones
Parte4 Pandas
36 páginas
Tema 10 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 10 - Guia de Inteligencia Artificial
16 páginas
Clase - Python 6 (24 - II)
Aún no hay calificaciones
Clase - Python 6 (24 - II)
29 páginas
Pandas y Python
100% (1)
Pandas y Python
24 páginas
Basecamp: Ciencia de Datos
Aún no hay calificaciones
Basecamp: Ciencia de Datos
45 páginas
5 - Pandas
Aún no hay calificaciones
5 - Pandas
41 páginas
Diapos Lenguaje
Aún no hay calificaciones
Diapos Lenguaje
21 páginas
Unidad 3 Uso Libreria Pandas
Aún no hay calificaciones
Unidad 3 Uso Libreria Pandas
18 páginas
PandasDFNotes Es
Aún no hay calificaciones
PandasDFNotes Es
20 páginas
Exploratorios Con Pandas
Aún no hay calificaciones
Exploratorios Con Pandas
33 páginas
ProgrammToolsPython 3 2 2021
Aún no hay calificaciones
ProgrammToolsPython 3 2 2021
21 páginas
Python PANDAS
Aún no hay calificaciones
Python PANDAS
10 páginas
FP Unidad 08 v4 20170417
Aún no hay calificaciones
FP Unidad 08 v4 20170417
45 páginas
Python y Pandas en Ciencia de Datos
Aún no hay calificaciones
Python y Pandas en Ciencia de Datos
11 páginas
Unidad 2 Py
Aún no hay calificaciones
Unidad 2 Py
10 páginas
Pandas: Guía Completa de Series y DataFrames
Aún no hay calificaciones
Pandas: Guía Completa de Series y DataFrames
26 páginas
"One - Trunc" "One": Fuera (7 9)
Aún no hay calificaciones
"One - Trunc" "One": Fuera (7 9)
131 páginas
Pandas: Guía para Analistas de Datos
Aún no hay calificaciones
Pandas: Guía para Analistas de Datos
45 páginas
Guía Adat Parcial 1
Aún no hay calificaciones
Guía Adat Parcial 1
10 páginas
Uso de pd.cut en análisis de datos
Aún no hay calificaciones
Uso de pd.cut en análisis de datos
64 páginas
Pandas
Aún no hay calificaciones
Pandas
53 páginas
Análitica de Datos 2
Aún no hay calificaciones
Análitica de Datos 2
6 páginas
Guía de Examen Final
Aún no hay calificaciones
Guía de Examen Final
39 páginas
Guía de referencia de Pandas
100% (1)
Guía de referencia de Pandas
2 páginas
Pandas
100% (5)
Pandas
172 páginas
Introducción a Pandas para Estudiantes
Aún no hay calificaciones
Introducción a Pandas para Estudiantes
10 páginas
Análisis de Datos con Pandas y Visualización
Aún no hay calificaciones
Análisis de Datos con Pandas y Visualización
23 páginas
Inteligencia Artificial y Ciencia de Datos - Data - Base
Aún no hay calificaciones
Inteligencia Artificial y Ciencia de Datos - Data - Base
21 páginas
Analytics 1 - Sesión 10
Aún no hay calificaciones
Analytics 1 - Sesión 10
180 páginas
Taller Pandas
Aún no hay calificaciones
Taller Pandas
15 páginas
Libreria de Pandas
Aún no hay calificaciones
Libreria de Pandas
5 páginas
Guía Completa de Pandas en Python
Aún no hay calificaciones
Guía Completa de Pandas en Python
12 páginas
S5-Tarea 2
Aún no hay calificaciones
S5-Tarea 2
9 páginas
FP Clase14
Aún no hay calificaciones
FP Clase14
26 páginas
05 Analisis de Datos Con Pandas
Aún no hay calificaciones
05 Analisis de Datos Con Pandas
32 páginas
Guía de pandas para análisis de datos
Aún no hay calificaciones
Guía de pandas para análisis de datos
115 páginas
Sesion 20221126
Aún no hay calificaciones
Sesion 20221126
20 páginas
Python y Pandas para Ciencia de Datos
Aún no hay calificaciones
Python y Pandas para Ciencia de Datos
7 páginas
Funciones Pandas
Aún no hay calificaciones
Funciones Pandas
4 páginas
Pandas-Principales Comandos
Aún no hay calificaciones
Pandas-Principales Comandos
28 páginas
Libreria Pandas Conceptos Basicos
Aún no hay calificaciones
Libreria Pandas Conceptos Basicos
4 páginas
Crear DataFrames en Python con Pandas
Aún no hay calificaciones
Crear DataFrames en Python con Pandas
79 páginas
Análisis y Visualización de Datos Usando Python - Comenzando Con Datos
Aún no hay calificaciones
Análisis y Visualización de Datos Usando Python - Comenzando Con Datos
15 páginas
Ev2 Eq4 Reporte Tecnico Sobre Analisis de Datos Con Pandas
Aún no hay calificaciones
Ev2 Eq4 Reporte Tecnico Sobre Analisis de Datos Con Pandas
20 páginas
Análisis de Datos con Pandas en Python
Aún no hay calificaciones
Análisis de Datos con Pandas en Python
11 páginas
Clase 21 - Manejo de Archivos Reales
Aún no hay calificaciones
Clase 21 - Manejo de Archivos Reales
63 páginas
Tipos y Ejemplos de Antivirus
Aún no hay calificaciones
Tipos y Ejemplos de Antivirus
7 páginas
Manejo de Inventarios en gamaSAB
Aún no hay calificaciones
Manejo de Inventarios en gamaSAB
3 páginas
Configuración SSH, FTP y HTTP
Aún no hay calificaciones
Configuración SSH, FTP y HTTP
23 páginas
Insertar Multimedia en Presentaciones
Aún no hay calificaciones
Insertar Multimedia en Presentaciones
5 páginas
Plantilla Inventario de Activos
Aún no hay calificaciones
Plantilla Inventario de Activos
7 páginas
Prueba Técnica de Desarrollo - Resuelto
Aún no hay calificaciones
Prueba Técnica de Desarrollo - Resuelto
8 páginas
Matriculacion Al Curso Autoasistido para Miembros de Comité Hospitalario de Bioética
Aún no hay calificaciones
Matriculacion Al Curso Autoasistido para Miembros de Comité Hospitalario de Bioética
6 páginas
¿Por Qué Es Mejor Realme C71 Vs OPPO A79 4G
Aún no hay calificaciones
¿Por Qué Es Mejor Realme C71 Vs OPPO A79 4G
1 página
Reporte de Laboratorio Microprocesador 8086 PDF
Aún no hay calificaciones
Reporte de Laboratorio Microprocesador 8086 PDF
10 páginas
Plan Estudio Completo Control SCADA
Aún no hay calificaciones
Plan Estudio Completo Control SCADA
2 páginas
Manual de Administración del Sistema Farmacia
Aún no hay calificaciones
Manual de Administración del Sistema Farmacia
7 páginas
Guía Básica de Word para Principiantes
Aún no hay calificaciones
Guía Básica de Word para Principiantes
20 páginas
Manual Autocad 2020
100% (1)
Manual Autocad 2020
33 páginas
Campamento Programación Santanderes
Aún no hay calificaciones
Campamento Programación Santanderes
25 páginas
Glab s03 Lsanchez 2025 01 (1) Terminado
Aún no hay calificaciones
Glab s03 Lsanchez 2025 01 (1) Terminado
10 páginas
Python en Análisis de Industria Eléctrica
Aún no hay calificaciones
Python en Análisis de Industria Eléctrica
14 páginas
38 - Solicitud Concepto de Norma Urbanística
Aún no hay calificaciones
38 - Solicitud Concepto de Norma Urbanística
2 páginas
11.1.3.4 Lab - Work With Task Manager
Aún no hay calificaciones
11.1.3.4 Lab - Work With Task Manager
4 páginas
Antología Computación IV
Aún no hay calificaciones
Antología Computación IV
58 páginas
Mi Tentación de Angy Skay (2021) - LEER LIBROS ONLINE GRATIS
25% (4)
Mi Tentación de Angy Skay (2021) - LEER LIBROS ONLINE GRATIS
10 páginas
Comandos Linux Canaima
Aún no hay calificaciones
Comandos Linux Canaima
3 páginas
Currículum Vitae de Tony Rios Jipa
Aún no hay calificaciones
Currículum Vitae de Tony Rios Jipa
2 páginas
Error de Software
Aún no hay calificaciones
Error de Software
3 páginas
Plab S06 Jperez 2025 02
Aún no hay calificaciones
Plab S06 Jperez 2025 02
2 páginas
Planificacion Anual LT 1 Año
100% (1)
Planificacion Anual LT 1 Año
2 páginas
Pensum Ingenieria Ciencias de La Computacion (PUCMM)
Aún no hay calificaciones
Pensum Ingenieria Ciencias de La Computacion (PUCMM)
5 páginas
Avance de Trabajo Final 3
Aún no hay calificaciones
Avance de Trabajo Final 3
33 páginas
Examen Básico de Computación para Adultos
100% (1)
Examen Básico de Computación para Adultos
6 páginas
Procedimiento para Cambios de Reservaciones
Aún no hay calificaciones
Procedimiento para Cambios de Reservaciones
4 páginas
Guía de Etiquetas HTML5 y CSS
Aún no hay calificaciones
Guía de Etiquetas HTML5 y CSS
10 páginas