Pandas Cheatsheet

El documento es una guía sobre el uso de la biblioteca Pandas en Python, que incluye métodos para crear, ordenar, agrupar y limpiar DataFrames, así como realizar operaciones estadísticas y lógicas. También se abordan transformaciones avanzadas, selección de datos, exportación y visualización gráfica. Se presenta un resumen de funciones y métodos esenciales para trabajar con datos en Pandas.

Cargado por

Miyagi San

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

21 vistas2 páginas

Pandas Cheatsheet

Cargado por

Miyagi San

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Creación Ordenación Agrupaciones

# Métodos comunes para crear DataFrames y atributos habituales # Ordenación de valores e índices # Permite agrupar los datos y aplicar funciones
# También se pueden utilizar cualquiera de las funciones de estadística
[Link](dict) # Desde diccionario sd.sort_values() # Ordena los valores
pd.read_csv(file) # Desde un csv sd.sort_index() # Ordena el índice [Link]() # Agrupa datos por un criterio
pd.read_excel(file) # Desde un excel [Link](func) # Aplica una función a los datos sobre el eje que indiquemos
pd.read_json(json) # Desde un json
[Link](lambda x: x*2) # Aplica una operación a todos los elementos del DataFrame
pd.read_html(uri) # Desde una web
pd.read_sql(sql) # Desde una base de datos Consulta de datos [Link]() # Crea ventanas que se desplazan para el procesamiento de los datos
pd.read_clipboard() # Desde el portapapeles # Obtener información de los datos almacenados [Link](func) # Agrega los datos aplicando la función del parámetro
pd.read_table(file) # Desde un archivo delimitado tsv
[Link](func) # Devuelve una serie/Dataframe después de aplicarle la función
pd.read_parquet() # Desde un archivo en formato parquet pd.read_gbg
[Link]() # Selecciona filas al azar. [Link](func) # Permite encadenar llamadas a funciones
Se pueden indicar % o número de filas/columnas [Link](periods) # Crea una ventana creciente con los periodos que indiquemos
[Link](list) # Devuelve un Dataframe que indica si cada celda contiene
Limpieza de datos alguno de los elementos que se pasan
[Link](expresion) # Permite obtener una parte del Dataframe a partir
# Ayudan a identificar datos inválidos de una expresión. Funciones estadísticas
Se puede conseguir algo similar con df[]
# Funciones que nos permiten calcular la estadística sobre columnas
[Link](obj) # Detecta los valores inválidos en un array [Link](list|expr) # Filtra las columnas a mostrar.
# o DataFrames completos
[Link](obj) # Detecta los nulos en un array Se puede utilizar o una lista o una expresión regular
[Link](obj) # Detecta los valores válidos en un array [Link](n=5) # Obtiene el comienzo del Dataframe.
[Link](obj) # Detecta todos los valores no nulos en un array Se pueden indicar el número de filas. [Link]() # Calcula la suma total
[Link](obj) # Devuelve un array con valores únicos. También existe para [Link](n=5) # Obtiene el final del Dataframe. [Link]() # Calcula el número de elementos
series ([Link]()) e índices ([Link]()), y variaciones Se puede indicar el número de filas [Link]() # Calcula el valor máximo
(nuinique, is_unique) [Link](cond) # Es equivalente a df[cond] pero devolviendo un Dataframe [Link]() # Calcula el valor mínimo
[Link] # Informa si la serie tiene NA con la misma forma que el original [Link]() # Calcula la desviación típica
[Link]() # Elimina los valores inválidos [Link]() # Iterador perezoso de elementos. Equivalente a [Link]() [Link]() # Calcula la media
[Link](val) # Rellena los valores inválidos [Link]() # Devuelve el primer elemento de la Serie [Link]() # Calcula la mediana
[Link]() # Interpola los valores según distintos métodos [Link]() # Columnas del objeto sr.value_counts() # Calcula los valores que hay de cada tipo
sd.drop_duplicates() # Elimina los duplicados [Link](item) # Elimina un elemento del conjunto y lo devuelve [Link]() # Devuelve una Serie con el valor absoluto de cada elemento
[Link]() # Máscara con los duplicados [Link](sr) # Calcula la covarianza con otro objeto.
sr.is_monotonic # Indica si es una progresión creciente/decreciente El parámetro es obligatorio en las Series
[Link]() # Devuelve los índices de los elementos que no son cero [Link](sr) # Calcula la correlación con otro objeto.
[Link]() # Elimina las filas o columnas del objeto Operadores Binarios El parámetro es obligatorio sólo en las Series
[Link]() # Devuelve la media de la desviación absoluta de los valores
# Son operaciones entre 2 Series o DataFrames
[Link](n,col) # Devuelve los N elementos más altos.
En el DataFrame hay que indicar la columna
Operadores lógicos [Link](sd) # Suma a nivel de elemento [Link](n, col) # Devuelve los N elementos más pequeños.
# Operadores lógicos para usar en cualquier expresión booleana [Link](sd) # Resta a nivel de elemento En el DataFrame hay que indicar la columna
[Link](sd) # Multiplicación a nivel de elemento sd.pct_change() # Devuelve la Serie con los cambios porcentuales
[Link](sd) # División a nivel de elemento [Link]() # Rango de elementos
& # And [Link](sd) # Módulo a nivel de elemento [Link]() # Suma acumulada
| # Or [Link](sd) # Potencia a nivel de elemento [Link]() # Máximo acumulado
~ # Not [Link](sd,func) # Combina 2 objetos aplicando la función a sus elementos [Link]() # Mínimo acumulado
^ # Xor [Link]() # Redondea con el número de decimales que indiquemos [Link]() # Producto acumulado
[Link]() # Any [Link]() # Operador lógico < [Link]() # Devuelve un elemento en el percentil indicado
[Link] # All [Link]() # Operador lógico >
[Link]() # Operador lógico <=
[Link]() # Operador lógico >=
Selección [Link]() # Operador lógico != Modificación
[Link]() # Operador lógico ==
[Link]() # Devuelve el producto de sus valores según el eje que indiquemos # Permite modificar nuestros elementos
# Selecciona contenido del DataFrame
[Link](sd) # Devuelve el producto matricial
[Link][row_indexer,column_indexer] # Selecciona por índices de filas y columnas [Link]() # Permite cambiar el nombre o las etiquetas del índice
[Link][row_indexer,column_indexer] # Selecciona por etiquetas [Link](to_replace) # Reemplaza los valores de panda según el parámetro
[Link][row,column] # Método análogo a iloc para obtener un valor concreto Exportación [Link](sd) # Actualiza los valores según el objeto del parámetro
[Link][row,column] # Método análogo a loc para obtener un valor concreto [Link]() # Desplazamos los valores tantas posiciones como indiquemos
df[] # Permite mezclar las selecciones y realizar filtrados # Permite exportar los datos a un fichero
(por defecto 1)

sd.to_excel() # En formato excel

Transformaciones avanzadas df.to_csv() # En formato csv
Metainformación
# Transformaciones de las Series/DataFrames sd.to_dict() # En formato diccionario python
sd.to_json() # En formato json # Nos da información sobre el modelo que estamos manejando
sd.to_sql(tab, con) # A una base de datos indicando tabla y cadena de conexión
[Link](df) # Descompone un Dataframe, según la columnas que digamos sd.to_string() # En formato cadena de texto
[Link](index,col,val) # Crea una tabla auxiliar a partir de 3 columnas sd.to_clipboard() # Al portapapeles [Link] # Etiquetas del índice
pd.pivot_table(df) # Crea una tabla auxiliar con el DataFrame. Series.to_latex() # En formato latex [Link] # ndarray con los valores
Guarda los distintos niveles de la tabla con un índice múltiple. [Link] # Informa del tipo de datos de la Serie. Es equivalente a [Link]
También disponible en la clase DataFrame [Link] # Informa del número de filas de la Serie. También se pueda usar
[Link](left, right) # Fusiona 2 DataFrames como si fuera un join de base de datos.
También disponible en la clase DataFrame Gráficas con DataFrame y devuelve filas y columnas
[Link] # Número de elementos
[Link]() # Nos permite utilizar un índice con nuevas etiquetas # Permiten obtener gráficos de los datos del DataFrame [Link] # Puntero a los datos
[Link](obj) # Fusiona las columnas de 2 DataFrames en base a una clave/columna [Link] # Nombre de la Serie
[Link](to_append) # Añade más columnas al DataFrame [Link](indices,values) # Efectúa un put sobre los índices con los values suministrados
[Link](rule) # Permite realizar un remuestro en función del tiempo [Link]() # Gráfico
[Link](obj) # Concatena pandas en el eje que se decida [Link]() # Histograma de los datos
Pandas cheatsheet V1 - ene. 2019

Inicialización Selección Manejo de tablas

# Para usar pandas sólo se requiere importar la librería [Link][2, 2] [Link][pd.to_datetime('2018/01/01'), ['B', 'C']]

import pandas as pd
Melt
# En esta guía utilizaremos 4 posibles notaciones:
# pd : Aplica a la librería de pandas
df2
# df : Aplica únicamente a dataframes
# sr : Aplica a series (pueden ser series únicas o columnas de un DataFrame)
first last height weight
# sd : Aplica tanto a series como DataFrames
0 John Doe 5.5 130
# En todos los ejemplos salvo que se diga lo contrario pondremos únicamente
los atributos obligatorios 1 Mary Bo 6.0 150

Series [Link][0, 2] [Link][pd.to_datetime('2018/01/03'), ['C']

sr1 = [Link](['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']) [Link](id_vars=['first', 'last'])

first last variable value

Índice Valor
0 John Doe height 5.5
0 a
1 Mary Bo height 6.0
1 b
2 John Doe weight 130
2 c
3 Mary Bo weight 150
3 d

4 e
df1[df1.C >'i'] [Link](n=4)
5 f

6 g Pivot
7 h

8 i
df3
9 j
foo bar baz zoo

DataFrame 0 one A 1 x
1 one B 2 y
df1 = [Link]({'A': range(0, 50, 5),
'B': 10**2, 2 one C 3 z
'C': sr_a.values}, [Link](['a', 'b', 'g', 'h', 'i', 100]) [Link](df1.C>'c') q
3 two A 4
index=pd.date_range(start='2019-01-01', freq="D", periods=10))
4 two B 5 w
5 two C 6 t
Índice A B C

2019-01-01 0 100 a

2019-01-02 5 100 b

2019-01-03 10 100 c

2019-01-04 [Link](index='foo', columns='bar', values='baz')

15 100 d

2019-01-05 20 100 e
[Link]("'a'< C <'d'") [Link](items=['A', 'C']) bar A B C
2019-01-06 25 100 f foo

2019-01-07 30 100 g one 1 2 3

two 4 5 6
2019-01-08 35 100 h

2019-01-09 40 100 i

2019-01-10 45 100 j

También podría gustarte

Guía de Uso de Pandas para Ciencia de Datos
Aún no hay calificaciones
Guía de Uso de Pandas para Ciencia de Datos
41 páginas
01 - Librería Pandas
Aún no hay calificaciones
01 - Librería Pandas
43 páginas
M1 - Clase 04 - PANDAS
Aún no hay calificaciones
M1 - Clase 04 - PANDAS
50 páginas
Uso de pd.cut en análisis de datos
Aún no hay calificaciones
Uso de pd.cut en análisis de datos
64 páginas
Inteligencia Artificial y Ciencia de Datos - Data - Base
Aún no hay calificaciones
Inteligencia Artificial y Ciencia de Datos - Data - Base
21 páginas
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
Aún no hay calificaciones
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
55 páginas
Clase - Python 6 (24 - II)
Aún no hay calificaciones
Clase - Python 6 (24 - II)
29 páginas
Guía de Examen Final
Aún no hay calificaciones
Guía de Examen Final
39 páginas
Guía de referencia de Pandas
100% (1)
Guía de referencia de Pandas
2 páginas
Guía de Pandas para Análisis de Datos
100% (1)
Guía de Pandas para Análisis de Datos
67 páginas
Manual Pandas
Aún no hay calificaciones
Manual Pandas
21 páginas
Unidad 3 Uso Libreria Pandas
Aún no hay calificaciones
Unidad 3 Uso Libreria Pandas
18 páginas
Tema 10 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 10 - Guia de Inteligencia Artificial
16 páginas
Análisis de Datos con Pandas y Visualización
Aún no hay calificaciones
Análisis de Datos con Pandas y Visualización
23 páginas
PandasDFNotes Es
Aún no hay calificaciones
PandasDFNotes Es
20 páginas
Unidad 2 Manipulación de Datos Con Pandas
Aún no hay calificaciones
Unidad 2 Manipulación de Datos Con Pandas
34 páginas
Basecamp: Ciencia de Datos
Aún no hay calificaciones
Basecamp: Ciencia de Datos
45 páginas
EDA Basico Con Python
Aún no hay calificaciones
EDA Basico Con Python
16 páginas
Parte4 Pandas
Aún no hay calificaciones
Parte4 Pandas
36 páginas
LEARNING
Aún no hay calificaciones
LEARNING
78 páginas
Guía de Proyecto con Anaconda y Pandas
Aún no hay calificaciones
Guía de Proyecto con Anaconda y Pandas
5 páginas
Diapos Lenguaje
Aún no hay calificaciones
Diapos Lenguaje
21 páginas
Tema 11 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 11 - Guia de Inteligencia Artificial
13 páginas
Python y Pandas para Ciencia de Datos
Aún no hay calificaciones
Python y Pandas para Ciencia de Datos
7 páginas
Pandas
100% (5)
Pandas
172 páginas
Funciones Pandas
Aún no hay calificaciones
Funciones Pandas
4 páginas
Introducción a Dataframes en Pandas
Aún no hay calificaciones
Introducción a Dataframes en Pandas
9 páginas
Sesion 20221126
Aún no hay calificaciones
Sesion 20221126
20 páginas
Guía Completa de Pandas en Python
Aún no hay calificaciones
Guía Completa de Pandas en Python
12 páginas
Pandas y Python
100% (1)
Pandas y Python
24 páginas
Analytics 1 - Sesión 10
Aún no hay calificaciones
Analytics 1 - Sesión 10
180 páginas
Comenzando Con Pandas y Numpy
Aún no hay calificaciones
Comenzando Con Pandas y Numpy
11 páginas
Unidad 2 Py
Aún no hay calificaciones
Unidad 2 Py
10 páginas
Python PANDAS
Aún no hay calificaciones
Python PANDAS
10 páginas
Guía Completa de Análisis de Datos Con Python
Aún no hay calificaciones
Guía Completa de Análisis de Datos Con Python
16 páginas
Bootcamp Inteligencia Artificial Nivel Explorador
Aún no hay calificaciones
Bootcamp Inteligencia Artificial Nivel Explorador
62 páginas
Gestión de Analítica de Datos Empresarial
Aún no hay calificaciones
Gestión de Analítica de Datos Empresarial
50 páginas
Parcial N2
Aún no hay calificaciones
Parcial N2
4 páginas
Limpieza Python
Aún no hay calificaciones
Limpieza Python
2 páginas
Curso Python para Análisis de Datos
Aún no hay calificaciones
Curso Python para Análisis de Datos
47 páginas
Clase 3 Numpy Pandas
Aún no hay calificaciones
Clase 3 Numpy Pandas
16 páginas
Exploratorios Con Pandas
Aún no hay calificaciones
Exploratorios Con Pandas
33 páginas
Análitica de Datos 2
Aún no hay calificaciones
Análitica de Datos 2
6 páginas
Informe Fundamentos de La Manipulación de Datos en Python Con NumPy y Pandas
Aún no hay calificaciones
Informe Fundamentos de La Manipulación de Datos en Python Con NumPy y Pandas
7 páginas
ProgrammToolsPython 3 2 2021
Aún no hay calificaciones
ProgrammToolsPython 3 2 2021
21 páginas
Clase 01
Aún no hay calificaciones
Clase 01
18 páginas
Python para Minería de Datos
Aún no hay calificaciones
Python para Minería de Datos
23 páginas
Pandas
Aún no hay calificaciones
Pandas
53 páginas
PYTHON
Aún no hay calificaciones
PYTHON
34 páginas
1.4.1 Manejo de Python
Aún no hay calificaciones
1.4.1 Manejo de Python
23 páginas
Cheat Sheet de Pandas para Data Wrangling
Aún no hay calificaciones
Cheat Sheet de Pandas para Data Wrangling
2 páginas
Maneja y Analiza Datos Con DataFrames de Pandas y Python
Aún no hay calificaciones
Maneja y Analiza Datos Con DataFrames de Pandas y Python
3 páginas
Python y Pandas en Ciencia de Datos
Aún no hay calificaciones
Python y Pandas en Ciencia de Datos
11 páginas
Conceptos Introducción Ciencia de Datos
Aún no hay calificaciones
Conceptos Introducción Ciencia de Datos
4 páginas
Pandas: Guía Completa de Series y DataFrames
Aún no hay calificaciones
Pandas: Guía Completa de Series y DataFrames
26 páginas
Manual de Programacion Microbit PDF
0% (1)
Manual de Programacion Microbit PDF
34 páginas
Manual de Programacion Microbit PDF
0% (1)
Manual de Programacion Microbit PDF
34 páginas
John Chappell - Método de Guitarra Heavy Metal - Nivel 2
100% (4)
John Chappell - Método de Guitarra Heavy Metal - Nivel 2
58 páginas
Audiobox USD Owners Manual
Aún no hay calificaciones
Audiobox USD Owners Manual
64 páginas
Chuleta Guitarra
Aún no hay calificaciones
Chuleta Guitarra
2 páginas
Triptico de Ejercicios Funcionales
0% (1)
Triptico de Ejercicios Funcionales
2 páginas
Nihms 564241
Aún no hay calificaciones
Nihms 564241
33 páginas
Acta de Entrega de Constancias A Participantes
Aún no hay calificaciones
Acta de Entrega de Constancias A Participantes
3 páginas
Prioridades Sociales en Chile 1980
Aún no hay calificaciones
Prioridades Sociales en Chile 1980
2 páginas
Instrumentos de Laboratorio y Funciones
Aún no hay calificaciones
Instrumentos de Laboratorio y Funciones
3 páginas
Real Decreto 2531/1985, de 18 Diciembre
Aún no hay calificaciones
Real Decreto 2531/1985, de 18 Diciembre
5 páginas
Percepcion de Seguridad en La Region Caribe
Aún no hay calificaciones
Percepcion de Seguridad en La Region Caribe
63 páginas
Guión Teoria Del Caso
100% (1)
Guión Teoria Del Caso
5 páginas
HDS Grasa Chasis
Aún no hay calificaciones
HDS Grasa Chasis
8 páginas
Lixiviación Bacteriana: Thiobacillus Acidophilus
Aún no hay calificaciones
Lixiviación Bacteriana: Thiobacillus Acidophilus
11 páginas
Análisis STC 80/1982: Herencia y Filiación
Aún no hay calificaciones
Análisis STC 80/1982: Herencia y Filiación
1 página
Capacidad y Peso 4º Primaria
Aún no hay calificaciones
Capacidad y Peso 4º Primaria
5 páginas
Orden Semanal 008 Décimo Tercera Brigada
Aún no hay calificaciones
Orden Semanal 008 Décimo Tercera Brigada
8 páginas
Menù Maravilla
Aún no hay calificaciones
Menù Maravilla
8 páginas
Aponeurosis del Miembro Superior
Aún no hay calificaciones
Aponeurosis del Miembro Superior
6 páginas
Glosario Del Martín Fierro
50% (2)
Glosario Del Martín Fierro
14 páginas
Lección 1 - Bases de Datos No Relacionales
Aún no hay calificaciones
Lección 1 - Bases de Datos No Relacionales
8 páginas
2.1 Cultura y Clima Organizacional
Aún no hay calificaciones
2.1 Cultura y Clima Organizacional
18 páginas
Patronaje de Pantalones Femeninos
100% (2)
Patronaje de Pantalones Femeninos
16 páginas
Tarea - Nº 1 - Campos Morales Jaime Luis
Aún no hay calificaciones
Tarea - Nº 1 - Campos Morales Jaime Luis
4 páginas
Guía 9° Inglés - Ciclo 7
Aún no hay calificaciones
Guía 9° Inglés - Ciclo 7
8 páginas
Saberes Pre-Filosóficos
Aún no hay calificaciones
Saberes Pre-Filosóficos
5 páginas
Catálogo de Cursos para Talleres Mecánicos
Aún no hay calificaciones
Catálogo de Cursos para Talleres Mecánicos
3 páginas
Lista de Verificación Grafadora ITACA
Aún no hay calificaciones
Lista de Verificación Grafadora ITACA
4 páginas
Demanda Cambio de Nombre Estrella Mamani
Aún no hay calificaciones
Demanda Cambio de Nombre Estrella Mamani
9 páginas
Ejemplo Excepción Dilatoria Ineptitud Del Líbelo
100% (2)
Ejemplo Excepción Dilatoria Ineptitud Del Líbelo
3 páginas
Evaluación Sensorial de Textura Alimentaria
Aún no hay calificaciones
Evaluación Sensorial de Textura Alimentaria
6 páginas
Acta Descargos Rocio Noviembre 21 de 2023
Aún no hay calificaciones
Acta Descargos Rocio Noviembre 21 de 2023
3 páginas
Reficar Exposicion
Aún no hay calificaciones
Reficar Exposicion
36 páginas
Codigo Municipal
100% (1)
Codigo Municipal
24 páginas