0% encontró este documento útil (0 votos)

28 vistas10 páginas

Julenx Python Pandas

Cargado por

josefchamo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

28 vistas10 páginas

Julenx Python Pandas

Cargado por

josefchamo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Python pandas Cheat Sheet

by julenx via [Link]/168626/cs/35356/

Fijar el estilo gráfico de seaborn por defecto Operaciones básicas con series (cont) Selección de datos en dataframes (cont)

[Link]() [Link] Ventas["D"] = [Link]ies(list, index = list )

nos devuelve el tamaño de la serie Si asignamos a una columna una serie
Operaciones básicas con series pandas se consideran los índices del
s = [Link]ies(d, index = list)
s = [Link]ies(list, index = list) dataframe y de la serie, haciendo
Crear serie a partir de un diccionario,
coincidir los valores cuyos índices sean
Crear serie. Si en vez de una serie se pero especificando nosotros el índice. Si
los mismos en ambas estructuras (si
introduce un escalar, todas las filas hay valores que no pertenezcan diccio‐
dicha columna no existe, se crea). En el
tendrán ese valor. nario, se añaden con un valor NaN:
caso de que haya valores en la serie con
s = [Link]ies(d)
índices que no se encuentren en el
Crear serie a partir de un diccionario Aplicación de funciones estadísticas
dataframe, se descartan. Y en el caso
s[n] data.mean() de que haya índices en el dataframe que
.podemos calcular el valor medio de los no se encuentren en la serie, se asigna
Extraer elemento con el índice implícito
datos un valor NaN.
de la serie. Si los índices asignados son
números entero, el índice implícito data.mean(level = "Year") del(Ventas["A"])
queda desactivado Borrar columna. Con la notación
si especificamos el nivel al que
s["name"] queremos aplicarlo, el DataFrame se Ventas.A no es posible crear nuevas
agrega según los valores de dicho nivel columnas ni eliminarlas
Extraer elemento con el nombre del
índice antes de realizar la operación Ventas[2:4]

[Link] El uso de un rango numérico entre los

Selección de datos en dataframes corchetes realiza una selección de filas
Extraer elemento con el nombre del
Ventas["B"]["feb"] Ventas["feb":"may"]
índice
podemos utilizar la sintaxis de los diccio‐ vemos en el resultado anterior que se
[Link]
narios para seleccionar la columna "B":. devuelven las filas entre el primer valor
Tipo de datos en la serie
Esto significa que podemos realizar una del rango (incluido) y el último (sin
[Link] selección en dicho resultado para, por incluir). aunque en este caso la
Consultar índice de la serie ejemplo, extraer el valor correspon‐ selección incluye tanto la fila correspon‐
diente a febrero: diente a la primera etiqueta como la fila
[Link]
Ventas["B"] = [-1, -2, -3, -4, -5] correspondiente a la segunda.
Nos da acceso "a los ejes" (a los
índices) Si, una vez seleccionada una columna, tips[["tip", "day"]]
le asignamos una lista o array (o serie) Si situamos entre los corchetes una lista
[Link]
de valores de la misma longitud, de etiquetas, estaremos seleccionando
Consultar valores de la serie estamos modificando dicha columna del columnas en el orden en el que
[Link] dataframe: aparecen en la lista y con formato
Consultar o cambiar nombre de la serie. Ventas["C"] = 0 dataframe
Por defecto, está vacío Si asignamos un único valor escalar, [Link]("name")
[Link][Link] este se propaga por toda la columna: extrae la columna indicada devolviendo
Consultar o cambiar nombre del índice un valor alternativo (por defecto None) si
de la serie. Por defecto, está vacío dicha columna no existe:

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 1 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Selección de datos en dataframes (cont) Selección de datos en dataframes (cont) Multi-índices por producto cartesiano de
arrays
[Link]c["may"] [Link]c[[5, 3], [Link]umns.get_indexer(["C", "‐
Seleccionar filas siempre por etiqueta. A"])]
Acepta listas. obtener de las filas 5 y 3 (en este orden)
los valores correspondientes a las
[Link]c[["feb"]]
columnas C y A (en este orden)
Selecciona fila y la devuelve en formato
dataframe. Si hay varias en la lista, se df[[Link] > n]
devuelve un dataframe con esa Selección con booleanos. También
selección. Admite rangos. funcionaría [Link]c[d[Link] > n] o con
[Link]oc[([Link] > n).values] (expli‐
[Link]c["may", "C"]
cación en la sección de series)
Extraer un único valor por fila y columna.
Admite rangos como [Link][:, "A"] [Link]ple(n, random_state = ..., axis = ...,
frac=...)
[Link]c[["may", "ene"], "B"]
Al igual que ocurre con las series,
seleccionar la intersección de las filas e
también los dataframes tienen un
y c (en este orden) y la columna B
método que permite extraer elementos
[Link][n] del mismo de forma aleatoria. Este `index = [Link]tiIndex.from_product(´
Selección por posición de fila. Mismas método permite especificar el número [
funcionalidades que iloc. de elementos a extraer (o el porcentaje [2018, 2019],
respecto del total, parámetros n y frac, ["Spain", "Portugal", "‐
[Link]lumns.get_loc("B")
respectivamente), si la extracción se France"]
Obtiene el índice de la columna con esa
realiza con reemplazo o no (parámetro ],
etiqueta.
replace), los pesos a aplicar a los names = ["Year", "Country"]
[Link]lumns.get_indexer(["A", "C"]) elementos para realizar una extracción )
Obtiene el índice de columnas con esas aleatoria ponderada (parámetro weights)
etiquetas. Devuelve un array y una semilla para el generador de data = [Link]aFrame(data =
números aleatorios que asegure la
[Link][Link]t_loc("feb") [18, 20, 10, 15, 12, 18], index
reproducibilidad de la extracción
= index, columns = ["Sales"])
Obtiene el índice de la fila con esa (parámetro random_state). También es
etiqueta. posible indicar el eje a lo largo del cual
Multi-indexación
[Link][Link]t_indexer(["feb", "abr"]) se desea realizar la extracción (por
defecto se extraen filas, correspondiente
Obtiene el índice de filas con esas
al eje 0)
etiquetas. Devuelve un array
s = [Link]("col")
[Link]oc[Ven[Link][Link]t_loc("feb"), 2]
extrae y elimina una columna de un
extraer del anterior dataframe el dato
dataframe
que ocupa la fila "feb" y la columna de
índice 2

index = [Link]tiIndex.from‐
_arrays(
[
[2018, 2018, 2018, 2019, 2019,
2019],
["Spain", "UK", "Fra‐
nce", "Spain", "UK", "Fra‐
nce"]
],
names = ["Year", "Country"]
)

data = [Link]aFrame(
data = [18, 20, 10, 15, 12,
18],
index = index, columns = ["Sa‐
les"])

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 2 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Operaciones entre dataframes y series Agrupaciones Métodos de agregación estadística

df + s [Link]pby(by = fun).mean() [Link]cribe()

Se suman los valores de una serie a A groupby operation involves some información estadística sobre los valores
todas las columnas (en todas las filas) combination of splitting the object, contenidos
cuyos valores coindicen con las applying a function, and combining the
[Link]()
etiquetas de la serie. Si la serie tiene results. This can be used to group large
Devuelve la media aritmética de los
índices cuyas columnas no existen en el amounts of data and compute operations
valores del dataframe a lo largo de un
df, se añaden con el valor NaN en todas on these groups
determinado eje (eje 0 -vertical- por
las filas.
[Link]pby(by = d).mean() defecto)
[Link](s, axis = 0) [Link]pby(level = 0).mean()
[Link]taFrame.median
[Link]upby(by = "col").mean()
Aplicación de funciones y mapeado [Link]taFram[Link]
[Link]upby(by = ["Categoría", "Produc‐
[Link]taFram[Link]
[Link]y(fun)
to"]).mean()
Devuelve la desviación estándar de los
permite aplicar a cada uno de los
[Link]oupby(level = 0).mean()
valores del dataframe a lo largo de un
elementos de la serie una función. Ésta
Según las etiquetas del índice. determinado eje
deberá aceptar un único valor como
argumento y devolver también un único [Link]ot_table(index = "foo", columns = "‐ [Link]taFram[Link]
valor bar", values = "baz")
[Link]_change()
[Link](obj) Take a dataframe and create a new one
devuelve el porcentaje de cambio de una
where the index is one of the columns,
Cambia los valores de la serie por los fila con respecto a la anterior (también
columns are the values of other column
indicados en la función. Puede ser un puede aplicarse a columnas usando el
and the values are taken from one more
diccionario u otra serie, en cuyo caso se parámetro axis). Podemos ver que los
different column. Los valores que toma
cambian por los valores de la otra serie valores de la primera fila, al no existir
la variable incluida en el parámetro
siguiendo buscand en el índice los una anterior con respecto a la que
values van a la intersección de filas y
valores que coinciden. También acepta realizar el cálculo, reciben un valor NaN
columnas, aplicándoseles una cierta
funciones. por defecto. En todo caso, es posible
función de agregación que, por defecto,
regular el comportamiento del método al
[Link]ly(fun) es [Link] (cálculo del valor medio).
respecto de los valores NaN con el
Aplica una función al df (por columnas
aggfunc = "count" parámetro fill_method.
eje 0 por defecto. Devuelve una serie
En vez de agrega los valores, agrega el [Link]ique()
donde en el caso por defecto los índices
número de registros presentado en cada
son los nombres de las columnas. devuelve el número de valores
intersección.
diferentes a lo largo del eje indicado
df,applymap(fun)
[Link]ot_table(index = "foo", columns = "‐
aplica una función que acepta y
bar", values = "baz", aggfunc = ["mean", "‐
devuelve un único escalar. Va celda por
count"])
celda y devuelve otro df.
Es posible aplicar más de una función de
agregación a los datos. Se devuelve un
df con las columnas repetidas según
cada parámetro.

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 3 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Ordenación y clasificación Selección con multi-índices Unión de dataframes

[Link]_index() data.index.get_level_values(n) [Link]cat([df1, df2])

Ordenación de series por índice. De Trabajando con un DataFrame o una Unión básica de dataframes. Se pone
forma descendente con ascending = Serie pandas con multi-índice, es uno encima del otro, añadiendo todos
False. Si los índices fuesen cadenas de posible extraer los valores de un nivel los índices aunque se repitan. En las
texto, se ordenarían de la "a" a la "z", del índice (columna). El parámetro que columnas se añaden primero las
dando a las mayúsculas mayor deberemos pasar a este método será o columnas del primer df y luego las del
prioridad. el número del nivel o su nombre segundo que no se hayan repetido, y si
un dataframe no tiene valores para esa
[Link]t_index() data.loc[2018]
columna se añaden valores NaN.
Se puede hacer por filas o columnas con data.loc[(2018, "Spain")]
el parámetro axis. Acepta el parámetro [Link]cat([df1, df2], axis = 1)
Es posible extraer los valores de un
ascending índice que está dentro de otro índice. Se pone un dataframe al lado del otro.
Se añaden las columnas comunes y no
[Link]t_index().sort_index(axis = 1)
comunes aunque se repita el nombre.
Ordenación a lo largo de ambos ejes Multi-índices a partir de un array de tuplas
En el eje 0 se ponen primero los índices
[Link]_values() del primer df y luego los índices del
Ordenación de series por valor. De segundo que no se hayan repetido.
forma descendente con ascending = join = "inner"
False.
Parámetro de concat para que solo se
[Link]t_values(by = "A") unan con las etiquetas comunes. El
Supongamos que queremos ordenar parámetro por defecto es "outer"
esta estructura según la columna A. El ignore_index = True
eje por defecto son las columnas
Se elimina el nombre de las filas para
(axis=0).
axis=0 en el parámetro concat o el
[Link]t_values(by = ["A", "C"]) nombre de las columnas para axis=1 y
En el caso de que dos filas tengan el se introduce un índice nuevo
mismo valor durante la ordenación, se empezando por 0. Por defecto, el valor
recurre al valor de la segunda columna es False
indicada. [Link]ge(df1, df2)
index = [Link]tiIndex.from‐
[Link]() Unión de dfs ignorando el índice. Se
_tuples(
Devuelve una serie conteniendo la buscan las columnas en común, y
[
posición de cada valor de la serie después se colocan los valores en de
(2018, "Spain"),
original si fuesen ordenados de menor a cada fila de ambos dfs cuyo valor en esa
(2018, "Portugal"),
mayor. En el caso de valores repetidos, columna coincida.
(2018, "France"),
se calcula la posición media. Con el
(2019, "Spain"),
método method = "min" se les adjudica
la posición más baja. (2019, "Portugal"),
(2019, "France")
[Link]()
],
Por defecto en el eje vertical (0)
names = ["Year", "Country"])

data = [Link]aFrame(data =
[18, 20, 10, 15, 12, 18], index
= index, columns = ["Sales"])

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 4 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Unión de dataframes (cont) Edición de series Edición de series (cont)

how="outer" s[0] = -1 [Link](s.index[[1, 3]])

Parámetro de merge. La función coge Podemos modificar un valor de una serie Uso de drop con índices en vez de
todos los valores de las columnas en usando la notación corchetes, y etiquetas.
común, no solo los valores de la haciendo referencia a índices o a
[Link]("b")
columna en común que estén presentes etiquetas:
devuelve el valor correspondiente a
en ambos dfs.
s["b"] = -2 dicha etiqueta, eliminándolo de la serie
on="column" Podemos modificar un valor de una serie in-place
Especificar la columna en común. Si hay usando la notación corchetes, y
[Link]e(condition, iftrue, iffalse)
más de una columna en común y solo se haciendo referencia a índices o a
permite filtrar los valores de una serie de
especifica una, se crearán varias copias etiquetas:
forma que solo los que cumplan cierta
mostrando todas las posibles combinaci‐
s[1:3] = 0 condición se mantengan. Los valores
ones.
s["b":"d"] = -10 que no la cumplan son sustituidos por
left_on = "Month", right_on = "MonthName" un valor (NaN por defecto, u otro valor si
s["b":"d"] = [10, 11, 12]
Especificar qué columna debería ser se especifica):
s["f"] = 0
común cuando tengan diferentes
si se trata de una etiqueta (y no existe)
nombres Operaciones básicas con dataframes
se añade:
left_on = "Month", right_index = True df = [Link]aFrame(d, index = list, column‐
s["d":"h"] = 0
Especificar que en vez de una columna s=list)
Si el rango incluye valores que no
común se tiene un índice Crear dataframe a partir de un diccio‐
existen, se ignoran
nario o un array matriz. Si el diccionario
Unión de series s[["c", "a"]] = [-1, -2] contiene listas, se crean varias filas. Lo
Podemos incluir como argumento del mismo ocurre si en vez de un diccionario
t = [Link]cat([s, r])
operador selección una lista de se usa una lista de diccionarios que
Unión básica de series. Si las etiquetas
etiquetas, en cuyo caso los valores se tengan las mismas claves. Las claves
coinciden se repiten para cada valor.
asignan en el orden indicado del diccionario son los nombres de las
[Link]cat([a, b], axis = 1) columnas, a excepción de que se
s[[1, 0]] = [20, 21]
Unión de series en forma de dataframe. indique algo distinto en el parámetro
También podemos usar índices. Pero si
La primera columna será la primera columns, en cuyo caso deberá coincidir
coinciden los índices y las etiquetas,
seria, la segunda columna será la con las claves del diccionario o no se
éstas tienen preferencia en este tipo de
segunda serie y el índice de filas serán mostrarán los valores.
selección, a menos que usemos los
las etiquetas compartidas y no compar‐ [Link]taFrame.from_dict
métodos loc e iloc
tidas. Valores NaN para laos valors de
crea un dataframe a partir de un diccio‐
las series cuyas etiquetas no existen en r = [Link]("b")
nario de diccionarios o de secuencias
la otra. Admite el parámetro sort. devuelve una copia de la serie tras
tipo array
eliminar el elemento cuya etiqueta se
[Link]taFrame.from_records
especifica. Admite listas. El argumento
inplace = True realiza la eliminación "‐ parte de una lista de tuplas o de arrays
inplace" (modificando directamente la NumPy con un tipo estructurado
serie). df["col"]
Consultar una columna de dataframe

[Link]
Consultar una columna de dataframe

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 5 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Operaciones básicas con dataframes (cont) Operaciones con dataframes (cont) Reindexación de series (cont)

[Link] [Link]taFram[Link] method = "ffill"

Consultar tipos de datos en las columnas [Link]taFram[Link] los valores existentes rellenan los
de un dataframe calcular el módulo de un dataframe y valores inexistentes que los sigan. Se
otro dataframe, elemento por elemento rellenan los valores inexistentes con el
[Link]
primer valor existente que los precedan.
Índice de filas de un dataframe [Link]taFram[Link]
Por orden alfabético.
[Link] multiplicación de las dos matrices
method = "bfill"
representadas por los dos dataframes
Lista de nombres de columnas del
method = "nearest"
dataframe [Link]taFram[Link]
asigna a cada valor desconocido el valor
[Link] copia del dataframe conteniendo el valor
más próximo en la serie original. Para
absoluto de cada uno de sus valores
Ver ejes del dataframe (filas y columnas) ver esta opción en funcionamiento
[Link][Link] necesitamos partir de una serie cuyo
Operaciones con series
índice sea numérico. Si en reindex un
Ver/cambiar el nombre del eje x
[Link](s, fill_value = 0) índice es 19 y en la serie original había
(conjunto de filas)
Sumar series por etiquetas, añadiendo un índice 20, se usa el valor de ese.
[Link]umn[Link]
un valor por defecto cuando una serie no
Ver/cambiar el nombre del eje y tiene las etiquetas de la otra. Reindexación de dataframes
(conjunto de columnas)
[Link]rie[Link] [Link]ndex(list)
[Link]
[Link]rie[Link] Reindexa por filas.
Ver valores del df en forma de array
[Link]rie[Link] [Link]ndex(index = list)
[Link]
[Link]rie[Link] Mismo resultado
Dimensiones del df
[Link]ndex(columns = list)
Reindexación de series
Reindexa por columnas
Lectura y escritura de ficheros
[Link]dex(list)
[Link]ndex(index = list1, columns = list2)
df = [Link]d_csv("file.csv") copia reindexada de una serie. El primer
Reindexa por filas y columnas
Lectura de fichero argumento siempre es el nuevo índice.
Si el nuevo índice es un subconjunto del [Link]_index("col")
df.to_csv('out.zip', index=False)
original, la serie generada no contendrá fija una columna del dataframe como
Guardar dataframe o serie
todos los valores de la serie de la que índice, descartando el índice existente.
partimos. si en el nuevo índice se Con el parámetro drop = False se
Operaciones con dataframes
incluyen etiquetas no incluidas en el mantiene la columna.
[Link]d(df2, fill_value = 0) índice original, la nueva serie incluirá
Con reindex se asignan valores NaN a los
establecar un valor predeterminado para dicha etiqueta pero el valor asignado a
valores de filas o columnas que no existan,
aquellos valores que no se encuentren ella recibe el valor por defecto NaN. es
lo que se puede cambiar con el parámetro
en uno de los dataframes. personalizable usando el parámetro
fill_value, o los mismos valores que en las
fill_value.
[Link]taFram[Link] series del parámetro method
[Link]taFram[Link]
[Link]taFram[Link]

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 6 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Edición de dataframes Edición de dataframes (cont) Selección de datos en series

[Link][1, 2] = -100 [Link]op(["A", "C"], axis = 1) [Link](n)

Podemos modificar un valor concreto Para eliminar columnas, habría que devuelve el valor que ocupa el índice
usando los métodos loc o iloc, en función indicar el eje correspondiente o usar el indicado, y devuelve un valor nulo en
de que queramos usar sus etiquetas o parámetro columns caso de que no exista.
índices.
[Link]op(columns = ["A", "C"]) Si utilizamos el índice númerico implícito
df["C"] = [-100, -200, -300, -400, -500, -600] como rango (s[1:3]), se seleccionan los
Podemos modificar una columna Multi-índices a partir de un DataFrame valores desde el primer índice incluido
completa seleccionándola y asigná‐ hasta el último sin incluir. Si se utilizan los
ndole, por ejemplo, una lista con los índices explícitos, se incluyen los valores
nuevos valores desde el primer hasta el último índice
incluyendo ambos.
df = [Link]() [Link]["feb":"mar", "‐
Sin embargo, si al utilizar un índice explícito
A":"B"] = [[-100, -200], [-300, -400]]
númerico hacemos referencia a los datos
Si la selección es un bloque de datos de
con un rango, se sigue cogiendo desde el
un tamaño arbitrario, nos encontramos
primer valor incluido hasta el último sin
en el mismo escenario: o bien
incluir.
insertamos datos con el mismo tamaño
[Link]["name"]
que la selección, o insertamos un único
valor que se propagará a toda la seleccionar un grupo de elementos por
selección. etiquetas y no por índice implícito.
Acepta listas y rangos (devuelve todos
df = [Link]() [Link]["feb":"mar", "‐
los elementos entre los límites
A":"B"] = -1
indicados, ambos incluidos)
[Link]re(condition, iftrue, iffalse)
[Link][n]
filtra los valores contenidos en el
Extrae datos de la serie siempre a partir
dataframe de forma que solo los que
de los índices implícitos que éstos tienen
cumplan cierta condición se mantengan.
asignados. si el rango tiene la forma a:b,
El resto de valores son sustituidos por un
se incluyen todos los elementos desde
valor que, por defecto, es NaN, o por
aquel cuyo índice es a (incluido) hasta el
otro valor si se especifica.
df = [Link]aFrame({ que tiene el índice b (sin incluir).
[Link]op(["feb", "abr"], axis = 0)
"Year":[2018, 2018, 2018, s[s > 2]
elimina las filas o columnas indicadas y 2019, 2019, 2019],
Ejemplo para extraer valores de una
devuelve el resultado. lo que se muestra "Country": ["Spain", "‐
serie con valores booleanos.
es el resultado de eliminar las filas
Portugal", "France", "‐
indicadas del dataframe. Éste no se [Link][s > 2]
Spain", "Portugal", "Fra‐
modifica salvo que utilicemos el Mismo comportamiento que el método
nce"]
argumento inplace = True. anterior,
})
[Link]op(index = ["feb", "abr"])
Admite índices index = [Link]tiIndex.from‐
_frame(df)

data = [Link]aFrame(data =
[18, 20, 10, 15, 12, 18], index
= index, columns = ["Sales"])

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 7 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Selección de datos en series (cont) Inspección de series y dataframes (cont) Inspección de series y dataframes (cont)

[Link][(s > 2).values] [Link](frac = 0.6, random_state = 18) [Link]e_counts(dropna = False)

Mismo comportamiento que el método ver datos aleatorios de nuestra estruc‐ devuelve una estructura conteniendo los
anterior. Con iloc debe ser así puesto tura. el número de elementos devueltos valores presentes en la serie y el
que puede aceptar una lista de valores por defecto es uno. permite especificar o número de ocurrencias de cada uno, Si
booleanos on un array NumPy, pero no bien el número de elementos a extraer o se trata de una serie numérica, en lugar
una serie de pandas que es lo que bien la fracción del número total de de devolver los valores distintos y el
genera este método. elementos a extraer (parámetros x y número de ocurrencias, este método
frac, respectivamente), pudiendo especi‐ también puede agrupar los datos en "‐
[Link](i)
ficar si la extracción se realiza con bins" y devolver una lista de bins
extrae y elimina un elemento de una
reemplazo o no (parámetro replace), los (indicando sus márgenes) con el
serie cuyo índice se indica como
pesos a aplicar a cada elemento para número de valores en cada uno de ellos
argumento. Si la serie tiene un índice
realizar una extracción aleatoria (bins = 5)
explícito, el argumento de pop hará
ponderada (parámetro weights), y una
referencia a este índice.
semilla para el generador de números Gestión de valores nulos
aleatorios que asegure la reproduci‐
Inspección de series y dataframes [Link]ull(s)
bilidad de la extracción (parámetro
devuelve una estructura con las mismas
[Link]() random_state)
dimensiones que la que se cede como
devuelve los primeros elementos de la [Link]()
argumento sustituyendo cada valor por
estructura. Por defecto, se trata de los 5
devuelve información estadística de los el booleano True si el correspondiente
primeros elementos, pero podemos
datos del dataframe o de la serie. elemento es un valor nulo, y por el
especificar el número que deseamos
acepta el parámetro percentiles conten‐ booleano False en caso contrario
como argumento de la función.
iendo una lista (o semejante) de los
[Link]()
[Link]() percentiles a mostrar. También acepta
[Link]ull(df)
muestran los últimos elementos de la los parámetros include y exclude para
especificar los tipos de las caracterí‐ [Link]ull()
estructura. Si no indicamos otra cosa
como argumento, serán los 5 últimos sticas a incluir o excluir del resultado. [Link]()
elementos los que se muestren [Link]() filtra los valores para dejar solo aquellos
muestra un resumen de un dataframe, no nulos
no de una serie. Incluyendo información [Link]pna()
sobre el tipo de los índices de filas y
Se aplica por defecto al eje 0, y borra
columnas, los valores no nulos y la
las filas que tengan un valor nulo en
memoria usada:
cualquiera de las columnas. Con how =
"all" se borran solo las filas que tengan
todos los valores nulos. Esto por defecto
es how="any"

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 8 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Gestión de valores nulos (cont)

[Link]na(n)
permite sustituir los valores nulos de una
estructura pandas por otro valor según
ciertos criterios. Acepta los parámetros
method = "ffill" y method="bfill"

[Link]lna(n)
Si usamos los métodos indicados arriba
también podemos cambiar el eje.

[Link]lna(axis = 1, method = "bfill").fillna(n)

asegurarnos de que todos los elementos
han sido sustituidos adecuadamente

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 9 of 10. [Link]

También podría gustarte

Tema 11 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 11 - Guia de Inteligencia Artificial
13 páginas
Guía de Pandas para Análisis de Datos
100% (1)
Guía de Pandas para Análisis de Datos
67 páginas
Parte4 Pandas
Aún no hay calificaciones
Parte4 Pandas
36 páginas
Guía de referencia de Pandas
100% (1)
Guía de referencia de Pandas
2 páginas
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
Aún no hay calificaciones
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
55 páginas
M1 - Clase 04 - PANDAS
Aún no hay calificaciones
M1 - Clase 04 - PANDAS
50 páginas
Cheat Sheet de Pandas para Data Wrangling
Aún no hay calificaciones
Cheat Sheet de Pandas para Data Wrangling
2 páginas
Guía de Uso de Pandas para Ciencia de Datos
Aún no hay calificaciones
Guía de Uso de Pandas para Ciencia de Datos
41 páginas
Pandas y Python
100% (1)
Pandas y Python
24 páginas
Manual Pandas
Aún no hay calificaciones
Manual Pandas
21 páginas
Guía de Proyecto con Anaconda y Pandas
Aún no hay calificaciones
Guía de Proyecto con Anaconda y Pandas
5 páginas
PandasDFNotes Es
Aún no hay calificaciones
PandasDFNotes Es
20 páginas
01 - Librería Pandas
Aún no hay calificaciones
01 - Librería Pandas
43 páginas
Uso de pd.cut en análisis de datos
Aún no hay calificaciones
Uso de pd.cut en análisis de datos
64 páginas
Filtrar filas en DataFrames de Pandas
Aún no hay calificaciones
Filtrar filas en DataFrames de Pandas
12 páginas
Unidad 2 Py
Aún no hay calificaciones
Unidad 2 Py
10 páginas
Técnicas Avanzadas en Pandas
Aún no hay calificaciones
Técnicas Avanzadas en Pandas
46 páginas
ProgrammToolsPython 3 2 2021
Aún no hay calificaciones
ProgrammToolsPython 3 2 2021
21 páginas
Sesion 20221126
Aún no hay calificaciones
Sesion 20221126
20 páginas
Pandas
Aún no hay calificaciones
Pandas
53 páginas
5 - Pandas
Aún no hay calificaciones
5 - Pandas
41 páginas
Pandas
100% (5)
Pandas
172 páginas
Clase 21 - Manejo de Archivos Reales
Aún no hay calificaciones
Clase 21 - Manejo de Archivos Reales
63 páginas
Guía de pandas para análisis de datos
Aún no hay calificaciones
Guía de pandas para análisis de datos
115 páginas
FP Unidad 08 v4 20170417
Aún no hay calificaciones
FP Unidad 08 v4 20170417
45 páginas
Pandas-Principales Comandos
Aún no hay calificaciones
Pandas-Principales Comandos
28 páginas
Pandas Cheatsheet
Aún no hay calificaciones
Pandas Cheatsheet
2 páginas
Unidad 2 Manipulación de Datos Con Pandas
Aún no hay calificaciones
Unidad 2 Manipulación de Datos Con Pandas
34 páginas
Tema 10 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 10 - Guia de Inteligencia Artificial
16 páginas
Guía Completa de Pandas en Python
Aún no hay calificaciones
Guía Completa de Pandas en Python
12 páginas
Funciones Básicas Ciencia de Datos
Aún no hay calificaciones
Funciones Básicas Ciencia de Datos
22 páginas
Indexación y selección en Python
Aún no hay calificaciones
Indexación y selección en Python
7 páginas
Python For Engineers 2
Aún no hay calificaciones
Python For Engineers 2
25 páginas
Guía de Examen Final
Aún no hay calificaciones
Guía de Examen Final
39 páginas
Análisis de Datos con Pandas y Visualización
Aún no hay calificaciones
Análisis de Datos con Pandas y Visualización
23 páginas
Clase - Python 6 (24 - II)
Aún no hay calificaciones
Clase - Python 6 (24 - II)
29 páginas
Python PANDAS
Aún no hay calificaciones
Python PANDAS
10 páginas
"One - Trunc" "One": Fuera (7 9)
Aún no hay calificaciones
"One - Trunc" "One": Fuera (7 9)
131 páginas
A 1.0 B 1.0 C 1.0 D Nan E 1.0 Dtype: Float64: Ejemplos
Aún no hay calificaciones
A 1.0 B 1.0 C 1.0 D Nan E 1.0 Dtype: Float64: Ejemplos
123 páginas
Maneja y Analiza Datos Con DataFrames de Pandas y Python
Aún no hay calificaciones
Maneja y Analiza Datos Con DataFrames de Pandas y Python
3 páginas
Introducción a Librerías en Python
Aún no hay calificaciones
Introducción a Librerías en Python
9 páginas
Cheat Sheet
Aún no hay calificaciones
Cheat Sheet
4 páginas
Basecamp: Ciencia de Datos
Aún no hay calificaciones
Basecamp: Ciencia de Datos
45 páginas
Diapos Lenguaje
Aún no hay calificaciones
Diapos Lenguaje
21 páginas
Unidad 3 Uso Libreria Pandas
Aún no hay calificaciones
Unidad 3 Uso Libreria Pandas
18 páginas
P3 IAA Rodriguez Zubaran Carlos Erick
Aún no hay calificaciones
P3 IAA Rodriguez Zubaran Carlos Erick
11 páginas
Pandas: Guía para Analistas de Datos
Aún no hay calificaciones
Pandas: Guía para Analistas de Datos
45 páginas
Parcial N2
Aún no hay calificaciones
Parcial N2
4 páginas
Pandas: Guía Completa de Series y DataFrames
Aún no hay calificaciones
Pandas: Guía Completa de Series y DataFrames
26 páginas
Presentacion Inicial Ciencia de Datos Vivelab
Aún no hay calificaciones
Presentacion Inicial Ciencia de Datos Vivelab
77 páginas
Unidad 8 Pensamiento Computacional
Aún no hay calificaciones
Unidad 8 Pensamiento Computacional
14 páginas
05 Analisis de Datos Con Pandas
Aún no hay calificaciones
05 Analisis de Datos Con Pandas
32 páginas
Pandas PensamientoComputacional 1c 2023
Aún no hay calificaciones
Pandas PensamientoComputacional 1c 2023
9 páginas
Python y Pandas en Ciencia de Datos
Aún no hay calificaciones
Python y Pandas en Ciencia de Datos
11 páginas
Guía Completa de Análisis de Datos Con Python
Aún no hay calificaciones
Guía Completa de Análisis de Datos Con Python
16 páginas
Taller Pandas
Aún no hay calificaciones
Taller Pandas
15 páginas
CertificadoCerap (1) Josef
Aún no hay calificaciones
CertificadoCerap (1) Josef
1 página
Hola Hermanos
Aún no hay calificaciones
Hola Hermanos
2 páginas
Win2008 11
Aún no hay calificaciones
Win2008 11
276 páginas
Rendición de Cuentas Evento 05-04-2025
Aún no hay calificaciones
Rendición de Cuentas Evento 05-04-2025
1 página
Robotic Toolbox
Aún no hay calificaciones
Robotic Toolbox
71 páginas
Ensamble Mecánico con Inventor 2010
Aún no hay calificaciones
Ensamble Mecánico con Inventor 2010
15 páginas
Guía Completa de PostgreSQL
Aún no hay calificaciones
Guía Completa de PostgreSQL
3 páginas
Progresiones Secundarias PDF
Aún no hay calificaciones
Progresiones Secundarias PDF
7 páginas
Crucigrama de Componentes Eléctricos
Aún no hay calificaciones
Crucigrama de Componentes Eléctricos
1 página
Carlos Guerra
Aún no hay calificaciones
Carlos Guerra
9 páginas
Transacciones SAP en Finanzas y Contabilidad
Aún no hay calificaciones
Transacciones SAP en Finanzas y Contabilidad
5 páginas
Comparativa de Algoritmos de Enrutamiento
Aún no hay calificaciones
Comparativa de Algoritmos de Enrutamiento
2 páginas
Manual Completo de C para Principiantes
Aún no hay calificaciones
Manual Completo de C para Principiantes
151 páginas
Sistemas Integrados de Manufactura
Aún no hay calificaciones
Sistemas Integrados de Manufactura
10 páginas
Rentabilidad Hoteles y Cálculos Excel
Aún no hay calificaciones
Rentabilidad Hoteles y Cálculos Excel
10 páginas
Definición de Celular
Aún no hay calificaciones
Definición de Celular
2 páginas
Red Personal de Aprendizaje: Definición y Uso
Aún no hay calificaciones
Red Personal de Aprendizaje: Definición y Uso
8 páginas
Método Monge y Proyecciones Orto]
Aún no hay calificaciones
Método Monge y Proyecciones Orto]
5 páginas
Guía Completa de Report Painter en SAP
Aún no hay calificaciones
Guía Completa de Report Painter en SAP
41 páginas
Sig-P-09 Control y Tratamiento de Los Servicios No Conformes
Aún no hay calificaciones
Sig-P-09 Control y Tratamiento de Los Servicios No Conformes
4 páginas
Comparativa de Scanners con WAVSEP
Aún no hay calificaciones
Comparativa de Scanners con WAVSEP
12 páginas
Bases para la Toma de Decisiones
100% (1)
Bases para la Toma de Decisiones
5 páginas
Triptico
100% (1)
Triptico
2 páginas
Experiencia Nacional de Ensamblaje
100% (1)
Experiencia Nacional de Ensamblaje
2 páginas
Diseño e Implementación de Robot Sumo
100% (2)
Diseño e Implementación de Robot Sumo
10 páginas
Cálculo de Errores en Métodos Numéricos
Aún no hay calificaciones
Cálculo de Errores en Métodos Numéricos
28 páginas
Uso Del Bootloader - Rom
Aún no hay calificaciones
Uso Del Bootloader - Rom
9 páginas
Tecnico Tactico Tchoukball
100% (1)
Tecnico Tactico Tchoukball
25 páginas
Caso Industria Acero
Aún no hay calificaciones
Caso Industria Acero
2 páginas
Wallbox Pulsar: Carga Inteligente EV
Aún no hay calificaciones
Wallbox Pulsar: Carga Inteligente EV
2 páginas
Conversión en Reactor Tubular Isotérmico
Aún no hay calificaciones
Conversión en Reactor Tubular Isotérmico
2 páginas
Atajos de Teclado en Photoshop
Aún no hay calificaciones
Atajos de Teclado en Photoshop
1 página

Julenx Python Pandas

Cargado por

Julenx Python Pandas

Cargado por

Python pandas Cheat Sheet

by julenx via [Link]/168626/cs/35356/

[Link]() [Link] Ventas​["D"] = [Link]​ies​(list, index = list )

[Link] El uso de un rango numérico entre los

By julenx Published 13th November, 2022. Sponsored by [Link]

By julenx Published 13th November, 2022. Sponsored by [Link]

Operac​iones entre dataframes y series Agrupa​ciones Métodos de agregación estadí​stica

df + s [Link]​pby(by = fun).m​ean() [Link]​cribe()

By julenx Published 13th November, 2022. Sponsored by [Link]

Ordenación y clasif​icación Selección con multi-​índices Unión de dataframes

[Link]​_in​dex() data.i​nde​x.g​et_​lev​el_​val​ues(n) [Link]​cat​([df1, df2])

By julenx Published 13th November, 2022. Sponsored by [Link]

Unión de dataframes (cont) Edición de series Edición de series (cont)

how="ou​ter​" s[0] = -1 [Link]​(s.i​nd​ex[[1, 3]])

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link] [Link]​taF​ram​[Link] method = "​ffi​ll"

By julenx Published 13th November, 2022. Sponsored by [Link]

Edición de dataframes Edición de dataframes (cont) Selección de datos en series

[Link][1, 2] = -100 [Link]​op(​["A", "​C"], axis = 1) [Link](n)

By julenx Published 13th November, 2022. Sponsored by [Link]

[Link][(s > 2).values] [Link](frac = 0.6, random_state = 18) [Link]​e_c​oun​ts(​dropna = False)

By julenx Published 13th November, 2022. Sponsored by [Link]

Gestión de valores nulos (cont)

[Link]​lna​(axis = 1, method = "​bfi​ll").fi​llna(n)

By julenx Published 13th November, 2022. Sponsored by [Link]

También podría gustarte

[Link]() [Link] Ventas["D"] = [Link]ies(list, index = list )

Operaciones entre dataframes y series Agrupaciones Métodos de agregación estadística

df + s [Link]pby(by = fun).mean() [Link]cribe()

Ordenación y clasificación Selección con multi-índices Unión de dataframes

[Link]_index() data.index.get_level_values(n) [Link]cat([df1, df2])

how="outer" s[0] = -1 [Link](s.index[[1, 3]])

[Link] [Link]taFram[Link] method = "ffill"

[Link][1, 2] = -100 [Link]op(["A", "C"], axis = 1) [Link](n)

[Link][(s > 2).values] [Link](frac = 0.6, random_state = 18) [Link]e_counts(dropna = False)

[Link]lna(axis = 1, method = "bfill").fillna(n)