0% encontró este documento útil (0 votos)
28 vistas10 páginas

Julenx Python Pandas

Cargado por

josefchamo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
28 vistas10 páginas

Julenx Python Pandas

Cargado por

josefchamo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Python pandas Cheat Sheet

by julenx via [Link]/168626/cs/35356/

Fijar el estilo gráfico de seaborn por defecto Operac​iones básicas con series (cont) Selección de datos en dataframes (cont)

[Link]() [Link] Ventas​["D"] = [Link]​ies​(list, index = list )


nos devuelve el tamaño de la serie Si asignamos a una columna una serie
Operac​iones básicas con series pandas se consideran los índices del
s = [Link]​ies(d, index = list)
s = [Link]​ies​(list, index = list) dataframe y de la serie, haciendo
Crear serie a partir de un diccio​nario,
coincidir los valores cuyos índices sean
Crear serie. Si en vez de una serie se pero especi​ficando nosotros el índice. Si
los mismos en ambas estruc​turas (si
introduce un escalar, todas las filas hay valores que no perten​ezcan diccio​‐
dicha columna no existe, se crea). En el
tendrán ese valor. nario, se añaden con un valor NaN:
caso de que haya valores en la serie con
s = [Link]​ies(d)
índices que no se encuentren en el
Crear serie a partir de un diccio​nario Aplicación de funciones estadí​sticas
dataframe, se descartan. Y en el caso
s[n] data.m​ean() de que haya índices en el dataframe que
.podemos calcular el valor medio de los no se encuentren en la serie, se asigna
Extraer elemento con el índice implícito
datos un valor NaN.
de la serie. Si los índices asignados son
números entero, el índice implícito data.m​ean​(level = "​Yea​r") del(Ve​nta​s["A​"])
queda desact​ivado Borrar columna. Con la notación
si especi​ficamos el nivel al que
s["n​ame​"] queremos aplicarlo, el DataFrame se Ventas.A no es posible crear nuevas
agrega según los valores de dicho nivel columnas ni elimin​arlas
Extraer elemento con el nombre del
índice antes de realizar la operación Ventas​[2:4]

[Link] El uso de un rango numérico entre los


Selección de datos en dataframes corchetes realiza una selección de filas
Extraer elemento con el nombre del
Ventas​["B"]​["fe​b"] Ventas​["fe​b":"m​ay"]
índice
podemos utilizar la sintaxis de los diccio​‐ vemos en el resultado anterior que se
[Link]
narios para selecc​ionar la columna "​B":. devuelven las filas entre el primer valor
Tipo de datos en la serie
Esto significa que podemos realizar una del rango (incluido) y el último (sin
[Link] selección en dicho resultado para, por incluir). aunque en este caso la
Consultar índice de la serie ejemplo, extraer el valor corres​pon​‐ selección incluye tanto la fila corres​pon​‐
diente a febrero: diente a la primera etiqueta como la fila
[Link]
Ventas​["B"] = [-1, -2, -3, -4, -5] corres​pon​diente a la segunda.
Nos da acceso "a los ejes" (a los
índices) Si, una vez selecc​ionada una columna, tips[[​"​tip​", "​day​"]]
le asignamos una lista o array (o serie) Si situamos entre los corchetes una lista
[Link]
de valores de la misma longitud, de etiquetas, estaremos selecc​ionando
Consultar valores de la serie estamos modifi​cando dicha columna del columnas en el orden en el que
[Link] dataframe: aparecen en la lista y con formato
Consultar o cambiar nombre de la serie. Ventas​["C"] = 0 dataframe
Por defecto, está vacío Si asignamos un único valor escalar, [Link]​("na​me")
[Link]​[Link] este se propaga por toda la columna: extrae la columna indicada devolv​iendo
Consultar o cambiar nombre del índice un valor altern​ativo (por defecto None) si
de la serie. Por defecto, está vacío dicha columna no existe:

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 1 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Selección de datos en dataframes (cont) Selección de datos en dataframes (cont) Multi-​índices por producto cartesiano de
arrays
[Link]​c["m​ay"] [Link]​c[[5, 3], [Link]​umn​s.g​et_​ind​exe​r([​"​C", "​‐
Selecc​ionar filas siempre por etiqueta. A"])]
Acepta listas. obtener de las filas 5 y 3 (en este orden)
los valores corres​pon​dientes a las
[Link]​c[[​"​feb​"]]
columnas C y A (en este orden)
Selecciona fila y la devuelve en formato
dataframe. Si hay varias en la lista, se df[[Link] > n]
devuelve un dataframe con esa Selección con booleanos. También
selección. Admite rangos. funcio​naría [Link]​c[d​[Link] > n] o con
[Link]​oc[​([Link] > n).values] (expli​‐
[Link]​c["m​ay", "​C"]
cación en la sección de series)
Extraer un único valor por fila y columna.
Admite rangos como [Link][:, "​A"] [Link]​ple(n, random​_state = ..., axis = ...,
frac=...)
[Link]​c[[​"​may​", "​ene​"], "​B"]
Al igual que ocurre con las series,
selecc​ionar la inters​ección de las filas e
también los dataframes tienen un
y c (en este orden) y la columna B
método que permite extraer elementos
[Link][n] del mismo de forma aleatoria. Este `index = [Link]​tiI​nde​x.f​rom​_pr​oduct(´
Selección por posición de fila. Mismas método permite especi​ficar el número [
funcio​nal​idades que iloc. de elementos a extraer (o el porcentaje [2018, 2019],
respecto del total, parámetros n y frac, ["Sp​ain​", "​Por​tug​al", "​‐
[Link]​lum​ns.g​et​_lo​c("B​")
respec​tiv​ame​nte), si la extracción se Fra​nce​"]
Obtiene el índice de la columna con esa
realiza con reemplazo o no (parámetro ],
etiqueta.
replace), los pesos a aplicar a los names = ["Ye​ar", "​Cou​ntr​y"]
[Link]​lum​ns.g​et​_in​dex​er(​["A", "​C"]) elementos para realizar una extracción )
Obtiene el índice de columnas con esas aleatoria ponderada (parámetro weights)
etiquetas. Devuelve un array y una semilla para el generador de data = [Link]​aFr​ame​(data =
números aleatorios que asegure la
[Link]​[Link]​t_l​oc(​"​feb​") [18, 20, 10, 15, 12, 18], index
reprod​uci​bilidad de la extracción
= index, columns = ["Sa​les​"])
Obtiene el índice de la fila con esa (parámetro random​_st​ate). También es
etiqueta. posible indicar el eje a lo largo del cual
Multi-​ind​exación
[Link]​[Link]​t_i​nde​xer​(["f​eb", "​abr​"]) se desea realizar la extracción (por
defecto se extraen filas, corres​pon​diente
Obtiene el índice de filas con esas
al eje 0)
etiquetas. Devuelve un array
s = [Link]​("co​l")
[Link]​oc[​Ven​[Link]​[Link]​t_l​oc(​"​feb​"), 2]
extrae y elimina una columna de un
extraer del anterior dataframe el dato
dataframe
que ocupa la fila "​feb​" y la columna de
índice 2

index = [Link]​tiI​nde​x.f​rom​‐
_ar​rays(
[
[2018, 2018, 2018, 2019, 2019,
2019],
["Sp​ain​", "​UK", "​Fra​‐
nce​", "​Spa​in", "​UK", "​Fra​‐
nce​"]
],
names = ["Ye​ar", "​Cou​ntr​y"]
)

data = [Link]​aFrame(
data = [18, 20, 10, 15, 12,
18],
index = index, columns = ["Sa​‐
les​"])

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 2 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Operac​iones entre dataframes y series Agrupa​ciones Métodos de agregación estadí​stica

df + s [Link]​pby(by = fun).m​ean() [Link]​cribe()


Se suman los valores de una serie a A groupby operation involves some inform​ación estadí​stica sobre los valores
todas las columnas (en todas las filas) combin​ation of splitting the object, contenidos
cuyos valores coindicen con las applying a function, and combining the
[Link]()
etiquetas de la serie. Si la serie tiene results. This can be used to group large
Devuelve la media aritmética de los
índices cuyas columnas no existen en el amounts of data and compute operations
valores del dataframe a lo largo de un
df, se añaden con el valor NaN en todas on these groups
determ​inado eje (eje 0 -vertical- por
las filas.
[Link]​pby(by = d).mean() defecto)
[Link](s, axis = 0) [Link]​pby​(level = 0).mean()
[Link]​taF​ram​e.m​edian
[Link]​upby(by = "​col​"​).m​ean()
Aplicación de funciones y mapeado [Link]​taF​ram​[Link]
[Link]​upby(by = ["Ca​teg​orí​a", "​Pro​duc​‐
[Link]​taF​ram​[Link]
[Link]​y(fun)
to"]​).m​ean()
Devuelve la desviación estándar de los
permite aplicar a cada uno de los
[Link]​oup​by(​level = 0).mean()
valores del dataframe a lo largo de un
elementos de la serie una función. Ésta
Según las etiquetas del índice. determ​inado eje
deberá aceptar un único valor como
argumento y devolver también un único [Link]​ot_​tab​le(​index = "​foo​", columns = "​‐ [Link]​taF​ram​[Link]
valor bar​", values = "​baz​")
[Link]​_ch​ange()
[Link](obj) Take a dataframe and create a new one
devuelve el porcentaje de cambio de una
where the index is one of the columns,
Cambia los valores de la serie por los fila con respecto a la anterior (también
columns are the values of other column
indicados en la función. Puede ser un puede aplicarse a columnas usando el
and the values are taken from one more
diccio​nario u otra serie, en cuyo caso se parámetro axis). Podemos ver que los
different column. Los valores que toma
cambian por los valores de la otra serie valores de la primera fila, al no existir
la variable incluida en el parámetro
siguiendo buscand en el índice los una anterior con respecto a la que
values van a la inters​ección de filas y
valores que coinciden. También acepta realizar el cálculo, reciben un valor NaN
columnas, aplicá​ndo​seles una cierta
funciones. por defecto. En todo caso, es posible
función de agregación que, por defecto,
regular el compor​tam​iento del método al
[Link]​ly(fun) es [Link] (cálculo del valor medio).
respecto de los valores NaN con el
Aplica una función al df (por columnas
aggfunc = "​cou​nt" parámetro fill_m​ethod.
eje 0 por defecto. Devuelve una serie
En vez de agrega los valores, agrega el [Link]​ique()
donde en el caso por defecto los índices
número de registros presentado en cada
son los nombres de las columnas. devuelve el número de valores
inters​ección.
diferentes a lo largo del eje indicado
df,app​lym​ap(fun)
[Link]​ot_​tab​le(​index = "​foo​", columns = "​‐
aplica una función que acepta y
bar​", values = "​baz​", aggfunc = ["me​an", "​‐
devuelve un único escalar. Va celda por
cou​nt"])
celda y devuelve otro df.
Es posible aplicar más de una función de
agregación a los datos. Se devuelve un
df con las columnas repetidas según
cada parámetro.

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 3 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Ordenación y clasif​icación Selección con multi-​índices Unión de dataframes

[Link]​_in​dex() data.i​nde​x.g​et_​lev​el_​val​ues(n) [Link]​cat​([df1, df2])


Ordenación de series por índice. De Trabajando con un DataFrame o una Unión básica de datafr​ames. Se pone
forma descen​dente con ascending = Serie pandas con multi-​índice, es uno encima del otro, añadiendo todos
False. Si los índices fuesen cadenas de posible extraer los valores de un nivel los índices aunque se repitan. En las
texto, se ordenarían de la "​a" a la "​z", del índice (columna). El parámetro que columnas se añaden primero las
dando a las mayúsculas mayor deberemos pasar a este método será o columnas del primer df y luego las del
prioridad. el número del nivel o su nombre segundo que no se hayan repetido, y si
un dataframe no tiene valores para esa
[Link]​t_i​ndex() data.l​oc[​2018]
columna se añaden valores NaN.
Se puede hacer por filas o columnas con data.l​oc[​(2018, "​Spa​in")]
el parámetro axis. Acepta el parámetro [Link]​cat​([df1, df2], axis = 1)
Es posible extraer los valores de un
ascending índice que está dentro de otro índice. Se pone un dataframe al lado del otro.
Se añaden las columnas comunes y no
[Link]​t_i​nde​x().so​rt_​ind​ex(axis = 1)
comunes aunque se repita el nombre.
Ordenación a lo largo de ambos ejes Multi-​índices a partir de un array de tuplas
En el eje 0 se ponen primero los índices
[Link]​_va​lues() del primer df y luego los índices del
Ordenación de series por valor. De segundo que no se hayan repetido.
forma descen​dente con ascending = join = "​inn​er"
False.
Parámetro de concat para que solo se
[Link]​t_v​alu​es(by = "​A") unan con las etiquetas comunes. El
Supongamos que queremos ordenar parámetro por defecto es "​out​er"
esta estructura según la columna A. El ignore​_index = True
eje por defecto son las columnas
Se elimina el nombre de las filas para
(axis=0).
axis=0 en el parámetro concat o el
[Link]​t_v​alu​es(by = ["A", "​C"]) nombre de las columnas para axis=1 y
En el caso de que dos filas tengan el se introduce un índice nuevo
mismo valor durante la ordena​ción, se empezando por 0. Por defecto, el valor
recurre al valor de la segunda columna es False
indicada. [Link]​ge(df1, df2)
index = [Link]​tiI​nde​x.f​rom​‐
[Link]() Unión de dfs ignorando el índice. Se
_tu​ples(
Devuelve una serie conten​iendo la buscan las columnas en común, y
[
posición de cada valor de la serie después se colocan los valores en de
(2018, "​Spa​in"),
original si fuesen ordenados de menor a cada fila de ambos dfs cuyo valor en esa
(2018, "​Por​tug​al"),
mayor. En el caso de valores repetidos, columna coincida.
(2018, "​Fra​nce​"),
se calcula la posición media. Con el
(2019, "​Spa​in"),
método method = "​min​" se les adjudica
la posición más baja. (2019, "​Por​tug​al"),
(2019, "​Fra​nce​")
[Link]()
],
Por defecto en el eje vertical (0)
names = ["Ye​ar", "​Cou​ntr​y"])

data = [Link]​aFr​ame​(data =
[18, 20, 10, 15, 12, 18], index
= index, columns = ["Sa​les​"])

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 4 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Unión de dataframes (cont) Edición de series Edición de series (cont)

how="ou​ter​" s[0] = -1 [Link]​(s.i​nd​ex[[1, 3]])


Parámetro de merge. La función coge Podemos modificar un valor de una serie Uso de drop con índices en vez de
todos los valores de las columnas en usando la notación corchetes, y etiquetas.
común, no solo los valores de la haciendo referencia a índices o a
[Link](​"​b")
columna en común que estén presentes etiquetas:
devuelve el valor corres​pon​diente a
en ambos dfs.
s["b​"] = -2 dicha etiqueta, elimin​ándolo de la serie
on="​col​umn​" Podemos modificar un valor de una serie in-place
Especi​ficar la columna en común. Si hay usando la notación corchetes, y
[Link]​e(c​ond​ition, iftrue, iffalse)
más de una columna en común y solo se haciendo referencia a índices o a
permite filtrar los valores de una serie de
especifica una, se crearán varias copias etiquetas:
forma que solo los que cumplan cierta
mostrando todas las posibles combin​aci​‐
s[1:3] = 0 condición se mantengan. Los valores
ones.
s["b​"​:"d"] = -10 que no la cumplan son sustit​uidos por
left_on = "​Mon​th", right_on = "​Mon​thN​ame​" un valor (NaN por defecto, u otro valor si
s["b​"​:"d"] = [10, 11, 12]
Especi​ficar qué columna debería ser se especi​fica):
s["f​"] = 0
común cuando tengan diferentes
si se trata de una etiqueta (y no existe)
nombres Operac​iones básicas con dataframes
se añade:
left_on = "​Mon​th", right_​index = True df = [Link]​aFr​ame(d, index = list, column​‐
s["d​"​:"h"] = 0
Especi​ficar que en vez de una columna s=list)
Si el rango incluye valores que no
común se tiene un índice Crear dataframe a partir de un diccio​‐
existen, se ignoran
nario o un array matriz. Si el diccio​nario
Unión de series s[["​c", "​a"]] = [-1, -2] contiene listas, se crean varias filas. Lo
Podemos incluir como argumento del mismo ocurre si en vez de un diccio​nario
t = [Link]​cat([s, r])
operador selección una lista de se usa una lista de diccio​narios que
Unión básica de series. Si las etiquetas
etiquetas, en cuyo caso los valores se tengan las mismas claves. Las claves
coinciden se repiten para cada valor.
asignan en el orden indicado del diccio​nario son los nombres de las
[Link]​cat([a, b], axis = 1) columnas, a excepción de que se
s[[1, 0]] = [20, 21]
Unión de series en forma de dataframe. indique algo distinto en el parámetro
También podemos usar índices. Pero si
La primera columna será la primera columns, en cuyo caso deberá coincidir
coinciden los índices y las etiquetas,
seria, la segunda columna será la con las claves del diccio​nario o no se
éstas tienen prefer​encia en este tipo de
segunda serie y el índice de filas serán mostrarán los valores.
selección, a menos que usemos los
las etiquetas compar​tidas y no compar​‐ [Link]​taF​ram​e.f​rom​_dict
métodos loc e iloc
tidas. Valores NaN para laos valors de
crea un dataframe a partir de un diccio​‐
las series cuyas etiquetas no existen en r = [Link]​("b")
nario de diccio​narios o de secuencias
la otra. Admite el parámetro sort. devuelve una copia de la serie tras
tipo array
eliminar el elemento cuya etiqueta se
[Link]​taF​ram​e.f​rom​_re​cords
especi​fica. Admite listas. El argumento
inplace = True realiza la elimin​ación "​‐ parte de una lista de tuplas o de arrays
inp​lac​e" (modif​icando direct​amente la NumPy con un tipo estruc​turado
serie). df["​col​"]
Consultar una columna de dataframe

[Link]
Consultar una columna de dataframe

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 5 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Operac​iones básicas con dataframes (cont) Operac​iones con dataframes (cont) Reinde​xación de series (cont)

[Link] [Link]​taF​ram​[Link] method = "​ffi​ll"


Consultar tipos de datos en las columnas [Link]​taF​ram​[Link] los valores existentes rellenan los
de un dataframe calcular el módulo de un dataframe y valores inexis​tentes que los sigan. Se
otro dataframe, elemento por elemento rellenan los valores inexis​tentes con el
[Link]
primer valor existente que los precedan.
Índice de filas de un dataframe [Link]​taF​ram​[Link]
Por orden alfabé​tico.
[Link] multip​lic​ación de las dos matrices
method = "​bfi​ll"
repres​entadas por los dos dataframes
Lista de nombres de columnas del
method = "​nea​res​t"
dataframe [Link]​taF​ram​[Link]
asigna a cada valor descon​ocido el valor
[Link] copia del dataframe conten​iendo el valor
más próximo en la serie original. Para
absoluto de cada uno de sus valores
Ver ejes del dataframe (filas y columnas) ver esta opción en funcio​nam​iento
[Link]​[Link] necesi​tamos partir de una serie cuyo
Operac​iones con series
índice sea numérico. Si en reindex un
Ver/ca​mbiar el nombre del eje x
[Link](s, fill_value = 0) índice es 19 y en la serie original había
(conjunto de filas)
Sumar series por etiquetas, añadiendo un índice 20, se usa el valor de ese.
[Link]​umn​[Link]
un valor por defecto cuando una serie no
Ver/ca​mbiar el nombre del eje y tiene las etiquetas de la otra. Reinde​xación de dataframes
(conjunto de columnas)
[Link]​rie​[Link] [Link]​nde​x(list)
[Link]
[Link]​rie​[Link] Reindexa por filas.
Ver valores del df en forma de array
[Link]​rie​[Link] [Link]​nde​x(index = list)
[Link]
[Link]​rie​[Link] Mismo resultado
Dimens​iones del df
[Link]​nde​x(c​olumns = list)
Reinde​xación de series
Reindexa por columnas
Lectura y escritura de ficheros
[Link]​dex​(list)
[Link]​nde​x(index = list1, columns = list2)
df = [Link]​d_c​sv(​"​fil​e.c​sv") copia reindexada de una serie. El primer
Reindexa por filas y columnas
Lectura de fichero argumento siempre es el nuevo índice.
Si el nuevo índice es un subcon​junto del [Link]​_in​dex​("co​l")
df.to_​csv​('o​ut.z​ip', index=​False)
original, la serie generada no contendrá fija una columna del dataframe como
Guardar dataframe o serie
todos los valores de la serie de la que índice, descar​tando el índice existente.
partimos. si en el nuevo índice se Con el parámetro drop = False se
Operac​iones con dataframes
incluyen etiquetas no incluidas en el mantiene la columna.
[Link]​d(df2, fill_value = 0) índice original, la nueva serie incluirá
Con reindex se asignan valores NaN a los
establecar un valor predet​erm​inado para dicha etiqueta pero el valor asignado a
valores de filas o columnas que no existan,
aquellos valores que no se encuentren ella recibe el valor por defecto NaN. es
lo que se puede cambiar con el parámetro
en uno de los datafr​ames. person​ali​zable usando el parámetro
fill_v​alue, o los mismos valores que en las
fill_v​alue.
[Link]​taF​ram​[Link] series del parámetro method
[Link]​taF​ram​[Link]
[Link]​taF​ram​[Link]

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 6 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Edición de dataframes Edición de dataframes (cont) Selección de datos en series

[Link][1, 2] = -100 [Link]​op(​["A", "​C"], axis = 1) [Link](n)


Podemos modificar un valor concreto Para eliminar columnas, habría que devuelve el valor que ocupa el índice
usando los métodos loc o iloc, en función indicar el eje corres​pon​diente o usar el indicado, y devuelve un valor nulo en
de que queramos usar sus etiquetas o parámetro columns caso de que no exista.
índices.
[Link]​op(​columns = ["A", "​C"]) Si utilizamos el índice númerico implícito
df["​C"] = [-100, -200, -300, -400, -500, -600] como rango (s[1:3]), se selecc​ionan los
Podemos modificar una columna Multi-​índices a partir de un DataFrame valores desde el primer índice incluido
completa selecc​ion​ándola y asigná​‐ hasta el último sin incluir. Si se utilizan los
ndole, por ejemplo, una lista con los índices explíc​itos, se incluyen los valores
nuevos valores desde el primer hasta el último índice
incluyendo ambos.
df = [Link]() [Link]​["fe​b":"m​ar", "​‐
Sin embargo, si al utilizar un índice explícito
A":"B​"] = [[-100, -200], [-300, -400]]
númerico hacemos referencia a los datos
Si la selección es un bloque de datos de
con un rango, se sigue cogiendo desde el
un tamaño arbitr​ario, nos encont​ramos
primer valor incluido hasta el último sin
en el mismo escenario: o bien
incluir.
insertamos datos con el mismo tamaño
[Link][​"​nam​e"]
que la selección, o insertamos un único
valor que se propagará a toda la selecc​ionar un grupo de elementos por
selección. etiquetas y no por índice implícito.
Acepta listas y rangos (devuelve todos
df = [Link]() [Link]​["fe​b":"m​ar", "​‐
los elementos entre los límites
A":"B​"] = -1
indicados, ambos incluidos)
[Link]​re(​con​dition, iftrue, iffalse)
[Link][n]
filtra los valores contenidos en el
Extrae datos de la serie siempre a partir
dataframe de forma que solo los que
de los índices implícitos que éstos tienen
cumplan cierta condición se mantengan.
asignados. si el rango tiene la forma a:b,
El resto de valores son sustit​uidos por un
se incluyen todos los elementos desde
valor que, por defecto, es NaN, o por
aquel cuyo índice es a (incluido) hasta el
otro valor si se especi​fica.
df = [Link]​aFr​ame({ que tiene el índice b (sin incluir).
[Link]​op(​["fe​b", "​abr​"], axis = 0)
"​Yea​r":[​2018, 2018, 2018, s[s > 2]
elimina las filas o columnas indicadas y 2019, 2019, 2019],
Ejemplo para extraer valores de una
devuelve el resultado. lo que se muestra "​Cou​ntr​y": ["Sp​ain​", "​‐
serie con valores booleanos.
es el resultado de eliminar las filas
Por​tug​al", "​Fra​nce​", "​‐
indicadas del dataframe. Éste no se [Link][s > 2]
Spa​in", "​Por​tug​al", "​Fra​‐
modifica salvo que utilicemos el Mismo compor​tam​iento que el método
nce​"]
argumento inplace = True. anterior,
})
[Link]​op(​index = ["fe​b", "​abr​"])
Admite índices index = [Link]​tiI​nde​x.f​rom​‐
_fr​ame(df)

data = [Link]​aFr​ame​(data =
[18, 20, 10, 15, 12, 18], index
= index, columns = ["Sa​les​"])

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 7 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Selección de datos en series (cont) Inspección de series y dataframes (cont) Inspección de series y dataframes (cont)

[Link][(s > 2).values] [Link](frac = 0.6, random_state = 18) [Link]​e_c​oun​ts(​dropna = False)


Mismo compor​tam​iento que el método ver datos aleatorios de nuestra estruc​‐ devuelve una estructura conten​iendo los
anterior. Con iloc debe ser así puesto tura. el número de elementos devueltos valores presentes en la serie y el
que puede aceptar una lista de valores por defecto es uno. permite especi​ficar o número de ocurre​ncias de cada uno, Si
booleanos on un array NumPy, pero no bien el número de elementos a extraer o se trata de una serie numérica, en lugar
una serie de pandas que es lo que bien la fracción del número total de de devolver los valores distintos y el
genera este método. elementos a extraer (parám​etros x y número de ocurre​ncias, este método
frac, respec​tiv​ame​nte), pudiendo especi​‐ también puede agrupar los datos en "​‐
[Link](i)
ficar si la extracción se realiza con bin​s" y devolver una lista de bins
extrae y elimina un elemento de una
reemplazo o no (parámetro replace), los (indicando sus márgenes) con el
serie cuyo índice se indica como
pesos a aplicar a cada elemento para número de valores en cada uno de ellos
argumento. Si la serie tiene un índice
realizar una extracción aleatoria (bins = 5)
explícito, el argumento de pop hará
ponderada (parámetro weights), y una
referencia a este índice.
semilla para el generador de números Gestión de valores nulos
aleatorios que asegure la reprod​uci​‐
Inspección de series y dataframes [Link]​ull(s)
bilidad de la extracción (parámetro
devuelve una estructura con las mismas
[Link]() random​_state)
dimens​iones que la que se cede como
devuelve los primeros elementos de la [Link]()
argumento sustit​uyendo cada valor por
estruc​tura. Por defecto, se trata de los 5
devuelve inform​ación estadí​stica de los el booleano True si el corres​pon​diente
primeros elementos, pero podemos
datos del dataframe o de la serie. elemento es un valor nulo, y por el
especi​ficar el número que deseamos
acepta el parámetro percen​tiles conten​‐ booleano False en caso contrario
como argumento de la función.
iendo una lista (o semejante) de los
[Link]()
[Link]() percen​tiles a mostrar. También acepta
[Link]​ull(df)
muestran los últimos elementos de la los parámetros include y exclude para
especi​ficar los tipos de las caract​erí​‐ [Link]​ull()
estruc​tura. Si no indicamos otra cosa
como argumento, serán los 5 últimos sticas a incluir o excluir del resultado. [Link]()
elementos los que se muestren [Link]() filtra los valores para dejar solo aquellos
muestra un resumen de un dataframe, no nulos
no de una serie. Incluyendo inform​ación [Link]​pna()
sobre el tipo de los índices de filas y
Se aplica por defecto al eje 0, y borra
columnas, los valores no nulos y la
las filas que tengan un valor nulo en
memoria usada:
cualquiera de las columnas. Con how =
"​all​" se borran solo las filas que tengan
todos los valores nulos. Esto por defecto
es how="an​y"

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 8 of 10. [Link]
Python pandas Cheat Sheet
by julenx via [Link]/168626/cs/35356/

Gestión de valores nulos (cont)

[Link]​na(n)
permite sustituir los valores nulos de una
estructura pandas por otro valor según
ciertos criterios. Acepta los parámetros
method = "​ffi​ll" y method​="bf​ill​"

[Link]​lna(n)
Si usamos los métodos indicados arriba
también podemos cambiar el eje.

[Link]​lna​(axis = 1, method = "​bfi​ll").fi​llna(n)


asegur​arnos de que todos los elementos
han sido sustit​uidos adecua​damente

By julenx Published 13th November, 2022. Sponsored by [Link]


[Link]/julenx/ Last updated 13th November, 2022. Measure your website readability!
Page 9 of 10. [Link]

También podría gustarte