Pandas Big Data

Cargado por

Danilo Sanchez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

22 vistas12 páginas

Pandas Big Data

Cargado por

Danilo Sanchez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Pandas

En Python
Concepto

• Es un paquete que permite trabajar con datos multidimensionales, los

cuales son comunes en estadística, su nombre viene de panel dataset
• Es muy útil para manipular tablas de datos como lo son los
dataframes
• Es de tener en cuenta que diferentes tipos de variables pueden
encajar en la misma tabla.
• Está construido sobre Numpy, lo que hace que sea más rápido y
eficiente.
Crear dataframes

• 1. Se importa el paquete de pandas

import pandas as pd
• 2. Se pueden crear a partir de una lista de datos, para el ejemplo tenemos datos
de las redes sociales (nombre, cantidad_usuarios, pertenece o no a facebook y el
año)
# datos de Redes sociales 2020
fbk = ['Facebook', 2449, True, 2006]
twt = ['Twitter', 339, False, 2006]
ig = ['Instagram', 1000, True, 2010]
yt = ['YouTube', 2000, False, 2005]
lkn = ['LinkedIn', 663, False, 2003]
wsp = ['WhatsApp', 1600, True, 2009]
Crear dataframes

• 3. Se crea la lista con los nombres de las listas anteriores

• #Variable en donde están las listas
•
lista_rrss = [fbk, twt, ig, yt, lkn, wsp]
• 4. Para esto se utiliza la función pd.Dataframe
•
# crear dataframe a partir de listas
• df_rrss = pd.DataFrame(lista_rrss,
• columns = ['Nombre', 'Cantidad', 'ES_FBK',
'Año'])
•
print(df_rrss)
Crear dataframes

5. Resultado
Nombre Cantidad ES_FBK Año
0 Facebook 2449 True 2006
1 Twitter 339 False 2006
2 Instagram 1000 True 2010
3 YouTube 2000 False 2005
4 LinkedIn 663 False 2003
5 WhatsApp 1600 True 2009
Crear dataframes

Otra forma de crear dataframe es haciendo uso de dataframes vacíos

1. Aquí ya no pasamos una lista si no las columnas directamente
df_vacio = pd.DataFrame(columns = ['Nombre',
'Cantidad', 'ES_FBK', 'Año’])
2. Mostramos el dataframe y verificamos que está vacío
print(df_vacio)
Empty DataFrame
Columns: [Nombre, Cantidad, ES_FBK, Año]
Index: []
Crear dataframes
3. Para agregar los datos tenemos que asignar los elementos con la función append
df_vacio = df_vacio.append({'Nombre' : 'Facebook',
'Cantidad' : 2449,
'ES_FBK' : True,
'Año' : 2006}, ignore_index
True)
print(df_vacio)

0 Facebook 2449 True 2006

• Estas son algunas formas, pero lo más común es traer la data desde un archivo CSV o
Excel
Seleccionar elementos
• #Seleccionar elementos por etiquetas
• #Método de localización

• df_rrss.loc[1, 'Nombre’]

• #Seleccionar elementos por número

• df_rrss.iloc[1, 0]

•
#Seleccionar por columnas
• df_rrss['Nombre']
Seleccionar elementos
• #Seleccionar por filas
•
df_rrss.iloc[4]
•
#Seleccionar por condición booleana
•
df_rrss['Cantidad']>1500
•
print(df_rrss[df_rrss['Cantidad']>1500])
Seleccionar elementos
Resultado
Nombre Cantidad ES_FBK Año
0 Facebook 2449 True 2006
3 YouTube 2000 False 2005
5 WhatsApp 1600 True 2009
Ordenar Columnas

• Puede ser de forma ascendente

• Menor a mayor
• df_rrss.sort_values('Nombre', ascending=True)
• Descendente:
• Mayor a menor
• df_rrss.sort_values('Cantidad', ascending=False)

• Ordenar por dos columnas

• df_rrss.sort_values(['Año', 'Cantidad'],
ascending=[True, False])
Ing. Narly Sánchez
Gracias!

También podría gustarte

Unidad 2 Py
Aún no hay calificaciones
Unidad 2 Py
10 páginas
Ev2 Eq4 Reporte Tecnico Sobre Analisis de Datos Con Pandas
Aún no hay calificaciones
Ev2 Eq4 Reporte Tecnico Sobre Analisis de Datos Con Pandas
20 páginas
Introducción a DataFrames en Python
Aún no hay calificaciones
Introducción a DataFrames en Python
9 páginas
Manipulación de Datos con Pandas
Aún no hay calificaciones
Manipulación de Datos con Pandas
55 páginas
Pandas
Aún no hay calificaciones
Pandas
53 páginas
Análitica de Datos 2
Aún no hay calificaciones
Análitica de Datos 2
6 páginas
Introducción a Pandas para Big Data
Aún no hay calificaciones
Introducción a Pandas para Big Data
33 páginas
Introducción a DataFrames en Pandas
Aún no hay calificaciones
Introducción a DataFrames en Pandas
20 páginas
Pandas
100% (5)
Pandas
172 páginas
Introducción a Pandas en Python
Aún no hay calificaciones
Introducción a Pandas en Python
15 páginas
Prac 01
Aún no hay calificaciones
Prac 01
17 páginas
Actividad José Ruiz Implementación de Pandas
Aún no hay calificaciones
Actividad José Ruiz Implementación de Pandas
3 páginas
1.intro Python Pandas
Aún no hay calificaciones
1.intro Python Pandas
24 páginas
5 - Pandas
Aún no hay calificaciones
5 - Pandas
41 páginas
Clase - Python 6 (24 - II)
Aún no hay calificaciones
Clase - Python 6 (24 - II)
29 páginas
Introducción a DataFrames en Pandas
Aún no hay calificaciones
Introducción a DataFrames en Pandas
37 páginas
Uso de pd.cut en análisis de datos
Aún no hay calificaciones
Uso de pd.cut en análisis de datos
64 páginas
Programación de DataFrames y Arrays en Python
Aún no hay calificaciones
Programación de DataFrames y Arrays en Python
77 páginas
Manual Pandas
Aún no hay calificaciones
Manual Pandas
21 páginas
Libreria de Pandas
Aún no hay calificaciones
Libreria de Pandas
5 páginas
Práctica Pandas en Python: DataFrames
Aún no hay calificaciones
Práctica Pandas en Python: DataFrames
2 páginas
Manejo de Datos con Pandas en Python
Aún no hay calificaciones
Manejo de Datos con Pandas en Python
45 páginas
Introducción a DataFrames en Python Pandas
Aún no hay calificaciones
Introducción a DataFrames en Python Pandas
15 páginas
Python y Pandas para Ciencia de Datos
Aún no hay calificaciones
Python y Pandas para Ciencia de Datos
7 páginas
Introducción a Pandas en Python
Aún no hay calificaciones
Introducción a Pandas en Python
11 páginas
Manipulación de Datos con Pandas en Python
100% (1)
Manipulación de Datos con Pandas en Python
67 páginas
Crear DataFrames en Python con Pandas
Aún no hay calificaciones
Crear DataFrames en Python con Pandas
79 páginas
Introducción a Python y Pandas en Ciencia de Datos
Aún no hay calificaciones
Introducción a Python y Pandas en Ciencia de Datos
11 páginas
Modulo11 Pandas DataFrames
Aún no hay calificaciones
Modulo11 Pandas DataFrames
2 páginas
Guía de referencia de Pandas
100% (1)
Guía de referencia de Pandas
2 páginas
Taller de Pandas: Análisis de Datos
Aún no hay calificaciones
Taller de Pandas: Análisis de Datos
15 páginas
Gestión de Analítica de Datos Empresarial
Aún no hay calificaciones
Gestión de Analítica de Datos Empresarial
50 páginas
Power BI y Python en Minería 2024
Aún no hay calificaciones
Power BI y Python en Minería 2024
23 páginas
Pandas: Guía para Analistas de Datos
Aún no hay calificaciones
Pandas: Guía para Analistas de Datos
45 páginas
Introducción a Pandas: Datos y Análisis
Aún no hay calificaciones
Introducción a Pandas: Datos y Análisis
43 páginas
Limpieza de Datos
Aún no hay calificaciones
Limpieza de Datos
9 páginas
Introducción a Pandas para Análisis de Datos
Aún no hay calificaciones
Introducción a Pandas para Análisis de Datos
10 páginas
Introducción a Python y Pandas en Data Science
Aún no hay calificaciones
Introducción a Python y Pandas en Data Science
21 páginas
Herramientas IO en Pandas 1.4.4
Aún no hay calificaciones
Herramientas IO en Pandas 1.4.4
124 páginas
Clase 5 Python Resumen
Aún no hay calificaciones
Clase 5 Python Resumen
6 páginas
Unidad 2 Manipulación de Datos Con Pandas
Aún no hay calificaciones
Unidad 2 Manipulación de Datos Con Pandas
34 páginas
TEMA 4 - Análisis de Datos Parte 1 - Introducción A La Librería Pandas
Aún no hay calificaciones
TEMA 4 - Análisis de Datos Parte 1 - Introducción A La Librería Pandas
7 páginas
ProgrammToolsPython 3 2 2021
Aún no hay calificaciones
ProgrammToolsPython 3 2 2021
21 páginas
05 Analisis de Datos Con Pandas
Aún no hay calificaciones
05 Analisis de Datos Con Pandas
32 páginas
Introducción a Pandas en Python
Aún no hay calificaciones
Introducción a Pandas en Python
12 páginas
Introducción a Pandas en Python
Aún no hay calificaciones
Introducción a Pandas en Python
19 páginas
Libreria Pandas Conceptos Basicos
Aún no hay calificaciones
Libreria Pandas Conceptos Basicos
4 páginas
ADAT
Aún no hay calificaciones
ADAT
11 páginas
Data Science con Python: Guía Completa
100% (1)
Data Science con Python: Guía Completa
31 páginas
Introducción a Pandas para Análisis de Datos
Aún no hay calificaciones
Introducción a Pandas para Análisis de Datos
5 páginas
Guía de Pandas: Análisis y Manipulación de Datos
Aún no hay calificaciones
Guía de Pandas: Análisis y Manipulación de Datos
17 páginas
Guía Rápida de Pandas para Datos
Aún no hay calificaciones
Guía Rápida de Pandas para Datos
17 páginas
Pandas y Python
100% (1)
Pandas y Python
24 páginas
Manejo de datos con Pandas en Python
Aún no hay calificaciones
Manejo de datos con Pandas en Python
24 páginas
Análisis y Manipulación de DataFrames en Python
Aún no hay calificaciones
Análisis y Manipulación de DataFrames en Python
6 páginas
PandasDFNotes Es
Aún no hay calificaciones
PandasDFNotes Es
20 páginas
Introducción a Machine Learning y Python
Aún no hay calificaciones
Introducción a Machine Learning y Python
78 páginas
Hernández Mota, J. - Huellas e Indicios en Los Accidentes de Tránsito Pp. 223-241
Aún no hay calificaciones
Hernández Mota, J. - Huellas e Indicios en Los Accidentes de Tránsito Pp. 223-241
19 páginas
Algoritmos de Operaciones Continúas
Aún no hay calificaciones
Algoritmos de Operaciones Continúas
4 páginas
Instrumentación Industrial: PLC y SCADA
Aún no hay calificaciones
Instrumentación Industrial: PLC y SCADA
41 páginas
Examen Semana 4 Investigacion de Operaciones
100% (2)
Examen Semana 4 Investigacion de Operaciones
14 páginas
Sistemas y Datos en CNCI Virtual
Aún no hay calificaciones
Sistemas y Datos en CNCI Virtual
8 páginas
Integrador II Syllabus V0
Aún no hay calificaciones
Integrador II Syllabus V0
2 páginas
Emprendimiento y Matemáticas en 2024
Aún no hay calificaciones
Emprendimiento y Matemáticas en 2024
7 páginas
Instrumentos de Medición en Metrología
Aún no hay calificaciones
Instrumentos de Medición en Metrología
26 páginas
Xming Tutorial
Aún no hay calificaciones
Xming Tutorial
3 páginas
Dibujo de Olas de Oscilación en Física
Aún no hay calificaciones
Dibujo de Olas de Oscilación en Física
2 páginas
Examen Química Acceso Universidad 2024-25
Aún no hay calificaciones
Examen Química Acceso Universidad 2024-25
210 páginas
Lista Ezviz Junio 2023
Aún no hay calificaciones
Lista Ezviz Junio 2023
4 páginas
Spark: Computación en Clúster Eficiente
Aún no hay calificaciones
Spark: Computación en Clúster Eficiente
7 páginas
TALLER No1 - Guía No1.
Aún no hay calificaciones
TALLER No1 - Guía No1.
3 páginas
Horno Combi HOBART HPJ101G: Especificaciones y Uso
Aún no hay calificaciones
Horno Combi HOBART HPJ101G: Especificaciones y Uso
12 páginas
Cuadernos Energias Renovables para Todos Hidrogeno y Pila de Combustible
Aún no hay calificaciones
Cuadernos Energias Renovables para Todos Hidrogeno y Pila de Combustible
20 páginas
Practica No 1 Instrumentos de Medicion PDF
Aún no hay calificaciones
Practica No 1 Instrumentos de Medicion PDF
10 páginas
Adsorción de Carbón Activado y Langmuir
Aún no hay calificaciones
Adsorción de Carbón Activado y Langmuir
11 páginas
Eco Abdomen Completo Mujer
80% (5)
Eco Abdomen Completo Mujer
2 páginas
Dialnet ObjetivamosLosGestosCaracteristicosDeLaMano 4517329
Aún no hay calificaciones
Dialnet ObjetivamosLosGestosCaracteristicosDeLaMano 4517329
4 páginas
Interes Compuesto 4
Aún no hay calificaciones
Interes Compuesto 4
11 páginas
Evaluación Bimestral Matemáticas 6°
Aún no hay calificaciones
Evaluación Bimestral Matemáticas 6°
5 páginas
Mantenimiento y partes de incubadoras
Aún no hay calificaciones
Mantenimiento y partes de incubadoras
8 páginas
08 Descargar División de Polinomios Metodo de Ruffini
Aún no hay calificaciones
08 Descargar División de Polinomios Metodo de Ruffini
11 páginas
Bombas LGLD
Aún no hay calificaciones
Bombas LGLD
3 páginas
Problemas de Volumenes de Revolucion
Aún no hay calificaciones
Problemas de Volumenes de Revolucion
3 páginas
Cristalización: Proceso y Aplicaciones
Aún no hay calificaciones
Cristalización: Proceso y Aplicaciones
14 páginas
Manual de Prácticas de Farmacognosia II
100% (1)
Manual de Prácticas de Farmacognosia II
64 páginas
Introducción A La Química Analítica - 1
Aún no hay calificaciones
Introducción A La Química Analítica - 1
5 páginas
Dominio, Rango y Funciones Matemáticas
Aún no hay calificaciones
Dominio, Rango y Funciones Matemáticas
7 páginas