PROCESAMIENTO DE
ARCHIVOS DE EXCEL
PREPARATIVOS
Para poder manipular archivos de Excel mediante Python, debes tener
instalado pandas y la librería xlrd.
En Thonny, la instalación se hace con los siguientes pasos:
2
PREPARATIVOS
También descarga la tabla vendedores.xlsx, la cual muestra información de los vendedores en una
empresa, dividida por regiones (norte, sur, este, oeste).
3
Carga de un archivo de Excel
Podemos utilizar la librería de Pandas para poder leer la información
contenida en un archivo de Excel.
Para ello, utiliza el método read_excel(“nombre del archivo”)
La información será guardará en
una tabla también conocida como
DataFrame
Asegúrate de que
escribiste
correctamente el
nombre del
archivo
Puedes usar print
para visualizar la
tabla, aunque
aparecerá
recortada en el
Shell.
5
Extracción de información por columna
Si requieres guardar la información de una columna entera en una lista,
utiliza la siguiente sintaxis:
lista = tabla[‘Columna’]
La lista guarda los
nombres de los
vendedores de las
cuatro regiones.
7
Medidas descriptivas
Al guardar la información en listas, puedes obtener diversas medidas
descriptivas, tales como el valor más grande, el más pequeño, el promedio,
la cantidad de registros, etc.
lista.max()
lista.min()
lista.mean()
lista.count()
Una forma más directa es
hacerlo en una sola sentencia
tabla[‘SALARIO’].max()
9
Extracción de subtablas
Para poder obtener una subtabla de la tabla principal, debes de agruparla
por alguna columna, y después especificar el valor.
Para ello, utiliza el método groupby(‘Columna’).get_group(‘Valor’)
Este método es
utilizado por el
Dataframe creado
anteriormente (la
tabla principal)
El nombre de la
columna y del
valor deben de
coincidir con la
tabla de Excel
tablaSur es la
subtabla con la
información de la
Región Sur.
11
¡A programar!
Realiza un programa en Python con las siguientes indicaciones:
1. Carga la información del archivo vendedores.xlsx en un Dataframe llamado reporte.
2. Extrae una subtabla llamada reporteNorte con la información de la región Norte.
3. Guarda la información de las Ventas Totales de la subtabla reporteNorte en una lista
llamada ventasNorte.
4. Muestra el promedio de las Ventas Totales de la región Norte.
Continua
¡A programar!
5. Guarda los nombres de los vendedores de la región Norte en una lista llamada
vendedoresNorte
6. Guarda los salarios de los vendedores de la región Norte en una lista llamada
salariosNorte
7. Mediante la librería matplotlib realiza una gráfica de barras de los nombres de los
vendedores y sus salarios de la región Norte. Agrega un título y etiquetas a los ejes.