0% encontró este documento útil (0 votos)
21 vistas21 páginas

Análisis de Datos con Pandas en Python

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
21 vistas21 páginas

Análisis de Datos con Pandas en Python

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CONTADURÍA PÚBLICA Y ADMINISTRACIÓN

Análisis de datos

Evidencia 1
Lic En Administración
Semestre: 6° Grupo: FA
Maestro: OLMEDO AGUILAR JOSE MANUEL

Integrantes de equipo:
1997817 GONZALEZ VALDES JESUS GERARDO
2012821 GUEVARA SIERRA ANA LUCIA
1960644 SALDAÑA ACEVEDO CARLO DAVID
1863147 VEGA VAZQUEZ MAURICIO
1994618 VELA ARANDA VANESSA ARELY
2129120 VIERA RANGEL GABRIELA JAQUELINE
Introducción
El análisis de datos utilizando pandas en Python es una herramienta que permite organizar,
manipular y analizar conjuntos de datos de manera eficiente. Pandas es una biblioteca
ampliamente utilizada, que facilita el manejo de grandes volúmenes de información y permite
realizar operaciones complejas de manera sencilla y estructurada.

En este caso, hemos aplicado pandas para trabajar con un DataFrame en el que generamos
18 series diferentes en el que cada una contiene información sobre 10 tipos diferentes de
objetos. A través de diversos comandos, hemos realizado operaciones que nos permiten
extraer información relevante sobre estos temas dependiendo el tema algunos ejemplos
serian como la longitud de sus nombres, su tamaño, su nivel de peligrosidad, o ordenar
alfabéticamente.

Una de las operaciones realizadas fue la organización de los temas fue por la longitud de sus
nombres. Esta operación es útil para identificar patrones en los nombres de los objetos.

En conjunto, estas operaciones realizadas con pandas no solo nos permiten organizar y
categorizar la información de manera eficiente, sino que también nos proporcionan una
visión más clara y detallada de cada tipo de tema. Este enfoque facilita el análisis de los
datos y nos permite tomar decisiones basadas en la información obtenida.
# -*- coding: utf-8 -*-
"""evidencia 1 aldat

Automatically generated by Colab.

Original file is located at

[Link]
x3U

ANA LUCIA GUEVARA SIERRA 2012821


nombres de mujeres
"""

import pandas as pd

# Crear el DataFrame
df = [Link]({'Nombres': ['MarÃ-a', 'SofÃ-a', 'Valentina',
'Isabella', 'Camila', 'Valeria', 'Martina', 'Gabriela', 'LucÃ-a',
'Daniela']})
print(df)

import pandas as pd

# Mostrar las primeras 5 filas


print([Link]())

import pandas as pd

# Agregar una columna con la longitud de los nombres


df['Longitud'] = df['Nombres'].apply(len)
print(df)

import pandas as pd

# Filtrar nombres con más de 6 caracteres


nombres_largos = df[df['Longitud'] > 6]
print(nombres_largos)

import pandas as pd
# Ordenar el DataFrame por la longitud de los nombres
df_ordenado = df.sort_values(by='Longitud', ascending=False)
# Mostrar el DataFrame ordenado
print(df_ordenado)

"""generos de musica

"""

import pandas as pd

# crear el DataFrame
df = [Link]({'Géneros': ['Rock', 'Pop', 'Jazz', 'Reggaetón',
'Clásica', 'Hip-Hop', 'Electrónica', 'Salsa', 'Blues', 'Country']})
print(df)

# Mostrar la estructura del DataFrame


print([Link]())

# Agregar una columna con la primera letra de cada género


df['Primera_Letra'] = df['Géneros'].str[0]
print(df)

# Filtrar géneros que empiezan con "C"


generos_c = df[df['Primera_Letra'] == 'C']
print(generos_c)

# Contar cuántos géneros empiezan con cada letra


conteo_letras = df['Primera_Letra'].value_counts()
print(conteo_letras)

"""tipos de dinosaurios"""

import pandas as pd

# Crear el DataFrame con nombres de dinosaurios


df = [Link]({
'Dinosaurios': ['Tyrannosaurus', 'Triceratops', 'Velociraptor',
'Stegosaurus', 'Brachiosaurus', 'Pteranodon', 'Spinosaurus',
'Ankylosaurus', 'Diplodocus', 'Parasaurolophus']
})
print(df)

# Agregar una columna con la longitud del nombre


df['Longitud_Nombre'] = df['Dinosaurios'].apply(len)
print(df)

# Agregar una columna con el tamaño (en metros, como ejemplo)


df['Tamaño_m'] = [12, 9, 2, 9, 25, 6, 15, 6, 27, 10]
print(df)

# Ordenar de mayor a menor tamaño


df_ordenado_tamaño = df.sort_values(by='Tamaño_m', ascending=False)
print(df_ordenado_tamaño)

# Agregar una columna con la dieta


df['Dieta'] = ['CarnÃ-voro', 'HerbÃ-voro', 'CarnÃ-voro', 'HerbÃ-voro',
'HerbÃ-voro', 'CarnÃ-voro', 'CarnÃ-voro', 'HerbÃ-voro', 'HerbÃ-voro',
'HerbÃ-voro']
print(df)

# Filtrar por carnÃ-voros


df_carnivoros = df[df['Dieta'] == 'CarnÃ-voro']
print(df_carnivoros)

# Filtrar por herbÃ-voros


df_herbivoros = df[df['Dieta'] == 'HerbÃ-voro']
print(df_herbivoros)

# Agregar una columna con el nivel de peligrosidad (1 más peligroso,


10 menos peligroso)
df['Peligrosidad'] = [1, 5, 2, 6, 8, 3, 4, 7, 9, 6]
print(df)

# Ordenar de más a menos peligroso


df_ordenado_peligro = df.sort_values(by='Peligrosidad')
print(df_ordenado_peligro)

# Agregar una columna indicando si volaban o no


df['Volador'] = [False, False, False, False, False, True, False,
False, False, False]
print(df)

# Filtrar los que volaban


df_voladores = df[df['Volador'] == True]
print(df_voladores)

# Filtrar los que no volaban


df_no_voladores = df[df['Volador'] == False]
print(df_no_voladores)

"""# Nueva sección

Carlo David Saldaña Acevedo 1960644


tipos de carros
"""

import pandas as pd

# Datos de ejemplo
data = {
'PaÃ-s': ['China', 'India', 'Estados Unidos', 'Indonesia',
'Pakistán',
'Brasil', 'Nigeria', 'Bangladesh', 'Rusia', 'México'],
'Capital': ['PekÃ-n', 'Nueva Delhi', 'Washington, D.C.',
'Yakarta', 'Islamabad',
'Brasilia', 'Abuya', 'Daca', 'Moscú', 'Ciudad de
México'],
'Población': [1400000000, 1366000000, 331000000, 273000000,
225000000,
213000000, 206000000, 166000000, 146000000,
128000000],
'Superficie': [9640000, 3287263, 9833520, 1910931, 88191,
8515767, 923768, 147570, 17098242, 1964375],
'Continente': ['Asia', 'Asia', 'América del Norte', 'Asia',
'Asia',
'América del Sur', 'Õfrica', 'Asia', 'Europa',
'América del Norte'],
'Idioma': ['Chino', 'Hindi', 'Inglés', 'Indonesio', 'Urdu',
'Portugués', 'Inglés', 'BengalÃ-', 'Ruso',
'Español'],
'Idioma': ['Chino', 'Hindi', 'Inglés', 'Indonesio', 'Urdu',
'Portugués', 'Inglés', 'BengalÃ-', 'Ruso',
'Español'],
'Calidad de Vida': [6.3, 5.9, 7.1, 5.7, 5.6,
6.1, 5.8, 6.0, 6.5, 6.2] # Escala de 1 a 10
}

# Crear el DataFrame
df = [Link](data)

# Mostrar el DataFrame
print(df)

"""vehiculos"""

import pandas as pd

# Datos de ejemplo
data = {
'VehÃ-culo': ['Toyota Corolla', 'Honda Civic', 'Ford Focus',
'Chevrolet Cruze', 'Hyundai Elantra',
'Nissan Sentra', 'Mazda 3', 'Subaru Impreza',
'Volkswagen Jetta', 'Kia Forte'],
'Uso (mil km)': [30, 40, 25, 35, 20, 45, 30, 15, 50, 22],
'Velocidad (km/h)': [180, 190, 170, 160, 185, 175, 180, 165, 200,
170],
'Eficiencia (km/l)': [15, 14, 13, 12, 16, 14, 13, 12, 15, 14]
}

df = [Link](data)
print(df)

# VehÃ-culos más utilizados


df_mas_utilizados = df.sort_values(by='Uso (mil km)', ascending=False)
print("VehÃ-culos más utilizados:")
print(df_mas_utilizados)

# VehÃ-culos menos utilizados


df_menos_utilizados = df.sort_values(by='Uso (mil km)')
print("\nVehÃ-culos menos utilizados:")
print(df_menos_utilizados)

# VehÃ-culos más veloces


df_mas_veloces = df.sort_values(by='Velocidad (km/h)',
ascending=False)
print("VehÃ-culos más veloces:")
print(df_mas_veloces)

# VehÃ-culos menos veloces


df_menos_veloces = df.sort_values(by='Velocidad (km/h)')
print("\nVehÃ-culos menos veloces:")
# VehÃ-culos ordenados por orden alfabético
df_orden_alfabetico = df.sort_values(by='VehÃ-culo')
print("VehÃ-culos ordenados por orden alfabético:")
print(df_orden_alfabetico)

# VehÃ-culos más eficaces


df_mas_eficaces = df.sort_values(by='Eficiencia (km/l)',
ascending=False)
print("VehÃ-culos más eficaces:")
print(df_mas_eficaces)

# VehÃ-culos menos eficaces


df_menos_eficaces = df.sort_values(by='Eficiencia (km/l)')
print("\nVehÃ-culos menos eficaces:")
print(df_menos_eficaces)

"""bebidas"""

import pandas as pd

# Crear un DataFrame de ejemplo con 10 bebidas


data = {
'Bebida': ['Café', 'Té', 'Jugo de Naranja', 'Soda', 'Cerveza',
'Vino', 'Agua Mineral', 'Limonada', 'Batido de Fresa', 'Espresso'],
'Popularidad': [8, 7, 6, 9, 5, 4, 10, 6, 7, 9], # Escala de 1 a
10
'Ventas': [150, 200, 120, 250, 100, 80, 300, 130, 110, 170], #
Unidades vendidas
'Costo': [2.5, 1.5, 3.0, 1.0, 4.5, 7.0, 1.2, 2.0, 5.0, 3.5], #
Precio en dólares
'Ingredientes': [3, 2, 4, 2, 3, 2, 1, 3, 4, 2] # Número de
ingredientes
}

df = [Link](data)
print(df)

# 1. Bebidas más populares


df_populares = df.sort_values(by='Popularidad', ascending=False)
print("Bebidas más populares:")
print(df_populares)

# 2. Bebidas más vendidas


df_vendidas = df.sort_values(by='Ventas', ascending=False)
print("\nBebidas más vendidas:")
print(df_vendidas)

# 3. Bebidas ordenadas por orden alfabético


df_alfabetico = df.sort_values(by='Bebida')
print("\nBebidas ordenadas por orden alfabético:")
print(df_alfabetico)

# 4. Bebidas más costosas


df_costosas = df.sort_values(by='Costo', ascending=False)
print("\nBebidas más costosas:")
print(df_costosas)

# 5. Bebidas con más ingredientes


df_ingredientes = df.sort_values(by='Ingredientes', ascending=False)
print("\nBebidas con más ingredientes:")
print(df_ingredientes)

"""# Nueva sección

Jesus Gerardo Gonzalez Valdés 1997817


gatos
"""

import pandas as pd

# Definimos los datos


data = {
'Nombre': ['Persa', 'BengalÃ-', 'Siames', 'Sphynx', 'Maine Coon',
'Ragdoll', 'British Shorthair', 'Abisinio', 'Scottish Fold',
'Savannah'],
'Raza': ['Persa', 'BengalÃ-', 'Siames', 'Sphynx', 'Maine Coon',
'Ragdoll', 'British Shorthair', 'Abisinio', 'Scottish Fold',
'Savannah'],
'Raza': ['Persa', 'BengalÃ-', 'Siames', 'Sphynx', 'Maine Coon',
'Ragdoll', 'British Shorthair', 'Abisinio', 'Scottish Fold',
'Savannah'],
'Raza': ['Persa', 'BengalÃ-', 'Siames', 'Sphynx', 'Maine Coon',
'Ragdoll', 'British Shorthair', 'Abisinio', 'Scottish Fold',
'Savannah'],
'Tamaño': ['Pequeño', 'Mediano', 'Pequeño', 'Pequeño',
'Grande', 'Grande', 'Mediano', 'Mediano', 'Mediano', 'Grande'],
'PaÃ-s de Origen': ['Irán', 'India', 'Tailandia', 'Canadá',
'[Link].', '[Link].', 'Reino Unido', 'EtiopÃ-a', 'Reino Unido',
'[Link].'],
'Peligroso': [False, False, False, False, False, False, False,
False, False, True]
}

# Crear DataFrame
df = [Link](data)
print(df)

# 1. Ordenamos el DataFrame de A a Z por el nombre de los gatos


df_ordenado_nombre = df.sort_values(by='Nombre')
print(df_ordenado_nombre)

# 2. Filtrar gatos por raza


df_raza = [Link]('Raza').size()
print(df_raza)

# 3. Filtrar por tamaño (grande o pequeño)


df_tamaño = [Link]('Tamaño').size()
print(df_tamaño)
# 4. Filtrar por paÃ-s de origen
df_pais = [Link]('PaÃ-s de Origen').size()
print(df_pais)

# 5. Filtrar por si son peligrosos o no


df_peligrosos = [Link]('Peligroso').size()
print(df_peligrosos)

"""comida para gatos"""

import pandas as pd

# Crear el DataFrame con información de 10 tipos de comida para gatos


data = {
'Tipo de Comida': ['Croquetas', 'Paté', 'Comida húmeda', 'Comida
seca', 'Comida orgánica',
'Comida sin grano', 'Comida casera', 'Snacks',
'Comida para gatos mayores',
'Comida medicada'],
'Recomendable': [True, True, True, False, True, True, True, True,
True, False],
'Origen': ['Estados Unidos', 'Francia', 'Reino Unido', 'México',
'Canadá',
'España', 'Italia', 'Alemania', 'Australia',
'Japón'],
'Tipo de Gatos': ['Adultos', 'Cachorros', 'Adultos', 'Todos',
'Adultos',
'Adultos con sensibilidad', 'Todos', 'Adultos',
'Mayores', 'Gatos con problemas de salud']
}

df = [Link](data)
print(df)

# 1. Mostrar el DataFrame inicial


print("1. DataFrame inicial:")
print(df)

# 2. Ordenar alfabéticamente por la columna 'Tipo de Comida'


df_ordenado = df.sort_values(by='Tipo de Comida')
print("\n2. DataFrame ordenado alfabéticamente por 'Tipo de
Comida':")
print(df_ordenado)

# 3. Filtrar las comidas que son recomendables


df_recomendable = df[df['Recomendable'] == True]
print("\n3. Comidas recomendables:")
print(df_recomendable)

# 4. Mostrar solo las columnas 'Tipo de Comida' y 'Origen'


df_origen = df[['Tipo de Comida', 'Origen']]
print("\n4. Columnas 'Tipo de Comida' y 'Origen':")
print(df_origen)
# 5. Agrupar por 'Tipo de Gatos' y contar cuántos tipos de comida hay
para cada grupo
df_agrupado = [Link]('Tipo de
Gatos').size().reset_index(name='Cantidad')
print("\n5. Comida agrupada por 'Tipo de Gatos':")
print(df_agrupado)

"""correas"""

import pandas as pd

# Crear el DataFrame inicial


data = {
"Correa": ["Correa A", "Correa B", "Correa C", "Correa D", "Correa
E", "Correa F", "Correa G", "Correa H", "Correa I", "Correa J"],
"Tipo": ["Retráctil", "Simple", "Arnés", "Retráctil", "Simple",
"Arnés", "Retráctil", "Simple", "Arnés", "Retráctil"],
"Buena Calidad": [True, False, True, True, False, True, False,
True, True, False],
"Origen": ["EEUU", "China", "España", "México", "Francia",
"Brasil", "Japón", "Alemania", "Italia", "Canadá"],
"Larga": [True, False, True, True, False, True, False, True, True,
False]
}

df = [Link](data)

# Mostrar el DataFrame original


print("DataFrame original:")
print(df)

# Ordenar por el nombre de la correa alfabéticamente de A a Z


df_sorted_az = df.sort_values(by="Correa")
print("\nOrdenado de la A a la Z:")
print(df_sorted_az)

# Filtrar correas de tipo 'Retráctil'


df_retractil = df[df["Tipo"] == "Retráctil"]
print("\nFiltradas por tipo 'Retráctil':")
print(df_retractil)

# Filtrar las correas que son de buena calidad


df_buena_calidad = df[df["Buena Calidad"] == True]
print("\nFiltradas por buena calidad:")
print(df_buena_calidad)

# Agrupar por origen y contar cuántas correas hay por cada origen
df_origen = [Link]("Origen").size().reset_index(name="Cantidad")
print("\nAgrupadas por origen:")
print(df_origen)

# Filtrar las correas que son largas


df_largas = df[df["Larga"] == True]
print("\nFiltradas por si son largas:")
print(df_largas)

"""# Nueva sección

Mauricio vega Vazquez 1863147


instrumentos
"""

import pandas as pd

# Crear un DataFrame con información adicional sobre cada instrumento


data = {
'Instrumento': ['Guitarra', 'Piano', 'BaterÃ-a', 'ViolÃ-n',
'Saxofón',
'Flauta', 'Trompeta', 'Bajo', 'Arpa',
'Clarinete'],
'Precio': [300, 5000, 1500, 1200, 2500, 200, 800, 400, 7000, 600],
'Dificultad': [3, 5, 4, 5, 4, 2, 3, 3, 5, 3], # 1 = más fácil,
5 = más difÃ-cil
'Popularidad': [5, 5, 4, 4, 3, 4, 3, 4, 2, 3], # 1 = menos
popular, 5 = más popular
'Tipo': ['Cuerdas', 'Cuerdas', 'Percusión', 'Cuerdas', 'Viento',
'Viento', 'Viento', 'Cuerdas', 'Cuerdas', 'Viento'],
'Tamaño': [4, 5, 4, 3, 3, 2, 3, 4, 6, 2] # 1 = más pequeño, 6
= más grande
}

df = [Link](data)
print(df)

# 1. Ordenar del más caro al más barato


df_ordenado_precio = df.sort_values(by='Precio', ascending=False)
print(df_ordenado_precio)

# 2. Ordenar del más al menos difÃ-cil de aprender


df_ordenado_dificultad = df.sort_values(by='Dificultad',
ascending=False)
print(df_ordenado_dificultad)

# 3. Ordenar del más popular al menos popular


df_ordenado_popularidad = df.sort_values(by='Popularidad',
ascending=False)
print(df_ordenado_popularidad)

# 4. Ordenar primero por tipo de instrumento (Viento -> Cuerdas)


df_ordenado_tipo = df.sort_values(by='Tipo')
print(df_ordenado_tipo)

# 5. Ordenar del más grande al más pequeño


df_ordenado_tamaño = df.sort_values(by='Tamaño', ascending=False)
print(df_ordenado_tamaño)

"""comida"""
import pandas as pd

# Crear un DataFrame con información adicional sobre cada comida


data = {
'Comida': ['Pizza', 'Hamburguesa', 'Ensalada', 'Sushi', 'Pasta',
'Tacos', 'Pollo Frito', 'Sopa', 'Pan', 'Helado'],
'Consumo': [5, 4, 4, 3, 4, 3, 3, 2, 5, 3], # 1 = menos consumida,
5 = más consumida
'Popularidad': [5, 5, 4, 4, 4, 4, 3, 3, 4, 5], # 1 = menos
popular, 5 = más popular
'Calidad': [4, 3, 5, 5, 4, 4, 2, 3, 3, 4], # 1 = peor, 5 = mejor
'Precio': [3, 2, 4, 5, 3, 2, 2, 3, 1, 2], # 1 = más barata, 5 =
más cara
'Saludable': [2, 1, 5, 4, 3, 3, 1, 4, 3, 2] # 1 = menos
saludable, 5 = más saludable
}

df = [Link](data)

# Mostrar el DataFrame
print(df)

# 1. Ordenar de la comida más consumida a la menos consumida


df_ordenado_consumo = df.sort_values(by='Consumo', ascending=False)
print(df_ordenado_consumo)

# 2. Ordenar de la más popular a la menos popular


df_ordenado_popularidad = df.sort_values(by='Popularidad',
ascending=False)
print(df_ordenado_popularidad)

# 3. Ordenar de la mejor comida a la peor


df_ordenado_calidad = df.sort_values(by='Calidad', ascending=False)
print(df_ordenado_calidad)

# 4. Ordenar de la más cara a la más barata


df_ordenado_precio = df.sort_values(by='Precio', ascending=False)
print(df_ordenado_precio)

# 5. Ordenar de la más saludable a la menos saludable


df_ordenado_saludable = df.sort_values(by='Saludable',
ascending=False)
print(df_ordenado_saludable)

"""deportes"""

import pandas as pd

# Crear un DataFrame con información adicional sobre cada deporte


data = {
'Deporte': ['Fútbol', 'Baloncesto', 'Tenis', 'Boxeo',
'Natación',
'Ciclismo', 'EsquÃ-', 'Escalada', 'Atletismo',
'Golf'],
'Antigüedad': [1863, 1891, 1873, 1867, 1837, 1817, 1861, 1960,
776, 1744], # Año de origen aproximado
'Popularidad': [5, 4, 4, 3, 4, 3, 2, 2, 4, 3], # 1 = menos
popular, 5 = más popular
'Riesgo': [3, 2, 2, 5, 1, 4, 5, 5, 2, 1], # 1 = menos riesgoso, 5
= más riesgoso
'EconomÃ-a': [4, 4, 3, 2, 3, 3, 2, 2, 3, 3], # 1 = más
económico, 5 = menos económico
'Practicado': [5, 4, 4, 3, 5, 4, 2, 2, 5, 3] # 1 = menos
practicado, 5 = más practicado
}

df = [Link](data)
print(df)

# 1. Ordenar del deporte más antiguo al más nuevo


df_ordenado_antiguedad = df.sort_values(by='Antigüedad')
print(df_ordenado_antiguedad)

# 2. Ordenar del más popular al menos popular


df_ordenado_popularidad = df.sort_values(by='Popularidad',
ascending=False)
print(df_ordenado_popularidad)

# 3. Ordenar del menos riesgoso al más riesgoso


df_ordenado_riesgo = df.sort_values(by='Riesgo')
print(df_ordenado_riesgo)

# 4. Ordenar del deporte con más economÃ-a (más económico) al de


menos
df_ordenado_economia = df.sort_values(by='EconomÃ-a')
print(df_ordenado_economia)

# 5. Ordenar del más practicado al menos practicado


df_ordenado_practicado = df.sort_values(by='Practicado',
ascending=False)
print(df_ordenado_practicado)

"""# Nueva sección

Vela Aranda Vanessa Arely 1994618


reptiles
"""

import pandas as pd

# Crear un DataFrame con los reptiles y sus caracterÃ-sticas


data = {
'Nombre': ['Iguana', 'Cocodrilo', 'Dragón barbudo', 'Gecko
leopardo', 'Tortuga de Galápagos',
'Camaleón', 'Serpiente de cascabel', 'Boa
constrictora', 'Monstruo de Gila', 'Krait'],
'Tamaño_cm': [150, 500, 60, 25, 120, 40, 90, 150, 35, 80],
'Peligrosidad': [2, 5, 3, 2, 1, 3, 4, 4, 2, 5],
'Común': [5, 2, 3, 4, 1, 4, 3, 3, 3, 2],
'Vuelo': ['No', 'No', 'No', 'No', 'No', 'No', 'No', 'No', 'No',
'No']
}

df = [Link](data)
print(df)

# Orden alfabético
df_sorted_alpha = df.sort_values(by='Nombre')
print("Orden alfabético:")
print(df_sorted_alpha)

# Del más grande al más pequeño


df_sorted_size = df.sort_values(by='Tamaño_cm', ascending=False)
print("\nDel más grande al más pequeño:")
print(df_sorted_size)

# Del más al menos peligroso


df_sorted_danger = df.sort_values(by='Peligrosidad', ascending=False)
print("\nDel más al menos peligroso:")
print(df_sorted_danger)

# Del más común al más raro


df_sorted_common = df.sort_values(by='Común')
print("\nDel más común al más raro:")
print(df_sorted_common)

# Si volaban o no
df_sorted_flying = df.sort_values(by='Vuelo')
print("\nSi volaban o no:")
print(df_sorted_flying)

"""insectos"""

# Crear un DataFrame con los insectos y sus caracterÃ-sticas


data_insectos = {
'Nombre': ['Abeja', 'Mosquito', 'Mariposa', 'Escarabajo',
'Chinche',
'Cucaracha', 'Hormiga', 'Libélula', 'Mantis
religiosa', 'Termita'],
'Tamaño_mm': [12, 7, 50, 20, 15, 25, 5, 80, 80, 10],
'Peligrosidad': [2, 4, 1, 2, 3, 3, 2, 1, 2, 3],
'Común': [1, 1, 2, 3, 4, 3, 1, 2, 3, 4],
'Vuelo': ['SÃ-', 'SÃ-', 'SÃ-', 'No', 'No', 'No', 'No', 'SÃ-',
'SÃ-', 'No']
}

df_insectos = [Link](data_insectos)
print(df)

# Orden alfabético
df_sorted_alpha_insectos = df_insectos.sort_values(by='Nombre')
print("Orden alfabético:")
print(df_sorted_alpha_insectos)

# Del más grande al más pequeño


df_sorted_size_insectos = df_insectos.sort_values(by='Tamaño_mm',
ascending=False)
print("\nDel más grande al más pequeño:")
print(df_sorted_size_insectos)

# Del más al menos peligroso


df_sorted_danger_insectos = df_insectos.sort_values(by='Peligrosidad',
ascending=False)
print("\nDel más al menos peligroso:")
print(df_sorted_danger_insectos)

# Del más común al más raro


df_sorted_common_insectos = df_insectos.sort_values(by='Común')
print("\nDel más común al más raro:")
print(df_sorted_common_insectos)

# Si volaban o no
df_sorted_flying_insectos = df_insectos.sort_values(by='Vuelo')
print("\nSi volaban o no:")
print(df_sorted_flying_insectos)

"""mascotas"""

import pandas as pd

# Crear un DataFrame con los tipos de mascotas y sus caracterÃ-sticas


data_mascotas = {
'Nombre': ['Perro', 'Gato', 'Pájaro', 'Conejo', 'Hámster',
'Tortuga', 'Pez', 'Cobaya', 'Serpiente', 'Rata'],
'Tamaño_cm': [60, 30, 20, 30, 15, 30, 15, 25, 100, 25],
'Peligrosidad': [2, 1, 2, 1, 1, 1, 1, 1, 3, 2],
'Común': [1, 1, 2, 3, 3, 4, 4, 3, 2, 3],
'Vuelo': ['No', 'No', 'SÃ-', 'No', 'No', 'No', 'No', 'No', 'No',
'No']
}

df_mascotas = [Link](data_mascotas)
print(df_mascotas)

# Orden alfabético
df_sorted_alpha_mascotas = df_mascotas.sort_values(by='Nombre')
print("Orden alfabético:")
print(df_sorted_alpha_mascotas)

# Del más grande al más pequeño


df_sorted_size_mascotas = df_mascotas.sort_values(by='Tamaño_cm',
ascending=False)
print("\nDel más grande al más pequeño:")
print(df_sorted_size_mascotas)
# Del más al menos peligroso
df_sorted_danger_mascotas = df_mascotas.sort_values(by='Peligrosidad',
ascending=False)
print("\nDel más al menos peligroso:")
print(df_sorted_danger_mascotas)

# Del más común al más raro


df_sorted_common_mascotas = df_mascotas.sort_values(by='Común')
print("\nDel más común al más raro:")
print(df_sorted_common_mascotas)

# Si volaban o no
df_sorted_flying_mascotas = df_mascotas.sort_values(by='Vuelo')
print("\nSi volaban o no:")
print(df_sorted_flying_mascotas)

"""# Nueva sección

Viera Rangel Gabriela Jaqueline 2129120


perros
"""

import pandas as pd

# Crear un DataFrame con datos ficticios


data = {
'Raza': ['Border Collie', 'Golden Retriever', 'Bulldog', 'Poodle',
'Beagle',
'Rottweiler', 'Dachshund', 'Shih Tzu', 'Siberian Husky',
'Chihuahua'],
'Facilidad de Entrenamiento': [1, 2, 5, 3, 4, 6, 8, 7, 9, 10], #
1 es el más fácil, 10 es el más difÃ-cil
'Longitud de Pelaje': [3, 4, 2, 5, 3, 2, 4, 5, 6, 2], # 2 es el
más corto, 6 es el más largo
'Prestigio': [5, 3, 7, 2, 6, 8, 10, 9, 4, 1], # 1 es el más
prestigioso, 10 es el menos prestigioso
'Propensión a Problemas de Salud': [3, 5, 7, 4, 6, 2, 8, 9, 1,
10], # 1 es el más propenso, 10 es el menos propenso
'PaÃ-s de Origen': ['Reino Unido', '[Link].', 'Reino Unido',
'Francia', 'Reino Unido',
'Alemania', 'Alemania', 'China', 'Rusia',
'México']
}

df = [Link](data)
print(df)

#Ordenar por PaÃ-s de Origen (del paÃ-s más lejano al más cercano,
usando un criterio simple de distancia relativa): # Definir una
función para mapear paÃ-ses a distancias hipotéticas
def map_country_to_distance(country):
distances = {
'México': 1,
'Reino Unido': 2,
'Francia': 3,
'Alemania': 4,
'[Link].': 5,
'China': 6,
'Rusia': 7
}
return [Link](country, 0)

# Agregar una columna de distancias al DataFrame


df['Distancia'] = df['PaÃ-s de Origen'].apply(map_country_to_distance)

# Ordenar por Distancia


df_sorted_distancia = df.sort_values(by='Distancia')
print(df_sorted_distancia)

"""serie 2 Tipos de flores"""

import pandas as pd

# Crear un DataFrame con datos ficticios


data = {
'Flor': ['Rosa', 'Tulipán', 'OrquÃ-dea', 'Lirio', 'Girasol',
'Margarita', 'Crisantemo', 'Violeta', 'Lirio de agua',
'Jacinto'],
'Tiempo de Floración': [7, 5, 6, 8, 4, 5, 6, 4, 8, 7], # En
dÃ-as, 4 es el más rápido, 8 es el más lento
'Época de Floración': ['Primavera', 'Primavera', 'Verano',
'Verano', 'Otoño',
'Primavera', 'Otoño', 'Primavera',
'Verano', 'Primavera'],
'Tipo de Polinización': ['Mariposas', 'Viento', 'EspecÃ-fico',
'General', 'Insectos',
'General', 'EspecÃ-fico', 'General',
'Insectos', 'Viento'],
'Fragancia': [8, 6, 9, 7, 5, 6, 5, 4, 7, 6], # 1 es el menos
fragante, 10 es el más fragante
'Frecuencia del Color': [5, 7, 4, 6, 8, 6, 5, 8, 4, 7] # 1 es el
menos común, 10 es el más común
}

df = [Link](data)
print(df)

"""Serie 3 Productos de maquillaje"""

import pandas as pd

# Crear un DataFrame con datos ficticios


data = {
'Producto': ['Base', 'Esmalte de uñas', 'Sombra', 'Rubor',
'Delineador',
'Lápiz labial', 'Corrector', 'Brocha', 'Primers',
'Gloss'],
'Complejidad de Aplicación': [5, 3, 4, 3, 4, 2, 4, 3, 3, 2], # 1
es el más simple, 5 es el más complicado
'Ingrediente Principal': ['Retinol', 'Glicerina', 'Õcido
hialurónico', 'Vitaminas', 'Aceites',
'Extractos naturales', 'Õcido
salicÃ-lico', 'Polvo mineral', 'Extracto de té verde', 'Colorantes'],
'Durabilidad': [8, 4, 7, 6, 5, 6, 7, 5, 8, 4], # 1 es la menor
durabilidad, 10 es la mayor durabilidad
'Tipo de Empaque': ['Innovador', 'Tradicional', 'Innovador',
'Tradicional', 'Innovador',
'Tradicional', 'Innovador', 'Tradicional',
'Innovador', 'Tradicional'],
'Preferencia por Mujeres Mayores': [3, 5, 4, 6, 5, 6, 4, 5, 7, 8]
# 1 es más preferido por mujeres jóvenes, 10 es más preferido por
mujeres mayores
}

df = [Link](data)
print(df)
CONCLUSIONES

Vela Aranda Vanessa Arely 1994618


Las series de datos y los comandos de pandas ofrecen una poderosa herramienta
para la manipulación y análisis de datos en Python. Con pandas, es posible
ordenar, filtrar y clasificar fácilmente los datos, permitiendo realizar tareas como
organizar elementos alfabéticamente, comparar tamaños, evaluar peligrosidad,
determinar la frecuencia de ocurrencia, y distinguir características específicas
como la capacidad de volar. Estos comandos no solo simplifican el proceso de
análisis, sino que también proporcionan una estructura clara para extraer
información relevante de grandes conjuntos de datos de manera eficiente y
efectiva.

Viera Rangel Gabriela Jaqueline 2129120


En esta actividad, trabajamos en equipo para crear tres series de datos por cada
integrante del grupo. Cada uno de nosotros eligió temas diferentes, generando
DataFrames con pandas y aplicando comandos de ordenamiento y análisis. Entre
los temas que abordamos se encontraban tipos de dinosaurios, tipos de flores,
tipos de vehículos, etc.
A través de esta tarea, he aprendido a utilizar pandas para manipular y ordenar
datos de manera eficiente. Aplicamos diferentes criterios para organizar nuestros
DataFrames, como el orden por tamaño, precio, frecuencia, uso, popularidad,
entre otros. Este proceso me ha ayudado a comprender mejor cómo pandas
puede ser una herramienta útil para el análisis de datos y la toma de decisiones.
Lo que más me sorprendió fue la adaptabilidad de pandas para gestionar una
amplia variedad de datos. Logramos trabajar con diversas clases de información y
aplicar reglas específicas según cada caso, también colaborar en equipo nos
brindó la oportunidad de intercambiar ideas y métodos distintos, lo que enriqueció
el proceso de aprendizaje.
En resumen, esta actividad representó una gran oportunidad para mejorar
nuestras habilidades en el manejo de datos y en el uso de herramientas de
análisis.
Mauricio vega Vazquez 1863147
Los códigos que hemos discutido son herramientas poderosas que simplifican la
organización y el análisis de datos utilizando pandas en Python. Al usarlos, puedes
ordenar, clasificar y comparar información de manera rápida y eficiente, lo que
resulta especialmente útil en proyectos de análisis de datos o en cualquier
situación donde necesites manejar grandes volúmenes de información.
Por ejemplo, si estás trabajando con listas de instrumentos musicales, deportes o
tipos de comida, estos códigos te permiten estructurar la información según
diferentes criterios, como precio, popularidad, dificultad, riesgo o salud. Esto no
solo te ahorra tiempo, sino que también asegura que los datos se presenten de
una manera clara y comprensible.
Además, saber cómo compartir estos códigos de manera efectiva es crucial
cuando colaboras con otros. Ya sea copiando directamente, enviando archivos, o
utilizando plataformas como GitHub Gist o Pastebin, la clave es asegurarte de que
la otra persona pueda usar y entender el código sin dificultad. Esto mejora la
comunicación y la colaboración, permitiendo que todos los miembros del equipo
estén alineados y puedan contribuir de manera efectiva.
En resumen, los códigos que hemos visto no solo son herramientas prácticas para
el análisis de datos, sino que también son fundamentales para facilitar el trabajo
en equipo y la colaboración, asegurando que todos tengan acceso a información
organizada y fácil de interpretar.

Jesus Gerardo Gonzalez Valdés 1997817


Como conclusión las series en pandas son una estructura de datos poderosa y
flexible que permite manejar y analizar datos unidimensionales de manera
eficiente. Al tener un índice asociado a cada valor, ofrecen una forma conveniente
de acceder y manipular datos, facilitando tareas comunes de análisis como
filtrado, agrupación y operaciones matemáticas. Su capacidad para manejar
diferentes tipos de datos y su integración con otras funcionalidades de pandas las
hacen una herramienta esencial para el análisis de datos en Python.
Carlo David Saldaña Acevedo 1960644
Ana Lucia Guevara Sierra 2012821
Los data frames en python especialmente cuando se utilizan con bibliotecas como
pandas son estructuras de datos bidimensionales que permiten almacenar y
manipular datos de manera eficiente. Ofrecen una forma intuitiva de trabajar con
datos tabulares similar a las hojas de cálculo pero con las ventajas del lenguaje de
programación. los comandos en python para manipular los data frames permite
realizar una amplia gama como la selección filtrado agrupamientos y
transformación de datos
En resumen los datos frames y los comandos usados en python son herramientas
poderosas para la manipulación de datos que simplifican tareas complejas y son
esenciales para la ciencia de datos y análisis

También podría gustarte