0% encontró este documento útil (0 votos)

17 vistas23 páginas

Python para Minería de Datos

Cargado por

ale.caroca

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

17 vistas23 páginas

Python para Minería de Datos

Cargado por

ale.caroca

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 23

MANEJO DE

PYTHON
BIY7121 MINERÍA DE DATOS
CONTENIDO

01 04
INTRODUCCION RESUMEN

02
NUMPY

03
PANDAS
01
INTRODUCCIÓN
INTRODUCCIÓN

Python es un lenguaje de programación interpretado

cuya filosofía hace hincapié en una sintaxis que
favorezca un código legible.

Se trata de un lenguaje de programación

multiparadigma, ya que soporta orientación a objetos,
programación imperativa y programación funcional (en
menor medida).
INTRODUCCIÓN

Anaconda es una distribución gratuita y de código

abierto de los lenguajes de programación Python y R
para procesamiento de datos a gran escala, análisis
predictivo y computación científica, cuyo objetivo es
simplificar la administración y la implementación de
paquetes.

Anaconda facilita la instalación de todas las bibliotecas

y paquetes que necesita para un proyecto Python de
una sola vez.

Todo lo que tiene que hacer es crear un "entorno

conda" para su proyecto y luego instalar las bibliotecas
requeridas usando el comando "conda install".
INTRODUCCIÓN

Google Colaboratory, comúnmente conocido como

GOOGLE COLAB, es un servicio gratuito en la nube
proporcionado por Google.

Permite a los usuarios escribir y ejecutar código

Python a través del navegador, sin necesidad de
ninguna configuración previa.

Es particularmente popular para ciencia de datos, por

varias razones:

•No requiere configuración

•Colaboración y Compartir
•Acceso gratuito a GPU
•Entorno de Codificación Interactivo
•Control de versiones:
02
NUMPY TÍTULO
Librería NUMPY

NUMPY es una librería de Python especializada

en el cálculo numérico y el análisis de datos,
especialmente para un gran volumen de datos.

Incorpora una nueva clase de objetos

llamados arrays que permite representar
colecciones de datos de un mismo tipo en
varias dimensiones, y funciones muy eficientes
para su manipulación.

La ventaja de Numpy frente a las listas

predefinidas en Python es que el
procesamiento de los arrays se realiza mucho
más rápido (hasta 50 veces más) que las listas,
lo cual la hace ideal para el procesamiento de
vectores y matrices de grandes dimensiones.
Librería NUMPY

La clase objetos ARRAY.

Un array es una estructura de datos de un

mismo tipo organizada en forma de tabla o
cuadrícula de distintas dimensiones.

Las dimensiones de un array también se

conocen como ejes
Librería NUMPY
Creación de arrays

Para crear un array se utiliza la siguiente función de

NumPy

[Link](lista) : Crea un array a partir de la lista o tupla

lista y devuelve una referencia a él. El número de
dimensiones del array dependerá de las listas o tuplas
anidadas en lista:

Para una lista de valores se crea un array de una dimensión, también conocido
como vector.

Para una lista de listas de valores se crea un array de dos dimensiones, también
conocido como matriz.

Para una lista de listas de listas de valores se crea un array de tres dimensiones,
también conocido como cubo.

Y así sucesivamente. No hay límite en el número de dimensiones del array más

allá de la memoria disponible en el sistema.
Librería NUMPY
Acceso a los elementos de un array.

Para acceder a los elementos contenidos en un array se

usan índices al igual que para acceder a los elementos
de una lista, pero indicando los índices de cada
dimensión separados por comas.

Al igual que para listas, los índices de cada dimensión

comienzan en 0.

También es posible obtener subarrays con el operador

dos puntos : indicando el índice inicial y el siguiente al
final para cada dimensión, de nuevo separados por
comas
Librería NUMPY
Operaciones matemáticas con arrays

Existen dos formas de realizar operaciones matemáticas

con arrays: a nivel de elemento y a nivel de array.

Las operaciones a nivel de elemento operan los

elementos que ocupan la misma posición en dos arrays.
Se necesitan, por tanto, dos arrays con las mismas
dimensiones y el resultado es una array de la misma
dimensión.

Los operadores mamemáticos +, -, *, /, %, ** se utilizan

para la realizar suma, resta, producto, cociente, resto y
potencia a nivel de elemento.
Librería NUMPY
Álgebra matricial

Numpy incorpora funciones para realizar las principales

operaciones algebraicas con vectores y matrices.

Por ejemplo, multiplicación entre matrices.

En la imagen, se devuelve el producto matricial de las

matrices a y b siempre y cuando sus dimensiones sean
compatibles.
03
PANDAS
Librería PANDAS

Pandas es una de las principales librerías de

Python, que es un lenguaje de programación
orientado a objetos de alto nivel muy popular entre
los Data Scientists.

Las estructuras más utilizadas en este módulo son

las Series y los DataFrames.

A diferencia de las Series, que son objetos

correspondientes a paneles unidimensionales, los
DataFrames son paneles bidimensionales
compuestos por filas y columnas, que permiten
destacar las relaciones entre las distintas variables
de la serie de datos.
Librería PANDAS

El formato de estas estructuras puede compararse

con los diccionarios de Python. Efectivamente, las
claves son los nombres de las columnas y los
valores son las Series. Su estructura puede
considerarse similar a la de una hoja de cálculo de
Excel.

Cada fila contiene datos específicos de varias

columnas, que son variables. El nombre de las filas
de un DataFrame se llama «index» que, por defecto,
empieza siempre por 0.
Librería PANDAS

Para importar una serie de datos, la librería Pandas

propone un método muy práctico que
es pd.read_csv().

Si el archivo que contiene la serie de datos está en

otro formato que no sea el de Comma Separated
Value, basta con cambiar la terminación del método
por el tipo de archivo correcto.

Por ejemplo, un archivo de Excel se importará de la

siguiente manera: pd.read_excel(). Este método
importa la serie de datos en una estructura
DataFrame.
Librería PANDAS

Cuando se importa la serie de datos, es necesario tener

una visión general del DataFrame.

El primer paso es utilizar el atributo shape, que permite

conocer la dimensión del DataFrame y devolver una
tupla (número_de_filas, número_de_columnas).

Para entender la serie de datos, hay tres métodos muy

útiles para ver las filas del DataFrame :
• El método head() devuelve las cinco primeras filas del
DataFrame, si no se especifica un número entre
paréntesis.
• Por otro lado, el método tail() permite visualizar las
últimas cinco líneas del DataFrame.

Estos dos métodos permiten visualizar el principio y el

final de la serie de datos
Librería PANDAS

Podemos filtrar nuestros datos utilizando el slice.

Por ejemplo, df[:2] devuelve las dos primeras filas de

nuestro DataFrame. No hay que olvidar que el último
número es exógeno al resultado, lo que significa que en
el ejemplo, el slicing devolverá las filas al índice 0 y 1
Librería PANDAS

Como se explicó en la introducción, los DataFrames son

tablas bidimensionales, que corresponden a los ejes de
las filas (eje = 0) y de las columnas (eje = 1). Se pueden
añadir tantas filas o columnas como sea necesario,
especificando el eje en el que queremos añadir estos
nuevos valores.

Lo interesante de los DataFrames es que es muy fácil

recuperar, cambiar, cargar o buscar datos en esta
estructura.
Librería PANDAS

Si el DataFrame tiene diez variables diferentes, se

puede saber cuáles son sus nombres utilizando el
atributo [Link]. Pero cuando la serie de datos
tiene ochocientas columnas, la visualización de los
nombres de las variables no será completa.

Para resolver este problema, se puede utilizar el

método [Link](), que permite almacenar los
nombres de las columnas en una lista de Python.
04
RESUMEN
RESUMEN

En esta presentación, hemos visto:

❑ Introducción a Python

❑ Librería NUMPY

❑ Librería PANDAS

También podría gustarte

1.4.1 Manejo de Python
Aún no hay calificaciones
1.4.1 Manejo de Python
23 páginas
(Sesion03) Introduccion Python
Aún no hay calificaciones
(Sesion03) Introduccion Python
47 páginas
Curso Python para Análisis de Datos
Aún no hay calificaciones
Curso Python para Análisis de Datos
47 páginas
Presentacion Inicial Ciencia de Datos Vivelab
Aún no hay calificaciones
Presentacion Inicial Ciencia de Datos Vivelab
77 páginas
Análisis de Datos con Python y Pandas
Aún no hay calificaciones
Análisis de Datos con Python y Pandas
29 páginas
Uso de Numpy en Python para cálculos
Aún no hay calificaciones
Uso de Numpy en Python para cálculos
29 páginas
Tema 7
Aún no hay calificaciones
Tema 7
32 páginas
Numpy Arrays
Aún no hay calificaciones
Numpy Arrays
17 páginas
Practica4 EdwinCardenas
Aún no hay calificaciones
Practica4 EdwinCardenas
15 páginas
Introducción Al Análisis de Datos Con Python
Aún no hay calificaciones
Introducción Al Análisis de Datos Con Python
53 páginas
Parte2 Numpy
Aún no hay calificaciones
Parte2 Numpy
33 páginas
Bootcamp Inteligencia Artificial Nivel Explorador
Aún no hay calificaciones
Bootcamp Inteligencia Artificial Nivel Explorador
62 páginas
Clase 3 Numpy Pandas
Aún no hay calificaciones
Clase 3 Numpy Pandas
16 páginas
Python PANDAS
Aún no hay calificaciones
Python PANDAS
10 páginas
Módulo 3 - Manejo de Datos Estructurados Con Pandas
Aún no hay calificaciones
Módulo 3 - Manejo de Datos Estructurados Con Pandas
24 páginas
Pandas Numpy
Aún no hay calificaciones
Pandas Numpy
30 páginas
Modulo Numpy
Aún no hay calificaciones
Modulo Numpy
7 páginas
Tema 10 - Guia de Inteligencia Artificial
Aún no hay calificaciones
Tema 10 - Guia de Inteligencia Artificial
16 páginas
Inteligencia Artificial y Ciencia de Datos - Data - Base
Aún no hay calificaciones
Inteligencia Artificial y Ciencia de Datos - Data - Base
21 páginas
Análisis de Datos - Resumen
Aún no hay calificaciones
Análisis de Datos - Resumen
7 páginas
Introducción a Librerías en Python
Aún no hay calificaciones
Introducción a Librerías en Python
9 páginas
Librerías Python para Análisis de Datos
Aún no hay calificaciones
Librerías Python para Análisis de Datos
11 páginas
Clase 21 - Manejo de Archivos Reales
Aún no hay calificaciones
Clase 21 - Manejo de Archivos Reales
63 páginas
1.intro Python Pandas
Aún no hay calificaciones
1.intro Python Pandas
24 páginas
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
Aún no hay calificaciones
M3 Analisis de Datos - Obtención y Preparación de Datos. (AE2)
55 páginas
Numpy Python 230821 112032
Aún no hay calificaciones
Numpy Python 230821 112032
69 páginas
Investigación Bibliotecas Numpy y Pandas
Aún no hay calificaciones
Investigación Bibliotecas Numpy y Pandas
8 páginas
Librerías Python para Machine Learning
Aún no hay calificaciones
Librerías Python para Machine Learning
65 páginas
Parte4 Pandas
Aún no hay calificaciones
Parte4 Pandas
36 páginas
Libreria de Pandas
Aún no hay calificaciones
Libreria de Pandas
5 páginas
Introducción A Python
Aún no hay calificaciones
Introducción A Python
22 páginas
Tarea 01 Investigación Librerias
Aún no hay calificaciones
Tarea 01 Investigación Librerias
11 páginas
Clase 6 - NumPy en Python
Aún no hay calificaciones
Clase 6 - NumPy en Python
31 páginas
Práctica Pandas en Python: DataFrames
Aún no hay calificaciones
Práctica Pandas en Python: DataFrames
2 páginas
4.1. Numpy - Computación Científica Con Python para Módulos de Evaluación Continua en Asignaturas de Ciencias Aplicadas
Aún no hay calificaciones
4.1. Numpy - Computación Científica Con Python para Módulos de Evaluación Continua en Asignaturas de Ciencias Aplicadas
5 páginas
Introducción a NumPy para Manipulación de Datos
Aún no hay calificaciones
Introducción a NumPy para Manipulación de Datos
18 páginas
Guía Completa de Pandas en Python
Aún no hay calificaciones
Guía Completa de Pandas en Python
12 páginas
21 Manejo Librerías
Aún no hay calificaciones
21 Manejo Librerías
27 páginas
Unidad 4-1
Aún no hay calificaciones
Unidad 4-1
7 páginas
Unidad 2 Manipulación de Datos Con Pandas
Aún no hay calificaciones
Unidad 2 Manipulación de Datos Con Pandas
34 páginas
Fundamentos de Programación: Arreglos y NumPy
Aún no hay calificaciones
Fundamentos de Programación: Arreglos y NumPy
15 páginas
Diapos Lenguaje
Aún no hay calificaciones
Diapos Lenguaje
21 páginas
GUIA Python
Aún no hay calificaciones
GUIA Python
2 páginas
Machine Learning Con Python PDF
Aún no hay calificaciones
Machine Learning Con Python PDF
7 páginas
Tema 7
Aún no hay calificaciones
Tema 7
28 páginas
Herramientas de Programacion. Redes Neuronales. Unidad 1
Aún no hay calificaciones
Herramientas de Programacion. Redes Neuronales. Unidad 1
12 páginas
Guía de Análisis de Datos con Python
Aún no hay calificaciones
Guía de Análisis de Datos con Python
2 páginas
Guía Completa de Arrays en NumPy
Aún no hay calificaciones
Guía Completa de Arrays en NumPy
29 páginas
Unidad 4 Uso Libreria NumPY
Aún no hay calificaciones
Unidad 4 Uso Libreria NumPY
31 páginas
Guia Practica4 Santiago Herrería
Aún no hay calificaciones
Guia Practica4 Santiago Herrería
17 páginas
PYTHON
Aún no hay calificaciones
PYTHON
34 páginas
Clase 5 - Programación Con Arrays - Introducción A NumPy
Aún no hay calificaciones
Clase 5 - Programación Con Arrays - Introducción A NumPy
72 páginas
Guía Básica de NumPy en Python
Aún no hay calificaciones
Guía Básica de NumPy en Python
1 página
Full 6678 Tema 7. Análisis de Datos Esl-ES
Aún no hay calificaciones
Full 6678 Tema 7. Análisis de Datos Esl-ES
33 páginas
Guía Adat Parcial 1
Aún no hay calificaciones
Guía Adat Parcial 1
10 páginas
Libreria Pandas
100% (1)
Libreria Pandas
27 páginas
01 - Librería Pandas
Aún no hay calificaciones
01 - Librería Pandas
43 páginas
Evaluación de Luz y Sonido 3° Básico
Aún no hay calificaciones
Evaluación de Luz y Sonido 3° Básico
5 páginas
Programación de DET175
Aún no hay calificaciones
Programación de DET175
9 páginas
Ejercitación 3° Lengua y Matemática
Aún no hay calificaciones
Ejercitación 3° Lengua y Matemática
3 páginas
Cronograma de Actividades-2022-I - Matematica
Aún no hay calificaciones
Cronograma de Actividades-2022-I - Matematica
3 páginas
Lógica Matemáticas PDF
Aún no hay calificaciones
Lógica Matemáticas PDF
35 páginas
2°sec. Mat. Tema 1 - Unidad Iii
Aún no hay calificaciones
2°sec. Mat. Tema 1 - Unidad Iii
1 página
Elementos de Montaje
Aún no hay calificaciones
Elementos de Montaje
7 páginas
Monotonía de Funciones Reales
Aún no hay calificaciones
Monotonía de Funciones Reales
3 páginas
Regístro-Videos-Práctica SAS ON Demand JCJ 25-8-23
Aún no hay calificaciones
Regístro-Videos-Práctica SAS ON Demand JCJ 25-8-23
25 páginas
Cinemática Inversa de Robots
Aún no hay calificaciones
Cinemática Inversa de Robots
5 páginas
Instrumentación y Control Industrial
Aún no hay calificaciones
Instrumentación y Control Industrial
358 páginas
EOS (Ecuaciones de Estado
Aún no hay calificaciones
EOS (Ecuaciones de Estado
38 páginas
Tamaño de La Muestra
Aún no hay calificaciones
Tamaño de La Muestra
12 páginas
Curvas V-I en Materiales Resistivos
Aún no hay calificaciones
Curvas V-I en Materiales Resistivos
11 páginas
Sistemas Equivalentes de Fuerzas y Momentos
Aún no hay calificaciones
Sistemas Equivalentes de Fuerzas y Momentos
4 páginas
Mapa Graficos
Aún no hay calificaciones
Mapa Graficos
1 página
8 Tipos de Vectores
Aún no hay calificaciones
8 Tipos de Vectores
3 páginas
Diagrama de Dispersión y Curva Salarial
100% (1)
Diagrama de Dispersión y Curva Salarial
14 páginas
Fisica - Laboratorio 1
Aún no hay calificaciones
Fisica - Laboratorio 1
8 páginas
Control Multiplicaciones - 5º Básicos
Aún no hay calificaciones
Control Multiplicaciones - 5º Básicos
5 páginas
Fisica 1 Vectores #01
Aún no hay calificaciones
Fisica 1 Vectores #01
26 páginas
Shklovsky
Aún no hay calificaciones
Shklovsky
3 páginas
Practica 4 MRU & MRUV
Aún no hay calificaciones
Practica 4 MRU & MRUV
5 páginas
Análisis de Estructuras Isostáticas
Aún no hay calificaciones
Análisis de Estructuras Isostáticas
17 páginas
MASTIL 6m TUBO 4in A-Análisis Estático 1-1
Aún no hay calificaciones
MASTIL 6m TUBO 4in A-Análisis Estático 1-1
10 páginas
Metodologia de Balanceo
Aún no hay calificaciones
Metodologia de Balanceo
18 páginas
Análisis de Variancia (ANOVA)
Aún no hay calificaciones
Análisis de Variancia (ANOVA)
9 páginas
Tarea 2 Compuertas Logicas
Aún no hay calificaciones
Tarea 2 Compuertas Logicas
8 páginas
Calculo de Acimuts y Coordenadas
Aún no hay calificaciones
Calculo de Acimuts y Coordenadas
10 páginas