0% au considerat acest document util (0 voturi)
69 vizualizări22 pagini

Modulul Pandas

Acest curs introduce biblioteca Pandas pentru manipularea și analiza datelor în Python. Documentul prezintă structurile de date principale ale Pandas - seria și DataFrame - și beneficiile utilizării Pandas, cum ar fi operațiile mai puțin verbale, vizualizarea intuitivă a datelor și scalabilitatea pentru seturi mari de date.

Încărcat de

Ciobanu Stas
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca PDF, TXT sau citiți online pe Scribd
0% au considerat acest document util (0 voturi)
69 vizualizări22 pagini

Modulul Pandas

Acest curs introduce biblioteca Pandas pentru manipularea și analiza datelor în Python. Documentul prezintă structurile de date principale ale Pandas - seria și DataFrame - și beneficiile utilizării Pandas, cum ar fi operațiile mai puțin verbale, vizualizarea intuitivă a datelor și scalabilitatea pentru seturi mari de date.

Încărcat de

Ciobanu Stas
Drepturi de autor
© © All Rights Reserved
Respectăm cu strictețe drepturile privind conținutul. Dacă suspectați că acesta este conținutul dumneavoastră, reclamați-l aici.
Formate disponibile
Descărcați ca PDF, TXT sau citiți online pe Scribd

Medii Integrate de Proiectare interactivă

Tema: Pandas

lect. univ. Victoria ALEXEI


Departament Informatică și Ingineria Sistemelor
Facultatea Calculatoare, Informatică și Microelectronică
În acest curs vom învăța:

• Introducere în Pandas

• Use Python’s statistics for the most important Python


statistics functions.
• Use NumPy to handle arrays efficiently.
• Use SciPy for additional Python statistics routines for
NumPy arrays.
• Use Pandas to work with labeled datasets.
• Use Matplotlib to visualize data with plots, charts, and
histograms.
Pandas

Pandas este o bibliotecă Python open-source care oferă instrument de manipulare și analiză a
datelor de înaltă performanță folosind structurile sale puternice de date.

Numele Pandas este derivat din cuvântul Panel Data – o econometrie din date
multidimensionale.

În 2008, dezvoltatorul Wes McKinney a început să dezvolte panda atunci când avea nevoie de
un instrument flexibil și de înaltă performanță pentru analiza datelor.

Înainte de Pandas, Python era folosit în principal pentru colectarea și pregătirea datelor. A avut
o contribuție foarte mică la analiza datelor. Panda a rezolvat această problemă.
Pandas

Folosind Pandas, putem realiza cinci pași tipici în procesarea și analiza datelor, indiferent de
originea datelor - încărcarea, pregătirea, manipularea, modelarea și analiza.

Python cu Pandas este utilizat într-o gamă largă de domenii, inclusiv domenii academice și
comerciale, inclusiv finanțe, economie, statistică, analiză etc.
Beneficiile cheie ale pachetului pandas

Pandas este un instrument puternic de manipulare a datelor cu mai multe beneficii, inclusiv:

Creat pentru Python: Python este cel mai popular limbaj din lume pentru învățarea automată și știința datelor.
Operații mai puțin detaliate pe unitate: codul scris în panda este mai puțin verbos, necesitând mai puține linii de
cod pentru a obține rezultatul dorit.

Vizualizare intuitivă a datelor: Pandas oferă o reprezentare a datelor excepțional de intuitivă, care facilitează
înțelegerea și analiza mai ușoară a datelor.

Set extins de caracteristici: acceptă un set extins de operațiuni de la analiza exploratorie a datelor, tratarea
valorilor lipsă, calcularea statisticilor, vizualizarea datelor univariate și bivariate și multe altele.

Funcționează cu date mari: pandas gestionează cu ușurință seturi mari de date. Oferă viteză și eficiență în timp
ce lucrezi cu seturi de date de ordinul a milioane de înregistrări și sute de coloane, în funcție de mașină.
Pandas -Configurarea mediului

Distribuția standard Python nu vine la pachet cu modulul Pandas.

O alternativă ușoară este să instalați NumPy folosind popularul program de instalare a


pachetelor Python, pip.

pip install pandas


Vom începe cu următoarele două structuri de date importante ale Pandas:
• Seria
• DataFrame
• Seria
[Link]( data, index, dtype, copy)

[Link] Parameter & Description


1 data
data takes various forms like ndarray, list, constants
2 index
Index values must be unique and hashable, same length as data.
Default [Link](n) if no index is passed.
3 dtype
dtype is for data type. If None, data type will be inferred
4 copy
Copy data. Default False

A series can be created using various inputs like −


•Array
•Dict
•Scalar value or constant
• DataFrame
[Link]
A pandas DataFrame can be created using the following constructor −
[Link]( data, index, columns, dtype, copy)
The parameters of the constructor are as follows −
[Link] Parameter & Description
1 data
data takes various forms like ndarray, series, map, lists, dict, constants and also another DataFrame.
2 index
For the row labels, the Index to be used for the resulting frame is Optional Default [Link](n) if no index is
passed.
3 columns
For column labels, the optional default syntax is - [Link](n). This is only true if no index is passed.
4 dtype
Data type of each column.
5 copy
This command (or whatever it is) is used for copying of data, if the default is False.
Be aware of the fact that replace by default creates a
copy of the object in which all the values are replaced
Exemple consola

S-ar putea să vă placă și