R vs Python – Rozdíl mezi nimi
Klíčový rozdíl mezi R a Python
- R se používá hlavně pro statistickou analýzu Python poskytuje obecnější přístup k datové vědě
- Primárním cílem R je analýza dat a statistika, zatímco primárním cílem Python je nasazení a výroba
- Uživatelé R se skládají hlavně z učenců a odborníků na výzkum a vývoj Python uživatelé jsou většinou programátoři a vývojáři
- R poskytuje flexibilitu pro použití dostupných knihoven Python poskytuje flexibilitu pro vytváření nových modelů od začátku
- R se ze začátku těžko učí Python je lineární a snadno se učí
- R je integrován do Spustit lokálně Python je dobře integrován s aplikacemi
- Jak R, tak Python zvládne obrovskou velikost databáze
- R lze použít na R Studio IDE Python lze použít na Spyder a Ipython Notebook IDE
- R se skládá z různých balíčků a knihoven jako tidyverse, ggplot2, caret, zoo Python obsahuje balíčky a knihovny jako pandas, scipy, scikit-learn, TensorFlow, caret
R a Python jsou oba open-source programovací jazyky s velkou komunitou. Nové knihovny nebo nástroje jsou průběžně přidávány do jejich příslušného katalogu. R se používá hlavně pro statistickou analýzu Python poskytuje obecnější přístup k datové vědě.
R a Python jsou nejmodernější z hlediska programovacího jazyka orientovaného na datovou vědu. Naučit se obojí je samozřejmě ideální řešení. R a Python vyžaduje časovou investici a takový luxus není dostupný pro každého. Python je univerzální jazyk s čitelnou syntaxí. R je však vytvořeno statistiky a zahrnuje jejich specifický jazyk.
R
Akademici a statistici vyvinuli R během dvou desetiletí. R má nyní jeden z nejbohatších ekosystémů na provádění analýzy dat. V CRAN (open-source repository) je k dispozici přibližně 12000 XNUMX balíčků. Je možné najít knihovnu pro jakoukoli analýzu, kterou chcete provést. Bohatá nabídka knihoven dělá z R první volbu pro statistické analýzy, zejména pro specializované analytické práce.
Špičkový rozdíl mezi R a ostatními statistickými produkty je výstupem. R má fantastické nástroje pro sdělení výsledků. Rstudio přichází s knihovnou pletařkou. Xie Yihui napsal tento balíček. Udělal zpravodajství triviálním a elegantním. Sdělení zjištění pomocí prezentace nebo dokumentu je snadné.
Python
Python dokáže téměř stejné úkoly jako R: boj s daty, inženýrství, sešrotování webu pro výběr funkcí, aplikace a tak dále. Python je nástroj pro nasazení a implementaci strojového učení ve velkém měřítku. Python kódy se snadněji udržují a jsou robustnější než R. před lety; Python neměl mnoho knihoven pro analýzu dat a strojového učení. Nedávno, Python dohání a poskytuje špičkové API pro strojové učení nebo umělou inteligenci. Většinu datové vědy lze provést s pěti Python knihovny: Numpy, Pandas, Scipy, Scikit-learn a Seaborn.
Python, na druhé straně usnadňuje replikovatelnost a dostupnost než R. Ve skutečnosti, pokud potřebujete použít výsledky své analýzy v aplikaci nebo na webu, Python je nejlepší volbou.
Index oblíbenosti
Žebříček IEEE Spectrum je metrika, která kvantifikuje popularitu a programovací jazyk. V levém sloupci je uvedeno pořadí v roce 2017 a v pravém sloupci v roce 2016. V roce 2017 Python se dostal na první místo ve srovnání se třetím místem o rok dříve. R je v 6th místo.
Pracovní příležitost
Obrázek níže ukazuje počet úloh souvisejících s datovou vědou podle programovacích jazyků. SQL je daleko vpředu, následuje Python si Java. R je na 5. místěth.

Pokud se zaměříme na dlouhodobý trend mezi Python (žlutě) a R (modrá), to vidíme Python je častěji uváděn v popisu práce než R.
Analýza provedená R and Python
Pokud se však podíváme na úlohy analýzy dat, R je zdaleka nejlepší nástroj.
Procento lidí, kteří přecházejí
Na obrázku níže jsou dva klíčové body.
- Python uživatelé jsou loajálnější než uživatelé R
- Procento uživatelů R, kteří přešli na Python je dvakrát větší než Python k R.
Rozdíl mezi R a Python
| Parametr | R | Python |
|---|---|---|
| Objektivní | Analýza dat a statistika | Nasazení a výroba |
| Primární uživatelé | Vědec a výzkum a vývoj | Programátoři a vývojáři |
| Flexibilita | Snadno použitelná dostupná knihovna | Snadná konstrukce nových modelů od začátku. Tj. maticové výpočty a optimalizace |
| Křivka učení | Na začátku těžké | Lineární a hladké |
| Popularita programovacího jazyka. Procentuální změna | 4.23% v 2018 | 21.69% v 2018 |
| Průměrná mzda | $99.000 | $100.000 |
| Integrace | Spustit lokálně | Dobře integrováno s aplikací |
| Úkol | Snadné získání primárních výsledků | Dobré nasazení algoritmu |
| Velikost databáze | Zvládněte obrovskou velikost | Zvládněte obrovskou velikost |
| IDE | studio | Spyder, notebook Ipython |
| Důležité balíčky a knihovna | tidyverse, ggplot2, stříška, zoo | pandy, scipy, scikit-learn, TensorFlow, cart |
| Nevýhody | Pomalu Vysoká křivka učení Závislosti mezi knihovnami |
Ne tolik knihoven jako R |
| Výhody |
|
|
R nebo Python Používání
Python byl vyvinut Guido van Rossumem, počítačovým chlapíkem, přibližně v roce 1991. Python má vlivné knihovny pro matematiku, statistiku a umělou inteligenci. Můžete přemýšlet Python jako čistý hráč v oblasti strojového učení. Však, Python není (zatím) pro ekonometrii a komunikaci zcela zralá. Python je nejlepším nástrojem pro integraci a nasazení Machine Learning, ale ne pro obchodní analýzy.
Dobrou zprávou je, že R je vyvinut akademiky a vědci. Je navržen tak, aby odpovídal na statistické problémy, strojové učení a datovou vědu. R je ten správný nástroj pro datovou vědu díky svým výkonným komunikačním knihovnám. Kromě toho je R vybaven mnoha balíčky pro provádění analýzy časových řad, panelových dat a dolování dat. Kromě toho neexistují lepší nástroje ve srovnání s R.
Podle našeho názoru, pokud jste začátečník v datové vědě s nezbytným statistickým základem, musíte si položit následující dvě otázky:
- Chci se naučit, jak funguje algoritmus?
- Chci nasadit model?
Pokud je vaše odpověď na obě otázky ano, pravděpodobně byste se začali učit Python první. Na jedné straně, Python obsahuje skvělé knihovny pro manipulaci s maticí nebo pro kódování algoritmů. Pro začátečníka může být snazší naučit se sestavit model od začátku a poté přejít na funkce z knihoven strojového učení. Na druhou stranu, algoritmus již znáte nebo se chcete hned pustit do analýzy dat, pak R i Python jsou pro začátek v pořádku. Jedna výhoda pro R, pokud se budete soustředit na statistické metody.
Za druhé, pokud chcete dělat více než jen statistiky, řekněme nasazení a reprodukovatelnost, Python je lepší volba. R je pro vaši práci vhodnější, pokud potřebujete napsat report a vytvořit dashboard.
Stručně řečeno, statistická propast mezi R a Python se přibližují. Většinu práce zvládnou oba jazyky. Raději si vyberte ten, který vyhovuje vašim potřebám, ale také nástroji, který vaši kolegové používají. Je lepší, když všichni mluvíte stejným jazykem. Poté, co znáte svůj první programovací jazyk, je učení druhého jednodušší.
Proč investovat do čističky vzduchu?
Nakonec volba mezi R resp Python záleží na:
- Cíle vaší mise: Statistická analýza nebo nasazení
- Množství času, které můžete investovat
- Nejpoužívanější nástroj vaší společnosti/odvětví


