Računala

Počevši od ggplot2 u R

Autor: Laura McKinney
Datum Stvaranja: 3 Travanj 2021
Datum Ažuriranja: 13 Svibanj 2024
Anonim
I DIDN’T THROW AWAY THE OLD TULLE AND SAVED THE FAMILY BUDGET WELL! 4 SUPER REWORKINGS OF TULLE.
Video: I DIDN’T THROW AWAY THE OLD TULLE AND SAVED THE FAMILY BUDGET WELL! 4 SUPER REWORKINGS OF TULLE.

Sadržaj

Harsh je SQL DBA koji ima više od 13 godina iskustva. Radio je na većini tehnologija vezanih uz SQL Server. Voli politiku, čitanje

Korištenje ggplot2

Predstavljamo ggplot2 paket

Jedan od najvažnijih aspekata analize podataka je vizualizacija podataka. Vizualizacija je vjerojatno najsnažniji aspekt koji vam omogućuje pregled podataka iz različitih kutova. Također vam omogućuje da vrlo snažno iznesete svoje zaključke. Slika vrijedi tisuću riječi.

R ima tisuće različitih paketa koji mogu obaviti razne zadatke. ggplot2 je jedan takav paket koji je dizajniran za stvaranje i prikaz parcela.

Dakle, u ovom članku pokazat ću kako možemo konstruirati zaplet pomoću ggplot2 u R od nule. Započet ću s praznom zapletom, a zatim ću joj dodati elemente za izgradnju nekih osnovnih ploha.


Imajte na umu da je paket nazvan ggplot2.

Stvarna funkcija koju ćemo koristiti za stvaranje ploha naziva se ggplot.

Ovo može zbuniti, ali bojim se da su tako nazvani.

Dakle, paket je ggplot2, a funkcija koju koristimo iz tog paketa naziva se ggplot.

Pravo.

Cilj

Cilj ovog članka nije izgraditi fensi i nevjerojatnu radnju. Cilj je čitatelja upoznati s postupkom gradnje radnje malo po malo od početka.

Koristeći ovaj članak, trebali biste biti u stanju razumjeti različite elemente sustava crtanja ggplot2 i kako ih koristiti. Međutim, imajte na umu da je ovo samo osnovno uvođenje ggplot2 sustava crtanja. U stvarnosti, ggplot2 je vrlo moćan, ali izuzetno širok sustav crtanja i na njega lako možete napisati knjigu.

Međutim, ovaj će post obuhvatiti neke osnovne građevne dijelove ggplot grafa i izgraditi tri grafa koristeći te osnovne gradivne blokove.

Građevni blokovi ggplota

Prije nego što to učinimo, moramo razumjeti osnovne gradivne dijelove ggplot grafa.


  • Parcela - ovo je područje crtanja na kojem ćemo graditi parcelu.
  • Podaci - ovo su podaci koji će se koristiti u radnji.
  • Estetsko mapiranje - Ovo je organizacija vaših podataka na parceli. To govori ggplotu koje podatkovne točke idu na kojoj osi, kakve bi trebale biti boje, koji bi oblik trebali biti itd. Estetsko mapiranje u osnovi kontrolira vizualni aspekt geometrijskih objekata koje crtamo.
  • Geom - To su različiti geometrijski objekti koje ćemo postaviti na područje parcele. To mogu biti oblici poput točke za raspršeni grafikon, crte, krivulje itd. Ti objekti predstavljaju vaše podatke na crtežu.

Svaki od ovih blokova predstavljen je funkcijama u R. Tako da ćemo u osnovi za svaki od tih blokova napisati funkciju.

Ggplot ima puno više od ovoga, ali zasad ćemo započeti sa stvarnim uvidom u to kako funkcioniraju ova četiri elementa.

Započnimo

Dakle, bez ikakvih daljnjih zahvata, pokrenimo R i započnemo graditi ggplot grafikon.


Ali prije nego što počnete istraživati ​​ggplot2, morate ga instalirati ako to već niste učinili.

Instalirajte ggplot2 paket

install.packages ("ggplot2")

Nakon što se ova instalacija uspješno dovrši, učitajmo ovaj paket.

knjižnica (ggplot2)

Stvorite prazan zaplet

Sad kad smo instalirali i učitali ggplot2 paket, napravimo parcelu od nule. Dakle, prvo moramo izgraditi prvi element koji smo ranije uveli.

Parcela - ovo je područje crtanja na kojem ćemo graditi parcelu.

ggplot ()

To je to. Imajte na umu da je ime funkcije koje smo koristili ggplot. Nije ggplot2. ggplot2 je naziv paketa koji sadrži ovu funkciju.

To će stvoriti praznu parcelu. To biste trebali moći vidjeti u prozoru parcela R Studija.

Podaci feeda za crtanje

Prijeđimo sada na drugu točku.

Podaci - ovo su podaci koji će se koristiti u radnji.

Dajmo neke podatke za ggplot. Ovo se neće ucrtati. Ali mi samo neke podatke stavljamo na raspolaganje radnji. Također imajte na umu da ggplot kao podatke prihvaća samo objekt okvira podataka. Ne prihvaća matricu, vektor, popis ili bilo koji drugi tip podataka. Ne razumijem ovo ograničenje, ali to je tako.

Za ovu demonstraciju koristit ću ugrađeni skup podataka u R nazvanom iris. Ovo je dio baze R i za to ne trebate instalirati dodatni paket.

Koji su to podaci možete vidjeti pokretanjem sljedeće naredbe u R.

glava (iris)

Kao što vidite, ima pet polja. Četiri od ovih polja su numerička, a posljednje je kategorično. Ovaj skup podataka mjeri 150 cvjetova 3 različite vrste cvijeta IRIS.

Ovaj skup podataka ima četiri numerička mjerenja i jedno polje koje identificira vrstu cvijeta. Sada ćemo upotrijebiti ovaj skup podataka i vidjeti kako možemo sastaviti te podatke pomoću ggplot2.

A sad, hranimo ove podatke u ggplot. To radite tako što prosljeđujete parametar s podacima u funkciju ggplot kao što je prikazano u nastavku. Podaci koje smo dodali u ggplot je podatkovni okvir nazvan iris.

ggplot (podaci = iris).

Estetsko mapiranje

Vaša će parcela i dalje biti prazna. Ovom naredbom upravo smo proslijedili iris okvira podataka na ggplot. Idemo sada do treće točke.

Estetsko mapiranje - Ovo je organizacija vaših podataka na parceli.

Sada ćemo definirati estetsko mapiranje podataka. U svom najjednostavnijem obliku samo definiramo koji podaci trebaju ići na X osi, a što na Y osi. To radite prosljeđivanjem druge funkcije nazvane aes funkciji ggplot.

ggplot (podaci = iris, mapiranje = aes (x = Sepal.Duljina, y = Sepal.Širina))

Ovom naredbom rekli smo ggplotu da duljinu sepala stavi na X os, a širinu Sepala na Y os. Pogledajmo sada našu radnju. Izgleda ovako.

Ranije je zaplet bio prazan. Sada možemo vidjeti dvije osi. Na osi X vidimo duljinu sepala, a na osi Y širinu sepala. Također je ucrtao lijepu malu mrežu na temelju vrijednosti duljine i širine sepala.

Ali još uvijek ne vidimo nikakve podatke na plohi. Sve što je naša naredba učinila je formatiranje radnje. Upravo to će raditi funkcija ggplot.

Sad ćemo doći do četvrte točke.

Geom

Stvarno crtanje podataka na crtežu vršit će se geometrijskim objektima, tj. Geom. Dodajmo sada geom u našu radnju.

Za to u funkciju ggplot dodajemo funkcije geom ._ * kao što je prikazano dolje. Imajte na umu da ova naredba nije dovršena. Ali kad tipkate do ove točke, vidjet ćete popis geom opcija koje su vam dostupne.

ggplot (podaci = iris, mapiranje = aes (x = Sepal.Duljina, y = Sepal.Širina)) + geom_

Opcije možete vidjeti na snimci zaslona ispod. Koji ćete geom odabrati ovisi o vrsti radnje koju želite.

Dovršimo naredbu. Za ovu demonstraciju izradit ću raspršeni raspored koji su samo bodovi.

ggplot (podaci = iris, mapiranje = aes (x = Sepal.Length, y = Sepal.Width)) + geom_point ()

Pogledajmo sada našu radnju.

Naša prva parcela s ggplotom

I tu ste. Vaša prva parcela s ggplotom je spremna.

Ali pomalo je dosadno, zar ne? Dodajmo joj malo boje.

ggplot (podaci = iris, mapiranje = aes (x = Sepal.Length, y = Sepal.Width)) + geom_point (boja = "crvena")

Možete li uočiti razliku između ove i ranije naredbe? Dodao sam parametar zvan boja u geom točku i dodao mu vrijednost crvene boje. To govori ggplotu da sve točke oboji u crveno.

Ovako sada izgleda naša radnja.

Pa, recimo da su mi dosadne točke u mojoj raspršenoj parceli i želim promijeniti oblik svojih točaka. Dodam još jedan parametar pod nazivom shape i dodam mu vrijednost četiri. Kao što možete vidjeti na snimci zaslona ispod ove naredbe, ggplot je promijenio oblik točaka u dijagramu raspršenja.

ggplot (podaci = iris, mapiranje = aes (x = Sepal.Length, y = Sepal.Width)) + geom_point (boja = "crvena", oblik = 4)

Pa, pretpostavljam da ste dobili sliku, zar ne? Da biste promijenili točke, u geom funkciju dodajte još parametara.

Koje parametre možete proslijediti ovisi o geomu koji koristite. Ovo je samo vrh sante leda i ako započnete dublje kopati u ggplotu, prilike bi vam bile gotovo beskrajne.

Promijenimo sada geom od točke do crte. Ovo će generirati linijski crtež umjesto raspršenog.

ggplot (podaci = iris, mapiranje = aes (x = Sepal.Length, y = Sepal.Width)) + geom_line (color = "red", shape = 4)

Kao što vidite promijenio je točke u liniju. Što kažete na crtanje jedne numeričke varijable i druge kategoričke?

U našoj podatkovnoj šarenici vrsta je kategoričan podatak. Nije numerički poput dužine ili širine već klasa.

Nacrtajmo još jednu raspršenu plohu, ali umjesto dužine Sepala na X osi, nacrtajmo Vrste na X osi. Možete vidjeti da za ovo moram promijeniti funkciju ggplot aes. Umjesto dužine Sepala, prebacio sam Vrstu na os x.

ggplot (podaci = iris, mapiranje = aes (x = vrste, y = širina šipka)) + geom_point (boja = "crvena")

I ovo je rezultat koji dobivamo.

Ali općenito, ako želite ucrtati jednu kategoričku varijablu u odnosu na numeričku varijablu, možda biste željeli ucrtati okvir polja umjesto raspršenja. Okvir prikazuje srednju, minimalnu, maksimalnu vrijednost, a također pokazuje i odstupanja.

Dakle, hajde da zacrtamo kutiju umjesto rasipanja. Dakle, sada mijenjamo geom iz točke u kutiju.

ggplot (podaci = iris, mapiranje = aes (x = vrste, y = širina šipka)) + geom_boxplot (boja = "crvena")

Je li vam već dosadila crvena boja? Promijenimo boju ovih kutija, a također ćemo dodati boju ispune unutar kutija.

ggplot (podaci = iris, mapiranje = aes (x = vrste, y = širina šipka)) + geom_boxplot (boja = "ljubičasta", ispuna = "crna")

Sažetak

Tako smo do sada stvorili raspršenu plohu, linijsku plohu i ploču okvira. Dodali smo mu malo boje.

Možete učiniti puno više od ove 3 plohe koje sam do sada ilustrirao. Realno govoreći, snaga ggplota gotovo je nevjerojatna.

Ovo je jedan zgodan alat koji možete imati u svom alatu.

Ograničenja

No, kao i svaki alat, i on ima svoja ograničenja. Svakako ne može napraviti neke stvari koje rešetka može. Nije baš dobro s 3D crtežima i za to ćete možda trebati koristiti rgl. Ne može se nositi s grafikonima tipa teorije grafova koji imaju čvorove ili strukture stabla odluka.

Dakle, to je to za ovaj put ljudi. Obavijestite me što mislite u odjeljku za komentare u nastavku. Ako želite bilo kakva poboljšanja u ovom postu, javite mi i bilo bi mi drago primijeniti naše prijedloge.

Ovaj je članak točan i vjeran prema autorskom znanju. Sadržaj je samo u informativne ili zabavne svrhe i ne zamjenjuje osobne savjete ili profesionalne savjete u poslovnim, financijskim, pravnim ili tehničkim pitanjima.

Zanimljive Publikacije

Popularno Na Mjestu

Kako stvoriti raspršeni plan u programu Excel
Računala

Kako stvoriti raspršeni plan u programu Excel

Jo hua je ap olvent na U F-u. Zanima ga po lovna tehnologija, analitika, financije i mršav še t igma.Ra pršena ploha vrlo je vjerojatno najkori nija tvorevina u povije ti tati tičke grafike. tvaranje ...
Tmart pregled: Ne kupujte od Tmarta dok ovo ne pročitate!
Internet

Tmart pregled: Ne kupujte od Tmarta dok ovo ne pročitate!

Pročitao am brojne kritike o Tmartu prije nego što am e odlučio kupiti kod njih, a ovdje dijelim vla titu recenziju kako bih pomogao o talim pametnim kupcima.Tmart je internet ka trgovina elektronikom...