Hvordan lage boblediagrammer Et boblediagram kan også bare være rett opp proporsjonalt størrelse bobler, men her skal vi dekke hvordan å lage variasjonen som er som en scatterplot med en tredje boblende dimensjon. Fordelen med denne diagramtypen er at den lar deg sammenligne tre variabler samtidig. Den ene er på x-aksen, den ene er på y-aksen, og den tredje er representert av størrelsen på bobler. Ta en titt på det endelige diagrammet for å se hva vi gjør. Trinn 0. Last ned R We8217 kommer til å bruke R for å gjøre dette, så last det ned før du går videre. It8217 er gratis og åpen kildekode, så du har ingenting å tape. Pluss it8217 er et behov for å kjenne navn 2011. så du kan like godt bli kjent med det nå. Du kan takke meg senere. Trinn 1. Last inn dataene Forutsatt at du allerede har R åpen, er den første tingen vi skal laste inn dataene. Vi undersøker de samme forbrytelsesdataene vi gjorde for vår siste opplæring. I8217ve la til statsbefolkning denne gangen. Ett notat om dataene. Kriminalnummerene er faktisk for 2005, mens befolkningene er for 2008. Dette er en stor del siden vi er mer interessert i relative populasjoner enn vi er de rå verdiene, men husk det. Ok, fortsett videre. Du kan laste ned den tabulatoravgrensede filen her og holde den lokal, men den enkleste måten er å laste den direkte inn i R med underlinjen kode: You8217re fortelle R for å laste ned dataene og lese den som en kommaseparert fil med en Overskrift. Dette laster det som en dataramme i forbrytelsesvariabelen. Trinn 2. Tegn noen sirkler Nå kan vi komme rett til tegning sirkler med symbolene () kommandoen. Pass det verdier for x-aksen, y-aksen og sirkler, og it8217ll spytter ut et boble diagram for deg. Kjør linjen med kode over, og you8217ll får dette: Alt gjort, riktig Feil. Det var en test. Ovenstående størrelser radius av sirkler etter befolkning. Vi ønsker å formatere dem etter område. De relative proporsjonene er alle ute av wack hvis du størrelsen etter radius. Trinn 3. Størr sirkelene riktig Til størrelsesradiusene på riktig måte, ser vi til ligningen for område av en sirkel: Sirkelareal 960r 2 I dette tilfellet er sirkelområdet populasjon. Vi vil vite r. Flytt noen ting rundt og vi får dette: r 8730 (Område i sirkel 960) Erstatningspopulasjon for sirkelområdet, og oversette til R, og vi får dette: Yay. Korrekt skalerte sirkler. De er altfor store, selv om dette diagrammet er nyttig. Som standard, symboler () størrelser den største boblen til en tomme, og deretter skalerer resten resten. Vi kan endre det ved å bruke inches-argumentet. Uansett hvilken verdi du setter, vil erstatte en-tommers standard. Mens we8217re på det, legger let8217s til farge og endrer x - og y-akse-etikettene. Legg merke til at vi bruker fg for å endre kantfarge, bg for å endre fyllfarge. Her får vi: Vi kommer nå et sted. Forresten, kan du også lage et diagram med andre figurer med symboler (). Du kan lage firkanter, rektangler, termometre, boxplots og stjerner. De tar forskjellige argumenter enn sirkelen. Firkantene, for eksempel, er dimensjonert av lengden av en side. Igjen, sørg for at du passer dem riktig. Her ser du hvilke kvadrater som bruker koden nedenfor. Let8217s holder med sirkler for nå. Trinn 4. Legg til etiketter Som det er, viser diagrammet noen fordeling av distribusjon, men vi vet ikke hvilken sirkel som representerer hver stat. Så let8217s legger til etiketter. Vi gjør dette med tekst (). hvis argumenter er x-koordinater, y-koordinater og den faktiske teksten som skal skrives ut. Vi har alle disse. Som boblene er x et mord og y er innbrudd. De faktiske etikettene er statlige navn, som er den første kolonnen i vår dataramme. Med det i tankene gjør vi dette: Cex-argumentet styrer tekststørrelsen. Det er 1 som standard. Verdier som er større enn en, vil gjøre etikettene større og det motsatte for mindre enn en. Etikettene vil sitte på x - og y-koordinatene. Her er det hvordan det ser ut. Trinn 5. Rydde opp Endelig, som vanlig, rydder jeg opp i Adobe Illustrator. Du kan rote rundt med dette i R, hvis du vil, men I8217ve fant it8217s måte enklere å lagre filen min som PDF, og gjør det jeg vil med Illustrator. Jeg redegjør statens etiketter for å gjøre dem mer lesbare, roterte y-akse-etikettene, slik at de er horisontale, lagt til en legende for befolkning, og fjernet ytre grensen. Jeg tok også Georgia til forsiden, fordi det meste var skjult av Texas. Here8217s den endelige versjonen. Klikk på bildet for å se det i sin helhet. Og der går du. Skriv inn symboler i R for flere plottingsalternativer. Bli gal. For flere eksempler, veiledning og allsidig datatilgjengelighet som dette, kjøp Visualisere dette. den nye FlowingData-boken. Hvis du ønsket å bli virkelig nær den resulterende figuren uten å bruke en bildeditor, kan du bruke følgende R-kode. Man kan forbedre statens navnposisjonering med en offsetvektor (og følge rådene i tekst om interaktiv posisjonering). par (tick 0.2, bty 8216n8217) kriminalitet lt - read. csv (quotdatasets. flowingdatacrimeRatesByState2008.csv038quot, headerTRUE, sepquottquot) rydde opp ledige plasser i statlig feltkriminalitet ltgsub (039 039, 039039, forbrytelse) ylim lt 1250) kriminalitet lt - forbrytelsesordre (krimepopulasjon, avtagende sant), radius lt - sqrt (krimepopulasjon pi) symboler (forbrytelsesmurderer, crimeburglary, sirkelradius, tommer 0,35, ylim ylim, fg 039white039, bg 039red039, xlab 039039, ylab 039039, yaxt 039n039) ylabpos lt - (1: 6) 200 akse (2, ylabpos, etiketter FALSE) tekst (-0,35, ylabpos, etiketter ylabpos, pos 2, xpd TRUE) tekst (-1,4, 1350, uttrykk (fet (039Burglaries pern100 , 000 befolkning039)), cex 0.8, pos 4, xpd SANT) tekst (median (forbrytelsesmurderer), -50, uttrykk (fet (039Murder per 100.000 befolkning039)), cex 0,8, xpd SANT) (kriminalitet)) pos-rep (3, nrow (kriminalitet)) poscrimestate i c (039Alabama039, 039California039, 039Connecticut039, 039Maine039, 039Mississippi039, 039Ne w York039, 039North Dakota039, 039Georgia039, 039Alaska039) LT 1 poscrimestate i c (039Hawaii039, 039Indiana039, 039Illinois039, 039Minnesota039, 039Nebraska039, 039West Virginia039, 039Wyoming039) LT-2 poscrimestate i c (039Arizona039, 039Massachusetts039, 039Nevada039, 039Rhode Island039, 039South Dakota039 , 039South Carolina039, 039Wisconsin039) lt - 4 tekst (forbryter, forbrytelse, forbrytelse, cex 0,5, pos pos, offset 0.25) opprette legenden legPop lt (4e7, 2e7, 3e6) legRad lt sqrt (legPop pi) hin lt - par (039pin039) 2 burgPerInch lt - (ylim2 8211 ylim1) hin radPerInch lt - max (radius) 0.35 høyAdj lt - legRadradPerInchburgPerInch symboler (rep (9,3), rep (200,3) høydeAdj, sirkler legRad, tommer 0,35, legg til TRUE) TAdj lt - strheight (03940m039, cex 0.5) tekst (rep (9,3), rep (200,3) heightAdj2 8211 tAdj, c (03940m039, 03920m039, 0393m039), cex 0.5) Dette har vært nyttig hittil. Hvis jeg ønsket å klassifisere boblene i tre kategorier med forskjellige boblefarger, hvilken kode er det nødvendig? For eksempel vil jeg vise innbrudd (y) ved mord (x) med populasjonsstørrelse (z) for 1. Kvinner, 2.Mann og 3.Karn. Dermed har vi for eksempel blå sirkler som representerer hanner, røde sirkler som representerer kvinner og grønne sirkler som representerer barn8230 Hei Nathan, jeg har kommet til nettstedet ditt i dag, utforsket og gjennomførte noen opplæringsprogrammer. Jeg har et problem i denne, kanskje en noob, som I8217m ikke ekspert på Illustrator. Jeg eksporterer R boblegrafen til PDF og åpner den på Acrobat ok, men når jeg åpner den på Illustrator, mangler noen bobler og erstattes av et X-bilde. Hva gjør jeg galt nå for å svare. Btw, nettstedet ditt er flott: masse info og moro med data og grafikk.
No comments:
Post a Comment