Kā burbuļa plāns parāda labākās pilsētas, kuras dzīvot ASV

Šajā rakstā es jums parādīšu dažus aizraujošus faktus par Amerikas pilsētām, burbuļu zemes gabalu vērtību, izlemjot, kurā pilsētā dzīvot, un kā šos zemes gabalus izveidot.

Vai domājat par ieguldījumiem nekustamajā īpašumā 2018. gadā? Pārceļaties uz jaunu pilsētu? Apsverot šos lēmumus, jums jānovērtē dažādi faktori, piemēram, bezdarba līmenis, mājokļa cena, pilsētas lielums, drošība un tā tālāk. Pat ar visiem šiem datiem un četrām atbilstošajām joslu diagrammām jūs joprojām varēsit skatīties uz šo tabulu. Jūs mēģināsit atrast labākos kandidātus, taču šie faktori stāsta dažādus stāstus ... Izklausās pēc sarežģītas problēmas.

Tātad, vai ir veids, kā mēs varam visus šos faktorus vizualizēt 1 diagrammā un salīdzināt tos VISUS? Jā, mēs varam izmantot burbuļa zīmi!

Kas ir burbulis?

Burbuļa diagramma ir diagrammas tips, kas parāda vairāk nekā divas datu dimensijas (salīdzinājumā ar tradicionālajiem izkliedes diagrammām). Papildus punkta uzzīmēšanai X-Y plaknē, tā izmanto punkta lielumu, krāsu vai formu, lai parādītu vairāk dimensiju.

Bezdarba līmeni mēs izmantojam kā X asi, mājas vidējo cenu kā Y asi, bet pilsētu lielumu kā punktu lielumu. Tas veido labu trešo dimensiju. Krāsa ir nejauši piešķirta katrai pilsētai.

Labākā pilsēta ASV, kur dzīvot, ir… (pagaidiet to)

Uzvarētājs: Nešvilla!

Citi ieteikumi: Ostina, Omaha, Milvoki, Dalasa, Mineapolisa, Denvera un Aurora.

Viņiem ir zems bezdarbs (un tāpēc ir lielākas iespējas atrast darbu) un zemas mājas cenas, jo viņi atrodas zemes gabala apakšējā kreisajā pusē. Ko tas nozīmē?

Tas nozīmē, ka jūs varat izdarīt izvēli, pamatojoties uz šo sižetu.

Piemēram, ja jūs uzskatāt, ka bezdarba līmenis ir svarīgāks, un neņemiet vērā augstākas māju cenas, tad Honolulu, Oakland, Boston un San Diego ir spēcīgi kandidāti

Kas par drošības kā cita faktora pievienošanu?

Protams. Pievienosim drošību kā ceturto faktoru (pārējie trīs faktori joprojām ir mājas cena, bezdarba līmenis un iedzīvotāju skaits). Tā vietā, lai nejauši piešķirtu pilsētai krāsu, mēs izmantojam krāsu skalu noziedzībai (noziedzības līmenis uz 100 000 cilvēku). Sarkans nozīmē vairāk noziegumu un zils nozīmē mazāk.

Vai rezultāts mainās?

Tā izdarīja! Ja drošība jums ir ļoti svarīga, Milvoki, iespējams, nav tik lieliska izvēle starp iepriekšējiem ieteikumiem (kaut arī tā atrodas diagrammas apakšējā kreisajā pusē).

Tagad jūs redzat burbuļa grafika spēku: spēja demonstrēt vairākus faktorus vienā divdimensiju grafikā. Ja jums ir tikai šo faktoru joslu diagrammas, jums ir grūti noteikt pilsētas ar ideālu faktoru kombināciju. Burbuļa plāns būtībā izveidoja jums “vizuālā objekta funkciju”, lai optimizētu vairāku mainīgo lēmumu pieņemšanas problēmu.

Kā laika gaitā mainās bezdarba līmenis un mājas cena?

Mēs varam izveidot interaktīvu kustības diagrammu, lai pievienotu laiku kā dimensiju (no 2013. līdz 2017. gadam), lai redzētu, kā laika gaitā mainās šo pilsētu faktori.

Lai izvairītos no pārāk daudz vizuālas informācijas, es neizmantoju datus par noziedzību un dažu izvēlēto pilsētu attēlošanai izmantoju dažādas krāsas.

Labās ziņas ir tas, ka gandrīz visās pilsētās bezdarba līmenis ir ievērojami samazinājies (pārvietojoties no labās uz kreiso). Bet sliktā ziņa ir tā, ka mājokļu cenas pieaug diezgan strauji (īpaši Sanfrancisko, Sanhosē, Los Angles, Ņujorkā un Sietlā).

Vai vēlaties pats izveidot diagrammas? Šeit ir mans kods burbuļa grafikiem un kustības shēma R. Izklaidējieties spēlējot ar zemes gabaliem :)

###############
# Burbuļa plāns #
###############
bibliotēka (datu tabula)
bibliotēka (ggplot2)
bibliotēka (ggrepel)
bubble_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/bubble_plot_merged_city_data.csv", sep = ",")
bubble_plot <- ggplot (bubble_data,
               aes (x = bezdarba_vērtējums, y = mājas_cena / 1000)) +
geom_point (aes (lielums = Iedzīvotāji, aizpildiet = Kopējais_crime), forma = 21) +
# Izveidojiet “burbuli”, piešķirot lielumam mainīgo #
scale_fill_continuous (zems = "# 33FFFF", augsts = "# FF6699") +
mēroga_izmērs_lielākais (maksimālais_lielums = 20) +
# Izvēlieties burbuļa krāsu skalu un burbuļa maksimālo lielumu #
geom_text_repel (
          aes (etiķete = Pilsēta), nudge_x = 0, nudge_y = 0,75, lielums = 6) +
# Izmantojiet geom_text_repel, lai atdalītu etiķetes viena no otras #
motīvs_bw () +
# Noklusētā pelēkā vietā izmantojiet baltu fonu #
ggtitle ("Labākās pilsētas, kurās dzīvot ASV") + laboratorijas (x = "Bezdarba līmenis%", y = "Mājas cena",
       lielums = "Iedzīvotāji", aizpildiet = "Noziegums") + tēma (plot.title = element_text (lielums = 25, hjust = 0,5)),
        ax.title = element_text (izmērs = 20, seja = "treknraksts"),
        ax.text = element_text (lielums = 15)) +
# Stila nosaukums un ass #
mērogs_nepārtraukts (nosaukums = "Mājas cena", pārtraukumi = sec (0, 1500, par = 250),
                      etiķetes = c (“0”, “250K”, “500K”, “750K”, “1000k”, “1250k”, “1500K”))
# Padariet y asi lasāmāku, aizstājot zinātnisko numuru ar “K” #
drukāt (bubble_plot)
################
# Kustības diagramma #
################
bibliotēka (datu tabula)
bibliotēka (googleVis)
motion_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/motion_chart_merged_city_data.csv", sep = ",")
kustības diagramma <- gvisMotionChart (kustības_dati,
idvar = "Pilsēta",
timevar = "gads",
xvar = "Bezdarba līmenis",
yvar = "mājas cena",
sizevar = "Iedzīvotāji")
sižets (kustības diagramma)
# R automātiski pārlūkā atver cilni
# Flash atskaņotājā ir jābūt iespējotam pārlūkā
Noklikšķiniet uz ikonas “⌽”, lai iespējotu Flash
########
# Dati #
########
"" "
Manas izmantotās datu kopas ir no Zillow (vidēja lieluma), FBI UCR programma, census.gov (iedzīvotāji), Darba birojs (bezdarbs).
Es veicu datu tīrīšanu un savienošanu ar formātu, kas man bija nepieciešams šajā rakstā, un jūs varat noklikšķināt uz zemāk esošajām saitēm, lai lejupielādētu.
"" "
bubble_plot_merged_city_data.csv, motion_chart_merged_city_data.csv

Sekojiet man un dodiet man dažus skaudumus, ja jums tas šķita noderīgi!

Varat arī izlasīt manus iepriekšējos rakstus par datu zinātni, nekustamo īpašumu un lēmumu pieņemšanu: