DataViz.ro, Statistics, Tableau

Scatter plot, la ce e bun si cum il putem realiza in Tableau

septembrie 18, 2018

Scatter Plot, daca ar fi sa traduc aceste cuvinte separat in romana ar fi:

  • “to scatter” – a dispersa sau a imprastia si
  • “to plot” care inseamna a reprezenta grafic.

In limba romana, denumirea acestui grafic este  “Diagrama de corelatie” sau “Diagrama de dispersie”.

Ceea ce inseamna ca un scatter plot este o reprezentare grafica care arata corelatia dintre doua variabile (X si Y).

Din punct de vedere al structurii bazei de date acest lucru duce la o structura pe “situatii” sau “evenimente” ca in exemplul de mai jos:

Reprezentarea grafica se va face in functie de fiecare situatie sau eveniment in separat pe o axa “XoY“:

Pentru a intelege mai bine, am reprezentat grafic fiecare intersectie a punctelor X si Y pentru toate cele 5 situatii din exemplul de mai sus:

*acest scatter plot a fost realizat in MS Excel

Acum ca am inteles bazele teoretice as vrea sa abordam dilema scatter plot-ului din doua perspective:
             – cum se poate realiza in Tableau si bune practici pentru realizarea graficului,
             – si cum interpretam acest grafic in asa fel incat sa aduca valoare adaugata business-ului.

Interpretare:

Modul de plasare al punctelor (xi, yi) conduce catre stabilirea unei relatii intre cele doua variabile.

In acest sens, diagrama de dispersie se Imparte in patru cadrane ca in imaginea de mai jos.

In functie de modul de plasare al majoritatii punctelor (xi, yi) (norul de puncte) in cele patru cadrane putem avea doua situatii:

Relatie liniara existenta

1. Majoritatea punctelor sunt plasate in cadrane dispuse in diagonala.

Caz in care putem spune ca intre cele doua variabile există relatie liniara.

Relatie liniara inexistenta

2. Majoritatea punctelor sunt plasate relativ uniform in cele patru cadrane.

Caz in care intre cele doua variabile nu exista o relatie liniara.

*sursa www.umfcv.ro

Mod de realizare in Tableau:

Am sa incerc mai jos sa detaliez modul in care vom realiza un scatter plot in cativa pasi simpli prin folosirea unei baze de date obtinuta de la worldbank.org:

Pasul 1:

Decidem ce vrem sa exprimam pe axa X si Y.

Astfel vom folosi doua masuri pe care le vom plasa pentru axa X pe “Columns” si pentru axa Y pe “Rows”

Dupa ce am plasat masurile pe axele dorite vom avea un grafic cu un singur punct.

Care in cazul meu va reprezenta intersectia dintre suma tuturor PIB-urilor si suma tuturor sperantelor de viata.

Pasul 2:

In acest pas vom decide care este nivelul de detaliu la care vrem sa ajungem.

Spre exemplu, pe mine nu ma intereseaza suma PIB vs suma sperantelor de viata. Eu as vrea sa vad PIB-ul fiecarei tari vs speranta de viata.

Pentru a obtine nivelul de detaliu dorit, acesta va trebui plasat pe card-ul “Detail”:

Dupa aceasta etapa puntul despre care am vorbit in pasul anterior se va impartii pe fiecare tara din baza mea de date.

Pasul 3:

Conform relatiilor descrise mai sus acestea par a avea o relatie liniara.

Folosind meniul “Analytics” si optiunea “Trend Line” -> “Linear”, putem adauga in graficul nostru o linie de trend.

Daca ne uitam atent in partea de mijloc a graficului un “patratel” in dreapta creste aproape cu un “patratel” in sus.

Ceea ce inseamna ca la mai putin de 10,000 USD in PIB-ul pe cap de locuitor speranta de viata poate creste cu aproximativ 10 ani.

Asta pana cand se depaseste pragul de 30,000 USD, cand PIB-ul nu mai are o importanta asa de mare in speranta de viata.

*pentru o intelegere mai amanuntita a liniei de trend recomand acest curs de la khanacademy.org.

In business, cea mai intalnita utilizare a scatter plot-ului de pana acum si pe care am folosit-o destul de mult este corelatia dintre profit si vanzare.

Care din proprie experienta necesita cateva cunostinte de statistica cel putin de baza pentru a putea fi interpretata intr-un mod corespunzator si totodata trebuie sa luati in calcul analiza unei populatii cat mai omogene.

 

Spor la treaba!

Pentru mai multe informatii si colaborari va stau oricand la dispozitie la adresa de e-mail contact@dataviz.ro sau prin completarea formularului din pagina de contact.

 

You Might Also Like