En R diagram gir mulighet for etablering av komplekse funksjoner og diagrammer . I mange tilfeller , statistikere med R diagrammer implementere dem til å få en sterk forståelse av utviklingen av et datasett . Likevel er det vanskelig å si bare ved å se etter midten av trenden eller data. I slike tilfeller er det best å beregne en midtlinjen for diagrammet , slik at du kan plotte figuren på data . Denne prosessen er enkel og spesielt nyttig, fordi den gjør det mulig å få et klart , objektiv idé av gjennomsnittet eller generell trend for de plottede data . Instruksjoner
en
Beregn midtlinjen for dataene på den horisontale aksen ( den uavhengige variabelen ) . Beregn middelverdien for de uavhengige data . Bruk kommandoen "mi < - mean ( data) , " hvor " data " er det sett av data som du har plottet langs den horisontale til R diagrammet . Separer hvert datapunkt i dette datasettet fra følgende datapunkt med et komma , for eksempel "mi < - mean ( 1 , 3, 9 , 3, 4)" . Midtlinjen for disse dataene er den vertikale linje trukket på "x = mi " . Plotte denne linjen med kommandoen " abline (h = km) . "
2
Beregn midtlinjen for dataene på den vertikale aksen ( den avhengige variabelen ) . Du gjør dette mye på samme måte som for den uavhengige variabelen. Bruk kommandoen " md < - gjennomsnitt ( data) , " hvor " data " denne gangen viser til data som er plottet langs den vertikale til R diagrammet . Igjen , skille datapunktene med komma , akkurat som i " md < - . Gjennomsnitt ( 4, 1, 4, 8 , 2 )" Plot denne linjen ved hjelp
" abline (v = md ) . "
3
Plot midtlinjen for dataene som en helhet. Dette trinnet passer egentlig en linje mellom alle dataene , og skaper en diagonal linje. Bruk kommandoen " Fitline < - lm ( dep ~ ind ) " for å beregne linjen. I denne koden , " dep " er avhengig variabel og " ind " er din uavhengige variabelen. Hvis du ikke har opprettet slike variabler , gjør du det ved å bruke koden " dep < - depdata " og " ind < - inddata , " hvor " depdata " er den avhengige variabelen datapunkter ( nøyaktig de samme datapunkter som brukes i beregning gjennomsnittet for den avhengige variabelen ) og " inddata " er den uavhengige variabelen datapunkter. Plotte denne linjen med koden " abline ( Fitline ) . "