Examinator: Serik Sagitov, serik@chalmers.se

Kurswebbsida: LGMA30.

Datorövningen är obligatorisk. Om man inte kan delta datorövningen, måste en rapport (3-8 sidor) med lösningsförslag, resultat och diagram (med tolkning) lämnas in senast den 25e oktober 2018.


Introduktion

# setwd("your path to the folder")


1. Konfidensintervall för väntevärden

Lös övning 5.9 (sidan 321) med hjälp av R. Du kan läsa in datan med x = c(147,254,132,98,195,85).

a)

Konstruera själv ett 95% konfidensintervall för väntevärdet \(\mu\). Du kan använda följande R-funktioner som hjälp mean(), sd(), sqrt(), length(), qt().

x = c(147,254,132,98,195,85)

b)

Beräkna konfidensintervallet med t.test funktionen.

# t1 = t.test(?)
# ki1 = t1$conf.int
# ki1

c)

Beräkna längden av konfidensintervalet; t.ex. med l = ki[2]-ki[1]

#l1 = ?

Slumpa 100 \(N\left(150, 64\right)\)-fördelade tal med y = rnorm(100,151,64). Få en ny vektor x2 med x och y värden. x2 = c(x,y). Beräkna längden av konfidensintervalet och jämför x och x2 konfidensintervallens längder. Förklara skillnaden.

y = rnorm(100,151,64)
#x2 = ?
#t2 = ? 
#ki2 = ?
#l2 = ? 

d)

Testa hypotesen \(\mu = 170\) med det ursprungliga stickprovet x och det nya stickprovet med 6 + 100 observationer, förklara skillnaden.


2. Konfidensintervall för väntevärdesskillnad

Data för denna uppgift hittar du på hemsidan. Du kan läsa in data med scan(). Det finns två dokument, som innehåller data över skördad majs vid användning av två olika gödningsmedel.

# m1 = scan(file = "medel1.txt")
# m2 = ?

a)

Jämför stickproven med boxplot(). Tror du att det finns en signifikant skillnad mellan medlens effekt?

b)

Testa hypotesen att det finns en skillnad mellan avkastningarna på 95% konfidensnivån. Anta samma varians för båda stickprov. Hypotesen förkastas?

# t.test(?, ?, alternative = ?, var.equal = ?)

c)

Är antagandet att stickproven har samma varians rimligt? Motivera ditt svar.


3. Stickprov-i-par

Erik vill ta reda på hur vilopulsen påverkas av meditation. För att göra detta frågar han 15 av sina vänner om de vill delta i hans “studie”. Han mäter deras vilopuls i början av studien och efter 10 dagar med 30 min meditation per dag. Data för denna uppgift hittar du på hemsidan. Text filen heter dataR. För att läsa in data till R skriv,

data = read.table("dataR.txt", header=TRUE)

a)

Är det rimligt att anta att observationer kommer från normalfördelade stokastiska variabler? Ledning: Använd hist()

# hist(?)
# hist(?)
# hist(?)

b)

Finns det en statistisk signifikant skillnad mellan vilopulsen före och efter meditationen? Testa hypotesen på konfidensnivån 95%.

# t.test(?, ?, alternative = ?, paired = ?)

c)

Prov hypotesen igen, men denna gång glömma att du har stickprov-i-par? Beskriv och förklara vad händer?

# t.test(?, ?, alternative = ?, paired = ?)


4. Konfidensintervall för väntevärdet och känd \(\sigma\)

En undersökning av storlek \(n = 12\) skolor visade att rund 35% av budgeten gick till modernisering av utrustning; se följande stickprov

x = c(35.6, 33.7, 37.8, 31.2, 37.2, 34.1, 35.8, 36.6, 37.1, 34.9, 35.6, 34.0)

Man antar att x kommer från \(N(\mu, 1.8)\)-fördelade stokastiska variabler.

a)

Konstruera ett 95% och 99% konfidensintervall för väntevärdet \(\mu\).

b)

Hur och varför ändras intervall längden när man ökar konfidensnivån från 95% till 99%?

c)

Testa hypotesen \(\mu = 35\) på 95% konfidensnivån.

d)

Hur mångar observationer (skolor) behövs, så att längden av konfidensintervallet till 95% konfidensnivån är mindre eller lika med 1.5?