SF1915 Sannolikhetsteori och
statistik för M.
Aktuell information.
Här ges fortlöpande information om schemaändringar, vad som gåtts igenom på föreläsningar etc.
Tentan 23 okt är nu rättad.
Den kommer att vara scannad senast måndag. Den kommer att
vara inrapporterad senast måndag. Informationen om
kompletteringstentan kommer att att mailas ut till de berörda i
början av nästa vecka.
Laboration 2
De som önskar redovisa Laboration 2 måste boka en
redovisningstid senast torsdag 10/10 kl 23.59 (se nedan).
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och
öppna Matlab samt ta fram era redovisningsuppgifter.
Ni behöver också ha med er en utskrift av
labspecifikationen som ni har skrivit era personnummer på
förstasidan på. Denna utskrift undertecknar labassistenten
efter att han eller hon har godkänt labben och utskriften
fungerar sedan som ert kvitto på resultatet.
Instruktion om
hur man anmäler sig till lab2
Gå in på personer. Välj en grupp 1-48. Gå in i kalender. Klicka
på "Hitta möte". Välj kurs. Klicka på "Lämna in". Välj tid.
Klicka på "Reservera".
Länkarna till lab 1 och lab 2 är nu uppdaterade
BETA ej längre tillåtet hjälpmedel på tentan
På gamla tentor stod att BETA är tillåtet hjälpmedel på
tentan. Observera att BETA ej längre är tillåtet
hjälpmedel på tentan.
Administrativa ärenden
I ärenden som är administrativa kontakta studentoffice@math.kth.se
Tentamen
Fr. o.m. per 1 HT18 består tentamen av två delar. Del I
för godkänt och del II för högre betyg. Se Examinationsregler
Kontrollskrivningen
Kontrollskrivningen omfattar kap 2-5.Tillåtet
hjälpmedel:miniräknare.
Ons 9 okt Började med att berätta när CHI-2-test
används och tog som inledande exempel på detta uppgift 5 på tentan
8 juni 2018. Första timmen ägnades sedan helt åt att grundligt gå
igenom exempel 13.18 i läroboken som exempel på test av given
fördelning där man dels måste skatta minst en parameter ur data (i
detta fall μ) för att skatta p1,p2,.. pr,
dels slå ihop grupper för att villkoret npi≥5 skall
gälla för alla i. Berättade sedan om när homogenitetstest används
och tog som exempel på detta en forskningsrapport där man ville
undersöka huruvida det var någon skillnad mellan 36 timmar gamla
pojkar och flickor vad gällde vad de föredrog att titta på.
Berättade efter detta att man vid oberoendetest kan använda sig av
identiskt samma numerik som man gör vid homogenitetstest. Gjorde
uppgift 5 på tentan 2017-01-09 som exempel på detta.
Mån 7 okt Inledde med att som repitition skriva upp
samma lista som föregående föreläsning på viktiga definitioner och
begrepp som används inom hypotesprövning, såsom
nollhypotes,mothypotes, risknivå, p-värde, och styrka.Fortsatte
sedan sedan med exempel 13.8 och gjorde nu hypotesprövning i
fallet ensidigt test, dels med kofidensintervallmetoden dels med
testvariabelmetoden. Detta gjordes med olika värden på risknivån α
och m.h.a. detta visades också i vilket intervall p-värdet måste
ligga. Gjorde sedan övningsuppgift 13.21a för att visa hur man tar
fram styrkan hos ett test när man har använt sig av
konfidensintervallmetoden. Utifrån detta visades även hur man tar
fram styrkefunktionen - i detta fall h(θ) där θ =μx-μy.
Gick sedan igenom linjär regression och visade att parametrarna α
och β skattas med Minsta-kvadrat-metoden. Fortsatte med att visa
hur man i multipel regression m.h.a. nollhypotesen H0
:βi =0 kan avgöra om man ska kasta respektive oberoende
variabel xi eller ej. Gjorde övningsuppgift 14.7a som
exempel på detta. Avslutade med att skissa några exempel där man
med hjälp av residualanalys kan avgöra huruvida det är troligt att
y beror linjärt av x.
Ons 2 okt Inledde med att skriva upp en lista på
viktiga definitioner och begrepp som används inom hypotesprövning,
såsom nollhypotes,mothypotes, risknivå, p-värde, och styrka.Gick
därefter igenom exempel 13.1 i läroboken som exempel på ett fall
där man inte använder konfidensintervall för att testa sin
nollhypotes.Fortsatte därefter med exempel 13.4 i läroboken, där
man tar fram styrkan hos testet i exempel 13.1 för alternativet
p=0.9, och tog även fram styrkefunktionen h(p) i detta
fall.Började sedan med exempel 13.8 och gjorde hypotesprövning i
fallet tvåsidigt test, dels med konfidensintervallmetoden dels med
testvariabelmetoden. Detta gjordes med olika värden på risknivån α
och m.h.a. detta visades också i vilket intervall p-värdet måste
ligga. Hann sedan göra hypotesprövning i fallet ensidigt test med
konfidensintervallmetoden innan det var dags att sluta.
Mån 30 sep Började med att repetera konfidensintervallet
för skillnaden mellan väntevärdena hos två Normalfördelade
stickprov där standardavvikelserna är okända och lika och hur man
m.h.a. §11.2 viktar ihop de två stickprovsvarianserna för att få
en skattning s av standardavvikelsen. Efter detta visades det
viktiga fallet när man har parvisa observationer-"stickprov i
par"- och att konfidensintervallet för väntevärdet av de parvisa
skillnaderna då tas fram som om man har ett stickprov av parvisa
skillnader. Som exempel på "Skillnad mellan stickprov" visades
tentatal 2019-06-05:15 och som exempel på "Stickprov i par"
visades tentatal 2019-08-12:15. Gick sedan igenom
konfidensintervall med approximativ konfidensgrad där §12.3
används. Visade att om stickproven är så stora så att C.G.S. kan
användas, så kan man bilda konfidensintervall med approximativ
konfidensgrad för väntevärden och skillnader mellan väntevärden
även om observationerna inte kommer från en Normalfördelning.
Avslutade kapitel 12 med att visa konfidensintervall med
approximativ konfidensgrad för p när X tillhör Bin(n,p), för py-
px när Y tillhör Bin(ny,py) och X tillhör Bin(nx,px) samt för my i
Poisson-fördelningen och att det i alla dessa fall förutsätter att
Normalapproximation är möjlig enligt villkoren i §5. Tog därefter
fram konfidensintervallet för standardavvikelsen utgående från
§12.4 i Formelsamlingen. Visade utgående från detta
konfidensintervall hur konfidensintervallet för variansen ser ut.
Visade också utgående från det tvåsidiga konfidensintervallet för
standardavvikelsen hur man tar fram det ensidiga.
Ons 25 sep Började med att definiera begreppet medelfel och
tog som exempel medelfelet för skattningen av väntevärde när detta
skattats med medelvärdet.Definierade därefter begreppen
konfidensintervall och konfidensgrad i allmänna fallet. Härledde
därefter det tvåsidiga konfidensintervallet för väntevärdet när
mätdata kommer från en Normalfördelning där standardavvikelsen är
känd. Visade utgående från detta hur man generellt bildar ensidigt
nedåt begränsade och ensidigt uppåt begränsade konfidensintervall.
Visade i samband med detta hur man använder §12.1 0ch 11.1 för att
ta fram det tvåsidiga konfidensintervallet ovan. Visade sedan
utgående från det första konfidensintervallet hur det tvåsidiga
konfidensintervallet för väntevärdet ser ut när mätdata kommer
från en Normalfördelning där standardavvikelsen är okänd. Därefter
visades konfidensintervallet för skillnaden mellan väntevärdena
hos två Normalfördelade stickprov där standardavvikelserna är
kända. Sedan visades hur man bildar ett konfidensintervall med
approximativ konfidensgrad för skillnaden mellan väntevärdena hos
två Normalfördelade stickprov där standardavvikelserna är okända
och olika. Därefter visades konfidensintervallet för skillnaden
mellan väntevärdena hos två Normalfördelade stickprov där
standardavvikelserna är okända och lika och hur man m.h.a. §11.2
viktar ihop de två stickprovsvarianserna för att få en skattning s
av standardavvikelsen. Avslutade med att visa hur man m.h.a. §12.2
och §11.2 får fram det tvåsidiga konfidensintervallet i detta
fall.
Mån 23 sep Började med att repetera begreppen TÄTA,TÄTA*
,TÄTA*obs. Presenterade därefter Maximum-Likelihood-metoden och
räknade exempel 11.10 i läroboken som exempel på denna. Fortsatte
med att gå igenom Minsta-kvadrat-metoden. Som exempel visades hur
man kunde göra MK-skattningen av arean hos en kvadrat där 2
mätdata var sidans längd, och 3 mätdata var diagonalens längd. Tog
sedan exempel 11.19 i läroboken som exempel på hur
Minsta-kvadrat-skattning går till när två saker ska skattas.
Definerade avslutningsvis begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa.
Tor 19 sep Började med kap 10 och definierade medelvärde,
stickprovsvarians, populationsvarians, variationskoefficient,
median, kovarians och korrelationskoefficient. Gick sedan igenom
begreppen grupperade data,absolut och relativ frekvens,
klassindelade data,histogram och boxplott.Avslutade kapitel 10 med
att visa hur man tar fram kvartiler och percentiler. Började sedan
kap 11 med att redogöra för skillnaden mellan det riktiga värdet
TÄTA,stickprovsvariabeln TÄTA* och punktskattningen TÄTA*obs. Tog
som exempel på skattning hur man brukar skatta väntevärdet my och
standardavvikelsen sigma vid okänd fördelning. Tog sedan som
ytterligare exempel på skattningar hur man skattar p i
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen samt my och sigma i Normalfördelningen.
Avslutade med att definera begreppet konsistent skattning.
Mån 16 sep Började med att repetera lite om
Normalfördelningen. För att visa när och hur tabell 1 används
visades exempel 6.2a och b. Exempel 6.2b är också exempel på att
varje linjärkombination av oberoende N-fördelade slumpvariabler är
normalfördelad.
Fortsatte med att ta fram k när
P(E[X]-kD[X]<X<E[X]+kD[X])=0.95 som exempel på hur Tabell 2
används och pekade på tabell 2 för att visa vad k ungefär blir när
sannolikheterna är 0.99 och 0.999.
Avslutade kapitel 6 med att presentera den viktiga Centrala
Gränsvärdessatsen (CGS), som säger att summan av n oberoende
likafördelade stokastiska variabler är approximativt
normalfördelad om n är stort, och att detta även medför att
medelvärdet är approximativt normalfördelat. Definierade sedan
Hypergeometriska fördelningen och skrev upp dess
sannolikhetsfunktion. Definierade sedan Binomialfördelningen och
skrev upp dess sannolikhetsfunktion. Talade om att Hyp(N,n,p)~
Bin(n,p) om n/N<0.1. Visade sedan utgående från
Bernoullifördelningen att villkoret np(1-p)>10 för
Normalapproximation egentligen är ett C.G.S.-villkor. Fortsatte
med att gå igenom halvkorrektion. Definierade efter detta
Poissonfördelningen. Avslutade kap 7 med att berätta att
sannolikhetsdefinitionen för Binomialfördelningen övergår i
sannolikhetsfunktionen för Poissonfördelningen om p är litet,
vilket motiverar att om p<0.1 så gäller att
Bin(n,p)~Po(np).
Tor 12 sep Började med att som övning på att räkna ut en
kovarians göra övningsuppgift 5.18. Gick sedan igenom räkneregler
för kovarianser och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att
V(X+Y)=V(X)+V(Y) om X och Y är oberoende.Fortsatte med att ta fram
väntevärde och standardavvikelse för medelväret av n st ober
stokastiska variabler. Skrev i samband med detta upp Stora talens
lag och Tjebysjevs olikhet. Skrev sedan upp täthetsfunktionen och
fördelningsfunktionen för normalfördelningen. Skrev efter det upp
täthetsfunktionen och fördelningsfunktionen för standardiserade
normalfördelningen N(0,1). Skrev sedan upp att om X är
N(E[X],D[X]) så gäller
att Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och hur man
använder Tabell 1 och Tabell 2 i formelsamlingen och vad
alfa-kvantilen är. Tog fram P(E[X]-kD[X] < X < E[X]+kD[X])
för k=2 när X är N(E[X],D[X]) som exempel på hur Tabell 1 används,
och skrev sedan som avslutning även upp sannolikheterna för att
ett utfall hamnar högst en,två,tre respektive sex
standardavvikelser ifrån väntevärdet.
Mån 9 sep Började med att repetera det i kap 5 som
jag avslutade förra föreläsningen med. D.v.s. jag startade med att
berätta att väntevärdet är vad man får i genomsnitt om man gör
oändligt många försök. T.ex. blir ju det genomsnittliga värdet av
ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken. Skrev
sedan upp definitionen för E(X) resp. E(g(X)) i det diskreta
fallet och det kontinuerliga fallet. Tog sedan och räknade ut E(X)
och E(X²) i Ex. 5.1 i boken. Började därefter med dagens
föreläsning genom att definiera variansen V( X) och
standardavvikelsen D(X). Sedan använde jag mig även här av ex 5.1
i boken för att räkna ut variansen m.h.a. definitionen. Härledde
sedan ur definitionen formeln V(X)=E(X²)-(E(X))² och räknade ut
samma varians m.h.a. denna formel. Gick sedan igenom följande
viktiga räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c, V(aX+b)=V(aX)=a²V(X), samt om X
och Y är oberoende: V(X+Y)=V(X)+V(Y). Definierade även
variationskoefficienten R(X)=D(X)/E(X).Fortsatte med att definiera
systematiskt fel och slumpmässigt fel och redogjorde för
skillnaden mellan noggrannhet och precision. Definierade sedan
E[g(X,Y)] i det diskreta och det kontinuerliga fallet. Definierade
sedan begreppet kovarians och visade att V(X)=C(X,X). Definerade
sedan begreppet korrelationskoefficient och berättade om dess
egenskaper. Visade att om X och Y är oberoende så leder det till
att E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0,
d.v.s. att X och Y är okorrelerade. Visade sedan att omvändningen
inte behöver vara sann genom att göra exempel 5.13 i läroboken.
Tor 5 sep Började med att gå igenom funktioner av
stokastiska variabler. Tog som exempel i det diskreta fallet
exempel 3.16 i Blom och som kontinuerliga exempel gjorde jag
exempel 3.20 och exempel 3.19 i Blom. Fortsatte sedan med att gå
igenom flerdimensionella diskreta och kontinuerliga stokastiska
variabler. Gick igenom begreppen simultan sannolikhetsfunktion
repektive simultan täthetsfunktion och hur man ur dessa får fram
den marginella sannolikhetsfunktionen respektive den marginella
täthetsfunktionen och hur man vid oberoende även kan gå åt andra
hållet. Visade till sist hur man räknar ut sannolikheter i det
två-dimensionella diskreta och kontinuerliga fallet. Fortsatte med
att visa hur man tar fram Fördelningsfunktionen för max(X,Y) och
min(X,Y) utgående från Fördelningsfunktionerna för X respektive Y.
Avslutade kapitel 4 med att som exempel på summa visa att summan
av ober Poisonfördelade stok.var. är Poissonfördelad. Började med
kapitel 5 och startade med att berätta att väntevärdet är vad man
får i genomsnitt om man gör oändligt många försök. T.ex. blir ju
det genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan
exempel 5.1 i boken. Skrev sedan upp definitionen för E(X) resp.
E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Tog
sedan och räknade ut E(X) och E(X²) i Ex. 5.1 i boken.
Tis 3 sep Gick först igenom Hypergeometriska fördelningen.
Gick sedan igenom Poissonfördelningen och gjorde ex 7.7 som
exempel på att summan av oberoende Poissonfördelningar är
Poissonfördelad. Började sedan med kontinuerliga stokastiska
variabler. Definierade täthetsfunktionen och gick igenom hur man
ur den får fram Fördelningsfunktionen och vice versa. Berättade
att eftersom hela kapitel 6 ägnas åt Normalfördelningen gås den
igenom då. Gick därefter igenom exponentialfördelningen.Fortsatte
med att visa att tiden mellan två händelser är exponentialfördelad
om antalet händelser är Poissonfördelat. Visade även att
exponentialfördelningen saknar minne. Gick sedan igenom den
likformiga fördelningen och tog som exempel på denna exempel 3.8
och exempel 3.9 i läroboken. Tog till sist exempel 3.14 i
läroboken som exempel på en blandad fördelning av diskreta och
kontinuerliga stokastiska variabler.
Fre 30 aug Gick först igenom ex 2.20 som är en intressant
tillämpning av Bayes sats. Visade sedan definitionen för oberoende
utgående från betingningsformeln. Avslutade därefter kapitel 2 med
exempel 2.23 som exempel på oberoende. Inledde sedan kapitel 3 med
att gå igenom begreppet stokastisk variabel och definera
sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp stolpdiagrammet. Definierade sedan
Fördelningsfunktionen och berättade om dess egenskaper. Tog som
exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick
sedan igenom ett antal viktiga diskreta fördelningar. Började med
tvåpunktsfördelningen och då speciellt Bernoullifördelningen.
Fortsatte med den likformiga fördelningen och
för-första-gången-fördelningen och den snarlika geometriska
fördelningen. Avslutade med att gå igenom Binomialfördelningen.
Ons 28 aug Började med att gå igenom fallet dragning
utan återläggning utan hänsyn till ordning. Gick därefter igenom
sannolikheten att vid n dragningar utan återläggning utan hänsyn
till ordning dra k vita kulor från v vita och s svarta kulor.
Detta är ett exempel på när man har Hypergeometrisk fördelning.
Utvidgade sedan detta till sannolikheten att dra g gula och r röda
och b blåa o.s.v när man har r färger. Gick sedan igenom
sannolikheten att vid n dragningar med återläggning utan hänsyn
till ordning dra k vita kulor från v vita och s svarta kulor.
Detta är ett exempel på när man har Binomialfördelning. Utvidgade
sedan detta till sannolikheten att dra g gula och r röda och b
blåa o.s.v när man har r färger. Detta är ett exempel på när man
har Multinomialfördelning.Började sedan med betingad sannolikhet.
Illustrerade betingningsformeln m.h.a. exemplet på sid 26 i
läroboken. Visade lagen om total sannolikhet m.h.a. Venndiagram
och tog exempel 2.17 som exempel på denna. Visade även Bayes sats
m.h.a. Venndiagram och tog exempel 2.19 som exempel på denna.
Mån 26 aug Presenterade först kursens hemsida som hittas
både på http://www.math.kth.se/matstat/gru och på Canvassidan.
Berättade om kursupplägget genom att visa olika länkar och dess
innehåll. Fortsatte sedan med ge exempel på olika
användningsområden som ämnet matematisk statistik har och denna
kurs ger en introduktion till. Började sedan med att gå igenom
utfall,utfallsrum,händelser.Förklarade därefter skillnaden mellan
diskret och kontinuerlig fördelning. Tog övningsuppgift 2.1a och b
som exempel på diskreta utfallsrum. Gick sedan igenom snitt,
union, komplement och visade hur man med hjälp av Venndiagram
räknar ut sannolikheter. Definierade i samband med detta
disjunkthet. Resten av tiden ägnades åt kombinatorik. Började med
multiplikationsprincipen och den klassiska
sannolikhetsdefinitinen. Gick igenom draging med återläggning med
hänsyn till ordning och tog som exempel att antal pinkoder blir
10^4 eftersom antal kombinationer när man drar k ggr från n
element blir n^k.Som exempel på dragning utan återläggning med
hänsyn till ordning tog jag en förening med 8 medlemmar som skulle
välja ordförande,sekreterare och kassör vilket ger 8ggr 7ggr 6
kombinationer. Allmänna fallet n!/(n-k)! kombinationer.
|