SF1901 Sannolikhetsteori och
statistik för D.
Aktuell information.
Här ges fortlöpande information om schemaändringar, vad som gåtts igenom på föreläsningar etc.
Alla
administrativa frågor sköts av
matematiks studentexpedition.
Tentan 2017-05-30 finns nu under länken Gamla
tentor och KS
Tid för omtentan är nu
fastslagen. Den går mån 14 augusti 08.00-13.00.
Anmälningstid: 5 juli-31 juli.
Länken Formelsamling
På dagens föreläsning (15/5) påpekade flera elever att länken
"Formelsamling" på indexsidan inte fungerade. Jag lovade att
åtgärda detta, men när jag klickar på den så fungerar den.
Kontrollskrivningarna är nu inlämnade för scanning.
Rätta svar på KS:en 1) 0.500 2) 0.866 3) 0.458 4) 0.833 5) 0.690
Skrivningen med svar finns här.
Laboration
Se till att komma till labbsalen minst tio minuter före redovisningstiden så att ni hinner logga in
på datorn och öppna Matlab samt ta fram era redovisningsuppgifter. Skriv även upp vilken dator ni sitter
vid på whiteboarden i datorsalen, så att labbassistenten lätt hittar er när redovisningstiden börjar.
Ni behöver också ha med er en utskrift av labbspecifikationen som ni har skrivit era personnummer
på förstasidan på. Denna utskrift undertecknar labbassistenten efter att han eller hon har godkänt labben och
utskriften fungerar sedan som ert kvitto på resultatet.
Salsbyte: Fredag 12 maj 10-12 är
föreläsningen flyttad till L1
Kontrollskrivningen omfattar kap 2-5.Tillåtet
hjälpmedel:miniräknare.
Fr.o.m nu har vi endast två övningsgrupper. Hanna är
övningsledare för grupp 1 och Henrik för grupp 2 enligt
nedanstående schema.
Må 24 apr 10-12 Q31, Q33
On 26 apr 13-15 Q31, Q33
Ti 2 maj 13-15
Q31, Q33
Fr 5 maj 13-15
Q31, Q33
Ti 9 maj 10-12
Q31, Q33
Fr 12 maj 13-15 Q31,
Q33
Må 15 maj 13-15 Q31,
Q33
Länken Översättningslista
av problem från Blom till äldre kurslitteratur fungerar nu.
Alla ska aktivera sig på rapp. Använd"aktiv".
Observera att föreläsningen 8/5 kl
15-17 inte är en vanlig föreläsning utan detta är en
demonstrationsföreläsning där föreläsaren gör en
demonstrationslaboration.
Laboration 1
Se till att komma till labsalen minst tio minuter före
redovisningstiden så att ni hinner logga in på datorn och öppna
Matlab samt ta fram era redovisningsuppgifter.
Ni behöver också ha med er en utskrift av labspecifikationen som ni
har skrivit era personnummer på förstasidan på. Denna utskrift
undertecknar labassistenten efter att han eller hon har godkänt
labben och utskriften fungerar sedan som ert kvitto på resultatet.
Anteckningshjälp
Det är en student i din kurs (SF1901) som
skulle vilja få anteckningar från en kurskamrat, men har lite
svårt att fråga någon själv.
Finns det någon i klassen som kan
kopiera sina anteckningar till studenten i fråga som heter Måns
Nilsson? Kopiering av
anteckningar arvoderas från KTH med 75 kr per
2x45 minuter som man antecknar.
Studenten som anmäler sig ska kontakta
funka@kth.se så förklarar de hur det går till.
Mån 15 maj Började med att gå igenom exempel 13.18 i läroboken
som exempel på test av given fördelning där man dels måste skatta parametrar ur data
för att skatta p1,p2...pr, dels slå ihop grupper
för att villkoret npi≥5 skall gälla för alla i. Berättade sedan om när
homogenitetstest används och tog som exempel på detta en forskningsrapport där man
ville undersöka huruvida det var någon skillnad mellan 36 timmar gamla pojkar och flickor
vad gällde vad de föredrog att titta på. Berättade efter detta att man vid oberoendetest
kan använda sig av identiskt samma numerik som man gör vid homogenitetstest.
Gjorde uppgift 5 på tentan 2017-01-09 som exempel på detta. Gick sedan igenom
linjär regression och vad beteckningarna i formelsamlingens §13 betyder.
Gick sedan på OH igenom exempel 14.7 i läroboken som exempel på hur man med hjälp
av multipel regression går tillväga för att avgöra vilka storheter xi man ska förkasta eller inte
när man antagit att y beror av xi:na. Avslutade med att skissa några exempel där man med hjälp av residualanalys kan avgöra huruvida det är troligt att y beror linjärt av x.
Fre 12 maj Började med att repetera begreppen p-värde,signifikansnivå=risknivå,och styrkefunktion.
Började från början med exempel 13.8 igen och gjorde hypotesprövning i fallet tvåsidigt test,
dels med kofidensintervallmetoden dels med testvariabelmetoden. Detta gjordes med olika
värden på risknivån α och m.h.a. detta visades också i vilket intervall p-värdet måste ligga.
Gjorde sedan hypotesprövning i fallet tvåsidigt test,
dels med kofidensintervallmetoden dels med testvariabelmetoden.
Även här gjordes detta med olika
värden på risknivån α och m.h.a. detta visades också här i vilket intervall p-värdet måste ligga.
Gjorde sedan en utvidgad variant av övningsuppgift 13.9 för att visa hur man tar fram
styrkan hos ett test när man har använt sig av konfidensintervallmetoden.
värden på risknivån α och m.h.a. detta visades också här i vilket intervall p-värdet måste ligga.
Utifrån detta visades även hur man tar fram styrkefunktionen - i detta fall h(μ).
Avslutade med att berätta när CHI-2-test används och tog som ett inledande exempel på detta exempel 13.17 i läroboken.
Mån 8 maj Började med att berätta lite om felfortplantning och härledde
felfortplantningsformlerna i § 9.4a m.h.a. Taylorutveckling. Räknade övningsuppgift 11.13b som
exempel på detta.Skrev sedan upp en lista på viktiga definitioner och begrepp som
används inom hypotesprövning. Gick därefter igenom exempel 13.1 i läroboken som exempel
på ett fall där man inte använder konfidensintervall för att testa sin nollhypotes.
Införde i samband med detta bgreppen signifikant*, signifikant**, och signifikant***,
samt begreppen testvariabel och kritiskt område. Fortsatte med exempel 13.4 i läroboken
där man tar fram styrkan hos testet i exempel 13.1 för alternativet p=0.9, och tog även
fram styrkefunktionen h(p) i detta fall. Som exempel på hypotesprövning m.h.a.
konfidensintervall-metoden använde jag mig därefter av exempel 13.8 i läroboken
och använde även slutligen samma exempel för att göra
hypotesprövning
m.h.a. testvariabelmetoden. Hann dock bara fallet tvåsidigt test.
Fre 5 maj Började med att repetera begreppet konfidensintervall
och de två konfidensintervallen som togs fram på förra föreläsningen. Fortsatte sedan med att
härleda konfidensintervallet för variansen och standardavvikelsen utgående från att summan
av kvadrerade N(0,1)-variabler tillhör chi-2-fördelningen.
Visade sedan hur man m.h.a. §12.4 får fram samma konfidensintervall.
Visade även hur det ensidiga konfidensintervallet ser ut i detta fall.
Därefter visades först konfidensintervallet för skillnaden mellan väntevärdena
från två stickprov när standardavvikelserna är kända.
Sedan visades konfidensintervallet för det viktiga fallet när standardavvikelserna är okända men antas vara lika
och hur man m.h.a. §11.2 viktar ihop de två stickprovsvarianserna för att få
en skattning s av standardavvikelsen. Efter detta visades det viktiga fallet
när man har parvisa observationer-"stickprov i par"- och att konfidensintervallet
för väntevärdet av de parvisa skillnaderna då tas fram som om man hade ett stickprov
av parvisa skillnader. Sedan visades att om man har två stickprov med okända och olika
standardavvikelser får man bilda ett konfidensintervall med approximativ konfidensgrad
m.ha. §12.3. Visade att om stickproven är tillräckligt stora så att C.G.S. kan
användas kan man bilda approximativa konfidensintervall för väntevärden och skillnader
mellan väntevärden även om observationerna inte kommer från en Normalfördelning.
Visade avslutningsvis konfidensintervall för p när X tillhör Bin(n,p) och konfidensintervall
för py- px när Y tillhör Bin(ny,py) och X tillhör Bin(nx,px) samt konfidensintervall för my i
Poisson-fördelningen och att det i alla dessa fall förutsätter att Normalapproximation är möjlig enligt §5.
Tis 2 maj Började med att gå igenom Minsta-kvadrat-metoden.
Som exempel visades hur man kunde göra MK-skattningen av arean hos en kvadrat
där 3 mätdata var sidans längd,
och 2 mätdata var diagonalens längd
Tog sedan exempel 11.19 i läroboken som exempel på hur Minsta-kvadrat-skattning går till när två saker ska skattas.
Definierade sedan begreppen konfidensintervall och konfidensgrad i allmänna fallet
och visade även hur ensidiga konfidensintervall ser ut. Härledde därefter det tvåsidiga
konfidensintervallet för väntevärdet när mätdata kommer från en Normalfördelning där
standardavvikelsen är känd. Visade utgående från detta hur de ensidiga konfidensintervallen ser ut.
Utgående från konfidensintervallet med känd standardavvikelse visades sedan hur
motsvarande konfidensintervall ser ut då standardavvikelsen är okänd. Berättade kort om
frihetsgrader och t-fördelningen. Avslutade med att visa hur man får fram de förut framtagna
konfidensintervallen m.h.a. §12.1 respektive §12.2.
Ons 26 apr Avslutade kapitel 10 med att
visa hur man tar fram kvartiler och percentiler. Började sedan
kap 11 med att redogöra för skillnaden mellan det riktiga
värdet TÄTA,stickprovsvariabeln TÄTA* och
punktskattningenTÄTA*obs. Tog som exempel på skattning hur man
kan skatta arean hos en kvadrat samt hur man brukar skatta
väntevärdet my och standardavvikelsen sigma vid okänd
fördelning. Tog sedan som ytterligare exempel på
skattningar hur man skattar pi
Binomialfördelningen,Hypergeometriska fördelningen och
ffg-fördelningen,my i Poissonfördelningen, lambda i
exponentialfördelningen samt my och sigma i Normalfördelningen.
Definierade efter detta begreppet medelfel och tog fram
medelfelet för skattningen av väntevärdet my allmänt ,
medelfelet för skattningen av p i binomialfördelningen och medelfelet
för skattningen av parametern my i Poissonfördelningen.
Definerade därefter begreppen väntevärdesriktighet och
effektivitet och tog ett par enkla exempel på dessa. Definierade
även begreppet konsistens. Presenterade slutligen
Maximum-likelihood-metoden och räknade exempel 11.10 i läroboken
som exempel på denna.
Mån 24 apr Började med att
definiera hypergeometriska fördelningen och skrev
upp dess sannolikhetsfunktion. Jämförde dess väntevärde och
varians med Binomialfördelningens. Talade om att Hyp(N,n,p)~
Bin(n,p) om n/N<0.1. Definierade efter detta
Poissonfördelningen. .Genom att kombinera satsen om att summan
av oberoende Poissonfördelade stokastiska variabler är
Poissonfördelad med att dela upp intervallet där X är
Poissonfördelad i många delintervall visades sedan att
villkoret µ>15 för normalapproximation egentligen
är ett C.G.S.-villkor. Avslutade kap 7 att med att visa
hur sannolikhetsdefinitionen för Binomialfördelningen övergår i
sannolikhetsfunktionen för Poissonfördelningen om p är litet,
vilket motiverar att om p<0.1 så gäller att
Bin(n,p)~Po(np). Fortsatte med kap 10 och definierade
medelvärde,
stickprovsvarians,variationskoefficient,median,kovarians och
korrelationskoefficient.Gick till sist igenom begreppen
grupperade data,absolut och relativ frekvens, klassindelade
data,histogram och boxplott.
Ons 19 apr Började med att repetera när och
hur man använder Tabell 1 och Tabell 2 i formelsamlingen och hur
man transformerarar en godtycklig normalfördelning till den
standardiserade Normalfördelningen N(0,1) Skrev sedan upp att
varje linjärkombination av oberoende N-fördelade slumpvariabler
är normalfördelad. Räknade exempel 6.2 som exempel på detta.
Gick därefter igenomom den viktiga Centrala Gränsvärdessatsen
(CGS), som säger att summan av n oberoende likafördelade
stokastiska variabler är approximativt normalfördelad om n är
stort. Detta medför även att medelvärdet är approximativt
normalfördelat. Avslutade kapitel 6 med att göra Exempel 6.6 som
exempel på Centrala Gränsvärdessatsen.Fortsatte med att
definiera Binomialfördelningen och härleda dess
sannolikhetsfunktion. Visade sedan utgående från
Bernoullifördelningen att villkoret np(1-p)>10 för
Normalapproximation egentligen är ett C.G.S.-villkor. Avslutade
med att gå igenom halvkorrektion och tog som exempel på detta
sannolikheten att få mer än 13 sexor när vi kastar en tärning 60
gånger.
Tis 18 apr Började med att repetera
definitioner för väntevärde och varians och räkneregler för
väntevärden och varianser. Tog efter detta fram väntevärdet och
standardavvikelsen för medelvärdet.Gick sedan igenom beviset för
Markovs olikhet. Använde sedan Markovs olikhet för att bevisa
Stora talens lag och Tjebysjevs olikhet. Skrev sedan upp
täthetsfunktionen och fördelningsfunktionen för
normalfördelningen. Skrev efter det upp täthetsfunktionen och
fördelningsfunktionen för standardiserade normalfördelningen
N(0,1). Visade sedan att om X är N(E[X],D[X]) så gäller att
Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och hur man
använder Tabell 1 och Tabell 2 i formelsamlingen och vad
alfa-kvantilen är. Tog fram P(E[X]-D[X] < X < E[X]+D[X])
när X är N(E[X],D[X]) som exempel på hur Tabell 1 används, och
skrev sedan även upp sannolikheterna för att ett utfall hamnar
högst två respektive tre standardavvikelser ifrån väntevärdet.
Avslutade med att ta fram k när
P(E[X]-kD[X]<X<E[X]+kD[X])=0.95, respektive 0.99 och 0.999
som exempel på hur Tabell 2 används.
Tor 6 apr Började med att repetera
definitionerna för väntevärde och varians i det diskreta och det
kontinuerliga fallet i en dimension. Gick sedan över till två
dimensioner och definierade E[g(X,Y)] i det diskreta och det
kontinuerliga fallet. Fortsatte med att definiera systematiskt
fel och slumpmässigt fel och redogjorde för skillnaden mellan
noggrannhet och precision.Gick därefter igenom följande viktiga
räkneregler för väntevärden och varianser:
E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X och Y är
oberoende V(X+Y)=V(X)+V(Y). Definierade sedan begreppet
kovarians och visade att V(X)=C(X,X). Definerade sedan begreppet
korrelationskoefficient och berättade om dess egenskaper. Visade
att om X och Y är oberoende så leder det till att E(XY)=E(X)E(Y)
vilket i sin tur leder till att C(X,Y)=0, d.v.s. att X och Y är
okorrelerade. Visade sedan att omvändningen inte behöver vara
sann genom att göra exempel 5.13 i läroboken. Som övning på att
räkna ut en kovarians gjorde jag sedan övningsuppgift 5.18. Gick
sedan igenom räkneregler för kovarianser och skrev upp att
C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a.
leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och
att V(X+Y)=V(X)+V(Y) om X och Y är oberoende.
Mån 3 apr Började med att gå igenom
flerdimensionella diskreta ock kontinuerliga stokastiska
variabler och begreppen simultan sannolikhetsfunktion repektive
simultan täthetsfunktion och hur man ur dessa får fram den
marginella sannolikhetsfunktionen respektive den marginella
täthetsfunktionen och hur man vid oberoende även kan gå åt andra
hållet. Visade sedan hur man tar fram Fördelningsfunktionen för
max(X,Y) och min(X,Y) utgående från Fördelningsfunktionerna för
X respektive Y. Avslutade kapitel 4 med att som exempel på summa
visa att summan av ober Poisonfördelade stok.var. är
Poissonfördelad.Började med kapitel 5 och startade med att
berätta att väntevärdet är vad man får i genomsnitt om man gör
oändligt många försök. T.ex. blir ju det genomsnittliga värdet
av ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken. Skrev
sedan upp definitionen för E(X) resp. E(g(X)) i det diskreta
fallet och det kontinuerliga fallet. Tog sedan och räknade ut
E(X²) i Ex. 5.1 i boken. Definierade därefter variansen för X
och standardavvikelsen D(X). Sedan använde jag mig även här av
ex 5.1 i boken för att räkna ut variansen m.h.a. definitionen.
Härledde sedan ur definitionen formeln V(X)=E(X²)-(E(X))² och
räknade till sist ut samma varians m.h.a. denna formel.
Definierade sedan även variationskoefficienten R(X)=D(X)/E(X).
Tor 30 mar Började med att gå igenom
Poissonfördelningen.Kom sedan in på kontinuerlig stokastisk
variabel och definierade täthetsfunktionen och gick igenom hur
man ur den får fram Fördelningsfunktionen och vise versa. Gick
sedan igenom den likformiga fördelningen och tog som exempel på
denna exempel 3.8 och exempel 3.9 i läroboken. Gick därefter
igenom exponentialfördelningen.Fortsatte med att visa att tiden
mellan två händelser är exponentialfördelad om antalet händelser
är Poissonfördelat. Visade även att exponentialfördelningen
saknar minne.Berättade att eftersom hela kapitel 6 ägnas åt
Normalfördelningen gås den igenom då. Tog sedan exempel 3.14 i
läroboken som exempel på en blandning av diskreta och
kontinuerliga stokastiska variabler. Fortsatte sedan
med att gå igenom funktioner av stokastiska variabler. Tog som
exempel i det diskreta fallet en kortversion av exempel 3.16 i
Blom och som kontinuerligt exempel gjorde jag en egen variant av
exempel 3.21 i Blom. Avslutade som exempel på hur man kan
simulera slumptal med att visa hur man kan simulera
exponentialfördelade slumptal utgående från likformigt fördelade
slumptal.
Mån 27 mar Började med att gå igenom igenom
begreppet stokastisk variabel och definera
sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i
läroboken och ritade även upp stolpdiagrammet. Som ytterliggare
exempel berättade jag om Benfords lag som säger att första
siffran i data i många datamängder har sannolikhetsfunktionen
P(X=k)=log10(k+1)-log10(k) och
ritade även upp detta stolpdiagram. Definierade
sedan Fördelningsfunktionen och berättade om dess egenskaper.
Tog som exempel på denna ex 3.1 i läroboken och ritade även upp
den. Gick sedan igenom ett antal viktiga diskreta fördelningar.
Började med tvåpunktsfördelningen och då speciellt
Bernouillyfördelningen. Fortsatte med den likformiga
fördelningen och för-första-gången-fördelningen och den snarlika
geometriska fördelningen. Avslutade med att gå
igenom binomialfördelningen och den hypergeometriska
fördelningen.
Ons 22 mar Började med att repetera de tre fallen:
Dragning med återläggning med hänsyn till ordning, dragning utan
återläggning med hänsyn till ordning, dragning utan återläggning
utan hänsyn till ordning. Gick därefter igenom sannolikheten att
vid n dragningar utan återläggning utan hänsyn till ordning dra k
vita kulor från k vita och s svarta kulor. Utvidgade sedan detta
till sannolikheten att dra v vita och; s svarta och g gula o.s.v
när man har r färger. Fortsatte med att gå igenomsannolikheten att
vid n dragningar med återläggning utan hänsyn till ordning dra k
vita kulor från k vita och s svarta kulor. Utvidgade sedan även;
detta till sannolikheten att dra v vita och; s svarta och g gula
o.s.v när man har r färger. Började sedan med betingad
sannolikhet. Illustrerade betingningsformeln m.h.a. exemplet på
sid 26 i läroboken. Visade lagen o total sannolikhet m.h.a.
Venndiagram och tog exempel 2.17 som exempel på denna. Visade även
Bayes sats >m.h.a. Venndiagram och tog exempel 2.19 som exempel
på denna. Visade sedan ex 2.20 på OH som en intressan tillämpning
av Bayes sats. Visade sedan definitionen för oberoende utgående
från betingningsformeln. Avslutade med exempel 2.23 som exempel på
oberoende.
Mån 20 mar Presenterade först kursens hemsida
som hittas på http://www.math.kth.se/matstat/gru och visa olika
länkar och dess innehåll. Fortsatte sedan med att ge exempel på
olika användningsområden som ämnet matematisk statistik har och
som denna kurs ger en introduktion till. Började sedan
med att gå igenom utfall,utfallsrum,händelser. Förklarade
därefter skillnaden mellan diskret och kontinuerlig fördelning.
Tog övningsuppgift 2.1a och b som exempel på diskreta
utfallsrum. Gick sedan igenom snitt, union, komplement och
visade hur man med hjälp av Venndiagram räknar ut sannolikheter.
Definierade i samband med detta disjunkthet.Skrev upp
Kolmogorovs axiomsystem och den klassiska
sannolikhetsdefinitionen.Resten av tiden ägnades åt
kombinatorik. Började med multiplikationsprincipen.Gick igenom
draging med återläggning med hänsyn till ordning och tog som
exempel att antal pinkoder blir 10^4 eftersom antal
kombinationer när man drar k ggr från n element blir n^k.Som
exempel på dragning utan återläggning med hänsyn till ordning
tog jag en förening med 8 medlemmar som skulle välja
ordförande,sekreterare och kassör vilket ger 8ggr 7ggr 6
kombinationer .Allmänna fallet n!/(n-k)! kombinationer. Som
exempel på dragning utan återläggning utan hänsyn till ordning
tog jag antalet pokergivar som ju blir 52 över 5. Allmänt n över
k kombinationer.
|