SF1901 Sannolikhetsteori och statistik för D

KTH Mathematik

$Matematisk statistik$

SF1901 Sannolikhetsteori och statistik för D.

Aktuell information.

              Här ges fortlöpande information om schemaändringar, vad som gåtts igenom på föreläsningar etc.

Alla administrativa frågor sköts av matematiks studentexpedition.

Tentan 2017-05-30 finns nu under länken Gamla tentor och KS

Tid för omtentan är nu fastslagen. Den går mån 14 augusti 08.00-13.00.

Anmälningstid: 5 juli-31 juli.

Länken Formelsamling

På dagens föreläsning (15/5) påpekade flera elever att länken "Formelsamling" på indexsidan inte fungerade. Jag lovade att åtgärda detta, men när jag klickar på den så fungerar den.

Kontrollskrivningarna är nu inlämnade för scanning.

Rätta svar på KS:en 1) 0.500 2) 0.866 3) 0.458 4) 0.833 5) 0.690

Skrivningen med svar finns här.

Laboration

Se till att komma till labbsalen minst tio minuter före redovisningstiden så att ni hinner logga in på datorn och öppna Matlab samt ta fram era redovisningsuppgifter. Skriv även upp vilken dator ni sitter vid på whiteboarden i datorsalen, så att labbassistenten lätt hittar er när redovisningstiden börjar.

Ni behöver också ha med er en utskrift av labbspecifikationen som ni har skrivit era personnummer på förstasidan på. Denna utskrift undertecknar labbassistenten efter att han eller hon har godkänt labben och utskriften fungerar sedan som ert kvitto på resultatet.

Salsbyte: Fredag 12 maj 10-12 är föreläsningen flyttad till L1

Kontrollskrivningen omfattar kap 2-5.Tillåtet hjälpmedel:miniräknare.

Fr.o.m nu har vi endast två övningsgrupper. Hanna är övningsledare för grupp 1 och Henrik för grupp 2 enligt nedanstående schema.

Ti 18 apr 10-12 V22, V32

To 20 apr 8-10 V22, V32

Må 24 apr 10-12 Q31, Q33

On 26 apr 13-15 Q31, Q33

Ti 2 maj 13-15 Q31, Q33

Fr 5 maj 13-15 Q31, Q33

Ti 9 maj 10-12 Q31, Q33

Fr 12 maj 13-15 Q31, Q33

Må 15 maj 13-15 Q31, Q33

Länken Översättningslista av problem från Blom till äldre kurslitteratur fungerar nu.

Alla ska aktivera sig på rapp. Använd"aktiv".

Observera att föreläsningen 8/5 kl 15-17 inte är en vanlig föreläsning utan detta är en demonstrationsföreläsning där föreläsaren gör en demonstrationslaboration.

Laboration 1

Se till att komma till labsalen minst tio minuter före redovisningstiden så att ni hinner logga in på datorn och öppna Matlab samt ta fram era redovisningsuppgifter.

Ni behöver också ha med er en utskrift av labspecifikationen som ni har skrivit era personnummer på förstasidan på. Denna utskrift undertecknar labassistenten efter att han eller hon har godkänt labben och utskriften fungerar sedan som ert kvitto på resultatet.

Anteckningshjälp

Det är en student i din kurs (SF1901) som skulle vilja få anteckningar från en kurskamrat, men har lite svårt att fråga någon själv.

Finns det någon i klassen som kan kopiera sina anteckningar till studenten i fråga som heter Måns Nilsson? Kopiering av

anteckningar arvoderas från KTH med 75 kr per 2x45 minuter som man antecknar.

Studenten som anmäler sig ska kontakta funka@kth.se så förklarar de hur det går till.

Mån 15 maj Började med att gå igenom exempel 13.18 i läroboken som exempel på test av given fördelning där man dels måste skatta parametrar ur data för att skatta p₁,p₂...p_r, dels slå ihop grupper för att villkoret np_i≥5 skall gälla för alla i. Berättade sedan om när homogenitetstest används och tog som exempel på detta en forskningsrapport där man ville undersöka huruvida det var någon skillnad mellan 36 timmar gamla pojkar och flickor vad gällde vad de föredrog att titta på. Berättade efter detta att man vid oberoendetest kan använda sig av identiskt samma numerik som man gör vid homogenitetstest. Gjorde uppgift 5 på tentan 2017-01-09 som exempel på detta.
Gick sedan igenom linjär regression och vad beteckningarna i formelsamlingens §13 betyder. Gick sedan på OH igenom exempel 14.7 i läroboken som exempel på hur man med hjälp av multipel regression går tillväga för att avgöra vilka storheter x_i man ska förkasta eller inte när man antagit att y beror av x_i:na. Avslutade med att skissa några exempel där man med hjälp av residualanalys kan avgöra huruvida det är troligt att y beror linjärt av x.

Fre 12 maj Började med att repetera begreppen p-värde,signifikansnivå=risknivå,och styrkefunktion. Började från början med exempel 13.8 igen och gjorde hypotesprövning i fallet tvåsidigt test, dels med kofidensintervallmetoden dels med testvariabelmetoden. Detta gjordes med olika värden på risknivån α och m.h.a. detta visades också i vilket intervall p-värdet måste ligga. Gjorde sedan hypotesprövning i fallet tvåsidigt test, dels med kofidensintervallmetoden dels med testvariabelmetoden. Även här gjordes detta med olika värden på risknivån α och m.h.a. detta visades också här i vilket intervall p-värdet måste ligga. Gjorde sedan en utvidgad variant av övningsuppgift 13.9 för att visa hur man tar fram styrkan hos ett test när man har använt sig av konfidensintervallmetoden. värden på risknivån α och m.h.a. detta visades också här i vilket intervall p-värdet måste ligga. Utifrån detta visades även hur man tar fram styrkefunktionen - i detta fall h(μ). Avslutade med att berätta när CHI-2-test används och tog som ett inledande exempel på detta exempel 13.17 i läroboken.

Mån 8 maj Började med att berätta lite om felfortplantning och härledde felfortplantningsformlerna i § 9.4a m.h.a. Taylorutveckling. Räknade övningsuppgift 11.13b som exempel på detta.Skrev sedan upp en lista på viktiga definitioner och begrepp som används inom hypotesprövning. Gick därefter igenom exempel 13.1 i läroboken som exempel på ett fall där man inte använder konfidensintervall för att testa sin nollhypotes. Införde i samband med detta bgreppen signifikant*, signifikant**, och signifikant***, samt begreppen testvariabel och kritiskt område. Fortsatte med exempel 13.4 i läroboken där man tar fram styrkan hos testet i exempel 13.1 för alternativet p=0.9, och tog även fram styrkefunktionen h(p) i detta fall. Som exempel på hypotesprövning m.h.a. konfidensintervall-metoden använde jag mig därefter av exempel 13.8 i läroboken och använde även slutligen samma exempel för att göra hypotesprövning m.h.a. testvariabelmetoden. Hann dock bara fallet tvåsidigt test.

Fre 5 maj Började med att repetera begreppet konfidensintervall och de två konfidensintervallen som togs fram på förra föreläsningen. Fortsatte sedan med att härleda konfidensintervallet för variansen och standardavvikelsen utgående från att summan av kvadrerade N(0,1)-variabler tillhör chi-2-fördelningen. Visade sedan hur man m.h.a. §12.4 får fram samma konfidensintervall. Visade även hur det ensidiga konfidensintervallet ser ut i detta fall. Därefter visades först konfidensintervallet för skillnaden mellan väntevärdena från två stickprov när standardavvikelserna är kända. Sedan visades konfidensintervallet för det viktiga fallet när standardavvikelserna är okända men antas vara lika och hur man m.h.a. §11.2 viktar ihop de två stickprovsvarianserna för att få en skattning s av standardavvikelsen. Efter detta visades det viktiga fallet när man har parvisa observationer-"stickprov i par"- och att konfidensintervallet för väntevärdet av de parvisa skillnaderna då tas fram som om man hade ett stickprov av parvisa skillnader. Sedan visades att om man har två stickprov med okända och olika standardavvikelser får man bilda ett konfidensintervall med approximativ konfidensgrad m.ha. §12.3. Visade att om stickproven är tillräckligt stora så att C.G.S. kan användas kan man bilda approximativa konfidensintervall för väntevärden och skillnader mellan väntevärden även om observationerna inte kommer från en Normalfördelning. Visade avslutningsvis konfidensintervall för p när X tillhör Bin(n,p) och konfidensintervall för py- px när Y tillhör Bin(ny,py) och X tillhör Bin(nx,px) samt konfidensintervall för my i Poisson-fördelningen och att det i alla dessa fall förutsätter att Normalapproximation är möjlig enligt §5.

Tis 2 maj Började med att gå igenom Minsta-kvadrat-metoden. Som exempel visades hur man kunde göra MK-skattningen av arean hos en kvadrat där 3 mätdata var sidans längd, och 2 mätdata var diagonalens längd Tog sedan exempel 11.19 i läroboken som exempel på hur Minsta-kvadrat-skattning går till när två saker ska skattas. Definierade sedan begreppen konfidensintervall och konfidensgrad i allmänna fallet och visade även hur ensidiga konfidensintervall ser ut. Härledde därefter det tvåsidiga konfidensintervallet för väntevärdet när mätdata kommer från en Normalfördelning där standardavvikelsen är känd. Visade utgående från detta hur de ensidiga konfidensintervallen ser ut. Utgående från konfidensintervallet med känd standardavvikelse visades sedan hur motsvarande konfidensintervall ser ut då standardavvikelsen är okänd. Berättade kort om frihetsgrader och t-fördelningen. Avslutade med att visa hur man får fram de förut framtagna konfidensintervallen m.h.a. §12.1 respektive §12.2.

Ons 26 apr Avslutade kapitel 10 med att visa hur man tar fram kvartiler och percentiler. Började sedan kap 11 med att redogöra för skillnaden mellan det riktiga värdet TÄTA,stickprovsvariabeln TÄTA* och punktskattningenTÄTA*obs. Tog som exempel på skattning hur man kan skatta arean hos en kvadrat samt hur man brukar skatta väntevärdet my och standardavvikelsen sigma vid okänd fördelning. Tog sedan som ytterligare exempel på skattningar hur man skattar pi Binomialfördelningen,Hypergeometriska fördelningen och ffg-fördelningen,my i Poissonfördelningen, lambda i exponentialfördelningen samt my och sigma i Normalfördelningen. Definierade efter detta begreppet medelfel och tog fram medelfelet för skattningen av väntevärdet my allmänt , medelfelet för skattningen av p i binomialfördelningen och medelfelet för skattningen av parametern my i Poissonfördelningen. Definerade därefter begreppen väntevärdesriktighet och effektivitet och tog ett par enkla exempel på dessa. Definierade även begreppet konsistens. Presenterade slutligen Maximum-likelihood-metoden och räknade exempel 11.10 i läroboken som exempel på denna.

Mån 24 apr Började med att definiera hypergeometriska fördelningen och skrev upp dess sannolikhetsfunktion. Jämförde dess väntevärde och varians med Binomialfördelningens. Talade om att Hyp(N,n,p)~ Bin(n,p) om n/N<0.1. Definierade efter detta Poissonfördelningen. .Genom att kombinera satsen om att summan av oberoende Poissonfördelade stokastiska variabler är Poissonfördelad med att dela upp intervallet där X är Poissonfördelad i många delintervall visades sedan att villkoret µ>15 för normalapproximation egentligen är ett C.G.S.-villkor. Avslutade kap 7 att med att visa hur sannolikhetsdefinitionen för Binomialfördelningen övergår i sannolikhetsfunktionen för Poissonfördelningen om p är litet, vilket motiverar att om p<0.1 så gäller att Bin(n,p)~Po(np). Fortsatte med kap 10 och definierade medelvärde, stickprovsvarians,variationskoefficient,median,kovarians och korrelationskoefficient.Gick till sist igenom begreppen grupperade data,absolut och relativ frekvens, klassindelade data,histogram och boxplott.

Ons 19 apr Började med att repetera när och hur man använder Tabell 1 och Tabell 2 i formelsamlingen och hur man transformerarar en godtycklig normalfördelning till den standardiserade Normalfördelningen N(0,1) Skrev sedan upp att varje linjärkombination av oberoende N-fördelade slumpvariabler är normalfördelad. Räknade exempel 6.2 som exempel på detta. Gick därefter igenomom den viktiga Centrala Gränsvärdessatsen (CGS), som säger att summan av n oberoende likafördelade stokastiska variabler är approximativt normalfördelad om n är stort. Detta medför även att medelvärdet är approximativt normalfördelat. Avslutade kapitel 6 med att göra Exempel 6.6 som exempel på Centrala Gränsvärdessatsen.Fortsatte med att definiera Binomialfördelningen och härleda dess sannolikhetsfunktion. Visade sedan utgående från Bernoullifördelningen att villkoret np(1-p)>10 för Normalapproximation egentligen är ett C.G.S.-villkor. Avslutade med att gå igenom halvkorrektion och tog som exempel på detta sannolikheten att få mer än 13 sexor när vi kastar en tärning 60 gånger.

Tis 18 apr Började med att repetera definitioner för väntevärde och varians och räkneregler för väntevärden och varianser. Tog efter detta fram väntevärdet och standardavvikelsen för medelvärdet.Gick sedan igenom beviset för Markovs olikhet. Använde sedan Markovs olikhet för att bevisa Stora talens lag och Tjebysjevs olikhet. Skrev sedan upp täthetsfunktionen och fördelningsfunktionen för normalfördelningen. Skrev efter det upp täthetsfunktionen och fördelningsfunktionen för standardiserade normalfördelningen N(0,1). Visade sedan att om X är N(E[X],D[X]) så gäller att Y=(X-E[X])/D[X] är N(0,1). Berättade sedan om när och hur man använder Tabell 1 och Tabell 2 i formelsamlingen och vad alfa-kvantilen är. Tog fram P(E[X]-D[X] < X < E[X]+D[X]) när X är N(E[X],D[X]) som exempel på hur Tabell 1 används, och skrev sedan även upp sannolikheterna för att ett utfall hamnar högst två respektive tre standardavvikelser ifrån väntevärdet. Avslutade med att ta fram k när P(E[X]-kD[X]<X<E[X]+kD[X])=0.95, respektive 0.99 och 0.999 som exempel på hur Tabell 2 används.

Tor 6 apr Började med att repetera definitionerna för väntevärde och varians i det diskreta och det kontinuerliga fallet i en dimension. Gick sedan över till två dimensioner och definierade E[g(X,Y)] i det diskreta och det kontinuerliga fallet. Fortsatte med att definiera systematiskt fel och slumpmässigt fel och redogjorde för skillnaden mellan noggrannhet och precision.Gick därefter igenom följande viktiga räkneregler för väntevärden och varianser: E(aX+bY+c)=aE(X)+bE(Y)+c V(aX+b)=V(aX)=a²V(X) samt om X och Y är oberoende V(X+Y)=V(X)+V(Y). Definierade sedan begreppet kovarians och visade att V(X)=C(X,X). Definerade sedan begreppet korrelationskoefficient och berättade om dess egenskaper. Visade att om X och Y är oberoende så leder det till att E(XY)=E(X)E(Y) vilket i sin tur leder till att C(X,Y)=0, d.v.s. att X och Y är okorrelerade. Visade sedan att omvändningen inte behöver vara sann genom att göra exempel 5.13 i läroboken. Som övning på att räkna ut en kovarians gjorde jag sedan övningsuppgift 5.18. Gick sedan igenom räkneregler för kovarianser och skrev upp att C(aX+bY,cZ+dW)=acC(X,Z)+adC(X,W)+bcC(Y,Z)+bdC(Y,W) vilket bl.a. leder till den viktiga regeln att V(X+Y)=V(X)+V(Y)+2C(X,Y) och att V(X+Y)=V(X)+V(Y) om X och Y är oberoende.

Mån 3 apr Började med att gå igenom flerdimensionella diskreta ock kontinuerliga stokastiska variabler och begreppen simultan sannolikhetsfunktion repektive simultan täthetsfunktion och hur man ur dessa får fram den marginella sannolikhetsfunktionen respektive den marginella täthetsfunktionen och hur man vid oberoende även kan gå åt andra hållet. Visade sedan hur man tar fram Fördelningsfunktionen för max(X,Y) och min(X,Y) utgående från Fördelningsfunktionerna för X respektive Y. Avslutade kapitel 4 med att som exempel på summa visa att summan av ober Poisonfördelade stok.var. är Poissonfördelad.Började med kapitel 5 och startade med att berätta att väntevärdet är vad man får i genomsnitt om man gör oändligt många försök. T.ex. blir ju det genomsnittliga värdet av ett tärningskast 3.5. Gjorde sedan exempel 5.1 i boken. Skrev sedan upp definitionen för E(X) resp. E(g(X)) i det diskreta fallet och det kontinuerliga fallet. Tog sedan och räknade ut E(X²) i Ex. 5.1 i boken. Definierade därefter variansen för X och standardavvikelsen D(X). Sedan använde jag mig även här av ex 5.1 i boken för att räkna ut variansen m.h.a. definitionen. Härledde sedan ur definitionen formeln V(X)=E(X²)-(E(X))² och räknade till sist ut samma varians m.h.a. denna formel. Definierade sedan även variationskoefficienten R(X)=D(X)/E(X).

Tor 30 mar Började med att gå igenom Poissonfördelningen.Kom sedan in på kontinuerlig stokastisk variabel och definierade täthetsfunktionen och gick igenom hur man ur den får fram Fördelningsfunktionen och vise versa. Gick sedan igenom den likformiga fördelningen och tog som exempel på denna exempel 3.8 och exempel 3.9 i läroboken. Gick därefter igenom exponentialfördelningen.Fortsatte med att visa att tiden mellan två händelser är exponentialfördelad om antalet händelser är Poissonfördelat. Visade även att exponentialfördelningen saknar minne.Berättade att eftersom hela kapitel 6 ägnas åt Normalfördelningen gås den igenom då. Tog sedan exempel 3.14 i läroboken som exempel på en blandning av diskreta och kontinuerliga stokastiska variabler. Fortsatte sedan med att gå igenom funktioner av stokastiska variabler. Tog som exempel i det diskreta fallet en kortversion av exempel 3.16 i Blom och som kontinuerligt exempel gjorde jag en egen variant av exempel 3.21 i Blom. Avslutade som exempel på hur man kan simulera slumptal med att visa hur man kan simulera exponentialfördelade slumptal utgående från likformigt fördelade slumptal.

Mån 27 mar Började med att gå igenom igenom begreppet stokastisk variabel och definera sannolikhetsfunktionen. Tog som exempel på denna ex 3.1 i läroboken och ritade även upp stolpdiagrammet. Som ytterliggare exempel berättade jag om Benfords lag som säger att första siffran i data i många datamängder har sannolikhetsfunktionen P(X=k)=log10(k+1)-log10(k) och
ritade även upp detta stolpdiagram. Definierade sedan Fördelningsfunktionen och berättade om dess egenskaper. Tog som exempel på denna ex 3.1 i läroboken och ritade även upp den. Gick sedan igenom ett antal viktiga diskreta fördelningar. Började med tvåpunktsfördelningen och då speciellt Bernouillyfördelningen. Fortsatte med den likformiga fördelningen och för-första-gången-fördelningen och den snarlika geometriska fördelningen. Avslutade med att gå igenom binomialfördelningen och den hypergeometriska fördelningen.

Ons 22 mar Började med att repetera de tre fallen: Dragning med återläggning med hänsyn till ordning, dragning utan återläggning med hänsyn till ordning, dragning utan återläggning utan hänsyn till ordning. Gick därefter igenom sannolikheten att vid n dragningar utan återläggning utan hänsyn till ordning dra k vita kulor från k vita och s svarta kulor. Utvidgade sedan detta till sannolikheten att dra v vita och; s svarta och g gula o.s.v när man har r färger. Fortsatte med att gå igenomsannolikheten att vid n dragningar med återläggning utan hänsyn till ordning dra k vita kulor från k vita och s svarta kulor. Utvidgade sedan även; detta till sannolikheten att dra v vita och; s svarta och g gula o.s.v när man har r färger. Började sedan med betingad sannolikhet. Illustrerade betingningsformeln m.h.a. exemplet på sid 26 i läroboken. Visade lagen o total sannolikhet m.h.a. Venndiagram och tog exempel 2.17 som exempel på denna. Visade även Bayes sats >m.h.a. Venndiagram och tog exempel 2.19 som exempel på denna. Visade sedan ex 2.20 på OH som en intressan tillämpning av Bayes sats. Visade sedan definitionen för oberoende utgående från betingningsformeln. Avslutade med exempel 2.23 som exempel på oberoende.

Mån 20 mar Presenterade först kursens hemsida som hittas på http://www.math.kth.se/matstat/gru och visa olika länkar och dess innehåll. Fortsatte sedan med att ge exempel på olika användningsområden som ämnet matematisk statistik har och som denna kurs ger en introduktion till. Började sedan med att gå igenom utfall,utfallsrum,händelser. Förklarade därefter skillnaden mellan diskret och kontinuerlig fördelning. Tog övningsuppgift 2.1a och b som exempel på diskreta utfallsrum. Gick sedan igenom snitt, union, komplement och visade hur man med hjälp av Venndiagram räknar ut sannolikheter. Definierade i samband med detta disjunkthet.Skrev upp Kolmogorovs axiomsystem och den klassiska sannolikhetsdefinitionen.Resten av tiden ägnades åt kombinatorik. Började med multiplikationsprincipen.Gick igenom draging med återläggning med hänsyn till ordning och tog som exempel att antal pinkoder blir 10^4 eftersom antal kombinationer när man drar k ggr från n element blir n^k.Som exempel på dragning utan återläggning med hänsyn till ordning tog jag en förening med 8 medlemmar som skulle välja ordförande,sekreterare och kassör vilket ger 8ggr 7ggr 6 kombinationer .Allmänna fallet n!/(n-k)! kombinationer. Som exempel på dragning utan återläggning utan hänsyn till ordning tog jag antalet pokergivar som ju blir 52 över 5. Allmänt n över k kombinationer.

[Kursförteckning] [Avdelningen Matematisk statistik]

Sidansvarig: Pierre Nyquist
Skapad: 2017-01-17