Genomgång av χ²-test. Testet (med varianter) används för att testa hypoteser som uttalar sig om endera
Kapitel 14, Regressionsanalys. Beskrev modellen för enkel linjär regression och hur man MK-skattar parametrarna i denna modell. Konfidensintervall för regressionslinjens parametrar α och β. Test av perfekt linjäritet, dvs om interceptet α är noll.
Mycket av vår behandling av regressionsanalys är räkning och bäst lär man sig detta avsnitt genom att räkna ett par uppgifter (där man använder formelsamlingen intensivt).
Här ett genomräknat exempel med tillämpning på börsindex.
Kapitel 13, Hypotesprövning. Först lite allmänt om upplägget i hypotesprövningssituationer, termer som nollhypotes, mothypotes, testvariabel, kritiskt område, signifikansnivå (α). Fel av första resp. andra slaget (α resp. β). Styrkefunktionen. Styrkan hos ett test är dess förmåga att förkasta felaktiga hypoteser. Man beräknar normalt sett styrkefunktionen vid dimensioneringen av testet (bestämma n) så att testet uppfyller de krav man har.
Räknade igenom ett exempel om en misstänkt falsk tärning och om hur man ställer upp hypoteser, väljer testvariabel och kritiskt område.
Här ett bra och belysande exempel på hypotesprövning som rör rattfylleri. Här ett annat som rör astrologi.
Mer om hypotespröning presenteras vid den sista föreläsningen, speciellt χ²-test (test av fördelning).
Lite om χ²-fördelningen och t-fördelningen.
Två normalfördelade stickprov. Fallet med två oberoende stickprov där man intresserar sig för skillnaden i väntevärde, dvs. θ=μ2-μ1. Polning av variansskattningar.
Kapitel 12 kommer avrundas i början av nästa föreläsning.
Allmänna skattningsmetoder såsom Maximum likelihhod-metoden och Minsta kvadrat-metoden. ML-metoden exemplifierad på en dataström av 1:or och 0:or med okänd 1-frekvens.
Felfortplantning. Gauss approximationsformler och samband mellan medelfel för funktioner av skattningar.
Kapitel 12 om Intervallskattning. I detta kapitel är idén att statistikern svarar med ett intervall i stället för en punkt på uppmaningen: gissa parametern θ. Svarets tolkning kan då göras matematiskt exakt. Definition av konfidensintervall. Exempel på normalfördelade data där σ är känd men inte väntevärdet (dvs θ=μ). Begreppet pivot-kvantitet. Tolkning av konfidensintervall.
Ungefärligt innehåll om punktskattningar (kapitel 11).
Kapitel 11 om punktskattningar. Begreppet stickprovsvariabel och hur modellen speglar verkligheten. Egenskaper hos skattningar såsom väntevärdesriktighet, konsistens. Begreppet medelfel. Exemplifiering med opinionsundersökning och punktskattning av andelen partisympatisörer, med tillhörande egenskaper.
Att aritmetiskt medelvärde ("x-struket") och stickprovsstandardavvikelse (s) kan användas som lämpliga skattningar av väntrevärde respektive standardavvikelse då man har oberoende likafördelade observationer. Den förra är väntevärdesriktig, men inte den senare. Båda är konsistenta.
Notera att kapitel 8 (Slumptal och simulering) ej ingår i kursen och att kapitel 9 (Introduktion till statistikteorin) läses på egen hand.
Illustration av approximationen för Bin(25,0.2), Bin(50,0.1) och Bin(500,0.01) vad gäller approximation med Po(5)-fördelningen.
Avslutade med ett antal andra användbara approximationer. Diskuterade hur approximationen kan förbättras med halvkorrektion då en diskret fördelning approximeras med en kontinuerlig.
Centrala gränsvärdessatsen, CGS (Sats 6.8) gicks igenom med tolkningen som en förfining av Stora talens lag (Sats 5.12). CGS är viktig, och särskilt användbar då man har summor av ett stort antal oberoende och likafördelade stokastiska variabler. Här ett exempel med summan av 100 tärningskast. Det viktiga med CGS är att summan i satsen blir approximativt normalfördelad trots att inga fördelningsantaganden på termerna finns (annat än att de ska ha varians). Detta förklarar det (något förvånande) fenomenet att många storheter som mäts visar normalfördelningsvariation.
Här ett bevis av Centrala gränsvärdessatsen med transformmetoder (ingår ej i kursen).
Kapitel 7 om binomialfördelningen och dess släktingar. Binomilafördelningen uppkommer som fördelningen för den s.v. som räknar antalet lyckade försök då man gör n oberoende försök vars sannolikhet varje gång är p att lyckas. Framställningen av binomialfördelningen som summan av Bernoulli-fördelade s.v. och hur detta kan användas för att bestämma binomialfördelningens väntevärde och varians, np resp. np(1-p).
Definitionen av varians repeterades och den viktiga satsen (Steiners sats) V(X)=E(X²)-E(X)² bevisades och exemplifierades på exponentialfördelningen. Räkneregler för variansen för summan/differensen av två s.v. i allmänna fallet med kovariansterm (Sats 5.10).
Definition av kovarians som beroendemått och diskussion hur kovariansen och korrelationskoefficienten mäter graden av linjärt beroende mellan två s.v.
Kapitel 5 om väntevärden. Definition av väntevärde med dess tolkningar som
Definition av varians och standardavvikelse med exempel på tärningskast. Tolkning som spridningsmått.
Nästa föreläsning behandlar resten av kapitel 5, dvs framförallt räkneregler, stora talens lag och beroendemått mellan två s.v.
Ungefärligt innehåll av föreläsning 4 (och delar av kommande föreläsning 5).
Kontinuerlig fördelning med exempel om likformig fördelning, exponentialfördelning och normalfördelning. Definition av täthetsfunktion (f) och fördelningsfuktion (F) med tillhörande tolkningar och egenskaper.
Begreppen kvantil och intensitet (avsnitt 3.8) gicks ej igenom. Ej heller avsnitt 3.9 och 3.10, Blandning av stokastiska variabler resp. Funktioner av en stokastisk variabel. Dessa avsnitt ingår förstås i kursen ändå.
Definition och tolkning av begreppet betingad sannolikhet och detsamma för begreppet oberoende händelser. Lagen om total sannolikhet samt Bayes sats om hur man vänder på betingningar.
Ungefärligt innehåll av föreläsning 2.
För den intresserade: Betingade sannolikheter och Bayes sats kan användas för att analysera "bilen och getterna" som var ett problem som diskuterades i pressen för några år sedan. Problemet går även under namnet 'the Monty Hall problem' då det först förekom i en TV-show ledd av Monty Hall (google ger ca 49000 träffar på sökordet "Monty Hall"!). På denna länk finns goda exempel på hur även duktiga matematiker kan tänka fel i detta problem. Sidan bjuder också på ett java-program där man själv kan testa Monty Hall-problemet.
Allmänna anvisningar: Finns även i utskriftsvänligt pdf-format.
Kursinformation
http://www.math.kth.se/matstat/gru/5b1501/B/ (för
B3)
http://www.math.kth.se/matstat/gru/5b1501/I/ (för
I2)
Kurslitteratur
Rekommenderad litteratur
(2) och (3) kan köpas på Elevexpeditionen, Lindstedtsvägen 25, entréplanet, rakt fram innanför porten. Elevexpeditionen är under terminstid öppen på följande tider: måndagar kl. 9.30 - 11.30 och 13.00 - 16.30, tisdagar kl. 9.30 - 13.15 samt onsdagar och torsdagar kl. 9.30 - 12.00. Elevexpeditionen är stängd på fredagar.
Gamla tentamina med lösningar finns på kursens hemsida.
Kursomfattning
Kursavsnitt | Kurslitteratur |
Sannolikhetsteori | (1) kap. 1 - 7 |
Beskrivande statistik | (1) kap. 10 |
Statistikteori | (1) kap. 9, 11 - 16 |
Examination
Tentamen består av sex problemlösningsuppgifter,
och tentamenstiden är fem timmar. Varje korrekt löst
uppgift ger 10 poäng. På tentamen sätts betyg
enligt följande riktlinjer. Från dessa riktlinjer kan
avsteg göras.
Poäng | Betyg |
0 - 23 | u |
24 - 35 | 3 |
36 - 46 | 4 |
47 - 60 | 5 |
Tillåtna hjälpmedel vid tentamen är fickkalkylator (dock ej manual till kalkylatorn) och formel- och tabellsamlingen (2b). Varje tentand måste medföra en egen fickkalkylator. Institutionen har ingen möjlighet att låna ut kalkylator vid tentamen. Institutionen lånar ut formel- och tabellsamlingen (2b) vid tentamen, eget exemplar av denna får inte användas.
Observera: Mathematics Handbook for Science and Engineering (tidigare kallad Beta Mathematics Handbook) av Lennart Råde och Bertil Westergren är inte tillåtet hjälpmedel vid tentamen.
Anmälan till tentamen är obligatorisk och skall i första hand göras via "Mina sidor", som nås via KTHs hemsida. Anmälningslistor kommer även att sättas upp dels på Matematisk statistiks anslagstavla i entréplanet, Lindstedtsvägen 25, rakt fram innanför porten, dels på B3:s anslagstavla i Materialvetenskapsbyggnaden, Brinellvägen 23, b.v. Information kommer att finnas på kursens hemsida.
Tentamensresultatet anslås senast tre veckor efter tentamen på Matematisk statistiks anslagstavla i entréplanet, Lindstedtsvägen 25, rakt fram innanför porten. Om det inte finns plats på själva tavlan, finns resultatlistorna i ringarna längst ned på tavlan. Därefter visas tentamina på Elevexpeditionen. Tentamina kommer att vara tillgängliga där från och med den tidpunkt då tentamensresultatet anslås och till och med sju veckor efter den dag då tentamen ägde rum. När tentamina visas på Elevexpeditionen är varje tentamen hophäftad. Den som vill klaga på bedömningen av tentamen får inte ta bort något häftklammer.
Examinator: Per Hallberg, rum 3437, Lindstedtsvägen 13, 1 tr., telefon 790 6911, e-post perh@math.kth.se.