Sannolikhetsteori och statistik för L
5B1501
Matematiska institutionen, avd. Matematisk statistik




På denna sida kommer aktuell information att ges om schemaändringar, vad som
behandlats på föreläsningarna samt en del kompletterande information. 
Titta  gärna till denna sida med jämna mellanrum.

Tentamen

Tentan 22/10-2003 är nu rättad. Resultatet var ganska tillfredsställande - Resultatsammanställning för L. För nästa tentamenstillfälle se tentamensinformation.

Kursutvärdering

En kursvärdering finns nu upplagd. Besvara gärna denna! Man kan också nå kursutvärderingarna på denna länk.

Lösningar till exempel

Lösningar till vissa problem i problemsamlingen finns nu att ladda ner.

Föreläsningsinformation

9/10 eftermiddag

Lite om linjär regression inklusive användning av konfidensmetoden för att testa om linjen går igenom origo (intercept=0) med utgångspunkt från exemplet med data från New York- och Sidneybörserna.

Chi2-test exemplifierades med test av tärning samt test av om antalet ihjälsparkade tysk kavallerister var Poisson-fördelat, dvs ett test av om dessa fördelningar var "tillräckligt lika".

Homogenitetstest med ett exempel om blodgruppsfördelningen i 3 etniska grupper.

9/10 förmiddag

Lite om "parvisa observationer" och hur denna situation skiljer sig från "två oberoende stickprov".

Inledning om kapitel 14 (Hypotesprövning). Räknade igenom exemplet rattfylleri och visade hur detta kopplade ihop hypotesprövning med konfidensintervall.

Kopplingen mellan konfidensintervall och hypotesprövning för dubbelsidiga och enkelsidiga test.

Vidare behandlades exemplet astrologi för att illustrera att hypotesprövning kan genomföras även om man inte kan använda konfidensmetoden.

Begreppen nollhypotes, alternativhypotes, fel av I:a slaget (alfa-felet), fel av II:a slaget (beta-felet), testvariabel, kritiskt område samt styrkefunktion.

7/10

Kapitel 13 om konfidensintervall med viss repetition från föregående gång eftersom detta är ett så viktigt område (brukar vara 2 uppgifter av 6 om detta på tentan).

Räknade igenom numeriskt och teoretiskt ett normalfördelat stickprov med både känd och okänd standardavvikelse samt den viktiga approximativa metoden i form av analys av en opinionsundersökning samt även jämförelse mellan 2 opinionsundersökningar. Begreppet "statistiskt säkerställd förändring".

Ordentlig genomgång med numeriska exempel på två oberoende stickprov speciellt om man inte antar något om standardavvikelserna (approximativ lösning) samt om dessa antas vara lika (exakt lösning).

Nästa gång behandlas parvisa observationer samt hypotesprövning.

2/10

Kapitel 13 om konfidensintervall. Fallet normalfördelade observationer med känd standardavvikelse behandlades först (tabell 2). Sedan normalfördelade observationer med okänd spridning varvid konfidensintervall både för väntevärde (tabell3) och varians (tabell 4) togs fram.

Den viktiga "approximativa metoden" behandlades i form av opinionsundersökning.

Bild av t(9)-fördelningen samt bild av chi2(9)-fördelningen.

Att beräkna konfidensintervall med hjälp av formelsamling kan vara till hjälp samt även en allmän metod att ta fram konfidensintervall.

30/9

Kapitel 12 om punktskattningar. Skattning av väntevärde och standardavvikelse med aritmetiskt medelvärde respektive s. Begreppen väntevärdesriktighet, effektivitet och konsistens.

Ett exempel på att aritmetiskt medelvärde inte alltid är bästa tänkbara skattning.

Maximum Likelihoodmetoden som går ut på att som skattning ta det parametervärde som gör de observerade mätdata så sannolika som möjligt. Exemplifierades med Poissonfördelade data.

Minsta kvadratmetoden som exemplifierades med dels ett vinkelmätningsproblem samt med enkel linjär regression (som beskrivs lite mer detaljerat i kapitel 15). Ett exempel på enkel linjär regression - det mesta av materialet behandlas senare i kapitel 13,14 och 15.

Nästa gång behandlas kapitel 13 om konfidensintervall.

26/9

Kapitel 9 om Binomialfördelning och dess släktingar behandlades lite översiktligt med tonvikt på att man kan göra ett antal approximationer. Som illustration gavs approximationen av Bin(1000,0.04) med normalfördelning som har tillåmpningar på opinionsundersökningar.

Bin(n,p) kan approximeras någorlunda väl med Po(np) om p<=0.1: Man ser ur nedanstående att approximationen blir bättre ju mindre p är.

En lustig och klassisk illustration om antalet ihjälsparkade kavallerister. Det sista med utgångspunkt från (den något förvirrade och okunniga) boken "The roots of coincidence" av Arthur Koestler.

Kapitel 11 läses kursivt. Inledning om kapitel 12 om punktskattningar med speciell tillämpning på opinionsundersökningar. Begreppen punktskattning och stickprovsvariabel. Begreppet medelfel.

Nästa gång behandlas resten av kapitel 12 speciellt Maximum Likelihoodmetoden och Minsta kvadratmetoden.

25/9

Avsnitt 7.4 om Gauss-approximation (felfortplantning), dvs att man gör en linearisering. Varning för att använda detta på tentan annat än som sista desperata åtgärd.

Kapitel 8 om normalfördelning. Standardiserad och allmän normalfördelning. En linjär sammansättning av oberoende normalfördelade är normalfördelad.

Centrala gränsvärdessatsen som ungefär innebär "summan av många (ungefär) oberoende och (ungefär) likafördelade är (ungefär) normalfördelad". Detta resultat illustrerades med summan av 100 tärningskast. Denna figur har tagits fram med Matlab enligt koden som egentligen utnyttjar z-transformen (sannolikhetsgenererande funktion) som inte ingår i kursen.

Om bevis av CGS.

Nästa föreläsning behandlarkapitel 9 och ger dessutom en inledning om statistisk inferens (kapitel 10,12).

16/9

Kapitel 6 och 7 om väntevärden. Behandlade summan av två tärningskast och exponentialfördelning som exempel. Formel för E(g(X)) med tillämpning på Y=2X där X=antalet slantsinglingar t o m första klave, dvs S:t Petersburgsparadoxen. Om man tog hänsyn till max-belopp kunde paradoxen lösas upp.

Spridningsmått i form av varians och (mer lämpligt) standardavvikelse samt variationskoefficient. Tolkning av standardavvikelse som "storleksordning" av variation kring väntevärdet med hjälp av Tjebyshovs olikhet.

Räkneregel för linjär transformation för väntevärde och varians. Konstaterade att "väntevärdesbildning är en linjär operation".

Räkneregeln V(aX+bY+c)=a2V(X)+b2V(Y) om X och Y är oberoende. Tillämpning på summan och aritmetiska medelvärdet av n oberoende likafördelade. Lite om stora talens lag.

Kovarians som mått på linjärt beroende.

11/9

Beklagligtvis hade jag skrivit fel datum i min kalender, vilket gjorde att jag tyvärr inte kom till föreläsningen.

OBS! Föreläsningen tas igen genom att övningen den 16/9 kl 15-17 byts mot en föreläsning i Sal L1.

9/9

Kapitel 4 om flerdimensionella stokastiska variabler, speciellt begreppet oberoende stokastiska variabler.

Kapitel 5 om funktioner av stokastiska variabler, där kvadrattransformation, summa, minimum och maximum behandlades.

Inledning om kapitel 6 om väntevärden.

Ett  bordsplaceringproblem.

Lite om generering av slumptal

4/9 eftermiddag

Kapitel 3 om stokastiska variabler som exemplifierades med Ovanstående var exempel på diskreta fördelningar, dvs sådana där man har ändligt (eller möjligen uppräkneligt oändligt) antal tänkbara värden på de stokastiska variablerna. Vidare behandlades kontinuerliga fördelningar (sådana med tätheter) samt begreppet fördelningsfunktion. Som exempel gavs rektangelfördelningen och exponentialfördelningen.

Nästa föreläsning behandlar kapitel 4 (översiktligt) och kapitel 5.

4/9 förmiddag

Avsnitt 2.5 och betingad sannolikhet, lagen om total sannolikhet samt Bayes' sats. Begreppet betingad sannolikhet, lagen om total sannolikhet och Bayes' sats som är användbar för att vända på betingade sannolikheter. Detta kan användas för att analysera diagnostiska test - se Scientific American juni 2002.

Artikel i Ny Teknik om användning av Bayes' sats för spamfilter.

Betingade sannolikheter och Bayes sats kan användas för att analysera 'bilen och getterna som var ett  problem som diskuterades i pressen för några år sedan. Samma problem finns i följande länk, 'bilen och getterna' dvs. Monty Hall problem (Virtual laboratory). För övrigt kan påpekas att Altavista ger ca 5000 länkar till sökordet "Monty Hall"! På länken finns längst ner på sidan en länk till ett java-program där man själv kan testa Monty Hall-problemet.

Begreppet oberoende händelser. Inledning om kapitel 3 om stokastiska variabler med exemplet X=antalet tärningskast t o m första sexan. Fördelningen för X härleddes utifrån begreppet oberoende.

1/9

Förutom praktiska detaljer behandlades kapitel 2.1-2.4 i kursboken. Lite om slumpförsök, elementarutfall, utfallsrum, händelser med exempel från tärningskast. Relativa frekvenser och axiomsystem för sannolikhetsmått. Lite om räkneregler för händelser (delmängder) samt satser för sannolikhetsmått. Klassisk sannolikhetsdefinition. Mycket kortfattat om kombinatorik i samband med klassisk sannolikhetsdefinition.


Senast ändrad 2003-09-02
Webansvarig: gunnare@math.kth.se