|
|
Aktuell information
Här ges fortlöpande information om schemaändringar, vad som gåtts igenom på föreläsningar etc.
Problem med anmälning, kursregistrering o.s.v. Har ni det får ni vända er till kurssekreteraren ireneh@math.kth.se (Irene Hanke) SchemaändringDen inställda övningen (tunnelbanehaveri) tas igen i sal C1 måndagen den 3 dec 15-17Kontrollskrivningen kontrollskrivning gavs 13/11 och får tillgodoräknas vid tentan i december. Resultatet bland de som deltog i Kista var 22 godkända och 44 underkända. Totalt (Kista + Centrala Campus) var 193 underkända och 172 godkända. Kopia på listorna finns på matte-expeditionen på Centrala Campus.Föreläsningsinformation2012-12-04 Tolfte föreläsningen.
Behandlade vidare homogenitetstest (kontingenstabell) med två exempel. Det första ett fiktivt exempel om blodgruppsfördelningen (A, B, AB 0) bland svenskar, somalier och japaner där man ville undersöka om det fanns några skillnader. Det andra exemplet var baserat på verkliga data om analys av skillnaden mellan nyfödda pojkar och flickor vad gäller intresse för ansikten. Se tabell 1 i bifogade vetenskapliga artikel Sex differences in human neonatal social perception. där analysen sammanfattas som "χ2=8.3, df.=2, p=0.016", dvs värdet på teststorheten Q, antalet frihetsgrader (degrees of freedom) och p-värdet. p-värdet är sannolikheten att en χ2(2)-fördelad variabel är större än det observerade Q-värdet 8.3. Slutsatsen var alltså att nyfödda pojkar och flickor skiljde sig åt vad gäller intresset för ansikten om vi testar på en signifikansnivå (felrisk) över 0.016, t ex 5%. Huvudförfattare till artikeln är Simon Baron Cohen. Denna artikel nämns i en debatt mellan Steven Pinker och Elisabeth Spelke med anledning av att Harvards rektor Lawrence Summers fått sparken eftersom han diskuterat om det fanns könsskillnader vad gäller intresse för naturvetenskap. Samme Lawrence Summers utnämndes till Barack Obamas ekonomiske rådgivare (han var framgångsrik finansminister under Bill Clinton). Artikeln nämns också i den norske komikern Harald Eias sevärda TV-serie Hjernevask. Här är en länk som leder till programmen. Lite om enkel linjär regression som jag tog upp redan i samband med minstakvadrat-metoden. Pekade på konfidensintervallen för intercept, riktningskoefficient samt en punkt på linjen. Här är ett exempel på enkel linjär regression. Nämnde lite om polynomregression samt Multipel linjär regression som naturliga generaliseringar av "Enkel linjär regression". Enbart avsnittet om enkel linjär regression ingår i kursen. Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2).
Föreläsningsinformation2012-11-29 Elfte föreläsningen.Slutförde resonemangen om Test av astrologer som inte hanns med sist. Ett exempel om rattfylleri presenterades som en repetition av hypotespröving samt introducerade begreppet styrkefunktion. I samband med detta exempel pekades på den i praktiska sammanhang ofta användbara "konfidensmetoden" att utföra hypotesprövning på nivån α genom att beräkna ett konfidensintervall med konfidensgrad (1-α). Om χ2-test. Inledningsvis om test av tärning i enlighet med exempel 13.17 i läroboken (sid 343). Illustrerade vidare χ2-metoden med exempel 13.18 sid 344 där man testade om data från en lustig och klassisk illustration om antalet ihjälsparkade kavallerister vid 14 tyska armékårer under en 20-årsperiod kom från en Poissonfördelning. Det sista med utgångspunkt från (den något förvirrade och okunniga) boken "The roots of coincidence" av Arthur Koestler. Förklaringen av att antalet kan antas vara Poissonfördelat är t ex att Bin(n,p) väl approximeras av Po(np). Man kan också göra en feluppskattning av denna typ av approximationer.
Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-11-26 Tionde föreläsningen.
Konfidensintervall för situationen "två oberoende stickprov" som exemplifierades med "längder för 100 svenska män" och "längder för 50 japanska män" och där man ville ge konfidensintervall för skillnaden i medellängd i de två populationerna. Först en approximativ lösning där man inte antog något om fördelningarna utan i stället via CGS kunde använda sig av "approximativa metoden".
Sedan presenterade jag en lösning där data (orealistiskt nog) antogs komma från normalfördelningar med kända spridningar.
Sist behandlades det på det "sedvanliga" sättet där man antar att data kommer från två normalfördelningar med okända väntevärden och med okänd spridning som dock är den samma i båda stickproven. Detta är ett (enkelt) exempel på vad som brukar kallas "Variansanalys" (Analysis of variance - ANOVA). Anknöt konfidensintervallet till hypotesprövning men denna koppling blir mer explicit nästa föreläsning som behandlar hypotesprövning. Behandlade vidare det intressanta fallet "stickprov i par" (parvisa observationer) som exempel på försöksplanering och där man analyserar differenserna inom par. Pekade på att det är viktigt att kunna identifiera om data kommer från "två oberoende stickprov" eller "stickprov i par" då man löser tentauppgifter! Vill också peka på allmän metodik för att beräkna konfidensintervall med formelsamlingen. Inledning om Kapitel 13 om hypotesprövning, dvs statistisk bevisning. Grundbegreppen nollhypotes, alternativhyptotes, testvariabel, kritiskt område, fel av första slaget (α-felet), fel av andra slaget (β-felet), signifikansnivå (felrisk) illustrerades med exemplet: test av astrologer Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-11-21 Nionde föreläsningen. Kapitel 12 om konfidensintervall (osäkerhetsintervall). Härledning av konfidensintervall då data är utfall av oberoende normalfördelade variabler N(μ,σ0) där spridningen σ0 är känd. Detta genomfördes som ett program i fem punkter. Resultatet framgår av formelsamlingens 12.1 λ-metoden. Approximativa konfidensintervall med exempel på opinionsundersökning. En mycket viktig situation som beskrivs av formelsamlingen i 12.3 Approximativa metoden där kontentan är att intervallet blir skattning ± 1.9600 medelfel om man vill göra ett approximativt 95%-igt konfidensintervall. Studerade också förändring mellan två opinionsundersökningar. Situationen "ett normalfördelat stickprov" där spridningen σ är okänd. χ2-fördelningen som är relevant för att ange fördelningen för σ-skattningar. Konstruktion av konfidensintervall för μ med hjälp av t-fördelning.
Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2).
2012-11-15 Åttonde föreläsningen. Allmänt om punktskattningar med begreppen parameter, statistisk modell, punktskattning och stickprovsvariabel. Pratade lite om hur man skattar μ respektive σ2 då data är utfall av oberoende likafördelade stokastiska variabler med väntevärde μ och varians σ2. Aritmetiskt medelvärde och s2 utgör väntevärdesriktiga och konsistenta skattningar. Det kan dock finnas effektivare skattningar i speciella situationer och här är ett exempel på detta. Detta exempel har en viss likhet med the German tank problem som användes under andra världskriget av de allierade för att skatta produktionen av tyska stridsvagnar.
Maximum likelihoodmetoden illustrerades med ett exempel med Poisson-fördelade mätdata. ML-metoden ger i princip de effektivaste skattningarna. För den (mycket) intresserade ges här en (ganska svår) genomgång av teoretisk statistik. Minsta kvadratmetoden illustrerades med exemplet enkel linjär regression som behandlas mer utförligt i kapitel 14 samt ett vinkelmätningsproblem.
Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2).
2012-11-13 Sjunde föreläsningen.
Inledning om kapitel 7 om binomialfördelning och dess släktingar. Om binomialfördelning. Typsituationerna för binomialfördelningen och Hypergeometrisk fördelning. Framställning av binomialfördelningen som fördelning för summa av indikatorer. Detta användes för att ta fram väntevärde och varians för binomialfördelningen. Tumregel för normalapproximation av binomialfördelningen med Centrala gränsvärdessatsen. Lite om Hypergeometrisk fördelning, framför allt hur den kan approximeras med binomialfördelning då andelen valda kulor är litet i förhållande till urnans storlek, vilket svarar mot att det då inte spelar någon roll om dragningen sker med eller utan återläggning. För den intresserade finns här en härledning av väntevärde och varians för den hypergeometriska fördelningen.
Se gärna uppkomstsätt för ffg, binomial- respektive hypergeometrisk fördelning. Sats om att summan av oberoende Poisson-fördelade stokastiska variabler är Poisson-fördelad. Detta bevisades med hjälp av sannolikhetsgenererande funktion (ligger lite utanför kursen men är så snggt att jag inte kunde låta bli att presentera detta). Feluppskattning för approximation av binomial- med Poisson-fördelning som motiverar varför Poisson-fördelning är så vanlig som modell för "sällsynta händelser", t ex antal telefonanrop, bränder eller åsknedslag etc. För approximationer: se jämförelserna mellan Bin(25,0.2)-fördelning och Po(5), Bin(50,0.1)-fördelning och Po(5) samt mellan Bin(500,0.01)-fördelning och Po(5). Kapitel 8 ingår ej (men är skojigt och användbart i praktiska livet). Kapitel 9 och 10 läses kursivt. Inledning om det viktiga kapitel 11 om punktskattningar med utgångspunkt i exemplet om opinionsundersökning beskrivet i avsnitt 11.2 i läroboken. Begreppen väntevärdesriktigtighet och medelfel. Nämnde att vi i kapitel 12 om konfidensintervall kommer att se att intervallet skattning ± 1.9600 medelfel ger övre och undre gräns för parameterna som gäller med approximativt 95% säkerhet. Allmänt om punktskattningar med begreppen parameter, statistisk modell, punktskattning och stickprovsvariabel.
Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-11-07 Sjätte föreläsningen. Visade hur varians för linjärkombination kunde beräknas med hjälp kovariansformler där man utnyttjar
Stora talens lag, dvs att aritmetiska medelvärdet av summor av oberoende likafördelade stokastiska variabler konvergerar mot väntevärdet, vilket är en viktig tolkning av väntevärdet. Som specialfall kan man ta "relativa frekvensers stabilitet" som vi talade om i kapitel 2.
Kapitel 6 om normalfördelningen. Definition och egenskaper, speciellt egenskapen att alla linjärkombinationer av oberoende normalfördelade stokastiska variabler är normalfördelade. Lite om användningen av Φ-tabell dvs tabell över fördelningsfunktionen för den standardiserade normalfördelningen N(0,1). Som varning att det krävs någon form av oberoende för att summor av normalfördelade skall bli normalfördelad ges följande motexempel. Centrala gränsvärdessatsen illustrerad med poängsumma av många tärningskast. För den intresserade: Ett bevis av Centrala gränsvärdessatsen med hjälp av Laplacetransform (momentgenererande funktion) samt ett bevis med Fourier-transform (karaktäristisk funktion).
Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-11-05 Femte föreläsningen. Beräknade hur man får E(X) där X är Po(μ). Gick igenom S:t Petersburgsparadoxen i enlighet med Exempel 5.8 i läroboken. Införde variansen V(X) och standardavvikelsen D(X) som spridningsmått. Formel att V(X)=E(X2) - (E(X))2 som brukar kallas Steiners regel inom mekaniken.
Beskrev hur vi får E(g(X,Y)) och noterade att intressanta fall var g(X,Y)=XY, g(X,Y)=X+Y samt g(X,Y)=X. Räkneregler för väntevärde och varians varvid begreppet kovarians dök upp som mått på beroende. Införde C(X,Y)=kovariansen mellan X och Y som beroendemått där C(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY)-E(X)E(Y) samt korrelationskoefficienten=C(X,Y)/(D(X)D(Y)) och varnade för okritisk användning av denna som mått på orsakssamband. Visade att oberoende variabler är okorrelerade (dvs har C(X,Y)=0). Observera att omvändningen inte gäller och jag gav ett exempel.
Visade räknelagar för väntevärden och varianser:
Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-10-29 Fjärde föreläsningen.
Avsnitt 3.8 och 3.9 och 4.8 läses kursivt. Avsnitt 3.10: Funktioner Y=g(X) av en stokastisk variabel som exemplifierades med Y=signum(X)=tecknet för X samt Y=X2. Tog fram sannolikhetsfunktion för Y=(X-2)2 då X var diskret samt Y=signum(X) då X har täthet. Tog fram tätheten för Y=X2 då X är kontinuerlig där lärdomen var att man måste utföra en kalkyl och inte kan gissa resultatet.
Kapitel 4 om flerdimensionella stokastiska variabler behandlades rätt kortfattat med särskild tonvikt på det viktiga fallet med oberoende variabler. Notera att avsnittet 4.8 om betingad fördelning inte ingår. Tittade också på fördelningen för Z=g(X,Y) i några intressanta fall som Z=max(X,Y) samt Z=min(X,Y) och Z=X+Y där det sistnämnda resulterade i en faltning.
Inledning om kapitel 5 om väntevärden. Definition av väntevärde E[X] för stokastisk variabel och dess tolkningar som tyngdpunkt i sannolikhetsfördelningen, ett viktat medelvärde där vikterna är sannolikheterna samt som medelvärde av "många" oberoende upprepningar av försöket (Stora talens lag). Gav exemplen X='resultat av ett tärningskast', X='kvadraten på ett tärningskast',X är exponentialfördelad. Formler för E(g(X)).
Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-10-26 Tredje föreläsningen.
Kapitel 3 om stokastiska variabler som exemplifierades med
Ovanstående var exempel på diskreta fördelningar, dvs sådana där man har ändligt (eller möjligen uppräkneligt oändligt) antal tänkbara värden på de stokastiska variablerna. Vidare behandlades kontinuerliga fördelningar (sådana med tätheter) samt begreppet fördelningsfunktion. Som exempel gavs likformiga fördelningen (rektangelfördelningen) och exponentialfördelningen.
Begreppet fördelningsfunktion dvs FX(x)=P(X≤x) som
kan användas för att beräkna
FX(b)-FX(a)=P(a < X≤b)=P(a≤ X ≤b)=P(a < X < b)= P(a ≤ X < b) eftersom P(X=x0)=0 oavsett x0. Fördelningsfunktion är lite ointuitiv men praktisk vid kalkyler. Här är lite om uppräknelighet. Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-10-24 Andra föreläsningen. Första föreläsningen presenterades lite om kombinatorik och vi redde ut de tre intressanta fallen med hjälp av multiplikationsprincipen. Alltså dragning med återläggning med hänsyn till ordning, dragning utan återläggning med och utan hänsyn till ordning. Använde detta för att härleda sannolikheten att få k vita kulor då man ur en urna med v vita och r röda kulor drar n kulor med respektive utan återläggning. Detta har kopplingar till Binomialfördelningen och Hypergeometriska fördelningen som presenteras i kapitel 3 och 7. Begreppet betingad sannolikhet samt oberoende. Lagen om total sannolikhet samt Bayes sats (som kan användas för att vända på betingning). Använda detta för att analysera dels ett exempel om rökning och strupcancer samt ett exempel hämtat ur Scientific American om ett diagnostiskt test. Se gärna godiset : Monty Halls problem (bilen och getterna) och Persi Diaconis videoföredrag från Princeton On coincidences. Här en nyhetsartikel om ett föredrag av Persi Diaconis om slantsingling. Ungefärligt föreläsningsinnehåll. (Alternativ 1).
Ungefärligt föreläsningsinnehåll (Alternativ 2). 2012-10-22 Första föreläsningen.
Grundläggande terminologi. Slumpförsök, utfall, utfallsrum och händelse med exempel på diskreta utfallsrum. Tolkning av mängder som händelser och mängdlärans operationer: komplement, union och snitt. De Morgans lagar. Omöjliga och oförenliga (disjunkta) händelser. Tolkning av sannolikhetsbegreppet. Relativa frekvensers stabilitet. Kolmogorovs axiomsystem och några satser som följer ur detta. Klassisk sannolikhetsdefinition som är tillämplig då elementarutfallen kan anses vara lika sannolika. Lite om kombinatorik, dvs svaret på frågan "På hur många sätt kan man...." samt begreppen "Med/Utan återläggning" samt "Med/Utan hänsyn till ordning". Finns tre intressanta fall av dragning ur en urna med hjälp av multiplikationsprincipen. Alltså dragning med återläggning med hänsyn till ordning, dragning utan återläggning med och utan hänsyn till ordning. Beviset av det återstående fallet, dragning med återläggning utan ordningshänsyn, ingår inte i kursen.
Ungefärligt föreläsningsinnehåll (Alternativ 1). Ungefärligt föreläsningsinnehåll (Alternativ 2). |
![]() |
|
Sidansvarig: Gunnar Englund Uppdaterad: 2010-08-09 |