Aktuell information
På denna sida ges aktuell information om schemaändringar, vad som har gåtts igenom på föreläsningar etc. Tag för vana att besöka denna sida.

Tentamen 19/08 2013
Tentan är nu rättad och och finns på matteexpeditionen.

Kompletteringstenta för de som fick Fx i tentamen den 19 augusti

Tentan ordnas fredag 2013-09-13 kl. 15:00 - 17:00, sal D4363. Tentan består av två skriftliga uppgifter av samma typ som du löser i de vanliga tentorna. Kursens formelsamling och handboken Beta är tillåtna hjälpmedel. Ingen förhandsanmälan krävs.

Tentamen 28/05 2013

Tentan är nu rättad och och finns på matteexpeditionen. Detaljer finns här.

Kompletteringstenta för de som fick Fx i kurstentan den 28 maj

Tentan ordnas tisdag 2013-06-25 kl. 15:00 - 17:00 sal D32. Tentan består av två skriftliga uppgifter av samma typ som du löser i de vanliga tentorna. Kursens formelsamling och handboken Beta är tillåtna hjälpmedel. Ingen förhandsanmälan krävs.

Kontrollskrivning gavs den 18:e april 2013 och de rättade skrivningarna finns på matte-expeditionen. Kontrollskrivning 18/04 2013 med svar finns här.

Föreläsningsinformation

2013-05-06

Föreläsning 12 ägnades helt åt statistiska test, med repetition av grundbegrepp som nollhypotes, mothypotes eller alternativ hypotes och teststorhet. Sedan introducerade jag p-värde, signifikansnivå och styrka eller styrkefunktion. Vidare visade jag att det finns två huvudmetoder för att utföra ett test: antingen beräknar man ett p-värde, eller så sätter man en signifikansnivå i förväg och beräknas kritiska gränser för teststorheten.

Kom ihåg att när man konstruerar ett test så utgår man nästan alltid från samma storhet (teststorheten) som man använder när man konstruerar konfidensintervall för den parameter som man undersöker.

På slutet visade jag hur konfidensintervall och test är nära relaterade: man kan testa för ett visst parametervärde genom att göra ett konfidensintervall och se om det innehåller det givna värdet, och man kan konstruera ett konfidensintervall genom att utgå från ett test och skapa intervallet som alla parametervärden som inte förkastas av testet.

Jag hann tala mycket kort om passning av fördelning med exempel på normplot. Vi återkommer till detta under laboration 2.

2013-05-02 (Vikarie Gunnar Englund)

Approximativa konfidensintervall med exempel på opinionsundersökning. En mycket viktig situation och vanlig situation beskrivs av formelsamlingen i 12.3 Approximativa metoden där kontentan är att intervallet blir

skattning ± 1.9600 medelfel

om man vill göra ett approximativt 95%-igt konfidensintervall.

Studerade dels en enskild opinionsundersökning samt förändringen mellan två opinionsundersökningar och kom då osökt in på begreppet ''förändringar inom felmarginalen'' och lite om hypotesprövning som dyker upp i nästa kapitel.

Som ytterligare exempel på användning av den mycket nyttiga approximativa metoden studerade vi ett (fiktivt) exempel med antalet trafikdöda två olika år där vi ansatte Poissonfördelningar och beräknade ett (approximativt) konfidensintervall för förändringen.

Inledning om Kapitel 13 om hypotesprövning, dvs statistisk bevisning. Grundbegreppen nollhypotes, alternativhyptotes, testvariabel, kritiskt område, fel av första slaget (α-felet), fel av andra slaget (β-felet), signifikansnivå (felrisk) illustrerades med exemplet: test av astrologer

Ett exempel om rattfylleri presenterades som ytterligare ett exempel på hypotespröving samt som introducerade begreppet styrkefunktion. Dessutom fanns i detta exempel en parameter som man ville testa om den hade ett visst värde. Borde ha hunnit med att göra kopplingen till "konfidensmetoden".

Ungefärligt föreläsningsinnehåll. (Alternativ 1).

Ungefärligt föreläsningsinnehåll (Alternativ 2).

2013-04-24 Tionde öreläsning inleddes med en repetition av den generella arbetsgången (schema) för att ta fram ett konfidensintervall. Schemat användes för att konstruera ett konfidensintervall för varians och standardavvikelse.

Vidare använde vi schemat för att konstruera ett konfidensintervall för skillnaden mellan väntevärdena i två normalfördelningar med samma varians, den situation som ofta kallas "två stickprov". Den gemensamma okända variansen skattas då med en s k polad variansskattning, och jag berättade varför den ser ut som den gör.

Sedan beskrev jag modellen stickprov i par (eller parvisa observationer), dvs då man har data från två behandlingar e dyl på ett antal objekt/individer. Skilj noga på denna situation, kontra modellen ''två stickprov''!

Tyvärr har jan inte hunnit tala om konfidensintervall baserade på läs själva i boken om normalapproximation med focus på skattning av sannolikheten p i Bin(n,p) (avsn. 12.5, exempel 12.12 och 12.14).

2013-04-22 Nionde öreläsning inleddes med en repetition av egenskaper av punskattning. Sedan introducerade jag begreppet konfidensintervall, illustrerat på skattning av väntevärde i normalfördelnig med känd standardavvikelse (exempel 12.1 och 12.2 i boken). Sedan berättade jag om fallet med okänd standardavvikelse, som då måste skattas (med stickprovsstandardavvikelsen). Då får den standardiserade skattaren (den s k pivotvariabeln) en t-fördelning, och konfidensintervallet konstrueras mha kvantiler för denna fördelning.

Den generella arbetsgången för att ta fram ett konfidensintervall är som följer: (i) skriv upp den parameter som skall skattas, (ii) hitta en (punkt)skattare av denna parameter, (iii) beräkna fördelningen för skattaren (denna fördelning innehåller parameterar, speciellt den som skall skattas), (iv) hitta en transformation av skattaren (i regel en subtraktion av och/eller division med parameterar, stickprovsstorlek o dyl) till en ny stokastisk variabel vars fördelning (en s k pivotvariabel) inte innehåller några parametrar, (v) stäng in denna nya s.v. mellan kvantliler uppåt och nedåt, en händelse som inträffar med en viss stor sannolikhet (som blir konfidensgraden), och (vi) skriv om olikheterna för att få parametern som skall skattas i mitten, och på så sätt ett konfidensintervall.

2013-04-17 Åttonde föreläsningen var den första i statistikavsnittet av kursen. Huvudbudskapet var att när man (upp)skattar en parameter (t ex väntevärde, varians eller proportion) i en statistisk fördelning, så kan man se det (i) som att man beräknar ett numeriskt värde (skattningen) utifrån de (numeriska) data man har, men också (ii) som att de data man har är observationer av stokastiska variabler och att den funktion man bildar av dessa (stickprovsvariabeln, eller skattaren) med syftet att skatta parametern också kan ses som en stokastisk variabel, som värdet (skattningen) i (i) är en observation av.

Just detta synsätt (eller insikt) att en skattare är en stokastisk variabel är grundpelaren för hela den statistiska delen av kursen. Tänk igenom detta, och också de viktiga begreppen väntevärdesriktighet och medelfel, som är en uppskattning av standardavvikelsen hos en skattare.

2013-04-15 Sjunde föreläsningen. Vi har gått igenom räkningar med normalfördelningen, både den standardiserade (v.v. 0, varians 1), som man kan hantera med tabeller om man inte har dess fördelningsfunktion på miniräknaren, och allmänna normalvariabler som man ofta standardiserar (subtrahera v.v., dela med standardavvikelse) för att komma tillbaka till grundfallet med standardiserad normalfördelning.

Vi sade att en linjärkombination av oberoende normalfördelade s.v. är normalfördelad, och att en summa av många oberoende likafördelade s.v. är approximativt normalfördelad, oavsett fördelningen för de s.v. som ingår i summan (centrala gränsvärdessatsen).

Normalapproximation av binomialfördelningen tas upp (avsnitt 7.2c) men jag hann tyvärr inte med Poissonapproximation av binomialfördelningen (avsnitt 7.4c), läs själva i boken!

2013-04-11 Sjätte föreläsningen.

Föreläsning 6 handlade om först om begreppet kovarians. Vet man och kan använda att väntevärdet är linjärt (dvs väntevärdet av en linjärkombination av s.v. är lika med motsvarande linjärkombination av väntevärdena), att kovariansen är bilinjär (dvs har linjäritetsegenskapen i båda argumenten; tänk på multiplikation av summor av termer inom paranteser), och att variansen av en s.v. är kovariansen av denna med sig själv (V(X)=C(X,X)), så klarar man alla beräkningar med väntevärden och (ko)varianser! Vi härledde att oberoende s.v. också är okorrelerade, dvs har kovarians 0.

Vi tittade på stora talens lag, och ett bevis.

2013-04-09 Femte föreläsningen.

Temat för föreläsningen två-dimensionella stokastiska variabler, vilket helt enkelt betyder att man betraktar två stycken stokastiska variabler på en gång. Naturligtvis kan det också vara fler än två. Viktigt att veta är hur sannolikhetsfunktion, täthetsfunktion och väntevärden fungerar för flerdimensionella variabler. Definitionerna är uppenbara generaliseringar av de som gäller i en dimension; t ex får man sannolikheten att en kontinuerlig variabel tar ett värde i en viss mängd genom att integrera dess täthet över mängden. Med marginalisering menas att man "plockar bort" den ena variabeln; t ex får man tätheten för X genom att integrera tätheten för (X,Y) över y-variabeln. Ett annat viktigt begrepp är oberoende stokastiska variabler. Vi diskuterade några olika funktioner av oberoende variabler som summa, maxima och minima.

2013-03-26 Fjärde föreläsningen.

Föreläsningen handlade om kontinuerliga stokastiska variabler. Jag började med repetition av de viktiga begreppen diskret fördelning och övergick till definition av kontinuerlig stokastisk variabel.

En sådan stokastisk variabel kan anta alla värden på tallinjen, eller ett intervall av reella tal. Man kan säga att den totala sannolikhetsmassan 1 är kontinuerligt utsmetat på tallinjen (eller ett intervall). Precis hur sannolikhetsmassan är fördelad beskrivs av täthetsfunktionen, som är det viktigaste begreppet för kontinuerliga stokastiska variabler, och motsvarar sannolikhetsfunktionen för diskreta dito. En grundprincip är att sannolikheten att en kontinuerlig stokastisk variabel faller i en viss delmängd av tal (t ex ett intervall), fås genom att integrera täthetsfunktionen över denna mängd.

Viktigt är också hur väntevärdet av (en funktion av) en kontinuerlig stokastisk variabel definieras/beräknas. Notera att definitionen är analog med motsvarande för en diskret stokastisk variabler, men vi byter sannolikhetsfunktion mot täthet och summa mot integral.

Begreppet fördelningsfunktion är användbart t ex när man vill beräkna täthetsfunktionen för en stokastisk variabel som är en funktion av en annan kontinuerlig stokastisk variabel. Begreppet kvantil hann jag inte med. Läs själva i boken! Vi återkommer också till kvantiler under statistikavsnittet av kursen.

2013-03-21 Tredje föreläsningen. (Vikarie Gunnar Englund).

Gick som hastigast igenom kapitel 10 om Beskrivande statistik framför allt behandlingen av data i 10.2a) om antalet tändstickor i 35 tändsticksaskar. I Tabell 10.1 presenteras materialet gruppindelat där det anges hur stor andel de olika värdena har. Grafiskt visas detta i figur 10.1 i form av ett stolpdiagram. Pratade om läges- och spridningsmått enligt 10.3 a.

Huvudtemat var dock delar av det utomordentligt viktiga kapitel 3 om stokastiska variabler som exemplifierades med (inklusive vad som behandlades på föreläsning 2)

Använde resultatet om X="antalet kast t o m första 6:an" för att härleda P(X är udda) som visade sig vara 6/11.

Poisson-fördelning dyker upp som modell för t ex inloggningar till ett datasytem, antal telefonanrop, antal åskväder etc.

Ovanstående var alla exempel på diskreta fördelningar, dvs sådana där man har ändligt (eller möjligen uppräkneligt oändligt) antal tänkbara värden på de stokastiska variablerna. Visade kopplingen till stolpdiagrammet i kapitel 10.

Demonstrerade hur man kan använda tabell 5 för att beräkna P(X≥17) då X är Po(8.5) och nämnde i detta sammanhang begreppet fördelningsfunktion dvs F(x)=P(X≤x).

Inledning om kapitel 5 om väntevärden. Definition av väntevärde E[X] för stokastisk variabel och dess tolkningar som tyngdpunkt i sannolikhetsfördelningen, ett viktat medelvärde där vikterna är sannolikheterna samt som medelvärde av "många" oberoende upprepningar av försöket (Stora talens lag).

Gav exemplen X='resultat av ett tärningskast', X='kvadraten på ett tärningskast' samt X är Poissonfördelad Po(μ).

Angav också kopplingen till det aritmetiska medelvärdet som behandlades i avsnitt 10.3.

Beskrev hur man kan få E(g(X)) och införde dessutom (lite hafsigt på slutet) begreppet varians V(X)=E((X-E(X))2) som är ett spridningsmått.

Ungefärligt föreläsningsinnehåll. (Alternativ 1).

Ungefärligt föreläsningsinnehåll (Alternativ 2).

2013-03-20 Andra föreläsningen. (Vikarie Gunnar Englund).

Första föreläsningen presenterades lite om kombinatorik och vi redde ut de tre intressanta fallen med hjälp av multiplikationsprincipen. Alltså dragning med återläggning med hänsyn till ordning, dragning utan återläggning med och utan hänsyn till ordning. Använde detta för att härleda sannolikheten att få k vita kulor då man ur en urna med v vita och s svarta kulor drar n kulor med respektive utan återläggning. Detta har kopplingar till Binomialfördelningen och Hypergeometriska fördelningen som presenteras i kapitel 3 och 7. Dragning utan återläggning illustrerades med test av astrologer som vi kommer att återvända till i kapitel 13 om hypotesprövning. Vad gäller dragning med återläggning illustrerades detta med antal 6:or i 20 tärningskast samt med andel i urvalet om man väljer 1000 st på måfå ur en (oändligt) stor valmanskår och ett parti har 4% i väljarkåren.

Begreppet betingad sannolikhet samt oberoende. Lagen om total sannolikhet samt Bayes sats (som kan användas för att vända på betingning).

En illustration var analysen av ett diagnostiskt test enligt en artikel om Bayes sats och positiva resultat i mammografi från en artikel i Scientific American January 2012. Texten finns också här.

Se gärna godiset : Monty Halls problem (bilen och getterna) och Persi Diaconis videoföredrag från Princeton On coincidences. Här en nyhetsartikel om ett föredrag av Persi Diaconis om slantsingling.

Ungefärligt föreläsningsinnehåll. (Alternativ 1).

Ungefärligt föreläsningsinnehåll (Alternativ 2).

2013-03-19 Första föreläsningen. (Vikarie Gunnar Englund).

Grundläggande terminologi. Slumpförsök, utfall, utfallsrum och händelse med exempel på diskreta utfallsrum.

Tolkning av mängder som händelser och mängdlärans operationer: komplement, union och snitt. De Morgans lagar. Omöjliga och oförenliga händelser.

Tolkning av sannolikhetsbegreppet. Relativa frekvensers stabilitet. Kolmogorovs axiomsystem och några satser som följer ur detta.

Klassisk sannolikhetsdefinition som är tillämplig då elementarutfallen kan anses vara lika sannolika. Lite om kombinatorik, dvs svaret på frågan "På hur många sätt kan man...." samt begreppen "Med/Utan återläggning" samt "Med/Utan hänsyn till ordning".

Redde ut de tre intressanta fallen med hjälp av multiplikationsprincipen. Alltså dragning med återläggning med hänsyn till ordning, dragning utan återläggning med och utan hänsyn till ordning. Beviset av det återstående fallet, dragning med återläggning utan ordningshänsyn, ingår inte i kursen.

Ungefärligt föreläsningsinnehåll (Alternativ 1).

Ungefärligt föreläsningsinnehåll (Alternativ 2).

[Kurshemsidan]     [Kursförteckning]     [Avdelningen Matematisk statistik]