|
|
Aktuell information
Angående tentan 9/1–13 Observera att denna tenta är en omtentamen för dem som läste sf1901 i period ett för Tatjana Pavlenko. Jag har alltså ingenting med denna tenta att göra, så jag svarar inte på några frågor angående den. Det är dock tillåtet även för er att tentera den, om ni fick plats, och betyget kommer att föras in i LADOK. Ni som fått FX på tentan 12/12–12 Komplettering klockan 17:15–18:30 den 15:e januari i sal E51. Tentan är rättad Det gick väldigt bra! Av de som var anmälda var statistiken så här: A B C D E Fx-F Samhällsbyggnad 16 19 20 14 18 32 Ind. Ekonomi 23 18 17 15 10 15 Ett test för homogenitet mellan programmen ger p-värdet 0.23, så det finns inget som tyder på någon skillnad mellan programmen. Kurssekreteraren för in resultaten i LADOK idag, Tentorna finns på studentexpeditionen, men den öppnar inte förrän den 14:e. Kommentarer till er som använder miniräknare med statistiska funktioner: Uppgift 2: Ni behöver naturligtvis inte göra någon Poisson-approximation, utan räknar med binom-proceduren direkt. Uppgift 3: Om ni använder homogenitetstestet, så använder ni bara χ2-testet på miniräknaren. Om ni i stället gör ett konfidensintervall för skillnad i sannolikheter i binomialfördelningar, så använder ni 2-PropZint... . Uppgift 4: Observationer i par. Eftersom vi vill visa att järnhalten höjs vill vi visa att m är väsentligen större än noll, d.v.s vi väljer mothypotesen m > 25. I b-uppgiften är det naturligt att göra ett ensidigt konfdensintervall för m, av typen nå’t < m. På miniräknaren gör vi ett dubbelsidigt konfidensintervall med felrisken 10% och utelämnar den högra olikheten: TInterval ger 26.585 < m. Vi kan alltså dra slutsatsen (med felrisk 5%) att m > 25, d.v.s att medicineringen väsentligen höjer järnhalten. Uppgift 6: När vi beräknat Q=20.3 behöver vi inte använda tabeller, vi beräknar χ2cdf(20.3, E99, 3) = 0.000147 som är (mycket) mindre än 0.05. Alltså accepterar vi påståendet att modellen inte är förenlig med mätningarna. Salarna vid tentan 12/12 8:00–13:00 Kursnumret är sf1901. Onsdag 5/12 Jag tog först upp ett exempel på hypotestest av lika Poisson-intensiteter. Därefter χ2-test. Homogenitetstest (kontingenstabell) Jag tog upp exemplet i den här artikeln av bl.a. Simon Baron-Cohen (ledande forskare om autism.) Jag visade både alla formler och hur man lätt får beräkningarna utförda med miniräknaren. Om jag hade haft litet med tid hade jag visat att skillnaden mellan pojkar och flickor är att pojkarna är mer intresserade av mobilen än flickor. Vi kan se det genom ett separat hypotestest med konfidensmetoden (H0: samma sannolikhet för pojke resp. flicka att vara intresserad av mobilen, H1: sannolikheterna är olika.) 2–PropZInt, x1:19, n1:44, x2:10, N2:58 C-level 0.99 ger ett konfidens-interval som bara innehåller positiva tal. Vi accepterar alltså H1 (felrisk mindre än 1%) och dessutom att pojkar är mer intresserade än flickor av mobilen. De övriga sannolikheterna är inte signifikant olika på nivån 5%. Vi löste också uppgift 13.35, dels med homogenitetstest, dels genom att testa om sannolikheten för ”lätta eller inga skador” är densamma om man har säkerhetsbälte som när man kör utan bälte. 2–PropZInt, x1:101, n1:159, x2:143, N2:341, C-level 0.9999 ger ett konfidens-interval som bara innehåller positiva tal. Vi accepterar alltså H1: ”sannolikheterna är olika” (felrisk mindre än 1 på 10'000). Sannolikheten är alltså större att få lätta eller inga skador om man använder bältet. Test av fördelning Jag illustrerade detta genom att lösa uppgift 13.32. Observera! H0 är att data kommer fråm en ffg(1)-fördelning, H1 är de inte gör det. Det är under förutsättning att H0 är sann som Q-värdet (summan av kvadrater) är en observation av en χ2-variabel. Vi förkastar H0, d.v.s. vi accepterar H1, om Q är stort vilket är detsamma som att p-värdet χ2(Q, E99, df) är litet. Jag hann aldrig säga något om linjär regression, ni får nöja er med att göra övning 14.4 vid ett övningstillfälle. På begäran kommer här en lösning på uppgift 13.6 1) Nej. Det skulle kunna vara så att alla som kör bil i det här landet har en alkoholhalt strax över 0.5 promille. Alla är alltså skyldiga. Men många kommer att bli frikända, på grund av slumpen och säkerhetsmarginalen. Alltså är alla frikända skyldiga, i detta fall. 2) Ja. ”Felrisken” är sannolikheten att acceptera alternativhypotesen när den är falsk, dvs. sannolikheten att döma en person som är oskyldig. 3) Nej. Det skulle kunna vara så att alla som kör bil i det här landet har en alkoholhalt strax över 0.5 promille. Alla är alltså skyldiga, men bara nätt och jämnt. Sannolikheten att fälla en sådan är bara strax under 1%, så nästan 99% av de skyldiga blir frikända. 4) Nej. Det skulle kunna vara så att ingen kör med mer än 0.5 promille alkohol i blodet. Alla är allstå oskyldiga. Likväl kommer några att ha oturen att bli dömda. Alltså: samtliga dömda är oskyldiga i detta fall! Måndag 3/12 Jag talade om hypotesprövning generellt. Speciellt påminnde jag om att ”p-värdet” är sannolikheten att acceptera (mot-)hypotesen H1 när H1 är falsk. Det betyder alltså inte ”sannolikheten att (mot-)hypotesen H1 är falsk när vi har accepterat den” Vi löste uppgift 13.5. Därefter betraktade vi testet av en tärning som kastades 200 gånger. H: P(sexa) = 1/6 H1: P(sexa) < 1/6, >1/6, ≠ 1/6 med ”första principer”. Därefter visade jag hur man kan lösa detta problem med ”konfidensmetoden” (se kap. 13.5). Jag rekommenderar er att använda ”konfidensmetoden” då hypotesprövningen handlar om värdet av en parameter (eller skillnad av parametrar, etc.). På onsdag – sista föreläsningen – skall vi ta upp χ2-tester. Onsdag 28/11 Jag avslutade kapitel 12, intervallskattning. Jag tog upp de tre olika fallen med skillnad av väntevärden för två normalfördelningar (se måndagen 26/11), där vi tittade på ett numeriskt exempel. Därefter skillnad i p för Bin(n, p1) och Bin(m, p2) och skillnad i intensitet för Po(μ1) och Po(μ2). (Det hade varit naturligare att skatta kvoten μ2 / μ1, men det görs inte i boken. Men här finns ett ”godis” om detta.) Slutligen pratade jag litet om hypotesprövning, och vi tittade på övning 13.22. Omfattning av kapitel 11 och 13 Vi läser inte kapitlen 11.10, 11.11, och inte heller Wilcoxons rangsumme-test i kapitel 13.9 (men ”teckentestet” tar vi med!) Måndag 26/11 Jag fortsatte med kapitel 12, intervallskattning. Jag tog upp skattning av
I alla tre fallen tog jag upp både formlerna och rutinerna på miniräknaren. Jag visade hur man gör enkelsidiga intervall på miniräknaren (gör ett dubbelsidigt med dubbla felrisken, och stryk den irrelevanta olikheten). Därefter tog jag ett mer generellt exempel, uppgift 12.6, men följde inte den dumma ledningen! (Man skall inte göra som den föreslår!) Slutligen tog jag upp skattning av skillnad mellan väntevärden
μ1 – μ2 av
I det sista fallet gör vi inte som i boken, utan vi använder t-fördelningen – det ger en bättre approximation och blir mer konsistent: Normal-fördelning (ZIinterval) då σ är kända, t-fördelning (TInterval) då σ är okända. Jag hann bara gå igenom hur rutinerna ser ut på miniräknaren; formler och exempel tar vi upp på onsdag. Listan med resultatet på KS-en finns nu på studentexpeditionen. Onsdag 21/11 Jag pratade först litet om MK-metoden. Jag rekommenderade er att läsa exempel 11.19 på sidan 261. Observera att om man har lika många μ:n som θ:n, så är MK-metoden detsamma som (den mycket enklare) momentmetoden. Därefter började vi på kapitel 12, intervallskattning. Vi började med ett stickprov av en N(μ, σ)-fördelning där σ är känt. Jag härledde intervallet givet av första formeln i sats 12.1 och visade hur man får det på miniräknaren (”ZInterval”). Därefter tog jag upp (approximativa) konfidensintervallet för en Poissonintensitet. Den formeln finns överst på sidan 312. På miniräknaren kan vi använda ZInterval med σ = kvadratroten ur stickprovets medelvärde. Vi tog också några numeriska exempel, bl.a. uppgift 12.9 och 12.36. Måndag 19/11 Jag gjorde ytterligare en del punktskattningar med ”momentmetoden” (d.v.s. MK-metoden enligt metoden som beskrivs i boken på sidan 259 under definition 11.8): 11.12, 11.25. 11.24. Därefter gick jag igenom begreppen Mean Squared Error, konsistent skattning, väntevärdesriktig skattning och medelfel och illustrerade med exempel på binomialfördelningen. (Jag antydde att begreppet medelfel används i samband med intervallskattning, som kommer i nästa kapitel.) Slutligen tog jag upp ML-skattning och illustrerade med två exempel: 11.12 (diskret fördelning) och 11.13 (kontinuerlig fördelning). Vi noterade att i bägge dessa fall blev ML-skattningen densamma som momentskattningen. Onsdag 14/11 Första timmen gick jag igenom approximationssatserna i kapitel 7 (approx. Poisson med normalal, approx. Binomial med normal eller Poisson.) Därmed är vi klara med sannolikhetsteorin. Andra timmen började jag med kapitel 11.4 – punktskattning av väntevärde och varians. Jag löste ett antal problem med ”momentmetoden” d.v.s. att skatta väntevärdet för en fördelning, och därur lösa ut den efterfrågade okända parametern: 11.10 (ger samma svar som ML-skattningan), 11.14 (ger inte samma svar som ML-skattningen) och 11.18 (ger samma svar som MK-skattningen. Detta gäller generellt!) I den denna uppgift skattar vi två moment, vilket går bra, eftersom vi har precis två obekanta parametrar. På övningarna kommer ni att lösa dessa uppgifter med ML- och MK-skattningar. Måndag 12/11 Jag gick igenom hela (relevanta delarna) av kapitel 6, normalfördelningen. Jag visade både hur man använder miniräknaren och tabellen, men lade huvudvikten vid miniräknaren. Jag löste uppgifterna 6.20 (CGS), 6.24 (CGS) och 6.19c. I 6.19c använde jag ”solver”: 0 = normalcdf(0.64, 0.,66, 0.65, 0.02/√(N)) – 0.99 och löser för N (man kan starta med N=1). Onsdag 7/11 Jag gick igenom relevanta delar av resten av kapitel 5, d.v.s. kovarians, varians, standardavvikelse och korrelationskoefficient. Kovariansen är bilinjär, och additiva konstanter ger inga bidrag. Denna räkneregel överförs till varianser genom att V(X) = C(X, X). Jag tog inte upp ”variationskoefficient”. Senare kommer jag att ta upp mer i detalj varians för en summa av oberoende s.v. och varians och standardavvikelse för medelvärdet av ett antal oberoende och likafördelade s.v., d.v.s. följdsatserna 5.11.2 och 5.11.3. Vi tar det senare i samband med statistiken – det blir väl mycket formler just nu annars. Jag tog inte heller upp ” stora talens lag”. Jag planerar att göra det vid något senare tillfälle. I kapilet 5.7 ingår bara sats 5.15, som jag gjorde ett exempel på. Jag löste också problemen 5.16, 5.28 och 5.29. KS-en Omfattningen är kapitel 1–5. Ni får ha miniräknare och den tillåtna lathunden till denna (se websidan), men ingen formelsamling. Här är salarna. I-are som medverkar i Armada Måndag 5/11 Jag definierade först begreppet ”oberoende s.v.”, därefter gick jag igenom ”största och minsta värde ” och löste upgift 4.16. Därefter började jag på kapitel 5, väntevärden. Jag försökte ge en intuitiv förståelse för begreppet genom ett enkelt exempel. Därefter definierade jag väntevärdet för diskret och kontinuerlig s.v. Jag tog några exempel, bl.a. Poisson (utan fullständig kalkyl) och exponential (med kalkyl). Jag beskrev sedan räkneregeln Sats 5.3, och utnyttjade den för att bestämma väntevärdet för en Bin(n,p)-variabel (se formel 7.2). Jag beskrev sedan hur man beräknar väntevärdet av en funktion av en s.v. och löste bl.a. uppgift 5.8. Sedan införde jag begreppet kovarians. (Jag tar det före ”varians” eftersom det blir enklare med räknereglerna på det sättet.) Jag hann bara definiera begreppet, försöka ge en viss intuittion för det, och bevisa att kovariansen för oberoende s.v är noll.
Onsdag 31/10 Jag pratade mer om kontinuerliga stokastiska variabler. Normalfördelning och likformig fördelning. Jag visade hur man använder miniräknaren för normalfördelningar, och även litet om tabellen. Detsamma om kvantiler. Jag definierade ”fördelningsfunktion” och visade med ett exempel hur man använder dessa då man bestämmer tätheten för en funktion av en kontinuerlig stokastisk variabel. Slutligen visade jag ett exempel på ”Lagen om Total Sannolikhet” (LOTS) i samband med diskreta variabler (mer om detta nedan). Därefter ett liknande exempel med kontinuerliga stokastiska variabler. Detta som ett alternativ till att räkna med dubbelintegraler då man har tvådimensionella kontinuerliga stokastiska variabler. Det uppstor en del förvirring i exemplet på LOTS med disktera s.v. Vi tyckte att man borde summera från noll – inte från ett – men miniräknaren rapporterade syntaxfel när vi summerade från noll. Det måste vara rätt att summera från noll, så vi får lägga till den termen separat. Den termen är sannolikheten att vi får tio klave på tio försök, så vi skall alltså addera 1/1024 till summan vi fick då vi summerade från ett. Följande personer har inte gjort kursval Ni måste kontakta er studievägledare om detta omedelbart! Lorena Sillav Vidal Marcus Palm Ida Sylvan Anton Janér Thomas Lewis Åkerman Noel Mattar Anmäl er till KS:en via "Mina Sidor" senast 4/11, men helst meddetsamma! (Jag skrev tidigare datumet 6/11, men det har av någon anledning ändrats.) Om ni inte kan göra det via "Mina Sidor" så maila Irene Hanke (se nedan), Men bara om ni av någon anledning inte kan göra det via "Mina Sidor". Strul med anmälningar Jag vet inte vad som händer när man mailar till Anne Riddarström. Jag testade och fick ett irrelevent autosvar. Nu är det mer problem – Anne är den här veckan inte på institutionen. Jag beklagar att institutionen klantar till saker på det här sättet! Gör så här Om ni inte är anmälda (bör synas på "Mina Sidor") så maila Irene Hanke ireneh@math.kth.se och säg då också att ni anmäler er till KS:en Måndag 29/10/2011 Jag började med att definiera kontinuerlig s.v. genom täthetsfunktion. Tog ett enkelt exempel och räknade ut en sannolikhet P(2≤X≤3). Därefter exponentialfördelningen. Jag visade ”minneslösheten” (Anm. 3.2) och jämförde med FFG-fördelningen. Jag berättade också att om tisdmellanrummen mellan händelser är oberoende och exp(λ) så är antalet inträffade händelser under ett tidsintervall av längd t Po(λt) (se anm. 7.4). Jag använde denna egenskap för att lösa en variant av uppgift 3.22: (kallad 3.22c). Vi antog att vi använder en transistor i taget, och så snart en gått sönder så ersätter vi den med en ny. Uppgiften är nu att beräkna sannolikheten att dessa fem transistorer tillsammans håller i mer än 30'000 timmar. Om Y∈Po(3) så blir sannolikheten P(Y≤4)=0.8153. Jag påpekade (igen) satsen att summan av Poisson är Poisson, och löste uppgift 7.24. Jag löste också uppgift 7.25 och visade hur man lätt får en lista av sannolikheter P(X=k), k=1,2,... . Fredag 26/10/2011 Jag gick igenom diskreta s.v. i kapitel 3 och delar av kapitel 7. Jag tog upp Bernoulli, Binomial, Poisson, Hypergeometrisk och FFG. Jag påpekade att FFG heter ”geomet...” på miniräknaren (TI 82 Stats). Löste problem 7.7, 7.27 och 7.16 m.h.a. miniräknaren. Problem med anmälning, kursregistrering o.s.v. Har ni det får ni vända er till kurssekreteraren Anne Riddarström. Skicka inte e-mail till mig om sådant! Binomialkoefficienter på miniräknaren På miräknaren finns binomialkoefficienterna nCr = ”dra r kulor av n stycken UÅ+UHTO”, och nPr = ”dra r kulor av n stycken UÅ+MHTO”. (MATH – PRB). Onsdag 24/10 Jag har nu gått igenom hela kapitel 2. Bl.a. löste jag uppgift 2.40. Jag gjorde också problem 2a i tentan 7/6/2012. Måndag 22/10 Jag gick igenom det väsentliga i kapitel 2.1–2.5.
|
![]() |
|
Sidansvarig: Harald Lang |