Sannolikhetsteori

Grunderna i sannolikhetslära

Här sammanfattas grunderna i sannolikhetsteorin. Dessutom visas kopplingen till mängdlära och till det systemteoretiska ramverket RARE-C-I/C-SIZE som bloggen bygger på.

Sidan är under konstruktion och inte färdigt redigerad.

Utfallsrum. Ett slumpförsök beskrivs av ett utfallsrum Ω, som innehåller alla möjliga utfall.
Händelser. En händelse är en delmängd av utfallsrummet. Händelser kan vara enkla (ett utfall) eller sammansatta (flera utfall).
Sannolikhet. En sannolikhet är ett tal mellan 0 och 1 som anger hur sannolik en händelse är. P(A) = 0 betyder omöjlig, P(A) = 1 betyder säker.
Normalisering. Sannolikheten för hela utfallsrummet är alltid 1: P(Ω) = 1.
Additionsregeln. För två oförenliga händelser gäller: P(A ∪ B) = P(A) + P(B).
Komplement. Sannolikheten att en händelse inte inträffar är: P(Ac) = 1 − P(A).
Betingad sannolikhet. Sannolikheten för att händelsen A inträffar givet att B inträffat skrivs: P(A∣B) = P(A ∩ B) / P(B).
Oberoende händelser Två händelser är oberoende om: P(A ∩ B) = P(A)*P(B). Då påverkar de inte varandras sannolikhet.
Multiplikationsregeln. För godtyckliga händelser gäller: P(A ∩ B)=P(A)*P(B ∣ A).
Slumpvariabler och fördelningar
En slumpvariabel översätter utfall till tal. Dess fördelning beskriver hur sannolik varje möjlig nivå är, och sammanfattas ofta med mått som väntevärde och varians.

Detta är de minimala byggstenarna. Allt mer avancerat – tillämpningar inom statistik, inferens, maskininlärning, spelanalys – är i grunden förfiningar och tillämpningar av dessa tio punkter.

Bayes sats

Utöver de tio punkterna är det även värt att känna till Bayes sats. Den anger hur en uppfattning av en rationell bedömare bör uppdateras i ljuset av ny information.

För två händelser A och B med P(B) > 0 gäller P(A∣B) = P(B∣A)* P(A) / P(B).

P(A) = prior. Vad bedömaren tror om A innan denne tagit del av någon ny information.
P(B∣A) = likelihood. Hur sannolik observationen B är om A är sann.
P(B)= evidens. Hur vanlig observationen B är totalt sett.
P(A∣B)P= posterior. Vad du bör tro om A efter att ha observerat B.

Innebörden av detta är att ny kunskap inte ersätter den gamla – den viktar om den.

I tillämpningar kan man alltså skilja mellan orsaker och observationer, vilket och gör att man kan undvika ett mycket vanligt tankefel, att glömma hur vanligt något är (s.k. base-rate neglect). Bayes sats är en viktig grund för statistisk inferens, diagnostik (medicin, juridik, riskbedömning), maskininlärning (Bayesianska modeller) och rationellt beslutsfattande under osäkerhet.

Kolmogorovs axiom

Hela den klassiska sannolikhetsteorin kan härledas ut bara tre axiom: att sannolikheter inte kan vara negativa, att något i utfallsrummet alltid inträffar och att sannolikheterna för parvis oförenliga händelser kan summeras även för oändliga serier. Allt annat är konsekvenser av dessa tre axiom, som formulerades av Andrej Kolmogorov 1933. De avgränsar vad sannolikhet är (inte intuition, inte frekvens – utan ett mått), de gör sannolikhetsläran matematiskt rigorös och de möjliggör koppling till måttteori, integration, stokastiska processer, m.m.

Mängdlära → sannolikhetslära

1. Utfallsrum = mängd

I mängdlära:

En mängd är en samling väldefinierade element.

I sannolikhetslära:

Utfallsrummet $Ω$ Ω är en mängd av alla möjliga utfall.

$Ω = {ω_{1}, ω_{2}, \dots}$ Ω={ω1,ω2,…}

Varje utfall $ω$ ω är ett element.

2. Händelser = delmängder

En händelse $A$ A är en delmängd av $Ω$ Ω:

$A \subseteq Ω$ A⊆Ω

Mängdlärans operationer blir sannolikhetslära:

Union $A \cup B$ A∪B → “A eller B”
Snitt $A \cap B$ A∩B → “A och B”
Komplement $A^{c}$ Ac → “inte A”
Tom mängd $\emptyset$ ∅ → omöjlig händelse

3. σ-algebra = tillåtna händelser

Alla delmängder får inte automatiskt sannolikhet (i kontinuerliga fall).

Därför införs en struktur:

$F \subseteq P (Ω)$ F⊆P(Ω)
FF är en σ-algebra:
- innehåller $Ω$ Ω
- sluten under komplement
- sluten under räknebara unioner

4. Sannolikhet = mått på mängder

Kolmogorovs genidrag:

Sannolikhet är ett mått på en mängd.

$P : F \to [0, 1]$ P:F→[0,1]

Precis som längd, area eller volym – men normaliserat till 1.

Kolmogorovs axiom i mängdläretermer

Icke-negativitet $P (A) \geq 0$ P(A)≥0 för alla A∈F
Normalisering $P (Ω) = 1$ P(Ω)=1
σ-additivitet
För parvis disjunkta mängder: $P ⁣ (⋃_{i = 1}^{\infty} A_{i}) = \sum_{i = 1}^{\infty} P (A_{i})$ P(i=1⋃∞Ai)=i=1∑∞P(Ai)

Detta är exakt måttteori på en σ-algebra.

Vad detta betyder konceptuellt

Mängdlära ger språket
σ-algebran ger tillåtna frågor
Sannolikhetsmåttet ger kvantifiering av osäkerhet
All vidare sannolikhetslära är härledd struktur

Sammanfattning

Sannolikhetslära är mängdlära + ett mått med särskilda egenskaper. Kolmogorovs axiom säger inte hur världen fungerar, utan hur man konsekvent räknar på osäkerhet.

Grundläggande och formella referenser

Grundbegriffe der Wahrscheinlichkeitsrechnung – Andrej Kolmogorov
Ursprungsverket.
Introducerar axiomen som gör sannolikhet till ett mått på en σ-algebra. All modern sannolikhetslära bygger på detta.
Probability: Theory and Examples – Rick Durrett
Standardverk för matematisk sannolikhetslära. Visar hur axiomen används i praktiken.

Klassiska läroböcker

A First Course in Probability – Sheldon Ross
Mycket tydlig introduktion. Bra brygga mellan intuition och formalism.
An Introduction to Probability Theory and Its Applications – William Feller
Klassikern. Bygger intuition utan att bli slapp. Historiskt viktig.

Bayes, inferens och epistemologi

Probability Theory: The Logic of Science – E T Jaynes
Bayesiansk sannolikhet som rationell inferens. Filosofiskt klar och stringent.
Bayesian Data Analysis – Andrew Gelman
Modern standard för Bayesiansk statistik. Mindre axiom, mer tillämpning.

Relationen till statistik och vetenskap

The Theory of Probability – Harold Jeffreys
Tidig systematisk Bayesiansk teori. Viktig för förståelsen av priorer.
Bruno de Finetti (artiklar, bl.a. Theory of Probability)
Subjektiv sannolikhet, koherens och bettingargument. Kontrast till Kolmogorov.

Koppling till RARE-C-I och C-SIZE

1. Grundantagande (gemensam botten)

Sannolikhetslära enligt Kolmogorov säger:

Osäkerhet kan representeras konsekvent som ett mått på mängder av möjliga tillstånd.

RARE-C-I och C-SIZE förutsätter exakt detta:

verksamheten befinner sig i ett tillstånd bland flera möjliga
styrning sker genom urval under osäkerhet
information reducerar osäkerhet, aldrig eliminerar den

Detta är den gemensamma epistemiska basen.

2. Utfallsrum = möjliga systemtillstånd

I sannolikhetslära: $Ω = {ω_{1}, ω_{2}, \dots}$ Ω={ω1,ω2,…}

I RARE-C-I: $Ω = {m \ddot{o} jliga kombinationer av (R_{1}, A, R_{2}, E)}$ Ω={möjliga kombinationer av (R1,A,R2,E)}

Varje “läge” i verksamheten är ett element i utfallsrummet.
Planering och styrning handlar om att förflytta sannolikhetsmassa mellan dessa tillstånd.

3. Händelser = meningsfulla aggregeringar

En händelse $A \subseteq Ω$ A⊆Ω motsvarar t.ex.:

“Måluppfyllelse över tröskel”
“Kritisk resursbrist”
“Acceptabel effekt givet budget”

RARE-C-I anger vilka delmängder som är relevanta att definiera som händelser.

4. I(RARE) = sannolikhetsfördelning

I(RARE) är inte “mer data” utan:

information som ändrar sannolikhetsfördelningen över ΩΩ

Detta är direkt kompatibelt med:

Kolmogorovs mått
Bayesiansk uppdatering

5. C-SIZE som sannolikhetsmaskin

C_sen (Sensor)

Observerar $B$ B: data, signaler, indikatorer
Producerar observationer med osäkerhet

C_int (Integrator)

Håller modellen $M$ M
Beräknar:

$P (Ω ∣ I)$ P(Ω∣I)

Detta är Bayesiansk uppdatering i praktiken.

C_zel (Selector)

Väljer åtgärd $A$ A som maximerar förväntad effekt:

$\arg \max_{A} E [E ∣ A, I]$ argAmaxE[E∣A,I]

C_exe (Exekutor)

Realiserar åtgärden → nytt tillstånd i $Ω$ Ω

C-SIZE är en operationaliserad Bayes-loop.

6. RARE-kedjor = stokastiska övergångar

Övergången: $(R_{1}, A) \to R_{2} \to E$ (R1,A)→R2→E

är inte deterministisk.

Den beskrivs bättre som: $P (R_{2}, E ∣ R_{1}, A)$ P(R2,E∣R1,A)

RARE-C-I erkänner därmed implicit:

slumpvariation
exogena störningar (Od)
modellfel

7. Kontroll = sannolikhetsstyrning

C påverkar inte E direkt, utan:

resurstilldelning
aktivitetsval
informationsflöden

Detta ändrar fördelningen över möjliga effekter, inte utfallet i sig.

Detta är exakt Kolmogorovs syn: styrning kan aldrig vara säker, bara koherent.

8. Entropi och variety (bindande länk)

Här möts sannolikhetslära och systemteori:

Entropi $H (Ω)$ H(Ω) mäter osäkerhet i tillståndsfördelningen
Styrning syftar till att minska relevant osäkerhet
Men enligt W. Ross Ashby krävs tillräcklig variety i C

Formellt:

för låg informationsupplösning → ineffektiv C_int
för låg handlingsvariety → ineffektiv C_zel

9. Vad RARE-C-I tillför sannolikhetsläran

Kolmogorov/Bayes är formella, men innehållslösa.

RARE-C-I:

specificerar vilka variabler som är meningsfulla
strukturerar $Ω$ Ω
definierar vad som är relevant information

Det är en ontologisk ram ovanpå en epistemisk teori.

10. Sammanfattande sats

RARE-C-I och C-SIZE förutsätter sannolikhetsteori i Kolmogorovs mening. Systemets tillstånd utgör ett utfallsrum, information ändrar sannolikhetsfördelningar över detta rum, och styrning består i att – via C-funktionerna – selektivt påverka dessa fördelningar. Bayesiansk uppdatering är därmed inte ett tillval utan en implicit del av modellens funktionslogik.

Formell ekvation

Låt systemets tillstånd vid tid $t$ t vara $X_{t} : = (R_{1, t}, A_{t}, R_{2, t}, E_{t}, O_{t})$ Xt:=(R1,t,At,R2,t,Et,Ot)

där $O_{t}$ Ot fångar omgivning/exogena faktorer (inkl. $O_{d}$ Od).

Låt sensorn ge en observation $Y_{t}$ Yt (indikatorer, mätvärden, signaler).

(1) Sensor + Integrator: Bayesiansk tillståndsuppdatering

$π_{t} (x) : = P (X_{t} = x ∣ y_{1 : t})$ πt(x):=P(Xt=x∣y1:t) $π_{t} (x) \propto P (y_{t} ∣ x) \sum_{x^{'}} P (x ∣ x^{'}, u_{t - 1}) π_{t - 1} (x^{'})$ πt(x)∝P(yt∣x)x′∑P(x∣x′,ut−1)πt−1(x′)

$P (y_{t} ∣ x)$ P(yt∣x): observationsmodell (C_sen → C_int)
$P (x ∣ x^{'}, u_{t - 1})$ P(x∣x′,ut−1): övergångsmodell (RARE-kedjans stokastik + exogent)
$u_{t - 1}$ ut−1: vald styrsignal/åtgärd (C_zel → C_exe)
$π_{t}$ πt: integratorns posterior över möjliga RARE-tillstånd

Detta är “I(RARE)→M→uppdaterad tro” i ett enda uttryck.

(2) Selector: val som maximerar förväntad nytta/effekt

Låt nyttan (värderingsfunktionen) vara $U (x, u)$ U(x,u) eller mer direkt “effekt” $E$ E i din mening. $u_{t} \in \arg \max_{u \in U} E_{X_{t} \sim π_{t}} ⁣ [U (X_{t}, u)]$ ut∈argu∈UmaxEXt∼πt[U(Xt,u)]

Vill du ha längre horisont (policy): $u_{t} \in \arg \max_{u} E ⁣ [\sum_{k = 0}^{\infty} γ^{k} U (X_{t + k}, u_{t + k}) ∣ π_{t}]$ ut∈argumaxE[k=0∑∞γkU(Xt+k,ut+k)πt]

( $γ$ γ = diskontering; kan sättas $= 1$ =1 för “ingen diskontering” om du vill hålla det neutralt.)

(3) Executor + RARE-dynamik: realiserad övergång

Efter exekvering realiseras nästa tillstånd enligt $X_{t + 1} \sim P (\cdot ∣ X_{t}, u_{t})$ Xt+1∼P(⋅∣Xt,ut)

och loopen fortsätter.

Minimal tolkning

$C_sen ger y_{t} \Rightarrow C_int uppdaterar P (X_{t} ∣ y_{1 : t}) \Rightarrow C_zel v \ddot{a} ljer u_{t} \Rightarrow C_exe ger X_{t + 1} .$ C_sen ger yt⇒C_int uppdaterar P(Xt∣y1:t)⇒C_zel v väljer ut⇒C_exe ger Xt+1.

Formell definition

Låt $Ω$ Ω vara en mängd (utfallsrum).
En σ-algebra $F$ F över $Ω$ Ω är en samling delmängder av $Ω$ Ω som uppfyller:

Hela rummet ingår

$Ω \in F$ Ω∈F

Slutenhet under komplement

$A \in F \Rightarrow A^{c} \in F$ A∈F⇒Ac∈F

Slutenhet under räknebara unioner

$A_{1}, A_{2}, \dots \in F \Rightarrow ⋃_{i = 1}^{\infty} A_{i} \in F$ A1,A2,⋯∈F⇒i=1⋃∞Ai∈F

(Därav σ = “räknebar”.)

Intuition

En σ-algebra är:

mängden av alla frågor om systemet som det är meningsfullt att sätta sannolikhet på.

Inte fler. Inte färre.

Sidan uppdaterad 2026-04-16