prøveudtagning fra normalfordelingen ved hjælp af kassen-Muller Transform
privatliv& Cookies
denne side bruger cookies. Ved at fortsætte accepterer du deres brug. Lær mere, herunder hvordan du styrer cookies.
normalfordelingen er arbejdshesten for mange almindelige statistiske analyser, og at kunne tegne prøver fra denne distribution ligger i hjertet af mange statistiske/maskinlæringsalgoritmer. Der har været en række metoder udviklet til at prøve fra normalfordelingen inklusive omvendt Transformationsprøvetagning, det Sikgurat algoritme, og forholdet metode (en afvisningsprøvetagning teknik). I dette indlæg vil vi fokusere på en elegant metode kaldet boksen-Muller transform.
en hurtig gennemgang af kartesiske og polære koordinater.
før vi kan tale om at bruge boksen-Muller transform, lad os opdatere vores forståelse af forholdet mellem kartesiske og polære koordinater. Du kan huske fra geometri, at hvis H og y er to punkter i det kartesiske plan, kan de repræsenteres i polære koordinater med en radius og en vinkel
ved hjælp af følgende forhold:
, og derfor
Bemærk, at hvis og
, så kortlægger vi værdier indeholdt i enhedscirklen som vist i nedenstående figur. Bemærk også, at tilfældige variabler i en sådan cirkel kan genereres ved at transformere værdier, der er samplet fra den ensartede fordeling. Specifikt kan radier samples fra
og vinkel kan samples fra
. En lignende mekanisme (dvs. tegnepunkter i en cirkel ved hjælp af ensartede variabler) er kernen i boks-Muller-transformationen til prøveudtagning af normale tilfældige variabler.

eksempel på forholdet mellem kartesiske og polære koordinater
tegning af normalt distribuerede prøver med boksen-Muller transform
Ok, nu hvor vi har diskuteret, hvordan kartesiske koordinater er repræsenteret i polære koordinater, lad os gå videre til, hvordan vi kan bruge dette forhold til at generere tilfældige variabler. Boks-Muller-prøveudtagning er baseret på at repræsentere den fælles fordeling af to uafhængige standard normale tilfældige kartesiske variabler og
i polære koordinater. Den fælles fordeling (som er cirkulær-symmetrisk) er:
hvis vi bemærker, at termen i tælleren for eksponenten er lig med
(som ovenfor) kan vi gøre forbindelsen mellem den kartesiske repræsentation af den fælles normalfordeling og dens polære repræsentation:
hvilket er produktet af to tæthedsfunktioner, en eksponentiel fordeling over kvadrerede radier:
og en ensartet fordeling over vinkler:
ligesom dem, der er nævnt ovenfor, når der genereres punkter på enhedscirklen. Nu, hvis vi laver en anden forbindelse mellem den eksponentielle fordeling og den ensartede fordeling, nemlig at:
så
dette giver os en måde at generere punkter fra den fælles gaussiske fordeling ved at prøve fra to uafhængige ensartede distributioner, en for og en anden for
og omdanne dem til kartesiske koordinater via ovenstående forhold. I detaljer går proceduren som følger:
- tegne,
- Transformer variablerne til radius-og vinkelrepræsentation
og
- Transformer radius og vinkel til kartesiske koordinater:
hvilke resultater er to uafhængige normale tilfældige variabler, og
. En MATLAB-implementering af boks-Muller-algoritmen er vist nedenfor:
% NORMAL SAMPLES USING BOX-MUELLER METHOD% DRAW SAMPLES FROM PROPOSAL DISTRIBUTIONu = rand(2,100000);r = sqrt(-2*log(u(1,:)));theta = 2*pi*u(2,:);x = r.*cos(theta);y = r.*sin(theta);% DISPLAY BOX-MULLER SAMPLESfigure% X SAMPLESsubplot(121);hist(x,100);colormap hot;axis squaretitle(sprintf('Box-Muller Samples Y\n Mean = %1.2f\n Variance = %1.2f\n Kurtosis = %1.2f',mean(x),var(x),3-kurtosis(x)))xlim()% Y SAMPLESsubplot(122);hist(y,100);colormap hot;axis squaretitle(sprintf('Box-Muller Samples X\n Mean = %1.2f\n Variance = %1.2f\n Kurtosis = %1.2f',mean(y),var(y),3-kurtosis(y)))xlim()

boks-Muller prøver til normalfordeling
indpakning
udgangen af MATLAB-koden er vist ovenfor. Bemærk det første, andet og fjerde centrale øjeblik (middelværdi, varians og kurtose) af de genererede prøver er i overensstemmelse med standard normal. Boks-Muller-transformationen er et andet eksempel på, hvordan ensartede variabler på intervallet (0,1) og kan transformeres for at prøve fra en mere kompliceret fordeling.
Write a Reply or Comment