Jak pracovat s normálním rozdělením v MATLABu pomocí fitdist

Jak Pracovat S Normalnim Rozdelenim V Matlabu Pomoci Fitdist



Normální distribuce je statistická technika široce používaná v umělé inteligenci, datové vědě, strojovém učení a mnoha dalších oblastech. Jedná se o rozdělení pravděpodobnosti, které je symetrické v průměru a je také označováno jako Gaussovo rozdělení kvůli tvaru, který vytváří na grafu. Ukazuje, že hodnoty dat blízké průměru se vyskytují častěji než hodnoty dat vzdálené od průměru. Na grafu tvoří normální rozdělení zvonovou křivku.

Najít normální rozložení souboru dat není snadný úkol; můžeme to však provést v MATLABu pomocí fitdist() funkce. Přečtěte si tuto příručku, kde se dozvíte podrobnosti o práci s normální distribuce v MATLABu pomocí fitdist() funkce.

Co je normální distribuce

A normální distribuce také nazývané Gaussovo rozdělení je definováno pomocí dvou parametrů; průměr a standardní odchylka datových bodů. Průměr měří průměr hodnot dat, zatímco standardní odchylka měří, jak jsou hodnoty dat rozloženy kolem průměru. S kombinací střední a standardní odchylky můžeme počítat normální distribuce z následujícího vzorce:









Kde:



  • X představuje hodnoty datové sady.
  • f(x) představuje pravděpodobnostní funkci.
  • m označuje
  • p označuje směrodatnou odchylku.

Jak provést normální rozdělení v MATLABu pomocí funkce fitdist().

MATLAB nám umožňuje vypočítat normální distribuce náhodných proměnných pomocí vestavěného fitdist() funkce. Tato funkce vytváří a normální rozdělení pravděpodobnosti objektu přizpůsobením daného rozdělení na vstupní data. The normální distribuce akceptuje jako vstup dva parametry: směrodatnou odchylku i průměr. Standardní normální rozdělení má nulovou střední hodnotu a také jednotkovou směrodatnou odchylku, která je 1. To znamená, že normální distribuce je vycentrován na nulu a hodnoty rozdělení jsou rovnoměrně rozprostřeny na obě strany střední hodnoty.





Syntax

The fitdist() v MATLABu lze použít různými způsoby:



pd = fitdista ( X , distname )
pd = fitdista ( X , distname , název , Hodnota )
pdca , gn , gl ] = fitdista ( X , distname , 'Podle' , groupvar )

Tady:

  • Funkce pd = fitdist(x,distname) je zodpovědný za přizpůsobení distribuce poskytnuté distname datům obsaženým ve sloupcovém vektoru x za účelem vytvoření objektu rozdělení pravděpodobnosti.
  • Funkce pd = fitdist(x,distname,name,value) je zodpovědný za vytvoření objektu rozdělení pravděpodobnosti s jedním nebo více argumenty páru název-hodnota, které specifikují další parametry.
  • Funkce [pdca,gn,gl] = fitdist(x,distname,‘By‘,groupvar) je zodpovědný za přizpůsobení rozdělení pravděpodobnosti definované distname datům ve sloupcovém vektoru x na základě seskupovací proměnné groupvar za účelem generování objektů rozdělení pravděpodobnosti. Poskytuje zpět pole buněk přizpůsobených objektů rozdělení pravděpodobnosti, označovaných jako pdca, pole buněk skupinových štítků, označovaných jako gn, a pole buněk seskupujících proměnných úrovní, označovaných jako gl.

Příklad 1: Jak najít normální rozdělení pomocí funkce fitdist(x,distname).

Tento příklad odpovídá a normální distribuce na vzorová data z pomocí fitdist() funkce.

zatěžovat pacienty
S = Hmotnost ;
pd = fitdista ( S , 'Normální' )

Příklad 2: Jak najít normální distribuci pomocí fitdist(x,distname,Name,Value) Funkce

V tomto příkladu se chystáme přizpůsobit distribuci jádra vzorovým datům pomocí fitdist() funkce v MATLABu.

zatěžovat pacienty
S = Hmotnost ;
pd = fitdista ( S , 'Jádro' , 'Jádro' , 'epanechnikov' )

Příklad 3: Jak najít normální rozdělení pomocí funkce fitdist(x,distname,‘By‘,groupvar)

Níže uvedený kód MATLABu sedí normální distribuce na seskupená data, vypočítá a vykreslí pdf obou skupin dat.

zatěžovat pacienty
S = Hmotnost ;
[ pdca , gn , gl ] = fitdista ( S , 'Normální' , 'Podle' , Rod )
ženský = pdca { 1 }
mužský = pdca { 2 }
z_hodnoty = 80 : 1 : 220 ;
ženapdf = pdf ( ženský , z_hodnoty ) ;
malepdf = pdf ( mužský , z_hodnoty ) ;
postava
spiknutí ( z_hodnoty , ženapdf , 'Šířka čáry' , 2 )
vydrž
spiknutí ( z_hodnoty , malepdf , 'Barva' , 'r' , 'LineStyle' , ':' , 'Šířka čáry' , 2 )
legenda ( gn , 'Umístění' , 'Severovýchod' )
zdržet se

Závěr

Nalezení normální distribuce datové sady je statistická technika, která se široce používá ve strojovém učení, umělé inteligenci, datové vědě a mnoha dalších oblastech. Lze jej definovat pomocí dvou parametrů; průměr i standardní odchylka datových bodů. Můžeme datovou sadu vměstnat do normální distribuce objekt pomocí fitdist() funkce. Tato příručka poskytla základy normální distribuce a jak s ní pracovat v MATLABu pomocí funkce fitdist() funkce.