ジャンガおじさん統計学を学ぶ。その4(確率分布編)
「世の中のデータはどんな分布になるのかあらかた決まっている」
前回、確率分布とはということでまとめていきましたが、
今回は具体的に代表的な3つの確率分布についてまとめていきます。
3つの代表的な確率分布はこちらになります。
②二項分布
コイン投げetc..
「裏表」、「あるない」ことを表す分布
③ポアソン分布
交通事故の確率etc...
めったに起きないことを表す分布
ではさっそく、
正規分布から学んでいきましょう。
①正規分布
ーランダムな誤差を表す分布になります。
正規分布は英語でNormal distributionと言うことからも分かるように『この世でもっとも一般的な分布』であり、「誤差の大きさの出現確率」をはじめ、さまざまな社会現象や自然現象で当てはまる確率分布です。
正規分布とは、平均を μ ・分散を σ2 とした場合に以下の確率密度関数で表される確率分布を指し、N(μ, σ2)と表記されます。
また、ある確率変数X の確率分布が正規分布N(μ, σ2)であるとき「確率変数 X はN(μ, σ2)に従う」と言い、『X ~ N(μ, σ2)』と表記されます。
ビジネスで正規分布が当てはまるケース
・ある工場で製造される部品の寸法の誤差
・証券の値段の不確実性
世の中の社会現象や自然現象の中には、その確率変数が正規分布に従うとみなせるものが多く存在するため、その平均と標準偏差が分かれば、多くの現象について「どういった事がどれくらいの確率で発生するのか」を計算できるようになるんです。
そして次に学ぶのが二項分布
②二項分布とは、
ー結果が2つの試行を何回も繰り返すことによって起こる分布
ビジネスにおいて二項分布が当てはまるケース
・N回のページビューのうち、確率pで広告がクリックされる回数
(クリックされるか、されないか)
・N人のユーザーのうち、確率pで解約する人数
(解約するか、されないか)
・N人の社員のうち、確率pで退職する人数
(退職するか、しないか)
少し考えてみればビジネスの世界でもどんどん応用できるようになります。
こんな具体例どんな参考書にも載っていないと思います。
下記が二項分布の確率質量関数の式となる。
※エクセルで簡単に計算できる
n回の試行を行い、
k回成功するとして、
(1回の試行における成功確率はp)
nCk はn回の試行で、k回成功する仕方を表します。
次はあまり聞いたことがないかもしれませんが
なかなか使える分布であるポアソン分布についてまとめていきます。
ポアソン分布
ーある一定時間や一定空間内でイベントが発生する回数を表現
ビジネスでポアソン分布が当てはまるケース
・一カ月で平均n回コンバージョンする広告を使って得る今月のコンバージョン数
・一日に平均n個不良品が作られる工場で、今日作られる不良品の個数
▼ポアソン分布の確率質量関数
Kは一定期間内にイベントが起こる回数、
分布の形はパラメータλに依存します。
※ポアソン分布はPOISSON関数で計算できる
今日はここまで次回は具体的なケースをみていきます。