スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

区間推定の手順を見てみよう!~ちょっと復習+α

かなーーりお久しぶりですが、いそいそと区間推定について
続けたいと思います

まずは区間推定の定義の再確認(for 自分)!!

区間推定:点推定量を元に、具体的な母数の値が、どの程度の信頼度でどういった範囲に含まれるかを推定することをいいます。例えば母数が『65点±10点』に存在すると区間推定されたとします。これは、65点を中心に、誤差±10点の中に母数があると考えられるわけです。

信頼区間:どの程度の信頼度でその区間に存在すると考えられるか、ということを『○%信頼区間』いう言い方をします。95%信頼区間、99%信頼区間、などです。90%信頼区間だと、「100回調べたら90回はこの範囲に収まるだろう」、といった考え方をすればいいと思います。

ふむふむ。これを数式で表すと、こういうことだそうです。
「真の母数θが、ある区間(L,U)に入る確率を1-α(αはθが区間に入らない確率)以上に保障する方法であり
P(L≦θ≦U)≧1-α
となる確率変数、LとUを求めるものである。」(統計学入門:東京大学出版会)

ははーん、つまり「1-α」に当たる部分が95%信頼区間の場合は「0.95」、99%信頼区間の場合は「0.99」になるわけだ
で、LとUを求めるわけね

ちなみに、信頼区間の幅(d=U-L)は、αを一定にした場合、標本nが大きくなるにつれてdは小さくなるそうです。この幅dは短い方が推定が正確だそうです。
つまり、nは大きいにこしたことはない!!ってことですね


ってことで、LとUを求めて参りたいと思います。





スポンサーサイト

テーマ : 仕事
ジャンル : 就職・お仕事

区間推定の手順を見てみよう!~用語編その4~

信頼区間を求めるには、『t値』をざっくり知っておく必要があります。
これは「t検定」で出てくる重要な値です。

まずは「仮説検定」について簡単に見てみます。
仮説検定では、まず対象となることがら2つに対して、「差がない」という仮説を立てます。これを『帰無仮説』といい、この帰無仮説の起こる確率をしらべ、その確率がある程度低いときに、帰無仮説をまちがいであると判断し、代わりに「差がある」という逆の仮説を支持します。ちなみに、その逆の仮説のことを『対立仮説』といいます。


テーマ : 仕事日記
ジャンル : 就職・お仕事

区間推定の手順を見てみよう!~用語編その3~

さて、今日も区間推定の求め方を知るための下準備です
難しい用語つぶしときたいと思います。

・標本平均の分散
これはそのまんま、「標本平均の散らばり=分散」ってことです。
標本平均の分散は、(母分散=σ2と表す)/サンプルサイズnで求めることができます

・標本平均の標準偏差
これもそのまま、標本平均の散らばりを表しています。求め方は簡単、上で出てきた(標本平均の分散)の平方根です

明日はtについて!

テーマ : 仕事日記
ジャンル : 就職・お仕事

区間推定の手順を見てみよう!~用語編その2~

さて、コチラのエントリーで用語の確認をしました。

がっ!

区間推定の求め方理解するには、まだまだ必要な用語があることがわかりました
しっかし、難しいなあ…くじけずに頑張りたいと思います

・正規分布
これは有名ですね!中心から左右対称の釣り鐘型(ベルマークみたいなやつ)に広がる、確率分布の図です。自然界の現象の多くがこの分布に従って発生するそうです例えば、10回硬貨を投げて表が何回でたか統計をとっていくと…結果は、この正規分布に従うそうです。ひえ~、統計恐るべし。
正規分布
↑こんな感じ。

・標本平均
母集団からサンプルサイズnとして標本をとりだし、ある現象が起きる確率を求めた時の平均。
たとえば、私が大好きな『た○のこの里』。一箱に何個あるのだろうか?
サンプルサイズを10として、コンビニで10箱買ってみます(これは母集団から10個の標本をとりだしたということです)。それぞれの箱を開けて中身を数え、その10箱の平均を出します。これが、標本平均です。
「もっと精度をあげたい!」となれば、同じ作業を繰り返すことになります。
ちなみに、繰り返し求めた標本平均値を分布図として描いてみると…なんと上記の正規分布に従うそうです
さらに、標本平均の平均は、母平均と一致するとのこと


bunpu.jpg
↑こんな感じ

信頼区間の手順にいくまでには、まだまだ用語調べないと無理そうです
続きは次回!




テーマ : 仕事日記
ジャンル : 就職・お仕事

区間推定の手順を見てみよう!~用語編~

区間推定の定義については、コチラのエントリーでちらっと述べました。
今日は、具体的な区間推定の求め方に入る前に、その際に必要と思われる用語について確認しておきたいと思います

・サンプルサイズ
推定というのは、標本データを元に母集団の母数を推測することをいいます。
このとき、標本として抽出したデータの数のことを『サンプルサイズ(n)』といいます(標本の大きさともいう)。n=10とある場合は、標本のデータ数が10個であることを指します。

・標本統計量

標本データから計算される値…例えば、平均や分散や標準偏差やら…は、標本統計量といいます。

・母平均、母標準偏差、母相関係数、母分散などなど、母数の統計量
母数に関して、「これは母集団の平均ですよ」と明示したいときは、頭に「母」をつけて『母平均』という風に表現します。

・標本平均、標本標準偏差、標本相関係数、標本分散などなど、標本の統計量
標本の統計量に関して、「これは標本の平均ですよ」と明示したいときは、頭に「標本」をつけて『標本平均』という風に表現します。

・推定量と推定値
この二つは響きが似ているので混乱しないように注意しましょう。
ある母数を推定するときに使用される標本統計量を、その母数の『推定量』といいます。
また、標本データを用いて計算された推定量の値を『推定値』といいます。

まず、以上の用語をおさえておいて、、、次回こそ、区間推定の求め方に入れる…カナ?

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。