統計処理とは、意味と分類

統計処理に関係するグラフの画像

統計処理とは、それぞれの立場によって様々に定義されてきています。
おそらくそれらすべては正しく、統計処理に多くの解釈があることは必然であると考えられます。
ここでは、統計処理を下記のように定義しています。


統計処理とは、誤差を含んだデータの中から客観的に情報を取り出すための処理手段のひとつである

上記の定義の中にある誤差は、「誤ったもの」というよりも「バラツキがあるもの」あるいは「確率的に変動するもの」と解釈してください。
医学分野におけるデータは、各種の要因、特に個体差によるバラツキを持っています。
個体の大きさ、薬の効果、刺激に対する反応性など、どれひとつとしてまったく同じものは無く、データには個体差による変動が必ず含まれています。

統計処理とは、このバラツキを持ったデータを処理することによって、そこに含まれている確からしい情報を取り出すための手段です。
たとえば、平均値を計算するという統計処理は、個体差によってバラツキのあるデータをすべて掲示する代わりに、集団のデータを代表する数値の1つである平均値をもって集団の特性を要約した定量的な情報として掲示するものです。

・誤差を含んだデータを統計処理することにより、定量的な情報を導き出す


統計処理と情報処理

統計処理とは、統計学という世界共通の学問体系に基づいて行われます。
統計学という共通の概念を持った者であれば、それを使って情報を伝えることができます。
つまり、統計処理の結果として得られた情報は、統計学という共通の言葉で伝えることによって正しく相手に伝わります。
また、統計処理によって得られた情報は定量的なものです。
したがって、統計処理は、情報を正しく伝えるための2つの条件を満足するものであり、情報処理の手法の1つでもあります。

・統計学は世界共通の概念であり、かつ、その結果は定量的である。
したがって、統計処理によって得られた結果を用いることで、相手に正しく情報を伝えることができる。


統計処理の分類

統計処理は、記述統計と推測統計に大別されます。
記述統計とは、得られたデータを要約して、データ全体の特徴を掲示することを目的とした統計処理です。
平均値や標準偏差などを計算してそれをもって集団の特性を示したり、数値のデータをグラフにして全体の傾向を視覚的に表現することがこれにあたります。

一方、推測と帰依とは、標本と呼ばれる少ないデータから、母集団と呼ばれる対象全体の特性を確率的に推測するものです。
たとえば、テレビの視聴率は、数百人のデータ(標本)をもとに日本全体(母集団)の視聴の割合を推測したものであり、推測統計の応用の1つです。

・記述統計:得られたデータの特性を要約して伝える目的で行われる

・推測統計:標本から母集団の特性を確率的に推測する目的で行われる

多くのデータがあるとき、大抵の人は、平均値を計算したりグラフを作成したりします。
これらの作業は、データの性質を要約し、その特徴を効率よく相手に伝えることを目的に行われます。
このときデータの要約に用いられるのが記述統計です。
記述統計は、自分の収集したデータをどのような視点で捕え、その結果どんな特徴があったのかをわかりやすく客観的に相手に伝える手段として用いられます。
したがって、「こうしたら相手がわかりやすいだろう」という考えを念頭に置いて行うことが肝要です。


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です