コラム
木も見て森も見たい(11)~公共資本ストックと地価に関係はあるか~
2021.03.03
前回からの続き
7回目のコラムより、「公共資本ストックで地価の上昇を説明する」をテーマとして話を続けてきて、「公共資本ストック(説明変数)と地価(被説明変数)の間には、何らかの相関が有り、公共資本ストックの増加(仮にXiとします)が、地価(仮にYとします)を押し上げる働きをしているのではないか?」という仮説をもとに、Y ← α + βXi という関係を調べています。
ちなみに、上記の式にある、Xの添え字のiは、Xが幾つかあることを示しており、式を眺めると、中学校で学習する「一次方程式」の形になっていることに気づくはずです。グラフに描くと、直線になるやつです。αはY軸との切片で、βは直線の傾きでした。直線なのでYとXは比例関係にあると言えます。
頻繁に使われる「比例的」というのは、YがXのβ倍になるという関係を指しますが、この定式化を受け入れるのであれば、我々の最大の関心事は、①β(傾き)は幾らなのか?②βの推計値はどれくらい確率的なのか?、ということになります。
推計式に潜む誤差項
前回のコラムにおいて、私は、Xiは何らかの誤差を含んだ、確率的な存在であるという話を致しました。この点を理解されていれば、現在手元にあるXi(にβを乗じてαを足す)が、Yより大きくなる、あるいは小さくなる。それならば、個々の差分を誤差εとして取り出して、Y = α + βXi + εi と書くことができる事を理解いただけるのではないでしょうか?
εは誤差項と呼ばれるものです。εには説明変数Xiだけでは説明できない、その他の全ての要因が含まれると解釈します。また、誤差項εは、近似的に正規分布に従う確率変数であると考えます。その結果、誤差項εが確率変数であるため、誤差項を含む式から計算された直線の傾きβもまた、確率的に変動すると考えることが出来ます。
サンプルと母集団の関係
次に、何度も繰り返し観測されたβの集団(母集団)があると仮定します。今、手元に有る1組のデータ(YとXのセット)から計算されたβは、たまたま、母集団から取り出された「サンプルのセット」であると考えます。
ここで注意しなければならないのが、「600人に2回アンケートを取りました」という例で説明しますが、「600人」の数(標本の大きさ)が「サンプルサイズ」(※1)であり、「2回」の数(標本)が「サンプル」(※2)ということになります。
科学実験においては、何度もデータを取り出すことができるかもしれませんが、社会科学の分野においては、サンプルは1セットしか入手出来ないことが殆どです。アンケート調査がいい例ですが、同じ調査を短期間に何度も実施するのは、殆ど不可能です。しかし、これまでの研究成果より、どんな分布から取り出したサンプルセットでも、その平均値は(今回の話ではβ)、正規分布することが知られております。
中心極限定理(※3)と言われるものですが、最大の関心は、たった1つだけ入手出来た貴重なサンプルセット(から計算した)βが、果たして、幻の母集団の中心(平均)から、どの程度ずれているのか?という点です。母集団の平均=中心と考えると、βが母集団の中心に近ければ、βは母集団を代表していると考えることが出来るのではないでしょうか。
何故、母集団とサンプルの関係にこだわるのか?それは仮に、たまたま母集団の中心から遠く外れたサンプルを取り出していた場合、βは母集団の傾向を正しく表しているとは言えなくなるからです。母集団の傾向を表していないのならば、手元にあるβは怪しい、ということになります。つまり、βを使ってYの予測を行った場合、間違った結論を導き出すことになります。
したがって、βが母集団の中心から遠く外れておらず、かなりの確率(例えば95%とか)で、母集団を代表する意味ある(有意な)数値であることを確かめる(検定する)必要が生じます。確かめる(検定する)ために用いる物差しが「t値」と呼ばれる数値(検定統計量)です。t値は、以下の割り算で計算されます。
分子:サンプル値(β)から、母集団の平均(現時点では不明)を引いたもの
分母:標準誤差
このt値(検定統計量)は、その分布をグラフ化すると、正規分布に近い形で描かれます。また、「標準誤差」(※4)という言葉が出てきていますが、現時点では、何らかの正の値であると捉えておいてください。
我々の関心は、「手元にあるβが母集団を代表しているかどうか」ということでした。それを調べるために、t値なる検定統計量にて、意味ある(有意な)数値であるかを確かめようとしておりますが、一体どんな手順を踏めば良いのか?t値は正規分布の親戚のようだ、裾野が広がった釣り鐘状の分布をしている、t値の式に従えば、個々のサンプル値から平均値を引くことになっている。でも、母集団の平均値は分からない…。という状況ではありますが、ここからが大変トリッキーで楽しくなるのですが、また次回に。
コラムニスト
公共事業本部 ソリューションストラテジスト 松村 俊英
参考
関連コラム
- 木も見て森も見たい(1)~自治体財務データから見えるもの
- 木も見て森も見たい(2)~自治体財務データから見えるもの
- 木も見て森も見たい(3)~自治体財務データから見えるもの
- 木も見て森も見たい(4)~自治体財務データから見えるもの
- 木も見て森も見たい(5)~自治体財務データから見えるもの
- 木も見て森も見たい(6)~自治体財務データから見えるもの
- 木も見て森も見たい(7)~公共資本ストックと地価に関係はあるか
- 木も見て森も見たい(8)~公共資本ストックと地価に関係はあるか
- 木も見て森も見たい(9)~公共資本ストックと地価に関係はあるか
- 木も見て森も見たい(10)~公共資本ストックと地価に関係はあるか
- 木も見て森も見たい(11)~公共資本ストックと地価に関係はあるか
- 木も見て森も見たい(12)~公共資本ストックと地価に関係はあるか
- 木も見て森も見たい(13)~公共資本ストックと地価に関係はあるか~
- 「データ分析を考える」コラム一覧に戻る