最近の世論調査は戸別訪問ではなく、電話による回答であることが多い。雑誌の折込み葉書による回答や、インターネットを利用した調査などもあるようだが、新聞やテレビで報道される世論調査は押しなべて電話によるものが多いようである。それは普通RDD方式(Random Digit Dialing)と呼ばれ、コンピュータで乱数計算を基に電話番号を発生させ、その番号に電話をかけて質問し回答を得るものである。
世論調査と銘打ってはいるけれど、もちろん全国民の意思の集約ではない。少数者による意見を基に国民全体の意見を推定しようとするものである。世論調査がこうした目的を持っていることくらい、誰でも知っている常識である。それを承知で言うのだが、集められた少数者の意見が国民の意見であると推計される根拠は、一定の要件の下で選ばれた少数者の意見は国民全体の意見を代表している、つまり国民全体の意思の縮小版であると思われてみなされているからである。
だから昼食時間帯にラーメン店を覗いて、サラリーマンの昼食がラーメンが90パーセント、餃子が10%であると結論付けるような調査方法が、サラリーマンの昼食状況全体を示すサンプルだと言うことなどできないだろうことからも分るだろう。
選ばれた少数グループを、統計では母集団と呼ぶ。前述したラーメン店の例でも分るように、母集団がラーメン店の客のみというように偏っていると、そこから集約された意見もまた当然に偏ってくることになるからである。こうした偏りをなくすために考えられたのが、「母集団の抽出がランダムであること」と「一定数以上の母集団数にすること」である。つまり、ある意見に対する回答を無作為に、しかもある程度の数集めるという手続が必要だということである。
ランダムという選定がどんな方式なら許されるのか、母集団の数はいくつくらいならいいのか、それには統計学による一応の基準がある。だがそれはあくまで数学的な方程式でしかない。母集団の意思が全国民の意思を代表しているのかどうかは、結局全数調査する以外に確かめようがないだろうからである。
私も若い頃に通信教育で統計学を学んだことがある。そこで分ったことは、一つはいかに無作為(ランダム)と言ったところで、純粋な意味でのランダムなどあり得ないということであった。そのことは最近コンピューターの情報通信でランダム数値を暗号として使おうとする例が多いのであるが、結局純粋な意味でのランダム性というのは無理と考えられていることからも分る。ランダムの問題については後で再度取り上げることとしたい。
もう一つは母集団の数である。私が学んだのは正規分布曲線を用いた信頼率とかいう理屈を使って、母集団数が100ならどの程度の信頼性がある、母集団が1000の信頼性はこの程度という、一種の確率論による評価であった。そしてそれはまさに「確からしさ」の範囲に止まるものでしかなかった。90%正しい、95%信頼できる、などと言う評価を何度も読んだけれど、果たしてそうした数値は何を意味しているのだろうか。
そして私がこの電話による世論調査結果にどことない違和感を覚えたのは、このランダム性についてであった。例えばNHKの調査結果発表を見ていると、コンピューターでランダムに発生させた電話番号1千数十件に電話をかけ、そこから得られた600〜700件の回答の集約ということであった。
そこには、どんな形でランダムに電話番号を発生させたのかに対する情報はまるでない。だから母集団1000件超の番号(数値)が、固定電話の番号だけなのかそれとも携帯などの番号も含まれているのか、更には0120などで始まる無料通話番号やその他IP電話などの番号も含まれているのかなどについてもまるで情報がない。
私たちに伝えられているのは1000分の数百という、発生させた番号数と回答してくれた母集団数だけである。日本の電話番号がどんな規則性で割り当てられているのか、私はきちんと理解しているわけではない。だからなんとも言えないのだが、例えば固定電話なら全部で10桁の数値からできていることくらいはすぐに分る。だから固定電話のみならずIP電話なども含めてあらゆる種類の電話番号が10桁でできていると仮定してみよう。
すると電話番号として割り振りが可能な数は100億(正確には100億から1を引いた数)になる。日本の人口は約一億二千万人と言われているから、赤ん坊まで含めて一人80台割り当てることができる。どんな形でランダムな10桁の数値を1000個発生させるのか分らないし、どこまでランダム性が保証されているかは疑問だけれど、発生させることそのものは認めていいだろう。
こうして母集団としての1000個の番号が目の前にある、ここまではいいだろう。次はその数値へ悉皆的に電話をかける作業である。そしてその番号に応答してくれた人に世論調査であることを告げ、回答を了解してくれた人を対象に質問を重ねることになる。
電話をかける対象者は、目の前にある10桁の数値のみである。固定電話よりも携帯電話の方が多いと言われるくらいの今の時代である。発生させた番号はまさしくランダムなのであるから、未成年者はもとより、会社や公共機関や行政などの業務専用の番号、受信専用の番号など多岐にわたるであろう。
日本にどれくらいの数の電話が存在しているのか、私にはまるで知識がない。それでも個人に割り当てられている電話番号は乳幼児にまでは及ばないだろうから、総人口一億二千数百万から考えてせいぜい一億台くらいと考えてもそれほど大きな違いはないだろう。一人で数台の番号を所持している人がいないとは言わないけれど、例えば世帯に一台しか電話を持っていないということもあるだろうから、一人一台としての約一億台という推計はそれほど無茶ではないと考える。
さてそうするとランダムで発生させた数値は10桁だから、その中の一つが個人に個人に割り当てられている確率は100億分の一ということになる。使われている電話番号が0から100億まで途切れることなく存在しているとは思わない。例えば市外局番を含めた電話番号の始まりは、私の知る限り「0」で始まっている。もし、他の数字で始まる番号がないとするなら、このことだけで電話番号の数は10分の1になってしまう。またこの他にも、共通して欠けているルールがあって公表されていることも考えられるから、分母は10億よりも更に小さくなることも考えられる。
そんなあいまいな根拠のままに論ずるのは説得力に乏しいかも知れないけれど、仮に実存している番号が10分の1だとしても10億台の電話があり、その中で個人が使用している番号は1億台なのだから10%に過ぎない。するとランダムに電話をかけたとき、「この番号は会社もしくは行政機関などです」など、世論調査の対象者としてふさわしくない番号が少なくとも10億台中の9億、つまり90%は含まれるはずである。
ところが世論調査の発表を見ていると、有効回答率が60%台になっているのである。これはいかにもおかしいような気がする。仮に電話が個人にかかったとしても、「忙しい」、「面倒くさい」、「興味がない」などなど、質問に対する回答を拒否する者もきっといることだろうと思う。それにもかかわらず、有効回答率が60%台にも及ぶというのはどう考えても変である。ランダム性がどこかで破綻しているように思えるのである。
それとも母集団たる1000数百個の番号発生させるというシステムの中に、あらかじめ対象者が必ず個人となるような何らかのプログラムが最初から組み込まれているのだろうか。だとするなら、その「何らかのプログラム」の中に、予め特定の意思の存否などの判断要素もしくは性別や年齢や職業などが偏らない要素など、を紛れ込ませておくような恐れはないのだろうか。これはつまりランダムに見せかけてはいるが、世論調査の結果に影響を与えるような母集団の選定が最初から仕組まれている可能性はないのだろうか、と言う疑問である。
例えば電話番号と一言で言っても、もし固定電話だけを対象にしているのなら携帯電話を無視した調査になってしまうから、在宅者は専業主婦が多いだろうし、携帯が含まれていないことで若者の意見が反映されにくいなどの偏りが考えられることになる。
また、電話に限るものではないが、例えばNHKであるとか朝日新聞などの調査主体者に対する好悪の感情であるとか、質問の仕方や回答の選択肢の作りかたなどによる微妙な変化も世論調査には大きな影響を与えるだろう。
だからこそ世論調査を実施する機関によって、似たような質問であるにもかかわらず異なった調査結果が出てくるのかも知れないし、そのことが逆に調査の正当性を示しているのだと言えるのかも知れない。それを理解しつつも私には、どうにも世論調査言うシステムが、どこかうさんくさく傲慢なシステムのような気がしてならないのである。どこかで嘘、もしくは信用できないとの声が聞こえてくるのである。
2016.2.13 佐々木利夫
トップページ ひとり言 気まぐれ写真館 詩のページ