各報道機関の選挙速報で、よく開票率が数%なのに当確(当選確実)が出ることがあります。
データサイエンスっぽいアプローチとしては……
- 出口調査を利用したもの
- 中間投票状況(開票率○○%)の結果を利用したもの
……を利用したものでしょう。
伝統的な数理統計学のアプローチでどうにかなります。
今回は、「なぜ、開票率数%で当確なのか?」というお話しをします。
Contents
中間投票状況(開票率○○%)
当選かどうかは、開票率100%でないと言えませんが、開票率数%の状況でも当選の可能性を言うことができます。
伝統的な数理統計学のアプローチを活用します。
例えば……
- 開票率1%で当確と言えたり
- 開票率10%で当確と言えたり
……します。
候補者が2名のケースで考えると……
今、候補者が2名のケースで考えてみます。
- 候補者A
- 候補者B
候補者Aが当選するには、得票率が50%を超える必要があります。有効投票者数が10,000と想定した場合、得票数が5,000を超えれば(5,001以上)であれば当選します。
開票率1%とは100人分の票が確定したことになります。開票率10%とは1,000人分の票が確定したことになります。
開票率1%の例
では、開票率1%の段階で当確をだすためには、候補者Aはどのくらいの票を得ればいいのでしょうか?
ざっくり計算すると100人の60%つまり60人の票を獲得すると、当確と判断することができます。
開票されたのが100人の場合、当確ラインは60%になります。
なぜでしょうか?
開票率10%の例
では、開票率10%の段階で当確をだすためには、候補者Aはどのくらいの票を得ればいいのでしょうか?
ざっくり計算すると1,000人の53%つまり531人の票を獲得すると、当確と判断することができます。
開票されたのが1,000人の場合、当確ラインは53%になります。
なぜでしょうか?
当確ラインの求め方
当確ラインを求める簡単な算定式があります。
要は、候補者Aと候補者Bが競っていればいるほど、開票率が高くならないと当確は出せない、ということです。
この算定式は簡単に作ることがでますが、ここでは作り方の説明は割愛します。興味のある方は、数理統計学の入門書などを参考にしていただければと思います。正規分布をベースにしたものです。
出口調査
出口調査とは、選挙当日などに投票所の出口で投票を終えた有権者に対し、誰に投票したのを質問する調査です。
もちろん、全員に質問するわけではなく、ある投票所から出てきた人に対し、10人置きに聞くとかします。
国政選挙では、1989年の参院選からと言われています。総選挙では、1993年(細川政権誕生)からと言われています。
調査方法は、2段抽出法を使っています。
- 1次抽出:投票区の抽出
- 2次抽出:抽出した投票区の投票者個人
出口調査は、最近の各報道機関の選挙速報では、欠かせないものになっています。
出口調査の結果によっては、開票率0%で当確ということもあり得ます。
候補者が2名のケースで考えると……
今、候補者が2名のケースで考えてみます。先ほどの例と同じ想定です。
- 候補者A
- 候補者B
候補者Aが当選するには、得票率が50%を超える必要があります。
100人に対し出口調査を行ったとします……
100人に対し出口調査をした結果、以下のようになったとします。
- 63人が候補者Aに投票(出口調査の得票率:63%)
- 37人が候補者Bに投票(出口調査の得票率:37%)
ここで候補者Aの得票率の区間を作ることができます。
得票率の区間とは?
得票率の区間とは、候補者Aの真の得票率は分からないが……
「だいたいこのくらいの区間に入ってるんじゃないかな?」
……という感じのものです。
得票率の区間には、区間というぐらいなので、下限と上限があります。
この区間の下限が50%を超えていれば当確と言えそうです。
先ほどの例で考えると……
100人に対し出口調査をした結果、以下のようになったとお話ししました。
- 63人が候補者Aに投票(出口調査の得票率:63%)
- 37人が候補者Bに投票(出口調査の得票率:37%)
この例の候補者Aの得票率の区間は、次のようになります(n:出口調査のサンプル数、p:出口調査の得票率)。
- 上限:72%
- 下限:54%
下限が50%を超えているので、当確と言えそうです。
得票率の区間の求め方
得票率の区間を求める簡単な算定式があります。
この算定式も簡単に作ることがでますが、ここでは作り方の説明は割愛します。興味のある方は、数理統計学の入門書などを参考にしていただければと思います。正規分布をベースにしたものです。
今回のまとめ
今回は、「なぜ、開票率数%で当確なのか?」というお話しをしました。
各報道機関の選挙速報で、よく開票率が数%なのに当確(当選確実)が出ることがあります。
データサイエンスっぽいアプローチとしては……
- 出口調査を利用したもの
- 中間投票状況(開票率○○%)の結果を利用したもの
……を利用したものでしょう。
伝統的な数理統計学のアプローチでどうにかなります。
実際の当確は、出口調査結果や中間投票状況(開票率○○%)だけでなく……
- 開票作業の目視による観察
- 事前の世論調査結果
- 立候補者の知名度
- 報道機関の記者の腕
……などによる色々な要素が絡み合った結果、当確を各報道機関で出しているようです。