世界的な勝ち組企業であるGAFA。
米国のGoogle、Apple、Facebook、Amazonの4社の頭文字をとって、このように表現されています。
「儲けすぎ」という感じなのかどうか知りませんが、課税や賃上げなど社会への還元圧力が、最近GAFAに吹き荒れています。
これらの企業は、データ分析・活用でも群を抜いており、データを独占し成長していると言われています。さらに、最近ではAI(人工知能)の分野でも活発に動いている感じがします。
今回は、「GAFAからみるAIの限界とデータ活用の未来」というお話しをします。
Contents
GAFAに社会共存の風圧 課税や賃上げ、下がる利益率
2018年11月3日の日経新聞の朝刊の一面に「GAFAに社会共存の風圧 課税や賃上げ、下がる利益率」という記事がありました。
記事では……
- 課税圧力
- 賃上げ圧力
- 情報流出の対策コスト上昇
……などなどにより、利益率は下がっていくだろうという内容でした。
面白いのが、「情報流出の対策コスト上昇」というところ。
記事では、人を採用し対策を打たないといけないから、人件費がアップしコストが上昇すると記載されていました。
AIでなんとかならないの?
この新聞記事を見た知人が言った言葉です。
「得意のAIでなんとかならないの?」
確かに、データのセキュリティーこそ、AI(人工知能)あたりが得意とするのでは? と思う人も多いのかもしれません。実際は「人力」です。
AIっぽく、アルゴリズムで上手く対処できる部分はあるとは思います。
しかし、私の知る限り、最終的には「人力」です。意外と思う人もいるかもしれませんが、「人力」なのです。
人が必要らしい……、実際そうだけど
AIと言えるかどうか分かりませんが、上手くアルゴリズムを開発することで、その「人力」の手間は減らすことはできます。
あるセキュリティー系の作業を、上手くアルゴリズム開発し99%カットした事例もあります。しかし、残りの1%は「人力」です。
1%と聞くと僅かであるような錯覚に陥りますが、人の手に託された1%は、アルゴリズムで対処できなかった「ややこしい奴」です。
つまり、面倒な奴が人の手に託されます。
地味な話し、良質な教材作りが一番つらいという現実
そもそも、機械学習で何かを学習させて覚えさせるとき、一番つらいのが学習データを作るところです。
学習データを作るAIが欲しいぐらいでしょう。
従来からの統計モデルも、モデル構築用のデータ(機械学習で言うところの学習データ)を取得するところだけで、実験計画法という名前で1つの学問領域になっているぐらいですから、昔からある課題です。
学習データを、人の教育の世界で考えれば、教材作りに該当します。
どう学習させるかというカリキュラムを作り、そのカリキュラムに沿ったドリルを作り、公文の問題集を何度も解かせるかのように、似たような問題を学習させる。
結局のところ、「人力」です。
といいうことで、AIの限界とデータ活用の未来
ところで、GAFAに代表される企業は、データを上手く分析し活用することで、急成長した事実があります。データを独占し成長していると、批判されるぐらいですから。データ保有格差です。
つまり、データ活用の未来は、GAFAが切り開きました。数十年で世界的な巨大企業になるほどの未来です。
一方で、データ活用といっても、そのためのお守りやAI化までとなると、「人」が欠かせません。
今後、どのように発展していくかは分かりませんが、現時点では「人」が欠かせず、当分そうでしょう。シンギュラリティ―が起こらない限りは。
今回のまとめ
今回は、「GAFAからみるAIの限界とデータ活用の未来」というお話しをしました。
2018年11月3日の日経新聞の朝刊の一面に「GAFAに社会共存の風圧 課税や賃上げ、下がる利益率」という記事を発端とした、私と知人との間の何気ない会話をもとにした、お話しでした。
GAFAに今後課されるコストとして、情報流出の対策コスト、記事ではそのための人件費が主なもの、となっていました。
データのセキュリティーこそ、AI(人工知能)あたりが得意とするのでは? と思う人も多いのかもしれません。実際は「人力」です。
そもそも、AIの学習データを作るのも、結局のところ「人力」の要素が大きいです。
それが、現在のAIの限界かと思います。AIへの取り組みが進んでいそうなGAFAでさえそうなのですから。
一方で、GAFAに代表される企業は、データを上手く分析し活用することで、急成長した事実があります。データ活用の未来は明るいです。
なぜならば、生かされていないデータは、まだまだ企業内にも家庭内にも行政内にも、いたるところにあるからです。
IT化されると、副産物としてデータが発生するからです。20年前にと比べると、ものすごくIT化しています。つまり、ものすごくデータが発生しているからです。