第102話|GAFAからみるAIの限界とデータ活用の未来

第102話|GAFAからみるAIの限界とデータ活用の未来

世界的な勝ち組企業であるGAFA。

米国のGoogle、Apple、Facebook、Amazonの4社の頭文字をとって、このように表現されています。

儲けすぎ」という感じなのかどうか知りませんが、課税や賃上げなど社会への還元圧力が、最近GAFAに吹き荒れています。

これらの企業は、データ分析・活用でも群を抜いており、データを独占し成長していると言われています。さらに、最近ではAI(人工知能)の分野でも活発に動いている感じがします。

今回は、「GAFAからみるAIの限界とデータ活用の未来」というお話しをします。

GAFAに社会共存の風圧 課税や賃上げ、下がる利益率

2018年11月3日の日経新聞の朝刊の一面に「GAFAに社会共存の風圧 課税や賃上げ、下がる利益率」という記事がありました。

記事では……

  • 課税圧力
  • 賃上げ圧力
  • 情報流出の対策コスト上昇

……などなどにより、利益率は下がっていくだろうという内容でした。

面白いのが、「情報流出の対策コスト上昇」というところ。

記事では、人を採用し対策を打たないといけないから、人件費がアップしコストが上昇すると記載されていました。

AIでなんとかならないの?

この新聞記事を見た知人が言った言葉です。

得意のAIでなんとかならないの?

確かに、データのセキュリティーこそ、AI(人工知能)あたりが得意とするのでは? と思う人も多いのかもしれません。実際は「人力」です。

AIっぽく、アルゴリズムで上手く対処できる部分はあるとは思います。

しかし、私の知る限り、最終的には「人力」です。意外と思う人もいるかもしれませんが、「人力」なのです。

人が必要らしい……、実際そうだけど

AIと言えるかどうか分かりませんが、上手くアルゴリズムを開発することで、その「人力」の手間は減らすことはできます。

あるセキュリティー系の作業を、上手くアルゴリズム開発し99%カットした事例もあります。しかし、残りの1%は「人力」です。

1%と聞くと僅かであるような錯覚に陥りますが、人の手に託された1%は、アルゴリズムで対処できなかった「ややこしい奴」です。

つまり、面倒な奴が人の手に託されます。

地味な話し、良質な教材作りが一番つらいという現実

そもそも、機械学習で何かを学習させて覚えさせるとき、一番つらいのが学習データを作るところです。

学習データを作るAIが欲しいぐらいでしょう。

従来からの統計モデルも、モデル構築用のデータ(機械学習で言うところの学習データ)を取得するところだけで、実験計画法という名前で1つの学問領域になっているぐらいですから、昔からある課題です。

学習データを、人の教育の世界で考えれば、教材作りに該当します。

どう学習させるかというカリキュラムを作り、そのカリキュラムに沿ったドリルを作り、公文の問題集を何度も解かせるかのように、似たような問題を学習させる。

結局のところ、「人力」です。

といいうことで、AIの限界とデータ活用の未来

ところで、GAFAに代表される企業は、データを上手く分析し活用することで、急成長した事実があります。データを独占し成長していると、批判されるぐらいですから。データ保有格差です。

つまり、データ活用の未来は、GAFAが切り開きました。数十年で世界的な巨大企業になるほどの未来です。

一方で、データ活用といっても、そのためのお守りやAI化までとなると、「」が欠かせません。

今後、どのように発展していくかは分かりませんが、現時点では「」が欠かせず、当分そうでしょう。シンギュラリティ―が起こらない限りは。

今回のまとめ

今回は、「GAFAからみるAIの限界とデータ活用の未来」というお話しをしました。

2018年11月3日の日経新聞の朝刊の一面に「GAFAに社会共存の風圧 課税や賃上げ、下がる利益率」という記事を発端とした、私と知人との間の何気ない会話をもとにした、お話しでした。

GAFAに今後課されるコストとして、情報流出の対策コスト、記事ではそのための人件費が主なもの、となっていました。

データのセキュリティーこそ、AI(人工知能)あたりが得意とするのでは? と思う人も多いのかもしれません。実際は「人力」です。

そもそも、AIの学習データを作るのも、結局のところ「人力」の要素が大きいです。

それが、現在のAIの限界かと思います。AIへの取り組みが進んでいそうなGAFAでさえそうなのですから。

一方で、GAFAに代表される企業は、データを上手く分析し活用することで、急成長した事実があります。データ活用の未来は明るいです。

なぜならば、生かされていないデータは、まだまだ企業内にも家庭内にも行政内にも、いたるところにあるからです。

IT化されると、副産物としてデータが発生するからです。20年前にと比べると、ものすごくIT化しています。つまり、ものすごくデータが発生しているからです。