データサイエンス・マーケティング NOTE

DATASCIENCE / MARKETNG NOTE

AIが超えなければならない最大の壁とは。

Posted by tanabe on 2018/11/28 15:00:00

AI人工知能は、徐々に生活の一部にはいりこんでいます。インターネット、自動車、ゲーム、医療、その普及の状況は、枚挙にいとまがありません。しかし、最後に超えなければならない最大の壁が控えています。それは何でしょうか。

目 次

1.はじめに

2.AIとは

3.AIとその前世代のモデルの違い

4.AIと人間の違い

5.AIが超えなければならない最大の壁

 


1.はじめに

AI人工知能は、徐々に生活の一部にはいりこんでいます。インターネット、自動車、ゲーム、医療、その普及の状況は、枚挙にいとまがありません。しかし、最後に超えなければならない最大の壁が控えています。それは何でしょうか。

システム開発に携わっているような技術の方は、ネット上にたくさんのソースが公開されていますし、関連雑誌でも特集が組まれていますので、概要はわかっているでしょう。しかし、それを使う側のエンドユーザーは、AIが使われているのかどうかさえわからないまま、AIが組み込まれたシステムを利用しています。このようなAIの利用状況から、AIはこのまま生活の至る所に普及していくと推測できるでしょう。

しかし、私たちが様々な話を聞いていると、最後に超えなければならない大きな壁がありそうです。

今回は、AIについて、改めて整理しつつ、最大の壁についてお話ししたいと思います。


2.AIとは

まずは、AI(artificial intelligence)について整理しておきましょう。定番の広辞苑の記載を見てみましょう。

じんこう‐ちのう【人工知能】
(artificial intelligence)推論・判断などの知的な機能を人工的に実現するための研究。また、これらの機能を備えたコンピューター‐システム。1956年に、アメリカのマッカーシー(J. McCarthy1927?)が命名。知識を蓄積するデータベース部、集めた知識から結論をひきだす推論部が不可欠である。データベースを自動的に構築したり誤った知識を訂正したりする学習機能を持つものもある。

 

もう少し、優しい言葉で書いてみます。

AIとは、人間特有の記憶に基づく推論や状況に応じた判断という作業をコンピュータが代わってできるようにしたシステム。記憶の部分はデータベースが担い、推論や判断は数理モデルなどを使った処理システムが行う。

少しわかりやすくなったでしょうか。

システム開発などを全く知らない方にも少し開発プロセスも含めて解説します。まずはわかりやすい教師ありのモデルを自動車がどうかを

★開発段階

①データ収集

例えば、人間が子どもから大人になるまで何台の自動車を見るでしょうか。都市部なら道路を数分歩けば数百台は見ているでしょう。その他、テレビでもたくさんの自動車を見ることができます。しかも、上から見た自動車、横から、斜めから、前から、後からとたくさんの角度から見た自動車を記憶しています。私たちが記憶しているのと同じだけ、いや、それ以上の自動車の画像を集めて、AIの基礎データを作ります。

②学習データと評価データ

子どもたちは、親から「ブーブー」などと自動車のことを教わり、いつの間にか、それを自動車であること記憶、認識します。ボンネット部分、屋根部分、タイヤのこの丸い部分などから自動車のような形をしたものが「ブーブー」、つまり自動車であるとラべリングします。しかし、タイヤがなかったり、窓が無かったりすると、それは自動車ではないとラべリングします。これが学習データです。もし、タイヤが無いような人間なら明らかに自動車ではないと認識するような形のものに自動車であるとラべリングしてしまうと、精度の悪いAIが出来上がる可能性があります。

③データ加工

カラーの自動車の画像を集めたとしても、その自動車の中には別のものも一緒に写っていることが多いでしょう。道路、人、建物です。これらと自動車を分ける必要があります。また、赤い自動車、青い自動車、これらはどのように判別すればよいでしょうか。たくさんのことを判別できるようにデータを加工します。画像データであれば、エッジ検出、モノクロ変換などといった画像処理を行ないます。

④学習モデルの作成

では、学習モデルを作成します。といっても、学習モデルに使われるはたくさんありますので、ここでは割愛します。

VOST様が運営されているAI研究所https://ai-kenkyujo.com/2017/03/29/machine-learning-2/をご参考にどうぞ。

これらのモデルを用いて、学習モデルを作成、そして、評価データを使って検証します。モデルの柔軟性が高いほど計算が複雑になりますが、正答率も上がっていくと考えることができます。(比例が一次方程式のy切片が0としたモデル(y=ax)であるのに対して、一次方程式のy切片を0と固定しないモデル(y=ax+b)の方が柔軟性が高いということです)いくつかの学習モデルを作成して、正答率の高いモデルを採用します。

★運用段階

AIの一番の特徴は、データを集め続けて、モデルを修正し続けることでしょう。以前、ホンダが開発したインサイトというタイヤが半分ボディに隠れた車が発売されました。下の写真のような自動車です。これが発売されたのが1999年、このスタイルに非常に驚いたのを思い出します。では、これをAIでこれを自動車と認識できるでしょうか。このようなユニークな自動車が発売されたとき、システム上でどのように対処すればよいでしょうか。少し前までは、新しいモデルを作り直して、再度、組み込み直す必要がありました。今のシステムでは、AIが自動で判別しいくようなシステムになっています。

Honda_Insight_Back

 


3.AIとその前世代のモデルの違い

モデルの話をするには少しだけ統計を思い出す必要があります。私たちは、常に、原因と予測結果を考えて、悪い結果を招かないように行動します。低気圧が近づいて雨の予報があれば傘を持ち、休日に渋滞のが予測されれば出発時刻をずらすなどです。このように、私たちは、予測結果について常に原因を考えています。

①前世代のモデル

前世代のモデルは、重回帰分析、主成分分析ほか、無数の数理モデルが存在しますが、その多くは、因果関係を分析するためのモデルでした。確率モデルだったり、非確率モデルだったりと様々ありますが、とにかく、因果関係を説明しようと必死でした。比較的よく利用される重回帰分析などは、説明変数、被説明変数と解説されている統計学の専門書も多いです。そして、その変数間でどの変数の影響が強いのか、などを分析していました。

②AIで使われるモデル

AIで多用されるモデルは、ニューラルネットワークモデルと言われるモデルです。このモデルの特徴は、インプットに対して最適なアウトプットするということです。詳述すれば、そう単純ではないのですが、このモデルでは、原因と結果を説明することが非常に難しいです。天気を予測するために10種類のデータをインプット、その時の天気をアウトプットとすれば、その結果が最もよくなるようなモデルが作れます。しかし、どの変数がどの程度説明しているのかなどは全く関係ありません。データによっては偶然の一致のような変数が一番説明力が高いかもしれません。


4.AIと人間の違い

AIのモデルと前世代のモデルを整理してみると、そこにはAIと人間の大きな違いをみることができます。

私たちは、モデルの確からしさを判断するのに、観測結果と推計結果の相関係数を使います。過去の研究結果では、相関係数が0.7以上であれば強い相関関係にあると言われていました。これは、収集できるデータが限られていましたし、分析にも多大な時間を要したこともあったでしょう。多様なデータを利用でき、計算処理速度も上がった現在では、すでにAIのモデルの方が正答率が高くなることは言うまでもありません。

相関係数については前の記事「エンジニア必読:8種類の決定係数と相関分析 」をお読みください。

どちらが当たるかといえば、間違いなくAIでしょう。しかし、人間には原因と結果を説明したいという願望がありますが、AIは正答率を高めることだけだということです。これが、人間とAIの大きな違いです。


5.AIが超えなければならない最大の壁

AIを使って分析すると、データが多くなればなるほど正答率も高くなるでしょうし、一方で、因果関係の説明がしくくなります。そして、私たちが、業務として分析結果を報告する場合、どんなに複雑な計算でも、必ず、なぜそのような結果になったのか、説明を求められます。

これは、人間がもつ「知的欲求」という根源的なものともいえるでしょう。

つまり、AIは、この人間の「知的欲求」を超えなくてはなりません。

逆に、人間が「知的欲求」を捨て、AIが出す結果を鵜呑みにするようになった時、AIと人間はバランスを失い、いつかの映画のような世界が訪れるのかもしれません。

AIが「知的欲求」という最大の壁を超えられる日が来るのでしょうか.。 


 

オススメ記事

Topics: その他, データサイエンス, データ分析, 統計