進捗(5/13~5/20)人工知能・機械学習・深層学習の関係

 先週の記事で紹介したとおり、すべての人工知能の共通項は「人間と同じ知的作業をする機械を工学的に実現する技術」と考えることができる。この「工学的に実現する技術」の例として、機械学習があり、機械学習の一形態として深層学習が存在する。なお、深層学習はニューラル・ネットワークを多層化したものであるが、しばらくの間、ニューラル・ネットワークのことは忘れて、話を進める。

人工知能>機械学習>ディープ・ラーニング

人工知能と機械学習の関係

人間と同じ知的作業」に入る前段階として、情報をシステムにインプットして、コンピュータの世界で処理できるようにする、という工程が必要だ。たとえば、画像情報を処理する場合、インプットとなる画像データは、カメラなどを経由してシステムにインプットされ(ステップ1)、「0」と「1」で表記できる形式に変換される(ステップ2)。そして、何らかのアルゴリズムで処理されて(ステップ3)、結果がアウトプットされる(ステップ4)。機械学習は、このステップ3~4の部分にあたる。

機械学習のアルゴリズムの分類

市販テキストによく見られる分類として、下記の3分類がある。

教師あり学習

実績値など既存のデータを利用して、過去のデータ(インプット:x)から未知のデータ(アウトプット:y)を予測する方法。既存のデータを利用して、未知のデータにラベル付けをする、ともいえる。

  • 回帰

過去の記録から、数値を予測する (例:札幌駅付近で家賃10万円/月で住める部屋の広さはどのくらいか?)

  • 分類

過去の記録から、カテゴリを予測する(例:このジャガイモは「男爵」or「メークイン」?)

教師なし学習

アウトプットを予測するのではなく、インプット(x)のデータ特性・データ構造を理解する方法。

  • クラスタリング

仮定に基づいて、インプットデータ(x)の集団の特性を予測する。教師あり学習の分類との相違点は、判断基準となるラベル(教師)があるかどうか。(例:カフェのマーケティング戦略において、ある集団データを「毎日スタバに行きそうなグループ」「コンビニのコーヒーを買いそうなグループ」「その他の店に行きそう/自分で作りそうなグループ」「コーヒーは飲まなさそうなグループ」に分類する。)

  • 次元削減

インプット(x)の要素を集約して、x全体の見通しが立ちやすいようにする。また、数値計算を単純化する。

強化学習

「報酬」が多くなる基準だけを決めて、データ(x)がほとんど存在しない状態で開始する方法。たとえば、試行錯誤をしながら、情報を蓄積し、どんどん賢くなる掃除ロボットなどがある。

教師あり学習(分類)の具体例

インプットとして魚の画像データを入れると、その名称がアウトプットされるようなシステムがあり、既存のデータベースとして、魚の画像と名称の対応表があるとする。アルゴリズムは何でもよい。

マルハニチロの鮭何でも辞典より(https://www.maruha-nichiro.co.jp/salmon/zukan/sakana02.html)

アルゴリズムで判断・出力した結果(正解 or 不正解)は、アルゴリズムにフィードバックされる。こうした学習を繰り返した結果、高い精度で予測できるようになる。

分類のアルゴリズムを繰り返す例

なお、①~⑥のサケマス類の名称は以下のとおり。

  • ① サケ(シロサケ)
  • ② ベニザケ
  • ③ ギンザケ
  • ④ カラフトマス
  • ⑤ マスノスケ
  • ⑥ サクラマス