アップルからグーグル、トヨタまで、世界中の企業が機械学習でAIシステムの開発にリソースを投入しています。
人工知能の歴史は意外に長いです。
1950年代から人工知能は存在していました。過去60年以上の歴史があるということです。
そして近年、大規模なデータの保存、高性能並列処理、高度なアルゴリズムの爆発的な発達に伴い、AIのルネッサンスの実現が見えてきました。AmazonからFacebook、Googleの企業が主導権を握っています。
AIにはさまざまな形があります。
その中でも、機械学習は今日最も広範囲にわたって活用されています。
いまさら感はありますが、今回は機械学習について紹介したいと思います。
機械学習とは何か
機械学習はAIの中のひとつの分野です。
明示的なプログラミングに頼るのではなく、コンピュータが大量のデータを使用し、アルゴリズムを適用して自分自身で学習し、予測をするシステムです。
1997年にチェスでギャリー・カスパロフを破ったIBMのディープ・ブルーのような多くの初期AIプログラムはルールベースでした。
人間によるプログラミングに依存していましたが、機械学習はコンピュータが自分で教え(実際に思考はしていない)、独自のルールを設定できるツールです。
2016年、GoogleのDeepMindは、機械学習訓練そのものを大規模なデータ操作で使用して、碁の世界チャンピオンを破ったことが大きなニュースになりました。
機械学習のタイプ
機械学習にはいくつかのタイプがあります。
以下に紹介します。
教師あり学習
教師あり学習では、訓練データと呼ばれる問題と答えがセットになったデータをシステムに与え、それをもとに学習させます。
教師なし学習
教師なし学習では、システムに入力データが与えられ、システム自体が入力データのパターンを発見するために単独で学習します。
強化学習
強化学習では、システムは入力を連続的に受け取り、常に改善していきます。
なにはともあれ入力データが必要
「機械学習を使おう」と意気込んでも、それ単体では何の役にも立ちません。
入力するデータが必要です、
機械学習のためのアルゴリズムを訓練するには大量のデータです。
たとえば、「赤」と「丸」がシステムに入力され、その結果「りんご」と出力されます。
機械学習の多くのケースでは、階層化されたアルゴリズムを使用してネットワークを形成し、情報を処理して予測に到達する機械学習のサブセットである「深層学習(Deep Learning)」が関係しています。
深層学習が機械学習と違う点は、システムが人間の訓練なしでそれ自身で学習できるという点です。
機械学習のアルゴリズム
「機械学習」とひとことで言っても、アルゴリズムの種類がいくつもあります。
おおまかに大別すると以下の4種類になります。
・分類(Classification)
・回帰(Regression)
・クラスタリング(Clustering)
・次元削減(Dimensionality Reduction)
詳細な解説はここでは省きますが、それぞれのアルゴリズムには、解決するのが得意な分野があります。
これらのアルゴリズムはさらに細分化されますが
機械学習を活用するために、適切なアルゴリズムを選ぶことが大切です。
Pythonのscikit-learnのチュートリアルに
適切なアルゴリズムを選ぶためのフローチャートがありますので参考になります。
まとめ
今回は、機械学習について紹介しました。
ビジネスで機械学習を活用したいという要望が増えてきています。
まずは、機械学習というものはどういったもので、何ができるのかを理解することが大切です。