時代は、ITを利用して企業や個人生活を効率化・利便化する段階から、ITはAIによる経済システムの激変や個人の生死を左右するような状況を生むような、今までは全く異なる「特異点」へ向かっているのかもしれません。

振り返って見れば、「あの時が歴史の転換期だった」と思うのが、「今」なのでしょう。

このような新たな世界のベースの基礎知識こそが「データサイエンス」であり「機械学習」です。データサイエンス、機械学習というと、難しいという印象を受けるかも しれません。たしかに、データサイエンスのなかの機械学習は、たとえば、迷惑メールと正常メールを、これまで蓄積されたデータを基に類別します、そして、その類別を理解については、カーネル法などの数学の知識が必要です。

ただし、実際に業務で機械学習を取り扱う際は、こうした数学的な理解はそれほど重要ではありません。むしろ、そうした機械学習の手法がどんな問題を解決し、何ができるかを把握することであり、数学はそのための道具にしかすぎません。

本講座では、こうした点を踏まえて、できるだけ数学を使うことなく、統計パッケージであるRを実際に利用することで機械学習の手法をマスターすることに注力しました。具体的には、第1時限では、Rのインストール、統計の初歩(平均、分散、相関係数)。第2時限では回帰分析、主成分分析、因子分析。第3時限では、アソシエーション分析、階層化クラスタリング、重回帰分析。第4時限では、カーネル法・サポートベクターマシン、ロジスティック回帰、決定木。第5時限では、k平均法、アンサンブル学習を取り上げました。

こうした各手法を理解する上で、本講座で重視しているのが、演習による実践です。こうした手法は、前述のように数式による説明はやはり難しくなってしまいます。だからこそ、Rを用いて、実際のデータを用いて、各手法で分析し、その結果を考察する。このプロセスを繰り返すことが、データサイエンスを学ぶための大事なステップといえます。一緒に機械学習を実践しましょう。

そして、この受講後には、全く異なるAI-Economy、脳型社会へはどのようなものかを体感できるでしょう。

フューチャーブリッジパートナーズ(株)
代表取締役 長橋賢吾

前回開催の様子

会 期
2014年11月26日~12月17日 19:00~20:30
会 場
ニフティ株式会社内 セミナルーム
主 催
株式会社インプレス

1時限目

Rのインストール、統計の初歩(平均、分散、相関係数)
概要
高校生程度の数学基礎(統計の基本)
内容
高校生程度の数学の復習、Rのインストール等Rの利用
使用テキスト 一部抜粋
(画像をクリックすると、内容をPDFで確認できます)

2時限目

回帰分析、主成分分析、因子分析
概要
基本的な分析種類の整理
内容
回帰分析、主要成分分析、因子分析、独立変数、独立変数の(有)(無)の分析、Rの演習
使用テキスト 一部抜粋
(画像をクリックすると、内容をPDFで確認できます)

3時限目

アソシエーション分析(機械学習の第一歩)、クラスタリング分析、重回帰分析、Rでの演習
概要
相関性、似たもの同士を集める
内容
アソシエーション分析、クラスタリング分析、重回帰分析、Rでの演習
使用テキスト 一部抜粋
(画像をクリックすると、内容をPDFで確認できます)

4時限目

機械学習
概要
データの分類と予測
内容
械学習(教師あり学習)、カーネル法・サポートベクターマシン、ロジスティクス回帰、決定木、
Rでの演習
使用テキスト 一部抜粋
(画像をクリックすると、内容をPDFで確認できます)

5時限目

機械学習
概要
クラスタリング データを自動的に仕分ける
内容
クラスタリング、K-平均法、バギング・ブースティング;ランダムフォレスト
Rでの演習、全5回のまとめ・質疑応答
使用テキスト 一部抜粋
(画像をクリックすると、内容をPDFで確認できます)