機械学習を基礎から学ぶ

機械学習を基礎から学ぶ

2022年1月実施


外部ベンダーの方にお願いして機械学習基礎研修を行いました。
アルメックスR&D本部にはAIロボティクスグループというAIの研究開発を行うチームがありますが、このチームにジョインした機械学習はじめてのメンバーと、検証テストを行うチームやプロジェクト管理チームのメンバーが参加し、機械学習の基礎的なトレーニングを実施しました。


研修の際に数学の知識を必要としたため、数学から10年以上離れていて思い出すのに苦労した社員もいたようでした。しかしながら、数学のバックグラウンドがあることは研修内容を理解することに役に立ったようでした。

1日目:データ分析の基礎と実データを用いた探索的データ分析について学ぶ

まず最も基本的なこと、データを使って何を解決したいのかを明確にすること、そのうえでデータの取得、そして仮説と分析が必要なことを学びました。「探索的データ分析」と聞くとすごく難しいことのように感じますが、実はエクセルでもできることがあるんです。研修ではPythonを利用しましたが、可視化することで仮説の検証をしたり、新たな仮説を発想したりできました。

2日目:多変量解析とその解釈について学ぶ

主成分分析を行い、ヒートマップで可視化しました。Pythonではヒートマップや散布図を使って簡単に可視化できますが、見えたものからどう解釈するかによって、次の行動が変わってきますね。

3日目:回帰分析とPythonによる実装について学ぶ

ここで学習と推論に入ります。2つ以上の変数から解析を行う重回帰分析を実装しました。
Pythonに用意されているライブラリを使いましたが、本当の意味で理解するためには、数学の知識が不可欠だと感じました。また、ホールドアウト法(holdout method)を使って、学習用データセットとテスト用データセットに分割しました。

4日目:前処理と教師なし学習

最終日の研修では画像の分類を行いました。アルメックスでは機械学習を、主に画像処理の分野で用いています。少ないクラスでの画像分類でしたが、研修で画像解析のイメージができたことは、今後の開発に、そして開発に向けての持続的な学習のいい経験になったと思います。
加えて、分類の結果について評価する指標としてAccuracy、Precision、Recall、F1scoreを学びました。よく精度としてAccuracyが挙げられますが、問題によって適切な評価指標を選択する必要があるそうです。パターンによって指標を選ぶこともあるようですが、ビジネス要件によって求める結果が異なってくることもあるということですので、経験を積んだり、他社事例を確認したりが必要になってくるのかもしれません。

以上、機械学習の基礎講座でした。
アルメックスには資格取得支援金制度があります。機械学習に関する資格取得も対象となっており、G検定やE資格を目指して学習を続けている社員もいます。引き続き応用編の研修を企画するなど、Dojoでは社員の学習支援とキャリア形成をサポートしていきます。
(Dojo 育成担当)