『Kaggle Masterによるデータ分析技術者養成講座』を受講して

受講に至るまで

まず、どうしてRPAとかやってる人がデータ分析をやる(やろうとしてる)のか振り返ると、業務自動化の一環として、Rによるデータ集計を2019年からやり始めたのが入り口でした。

その後、自動化の文脈とはまた別で、Pythonによる大量データ集計と可視化に業務として取り組むことになり、そうすると統計の知識が必要になると思って勉強して統計検定を受けたりもしました。ちなみに学生時代は統計などとは無縁だったので、特に過去の蓄積はなく少しずつ勉強しているところです。

今のところ仕事で行うのは過去データの集計と可視化ですが、いずれ「予測もできないか」という話が出た時に、頼ってもらえるようになっていたい。でもデータ分析の他にも色々手を出しすぎてて、これはもう手取り足取り教えてもらわないと最初の一歩がなかなか進まない!

そう思っていたところへ、以前から気になっていたこの講座の開催通知が届いたので、受講に至った次第です。

受講してみて

冒頭のツイートの通り、すごく良いので同じような境遇の方には全力でおすすめしたいです。カリキュラムはこんな感でした。

第1回:12/2(水) 19:00 ~ 21:00 Python基礎(pandas, seaborn)、評価指標(AUC)について
第2回:12/9 (水) 19:00 ~ 21:00 決定木、過学習、クロスバリデーション法
第3回:12/16 (水) 19:00 ~ 21:00 ロジスティック回帰、変数加工
第4回:12/23(水) 19:00 ~ 21:00 アンサンブル学習(バギング、スタッキング)、発展的な機械学習モデル
第5回:12/30(水) 19:00 ~ 21:00 リークについて、ビジネス応用での注意点、データ結合

よかったポイントは色々あるのですが、私にとってどうだったのか考えてみました。

講義とハンズオンのバランスがちょうど良かった

講義で先生に教えてもらったことをサンプルコードを動かして確認して、今度はサンプルコードを自分なりに変えてみたらどんな結果が返ってくるんだろう?と確かめながら進めることができたので、最後まで続けやすかったと思います。

講義の内容は、本当に最低限これだけは、というところまで絞り込まれている感じがあった分、これだけは分かりたいと集中することができた気がします。

挫折しそうなポイントは講座の時間内にやる

講座の基本的なサイクルは、1回の講座で教わったことを使って次回までに自分でSIGNATEに投稿してスコアを上げる、となっていました。

そこで、例えば最初にSIGNATEに投稿するところなど、受講者がつまずきそうな所は講座の時間内にやってしまうなどの配慮があるように感じました。挫折しそうなポイントがあらかじめ潰されているのはありがたかったです。

受講の成果

まず、第5回まで受けた結果として、SIGNATEの練習問題で4,325人中の23位に載ることができました。 f:id:cerasite:20210103161151p:plain

また、後日開催されたBeginner限定コンペに参加して規定のスコアをクリアし、BegginnerからIntermidiateになることができました。

本当に、一般枠1人+学生枠1人=2人だけで受講するには贅沢すぎる講座なので、不定期開催で知られていないのがもったいないです。コンパスのグループに登録しておくと開催通知が来るので、気になった方はぜひ登録してみてください。

yukari17.connpass.com