AI・データサイエンス初心者がKaggle・SIGNATEに挑戦!タイタニックのその先へ

「プログラミングでAIを勉強したい。」「データサイエンティストになりたい。」という方も多いのではないでしょうか。

しかし、独学でプログラミングの勉強をする際、モチベーションの維持が難しい問題があります。

たけ
たけ

私もプログラミングを独学で勉強を始めた際、モチベーションを維持できず、挫折することが何度もありました。

そんな方はKaggleやSIGNATEなどのコンペに参加することをお勧めします。

実際の企業のデータを用いてデータ分析をすることで、AIやデータ分析のスキルを確実に身に着けることができます。

本記事ではAI・データサイエンス初心者の私が実際にKaggleやSIGNATEに挑戦し、初心者におすすめするコンペを紹介します。

コンペに挑戦したいけど何から始めたらよいかわからない方は是非ご覧ください。

こんな方におすすめ
  • AIやデータ分析の興味のある方
  • プログラミングの学習が続かない方
  • AI・データ分析に興味のある方
  • どのコンペに参加すればよいかわからない方
  • kaggleのタイタニックコンペ後何をするべきかわからない方

Kaggle・SIGNATEとは

Kaggle(カグル)とは世界中の機械学習・データサイエンスに携わっている約40万人の方が集まるコミュニティです。

Kaggleでは、企業や政府などの組織とデータ分析のプロであるデータサイエンティスト/機械学習エンジニアを繋げるプラットフォームであり、最大の目玉とも言える「Competetion(コンペ)」がKaggleの最大の特徴です。

Competition(コンペ)は、企業や政府がコンペ形式(競争形式)で課題を提示し、賞金と引き換えに最も制度の高い分析モデルを買い取る仕組みとなります。

たけ
たけ

スキルを身に着けられるだけでなく、高いスキルを身に着ければ賞金も手に入れることもできます。

一方、言語は全て英語なので、英語力も求められ、初心者は始めにくいかもしれません。

SIGNATEとは日本版Kaggleといわれている日本初のAI開発コンペティションサイトです。

データ分析に関するコンペティションを開催しており、好成績を残したデータサイエンティストは賞金や実績を得ることができます。

たけ
たけ

日本のサイトであるため言語も日本語であり、Kaggleに比べて競争相手が少ないため賞金を得られる確率が高くなります。

また、学習するためのコンテンツも豊富で初心者にはお勧めです。

初心者オススメの学習手順

プログラミングはしたことがあるか、データ分析コンペに参加したことはないけど参加して大丈夫かな?

たけ
たけ

大丈夫です。難しいコンペから初心者向けのコンペまで幅広くあります。

データ分析初心者である私がおすすめするコンペを紹介します。

一方、下記のコンペは全くのプログラミング初体験者にとっては難しい内容だと思います。

そのような方はUdemyの受講をお勧めします。

Udemyとは、100,000以上の講座があるオンライン学習プラットフォームで、教えたい人が講座を開き、学びたい人が学べるサイトです。プログラミング初心者向けの講座も多数あるため大変おすすめです。

Udemyはこちらから⇩

おすすめ学習手順
  • KaggleとSIGNATEに登録
  • Kaggle タイタニックコンペ参加
  • SIGNATE 自転車の走行距離予想
  • SIGNATE お弁当の需要予想
  • SIGNATE 国勢調査からの年収予想
  • Kaggle タイタニックコンペの高精度化

0. KaggleとSIGNATEに登録

まずはKaggleとsignateに登録しましょう。

登録しないとこれから紹介するコンペに必要なデータのダウンロードができません。

コンペに参加するために必須なので必ず登録しましょう。

ともに無料で登録できますので、料金に関する心配はありません。

たけ
たけ

登録しない事には何も始まりません。

GoogleアカウントやFacebookアカウントを紐づければ数分で簡単に登録できます。

各サイトへのこちらから⇩

1. タイタニックコンペに参加

コンペはこちらから⇩

まずはKaggleのタイタニックコンペに参加しましょう。

kaggleの使い方やデータサイエンスの概要を理解できます。

データサイエンスの基本なる手順である

  • 欠損値の補完
  • 前処理
  • モデル化
  • 学習
  • 提出

などの基本を学ぶことができます。

また、機械学習で用いられる手法のランダムフォレストについても勉強になります。

たけ
たけ

最初はわからない部分も多いかもしれませんが、一行づつ理解していきながら、提出まで流れを意識しながら取り組みましょう

本コンペの初心者オススメの解説記事はこちらをご覧ください。⇩

たけ
たけ

上記記事を参考にして提出までの一連の流れを一度行ってみましょう。

コンペの流れを理解できるはずです。

一方でまだ正答率が低いので本記事の最後に再挑戦したいと思います。

2. SIGNATE「自動車の走行距離予想」

タイタニックコンペはできたけど、そのあと何に取り組めばいいのかわからないよ。

Kaggleは全部英語だし、全部内容が難しそう。

たけ
たけ

そんな方にはSIGNATEのコンペに参加することをお勧めするよ。

日本語で取り組みやすいし、Kaggleより初心者向けのコンペが充実しているよ。

データサイエンス始めたばかりの方はまずタイタニックのコンペに参加する方は多いと思います。

しかし、タイタニックコンペの後に何をすればよいか分からない方も多いと思います。

私もタイタニック後、自分にできそうなコンペをkaggle内で探しましたが、丁度よい難易度のコンペを見つけられませんでした。

そんな方におすすめなのはSIGNATEのコンペに参加することです。

SIGNATEはAI・データサイエンス初心者向けのコンペや学習コンテンツが充実しています。

その中でも得に「自動車の走行距離予想」は初心者向けでお勧めです。

コンペはこちらから⇩

欠損値がなく、データの前処理もタイタニックに比べて非常に簡単で予測もしやすいので、練習問題には丁度良いと思います。

もし難易度が高いと感じた場合は、SIGNATEの学習コンテンツを活用をお勧めします。

一つ一つ丁寧に手を動かしながら学習できるので、理解が深まります。

たけ
たけ

私はまず無料でできるSIGNATEの学習コンテンツで学びました。

その後コンペに参加するとさらなる理解向上につながります。

オススメの初心者向け解答例⇩

上記記事では回帰分析を用いた走行距離の予想をしています。

回帰分析とは何か理解するよい教材になると思います。

3. SIGNATE「お弁当の需要予想」

続いてはSIGNATEの「お弁当の需要予想」です。

本コンペも自動車の走行距離予想と類似した内容で、知識の定着にはちょうど良い内容だと思います。

まずは自動車の走行距離予想を参考に答えを観ずに、取り組んでみましょう。

コンペはこちらから⇩

たけ
たけ

まずは簡単な問題に取り組み、知識の定着と自信をつけることが重要です。

一つ一つ着実にスキルアップしていきましょう。

おすすめの回答記事⇩

4. SIGNATE「国勢調査からの年収予想」

「国勢調査からの年収予想」もお勧めです。

数多いデータから年収を予想するコンペです。

コンペはこちらから⇩

たけ
たけ

紹介したSIGNATEの3つのコンペは初心者向けであり、初心者には取り組みやすい内容です。

手を動かしながらプログラミングを書くことで、理解が深まります。

解答例をコピーするだけでなく、より精度の高い自分の解答を作成することでさらに理解が深まるでしょう。

おすすめの回答記事⇩

5. タイタニックコンペのやり直し

最後にタイタニックのコンペに再度挑戦して正答率80%以上を目指しましょう。

ここまで3つのコンペを経験して確実にスキルがアップしたはずです。

再度タイタニックコンペに挑戦し、復習と、さらなる精度向上にはどうすればよいのか学習を重ねることが重要です。

たけ
たけ

80%以上目指すのが難しい場合はSIGNATEの練習問題をさらに取り組みましょう。

タイタニックコンペは学ぶ要素が多く、何度も取り組むことでスキルが身につきます。

おすすめタイタニックコンペ学習記事⇩

その他初心者オススメコンペ

kaggle「house prices」

SIGNATE「賃貸物件の家賃予想」

まとめ

データサイエンスの勉強したい方向けに、コンペ未経験者におすすめのデータ分析コンペを紹介しました。

KaggleやSIGNATEには多数のデータ分析初心者向けのコンペがあり、複数のコンペに参加することをお勧めします。

その後は書籍による勉強やUdemyなどのオンライン授業を受けることをお勧めします。

データサイエンティストは今後さらに需要が高くなる職業といわれております。

一朝一夕にはスキルは伸びないと思いますが、継続して一緒に楽しく勉強しましょう。

プログラムやコンペに関して疑問点やご意見ございましたら、コメントしていただけると嬉しいです。

Udemyはこちらから⇩

本ブログではインデックス投資を初心者にはお勧めしています。

ぜひこちらの記事を参考にして投資をはじめ、豊かな資産を築きましょう。

また、pythonを用いて株式解析と時系列分析をしています。

プログラミング初心者でも簡単にシミュレーションを動かすことができますので、興味のある方は是非参考にしてください。

また、大人気のETFであるVT,VTI,VOOについてもpythonで比較しました。

配当金は少ないものの高い値上がりが期待できます。

本記事の内容と比較することで自分がしたい投資手法を考えるきっかけになると思います。

pythonの学習にはUdemyがおすすめです。

世界最大が学習プラットフォームで自分に合ったプログラムを選択できます。

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA