CATEGORY

データサイエンス

データサイエンスあれこれ

【独学】未経験者に向けたPython学習マップ

AI時代の到来を受けて、大人気プログラミング言語となった「Python」。 ただ興味を持ってみたものの『何から始めたらいいのかわからない。』 という人は意外と多いです。   そこでこの記事では、非情報系Python未経験者が、自走できる中級者なるまでの「最短独学ロードマップ」を紹介していきます。 機械学習への応用方法や、上級者になるための道標も紹介するので、ぜひ最後まで見ていってください。   独 […]

【Pandas】これだけで9割カバー!頻出メソッド20 解説 使い方 まとめ

この記事では、Pythonのデータ分析用ライブラリPandasについて、頻出のプロパティ・関数・メソッドをまとめていきます。 どの場面で、どんな使い方をするか?をメインに置きながら、Pandasへの理解を深めるためのTipsもできる限り詰めこんでみました。 ぜひPandasの「ハンドブック」として使ってください。 また、Python自体が不安な人は、独学にオススメの教材をまとめておいたので、参考に […]

1ヶ月で統計検定2級に合格した勉強法

1ヶ月弱の勉強期間で統計検定2級に合格できたので、その勉強法を紹介していこうと思います。 85点は取れるかな?なんて思ってましたが、なんとも言えない点数になってしまいました(笑) ただ時間面・金銭面の両方において最も少ないコストで合格できたと思います。 お金を払うのは、受験料(¥7000)と公式問題集だけ。 これから統計検定二級を受けようと考えている方は、ぜひ参考にしてみてください。     バッ […]

【数学】苦手な人のための『微分積分』学習マップ

今回は数学が苦手な人に向けて「微分積分の入門ロードマップ」を紹介していきます。 大学の授業や独学で挫折してしまった人も、このロードマップに従えばスムーズに入門できるようになっています。 ぜひ最後まで読んでいってください。   前提となる高校数学 まずは「大学の微分積分」を学ぶ上で必要な前提知識を効率よく学ぶ方法を紹介します。 最低限ここで上げている内容の知識は理解しておけば、大学の微分積分もスムー […]

【数学】苦手な人のための『線形代数』学習マップ

今回は、僕の知る限りもっとも優しい「線形代数の入門ロードマップ」を紹介していきます。 大学の授業や独学で挫折してしまった人も、このロードマップに従えばスムーズに入門できるようになっています。 ぜひ最後まで読んでいってください。   高校数学の前提 線形代数を学ぶ前提として、教科書レベルの高校数学は一通り学んでおく必要があります。 でなければ「何のこっちゃ分からん」状態になります。 オススメの参考書 […]

苦手な人のための数学勉強ガイド

データ活用の時代が到来し、統計学を中心とする「データ分析スキルとして数学力」が広く求められるようになっていますね。 そんな時代だからこそ 『数学を勉強しないといけないけど、苦手意識があってどうしても手が出ない』 という悩みを抱えている方は意外と多いのではないでしょうか? 僕も以前はそうでした。数式を見るだけで頭から変な音が聞こえてくるレベル。 それでもあきらめずに試行錯誤を続け、国立の理系大学院で […]

データサイエンスのためのやり直し数学入門書20選

統計学や機械学習アルゴリズムなど、データサイエンスを学んでいくと数学力不足で理解が進まないことが良くありますよね。 お察しの通り、データサイエンスを学ぶなら数学は避けられません。 どうせ必要になるなら、取り組むのは早ければ早いほどいいでしょう。 今回は「数学の学び直し」を決心したあなたに、各段階ごとのオススメ数学入門書を紹介します。   高校数学やり直し書籍 まずは高校レベルの数学から学び直したい […]

GCE上のファイルをVScodeで編集する方法

今回はGoogle Cloud Platform(GCP)のConpute Engine上のファイルを、ローカルのVisual Studio Codeから編集する方法を紹介します。 とはいっても同じような記事はたくさんあるので、今回は僕が参考にした記事中で「ここは初心者に優しくないのでは?」と感じた部分に重点を置いて解説していきます。   今回、参考にした記事はこちら。 ☞ VSCode+Remo […]

【Python】 ロギング(logging)の使い方を分かりやすく解説

現在、Kaggleにガチ挑戦中のツクダンです。 いろいろな書籍・動画を参考にして学習を進めていますが、以下のYouTube動画での「ログをとる(コード実行中におこるイベントを追跡・記録)」という操作が有益で驚きました。 ただそこで出てくる「loggingモジュール」の使い方がわかりにくかったので、頭の整理ついでに記事にまとめることにしました。 loggingを初めて使う人にも分かりやすくまとめてあ […]

メダルを目指すKaggle初心者に向けた書籍9選

この記事では、Kaggleメダル獲得を目標にしている初心者に向けて、オススメ書籍をいくつか紹介したいと思います。 この記事は、こんな人にオススメ!   初心者がKaggleで戦うための5冊 まずはKaggleでメダル獲得を目指すのに役立つ書籍を5つ紹介していきます。   データサイエンスハンドブック データサイエンス始めるなら、そばに置いときたい一冊。 データサイエンスに必要なPythonライブラ […]

【Kaggle】データ分析の流れをザックリ解説

この記事では、Kaggleデータ分析の流れを6ステップに分けて紹介していきます。 これからデータ分析を学ぶ人が、データ分析の全体像を把握するのに最適な内容にしていますので、参考にしてみてください。 ※今回はKaggle入門者の練習に使われる「Titanic」問題を例に進めていきます。   kaggleで勝つデータ分析の技術 今回の内容の多くの部分は「Kaggleで勝つデータ分析の技術」を参考にして […]

【Windows】GCE VMインスタンスをローカルマシンで操作する

本格的にKaggleに挑戦することになったので、その中で発生した問題の解決策を共有。 この記事では「Google Cloud上での仮想マシンを、ローカルなWindowsで使用する手順」を説明していきます。 具体的には以下の6ステップ。   今回の内容は次の動画で解説されていた環境構築を、Windowsユーザー向けに補足したもの。 もし分かりにくい部分があれば、動画を確認してみてください。 動画内で […]