2021-02-01から1ヶ月間の記事一覧

クラスタリング②

こんにちは!EMです^^ 今回は前回の続きとして、クラスタリングについて学んでいこうと思います。 この前は、一目でわかる比較的簡単なデータを使ったので今日は少し複雑なデータを使っていこうと思います。 #いくつかのデータを作っていきます mean = [3,3]…

【社会人の方必読!】未経験からたった6か月でデータサイエンティストになる方法

こんにちは!EMです^^ まもなく2月も終わりますね。 この前までお正月だったのに、もう2か月たった、、、という方も多いのではないのでしょうか。 という事で、今回超絶変化の激しい2021年に、データサイエンティストのスキルアップを通じて自分に自信を持…

クラスタリング

こんにちは!EMです^^ 今回はクラスタリングについて解説していきます! クラスタリング クラスタリングとは、似たようなデータを同じグループに入れるモデルの適合です。 分類(従属カテゴリ変数を含むモデルの適合)は、クラスタリングの形式と考えること…

【機械学習】教師なし学習-KMeans・ラベルなしデータ

こんにちは!EMです^^ 今日からは教師なし学習について解説していきたいと思います! 機械学習に興味がある方なら、一度は聞いたことのある単語ではないでしょうか。 さっそく教師なし学習とはなにか、どうやって使うのかを見ていきましょう! 教師なし学習-…

機械学習エンジニアってなんだろう?

お久しぶりです!EMです^^ 2月も半分が過ぎてしまいました。早いですね~。 私が住んでいるトロント市は現在ロックダウンしており その上今週から非常事態宣言も発表されて、ますますコロナの厳戒態勢が 強まっていました。 ただ、周辺の地域はロックダウン…

分類アルゴリズム~決定木~おまけ編

こんにちは!EMです^^ 今回は分類アルゴリズム関連の知って得する知識をさらっと学んでいこうと思っています! 分類アルゴリズムのヒント(Classification Tips) 高いカーディナリティ(high cardinality) 機械学習の世界では、「カーディナリティ」とは、…

【機械学習・データ分析を勉強している方必見】オススメの本2選!

こんにちは!EMです^^ 今回は私が最近読んだ機械学習系の本を紹介していきたいと思います! サイトで検索する事も、勉強にはかかせませんがやはり本を読むと、全体的の流れがつかみやすいのと情報の中身がかなり安定しているので、信頼できる情報が多いです…

分類アルゴリズム~決定木④アンサンブル手法~

こんにちは!EMです^^ 今回も引き続き決定木シリーズを解説していきます! メインのテーマはアンサンブル手法です! アンサンブル手法(Ensemble methods) ランダムフォレスト: たくさんの決定木を並行して構築し、多数決を使用して出力を1つのモデルにか…

分類アルゴリズム~決定木の視覚化~

こんにちは!EMです^^ 今回も引き続き、決定木の特に視覚化について学んでいきたいと思います。 決定木の視覚化(visualizing trees) 構築した決定木を視覚化していきましょう。 その為に、プログラムを含む2つの新しいパッケージをインストールしていきま…

分類アルゴリズム~決定木②~

こんにちは!EMです^^ 今回も引き続き、決定木について解説していきたいと思います。 決定木①では決定木が過学習しやすいというお話をしました。 では過学習してしまった時、どのように対処していくのかという事をみていきましょう。 正則化(Regularization…

分類アルゴリズム~決定木①~

こんにちは!EMです^^ さっそく今日も分類アルゴリズムシリーズをはじめていきたいと思います。 今日のテーマは「決定木」です! 決定木(Decision Trees) 決定木はイメージしやすいかもしれません。 例えば、10個ほどの質問をして、答えにたどり着くタイプ…

分類アルゴリズム~SVM~

こんにちは!EMです^^ 今回も分類アルゴリズムシリーズとして、解説していきたいと思っています。 今日はサポートベクターマシーンです! ロジスティック回帰と同様に、サポートベクターマシーン(SVM)は2つのグループの間にまっすぐな境界線を描きます。 …

分類アルゴリズム~ロジスティック回帰~

こんにちは!EMです^^ 今日はロジスティック回帰について学んでいこうと思います。 ロジスティック回帰(Logistic Regression) ロジスティック回帰は、カテゴリーデータを分類するための最も基本的かつ効果的なツールの1つです。 線形回帰では、下の形式の…

分類アルゴリズム~アルゴリズムに適応させるまでのおさらい~

こんにちは!EMです^^ それでは本日からは分類アルゴリズムシリーズをいくつか紹介していきたいと思っています! 詳しくは ロジスティック回帰(Logistic Regression) サポートベクターマシン(Support Vector Machine) 決定木(Decision Trees) アンサン…

モデルの保存方法

こんにちは!EMです^^ 今回は、作成したモデルの保存の仕方についてさらっと解説していこうと思います。 モデルを適合させて、その出来が良ければ、再度分析を繰り返すときにまたそのモデルを使いたいと思います。 モデルの適合は莫大な時間がかかるプロセス…

Train-Test Splitってな~に??

こんにちは^^EMです。 今回は(私が)分かりそうで理解できていなかった Train-Test Splitについてのお話です! 今回は、データをトレーニングデータとテストデータの2つのグループに分けていきます。 モデルはトレーニングデータに適合され、トレーニングと…