回帰分析とは①

こんにちは!EMです^^

 

本日は回帰分析とはなんぞや?という話をしていきたいと思います。

回帰分析を理解する為に、おさえていきたいのが下の二つ。

 

・コスト関数やエラー

・反復解法、最急降下法

 

 

なにやら難しい単語が出てきましたね。

はじめて見る方には抵抗感しかないかもしれません。

こちらは次回以降に解説していこうと思います。

 

まず、回帰分析の一種で線形回帰というものがあります。

 

 

名前は難しいですが、見た目は棒線グラフです。

線形回帰とは2つの連続した数(変数とも言います)の関係を表す方法です。

 

相関係数とは2変数との関係の強さを表しますが

一方で、線形回帰を使用すると、それらの間の関係を描いて

従属変数の新しい値を予測できます。

※従属変数とは独立変数の変化に応じて変わる値です。

 

基本的な線形回帰は、従属変数を相互の値に応じてモデル化します。

これはデータを通じて「ベストな線」を描くための統計的手法になります。

 

import seaborn as sns
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
pd.options.display.max_columns=500

 

import warnings
warnings.filterwarnings("ignore"#warning suppressor
x = np.random.normal(size = 100)
y = 3 * x + np.random.normal(scale = 3, size = 100) + 2

sns.lmplot('x''y', pd.DataFrame({'x':x, 'y':y}));
 

f:id:tennisfashionista:20210118012153p:plain

 

従属変数のyと独立変数xの関係は数式でこのように記述できます。

         y=β01X+ϵ

 

ここで、β0は切片、β1は勾配(傾き)、ϵ がランダムエラーを表します。

 

 

 

ちなみに皆様に朗報です!

私今まで知らなかったんですが、CodeCampさんが無料で5回分無料レッスンを

されているらしいです、、、!

私が他のオンラインスクールで機械学習のコースを受講した際は

グループレッスンで約2倍のお値段を払ったので

完全マンツーマンでこのお値段は超良心的だなと思います。。。

 

 

 

ぜひ気になる方は無料体験もされてるみたいなので、一度WEBサイトを見てみてくださいね。

データ分析は時代が変化しても、必ず重宝される分野だと思っているので

プロから基礎を学ぶのは、本当に超効率的な自己投資だと思います。

 

 

 

 

これからどんどん内容がMLっぽくなっていきますよ~!

では次回お楽しみに^^