ロジスティック回帰分析

ロジスティック回帰分析とは、モデルが $log( \frac{1} {1 - p} ) = a_1 x_1 + a_2 x_2 + a_3 x_3 ...$ となるような ${a_1,a_2,a_3}$ ベクトルを探すモデルです。(上記pはベクトル、x1..xnは今既知の値です。）

一旦モデルを作成さえすれば、あとは実測値を入れるだけで良いのがポイントで、このあたりは回帰分析と同じとなります。それでは一体何が違うのでしょうか。

ロジスティック回帰分析では、２値のデータの予測をしたいときに利用します。(男か女か、イスラム教かそれ以外か、日本人か外人かなど）。回帰分析では、値の推定に正規分布を利用しているため、正規分布に従わない、たとえば０か１かしか取らないものの推定が出来ないのです。少し専門的な言い方をすると、量的変数の解析には回帰分析、質的変数の解析（ただし２値に限る）にはロジスティック回帰分析を使います。量的変数は連続値のデータで、質的変数は離散的なデータと捉えて問題ありません。

出力が２値ですので、面白い使い方として、たとえばこれをしたら売れるか（１）、売れないか（０）みたいな出力結果を得られます。ですので、例えばマーケッターの方があるターゲットに売れるか売れないかの２値をとる計算などにロジスティック回帰分析が使えます。

以下のような関数を使います。

P = exp( Z ) / ( 1 + exp( Z ) )　= 1 / ( 1 + exp( Z ) )

ここで、上記の中のZは次のように表します。

Z = B_0 + B_1*x_1+ B_2*x_2+ B_3*x_3 \dots

補足ですがPの式はよくみるとシグモイド関数です。このBの係数（偏回帰係数
とよばれる）を求めるために式を変形します。

ln( P / (1-P )) = Z

この式をみるとわかるとおり、あとは、最小二乗法を用いて偏回帰係数を求めるだけで、回帰分析と全く一緒となります。これにより、ロジスティック回帰分析が出来ます。なお、最尤法（コンピューターをぶん回してフィッティング関数を見つける方法）を利用する方法でも解は求まるのですが、ほとんど最小2乗法を利用した計算法で事が足ります。

参考文献

投稿者: 等々力康弘

画像処理エンジニア。組み込みソフト出身。株式会社モルフォにてR&D部門、主に機械学習業務に携わり、顔認識＆顔検出のアルゴリズム開発に従事。国内特許数件、国際特許１件。モルフォ社退社後、株式会社Dynaptico創業（CEO)。アメリカ人、スウェーデン人と３名とフードデリバリーサイトmaishoku.comを立ち上げる。社長業の他、開発業務においてバックグラウンド関連全般(Djangoを用いいたバックエンドサーバ＆APIサーバーの作成、リバースプロキシなどの負荷分散サーバ関連、OCRプログラムの作成、CISCOルータの管理, 、seleniumを用いたテストサーバーの構築、Androidアプリの開発等々）に携わる。 2019年DynapticoのCEOを辞職。 2020年2月にComputer Scienceに特化した株式会社OctOpt創業。 OSはUbuntu。Appleが苦手。Swiftのバージョンアップ対応とか死ぬほど嫌い。 Python/C++/C Twitter: @rocky_house シフト自動調整スケジュールサイトをVue.js+graphene djangoで構築. https://www.allshifter.com 等々力康弘のすべての投稿を表示

参考文献

おすすめの記事

投稿者: 等々力康弘

コメントを残すコメントをキャンセル

参考文献

おすすめの記事

投稿者: 等々力 康弘

コメントを残す コメントをキャンセル

投稿者: 等々力康弘

コメントを残すコメントをキャンセル