Regresion logística

Se utiliza para problemas biclase y donde las clases son linealmente separables. Sus prestaciones se pueden extender a problemas multiclase a traves de la tecnica "OvR". Este clasificador parte de la probabilidad a favor de un determinado evento, definida por la razon de momios.

Funciona para clases linealmente separables
Problemas binarios o biclase One vs Rest (OvR) Se puede extender a problemas multiclase

Razón de Momios

Relación de dos probibilidades, la razón a favor de un evento. Qué tan favorecido está un evento.

$OR = \frac{p}{1-p}$

donde $p$ es la probabilidad del evento.

Al OR le podemos calcular el logaritmo para obtener la función logit.

$logit(p)= \log\frac{p}{1-p}$

en terminos de los parametros de entrada a nuestra clasificador tendremos: $logit(p)= logit(P(y =1| \mathbf{x}))= w_0x_0 + w_1x_1+\dots + w_{1-p}x_{1-p}$

Cuando la razón de momios es muy pequeña sacamos logit para agrandarla

Lo que queremos hacer es depejar la probabilidad del evento, que se va a relacionar con la probabilidad de que una observación pertenzca a la clase con etiqueta $y-1$ . Para ello utllizamos la función inversa, que se denomina sigmoide

Método de clasificación

from sklearn import datasets
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import StandardScaler
import numpy as np
from numpy import linalg as LA

# Importar data de sklearn
iris = datasets.load_iris()
X = iris.data[:,[2,3]]
y = iris.target

# Separar los datos de entranamiento y los de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)


# Tecnica de remoción es la mejor!!!
def remocion_train(X) :
    X = X - X.mean(axis=0)
    X = X/X.std(axis=0)

    return X

def remocion_test(X_test) :
    media = X_train.mean(axis=0)
    desviacion = X_train.std(axis=0)

    X_test = X_test - media
    X_test = X_test/desviacion

    return X_test

x_train_norm = remocion_train(X_train)
x_test_norm = remocion_test(X_test)

clasificador = LogisticRegression(C=1.0, random_state=0)
clasificador.fit(x_train_norm, y_train)

y_predict = clasificador.predict(x_test_norm)
iguales = (y_test == y_predict).sum()
porcentaje = (iguales/60)*100

print('Muestras iguales %d/%d - Porcentaje: %d ' %( iguales, len(y_predict), porcentaje))

Regresión Logística

Regresion logística

Razón de Momios

Método de clasificación

results matching ""

No results matching ""