Como fazer uma regressão linear com sklearn Introdução A regressão linear simples é um método estatístico que nos permite resumir e estudar relações entre duas ou mais variáveis contínuas (quantitativas). É uma boa idéia começar a fazer uma regressão linear para aprender ou quando você começa a analisar dados, uma vez que os modelos lineares são simples de entender. Se um modelo linear não é o caminho a seguir, então você pode mover para modelos mais complexos. A regressão linear tenta encontrar uma relação entre as variáveis. Scikit-learn é uma biblioteca de python que é usada para aprender máquina, processamento de dados, validação cruzada e muito mais. Neste tutorial, vamos fazer uma regressão linear simples usando esta biblioteca, em particular, vamos jogar com alguns dados gerados aleatoriamente que usaremos para prever um modelo. Exigimos que o usuário tenha um ambiente anônimo de python já instalado. Quando usar a regressão linear Quando você acha que existe uma relação entre a variável a analisar (X e Y), como vemos na figura 0. O que vamos encaixar é a inclinação (m) e o interceptor-y (b), Então vamos ter uma função como: y xm b. Neste caso, a combinação linear só tem x uma vez que estamos usando dados 2D, mas o modelo linear geral em que y é o modelo previsto é: Etapa 1: Instalando scikit-learn Teste que scikit-learn foi instalado corretamente :: Etapa 2: Gerar Dados lineares aleatórios Vamos escolher valores fixos de m e b para a fórmula y xm b. Então, com um erro aleatório de 1, irá gerar os pontos aleatórios. Normalmente, você não saberá antecipadamente esta informação, geramos esses dados para fins de ensino. Com esses pontos, vamos usar o sklearn para criar uma regressão linear e verificar a proximidade com os valores fixos m e b que escolhemos. Em nosso código, primeiro definimos a função f, que é uma função linear. Em particular, esta função adiciona - 1 de erro aleatório ao resultado, se não, vamos conseguir uma linha reta. Então, nós geramos 300 pontos aleatórios que usaremos para treinar um modelo. Se traçamos o ponto que iremos: Passo 3: Use scikit-learn para fazer uma regressão linear Agora estamos prontos para começar a usar scikit-learn para fazer uma regressão linear. Usando a lista de valores, alimentaremos o método de ajuste da regressão linear. Também separamos os dados em duas peças: treinar e testar. Com thet no passo 5, vamos medir o erro do modelo linear treinado. A saída deve ser semelhante a: Etapa 4: traçar o resultado Agora vamos traçar a regressão instalada: Etapa 5: Medir o erro A saída deve ser semelhante a: Como corrigir erro Erro: ImportError: numpy. core. multiarray falhou Para importar, tente atualizar numpy com: Se você não estiver usando anaconda: Como corrigir ValueError: Arrays encontrados com números inconsistentes de amostras Verifique se os valores X da função de ajuste são uma lista de lista de possíveis valores para cada Y. Por favor, ative JavaScript para ver os comentários alimentados por Disqus. sklearn. linearmodel. LinearRegression DEPRECATED: os resíduos são obsoletos e serão removidos em 0.19 Obter os resíduos do modelo ajustado. Retorna o coeficiente de determinação R2 da predição. O coeficiente R2 é definido como (1 - uv), onde u é a soma de regressão de quadrados ((ytrue - ypred) 2).sum () e v é a soma residual de quadrados ((ytrue - ytrue. mean ()) 2).sum (). A melhor pontuação possível é 1,0 e pode ser negativa (porque o modelo pode ser arbitrariamente pior). Um modelo constante que sempre prediz o valor esperado de y, desconsiderando os recursos de entrada, obteria um índice R2 de 0,0. X. Array-like, shape (nsamples, nfeatures)
Comments
Post a Comment