{"id":13,"date":"2023-11-11T17:43:56","date_gmt":"2023-11-11T20:43:56","guid":{"rendered":"http:\/\/localhost\/wordpress\/?page_id=13"},"modified":"2025-10-29T18:08:01","modified_gmt":"2025-10-29T18:08:01","slug":"predicao-com-regressao-linear","status":"publish","type":"page","link":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/","title":{"rendered":"Regress\u00e3o (Predi\u00e7\u00e3o)"},"content":{"rendered":"\t\t<div data-elementor-type=\"wp-page\" data-elementor-id=\"13\" class=\"elementor elementor-13\">\n\t\t\t\t<div class=\"elementor-element elementor-element-57b35f4a e-flex e-con-boxed e-con e-parent\" data-id=\"57b35f4a\" data-element_type=\"container\" data-e-type=\"container\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t\t\t<div class=\"elementor-element elementor-element-1d50040b elementor-widget elementor-widget-text-editor\" data-id=\"1d50040b\" data-element_type=\"widget\" data-e-type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--60)\" aria-hidden=\"true\">\u00a0<\/div>\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n<h1 id=\"INTRODUCAO-A-REGRESSAO\" class=\"wp-block-heading has-text-align-center has-black-color has-text-color has-link-color has-large-font-size wp-elements-44263e7757b69eebcf3c0dda0ef36e00\" style=\"font-style: normal;font-weight: 900\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">INTRODU\u00c7\u00c3O A REGRESS\u00c3O<\/mark><\/h1>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--50)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<p class=\"wp-block-paragraph\">Em 1885, o antrop\u00f3logo e estat\u00edstico Francis Galton protagonizou uma descoberta fascinante na an\u00e1lise estat\u00edstica ao cunhar o termo &#8220;Regress\u00e3o&#8221;. Essa descoberta teve suas ra\u00edzes na Antropometria, o estudo meticuloso das medidas e a matem\u00e1tica dos corpos humanos.<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><img fetchpriority=\"high\" decoding=\"async\" width=\"547\" height=\"381\" class=\"wp-image-176\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton.png 547w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton-300x209.png 300w\" sizes=\"(max-width: 547px) 100vw, 547px\" \/>\n<figcaption class=\"wp-element-caption\">Francis Galton, mat\u00e9matico ingl\u00eas e uma das mentes mais criativas do s\u00e9culo XIX<\/figcaption>\n<\/figure>\n<\/div>\n<div class=\"wp-block-group\"><div class=\"wp-block-group__inner-container is-layout-constrained wp-block-group-is-layout-constrained\">\n<p class=\"wp-block-paragraph\">Francis Galton, matem\u00e1tico ingl\u00eas que cunhou o termo &#8220;regress\u00e3o&#8221; ao estudar a antropometria, o estudo das medidas e propor\u00e7\u00f5es humanas, percebeu que a altura das fam\u00edlias tendia a regredir para a m\u00e9dia.<\/p>\n\n<p class=\"wp-block-paragraph\">Ao examinar as estaturas de pais e filhos, Galton identificou um fen\u00f4meno intrigante: filhos de pais com altura abaixo da m\u00e9dia frequentemente ultrapassavam essa m\u00e9dia, enquanto filhos de pais mais altos tendiam a ficar abaixo dela, ou seja, as alturas tendiam a <strong>Regredir<\/strong> para a m\u00e9dia. Essa descoberta estruturou as bases para o que agora reconhecemos como an\u00e1lise de regress\u00e3o, mas tamb\u00e9m permitiu que essa ferramenta transcendesse o campo da Antropometria, encontrando aplica\u00e7\u00f5es nas mais diversas \u00e1reas, de finan\u00e7as \u00e0 ci\u00eancia de dados.<\/p>\n\n<p class=\"wp-block-paragraph\">Dentro desse contexto, voltando para a modernidade, a an\u00e1lise de regress\u00e3o se consolidou como uma t\u00e9cnica estat\u00edstica que investiga e modela rela\u00e7\u00f5es que vari\u00e1veis possam ter entre si, dessa forma, permeando virtualmente todos os setores, desde a engenharia at\u00e9 economia e gest\u00e3o.\u00a0<\/p>\n\n<p class=\"wp-block-paragraph\">No \u00e2mbito desse amplo conceito, a an\u00e1lise de regress\u00e3o se ramifica em diferentes t\u00e9cnicas, cada uma com sua respectiva peculiaridade. Entre elas est\u00e1 a t\u00e9cnica de regress\u00e3o linear, a mais famosa e o principal foco deste artigo.<\/p>\n<\/div><\/div>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">REGRESS\u00c3O LINEAR<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">A regress\u00e3o linear, em suma, \u00e9 uma t\u00e9cnica que busca prever o valor de dados desconhecidos usando como base valores de dados relacionados e conhecidos.\u00a0<\/p>\n\n<p class=\"wp-block-paragraph\">Al\u00e9m disso, ao se aprofundar nessa ferramenta, saindo da teoria, \u00e9 not\u00e1vel que ela possa ser utilizada de duas maneiras distintas: <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">regress\u00e3o linear de predi\u00e7\u00e3o<\/mark><\/strong> e <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">regress\u00e3o linear de classifica\u00e7\u00e3o<\/mark><\/strong>.<\/p>\n\n<p class=\"wp-block-paragraph\"><em>Na regress\u00e3o linear de predi\u00e7\u00e3o, o foco est\u00e1 em estimar ou prever valores num\u00e9ricos para uma vari\u00e1vel em espec\u00edfico. Em outras palavras, o interesse reside em antecipar n\u00fameros espec\u00edficos com base em padr\u00f5es identificados nos dados relacionados. Isso se revela \u00fatil em cen\u00e1rios como previs\u00e3o de pre\u00e7os de a\u00e7\u00f5es, onde a vari\u00e1vel em estudo \u00e9 num\u00e9rica e buscamos compreender as tend\u00eancias futuras com base em informa\u00e7\u00f5es hist\u00f3ricas.<\/em><\/p>\n\n<p class=\"wp-block-paragraph\"><em>Por outro lado, na regress\u00e3o linear de classifica\u00e7\u00e3o, o prop\u00f3sito muda. Nesse caso, a vari\u00e1vel \u00e9 categ\u00f3rica, e o objetivo \u00e9 classificar os dados em categorias espec\u00edficas. Como, por exemplo, ao classificar o desempenho de estudantes, \u00e9 poss\u00edvel\u00a0 utilizar a regress\u00e3o linear de classifica\u00e7\u00e3o e dividir as vari\u00e1veis em dois grupos distintos, aprovados ou reprovados, dessa forma,\u00a0 com base nas caracter\u00edsticas de estudo de cada aluno, ser\u00e1 poss\u00edvel classific\u00e1-los em uma das poss\u00edveis classes.<\/em><\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img decoding=\"async\" width=\"1024\" height=\"512\" class=\"wp-image-164\" style=\"width: 730px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/classificao-predicao.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/classificao-predicao.png 1024w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/classificao-predicao-300x150.png 300w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/classificao-predicao-768x384.png 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/>\n<figcaption class=\"wp-element-caption\">Na classifica\u00e7\u00e3o, o foco est\u00e1 em dividir os dados em grupos, como no exemplo acima, onde os dados foram separados entre abaixo da curva e acima da curva. Por outro lado, na regress\u00e3o de predi\u00e7\u00e3o, o objetivo \u00e9 prever n\u00fameros com base em um padr\u00e3o. No exemplo acima, os dados de previs\u00e3o s\u00e3o representados pela pr\u00f3pria linha, abrangendo todos os pontos infinitos sobre a mesma. <a href=\"https:\/\/scorecardstreet.wordpress.com\/2015\/12\/09\/is-machine-learning-the-new-epm-black\/\" target=\"_blank\" rel=\"noreferrer noopener\">Fonte para imagem<\/a><\/figcaption>\n<\/figure>\n<\/div>\n<p class=\"wp-block-paragraph\">A principal diferen\u00e7a entre essas abordagens reside no tipo de pergunta que estamos fazendo aos dados. Quando buscamos valores num\u00e9ricos, optamos pela regress\u00e3o linear de predi\u00e7\u00e3o. Se a nossa curiosidade est\u00e1 voltada para categorias, a regress\u00e3o linear de classifica\u00e7\u00e3o \u00e9 a escolha apropriada. Em nosso caso, a t\u00e9cnica que estudaremos durante esse artigo ser\u00e1 a regress\u00e3o linear de predi\u00e7\u00e3o.<\/p>\n\n<p class=\"wp-block-paragraph\">Para entendermos melhor o conceito de regress\u00e3o linear de predi\u00e7\u00e3o, vamos observar a situa\u00e7\u00e3o proposta:<\/p>\n\n<p class=\"wp-block-paragraph\"><em><mark class=\"has-inline-color has-vivid-cyan-blue-color\">\u201cSuponha que um engenheiro industrial empregado por uma engarrafadora de bebidas analise as opera\u00e7\u00f5es de entrega de produtos e servi\u00e7os para m\u00e1quinas de venda. Ele suspeita que o tempo necess\u00e1rio para um entregador de rota carregar e atender a uma m\u00e1quina est\u00e1 relacionado ao n\u00famero de caixas de produtos entregues. O engenheiro visita 25 pontos de venda escolhidos aleatoriamente que possuem m\u00e1quinas de venda. O tempo de entrega (em minutos) e o volume de produtos entregues (em caixas) s\u00e3o observados para cada uma das m\u00e1quinas de venda.\u201d<\/mark><\/em><\/p>\n\n<p class=\"wp-block-paragraph\">Se representarmos y como o tempo de entrega e x como o volume de entrega, a equa\u00e7\u00e3o de uma linha reta que relaciona essas duas vari\u00e1veis \u00e9 y = \u03b20 + \u03b21.x, onde \u03b20 \u00e9 a intercepta\u00e7\u00e3o no eixo y e \u03b21 \u00e9 a inclina\u00e7\u00e3o da reta. Por\u00e9m, os pontos de dados n\u00e3o se ajustam exatamente a uma linha reta, dessa forma, a equa\u00e7\u00e3o deve ser modificada para levar isso em considera\u00e7\u00e3o. Esse ajuste aplicado sobre a equa\u00e7\u00e3o trata-se da diferen\u00e7a entre o valores previstos pela reta e os valores observados, na qual chamamos de erro \u03b5. \u00c9 conveniente pensar em \u03b5 como um erro estat\u00edstico, ou seja, uma vari\u00e1vel aleat\u00f3ria que considera a falta de ajuste exato do modelo aos dados. O erro pode ser composto pela influ\u00eancia de vari\u00e1veis ocultas no problema, como o tempo de entrega, erros de medi\u00e7\u00e3o e assim por diante. Portanto, um modelo mais plaus\u00edvel para os dados de tempo de entrega \u00e9 y = \u03b20 + \u03b21.x + \u03b5.\u00a0 Essa \u00e9 a equa\u00e7\u00e3o da reta que define a regress\u00e3o linear simples:<\/p>\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" width=\"1134\" height=\"430\" class=\"wp-image-175\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/exemplo-regressao.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/exemplo-regressao.png 1134w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/exemplo-regressao-300x114.png 300w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/exemplo-regressao-1024x388.png 1024w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/exemplo-regressao-768x291.png 768w\" sizes=\"(max-width: 1134px) 100vw, 1134px\" \/>\n<figcaption class=\"wp-element-caption\">Exemplo tirado do livro &#8220;<em>Introduction to Linear Regression Analysis<\/em> (Wiley Series in Probability and Statistics)&#8221;. No gr\u00e1fico acima est\u00e3o representadas as 25 visitas que o engenheiro realizou. A representa\u00e7\u00e3o sugere claramente uma rela\u00e7\u00e3o entre o tempo de entrega e o volume de entrega, ilustrando a rela\u00e7\u00e3o linear do problema.<\/figcaption>\n<\/figure>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" class=\"wp-image-216\" src=\"http:\/\/localhost\/wordpress\/wp-content\/uploads\/2023\/12\/exemplo-regressao.png\" alt=\"\" \/><\/figure>\n<\/div>\n<p class=\"has-text-align-center has-large-font-size wp-block-paragraph\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>y = \u03b20 + \u03b21.x + \u03b5<\/strong><\/mark><\/p>\n\n<ul class=\"wp-block-list\">\n<li><em><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">y:<\/mark><\/strong> \u00c9 a vari\u00e1vel que define a altura dos pontos previstos pela fun\u00e7\u00e3o<\/em><\/li>\n\n<li><em><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">\u03b20:<\/mark><\/strong> \u00c9 a constante que determina a intersec\u00e7\u00e3o da reta com o eixo y, ou seja, quando x=0.<\/em><\/li>\n\n<li><em><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">\u03b21:<\/mark><\/strong> \u00c9 o valor que indica a inclina\u00e7\u00e3o da reta, podendo ser interpretada como a mudan\u00e7a na m\u00e9dia de y para uma mudan\u00e7a de uma unidade em x<\/em><\/li>\n\n<li><em><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>x:<\/strong><\/mark> \u00c9 a vari\u00e1vel que determina a posi\u00e7\u00e3o horizontal dos pontos previstos pela fun\u00e7\u00e3o.<\/em><\/li>\n\n<li><em><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">\u03b5:<\/mark><\/strong> \u00c9 o erro estat\u00edstico, \u00e9 uma vari\u00e1vel que serve para compensar pelos poss\u00edveis erros de predi\u00e7\u00e3o que a reta apresentar\u00e1.<\/em><\/li>\n<\/ul>\n\n<p class=\"wp-block-paragraph\">Esse tipo de regress\u00e3o \u00e9 uma linha de valores m\u00e9dios, isto \u00e9, representa um valor m\u00e9dio que esperamos para y quando x tem um valor qualquer atribu\u00eddo. No modelo, x \u00e9 chamado de vari\u00e1vel independente, ou seja, \u00e9 a vari\u00e1vel manipul\u00e1vel que possui influ\u00eancia sobre a vari\u00e1vel dependente, enquanto o\u00a0 y \u00e9 chamado de vari\u00e1vel dependente, a vari\u00e1vel que est\u00e1 sendo estudada ou medida, e que \u00e9 influenciada por outras vari\u00e1veis, as independentes.\u00a0<\/p>\n\n<p class=\"wp-block-paragraph\">Dessa forma, o objetivo da Regress\u00e3o Linear \u00e9 encontrar os valores de \u03b20 e \u03b21 que minimizem a diferen\u00e7a entre o conjunto real de dados e o conjunto previsto pela regress\u00e3o Linear. Isso pode ser obtido utilizando o m\u00e9todo dos M\u00ednimos Quadrados, que \u00e9 uma t\u00e9cnica estat\u00edstica usada para estimar os par\u00e2metros de um modelo matem\u00e1tico, minimizando a soma dos quadrados das diferen\u00e7as entre os valores observados e os valores preditos pelo modelo. Essa abordagem busca encontrar a melhor linha que se ajusta aos dados observados, minimizando a soma dos quadrados das discrep\u00e2ncias verticais entre esses dados e os valores preditos pelo modelo. Essa \u00e9 a equa\u00e7\u00e3o que define as vari\u00e1veis \u03b20 e \u03b21 com base no m\u00e9todo dos m\u00ednimos quadrados.<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><img loading=\"lazy\" decoding=\"async\" width=\"520\" height=\"257\" class=\"wp-image-174\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacoes-b0-e-b1.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacoes-b0-e-b1.png 520w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacoes-b0-e-b1-300x148.png 300w\" sizes=\"(max-width: 520px) 100vw, 520px\" \/><\/figure>\n<\/div>\n<ul class=\"wp-block-list\">\n<li><em><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>Xi: <\/strong><\/mark>\u00c9 o valor x das vari\u00e1veis independentes<\/em><\/li>\n\n<li><em><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>X\u0304:<\/strong> <\/mark>\u00c9 a m\u00e9dia aritm\u00e9tica das vari\u00e1veis independentes<\/em><\/li>\n\n<li><em><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>Yi:<\/strong><\/mark>\u00a0 \u00c9 o valor y das vari\u00e1veis dependentes<\/em><\/li>\n\n<li><em><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>\u0232:<\/strong><\/mark> \u00c9 a m\u00e9dia aritm\u00e9tica das vari\u00e1veis dependentes<\/em><\/li>\n<\/ul>\n\n<p class=\"wp-block-paragraph\">Na equa\u00e7\u00e3o acima, em \u03b21, sua equa\u00e7\u00e3o \u00e9 dada como a raz\u00e3o entre o somat\u00f3rio dos produtos da diferen\u00e7a das observa\u00e7\u00f5es em rela\u00e7\u00e3o \u00e0s vari\u00e1veis de x, X\u0304 e y, \u0232 e o somat\u00f3rio dos quadrados da diferen\u00e7a de x em rela\u00e7\u00e3o a X\u0304. Em suma, A raz\u00e3o entre a soma dos produtos da diferen\u00e7a entre x, X\u0304 e y, \u0232 e a soma dos quadrados da diferen\u00e7a entre x em rela\u00e7\u00e3o a X\u0304 proporciona uma medida ponderada das altera\u00e7\u00f5es em y em resposta \u00e0s mudan\u00e7as em x. Isso significa que a equa\u00e7\u00e3o reflete como as varia\u00e7\u00f5es nas observa\u00e7\u00f5es de x influenciam as varia\u00e7\u00f5es correspondentes em y, estabelecendo a inclina\u00e7\u00e3o da linha de regress\u00e3o. Quando \u03b21 \u00e9 positivo, h\u00e1 uma rela\u00e7\u00e3o positiva; quando negativo, indica uma rela\u00e7\u00e3o negativa.<\/p>\n\n<p class=\"wp-block-paragraph\">Por outro lado, em \u03b20, sua equa\u00e7\u00e3o\u00a0 \u00e9 expressa como a diferen\u00e7a entre \u0232\u00a0 e o produto de \u03b21 e X\u0304. Dessa forma a interpreta\u00e7\u00e3o de \u03b20 \u00e9 contextual, sendo mais relevante quando x pode assumir o valor zero, que fornece uma estimativa do valor inicial esperado da vari\u00e1vel no eixo y.<\/p>\n\n<p class=\"wp-block-paragraph\">Em conjunto, essas equa\u00e7\u00f5es possibilitam a constru\u00e7\u00e3o de uma linha de regress\u00e3o que melhor se ajusta aos dados observados, oferecendo uma representa\u00e7\u00e3o quantitativa da rela\u00e7\u00e3o linear entre as vari\u00e1veis. A interpreta\u00e7\u00e3o desses coeficientes \u00e9 essencial para compreender como as mudan\u00e7as em uma vari\u00e1vel est\u00e3o associadas \u00e0s mudan\u00e7as na outra, fornecendo uma base s\u00f3lida para an\u00e1lises preditivas e infer\u00eancias estat\u00edsticas<\/p>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">PRESSUPOSI\u00c7\u00d5ES DA REGRESS\u00c3O<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">Apesar de sua aparente simplicidade, a regress\u00e3o linear se baseia em <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">pressuposi\u00e7\u00f5es<\/mark><\/strong>, isto \u00e9, em cinco fatores fundamentais que devem ser satisfeitos para que os resultados sejam v\u00e1lidos.<\/p>\n\n<p class=\"wp-block-paragraph\">A primeira e fundamental premissa \u00e9 a <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">linearidade<\/mark><\/strong>, que postula que a rela\u00e7\u00e3o entre a vari\u00e1vel dependente e as vari\u00e1veis independentes \u00e9 verdadeiramente linear, ou seja, as mudan\u00e7as nas vari\u00e1veis independentes provocam varia\u00e7\u00f5es proporcionais na vari\u00e1vel dependente, esbo\u00e7ando uma trajet\u00f3ria linear. Esta linearidade n\u00e3o apenas guia o modelo, mas tamb\u00e9m assegura a interpreta\u00e7\u00e3o adequada dos resultados.<\/p>\n\n<p class=\"wp-block-paragraph\">Seguindo adiante, a <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">independ\u00eancia dos erros<\/mark><\/strong> surge como uma premissa vital. Ela estabelece que deve haver pouca ou nenhuma autocorrela\u00e7\u00e3o nos dados. A autocorrela\u00e7\u00e3o \u00e9 um fen\u00f4meno que ocorre quando os erros, a discrep\u00e2ncia entre os dados previstos e os reais n\u00e3o s\u00e3o independentes entre si. Por exemplo, isso \u00e9 comum em pre\u00e7os de a\u00e7\u00f5es, onde o pre\u00e7o atual n\u00e3o \u00e9 independente do pre\u00e7o anterior. Dessa forma, essa assun\u00e7\u00e3o garante uma acur\u00e1cia maior para o algoritmo.<\/p>\n\n<p class=\"wp-block-paragraph\">A <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">homocedasticidade<\/mark><\/strong> \u00e9 uma condi\u00e7\u00e3o frequentemente negligenciada, mas essencial. Ela garante que a dispers\u00e3o dos erros seja uniforme em todas as partes do conjunto de dados, evitando oscila\u00e7\u00f5es desiguais nas previs\u00f5es que comprometeriam a confiabilidade das estimativas, dessa maneira, assegurando a previsibilidade dos erros no conjunto inteiro, e consequentemente assegurando a previsibilidade da regress\u00e3o linear.<\/p>\n\n<p class=\"wp-block-paragraph\">No jogo de vari\u00e1veis independentes, a <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">multicolinearidade<\/mark><\/strong> \u00e9 uma considera\u00e7\u00e3o cr\u00edtica. Ela exige que cada vari\u00e1vel independente contribua de maneira \u00fanica para as previs\u00f5es, sem interferir em rela\u00e7\u00e3o \u00e0s outras, do contr\u00e1rio,seria desafiador, beirando a impossibilidade, discernir o impacto individual de cada vari\u00e1vel independente sobre a vari\u00e1vel dependente.<\/p>\n\n<p class=\"wp-block-paragraph\">Por fim, a <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">normalidade dos erros<\/mark><\/strong> \u00e9 vital para as infer\u00eancias estat\u00edsticas. Ela sup\u00f5e que a diferen\u00e7a entre os valores observados e os valores previstos seguem uma distribui\u00e7\u00e3o normal, ou seja, significa que os erros cometidos pelo modelo devem se aproximar de uma distribui\u00e7\u00e3o de sino, tamb\u00e9m conhecida como distribui\u00e7\u00e3o normal ou gaussiana. Essa suposi\u00e7\u00e3o \u00e9 crucial pois quando os erros t\u00eam uma distribui\u00e7\u00e3o normal, \u00e9 poss\u00edvel aplicar m\u00e9todos estat\u00edsticos mais confi\u00e1veis para avaliar a precis\u00e3o do modelo e realizar infer\u00eancias sobre os par\u00e2metros da regress\u00e3o.<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><img loading=\"lazy\" decoding=\"async\" width=\"720\" height=\"465\" class=\"wp-image-169\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/curva-normal-de-distribuicao.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/curva-normal-de-distribuicao.png 720w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/curva-normal-de-distribuicao-300x194.png 300w\" sizes=\"(max-width: 720px) 100vw, 720px\" \/>\n<figcaption class=\"wp-element-caption\">A curva normal de distribui\u00e7\u00e3o \u00e9 um modelo matem\u00e1tico de distribui\u00e7\u00e3o amostral extremamente \u00fatil. Ao assumir a normalidade dos erros as ferramentas estat\u00edsticas conseguem modelar e prever situa\u00e7\u00f5es com mais facilidade, visto que a distribui\u00e7\u00e3o ser\u00e1 previs\u00edvel, e consequentemente mais eficiente para ser trabalhada. <mark class=\"has-inline-color has-pale-cyan-blue-color\"><a href=\"https:\/\/medium.com\/analytics-vidhya\/hypothesis-tests-with-python-bfff05955c43\" target=\"_blank\" rel=\"noreferrer noopener\">Fonte para imagem<\/a><\/mark><\/figcaption>\n<\/figure>\n<\/div>\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">M\u00c9TODO DOS M\u00cdNIMOS QUADRADOS<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">A determina\u00e7\u00e3o dos par\u00e2metros \u00e9 essencial, uma vez que esses valores estabelecem tanto a inclina\u00e7\u00e3o quanto a intercepta\u00e7\u00e3o da linha de regress\u00e3o, permitindo com que a aplica\u00e7\u00e3o do modelo para efetuar previs\u00f5es e infer\u00eancias acerca da rela\u00e7\u00e3o entre as vari\u00e1veis.<\/p>\n\n<p class=\"wp-block-paragraph\">Dentre os m\u00e9todos empregados para valida\u00e7\u00e3o, destaca-se o <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">M\u00e9todo dos M\u00ednimos Quadrados<\/mark><\/strong>. Nota-se que os par\u00e2metros \u03b20 e \u03b21 s\u00e3o desconhecidos e precisam ser estimados. O m\u00e9todo dos m\u00ednimos quadrados \u00e9 utilizado justamente para estimar \u03b20 e \u03b21.<\/p>\n\n<p class=\"wp-block-paragraph\">Para estimar esses valores, partimos do pressuposto de que temos n pares de dados (y\u2081, x\u2081), (y\u2082, x\u2082), &#8230;, (y\u2099, x\u2099). O m\u00e9todo \u00e9 ent\u00e3o utilizado para ajustar uma linha aos dados de maneira a minimizar a soma dos quadrados das diferen\u00e7as entre as observa\u00e7\u00f5es y\u1d62 e a reta y = \u03b20 + \u03b21.x + \u03b5, alcan\u00e7ando assim o melhor ajuste poss\u00edvel aos dados.<\/p>\n\n<p class=\"wp-block-paragraph\">Portanto, o m\u00e9todo visa minimizar a express\u00e3o:<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"960\" height=\"202\" class=\"wp-image-177\" style=\"width: 652px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/minimos-quadrados.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/minimos-quadrados.png 960w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/minimos-quadrados-300x63.png 300w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/minimos-quadrados-768x162.png 768w\" sizes=\"(max-width: 960px) 100vw, 960px\" \/>\n<figcaption class=\"wp-element-caption\">Express\u00e3o da soma dos quadrados dos <em>res\u00edduos<\/em> (diferen\u00e7as entre os valores observados e os valores previstos pela linha de regress\u00e3o)<\/figcaption>\n<\/figure>\n<\/div><div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" class=\"wp-image-207\" src=\"http:\/\/localhost\/wordpress\/wp-content\/uploads\/2023\/12\/minimos-quadrados-1.png\" alt=\"\" \/><\/figure>\n<\/div>\n<p class=\"wp-block-paragraph\">O objetivo do m\u00e9todo \u00e9 encontrar os par\u00e2metros \u03b2\u2080 e \u03b2\u2081 que minimizam essa soma. Quando esses valores s\u00e3o encontrados, a linha de regress\u00e3o resultante tenta ser a que <strong>melhor se ajusta aos dados, diminuindo a discrep\u00e2ncia entre os valores observados e os valores previstos pela linha<\/strong>.<\/p>\n\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">UM POUCO SOBRE CORRELA\u00c7\u00c3O DOS DADOS<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">Outro conceito importante \u00e9 o qu\u00e3o boa a correla\u00e7\u00e3o linear entre dados pode se apresentar, ou seja, quando o relacionamento entre os dados (positivo ou negativo) pode ser definido com uma reta. A an\u00e1lise de correla\u00e7\u00e3o mede a \u201cintensidade\u201d de relacionamento linear entre as vari\u00e1veis X e Y. Para quantificar a rela\u00e7\u00e3o entre essas duas vari\u00e1veis quantitativas utiliza-se o coeficiente de correla\u00e7\u00e3o linear de Pearson.<br \/>Este que por sua vez \u00e9 representado pela seguinte equa\u00e7\u00e3o:<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"772\" height=\"200\" class=\"wp-image-170\" style=\"width: 743px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacao-correlacao1.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacao-correlacao1.png 772w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacao-correlacao1-300x78.png 300w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacao-correlacao1-768x199.png 768w\" sizes=\"(max-width: 772px) 100vw, 772px\" \/><\/figure>\n<\/div>\n<p class=\"wp-block-paragraph\">Em que:<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"605\" height=\"162\" class=\"wp-image-171\" style=\"width: 504px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacao-correlacao2.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacao-correlacao2.png 605w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/equacao-correlacao2-300x80.png 300w\" sizes=\"(max-width: 605px) 100vw, 605px\" \/><\/figure>\n<\/div>\n<figure class=\"wp-block-gallery aligncenter has-nested-images columns-default is-cropped wp-block-gallery-2 is-layout-flex wp-block-gallery-is-layout-flex\"><div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" data-id=\"75\" class=\"wp-image-75\" src=\"http:\/\/localhost\/wordpress\/wp-content\/uploads\/2023\/11\/equacao-correlacao2.png\" alt=\"\" \/><\/figure>\n<\/div><\/figure>\n\n<p class=\"wp-block-paragraph\">Pode-se inferir, com base em R<sub>xy<\/sub>, sobre a dire\u00e7\u00e3o e intensidade da rela\u00e7\u00e3o entre X e Y. Por n\u00e3o haver uma classifica\u00e7\u00e3o un\u00e2nime da correla\u00e7\u00e3o. Foi optado por seguir a f\u00f3rmula apresentada por Santos (2007), conforme indicado na Tabela.<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"366\" height=\"437\" class=\"wp-image-168\" style=\"width: 502px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/correlacao-de-pearson.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/correlacao-de-pearson.png 366w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/correlacao-de-pearson-251x300.png 251w\" sizes=\"(max-width: 366px) 100vw, 366px\" \/>\n<figcaption class=\"wp-element-caption\">Tabela: Interpreta\u00e7\u00e3o do coeficiente de correla\u00e7\u00e3o de Pearson<\/figcaption>\n<\/figure>\n<\/div>\n<p class=\"wp-block-paragraph\">Para entender a rela\u00e7\u00e3o entre duas vari\u00e1veis, X e Y, \u00e9 poss\u00edvel representar os valores delas num gr\u00e1fico de dispers\u00e3o. Pode-se confirmar que existe uma rela\u00e7\u00e3o linear entre essas vari\u00e1veis se os dados mostrarem proximidade com uma linha reta. Como mostrado nos gr\u00e1ficos abaixo.<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"599\" height=\"656\" class=\"wp-image-178\" style=\"width: 487px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/tabela-correlacao.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/tabela-correlacao.png 599w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/tabela-correlacao-274x300.png 274w\" sizes=\"(max-width: 599px) 100vw, 599px\" \/>\n<figcaption class=\"wp-element-caption\">Classifica\u00e7\u00e3o da correla\u00e7\u00e3o atrav\u00e9s do diagrama de dispers\u00e3o, dispon\u00edvel em Santos (2007)<\/figcaption>\n<\/figure>\n<\/div><div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" class=\"wp-image-81\" src=\"http:\/\/localhost\/wordpress\/wp-content\/uploads\/2023\/11\/tabela-correlacao.png\" alt=\"\" \/><\/figure>\n<\/div>\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n<h1 id=\"APLICACAO-COM-PYTHON\" class=\"wp-block-heading has-text-align-center has-large-font-size\" style=\"font-style: normal;font-weight: 900\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>APLICA\u00c7\u00c3O COM PYTHON<\/strong><\/mark><\/h1>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--50)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<p class=\"wp-block-paragraph\">Agora que entendemos como funciona a regress\u00e3o linear, vamos realizar um exemplo de problema de predi\u00e7\u00e3o em <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">Python<\/mark><\/strong>!\u00a0O exemplo que iremos usar ser\u00e1 o mesmo apresentado no come\u00e7o deste artigo sobre o <strong><em><mark class=\"has-inline-color has-vivid-cyan-blue-color\">engenheiro industrial<\/mark><\/em><\/strong>, ent\u00e3o vamos come\u00e7ar do in\u00edcio:<\/p>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--60)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">1) CONHECENDO O COLAB<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">O primeiro passo \u00e9 escolher o ambiente onde iremos escrever nosso c\u00f3digo. No exemplo, iremos usar o Google Colaboratory, conhecido pela comunidade como Colab. Ele \u00e9 uma ferramenta que permite trabalhar com c\u00f3digos que envolvam an\u00e1lise de dados, machine learning, e outras tarefas relacionadas \u00e0 ci\u00eancia de dados. O Colab \u00e9 projetado para trabalhar principalmente com Python.<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"1362\" height=\"640\" class=\"wp-image-179\" style=\"width: 703px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab.jpg\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab.jpg 1362w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab-300x141.jpg 300w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab-1024x481.jpg 1024w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab-768x361.jpg 768w\" sizes=\"(max-width: 1362px) 100vw, 1362px\" \/><\/figure>\n<\/div>\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">2) COMO CRIAR UM NOTEBOOK<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">O &#8220;notebook&#8221; no contexto do Google Colab refere-se a um documento interativo na qual iremos escrever nossos c\u00f3digos.<\/p>\n\n<p class=\"wp-block-paragraph\">\u00c9 necess\u00e1rio estar logado em uma conta google para criar um notebook, pois ele ficar\u00e1 atrelado a seu perfil, permitindo que possa revisitar o notebook a qualquer momento.<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"1250\" height=\"551\" class=\"wp-image-180\" style=\"width: 760px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab2.jpg\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab2.jpg 1250w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab2-300x132.jpg 300w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab2-1024x451.jpg 1024w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/welcome-to-colab2-768x339.jpg 768w\" sizes=\"(max-width: 1250px) 100vw, 1250px\" \/><\/figure>\n<\/div>\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">3) PRIMEIRAS LINHAS DE C\u00d3DIGO: BUSCANDO BIBLIOTECAS<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">Nossas primeiras linhas de c\u00f3digo referem-se a chamadas das bibliotecas que iremos usar no c\u00f3digo. As bibliotecas do Python s\u00e3o conjuntos de c\u00f3digo predefinido que fornecem funcionalidades espec\u00edficas, permitindo que voc\u00ea use-os sem ter que escrev\u00ea-los do zero.\u00a0<\/p>\n\n<p class=\"wp-block-paragraph\">Algumas das bibliotecas usadas s\u00e3o:<\/p>\n\n<ul class=\"wp-block-list\">\n<li><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">pandas (pd):<\/mark><\/strong> permite a manipula\u00e7\u00e3o e an\u00e1lise eficiente de dados<\/li>\n\n<li><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">numpy (np):<\/mark><\/strong> suporte para arrays multidimensionais e fun\u00e7\u00f5es matem\u00e1ticas eficientes<\/li>\n\n<li><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">seaborn (sns)<\/mark><\/strong> e <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">matplotlib.pyplot (plt):<\/mark><\/strong> bibliotecas de visualiza\u00e7\u00e3o que facilitam a cria\u00e7\u00e3o de gr\u00e1ficos e visualiza\u00e7\u00f5es<\/li>\n\n<li><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">sklearn:<\/mark><\/strong> oferece uma variedade de ferramentas para tarefas relacionadas \u00e0 minera\u00e7\u00e3o de dados e aprendizado de m\u00e1quina<\/li>\n<\/ul>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-e2aea045cda5a96239bfdaa326f61dca\" style=\"background-color: #001f2e\"><code>import pandas as pd\nimport numpy as np\nimport seaborn as sns\nimport matplotlib.pyplot as plt\nfrom sklearn.model_selection import train_test_split\nfrom sklearn.linear_model import LinearRegression\nfrom sklearn.metrics import mean_squared_error, r2_score\nfrom sklearn.model_selection import train_test_split\nfrom matplotlib import pyplot as plt\nimport seaborn as sns\nfrom sklearn.linear_model import LinearRegression<\/code><\/pre>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">4) CRIANDO UM DATAFRAME COM OS PONTOS DO PROBLEMA<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">Vamos agora criar o DataFrame com os pontos do problema do engenheiro. Fazendo uma aproxima\u00e7\u00e3o por observa\u00e7\u00e3o do gr\u00e1fico, chegamos nos 25 pontos de venda descritos.<\/p>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-f0cb1057311722aef60ca6f7407ba868\" style=\"background-color: #001f2e\"><code>column_titles = ['x','y']\ncoordenadas_bolinhas = np.array([[1,9],\n[2,9],\n[4,10],\n[2,11],\n[1.5,15],\n[3.75,12],\n[3.5,15.25],\n[6,12],\n[6,14],\n[4,21.5],\n[6,19],\n[8,12],\n[7.5,15],\n[7,17],\n[7.25,20],\n[8.75,19],\n[9,19],\n[10,16],\n[10,20],\n[9.25,25],\n[10,29],\n[16,40],\n[17,34],\n[26.25,53],\n[30,80]])\ndf = pd.DataFrame(data=coordenadas_bolinhas, columns=column_titles)\ndf<\/code><\/pre>\n\n<p class=\"wp-block-paragraph\">A sa\u00edda de df deve ser:<\/p>\n\n<pre class=\"wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-528aa8e59490068ed914d6e0cde085c9\"><code>\tx\t\ty       \n0\t1.00\t9.00\n1\t2.00\t9.00\n2\t4.00\t10.00\n3\t2.00\t11.00\n4\t1.50\t15.00\n5\t3.75\t12.00\n6\t3.50\t15.25\n7\t6.00\t12.00\n8\t6.00\t14.00\n9\t4.00\t21.50\n10\t6.00\t19.00\n11\t8.00\t12.00\n12\t7.50\t15.00\n13\t7.00\t17.00\n14\t7.25\t20.00\n15\t8.75\t19.00\n16\t9.00\t19.00\n17\t10.00\t16.00\n18\t10.00\t20.00\n19\t9.25\t25.00\n20\t10.00\t29.00\n21\t16.00\t40.00\n22\t17.00\t34.00\n23\t26.25\t53.00\n24\t30.00\t80.00\n<\/code><\/pre>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">5) SEPARANDO OS DADOS EM TREINO E TESTE E PLOTANDO O GR\u00c1FICO DE DISPERS\u00c3O<\/mark><\/h2>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-a936ce61a21b502a378dea2b61f9cf8b\" style=\"background-color: #001f2e\"><code># Split the data into training and testing sets\nX_train, X_test, y_train, y_test = train_test_split(df[['x']], df['y'], test_size=0.2, random_state=0)\n\n# Create and fit the linear regression model\nmodel = LinearRegression()\nmodel.fit(X_train, y_train)\n\n# Make predictions on the test set\ny_pred = model.predict(X_test)\n\n# Plot the training points\nplt.scatter(X_train, y_train, color='g', label='Training Data')\n\n# Plot the linear regression line for the test set\nplt.plot(X_test, y_pred, color='k', label='Linear Regression Line')\n\n# Create a legend for the graphic\nplt.legend()\nplt.show()<\/code><\/pre>\n\n<p class=\"wp-block-paragraph\">Uma das etapas da minera\u00e7\u00e3o de dados envolve a separa\u00e7\u00e3o de nossa base de dados em dois conjuntos, o grupo de treino e o grupo de teste. O conjunto de dados separados para treino s\u00e3o os dados que ser\u00e3o usados para treinar o algoritmo que de regress\u00e3o linear que iremos usar. J\u00e1 o conjunto de testes, ser\u00e1 usado posteriormente para avaliar o desempenho do modelo em dados n\u00e3o vistos.A fun\u00e7\u00e3o usada para fazer essa separa\u00e7\u00e3o \u00e9 do sklearn e se chama \u201c<em><strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">train_test_split<\/mark><\/strong><\/em>\u201d.<\/p>\n\n<p class=\"wp-block-paragraph\">Logo em seguida, criamos\u00a0 uma inst\u00e2ncia do modelo de regress\u00e3o linear com &#8220;<strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">LinearRegression()<\/mark><\/strong>&#8220;, passando os dados do conjunto de treinamento com o m\u00e9todo &#8220;<mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>.fit<\/strong><\/mark>&#8221; ao modelo. \u00c9 interessante saber que o <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">M\u00e9todo dos M\u00ednimos Quadrados<\/mark><\/strong> \u00e9 automaticamente utilizado quando voc\u00ea ajusta um modelo usamos o m\u00e9todo &#8220;fit&#8221;, ajustando assim o modelo aos dados de treinamento.<\/p>\n\n<p class=\"wp-block-paragraph\">Com o modelo treinado, podemos ver os dados que v\u00e3o ser preditos pelo algoritmo com o m\u00e9todo &#8220;<strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">.predict<\/mark><\/strong>&#8220;. Armazenamos esses valores preditos na vari\u00e1vel &#8220;<strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">y_pred<\/mark><\/strong>&#8220;.<\/p>\n\n<p class=\"wp-block-paragraph\">Usamos ent\u00e3o o matplotlib para criar um gr\u00e1fico de dispers\u00e3o dos pontos de treino (verde) e plotar a linha de regress\u00e3o linear prevista nos dados de teste (preto). Tamb\u00e9m inclu\u00edmos uma legenda ao gr\u00e1fico para indicar os dados de treinamento e a linha de regress\u00e3o linear.<\/p>\n\n<p class=\"wp-block-paragraph\">O resultado de sa\u00edda \u00e9 o gr\u00e1fico plotado, por\u00e9m pode existir uma problema com a extens\u00e3o da linha de regress\u00e3o, que pode acabar n\u00e3o indo at\u00e9 o final do gr\u00e1fico. Isso deve ocorrer devido a quantidade limitada de dados na extremidade do eixo x, que faz o modelo ter dificuldade em estender a linha de maneira significativa.<\/p>\n\n<p class=\"wp-block-paragraph\">Para corrigir a extens\u00e3o da linha e gerar uma melhor visualiza\u00e7\u00e3o, podemos ajust\u00e1-la para cobrir toda a largura do gr\u00e1fico. Usamos o m\u00e9todo &#8220;<strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">plt.xlim()<\/mark><\/strong>&#8221; para fazer essa configura\u00e7\u00e3o.<\/p>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-42136ddcfa9c2551651ec3074cad2532\" style=\"background-color: #001f2e\"><code># [...]\n\n# Plot the linear regression line for the test set\nplt.plot(X_test, y_pred, color='k', label='Linear Regression Line')\n\n# Extend the line to cover the entire width of the graph\nx_min, x_max = plt.xlim()\nx_extend = np.linspace(x_min, x_max, 100)\ny_extend = model.coef_[0] * x_extend + model.intercept_\nplt.plot(x_extend, y_extend, color='k')\n\n# [...]<\/code><\/pre>\n\n<p class=\"wp-block-paragraph\">A sa\u00edda do gr\u00e1fico fica:<\/p>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><img loading=\"lazy\" decoding=\"async\" width=\"543\" height=\"413\" class=\"wp-image-166\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/colab_grafico2_exemploEngenheiro.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/colab_grafico2_exemploEngenheiro.png 543w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/colab_grafico2_exemploEngenheiro-300x228.png 300w\" sizes=\"(max-width: 543px) 100vw, 543px\" \/><\/figure>\n<\/div>\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">6) VERIFICANDO PODER DE PREVIS\u00c3O DO MODELO<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">Vamos agora utilizar uma m\u00e9trica para sabermos qual o poder de previs\u00e3o do nosso modelo. Para tal tarefa, vamos usar uma fun\u00e7\u00e3o bastante popular que \u00e9 o c\u00e1lculo do R\u00b2 usando a fun\u00e7\u00e3o &#8221; <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">r2_score<\/mark><\/strong>&#8220;. Essa m\u00e9trica fornece uma medida que varia de 0 a 1 (na qual 1 indica o ajuste perfeito). Essa medida diz o qu\u00e3o bem as previs\u00f5es do modelo se ajustam aos dados reais.<\/p>\n\n<p class=\"wp-block-paragraph\">Comparamos os valores reais (y_test) com as previs\u00f5es do modelo (y_pred) e atribu\u00edmos essa compara\u00e7\u00e3o \u00e0 vari\u00e1vel \u201c<strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">r_squared<\/mark><\/strong>\u201d.<\/p>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-d56185211478ff9dfddfd4388366e3d2\" style=\"background-color: #001f2e\"><code>r_squared = r2_score(y_test, y_pred)\nprint(f\"R-squared (R^2) Score: {r_squared}\")<\/code><\/pre>\n\n<pre class=\"wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-2ec1a4c227504711db561a41f3e0a447\"><code>R-squared (R^2) Score: 0.2875287223839458<\/code><\/pre>\n\n<p class=\"wp-block-paragraph\">O resultado obtivo mostra que modelo explica aproximadamente 28,75% da variabilidade nos dados de teste, o que n\u00e3o \u00e9 um valor considerado satisfat\u00f3rio para a m\u00e9trica.<\/p>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<h2 class=\"wp-block-heading\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">7) PREVENDO UM VALOR<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">Para fecharmos o exemplo proposto, vamos fazer uma previs\u00e3o usando o modelo de regress\u00e3o linear treinado. Usamos o m\u00e9todo &#8220;<mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>model.predict<\/strong>&#8220;<\/mark>, passamos um valor x para qual ser\u00e1 correspondido com um valor previsto y.<\/p>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-02c7dc4aef1f6618df174c0d3ba71349\" style=\"background-color: #001f2e\"><code>new_x_value = 5.0  # Replace with the desired 'x' value\nnew_x_value = [[new_x_value]]\npredicted_y = model.predict(new_x_value)\nprint(predicted_y)<\/code><\/pre>\n\n<pre class=\"wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-d37bb3494b2be6270e9f5e382f759e68\"><code>[14.93059242]<\/code><\/pre>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n\n<h2 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-e87ffc0b63282bf245017346828f4f67\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\">EXEMPLO COM MELHOR PREVIS\u00c3O DO MODELO<\/mark><\/h2>\n\n<p class=\"wp-block-paragraph\">O problema mostrado acima traz um impecilho, seu poder de previs\u00e3o para se ajustarem aos dados reais \u00e9 muito fraco. Isso aconteceu porque a quantidade de dados passado para treinar o modelo era muito pequeno. Por isso, vamos agora usar outra base de dados que contenha uma quantidade considerada de dados para o treino.<\/p>\n\n<p class=\"wp-block-paragraph\">A base de dados usado se trata de uma disponibilizada pelo kaggle, que \u00e9 plataforma focada para conte\u00fados de aprendizado de m\u00e1quina. Chamada de &#8220;<a href=\"https:\/\/www.kaggle.com\/datasets\/saquib7hussain\/experience-salary-dataset\" data-type=\"link\" data-id=\"https:\/\/www.kaggle.com\/datasets\/saquib7hussain\/experience-salary-dataset\">Experience Salary Dataset<\/a>&#8221; se trata sobre a rela\u00e7\u00e3o entre a experi\u00eancia profissional (em meses) e os sal\u00e1rios mensais correspondentes (em milhares de d\u00f3lares) de funcion\u00e1rios em v\u00e1rios setores.<\/p>\n\n<p class=\"wp-block-paragraph\">A base de dados possui 1000 inst\u00e2ncias, o que ainda pode ser considerado poucos dados para treinar um modelo, mas para o exemplo podemos ver o salto significativo do c\u00e1lculo da precis\u00e3o.<\/p>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-2ff040ec9389cb55ae33c48c3a3acb92\" style=\"background-color: #001f2e\"><code>df = pd.read_csv('Experience-Salary.csv')\n\nquantidade_instancias = df.shape[0]\nprint(\"N\u00famero de inst\u00e2ncias na tabela:\", quantidade_instancias)<\/code><\/pre>\n\n<pre class=\"wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-a18f66401c7dbd0f16201c57e1ca82e0\"><code>N\u00famero de inst\u00e2ncias na tabela: 1000<\/code><\/pre>\n\n<p class=\"wp-block-paragraph\">Agora fazemos os mesmos passos do exemplo anterior, na qual treinamos o modelo e plotamos o gr\u00e1fico.<\/p>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-c091601fddda9e5050fce1c024ed2c3e\" style=\"background-color: #001f2e\"><code>X = df[['exp(in months)']]\ny = df['salary(in thousands)']\nX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)\n\nmodel = LinearRegression()\n\n\nmodel.fit(X_train, y_train)\ny_pred = model.predict(X_test)\nplt.scatter(X_train, y_train,color='g')\nplt.plot(X_test, y_pred,color='k')\n\nplt.show()<\/code><\/pre>\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" class=\"wp-image-195\" src=\"http:\/\/localhost\/wordpress\/wp-content\/uploads\/2023\/11\/colab_grafico3_Experience-Salary-Dataset.png\" alt=\"\" \/><\/figure>\n<\/div><div class=\"wp-block-image\">\n<figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"543\" height=\"413\" class=\"wp-image-167\" style=\"width: 465px;height: auto\" src=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/colab_grafico3_Experience-Salary-Dataset.png\" alt=\"\" srcset=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/colab_grafico3_Experience-Salary-Dataset.png 543w, https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/colab_grafico3_Experience-Salary-Dataset-300x228.png 300w\" sizes=\"(max-width: 543px) 100vw, 543px\" \/><\/figure>\n<\/div>\n<p class=\"wp-block-paragraph\">Comparando os valores reais (y_test) com as previs\u00f5es do modelo (y_pred), o <strong><mark class=\"has-inline-color has-vivid-cyan-blue-color\">r_squared<\/mark><\/strong> nos mostra uma acur\u00e1cia de aproximadamente 74%, uma porcentagem considerada positiva para o modelo.<\/p>\n\n<pre class=\"wp-block-code has-white-color has-text-color has-background has-link-color wp-elements-6a15139502645bdffee194856af8da78\" style=\"background-color: #001f2e\"><code> from sklearn.metrics import  r2_score\nr_squared = r2_score(y_test, y_pred)\nprint(f\"R-squared (R^2) Score: {r_squared}\")<\/code><\/pre>\n\n<pre class=\"wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-43458a4b70d98b7c970ea06e2f3f9ff5\"><code>R-squared (R^2) Score: 0.746188470890027<\/code><\/pre>\n\n<div class=\"wp-block-spacer\" style=\"height: var(--wp--preset--spacing--70)\" aria-hidden=\"true\">\u00a0<\/div>\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n<h1 id=\"APLICACAO-COM-PYTHON\" class=\"wp-block-heading has-text-align-center has-large-font-size\" style=\"font-style: normal;font-weight: 900\"><mark class=\"has-inline-color has-vivid-cyan-blue-color\"><strong>REFER\u00caNCIAS<\/strong><\/mark><\/h1>\n\n<p class=\"wp-block-paragraph\">[1] MONTGOMERY, Douglas C.; PECK, Elizabeth A.; VINING, G. Geffrey. Introduction to Linear Regression Analysis. 5. ed. Wiley Series in Probability and Statistics. Wiley.<\/p>\n\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t","protected":false},"excerpt":{"rendered":"<p>INTRODU\u00c7\u00c3O A REGRESS\u00c3O Em 1885, o antrop\u00f3logo e estat\u00edstico Francis Galton protagonizou uma descoberta fascinante na an\u00e1lise estat\u00edstica ao cunhar o termo &#8220;Regress\u00e3o&#8221;. Essa descoberta [&hellip;]<\/p>\n","protected":false},"author":113,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-13","page","type-page","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.9 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Regress\u00e3o (Predi\u00e7\u00e3o) - REVISA<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Regress\u00e3o (Predi\u00e7\u00e3o) - REVISA\" \/>\n<meta property=\"og:description\" content=\"INTRODU\u00c7\u00c3O A REGRESS\u00c3O Em 1885, o antrop\u00f3logo e estat\u00edstico Francis Galton protagonizou uma descoberta fascinante na an\u00e1lise estat\u00edstica ao cunhar o termo &#8220;Regress\u00e3o&#8221;. Essa descoberta [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/\" \/>\n<meta property=\"og:site_name\" content=\"REVISA\" \/>\n<meta property=\"article:modified_time\" content=\"2025-10-29T18:08:01+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton.png\" \/>\n\t<meta property=\"og:image:width\" content=\"547\" \/>\n\t<meta property=\"og:image:height\" content=\"381\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Est. tempo de leitura\" \/>\n\t<meta name=\"twitter:data1\" content=\"22 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/\",\"url\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/\",\"name\":\"Regress\u00e3o (Predi\u00e7\u00e3o) - REVISA\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/wp-content\\\/uploads\\\/sites\\\/86\\\/2023\\\/12\\\/francis-galton.png\",\"datePublished\":\"2023-11-11T20:43:56+00:00\",\"dateModified\":\"2025-10-29T18:08:01+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/#primaryimage\",\"url\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/wp-content\\\/uploads\\\/sites\\\/86\\\/2023\\\/12\\\/francis-galton.png\",\"contentUrl\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/wp-content\\\/uploads\\\/sites\\\/86\\\/2023\\\/12\\\/francis-galton.png\",\"width\":547,\"height\":381},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/predicao-com-regressao-linear\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Regress\u00e3o (Predi\u00e7\u00e3o)\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/#website\",\"url\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/\",\"name\":\"REVISA\",\"description\":\"A REvista VIrtual de Sistemas de Apoio a decis\u00e3o \u00e9 escrita por alunos de Sistemas de Apoio \u00e0 Decis\u00e3o da FT\\\/UNICAMP e estende a excel\u00eancia da gradua\u00e7\u00e3o para toda comunidade.\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/wordpress.ft.unicamp.br\\\/revisa\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Regress\u00e3o (Predi\u00e7\u00e3o) - REVISA","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/","og_locale":"pt_BR","og_type":"article","og_title":"Regress\u00e3o (Predi\u00e7\u00e3o) - REVISA","og_description":"INTRODU\u00c7\u00c3O A REGRESS\u00c3O Em 1885, o antrop\u00f3logo e estat\u00edstico Francis Galton protagonizou uma descoberta fascinante na an\u00e1lise estat\u00edstica ao cunhar o termo &#8220;Regress\u00e3o&#8221;. Essa descoberta [&hellip;]","og_url":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/","og_site_name":"REVISA","article_modified_time":"2025-10-29T18:08:01+00:00","og_image":[{"width":547,"height":381,"url":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton.png","type":"image\/png"}],"twitter_card":"summary_large_image","twitter_misc":{"Est. tempo de leitura":"22 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/","url":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/","name":"Regress\u00e3o (Predi\u00e7\u00e3o) - REVISA","isPartOf":{"@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/#website"},"primaryImageOfPage":{"@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/#primaryimage"},"image":{"@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/#primaryimage"},"thumbnailUrl":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton.png","datePublished":"2023-11-11T20:43:56+00:00","dateModified":"2025-10-29T18:08:01+00:00","breadcrumb":{"@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/"]}]},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/#primaryimage","url":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton.png","contentUrl":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-content\/uploads\/sites\/86\/2023\/12\/francis-galton.png","width":547,"height":381},{"@type":"BreadcrumbList","@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/predicao-com-regressao-linear\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/wordpress.ft.unicamp.br\/revisa\/"},{"@type":"ListItem","position":2,"name":"Regress\u00e3o (Predi\u00e7\u00e3o)"}]},{"@type":"WebSite","@id":"https:\/\/wordpress.ft.unicamp.br\/revisa\/#website","url":"https:\/\/wordpress.ft.unicamp.br\/revisa\/","name":"REVISA","description":"A REvista VIrtual de Sistemas de Apoio a decis\u00e3o \u00e9 escrita por alunos de Sistemas de Apoio \u00e0 Decis\u00e3o da FT\/UNICAMP e estende a excel\u00eancia da gradua\u00e7\u00e3o para toda comunidade.","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/wordpress.ft.unicamp.br\/revisa\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR"}]}},"_links":{"self":[{"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/pages\/13","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/users\/113"}],"replies":[{"embeddable":true,"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/comments?post=13"}],"version-history":[{"count":9,"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/pages\/13\/revisions"}],"predecessor-version":[{"id":694,"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/pages\/13\/revisions\/694"}],"wp:attachment":[{"href":"https:\/\/wordpress.ft.unicamp.br\/revisa\/wp-json\/wp\/v2\/media?parent=13"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}