Análise de Regressão
Bacharelado em Estatística - UFMT
Período letivo: 2025/1
Avisos:
- Última atualização do site às 22:04 do dia 29/07/2025.
- Monitor: Heliton (quarta-feira das 18 às 19h)
- Avaliação 1: escrita. Data: 30/7/2025. Conteúdo: correlação e regressão linear simples.
- Relatório parcial: entrega do relatório parcial de análise de dados (etapa 1). Data: 4/8/2025.
Ementa:
Análise de correlação. Regressão linear simples e múltipla. Regressão com variáveis qualitativas. Técnicas de diagnóstico em regressão. Seleção de variáveis e construção de modelos. Validação de modelos. Transformação de variáveis.
Notas de aula:
Aulas 1 e 2: Apresentação da disciplina com ementa e avaliações. Introdução ao estudo de regressão a partir do artigo seminal de Francis Galton (1886): Regression towards mediocrity in hereditary stature, no qual se analisa a relação entre as estaturas de filhos e filhas em função das estaturas de pais e mães, destacando-se a tendência de regressão à média (aproximadamente 2/3). Exploração da obtenção de modelos por meio de equações diferenciais. Estudo do modelo de crescimento e decaimento exponencial. Introdução ao modelo de regressão linear simples, exemplificado pela relação entre tempo e distância de deslocamento. Ampliação para o modelo de regressão linear múltipla, incluindo variáveis indicadoras e efeitos de interação (por exemplo, a interação entre distância de deslocamento e o horário em que ocorre). Aplicações adicionais incluem a modelagem de relações entre variáveis em instrumentos psicométricos (escores) e a utilização de modelos de dose-resposta, com destaque para o modelo logístico.
Aula 3: definição de covariância, ilustração do porquê dos valores positivos ou negativos da covariância, proposições/propriedades de covariância, definição de correlação, proposições/propriedades, estimador para a covariância e correlação, exemplo de cálculo de covariância e correlação com dados reais (consumo de açúcar e taxa de depressão), teste de hipóteses para correlação (teste 1: \(H_0: \rho = 0\) versus \(H_1: \rho \neq 0\) e teste 2: \(H_0: \rho = \rho_0\) versus \(H_1: \rho \neq \rho_0\)) e exercício de teste de hipóteses para correlação. Tarefa para casa: correlação como medida de proporção entre duas variáveis (padronizadas) \(Z_1 = k Z_2\).
Lista 1: covariância e correlação.
Aula 4: apresentação da definição formal do modelo de regressão, com exemplo motivacional. Construção e interpretação do gráfico de dispersão para visualização da relação entre duas variáveis. Modelo de regressão linear simples, com detalhamento de suas componentes e respectivas interpretações. Cálculo da média e da variância condicional de \(Y\) dado \(x\), \(E(Y|x)\) e \(\text{Var}(Y|x)\), com representação gráfica da reta de regressão e das curvas de densidade associadas. Discussão sobre o conceito de variância constante (homocedasticidade) e suas implicações para o ajuste do modelo. Definição do modelo de regressão linear múltipla, com apresentação de casos particulares, como o modelo de regressão polinomial. Distinção entre relação linear (ou não linear) entre variáveis e relação linear (ou não linear) entre os parâmetros do modelo. Estudo da estimação dos parâmetros do modelo de regressão linear simples por meio do método dos mínimos quadrados, acompanhado de um exemplo ilustrativo. Tarefa: estudar o método de estimação de máxima verossimilhanca, testes de hipóteses e intervalos de confiança para parâmetros.
Lista 2: um pouco mais sobre covariância e correlação.
Lista 3: ajuste de modelos de regressão linear simples.
Aula 5: estimação de \(\sigma^2\) (\(\hat{\sigma}^2 = QMErro\), quadrado médio do erro), propriedades dos estimadores de mínimos quadrados para os parâmetros \(\beta_0\) e \(\beta_1\), esperança e variância, distribuição de probabilidade dos estimadores (beta0 e beta1), intervalos de confiança e testes de hipóteses (Wald), exemplo de IC e TH para os parâmetros.
Aula 6: desenvolvimento da expressão \(SQErro = SQTotal - SQReg = S_{yy} - \hat{\beta}_1Sxy\), intervalo de confiança para o valor estimado (média), intervalo de predição (novas observações ou observações futuras) e exemplo. Lembrete: próxima aula será a avaliação teórica. É permitida a consulta a qualquer material, exceto celular e computador.
Lista 4: ajuste de modelos de regressão linear simples e inferência estatística (intervalos de confiança e testes de hipóteses).
Relatório: orientações para a entrega do relatório parcial de análise de dados (etapa 1). Data da entrega: 4/8/2025.
Aula 7: avaliação 1 (escrita).
Avaliações:
- \(A_1\): escrita, computacional e arguição oral. Nota: 0 a 10.
Conteúdo: análise de correlação, regressão linear simples e múltipla.
- \(A_2\): escrita, computacional e arguição oral. Nota: 0 a 10.
Conteúdo: todo o conteúdo da disciplina.
\(A_{31}\): relatório parcial de análise de dados. Nota: 0 a 5.
\(A_{32}\): relatório final de análise de dados. Nota: 0 a 5.
A média final (\(MF\)) será calculada por:
\[MP = 0,4 A_1 + 0,4 A_2 + 0,2(A_{31} + A_{32}).\]
Se \(MF \geq 5\), o aluno será aprovado. Não haverá prova final.
Livro texto:
Montgomery, D. C., Peck, E. A., & Vining, G. G. (2021). Introduction to linear regression analysis (6th ed.). Wiley.
Referências:
Devore, J. L., Berk, K. N., & Carlton, M. A. (2021). Modern mathematical statistics with applications (3rd ed.). Springer.
Seber, G. A. F., & Lee, A. J. (2012). Linear Regression Analysis (2nd ed.). Wiley.
Draper, N. R., & Smith, H. (1998). Applied regression analysis (3rd ed.). Wiley.
Rao, C. R., Toutenburg, H., Shalabh, & Heumann, C. (2008). Linear Models and Generalizations: Least Squares and Alternatives (3rd ed.). Springer.
Allen, M. P. (1997). Understanding Regression Analysis. Sage Publications.
Kutner, M. H., Nachtsheim, C. J., Neter, J., & Li, W. (2005). Applied linear statistical models (5th ed.). McGraw-Hill.
Rencher, A. C., & Schaalje, G. B. (2008). Linear models in statistics (2nd ed.). Wiley.
Faraway, J. J. (2015). Linear Models with R. CRC Press.