. tab sexo sexo do | entrevistad | o | Freq. Percent Cum. ------------+----------------------------------- masculino | 495 50.93 50.93 feminino | 477 49.07 100.00 ------------+----------------------------------- Total | 972 100.00 . tab sexo, nol sexo do | entrevistad | o | Freq. Percent Cum. ------------+----------------------------------- 1 | 495 50.93 50.93 2 | 477 49.07 100.00 ------------+----------------------------------- Total | 972 100.00 . sum wrca2005 if sexo==1 Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- wrca2005 | 449 .4661205 .0589262 .271789 .8586712 . hist wrca2005 if sexo==1 (bin=21, start=.27178901, width=.02794677) . anova wrca2005 corauto if sexo==1, tab option tab not allowed r(198); . oneway wrca2005 corauto if sexo==1, tab cor da pele | Summary of razao cintura altura em autorreferi | 2005 da | Mean Std. Dev. Freq. ------------+------------------------------------ branca | .46624595 .05929218 351 preta mul | .46187769 .05565917 82 amarela e | .48511188 .06681116 16 ------------+------------------------------------ Total | .46612047 .05892619 449 Analysis of Variance Source SS df MS F Prob > F ------------------------------------------------------------------------ Between groups .007252406 2 .003626203 1.04 0.3527 Within groups 1.54833636 446 .003471606 ------------------------------------------------------------------------ Total 1.55558877 448 .003472296 Bartlett's test for equal variances: chi2(2) = 1.0361 Prob>chi2 = 0.596 . xi: regress wrca2005 i.corauto if sexo==1 i.corauto _Icorauto_0-2 (naturally coded; _Icorauto_0 omitted) Source | SS df MS Number of obs = 449 -------------+------------------------------ F( 2, 446) = 1.04 Model | .007252406 2 .003626203 Prob > F = 0.3527 Residual | 1.54833636 446 .003471606 R-squared = 0.0047 -------------+------------------------------ Adj R-squared = 0.0002 Total | 1.55558877 448 .003472296 Root MSE = .05892 ------------------------------------------------------------------------------ wrca2005 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Icorauto_1 | -.0043683 .0072268 -0.60 0.546 -.0185712 .0098346 _Icorauto_2 | .0188659 .0150621 1.25 0.211 -.0107355 .0484674 _cons | .466246 .0031449 148.25 0.000 .4600652 .4724267 ------------------------------------------------------------------------------ * O xi colocado no começo do comando indica que na regressão podem ser incluidas variáveis categóricas * O i. indica qual a variável categórica * Nas análises anteriores as categorias 1 e 2 sao comparadas com a categoria de referencia (brancos) * Os valores devem ser interpretados como diferencias de média em comparação com a categoria de referência * Do lado direito aparecem os intervalos de confianca dessas diferenças * O detalhe é que o valor p que aparece em cada linha (P>|t|) que seria o TESTE DE WALD (procedimento que da o valor P nas análises de regressão) é um valor diferente para cada categoria, e preciso um valor P global. * Para obter o valor P global se usa o comando "test", somente que preciso especificar para qual variável quero o valor P * Para isso precisa ir no final da lista de variáveis, que ao fazer a regressao foram criadas novas variáveis que tem o mesmo nome das categorias que aparecem no resultado da regressao (_Icorauto_1 _Icorauto_2) . test _Icorauto_1 _Icorauto_2 ( 1) _Icorauto_1 = 0 ( 2) _Icorauto_2 = 0 F( 2, 446) = 1.04 Prob > F = 0.3527 *Isto também é teste de Wald. Perceba que o valor P é o mesmo do teste de ANOVA DE HETEROGENEIDADE > ------ LEMBRE QUE PARA FAZER AJUSTE PRECISA DEFINIR: - VALOR P PARA SER CONSIDERADO FATOR DE CONFUSÃO (USUALMENTE ENTRE 0,15 E 0,25) - SE VAI COLOCAR TODAS AS VARIÁVEIS JUNTAS (SEM CONSIDERAR MODELO - ÚTIL EM ESTUDOS DE INTERVENÇÃO OU EM ESTUDOS OBSERVACIONAIS QUANDO O QUE INTERESSA É UMA EXPOSICAO EM PARTICULAR, MESMO TENDO MODELO DE ANÁLISE) OU POR NÍVEIS (IMPORTANTE AO AVALIAR FATORES ASSOCIADOS - SE A SELEÇÃO SERÁ PARA FRENTE (VALOR P DA ANÁLISE BIVARIADA) OU PARA TRÁS (VALOR P AJUSTADO) - TIPO DE REGRESSAO QUE VAI USAR: LINEAR MÚLTIPLA (DESFECHO CONTINUO), LOGISTICA (DESFECHO DICOTOMICO), POISSON (DESFECHO É CONTAGEM OU DESFECHOS DICOTOMICOS COM PREVALÊNCIA >20%) OU COX (TEMPO ATÉ O EVENTO) A SEGUIR EXEMPLO DE AJUSTE PARA DESFECHO CONTÍNUO USANDO SELECAO PARA TRÁS POR NIVEIS, EM QUE O VALO P PARA CONFUSAO FOI FIXADO EM <0,20. * Para fazer o ajuste por níveis, usando seleção para trás, sao colocadas todas as variáveis juntas (por nível) * Como neste modelo todas sao categóricas, se coloca o i. na frente de cada variável * O resultado de cada variável é a diferença de médias ajustada para as outras do modelo (por exemplo, cor ajustada para escolaridade e renda) . xi: regress wrca2005 i.corauto i.wesc3g i.wrenda4g if sexo==1 i.corauto _Icorauto_0-2 (naturally coded; _Icorauto_0 omitted) i.wesc3g _Iwesc3g_0-2 (naturally coded; _Iwesc3g_0 omitted) i.wrenda4g _Iwrenda4g_0-3 (naturally coded; _Iwrenda4g_0 omitted) Source | SS df MS Number of obs = 449 -------------+------------------------------ F( 7, 441) = 1.45 Model | .035073378 7 .005010483 Prob > F = 0.1822 Residual | 1.52051539 441 .003447881 R-squared = 0.0225 -------------+------------------------------ Adj R-squared = 0.0070 Total | 1.55558877 448 .003472296 Root MSE = .05872 ------------------------------------------------------------------------------ wrca2005 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Icorauto_1 | -.0030032 .0074639 -0.40 0.688 -.0176724 .0116661 _Icorauto_2 | .0192526 .0152454 1.26 0.207 -.0107101 .0492153 _Iwesc3g_1 | -.0003871 .0064796 -0.06 0.952 -.0131218 .0123475 _Iwesc3g_2 | -.0090615 .0101491 -0.89 0.372 -.0290082 .0108852 _Iwrenda4g_1 | .0087135 .0097036 0.90 0.370 -.0103575 .0277845 _Iwrenda4g_2 | .0214551 .0092075 2.33 0.020 .0033591 .0395511 _Iwrenda4g_3 | .0216642 .0104732 2.07 0.039 .0010807 .0422477 _cons | .4517072 .008938 50.54 0.000 .4341408 .4692737 ------------------------------------------------------------------------------ . test _Icorauto_1 _Icorauto_2 ( 1) _Icorauto_1 = 0 ( 2) _Icorauto_2 = 0 F( 2, 441) = 0.96 Prob > F = 0.3835 . test _Iwesc3g_1 _Iwesc3g_2 ( 1) _Iwesc3g_1 = 0 ( 2) _Iwesc3g_2 = 0 F( 2, 441) = 0.49 Prob > F = 0.6124 . test _Iwrenda4g_1 _Iwrenda4g_2 _Iwrenda4g_3 ( 1) _Iwrenda4g_1 = 0 ( 2) _Iwrenda4g_2 = 0 ( 3) _Iwrenda4g_3 = 0 F( 3, 441) = 2.47 Prob > F = 0.0610 * Conforme o apresentado acima, porcede-se a tirar a variável com VALOR P MENOS SIGNIFICATIVO (NESTE CASO A ESCOLARIDADE) . xi: regress wrca2005 i.corauto i.wrenda4g if sexo==1 i.corauto _Icorauto_0-2 (naturally coded; _Icorauto_0 omitted) i.wrenda4g _Iwrenda4g_0-3 (naturally coded; _Iwrenda4g_0 omitted) Source | SS df MS Number of obs = 449 -------------+------------------------------ F( 5, 443) = 1.84 Model | .031688174 5 .006337635 Prob > F = 0.1033 Residual | 1.52390059 443 .003439956 R-squared = 0.0204 -------------+------------------------------ Adj R-squared = 0.0093 Total | 1.55558877 448 .003472296 Root MSE = .05865 ------------------------------------------------------------------------------ wrca2005 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Icorauto_1 | -.0021646 .0073178 -0.30 0.768 -.0165466 .0122174 _Icorauto_2 | .0204455 .0150383 1.36 0.175 -.0091097 .0500007 _Iwrenda4g_1 | .008714 .0096924 0.90 0.369 -.0103348 .0277628 _Iwrenda4g_2 | .0211308 .0091039 2.32 0.021 .0032387 .0390229 _Iwrenda4g_3 | .0186907 .0098546 1.90 0.059 -.0006768 .0380582 _cons | .4509068 .0082528 54.64 0.000 .4346873 .4671263 ------------------------------------------------------------------------------ . test _Icorauto_1 _Icorauto_2 ( 1) _Icorauto_1 = 0 ( 2) _Icorauto_2 = 0 F( 2, 443) = 1.02 Prob > F = 0.3614 . test _Iwrenda4g_1 _Iwrenda4g_2 _Iwrenda4g_3 ( 1) _Iwrenda4g_1 = 0 ( 2) _Iwrenda4g_2 = 0 ( 3) _Iwrenda4g_3 = 0 F( 3, 443) = 2.37 Prob > F = 0.0702 * A SEGUINTE VARIÁVEL A SAIR É COR DA PELE . xi: regress wrca2005 i.wrenda4g if sexo==1 i.wrenda4g _Iwrenda4g_0-3 (naturally coded; _Iwrenda4g_0 omitted) Source | SS df MS Number of obs = 449 -------------+------------------------------ F( 3, 445) = 2.39 Model | .024669523 3 .008223174 Prob > F = 0.0681 Residual | 1.53091924 445 .003440268 R-squared = 0.0159 -------------+------------------------------ Adj R-squared = 0.0092 Total | 1.55558877 448 .003472296 Root MSE = .05865 ------------------------------------------------------------------------------ wrca2005 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Iwrenda4g_1 | .0084973 .0096718 0.88 0.380 -.0105108 .0275053 _Iwrenda4g_2 | .0210449 .0090731 2.32 0.021 .0032133 .0388764 _Iwrenda4g_3 | .0184214 .0097012 1.90 0.058 -.0006443 .0374872 _cons | .4513923 .0079089 57.07 0.000 .4358489 .4669357 ------------------------------------------------------------------------------ . test _Iwrenda4g_1 _Iwrenda4g_2 _Iwrenda4g_3 ( 1) _Iwrenda4g_1 = 0 ( 2) _Iwrenda4g_2 = 0 ( 3) _Iwrenda4g_3 = 0 F( 3, 445) = 2.39 Prob > F = 0.0681 * ASSIM, NO FINAL NESTE NIVEL FICA SOMENTE A RENDA. SOMENTE QUE O P ANTERIOR É DE HETEROGENEIDADE.VOCÊ PODE PEGAR OS VALORES DA REGRESSÃO E COLOCAR NA TABELA QUE VOCÊ ESTÃ MONTANDO. MAS PARA VER O P DE TENDENCIA ´SE FAZ O SEGUINTE * PARA VER O VALOR P DE TENDENCIA PRECISA TIRAR O i. DA FRENTE QUE O VALOR P QUE APARECE NA LINHA É O DE TENDENCIA . xi: regress wrca2005 wrenda4g if sexo==1 Source | SS df MS Number of obs = 449 -------------+------------------------------ F( 1, 447) = 5.20 Model | .017879313 1 .017879313 Prob > F = 0.0231 Residual | 1.53770945 447 .003440066 R-squared = 0.0115 -------------+------------------------------ Adj R-squared = 0.0093 Total | 1.55558877 448 .003472296 Root MSE = .05865 ------------------------------------------------------------------------------ wrca2005 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- wrenda4g | .0065871 .0028894 2.28 0.023 .0009087 .0122655 _cons | .4545894 .0057658 78.84 0.000 .4432579 .4659209 ------------------------------------------------------------------------------ * NESTE CASO O VALOR P DE TENDENCIA É 0.023. NÃO ESQUEÇA QUE PARA DECIDIR POR HETREROGENEIDADE OU TENDENCIA PRECISA CONSIDERAR AS HIPOTESES INICIAIS E OBSERVAR OS DADOS PARA DEFINIR SE REALMENTE HÁ UM ATENDÊNCIA * DAQUI PARA FRENTE A VARIÁVEL QUE FICOU NUM NÍVEL PERMANECERÁ, MESMO QUE EM ETAPAS ANTERIORES PERCA SIGNIFICÂNCIA ESTATÍSTICA * O SEGUINTE PASSO É COLOCAR TODAS AS VARIÁVEIS DO SEGUINTE NIVEL É IR TIRANDO UMA A UMA ATÉ FICAR SOMENTE COM VARIÁVEIS COM P<0,20 (CRITERIO PARA SER FATOR DE CONFUSAO) . xi: regress wrca2005 i.wrenda4g i.wfumat i.wgordtercis i.wsedtotal if sexo==1 i.wrenda4g _Iwrenda4g_0-3 (naturally coded; _Iwrenda4g_0 omitted) i.wfumat _Iwfumat_0-1 (naturally coded; _Iwfumat_0 omitted) i.wgordtercis _Iwgordterc_1-3 (naturally coded; _Iwgordterc_1 omitted) i.wsedtotal _Iwsedtotal_0-1 (naturally coded; _Iwsedtotal_0 omitted) Source | SS df MS Number of obs = 449 -------------+------------------------------ F( 7, 441) = 2.22 Model | .053047676 7 .007578239 Prob > F = 0.0313 Residual | 1.50254109 441 .003407123 R-squared = 0.0341 -------------+------------------------------ Adj R-squared = 0.0188 Total | 1.55558877 448 .003472296 Root MSE = .05837 ------------------------------------------------------------------------------ wrca2005 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Iwrenda4g_1 | .0077298 .0097092 0.80 0.426 -.0113523 .0268119 _Iwrenda4g_2 | .0192721 .0091762 2.10 0.036 .0012377 .0373065 _Iwrenda4g_3 | .0151191 .0098347 1.54 0.125 -.0042096 .0344479 _Iwfumat_1 | -.0110807 .0064744 -1.71 0.088 -.0238052 .0016438 _Iwgordter~2 | .0001733 .0072988 0.02 0.981 -.0141715 .0145182 _Iwgordter~3 | -.0051016 .0066937 -0.76 0.446 -.0182571 .0080539 _Iwsedtota~1 | .0249288 .0112836 2.21 0.028 .0027525 .047105 _cons | .4563093 .0089189 51.16 0.000 .4387804 .4738382 ------------------------------------------------------------------------------ * QUANDO A VARIÁVEL É DICOTOMICA NAO PRECISA USAR O COMANDO "TEST" , O VALO P QUE APARECE NA LINHA JÁ É O VALOR P DA DIFERENCA DE MÉDIAS QUE SERÁ USADO (EQUIVALENTE AO TESTE T). POR EXEMPLO, PARA FUMO O VALOR P É 0.088 . test _Iwgordterc_2 _Iwgordterc_3 ( 1) _Iwgordterc_2 = 0 ( 2) _Iwgordterc_3 = 0 F( 2, 441) = 0.43 Prob > F = 0.6532 . test _Iwfumat_1 ( 1) _Iwfumat_1 = 0 F( 1, 441) = 2.93 Prob > F = 0.0877 * O PRIMEIRO A SAIR NESTE NIVEL É O CONSUMO DE GORDURA . xi: regress wrca2005 i.wrenda4g i.wfumat i.wsedtotal if sexo==1 i.wrenda4g _Iwrenda4g_0-3 (naturally coded; _Iwrenda4g_0 omitted) i.wfumat _Iwfumat_0-1 (naturally coded; _Iwfumat_0 omitted) i.wsedtotal _Iwsedtotal_0-1 (naturally coded; _Iwsedtotal_0 omitted) Source | SS df MS Number of obs = 449 -------------+------------------------------ F( 5, 443) = 2.95 Model | .050143025 5 .010028605 Prob > F = 0.0124 Residual | 1.50544574 443 .003398297 R-squared = 0.0322 -------------+------------------------------ Adj R-squared = 0.0213 Total | 1.55558877 448 .003472296 Root MSE = .05829 ------------------------------------------------------------------------------ wrca2005 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Iwrenda4g_1 | .0067411 .0096355 0.70 0.485 -.0121959 .0256781 _Iwrenda4g_2 | .0184167 .0090876 2.03 0.043 .0005565 .0362768 _Iwrenda4g_3 | .0143928 .0097594 1.47 0.141 -.0047876 .0335732 _Iwfumat_1 | -.0111225 .0064658 -1.72 0.086 -.0238299 .0015849 _Iwsedtota~1 | .0244746 .0112582 2.17 0.030 .0023484 .0466008 _cons | .4549919 .0082056 55.45 0.000 .4388651 .4711187 ------------------------------------------------------------------------------ * PERCEBA QUE NESTE MOMENTO A RENDA FOI AJUSTADA PARA VARIÁVEIS QUE SÃO DE UM NÍVEL INFERIOR (QUE VIRIAM SER MEDIADORES) * NESTE CASO SE REALMENTE AS VARIÁVEIS DE NÍVEL INFERIOR SAO MEDIADORAS NESSA CADEIA CAUSAL, ESPERA-SE PERDA PARCIAL OU TOTAL NA SIGNIFICANCIA ESTATISTICA E REDUCAO DA MEDIDA DE EFETIO. * OLHE A SEGUIR COMO O VALOR P, QUE ANTES DE AJUSTE ERA 0,07 PASSOU PARA O.15, O QUE SUGERE QUE REALMENTE FUMO E SEDENTARISMO SAO MEDIADORAS . test _Iwrenda4g_1 _Iwrenda4g_2 _Iwrenda4g_3 ( 1) _Iwrenda4g_1 = 0 ( 2) _Iwrenda4g_2 = 0 ( 3) _Iwrenda4g_3 = 0 F( 3, 443) = 1.79 Prob > F = 0.1476 * PARA REGRESSÃO LOGÍSTICA O COMANDO É O SEGUINTE (LEMBRE QUE O RESULTADO É A RAZAO DE ODDS) * LEMBRE QUE TRABALHAR COM DESFECHOS CONTÍNUOS SEMPRE TEM MAIS PODER (MAIS PROVAVEL DE TER ANÁLISES SIGNIFICATIVAS), COM O QUAL NEM SEMPRE AS VARIÁVEIS QUE FICARAM NUM MODELO FICAM NO OUTRO.NESTE CASO O FUMO NAO ENTRARIA NAS ANÁLISES) . xi: logistic wrcaelevada i.wrenda4g i.wfumat i.wsedtotal if sexo==1 i.wrenda4g _Iwrenda4g_0-3 (naturally coded; _Iwrenda4g_0 omitted) i.wfumat _Iwfumat_0-1 (naturally coded; _Iwfumat_0 omitted) i.wsedtotal _Iwsedtotal_0-1 (naturally coded; _Iwsedtotal_0 omitted) Logistic regression Number of obs = 449 LR chi2(5) = 9.93 Prob > chi2 = 0.0773 Log likelihood = -233.15199 Pseudo R2 = 0.0208 ------------------------------------------------------------------------------ wrcaelevada | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Iwrenda4g_1 | 1.344759 .6101612 0.65 0.514 .5526194 3.272371 _Iwrenda4g_2 | 1.907876 .807798 1.53 0.127 .8320512 4.374721 _Iwrenda4g_3 | 1.526562 .6898814 0.94 0.349 .6295651 3.701588 _Iwfumat_1 | .7993711 .2243357 -0.80 0.425 .4611764 1.385574 _Iwsedtota~1 | 2.672796 1.071069 2.45 0.014 1.218608 5.862294 ------------------------------------------------------------------------------ PARA REGRESSÃO DE POISSON, O COMANDO É O SEGUINTE (LEMBRE QUE POISSON FOI CRIADO PARA DESFECHOS DO TIPO CONTAGEM, MAS QUE, COM UM AJUSTIFICATIVA APROPRIADA, PODE SER USADA PARA DESFECHOS DICOTOMICOS COM PREVALENCIA >20%) . xi: poisson wrcaelevada i.wrenda4g i.wfumat i.wsedtotal if sexo==1, irr r i.wrenda4g _Iwrenda4g_0-3 (naturally coded; _Iwrenda4g_0 omitted) i.wfumat _Iwfumat_0-1 (naturally coded; _Iwfumat_0 omitted) i.wsedtotal _Iwsedtotal_0-1 (naturally coded; _Iwsedtotal_0 omitted) Iteration 0: log pseudolikelihood = -246.47532 Iteration 1: log pseudolikelihood = -246.47315 Iteration 2: log pseudolikelihood = -246.47315 Poisson regression Number of obs = 449 Wald chi2(5) = 12.61 Prob > chi2 = 0.0273 Log pseudolikelihood = -246.47315 Pseudo R2 = 0.0148 ------------------------------------------------------------------------------ | Robust wrcaelevada | IRR Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- _Iwrenda4g_1 | 1.282311 .4833556 0.66 0.509 .6125483 2.684393 _Iwrenda4g_2 | 1.675443 .5899391 1.47 0.143 .8402602 3.340763 _Iwrenda4g_3 | 1.417592 .5311456 0.93 0.352 .6801766 2.954478 _Iwfumat_1 | .8404527 .186352 -0.78 0.433 .5442243 1.297922 _Iwsedtota~1 | 1.969131 .4883201 2.73 0.006 1.21112 3.201563 ------------------------------------------------------------------------------