class: center, middle, inverse, title-slide .title[ # ANÁLISE DE DADOS CATEGORIZADOS STA13833 ] .subtitle[ ## Introdução ] .author[ ### Nátaly A. Jiménez Monroy ] .institute[ ### LECON/DEST - UFES ] .date[ ### Vitória. ES ] --- class: animated, fadeIn <style> body {text-align: justify} </style> <!-- Justify text. --> # Contexto - I Em diversos estudos é comum o registro de variáveis qualitativas e quantitativas (contínuas ou discretas). Por exemplo: - Melhora do paciente: sim, não. - Desempenho do candidato: bom, regular, péssimo. - Local de moradia: norte, sul, leste, oeste. - Horas de alívio de dor: 0, 1, 2, 3, > 4. - Idade: anos. -- Tais variáveis são comumente classificadas de acordo com suas respectivas escalas de mensuração: - Dicotômicas ou binárias. - Politômicas (ordinais ou nominais). - Contagens discretas. - Contínuas. --- class: animated, fadeIn #Contexto - II Por interesse do pesquisador, ou por conveniência, variáveis contínuas podem ser categorizadas: * Idade `\(\rightarrow\)` Faixas etárias. * Resultado de um exame médico `\(\rightarrow\)` Normal ou anormal. * Peso `\(\rightarrow\)` Obeso ou não obeso. * Peso `\(\rightarrow\)` < 60, [60 − 100), [100, 150), ≥ 150. -- > Agrupar categorias pode ser necessário quando houver categorias com frequências muito pequenas ou nulas. * Em função do delineamento amostral e dos objetivos, as variáveis podem ser classificadas em: * variáveis resposta * variáveis explicativas >**Observação:** Nem sempre essa classificação é simples. --- class: animated, fadeIn #Contexto - III Aqui serão apresentados e estudados testes, medidas de associação e modelos de regressão utilizados com frequência em estudos onde: * Variável resposta: categórica * Variáveis explicativas: Contínuas ou categóricas -- A análise dos dados dessa natureza é chamada de: **<span style="color:orange">Análise de dados categóricos</span>** ou análise de dados discretos. --- class: animated, slideInRight #Exemplo - I <img src="images/intro2.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, slideInRight #Exemplo - II <img src="images/intro3.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, slideInRight #Exemplo - III <img src="images/intro4.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, slideInRight #Exemplo - IV <img src="images/intro5.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, slideInRight #Exemplo - V <img src="images/intro6.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, slideInRight #Exemplo - VI <img src="images/intro7.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, slideInRight #Exemplo - VII <img src="images/intro8.png" width="65%" style="display: block; margin: auto;" /> --- class: animated, slideInRight #Notação - frequências absolutas * Os dados de estudos em que as variáveis resposta e explicativas (fatores e covariáveis) são categóricas costumam ser organizados em **<span style="color:orange">tabelas de contingência</span>**. * Se `\(X\)` e `\(Y\)` são duas variáveis dicotômicas temos a tabela de contingência `\(2 \times 2\)` dada por | Categorias de `\(X\)` | Categorias | de `\(Y\)` | Totais | |:-----------------:|:-----------:|:-------:|:-------:| | | `\(j=1\)` | `\(j=2\)` | | | `\(i=1\)` | `\(n_{11}\)` | `\(n_{12}\)`| `\(n_{1+}\)`| | `\(i=2\)` | `\(n_{21}\)` | `\(n_{22}\)`| `\(n_{2+}\)`| | Totais | `\(n_{+1}\)` | `\(n_{+2}\)`| `\(n_{++}=n\)`| >*Frequências* `\(n_{ij} \Rightarrow\)` indivíduos na categoria `\(i\)` de `\(X\)` e categoria `\(j\)` de `\(Y\)`. >*Totais marginais - linha:* `\(\Rightarrow\)` frequências `\(n_{i+}\)` >*Totais marginais - coluna:* `\(\Rightarrow\)` frequências `\(n_{+j}\)` >*Total geral ou amostral:* `\(\Rightarrow\)` soma dos `\(n_{ij}\)` --- class: animated, slideInRight #Notação - probabilidades | Categorias de `\(X\)` | Categorias | de `\(Y\)` | Totais | |:-----------------:|:-----------:|:-------:|:-------:| | | `\(j=1\)` | `\(j=2\)` | | | `\(i=1\)` | `\(p_{11}\)` | `\(p_{12}\)`| `\(p_{1+}\)`| | `\(i=2\)` | `\(p_{21}\)` | `\(p_{22}\)`| `\(p_{2+}\)`| | Totais | `\(p_{+1}\)` | `\(p_{+2}\)`| `\(1\)`| > Probabilidades conjuntas: `\(p_{ij}=P(X=i, Y=j)\)` > Probabilidades condicionais: `\(p_{(i)j}=P(Y=j| X=i)\)`, `\(p_{i(j)}=P(X=i| Y=j)\)` > Probabilidades marginais - linha: `\(p_{i+}=P(X=i)\)` > Probabilidades marginais - coluna: `\(p_{+j}=P(Y=j)\)` --- class: animated, hide-logo, bounceInDown ## Política de proteção aos direitos autorais > <span style="color:grey">O conteúdo disponível consiste em material protegido pela legislação brasileira, sendo certo que, por ser o detentor dos direitos sobre o conteúdo disponível na plataforma, o **LECON** e o **NEAEST** detém direito exclusivo de usar, fruir e dispor de sua obra, conforme Artigo 5<sup>o</sup>, inciso XXVII, da Constituição Federal e os Artigos 7<sup>o</sup> e 28<sup>o</sup>, da Lei 9.610/98. A divulgação e/ou veiculação do conteúdo em sites diferentes à plataforma e sem a devida autorização do **LECON** e o **NEAEST**, pode configurar violação de direito autoral, nos termos da Lei 9.610/98, inclusive podendo caracterizar conduta criminosa, conforme Artigo 184<sup>o</sup>, §1<sup>o</sup> a 3<sup>o</sup>, do Código Penal. É considerada como contrafação a reprodução não autorizada, integral ou parcial, de todo e qualquer conteúdo disponível na plataforma.</span> .pull-left[ <img src="images/logo_lecon.png" width="50%" style="display: block; margin: auto;" /> ] .pull-right[ <img src="images/logo_neaest.png" width="50%" style="display: block; margin: auto;" /> ] <br></br> .center[ [https://lecon.ufes.br](https://lecon.ufes.br/)] <font size="2"><span style="color:grey">Material elaborado pela equipe LECON/NEAEST: Alessandro J. Q. Sarnaglia, Bartolomeu Zamprogno, Fabio A. Fajardo, Luciana G. de Godoi e Nátaly A. Jiménez.</span></font>