library(readr)
dados_b <- read_csv("db/suplementos_b.csv")
plotly::plot_ly(dados_b,x=~Raca,y=~Producao, color=~Suplemento, type = "box")%>%
layout(xaxis = list(range = c("G", "Gu", "H", "J", "N"), title="Tipo de Suplemento"), boxmode ="group")
Experimentos em Blocos
LECON/DEST - UFES
Delineamento utilizado quando as unidades experimentais não são homogêneas, mas podem ser agrupadas em grupos homogêneos chamados de blocos, contendo cada grupo normalmente uma repetição de cada tratamento.
Quando cada bloco contém pelo menos uma repetição de cada tratamento, diz-se que o experimento foi conduzido em um Delineamento em Blocos Completos Casualizados (BCC).
Um agrônomo deseja comparar quatro variedades de milho, com o objetivo de verificar se possuem em média a mesma produtividade. O agrônomo possui uma grande área para realizar o experimento. Entretanto, ele sabe que o solo não é homogêneo em toda a área. Portanto, um experimento inteiramente aleatorizado não é viável. Desta maneira, ele divide a área total em áreas homogêneas menores, os blocos. Assim, dentro de cada bloco ele delimita quatro parcelas, uma para cada variedade de milho que deseja comparar.
Um médico deseja comparar quatro medicamentos com o objetivo de verificar se possuem em média o mesmo efeito na redução de sinais e sintomas da artrite. O médico dispõe de um grande grupo de pacientes, de onde poderá selecionar uma amostra. Entretanto, há uma suspeita de que a idade do paciente é um fator de variação de sinais e sintomas. Desta maneira, os pacientes são divididos por faixa etária (estratos ou blocos). Assim, dentro de cada bloco, quatro (ou multiplo de quatro - réplicas) pacientes são sorteados, um para cada medicamento a ser comparado.
Observações
O bloqueamento (ou blocagem) também é chamado de controle local, pois permite que se controle alguma causa de variação conhecida que afeta os resultados do experimento, diminuindo assim o erro experimental.
Os tratamentos agrupados em um bloco devem ter as condições experimentais homogêneas, ou seja, é permitido que se tenha variação entre blocos, mas não dentro do bloco.
Para efeito de implantação do experimento, determina-se o bloco, sorteiam-se os tratamentos dentro de cada bloco e depois faz-se o sorteio da posição dos blocos.
Assume-se que há \(a\) tratamentos e \(b\) blocos.
Tratamento | Blocos | Total | Média |
---|---|---|---|
\(1\phantom{*}\quad \phantom{*}2\phantom{*}\quad \cdots\phantom{*} \quad b\phantom{*}\) | |||
1 | \(y_{11}\quad y_{12}\quad \cdots\quad y_{1b}\) | \(y_{1\cdot}\) | \(\bar{y}_{1\cdot}\) |
2 | \(y_{21}\quad y_{22}\quad \cdots\quad y_{2b}\) | \(y_{2\cdot}\) | \(\bar{y}_{2\cdot}\) |
\(\vdots\) | \(\vdots\qquad \vdots\qquad \cdots\qquad \vdots\) | \(\vdots\) | \(\vdots\) |
\(a\) | \(y_{a1}\quad y_{a2}\quad \cdots\quad y_{ab}\) | \(y_{a\cdot}\) | \(\bar{y}_{a\cdot}\) |
Total | \(y_{\cdot1}\quad y_{\cdot2}\quad \cdots\quad y_{\cdot}\) | \(y_{\cdot\cdot}\) | |
Média | \(\bar{y}_{\cdot 1}\quad \bar{y}_{\cdot 2}\quad \cdots\quad \bar{y}_{\cdot b}\) | \(\bar{y}_{\cdot\cdot}\) |
\[\begin{align*} y_{ij}=\mu+\tau_i+\beta_j+\epsilon_{ij},\quad i=1,\ldots,a,\quad j=1,\ldots,b, \end{align*}\]
\(y_{ij}\) é a observação do \(i-\)ésimo tratamento no \(j-\)ésimo bloco;
\(\tau_i\) representa o efeito do \(i-\)ésimo tratamento;
\(\beta_j\) representa o efeito do \(j-\)ésimo bloco;
\(\epsilon_{ij}\) é o erro experimental associado ao \(i-\)ésimo tratamento do \(j-\)ésimo bloco. Assume-se que \(\epsilon_{ij}\sim N(0,\sigma^2)\).
Observação
Importante
Assume-se que não há interação entre tratamentos e blocos.
O interesse está em testar os efeitos dos tratamentos:
\[\begin{cases} \text{H}_0:& \tau_1=\tau_2=\cdots\tau_a=0\\ \text{H}_1:& \tau_i\neq 0 \text{ para pelo menos um }i. \end{cases} \]
Equivalente a…
Hipótese de que as médias dos tratamentos são iguais.
Média do \(i\)-ésimo tratamento
\[\begin{align*} \mu_i&=E\left(\frac{\sum_{j=1}^b y_{ij}}{b}\right)\\ &=\frac{1}{b}\sum_{j=1}^b E(y_{ij})=\frac{1}{b}\sum_{j=1}^b E(\mu+\tau_i+\beta_j+\epsilon_{ij})\\ &=\frac{1}{b}\sum_{j=1}^b E(\mu+\tau_i+\beta_j)=\mu+\tau_i+\frac{1}{b} \sum_{j=1}^b \beta_j, \end{align*}\]
Dado que \(\sum_{j=1}^b \beta_j=0\), a média do \(i-\)ésimo tratamento é definida como \[\mu_i=\mu+\tau_i, \qquad i=1,\ldots, a.\]
Fonte de Variação | Gl | SQ | QM | \(F_0\) |
---|---|---|---|---|
Tratamentos | \(a-1\) | \(\frac{1}{b}\sum_{i=1}^a y_{i\cdot}^2-\frac{y_{\cdot\cdot}^2}{ab}\) | \(\frac{SQTr}{a-1}\) | \(\frac{QMTr}{QME}\) |
Blocos | \(b-1\) | \(\frac{1}{a}\sum_{i=1}^b y_{\cdot j}^2-\frac{y_{\cdot\cdot}^2}{ab}\) | \(\frac{SQB}{b-1}\) | |
Erro | \((a-1)(b-1)\) | \(SQT-SQTr\\-SQB\) | \(\frac{SQE}{(a-1)(b-1)}\) | |
Total | \(ab-1\) | \(\sum_{i=1}^a\sum_{j=1}^b y_{ij}^2\\-\frac{y_{\cdot\cdot}^2}{ab}\) | \(\phantom{.}\) |
Valor Esperado dos Quadrados Médios
\[\begin{align*} E\left(QMTr\right)&=\sigma^2+\frac{b\sum_{i=1}^a \tau_i^2}{a-1}\\ E\left(QMB\right)&=\sigma^2+\frac{a\sum_{j=1}^b \beta_j^2}{b-1}\\ E(QME)&=\sigma^2. \end{align*}\]
Observações
Se \(H_0\) for verdadeira, \(QMTr\) é um estimador não viesado de \(\sigma^2\). Se \(H_0\) for falsa, \(QMTr\) superestima \(\sigma^2\).
O \(QME\) é sempre um estimador não viesado de \(\sigma^2\).
Estatística de Teste:
\[F_0=\frac{QMTr}{QME},\] Temos que \(F_0\sim F_{(a-1,(a-1)(b-1))}\) sob \(H_0\). Rejeita-se \(H_0\) se \(F_0>F_{(\alpha,a-1,(a-1)(b-1))}\).
Avaliação dos efeitos dos blocos
Anderson & McLean (1974): A falta de aleatorização nos blocos torna \(F_0\) uma estatística inadequada para compará-los. Essa estatística testa a igualdade dos blocos mais o erro de restrição.
Se os erros são \(N(0,\sigma^2\)), pode-se usar a estatística \(F_0=\frac{QMB}{QME}\) para comparar as médias dos blocos (Box, Hunter & Hunter, 1978).
Solução prática
Examinar apenas a razão \(\frac{QMB}{QME}\).
\[\begin{align*} y_{\cdot\cdot} &= ab\widehat{\mu}+b\widehat{\tau_1}+b\widehat{\tau_2}+\cdots+b\widehat{\tau_a}+a\widehat{\beta}_1+a\widehat{\beta}_2+\cdots+a\widehat{\beta}_b\\ y_{1\cdot}&=\phantom{a}b\widehat{\mu}+b\widehat{\tau_1}\,\,\,\phantom{+b\widehat{\tau_2}+\cdots+b\widehat{\tau_a}}+\phantom{a}\widehat{\beta}_1+\phantom{a}\widehat{\beta}_2+\cdots+\phantom{a}\widehat{\beta}_b\\ \vdots\\ y_{a\cdot}&=\phantom{a}b\widehat{\mu}\,\,\,\phantom{+b\widehat{\tau_1}+b\widehat{\tau_2}+\cdots}+b\widehat{\tau_a}+\phantom{a}\widehat{\beta}_1+\phantom{a}\widehat{\beta}_2+\cdots+\phantom{a}\widehat{\beta}_b\\ y_{\cdot 1}&=\phantom{b}a\widehat{\mu}+\phantom{b}\widehat{\tau_1}+\phantom{b}\widehat{\tau_2}+\cdots+\phantom{b}\widehat{\tau_a}+a\widehat{\beta}_1\phantom{+\widehat{\beta}_2+\cdots+\widehat{\beta}_b}\\ \vdots\\ y_{\cdot b}&=\phantom{b}a\widehat{\mu}+\phantom{b}\widehat{\tau_1}+\phantom{b}\widehat{\tau_2}+\cdots+\phantom{b}\widehat{\tau_a}\,\,\,\phantom{+a\widehat{\beta}_1+a\widehat{\beta}_2+\cdots}+a\widehat{\beta}_b \end{align*}\]
As equações normais podem ser resumidas como
\[\begin{align*} y_{\cdot\cdot} &= ab\widehat{\mu}+b\sum_{i=1}^a\widehat{\tau_i}+a\sum_{j=1}^b \widehat{\beta}_j\\ y_{i\cdot}&=\phantom{a}b\widehat{\mu}+\phantom{\sum_{j=1}^b}b\,\,\widehat{\tau_i}+\phantom{a}\sum_{j=1}^b\widehat{\beta}_j\\ y_{\cdot j}&=\phantom{b}a\widehat{\mu}+\phantom{b}\sum_{i=1}^a \widehat{\tau_i}+\phantom{a}a\widehat{\beta}_j \end{align*}\]
Impondo as restrições \(\sum_{i=1}^a \widehat{\tau_i}=0\) e \(\sum_{j=1}^b\widehat{\beta}_j=0\) obtem-se os EMQ:
\[\begin{align*} \widehat{\mu}&=\overline{y}_{\cdot\cdot}\\ \widehat{\tau_i}&=\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot}, \qquad i=1,\ldots,a\\ \widehat{\beta}_j&=\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot}\qquad j=1,\ldots,b. \end{align*}\]
No exemplo trabalhado na ANOVA com um fator referente ao estudo dos efeitos da administração de raízes e tubérculos como suplementação de inverno na alimentação de vacas em lactação, assuma que foi considerado um experimento em blocos casualizados com 4 tipos de suplementos (tratamentos) e 5 raças (blocos). As produções médias diárias de leite (Kg) foram:
Tratamento | Bloco | Total | ||||
---|---|---|---|---|---|---|
Gir | Holandesa | Jersey | Nelore | Guzerá | ||
S | 6,4 | 6,2 | 6,2 | 7,1 | 6,6 | 32,5 |
M | 10,9 | 11,6 | 11,4 | 10,4 | 12,4 | 56,7 |
A | 12,0 | 10,9 | 11,5 | 11,1 | 11,8 | 57,3 |
B | 11,2 | 11,6 | 10,9 | 12,1 | 10,1 | 55,9 |
Total | 40,5 | 40,3 | 40,0 | 40,7 | 40,9 | 202,4 |
Fonte de Variação | g.l. | SQ | QM | \(F_0\) |
---|---|---|---|---|
Tratamentos | 3 | 87,560 | 29,187 | 60,075 |
Blocos | 4 | 0,122 | 0,030 | |
Erro | 12 | 5,830 | 0,486 | \(\phantom{.}\) |
Total | 19 | 93,512 | \(\phantom{.}\) |
No R:
Df Sum Sq Mean Sq F value Pr(>F)
Suplemento 3 87.56 29.187 60.075 1.69e-07 ***
Raca 4 0.12 0.030 0.063 0.992
Residuals 12 5.83 0.486
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Producao ~ Suplemento + Raca, data = dados_b)
$Suplemento
diff lwr upr p adj
B-A -0.28 -1.588788 1.028788 0.9186470
M-A -0.12 -1.428788 1.188788 0.9925738
S-A -4.96 -6.268788 -3.651212 0.0000005
M-B 0.16 -1.148788 1.468788 0.9828581
S-B -4.68 -5.988788 -3.371212 0.0000010
S-M -4.84 -6.148788 -3.531212 0.0000007
$Raca
diff lwr upr p adj
Guzera-Gir 0.100 -1.470976 1.670976 0.9995633
Holandesa-Gir -0.050 -1.620976 1.520976 0.9999722
Jersey-Gir -0.125 -1.695976 1.445976 0.9989491
Nelore-Gir 0.050 -1.520976 1.620976 0.9999722
Holandesa-Guzera -0.150 -1.720976 1.420976 0.9978583
Jersey-Guzera -0.225 -1.795976 1.345976 0.9898910
Nelore-Guzera -0.050 -1.620976 1.520976 0.9999722
Jersey-Holandesa -0.075 -1.645976 1.495976 0.9998603
Nelore-Holandesa 0.100 -1.470976 1.670976 0.9995633
Nelore-Jersey 0.175 -1.395976 1.745976 0.9961122
Rendimento de sementes de algodão:
Fertilizante | Parcela | \(y_{i\cdot}\) | |||
---|---|---|---|---|---|
A | B | C | D | ||
1 | 87 | 86 | 88 | 83 | 344 |
2 | 85 | 87 | 95 | 85 | 352 |
3 | 90 | 92 | 95 | 90 | 367 |
4 | 89 | 97 | 98 | 88 | 372 |
5 | 99 | 96 | 91 | 90 | 376 |
\(y_{\cdot j}\) | 450 | 458 | 467 | 436 | 1811 |
Fonte de Variação | g.l. | SQ | QM | \(F_0\) |
---|---|---|---|---|
Tratamentos | 4 | 186,20 | 46,55 | 4,26 |
Blocos | 3 | 103,75 | 34,58 | 3,17 |
Erro | 12 | 131,00 | 10,92 | |
Total | 19 | 420,95 |
No R:
Df Sum Sq Mean Sq F value Pr(>F)
factor(Fertilizante) 4 186.2 46.55 4.264 0.0224 *
factor(Parcela) 3 103.8 34.58 3.168 0.0638 .
Residuals 12 131.0 10.92
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Fonte de Variação | g.l. | SQ | QM | \(F_0\) |
---|---|---|---|---|
Tratamentos | 4 | 186,20 | 46,55 | 2,97 |
Erro | 15 | 234,75 | 15,65 | |
Total | 19 | 420,95 |
No R:
Df Sum Sq Mean Sq F value Pr(>F)
factor(Fertilizante) 4 186.2 46.55 2.974 0.0541 .
Residuals 15 234.8 15.65
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Observações
O teste para comparação de médias dos tratamentos sob o delineamento em blocos detecta diferenças significativas ao nível 5%.
Quando realizado o mesmo teste sob o delineamento completamente aleatorizado, não se encontram diferenças significativas entre tratamentos ao nível 5%.
Importante
Mesmo que os blocos não tenham um efeito significativo, nem sempre é conveniente prescindir deles.
No exemplo 2 notamos que os delineamentos completamente aleatorizado (DCA) e em blocos (DB) podem conduzir a conclusões divergentes.
A pergunta que surge naturalmente é referente à eficiência do delineamento em blocos, quando comparado com o delineamento mais simples (DCA). Uma forma de medir essa eficiência é dada por \[R=\dfrac{(gl_B+1)(gl_{CA}+3)}{(gl_{B}+3)(gl_{CA}+1)}\dfrac{\sigma^2_{CA}}{\sigma^2_{B}},\]
onde \(\sigma^2_{CA}\) e \(\sigma^2_{B}\) representam as variâncias dos erros dos delineamentos Completamente Aleatorizado e em Blocos, respectivamente; e \(gl_{CA}\) e \(gl_B\) são os correspondentes graus de liberdade dos erros dos dois delineamentos. Assim, \(R\) representa o acréscimo no número de réplicas requerido por um DCA para obter a mesma precisão do DB. Usando a ANOVA do DB, podemos estimar \(\sigma^2_{CA}\) e \(\sigma^2_{B}\) como
\[\begin{align*} \widehat{\sigma}^2_{B}&=QME\\ \widehat{\sigma}^2_{CA}&=\frac{(b-1)QMB+b(a-1)QME}{ab-1}. \end{align*}\]
A partir da tabela de ANOVA do DB, temos que \[\begin{align*} QME&= 10,92\\ gl_B=(a-1)(b-1)&= 12 \quad\quad gl_{CA}= a(b-1)=15. \end{align*}\]
Assim,
\[\begin{align*} \widehat{\sigma}^2_{B}&=10,92\\ \widehat{\sigma}^2_{CA}&=\frac{3\times 34,58+16\times 10,92}{20-1}=14,66. \end{align*}\]
A eficiência relativa do DB com respeito ao DCA é estimada como
\[\begin{align*} \widehat{R}&=\dfrac{(gl_B+1)(gl_{CA}+3)}{(gl_{B}+3)(gl_{CA}+1)}\dfrac{\sigma^2_{CA}}{\sigma^2_{B}}\\ &=\dfrac{(12+1)(15+3)}{(12+3)(15+1)}\dfrac{14,66}{10,92}=1,49. \end{align*}\]
Isto significa que o DCA precisaria de aproximadamente 50% a mais de observações para obter a mesma precisão do DB na detecção das diferenças.
Uma franquia de comidas está testando três novos itens no cardápio. Para determinar se eles têm o mesmo sucesso, seis restaurantes da franquia foram aleatoriamente selecionados para participar do estudo. Cada restaurante testará os três itens do cardápio. Adicionalmente, cada restaurante testará apenas um item por semana, de forma que o teste terá duração de três semanas. A ordem do teste de cada item para cada restaurante é aleatorizada. As vendas dos itens após uma semana de teste foram:
Item 1 | Item 2 | Item 3 |
---|---|---|
31 | 27 | 24 |
31 | 28 | 31 |
45 | 29 | 46 |
21 | 18 | 48 |
42 | 36 | 46 |
32 | 17 | 40 |
As comparações múltiplas referentes aos tratamentos podem ser realizadas da mesma forma que para o delineamento completamente aleatorizado.
Importante
Lembre que nesse caso, os graus de liberdade do erro são \((a-1)(b-1)\) e não \(a(n-1)\).
Testes para verificar independência, homoscedasticidade e normalidade são análogos aos realizados no delineamento completamente aleatorizado.
A aditividade dos efeitos de tratamentos e blocos (ausência de interação) deve ser verificada. Para este fim pode-se usar o Teste de Interação de Tukey.
Modelo:
\[\begin{align*} y_{ij}=\mu+\tau_i+\beta_j+(\tau\beta)_{ij}+\epsilon_{ij},\quad i&=1,\ldots,a,\\ j&=1,\ldots,b, \end{align*}\]
onde \((\tau\beta)_{ij}\) representa a interação entre tratamentos e blocos. Assumimos as restrições:
\[\begin{align*} \sum_{i=1}^a \tau_i=\sum_{j=1}^b \beta_j=\sum_{i=1}^a (\tau\beta)_{ij}=\sum_{j=1}^b (\tau\beta)_{ij}=0. \end{align*}\]
Portanto, o número de parâmetros independentes do modelo seria: \[1+(a-1)+(b-1)+(a-1)(b-1)=ab.\]
Problema
Igual ao número de observações!
Assume-se que a interação é da forma: \[(\tau\beta)_{ij}=\gamma \tau_i\beta_j,\]
onde \(\gamma\) é uma constante desconhecida. Portanto, o modelo é dado por
\[\begin{align*} y_{ij}=\mu+\tau_i+\beta_j+\gamma \tau_i \beta_j+\epsilon_{ij},\quad i&=1,\ldots,a,\\ j&=1,\ldots,b, \end{align*}\]
com as restrições:
\[\begin{align*} \sum_{i=1}^a \tau_i&=\sum_{j=1}^b \beta_j\\ &=\sum_{i=1}^a \gamma \tau_i \beta_j\\ &=\sum_{j=1}^b \gamma \tau_i \beta_j\\ &=0. \end{align*}\]
\[\frac{\partial L}{\partial \gamma}=\sum_{i=1}^a \sum_{j=1}^b[y_{ij}-\mu-\tau_i-\beta_j-\gamma\tau_i\beta_j]\tau_i\beta_j=0\]
Logo, \[\begin{align*} \sum_{i=1}^a \sum_{j=1}^b y_{ij}\tau_i\beta_j&-\mu\sum_{i=1}^a \tau_i \sum_{j=1}^b \beta_j-\sum_{i=1}^a \tau_i^2 \sum_{j=1}^b \beta_j\\ &-\sum_{j=1}^b \beta_j^2 \sum_{i=1}^a \tau_i-\gamma\sum_{i=1}^a \tau_i^2 \sum_{j=1}^b \beta_j^2=0. \end{align*}\]
Daí, \[\widehat{\gamma}=\frac{\sum_{i=1}^a \sum_{j=1}^b \widehat{\tau}_i\widehat{\beta}_j y_{ij}}{\sum_{i=1}^a \widehat{\tau}_i^2\sum_{j=1}^b \widehat{\beta}_j^2}.\]
Substituindo \(\widehat{\tau}_i\) e \(\widehat{\beta}_j\) pelos respectivos estimadores, obtemos
\[\widehat{\gamma}=\frac{\sum_{i=1}^a \sum_{j=1}^b(\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot})(\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot}) y_{ij}}{\sum_{i=1}^a (\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot})^2\sum_{j=1}^b (\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot})^2}.\]
Soma de Quadrados da Interação
\[\begin{align*} SQI&=\sum_{i=1}^a\sum_{j=1}^b \widehat{\gamma}^2\widehat{\tau}_i^2 \widehat{\beta}_j^2\\ &=\sum_{i=1}^a\sum_{j=1}^b \widehat{\gamma}^2 (\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot})^2(\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot})^2\\ &=\frac{\left[\sum_{i=1}^a\sum_{j=1}^b (\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot})(\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot})y_{ij}\right]^2}{\sum_{i=1}^a (\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot})^2 \sum_{j=1}^b (\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot})^2}. \end{align*}\]
\[SQT=SQTr+SQB+SCI+SQE.\]
Se \(\gamma=0\), podemos provar que \(SQI/\sigma^2\sim \chi_{(1)}^2\) e \(SQE/\sigma^2\sim \chi_{(ab-a-b)}^2\) são variáveis aleatórias independentes, daí:
\[F=\frac{SQI/1}{SCE/(ab-a-b)}\sim F_{(1,ab-a-b)}.\] Rejeita-se \(H_0: \gamma=0\) se \(F>F_{(\alpha,1,ab-a-b)}\).
\[\begin{align*} \widehat{\gamma}&= \frac{\sum_{i=1}^a \sum_{j=1}^b (\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot})(\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot}) y_{ij}}{\sum_{i=1}^a (\overline{y}_{i\cdot}-\overline{y}_{\cdot\cdot})^2\sum_{j=1}^b (\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot})^2}.\\ &=\frac{-21,45}{(46,55)(20,75)}=-0,0222\\ SQI&= \sum_{i=1}^a\sum_{j=1}^b (-0,0222)^2 (46,55) (20,75)=0,4760. \end{align*}\]
\[ F= \frac{SQI}{SQE/(ab-a-b)}=\frac{0,4760}{131,00/11}=0,0395.\\ \] Podemos concluir que não há interação entre fertilizantes e parcelas do terreno.
Na presença de observações faltantes, os tratamentos deixam de ser ortogonais aos blocos, ou seja, não há ocorrência de cada tratamento em cada bloco.
Abordagens para o tratamento de dados faltantes
Seja \(x\) a observação faltante para o tratamento \(i\) no bloco \(j\). Deseja-se estimar a observação \(x\) tal que sua contribuição na soma de quadrados do erro seja mínima. Isto é equivalente a minimizar:
\[\begin{align*} SQE&=\sum_{i=1}^a\sum_{j=1}^b y_{ij}^2-\frac{1}{b}\sum_{i=1}^a\left(\sum_{j=1}^b y_{ij}\right)^2\\ &-\frac{1}{a}\sum_{j=1}^b\left(\sum_{i=1}^a y_{ij}\right)^2+\frac{1}{ab}\left(\sum_{i=1}^a\sum_{j=1}^b y_{ij}\right)^2. \end{align*}\]
Equivalente a
\[\begin{align*} SQE=x^2&-\frac{1}{b}(y_{i\cdot}'+x)^2-\frac{1}{a}(y_{\cdot j}'+x)^2\\ &+\frac{1}{ab}(y_{\cdot\cdot}'+x)^2+R, \end{align*}\]
onde \(y_{i\cdot}'\) representa o total para o tratamento com a observação faltante, \(y_{\cdot j}'\) é o total para o bloco com a observação faltante, \(y_{\cdot\cdot}'\) representa o total geral com a observação faltante e \(R\) inclui todos os termos que não envolvem \(x\).
A partir de \(\frac{dSQE}{dx}=0\) obtemos a estimativa da observação faltante:
\[x=\frac{ay_{i\cdot}'+by_{\cdot j}'-y_{\cdot\cdot}'}{(a-1)(b-1)}.\]
Observação
Se houver várias observações faltantes, elas podem ser estimadas escrevendo a soma de quadrados do erro como função dos valores faltantes, diferenciando com respeito a cada um deles, igualando com zero e resolvendo as equações resultantes. Os graus de liberdade são reduzidos em um para cada observação estimada.
Delineamentos em Blocos Incompletos (DBIB) são aqueles nos quais se tem um grande número de tratamentos, mas nem todos podem ser aplicados em todos os blocos.
Em um DBIB, cada bloco é selecionado de forma balanceada, de forma que qualquer par de tratamentos ocorra simultaneamente o mesmo número de vezes que qualquer outro par de tratamentos. Assumido que há \(k\) tratamentos e \(b\) blocos, cada bloco pode conter \(a\) tratamentos, onde \(a<k\).
Exemplo: DBIB com 3 tratamentos
Consideremos três tratamentos (A, B e C) onde dois deles são aplicados em cada bloco. Temos
\[\left(\begin{array}{c} 3 \\ 2 \\ \end{array} \right)=3\]
formas de selecionar 2 dos três tratamentos.
1 | 2 | 3 |
---|---|---|
A | - | A |
B | B | - |
- | C | C |
Exemplo: DBIB com 5 tratamentos
Consideremos cinco tratamentos (A, B, C, D e E) onde três deles são aplicados em cada bloco. Temos 10 formas de selecionar 3 dos 5 tratamentos.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|
A | - | - | - | A | A | A | - | A | A |
- | B | B | - | B | B | - | B | B | - |
C | - | C | C | C | - | - | C | - | C |
D | D | - | D | - | D | D | D | - | - |
- | E | E | E | - | - | E | - | E | E |
Considerações:
Seja \(r\) o número de blocos nos quais aparece cada tratamento.
Seja \(\lambda=\frac{r(k-1)}{a-1}\) o número de vezes que cada par de tratamentos aparece simultaneamente no mesmo bloco.
O tamanho amostral é \(ab=kr\).
Fonte de Variação | Gl | SQ | QM | \(F_0\) |
---|---|---|---|---|
Tratamentos (Adj) | \(k-1\) | \(\frac{a\sum_{i=1}^k Q_i^2}{\lambda k}\) | \(\frac{SQTrAdj}{k-1}\) | \(\frac{QMTrAdj}{QME}\) |
Blocos | \(b-1\) | \(k\sum_{j=i}^b (\overline{y}_{\cdot j}-\overline{y}_{\cdot\cdot})^2\) | \(\frac{SQB}{b-1}\) | |
Erro | \[\begin{align*} &kr-k\\ &-b-1 \end{align*}\] | \[\begin{align*} &SQT-SQTrAdj\\ &-SQB \end{align*}\] | \(\frac{SQE}{kr-k-b-1}\) | \(\phantom{.}\) |
Total | \(kr-1\) | \(\sum_{i=1}^k\sum_{j=1}^b(y_{ij}-\overline{y}_{\cdot\cdot})^2\) | \(\phantom{.}\) | \(\phantom{.}\) |
onde \(Q_i\) representa o total ajustado para o \(i-\)ésimo tratamento, calculado como \[Q_i=y_{i\cdot}-\frac{1}{k} \sum_{j=1}^b n_{ij} y_{\cdot j},\quad i=1,\ldots,a\] com \(n_{ij}=1\) se o tratamento \(i\) está no bloco \(j\) e \(n_{ij}=0\) em caso contrário.
Material elaborado pela equipe LECON/NEAEST