






























Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
Community
Ask the community for help and clear up your study doubts
Discover the best universities in your country according to Docsity users
Free resources
Download our free guides on studying techniques, anxiety management strategies, and thesis advice from Docsity tutors
Describe la metodología del diseño experimental de Bloques Completamente Aleatorizados
Typology: Summaries
1 / 38
This page cannot be seen from the preview
Don't miss anything!
En las situaciones que hemos estudiado en el Capítulo 1 hemos supuesto que existe bastante homogéneidad entre las unidades experimentales, así, por ejemplo, en el caso de la industria algodonera, hemos supuesto que las parcelas de terreno son de la misma calidad e igual superficie. Pero, puede suceder que dichas parcelas sean distintas y contribuyan a la variablidad observada en el rendimiento de la semilla de algodón. Si en esta situación se utiliza un diseño completamente aleatorizado, las diferencias entre los rendimientos de dos unidades experimentales sometidas a distintos tratamientos no sabremos si se deben a una diferencia real entre los efectos de los tratamientos o a la heterogeneidad de dichas unidades. Como resultado el error experimental reflejará esta variabilidad entre las parcelas de terreno.
En todo diseño de experimento se desea que el error experimental sea lo más pequeño posible. Por lo tanto, en la situación descrita se debe sustraer del error experimental la variabilidad producida por las parcelas de terreno. Para ello, el experimentador puede:
Considerar parcelas de terreno muy homogéneas.
O bien, formar bloques de terreno de manera que el terreno de cada bloque sea lo más homogéneo posible y los bloques entre sí sean heterogéneos.
En esta última situación, cada bloque se divide en I parcelas de terreno, tantas como tratamientos y cada tratamiento se prueba en cada uno de los bloques. Los I tratamientos, en este caso las I variedades del fertilizante, se asignan al azar a cada una de las I parcelas del bloque; esto se hace con asignación aleatoria independientemente en cada bloque. Este
1
2 Diseños en bloques aleatorizados
diseño se conoce como diseño en bloques^1 completos aleatorizados. La palabra completo indica que todos los tratamientos se prueban en cada bloque.
Puede suceder, cuando se realizan diseños en bloques aleatorizados, que no puedan realizarse los ensayos de todos los tratamientos dentro de cada bloque, debido, por ejemplo, a la escasez de recursos del experimento o al tamaño físico de los bloques. Es decir, no se puede aplicar cada fertilizante en cada bloque. En estos casos, es posible usar diseños aleatorizados por bloques en los que no todos los tratamientos se encuentran representados en cada bloque, y aquellos que sí están representados en uno en particular se ensayan en él una sola vez. Estos diseños se conocen como diseños por bloques incompletos.
Recordemos que en el diseño completamente aleatorizado asignábamos los tratamien- tos al azar a las parcelas sin restricción alguna, mientras que en el diseño en bloques aleatorizados primero agrupamos las parcelas en bloques y a continuación asignamos los tratamientos a las parcelas en cada bloque. Podemos decir, por tanto, que un diseño en bloque aleatorizados es un diseño con aleatorización restringida en el cual las unidades experimentales son primero clasificadas en grupos homogéneos, llamados bloques, y los tratamientos son entonces asignados aleatoriamente dentro de los bloques.
Esta estrategia de diseño mejora efectivamente la precisión en las comparaciones al reducir la variabilidad residual. Dicho diseño es quizás el diseño experimental más ampli- amente utilizado. En la práctica, las situaciones en las que este diseño se aplica son muy numerosas y pueden identificarse fácilmente.
Estudiaremos en primer lugar el diseño en bloques completos aleatorizados, y en la sección ?? el diseño en bloques incompletos.
Para desarrollar esta sección consideramos el siguiente ejemplo al que seguiremos haciendo referencia en las sucesivas secciones.
Ejemplo 5. Una industria algodonera, interesada en maximizar el rendimiento de la semilla de al- godón, quiere comprobar si dicho rendimiento depende del tipo de fertilizante utilizado para tratar la planta. A su disposición tiene 5 tipos de fertilizantes. Como puede haber diferencia entre las parcelas, el experimentador decide efectuar un diseño en bloques aleatorizados. Para ello, divide el terreno en 4 bloques^2 y cada bloque en 5 parcelas, fumigando dentro
(^1) El término bloques aleatorios procede de la experimentación agrícola, en la que pueden usarse parcelas de terreno como unidades experimentales. Un bloque consiste en varias parcelas adyacentes, y se supone que las parcelas adyacentes son más semejantes que las alejadas entre sí. (^2) El terreno, en cada bloque, debe ser lo más homogéneo posible.
4 Diseños en bloques aleatorizados
Supondremos que se realiza una observación por tratamiento en cada bloque, por tanto, hay un total de N = IJ observaciones y que la asignación de los tratamientos a las unidades experimentales en cada bloque se determina aleatoriamente. También se supone que tanto los tratamientos como los bloques son factores de efectos fijos y que no hay interacción entre ellos. Se dice que no hay interacción entre dos factores cuando el efecto de un factor no depende del nivel del otro factor; en este caso se dice que los efectos de los factores son aditivos.
Las observaciones se pueden disponer en forma de tabla de doble entrada como la siguiente Tabla 4-2. Diseño en bloques aleatorizado
Bloques Tratamientos 1 2 · · · j · · · J 1 y 11 y 12 · · · y 1 j · · · y 1 J 2 y 21 y 22 · · · y 2 j · · · y 2 J .. .
i yi 1 yi 2 · · · yij · · · yiJ .. .
I yI 1 yI 2 · · · yIj · · · yIJ
Generalmente no vamos a utilizar el término completo cuando en el contexto esté claro que todos los tratamientos están incluidos en cada bloque.
Utilizamos la siguiente notación:
N = IJ es el número total de observaciones.
yi. es el total de las observaciones bajo el i-ésimo tratamiento, es decir
yi. =
j=
yij i = 1, 2 , · · · , I (5.1)
y.j es el total de las observaciones bajo el j-ésimo bloque, es decir
y.j =
i=
yij j = 1, 2 , · · · , J (5.2)
5.2 Diseño en bloques completos aleatorizados 5
y.. es la suma de todas las observaciones, denominado el total general, es decir
y.. =
i=
j=
yij =
i=
yi. =
j=
y.j (5.3)
¯yi. es la media de las observaciones del tratamiento i-ésimo, es decir
y ¯i. = yi. J
¯y.j es la media de las observaciones del bloque j-ésimo, es decir
y ¯.j =
y.j I
¯y.. es la media general de las observaciones, es decir
¯y.. =
y.. N
i=
j=
yij ,
que también se puede expresar como media de las medias parciales, es decir
y ¯.. =
i=
y ¯i. =
j=
y ¯.j.
El modelo estadístico para este diseño es:
yij = μ + τ (^) i + βj + uij i = 1, 2 , · · · , I ; j = 1, 2 , · · · , J , (5.4)
donde
yij es la variable aleatoria que representa la observación (i)-ésima del bloque (j)- ésimo.
μ es un efecto constante que mide el nivel promedio de respuesta para todas las unidades, denominado media global.
τ (^) i es el efecto producido por el nivel i-ésimo del factor principal. Se supone que i τ^ i^ = 0. βj es el efecto producido por el nivel j-ésimo del factor secundario o factor de bloque. Se supone que
j βj = 0.
5.2 Diseño en bloques completos aleatorizados 7
Estimación por máxima verosimilitud
Al igual que en modelo completamente aleatorizado se construye la función de verosimilitud asociada a la muestra y = (y 11 , · · · , y 1 J , · · · , yI 1 , · · · , yIJ ):
L(μ, τ (^) i, βj , σ^2 ) = (2πσ^2 )
−
2 exp
2 σ^2
i=
j=
yij − μ − τ (^) i − βj
se determina el logaritmo de dicha función
ln(L(μ, τ (^) i, βj , σ^2 )) = −
ln(2π) −
ln(σ^2 ) −
2 σ^2
i=
j=
yij − μ − τ (^) i − βj
y se hallan las primeras derivadas parciales respecto de los parámetros del modelo
∂ ln L ∂μ
σ^2
i=
j=
yij − μ − τ (^) i − βj
∂ ln L ∂τ (^) i
σ^2
j=
yij − μ − τ (^) i − βj
i = 1, · · · , I
∂ ln L ∂βj
σ^2
i=
yij − μ − τ (^) i − βj
j = 1, · · · , J
∂ ln L ∂σ^2
2 σ^2
2(σ^2 )^2
i=
j=
yij − μ − τ (^) i − βj
Igualando a cero estas derivadas parciales, se obtiene un sistema de ecuaciones que proporciona los estimadores máximo verosímiles. Dichos estimadores vienen dados por las expresiones
μ =
i=
j=
yij
N = ¯y.. , (5.12)
8 Diseños en bloques aleatorizados
τ (^) i =
j=
yij − μ = ¯yi. − y¯.. , (5.13)
βj =
i=
yij − μ = ¯y.j − y¯... (5.14)
Por tanto, la media general se estima utilizando el promedio de todas las observaciones y cualquiera de los efectos de los factores se estiman usando la diferencia entre el promedio correspondiente al nivel del factor y el promedio total.
Se puede comprobar fácilmente que
i
τ (^) i = 0
y (^)
j
βj = 0
siendo, por tanto, I − 1 y J − 1 los grados de libertad asociados a los tratamientos y a los bloques, respectivamente.
Finalmente, sustituyendo μ, τ (^) i y βj en la última ecuación de (5.11) igualada a cero, obtenemos el estimador de máxima verosimilitud para la varianza
σ^2 =
i=
j=
yij − μ − τ (^) i − βj
2
. (5.15)
Residuos
Los residuos se definen como las diferencias entre los valores observados yij y los valores estimados por el modelo yij y los denotamos por eij ,
eij = yij − yij = yij − μ − τ (^) i − βj = yij − y¯i. − ¯y.j + ¯y... (5.16)
Por lo tanto, el estimador máximo-verosimil, σ^2 , se puede escribir como
σ^2 =
i=
j=
e^2 ij
N
10 Diseños en bloques aleatorizados
c) μ se distribuye según una Normal, puesto que dicho estimador es combinación lineal de variables aleatorias independientes con distribución Normal.
a) τ (^) i es un estimador centrado de τ (^) i, puesto que
E[τ^ i] =^ E[¯yi.]^ −^ E[¯y..] =^ μ^ +^ τ^ i −^ μ^ =^ τ^ i.
En efecto
E[¯yi.] =^ E
j=
yij
j=
μ + τ (^) i + βj + uij
Jμ + Jτ (^) i +
j=
βj +
j=
E[uij ]
(^) = μ + τ (^) i
b) La varianza de τ (^) i es (I − 1) σ^2 N
, puesto que
Var[τ (^) i] = Var [¯yi. − y¯..] = Var
j
yij −
i,j
yij
j
Var(yij ) +
i,j
Var(yij ) −
Cov
j
yij ,
i,j
yij
j
σ^2 +
i,j
σ^2 −
Jσ^2 =
σ^2 +
σ^2 − 2 σ^2 N
σ^2 J
σ^2 N
σ^2 N (5.17) c) τ (^) i se distribuye según una Normal, puesto que dicho estimador está expresado como función lineal de variables aleatorias con distribución Normal.
5.2 Diseño en bloques completos aleatorizados 11
a) βj es un estimador centrado de βj , puesto que
E[βj ] =^ E[¯y.j ]^ −^ E[¯y..] =^ μ^ +^ βj −^ μ^ =^ βj.
En efecto
E[¯y.j ] =^ E
i
yij
i
μ + τ (^) i + βj + uij
Iμ +
i
τ (^) i + Iβj +
i
E[uij ]
= μ + βj
b) La varianza de βj es (J − 1) σ^2 N c) βj se distribuye según una Normal.
N σ^2 σ^2
σ^2
i=
j=
(eij )^2 χ^2 (I−1)(J−1) ,
donde los grados de libertad de la distribución χ^2 corresponden al número de residuos independientes, por tanto
N σ^2 σ^2
= (I − 1)(J − 1) ⇒ (^) E[σ^2 ] =
σ^2 ,
luego σ^2 no es un estimador insesgado de σ^2. Ahora bien, a partir de este resultado se construye fácilmente un estimador centrado simplemente considerando
σ ^2 =
σ^2.
Dicho estimador recibe el nombre de varianza residual, se denota por S^2 R y se expresa, por tanto, de la siguiente forma
σ ^2 = S R^2 =
i=
j=
[yij − yij ]^2
(I − 1)(J − 1)
i=
j=
e^2 ij
(I − 1)(J − 1)
5.2 Diseño en bloques completos aleatorizados 13
(τ − τ )′e =
i
j
(τ (^) i − τ (^) i)eij =
i
(τ (^) i − τ (^) i)
j
eij = 0 (5.24)
(β − β)′e =
i
j
(βj − βj )eij =
j
(βj − βj )
i
eij = 0 (5.25)
De forma similar se comprueba que los restantes productos escalares son nulos. Por lo tanto, los vectores en que se descompone Z son ortogonales y se verifican las condiciones del teorema de Cochran cuyo enunciado presentamos en el Capítulo 1.
Por consiguiente, los cuadrados de los módulos de los vectores de la descomposición (5.22) seguirán distribuciones χ^2 independientes cuyos grados de libertad serán la dimensión del subespacio al que pertenezca cada vector. De esta forma,
a) Como (μ − μ) pertenece a un subespacio de dimensión 1, al tener todas sus coordenadas iguales:
N(¯y.. − μ)^2 σ^2
χ^21
b) Como (τ − τ ) pertenece a un subespacio de dimensión I − 1 , al tener I coorde- nadas distintas y una ecuación de restricción:
1 σ (τ − τ )′^ ×
σ (τ − τ ) =
σ^2
i
(τ (^) i − τ (^) i)^2 χ^2 I− 1
c) Como (β − β) pertenece a un subespacio de dimensión J − 1 , al tener J coor- denadas distintas y una ecuación de restricción:
1 σ
(β − β)′^ ×
σ
(β − β) =
σ^2
j
(βj − βj )^2 χ^2 J− 1
d) El vector e tiene IJ coordenadas, en principio distintas, pero sujetas, como hemos visto, a las ecuaciones de restricción
j
eij = 0 ;
i
eij = 0
es decir, la suma de los residuos por filas y por columnas es cero, lo que implica I + J − 1 ecuaciones de restricción e IJ − (I + J − 1) = (I − 1)(J − 1) residuos independientes. Por lo tanto,
14 Diseños en bloques aleatorizados
i
j
e^2 ij
σ^2 χ^2 (I−1)(J−1).
En resumen,
μ N(μ, σ^2 /N)
τ (^) i N
τ (^) i, (I − 1)σ^2 /N
βj N
βj , (J − 1)σ^2 /N
N σ^2 /σ^2 χ^2 (I−1)(J−1)
Como dijimos en el Capítulo 1, para comparar globalmente los efectos de los distintos niveles de un factor se emplea la técnica estadística denominada análisis de la varianza, que está basada en la descomposición de la variabilidad total de los datos en distintas componentes. En los diseños en bloques aleatorizados también se emplea esta técnica y para ello consideramos la siguiente identidad:
yij = y¯.. + (¯yi. − y¯..) + (¯y.j − y¯..) + (yij − y¯i. − y¯.j + ¯y..) , (5.26)
que expresa cada variable yij observada como la suma de cuatro términos:
16 Diseños en bloques aleatorizados
τ ′^ × e =
i=
τ (^) i
j=
eij = 0
β
′ × e =
j=
βj
i=
eij = 0
y
N = 1 + (I − 1) + (J − 1) + (I − 1)(J − 1)
La ecuación (5.26) también se puede expresar
yij − y¯.. = (¯yi. − y¯..) + (¯y.j − ¯y..) + (yij − y¯i. − y¯.j + ¯y..) , (5.29)
elevando los dos miembros al cuadrado y sumando para todas las observaciones tenemos
i=
j=
(yij − y¯..)^2 =
i=
j=
[(¯yi. − y¯..) + (¯y.j − ¯y..) + (yij − y¯i. − y¯.j + ¯y..)]^2 =
i=
(¯yi. − y¯..)^2 + I
j=
(¯y.j − y¯..)^2 +
i=
j=
(yij − y¯i. − y¯.j + ¯y..)^2 +
i=
j=
(¯yi. − y¯..)(¯y.j − ¯y..)+
i=
j=
(¯y.j − y¯..)(yij − y¯i. − ¯y.j + ¯y..)+
i=
j=
(¯yi. − y¯..)(yij − y¯i. − ¯y.j + ¯y..)
donde los dobles productos se anulan (ya que los términos son ortogonales, como acabamos de comprobar), por lo que dicha ecuación queda en la forma
5.2 Diseño en bloques completos aleatorizados 17
i=
j=
(yij − y¯..)^2 = J
i=
(¯yi. − y¯..)^2 + I
j=
(¯y.j − y¯..)^2 +
i=
j=
(yij − y¯i. − y¯.j + ¯y..)^2
(5.31) que representa la ecuación básica del análisis de la varianza, que simbólicamente podemos escribir
SCT = SCT r + SCBl + SCR ,
donde hemos desglosado la variabilidad total de los datos
i=
j=
(yij − y¯..)^2 ,
denominada suma total de cuadrados, en tres componentes:
i= (¯yi. − ¯y..)^2 , la suma de cuadrados de las diferencias entre las medias de los tratamientos y la media general, que expresa la variabilidad explicada por los tratamientos, denominada suma de cuadrados entre tratamientos.
j=1 (¯y.j^ −^ y¯..)
(^2) , la suma de cuadrados de las diferencias entre las medias de los bloques y la media general, que expresa la variabilidad explicada por los bloques, denominada suma de cuadrados entre bloques.
i=
j=1 (yij^ −^ y¯i.^ −^ y¯.j^ + ¯y..)
(^2) , la suma de cuadrados de los residuos, que expresa la variabilidad no explicada por el modelo, denominada suma de cuadrados del error.
A partir de la ecuación básica del ANOVA se pueden construir los cuadrados medios definidos como:
∗ Cuadrado medio total
i=
j=
(yij − ¯y..)^2
N − 1
5.2 Diseño en bloques completos aleatorizados 19
yi. = Jμ + Jτ (^) i +
j=
βj + ui. ; y¯i. = μ + τ (^) i + ui.
y.j = Iμ +
i=
τ (^) i + Iβj + u.j ; y¯.j = μ + βj + u.j
y.. = Nμ + J
i=
τ (^) i + I
j=
βj + u.. ; y¯.. = μ + u..
1 o) El cuadrado medio entre grupos se puede expresar
S^2 T r =
i=
(¯yi. − y¯..)^2
I − 1
i=
[τ (^) i + (ui. − u..)]^2
I − 1
i=
τ (^2) i
I − 1
i=
(ui. − u..)^2
I − 1
j=
τ (^) i(ui. − u..)
I − 1
y su esperanza matemática será la suma de las esperanzas matemáticas de cada sumando; es decir,
E S^2 T r = E
i=
τ (^2) i
I − 1
i=
(ui. − u..)^2
I − 1
i=
τ (^) i(ui. − u..)
I − 1
Ahora bien, puesto que:
a) El modelo es de efectos fijos E[τ (^) i] = τ (^) i, entonces
20 Diseños en bloques aleatorizados
i=
τ (^2) i
I − 1
i
τ (^2) i
i
τ (^2) i (5.38)
b) Como E [τ (^) i − E [τ (^) i]]^2 es la Var (τ (^) i), cuya expresión, determinada en la subsec- ción 5.2.2, es (I − 1)σ^2 /N, luego
i=
(ui. − u..)^2
I − 1
i=
E [ui. − u..]^2 =
i=
E [(¯yi. − y¯..) − τ (^) i]^2 =
i=
E [τ (^) i − E [τ (^) i]]^2 =
i=
Var (τ (^) i) =
i=
σ^2 N
(I − 1)Iσ^2 N = σ^2
(5.39) c) Como E (ui. − u..) = 0, entonces
i=
τ (^) i(ui. − u..)
I − 1
i=
τ (^) iE [ui. − u..] = 0. (5.40)
Por lo tanto, sustituyendo las expresiones (5.38), (5.39) y (5.40) en (5.37) tenemos que el valor esperado del cuadrado medio entre grupos es: