Información

¿Qué prueba estadística debo usar cuando hay múltiples predictores latentes y múltiples resultados latentes?

¿Qué prueba estadística debo usar cuando hay múltiples predictores latentes y múltiples resultados latentes?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

¿Qué método estadístico debo utilizar para predecir el compromiso de la organización (compuesto por 3 variables latentes) utilizando los cinco factores de la personalidad?

Es un diseño transversal con datos de encuestas. Los factores de personalidad son cinco factores independientes (derivados del análisis factorial) y cada factor se mide en una escala Likert, lo mismo ocurre con los tres componentes del compromiso y también se miden en una escala tipo Likert.

Los estudios que he leído hasta ahora utilizan correlaciones parciales y regresión jerárquica para vincular estas construcciones, pero de alguna manera creo que tiene que haber una mejor manera.

Nota: esta pregunta se hizo originalmente aquí en Stats.SE, pero el moderador sugirió publicarla en cogsci.se


Supongo que estás relacionando los cinco factores principales de la personalidad con el modelo de compromiso de tres factores de Meyer y Allen (normativo, continuo, afectivo).

Sin duda, podría adoptar el enfoque simple de crear puntuaciones compuestas observadas para cada variable e informar la matriz de correlación y un conjunto de regresiones múltiples.

Sin embargo, el lenguaje de su pregunta también sugiere que está interesado en modelar variables latentes en lugar de variables observadas. Esto puede sugerir que un enfoque de modelado de ecuaciones estructurales puede ser adecuado.

Beneficios del enfoque de modelado de ecuaciones estructurales

  • Puede modelar su modelo de medición (es decir, ¿las variables observadas se cargan adecuadamente en sus 8 factores latentes? ¿Existe un factor de compromiso general de orden superior que represente los tres factores de compromiso?)
  • Puede modelar relaciones entre factores latentes en lugar de variables observadas (es decir, puede ajustar la confiabilidad de la medición); esto a menudo alinea más los análisis con los intereses teóricos de la psicología.
  • Podría explorar enfoques de comparación de modelos más sofisticados. Un enfoque que realmente me gusta implica comparar modelos con varias restricciones en las correlaciones o coeficientes de regresión entre el conjunto de predictores (es decir, personalidad) y el conjunto de resultados (es decir, compromiso). Por ejemplo, un modelo podría restringir los 15 coeficientes de regresión entre las variables de personalidad y compromiso para que sean iguales; otro modelo podría decir que las relaciones están limitadas a ser iguales en las variables de compromiso pero diferentes en las variables de personalidad.

3 resultados

Se examinaron el criterio de información de Akaike, BIC y entropía para determinar el número ideal de clases en el modelo. AIC y la entropía sugirieron una solución de 10 clases, y BIC sugirió una solución de tres clases. Por lo tanto, se consideraron todas las opciones entre tres y diez clases. Se seleccionó una solución de cuatro clases sobre la base de que este modelo producía una clara distinción entre clases interpretables.

La Tabla 3 proporciona las probabilidades de respuesta al ítem por pertenencia a una clase latente. También proporcionamos el promedio de probabilidad de la población estimada para cada uno de los riesgos, que se puede interpretar como la proporción de niños dentro de cada clase que respaldan cada factor de riesgo.

Clase Habilitado para el desarrollo (70%) Grupo de riesgo parental (16%) Grupo de riesgo emocionalmente inmaduro (7%) Grupo de riesgo de lenguaje y desarrollo (7%) Promedio de la población
Proporción 0.70 0.16 0.07 0.07 1.00
Probabilidades de respuesta al ítem
Indicadores de vulnerabilidad del desarrollo infantil del Censo de desarrollo temprano de Australia
Dominio de la salud física y el bienestar 0.026 0.020 0.170 0.539 0.066
Dominio de competencia social 0.008 0.000 0.493 0.510 0.069
Dominio de madurez emocional 0.011 0.000 0.686 0.361 0.074
Dominio de habilidades cognitivas y del lenguaje (basadas en la escuela) 0.014 0.031 0.013 0.572 0.052
Habilidades de comunicación y dominio de conocimientos generales. 0.014 0.040 0.000 0.673 0.058
Indicadores familiares
No leer libros entre padres e hijos 0.035 0.193 0.099 0.174 0.075
Baja consistencia parental 0.081 0.530 0.238 0.201 0.170
Baja eficacia parental 0.059 0.493 0.272 0.152 0.148
Angustia psicológica de los padres 0.048 0.338 0.168 0.151 0.108
Condiciones de salud de los padres 0.046 0.123 0.095 0.151 0.069
Indicadores escolares y comunitarios
Entorno de alfabetización y aprendizaje escolar deficiente 0.153 0.165 0.225 0.275 0.167
Mala relación maestro-niño 0.110 0.211 0.545 0.305 0.165
Bajo capital social vecinal 0.187 0.352 0.192 0.274 0.220
Riesgos medios 0.79 2.50 3.20 4.34 1.44
norte 3,083 713 294 296 4,386

Las cuatro clases diferían en la prevalencia del 70 por ciento de los niños en la clase uno al 7 por ciento en las clases tres y cuatro. El número promedio y el tipo de riesgos experimentados por los niños en estos grupos difirieron considerablemente, y ningún grupo se definió exclusivamente por la presencia o ausencia de un solo factor de riesgo (Figura 1).

El primer grupo (es decir, el grupo de referencia) se tipificó como habilitado para el desarrollo y comprendía el 70 por ciento de los niños del estudio. En promedio, cada niño de este grupo estuvo expuesto a 0,8 riesgos. Este grupo se distinguió por ser más bajo que la proporción promedio de la población en todos los factores de riesgo. Los niños de este grupo tenían una probabilidad muy baja de ser vulnerables desde el punto de vista del desarrollo en cualquiera de los indicadores de vulnerabilidad del desarrollo infantil de la AEDC (salud física y bienestar, competencia social, madurez emocional, lenguaje y habilidades cognitivas (en la escuela)) (pag = .008–.026).

El segundo grupo se tipificó como el grupo de factores de riesgo de la crianza y comprendió el 16 por ciento de los niños del estudio. En promedio, cada niño de este grupo estuvo expuesto a 2,5 riesgos. Este grupo se distinguió por una mayor probabilidad de que no se le leyera al niño del estudio, baja consistencia parental, baja eficacia parental, angustia psicológica de los padres y bajo capital social del vecindario calificado por los padres. Los niños de este grupo eran muy similares a los habilitados para el desarrollo en su probabilidad de vulnerabilidad en los cinco indicadores de vulnerabilidad del desarrollo infantil de la AEDC.

El tercer grupo se tipificó como el grupo de riesgo emocionalmente inmaduro y comprendió el 7 por ciento de los niños del estudio. En promedio, cada niño de este grupo estuvo expuesto a 3,2 riesgos. Este grupo se distinguió por una mayor probabilidad de vulnerabilidad en el desarrollo en los dominios de competencia social y madurez emocional del niño AEDC, y una mala relación maestro-niño. El grupo de riesgo emocionalmente inmaduro fue comparable al grupo de desarrollo habilitado en términos de vulnerabilidad del desarrollo en el lenguaje y las habilidades cognitivas (basadas en la escuela) y las habilidades de comunicación y los dominios de conocimiento general.

El cuarto grupo se tipificó como el grupo de Riesgos del desarrollo y el lenguaje y comprendió el 7 por ciento de los niños del estudio. En relación con el grupo de desarrollo habilitado, este grupo se distinguió por un riesgo elevado en todos los indicadores de la AEDC, pero particularmente en el dominio del lenguaje y las habilidades cognitivas (basadas en la escuela) (pag = .57) y Habilidades de comunicación y dominio de conocimientos generales (pag = .67). Los niños de este grupo también tenían un riesgo elevado en todos los indicadores de la familia, la escuela y la comunidad, y tenían el mayor número de riesgos promedio por niño (4,3).

Las tablas 4-6 muestran los resultados de ajustar modelos de regresión logística para cada clase latente con las medidas de resultado.

Clase % de clase con baja comprensión lectora Razón de probabilidades pag-valor
Habilitado para el desarrollo (70%) 9.8 1 (ref.)
Grupo de riesgo parental (16%) 30.0 3.93 (2.66, 5.8) & lt.0001
Grupo de riesgo emocionalmente inmaduro (7%) 18.4 2.07 (1.08, 3.97) .04634
Grupo de riesgo de lenguaje y desarrollo (7%) 51.1 9.63 (5.86, 15.8) & lt.0001
Clase % de clase con dificultades emocionales y de comportamiento Razón de probabilidades pag-valor
Habilitado para el desarrollo (70%) 7.3 1 (ref.)
Grupo de riesgo parental (16%) 49.5 12.42 (8.85, 17.42) & lt.0001
Grupo de riesgo emocionalmente inmaduro (7%) 39.2 8.19 (5.11, 13.12) & lt.0001
Grupo de riesgo de lenguaje y desarrollo (7%) 28.5 5.06 (2.77, 9.24) & lt.0001
Clase % de clase con altas tasas de absentismo Razón de probabilidades pag-valor
Habilitado para el desarrollo (70%) 14.7 1 (ref.)
Grupo de riesgo parental (16%) 20.6 1.50 (0.98, 2.30) .12154
Grupo de riesgo emocionalmente inmaduro (7%) 19.3 1.38 (0.73, 2.62) .35148
Grupo de riesgo de lenguaje y desarrollo (7%) 21.3 1.57 (0.85, 2.89) .17790

En relación con el perfil de desarrollo habilitado, los niños de los grupos de paternidad, emocionalmente inmaduros y de lenguaje y riesgos del desarrollo tenían una mayor probabilidad de baja comprensión lectora en el tercer año (tabla 4). Las probabilidades de que un niño tenga baja comprensión de lectura en el tercer año fueron 3.9 veces mayores para el grupo de Riesgo de crianza, 2.1 veces mayor para el grupo Emocionalmente inmaduro y 9.6 veces mayor para el grupo de Riesgos de lenguaje y desarrollo.

En relación con el perfil de desarrollo habilitado, los niños de los grupos de padres, emocionalmente inmaduros y de lenguaje y riesgos del desarrollo tenían una mayor probabilidad de tener dificultades emocionales y de comportamiento a la edad de 8 años (tabla 5). Las probabilidades de que un niño tenga dificultades emocionales y de comportamiento a los 8 años fueron 12,4 veces mayores para el grupo de perfil de riesgo de crianza, 8,2 veces más altas para el grupo de inmaduros emocionales y 5,1 veces más altas para el grupo de riesgos de lenguaje y desarrollo.

Aunque hubo indicios de una tendencia creciente hacia tasas altas de ausentismo escolar en los grupos de padres, emocionalmente inmaduros y de lenguaje y riesgos del desarrollo, no hubo diferencias estadísticamente significativas entre los grupos en la probabilidad de tasas altas de ausentismo escolar a los 8 años (Tabla 6).


Fronteras en psicología

Las afiliaciones del editor y los revisores son las últimas proporcionadas en sus perfiles de investigación de Loop y pueden no reflejar su situación en el momento de la revisión.


  • Descargar Articulo
    • Descargar PDF
    • ReadCube
    • EPUB
    • XML (NLM)
    • Suplementario
      Material
    • EndNote
    • Administrador de referencias
    • Archivo de texto simple
    • BibTex


    COMPARTIR EN

    ¿Qué es el análisis de clases latentes?

    Uno de los desafíos más comunes, y uno de los más complicados, en el análisis de datos es decidir cómo incluir múltiples predictores en un modelo, especialmente cuando están relacionados entre sí.

    Aquí & # 8217s un ejemplo. Digamos que está interesado en estudiar la relación entre la propagación del trabajo y el tiempo personal como factor de predicción del agotamiento laboral.

    Tiene 5 variables categóricas de sí / no que indican si un síntoma particular de desbordamiento del trabajo está presente (ver más abajo).

    Si bien puede utilizar cada variable individual, no está realmente interesado si una en particular está relacionada con el resultado. Quizás no sea realmente cada síntoma lo que sea importante, sino la idea de que se está produciendo un desbordamiento.

    Una posibilidad es contar el número de ítems a los que cada encuestado dijo que sí. Esta variable medirá el grado en que se está produciendo el derrame. En muchos estudios, esto es justo lo que necesita.

    Pero no le dice algo importante, si hay ciertos combinaciones que generalmente coexisten, y ¿son estas combinaciones las que afectan el agotamiento?

    En otras palabras, ¿y si no es sólo el la licenciatura de desbordamiento que & # 8217 es importante, pero el escribe?

    Ingrese al Análisis de clases latentes (LCA).

    El LCA es un modelo de medición en el que los individuos pueden clasificarse en tipos mutuamente excluyentes y exhaustivos, o clases latentes, según su patrón de respuestas en un conjunto de variables indicadoras categóricas. (El Análisis Factorial es también un modelo de medición, pero con variables indicadoras continuas).

    Probabilidad de '"Respuesta para cada clase

    La verdadera membresía de clase es desconocida para cada individuo. Como categorías de una variable latente, estas clases no pueden medirse directamente más que a través de los patrones de respuestas en las variables indicadoras.

    Hay dos conjuntos de parámetros en un LCA. El primero es el conjunto de probabilidades de inclusión de que cualquier persona aleatoria estará en cualquier clase latente. Puede ver en el ejemplo anterior que hay 4 clases y que el 20% de los encuestados están en la Clase 1, el 61% en la Clase 2, etc.

    Los números azules en cada columna son el segundo tipo de parámetros, equivalentes a las cargas factoriales en el análisis factorial confirmatorio. Cada una es la probabilidad condicional de que alguien de una clase en particular responda & # 8216sí & # 8217 a un elemento determinado. Estos parámetros se utilizan para interpretar las clases.

    Por ejemplo, la clase más grande, la Clase 2, podría interpretarse como el grupo & # 8220Low Spillover & # 8221. Su probabilidad de responder & # 8216 sí & # 8217 a cualquiera de las 5 preguntas es relativamente baja. El único que es un poco alto es & # 8216Checks work email from home, & # 8217, pero aun así, este grupo lo hace con la probabilidad más baja de cualquiera de las clases.

    Asimismo, la clase 4, la más pequeña, tiene una probabilidad bastante alta de responder & # 8216 sí & # 8217 a todas las preguntas. Esta clase sería el grupo & # 8220High Spillover & # 8221.

    Hasta ahora, no es muy interesante, ¿verdad? Simplemente parece un nivel de grado.

    Pero las clases 1 y 3 son más interesantes.

    La clase 1 tiene probabilidades bastante altas de responder & # 8216 sí & # 8217 a tres de las preguntas y probabilidades muy bajas de responder & # 8216 sí & # 8217 a las otras dos. Si examina a lo que ellos & # 8217 están diciendo que sí, ellos & # 8217 se tratan de ser disponible a la empresa fuera del horario laboral. Por lo tanto, sus vidas personales a menudo se ven interrumpidas, pero no suelen trabajar muchas horas.

    Compare esto con la clase 3. La clase 3 es bastante diferente. Es muy probable que los miembros de la clase 3 revisen el correo electrónico del trabajo desde casa, pero también realizan trabajo extra con regularidad por las tardes y, en menor medida, los fines de semana. Sin embargo, no se espera que estén a la entera disposición del trabajo. (Quizás ellos son los que están en la oficina trabajando hasta tarde).

    Estas son dos formas cualitativamente diferentes de hacer que el trabajo se extienda a la vida hogareña y podrían tener diferentes impactos en el agotamiento. Así es como el Análisis de clases latentes puede ser tan útil.

    En este ejemplo, pudimos usar el Análisis de clases latentes para identificar una tipología latente que se usa como variable de predicción, pero también hay muchos otros usos dentro de las estadísticas.

    Así que asegúrese de mantener el LCA en su radar, nunca se sabe cuándo puede resultar útil.


    Clases latentes de conductas sexuales: prevalencia, predictores y consecuencias

    Los estudiosos de la sexualidad adolescente y adulta emergente han comenzado recientemente a estudiar cómo diversos patrones de comportamientos sexuales contribuyen al desarrollo y al bienestar. Un enfoque orientado a la persona para estudiar los comportamientos sexuales proporciona una comprensión matizada de los repertorios sexuales. Los objetivos de este artículo fueron documentar los patrones de conductas sexuales que van desde los besos hasta el sexo con penetración, y examinar cómo las clases latentes de conductas, el género y el tipo de pareja (románticas o no románticas) predicen las consecuencias intra e interpersonales de las conductas sexuales. El análisis de clase latente de una muestra aleatoria estratificada de estudiantes universitarios de EE. UU. Reveló cuatro clases de comportamientos sexuales: solo besar, besar y tocar, todos los comportamientos y solo oral y penetrante. En comparación con los individuos de la clase Todos los comportamientos, los individuos de la clase Solo besos tenían menos probabilidades de experimentar una consecuencia intrapersonal positiva o negativa de los comportamientos sexuales. Los hombres tenían menos probabilidades de informar una consecuencia intrapersonal negativa que las mujeres. El tipo de pareja predijo consecuencias interpersonales negativas para la clase Todos los comportamientos. Las implicaciones se discuten en términos de desarrollo sexual normativo, prevención y educación sexual y relacional.

    Esta es una vista previa del contenido de la suscripción, acceda a través de su institución.


    Introducción

    La investigación de los factores de riesgo asociados con el ajuste psicológico de los niños ha sido un objetivo omnipresente en las ciencias psicológicas y del desarrollo. En relación con este objetivo, una línea de investigación se ha centrado en cómo los niños expuestos a múltiples factores de riesgo concurrentes tienden a tener peores resultados de desarrollo que aquellos que tienen menos o ninguna exposición a los factores de riesgo. Rutter [1,2] propuso un método para medir riesgo acumulativo (RC) en el que se agregan múltiples factores de riesgo para crear un único índice compuesto de riesgo. Este método ha sido ampliamente utilizado por los investigadores y es un predictor sólido de los problemas de salud mental y el ajuste psicológico de los niños (para una revisión, consulte Evans, Li y Whipple, 2013 [3]).

    Los investigadores han articulado varios argumentos conceptuales y metodológicos para agregar múltiples indicadores de riesgo en una sola variable compuesta o CR. Conceptualmente, la agregación de múltiples indicadores de riesgo puede determinar con mayor precisión cómo la exposición de los niños al riesgo puede atravesar múltiples sistemas y dominios, incluidos los contextos de los padres, la familia, el hogar, la escuela y el vecindario [3, 4]. Para muchas poblaciones (por ejemplo, los niños que viven en contextos urbanos de bajos ingresos), la exposición al riesgo en estos dominios tiende a coexistir y rara vez existe de forma aislada [5]. Metodológicamente, este enfoque proporciona un modelo más simplificado que la estimación de cada factor de riesgo como un predictor independiente. Esto puede ser particularmente ventajoso cuando los investigadores están usando muestras pequeñas, examinando la exposición a una gran cantidad de factores de riesgo dentro de un modelo, o cuando algunos factores de riesgo coexisten y se correlacionan entre sí, lo que puede generar preocupaciones sobre colinealidad o efectos de supresión. [6]. Además, el uso de una puntuación agregada suele tener un mayor poder predictivo que cualquier factor de riesgo individual [3]. Sin embargo, cuando este no es el caso, se justificaría utilizar un único factor de riesgo en lugar de agregar múltiples índices de riesgo. Los investigadores también han informado de efectos de umbral, que no son evidentes cuando se examinan los factores de riesgo individuales [7]. Los efectos de umbral indican que el efecto de múltiples indicadores de riesgo se agrava cuando el número de riesgos a los que está expuesto un niño supera un umbral determinado, por lo que la exposición a la RC puede tener una asociación no lineal con el ajuste psicológico de los niños.

    Desde el inicio del enfoque de RC, ha habido numerosos avances metodológicos que se pueden aplicar fácilmente para medir la exposición de los niños a múltiples factores de riesgo. Sin embargo, las comparaciones entre diversos métodos han sido raras y la mayoría de los estudios se han basado típicamente en un método para medir la RC. Los objetivos de este estudio fueron proporcionar una comparación conceptual y metodológica de varios métodos alternativos que se pueden aplicar para medir la exposición al riesgo múltiple con el objetivo de ayudar a los investigadores a considerar los matices y distinciones de varios enfoques. Desde un punto de vista conceptual, se realizan varias comparaciones entre cada método que se evalúa. Más específicamente, consideramos, 1) los supuestos de cada enfoque con respecto a si los indicadores de riesgo individuales deben medirse a lo largo de un continuo o dicotomizarse para diferenciar aquellos con el riesgo más severo, y 2) las implicaciones de cada enfoque con respecto a la relación relativa. influencia (ponderación) de los indicadores de riesgo individuales en la formación de una variable compuesta. Desde un punto de vista metodológico, presentamos una estrategia para aplicar cada método y elaboramos los supuestos conceptuales que subyacen a cada método. Dado que uno de los objetivos principales de los estudios que incorporan un enfoque de riesgo múltiple es predecir un resultado de interés específico, evaluamos la utilidad predictiva de cada método sobre los problemas de externalización de los niños en una muestra diversa de bajos ingresos con alto riesgo debido a la sustancia materna. utilizar durante el embarazo. Debido a que existen numerosos riesgos concurrentes que están presentes en esta población, esta fue una muestra ideal para examinar los diversos métodos de evaluación de la exposición a múltiples riesgos de los niños.

    Cabe destacar que el objetivo de este estudio no fue recomendar un enfoque único o proponer un "estándar de oro" para medir la RC, sino destacar varios métodos que han sido utilizados por los investigadores. Al evaluar y comparar los supuestos conceptuales y metodológicos, y las fortalezas y limitaciones potenciales de estos métodos, este estudio tiene como objetivo ayudar a los investigadores a conocer mejor las diversas opciones disponibles para evaluar la RC y estar mejor equipados para tomar una decisión más informada sobre su elección de método. Dependiendo de cómo los investigadores elijan conceptualizar y medir la RC, y sus objetivos de investigación específicos (por ejemplo, diseños analíticos y de investigación), es probable que haya casos en los que cada uno de estos métodos se pueda aplicar de manera efectiva y apropiada. En consecuencia, proponemos un árbol de decisiones que puede facilitar este proceso (ver Fig. 1).

    Métodos de puntuación observados

    Índice de riesgo acumulado (RC).

    El índice de riesgo acumulado (RC) convencional generalmente se basa en un conjunto de variables dicotómicas o binarias, cada una de las cuales está codificada para reflejar la presencia o ausencia de un factor de riesgo particular (es decir, 1 = alto riesgo, 0 = riesgo bajo o nulo). Este índice se calcula sumando cada uno de los indicadores de riesgo de manera que las puntuaciones más altas reflejen una mayor exposición a múltiples factores de riesgo. Esta variable compuesta sumada (a la que se hace referencia aquí como índice CR) se puede incorporar luego en otros análisis (por ejemplo, modelos de regresión, modelado de ecuaciones estructurales) como una variable predictiva.

    A nivel de riesgo individual, el investigador debe tener en cuenta varios factores. Las decisiones deben tomarse a priori sobre cómo se debe dicotomizar cada variable. Para algunas variables (por ejemplo, datos categóricos), es posible que la variable ya esté medida a nivel binario. Por ejemplo, la educación materna baja puede medirse por la presencia o ausencia de un diploma de escuela secundaria, o la paternidad monoparental puede medirse por la presencia o ausencia de un segundo cuidador que reside en el hogar del niño. Sin embargo, en muchos casos, esto puede requerir la conversión de una variable de escala continua en una variable dicotómica. En estos casos, los investigadores deben tener un fundamento para determinar una puntuación de corte (p. Ej., Una división media, un cuartil superior, una puntuación de umbral) o un criterio mediante el cual dicotomizar una variable continua. En particular, la dicotomización de variables continuas conlleva ciertos inconvenientes que los investigadores deben tener en cuenta [8, 9]. Debido a que este enfoque utiliza indicadores de riesgo individuales dicotomizados, no tiene en cuenta los indicadores de riesgo individuales que pueden abarcar un continuo. Dicho de otra manera, este enfoque tiende a medir la exposición más alta o más severa a un factor de riesgo en lugar de diferenciar un factor de riesgo a lo largo de un continuo que diferencia la gravedad. Por ejemplo, si se utiliza una división del cuartil superior (es decir, el percentil 75 y superior se considera que están 'en riesgo'), se supone que aquellos que caen en el percentil 50 al 75 tienen 'ningún riesgo' similar a los que caen en el rango de percentiles 0 a 25. Dependiendo de cómo un investigador dicotomice los indicadores de riesgo individuales, este enfoque puede ser específico de la muestra. Por ejemplo, el uso de una división del cuartil superior puede constituir clasificaciones de riesgo muy diferentes en una muestra de alto o bajo riesgo.

    A nivel compuesto, este enfoque también asume que cuando hay riesgo, cada variable de riesgo individual tiene el mismo peso hacia el índice CR agregado. Es decir, este enfoque no pondera de manera diferencial los factores de riesgo individuales de modo que algunos indicadores puedan tener una influencia más fuerte en el compuesto que otros. Conceptualmente, el índice CR se basa en la premisa de que la exposición al riesgo se vuelve más perjudicial en función de la número de los diferentes riesgos que experimenta un niño, en lugar de los riesgos específicos formulario o naturaleza de riesgo. Por tanto, imponer pesos iguales parece coherente con esta premisa.

    Una de las posibles ventajas del índice CR es que es fácilmente interpretable. Para ilustrar, suponiendo que el coeficiente no estandarizado del índice CR es igual a .2, esto puede interpretarse fácilmente para sugerir que para un aumento de una unidad en el riesgo acumulado (que correspondería a la presencia de un riesgo adicional), hay un .2 aumento de la variable de resultado. En la medida en que exista un efecto umbral, otra ventaja potencial del índice CR es que puede detectar fácilmente dichos efectos (por ejemplo, determinar la cantidad de factores de riesgo necesarios para que un niño tenga un mayor riesgo de ciertos resultados de desarrollo).

    Índice de riesgo acumulativo (PCR) de puntuación de proporción.

    Como alternativa al índice CR, otra estrategia que se puede aplicar es la índice de riesgo acumulativo (PCR) de puntuación de proporción [10]. Para cada indicador de riesgo, se calcula una puntuación proporcional dividiendo cada puntuación individual por la puntuación máxima, lo que arroja una puntuación proporcional con un valor máximo de uno. A nivel compuesto, el índice de PCR consiste en calcular la media (o suma) de cada puntuación de proporción para estimar una variable compuesta. En comparación con el índice CR, puede haber condiciones en las que este enfoque sea más o menos ventajoso. Cuando los indicadores de riesgo individuales se derivan de variables de escala continua, puede ser más factible transformarlos en una puntuación de proporción que dicotomizarlos. En particular, cuando un indicador de riesgo individual es dicotómico por diseño, no requiere una transformación a una puntuación de proporción. Una de las distinciones de este enfoque es que mantiene el orden relativo de los individuos en una variable que se pierde en la dicotomización. Por lo tanto, a diferencia del índice de RC que tiende a diferenciar la presencia de alto riesgo, este enfoque asume que el riesgo ocurre en un continuo con diversos grados de gravedad. Debido a que una puntuación de proporción tiene un valor máximo posible de uno, este enfoque es similar al índice CR en que los altos niveles de riesgo en diferentes indicadores de riesgo tienen el mismo peso máximo. Teniendo en cuenta que los puntajes proporcionales se derivan del puntaje máximo dentro de una muestra en particular, uno de los posibles inconvenientes de este enfoque, quizás más que el índice CR, es que es específico de la muestra.

    En comparación con el índice CR, el índice PCR se ha utilizado con poca frecuencia. Una excepción es un estudio de Moran et al. (2016), que aplicó este enfoque para formar un índice de PCR que consiste en baja educación materna, estado de monoparental, inestabilidad residencial, densidad de hogares, eventos de vida negativos, divorcio de los padres y depresión materna. Sin embargo, estos investigadores no evaluaron explícitamente las ventajas potenciales de este enfoque en comparación con el índice CR.

    Índice de riesgo acumulado (ZCR) estandarizado (puntaje z).

    El índice de riesgo acumulativo (ZCR) estandarizado (es decir, puntaje z) es otro enfoque que comparte varias similitudes con el índice de PCR (tenga en cuenta que este enfoque se conoce como un puntuación resumida en Evans et al., 2013). Este enfoque implica transformar cada variable de riesgo individual en una puntuación estandarizada (es decir, puntuación z) y agregar las puntuaciones estandarizadas (es decir, calcular una puntuación media o suma). Es un enfoque factible cuando los indicadores de riesgo se basan en escalas continuas y mantiene el orden de clasificación relativo de los individuos. Por lo tanto, este enfoque asume que el riesgo ocurre en un continuo con diversos grados de gravedad o riesgo. Debido a que las puntuaciones z se derivan de la desviación estándar dentro de una muestra determinada, este enfoque también es muy específico de la muestra, similar a la PCR.

    A diferencia de los índices CR o PCR, este enfoque no presupone de manera inherente que todos los indicadores de riesgo se ponderen por igual. Es decir, mientras que los índices CR y PCR tienen un rango impuesto para cada indicador de riesgo individual (0 = sin riesgo, 1 = alto riesgo), este no es el caso de las puntuaciones z. Por lo tanto, puede haber casos en los que ciertas variables de riesgo (es decir, aquellas en las que hay un rango mayor en las puntuaciones estandarizadas) contribuyan más al índice compuesto. Las ponderaciones diferenciales pueden ser ventajosas en casos en los que un investigador supone que la exposición severa a un indicador de riesgo específico (o múltiples indicadores) puede ser particularmente perjudicial para un resultado dado y, por lo tanto, tiene una justificación para no asumir la misma ponderación de los indicadores de riesgo.

    Pocos investigadores han comparado explícitamente el ZCR con el índice CR u otros métodos. Por ejemplo, una revisión sistemática de Evans y colegas (2013) encontró solo un estudio que comparó explícitamente estos dos métodos. Este estudio informó que el ZCR fue un predictor más fuerte que el índice CR [11]. Sin embargo, este hallazgo puede ser específico de los indicadores de riesgo o resultados que se evaluaron. Por lo tanto, sigue siendo necesario realizar más investigaciones para comparar estos métodos.

    Métodos centrados en variables

    Desde el inicio del índice CR, la aplicación de modelos de variables latentes (por ejemplo, modelos de ecuaciones estructurales, modelos de mezclas) en la investigación psicológica se ha expandido considerablemente, lo que permite a los investigadores utilizar estos métodos para operacionalizar múltiples indicadores de riesgo utilizando latentes (desapercibido) construye. Como se ilustra en la Figura 1, cuando los investigadores deciden renunciar al uso de índices de CR de puntuación observados (es decir, CR, PCR y ZCR), tienen la opción de utilizar métodos de variables latentes. Discutimos varias variantes de modelos que se pueden aplicar para medir múltiples indicadores de riesgo, incluidos métodos centrados en variables (es decir, indicadores reflexivos y formativos) y métodos centrados en la persona (análisis de clases latentes y análisis de perfiles latentes). Estos métodos se pueden aplicar con indicadores dicotómicos, proporcionales y de puntaje z. En particular, debido a que los indicadores de proporción y puntuación z consisten en transformaciones que mantienen el mismo orden de clasificación de los individuos, producen matrices de covarianza (correlación) equivalentes. Por lo tanto, las diferencias entre estos dos enfoques son quizás más evidentes cuando se utilizan índices de RC de puntuación observada, y menos relevantes para los enfoques de variables latentes que se analizan en las siguientes secciones, que se basan en una matriz de covarianza.

    Método del indicador reflectante (RI).

    Los modelos de indicadores reflexivos (RI) implican especificar un modelo de medición utilizando múltiples indicadores de riesgo como indicadores de efecto de una construcción latente inobservable [12]. Esto se puede lograr especificando un factor latente de modo que cada variable de riesgo individual se trate como un indicador del constructo de riesgo múltiple latente. Una de las ventajas de este enfoque es que se puede aplicar cuando los indicadores de riesgo individuales son variables dicotómicas o continuas (es decir, proporción o puntuación z). La comparación de este método con otros enfoques plantea varias otras consideraciones. El método RI asume unidad conceptual y que los indicadores están inter-correlacionados, lo que implica que cada indicador refleja un constructo latente subyacente no observado [12]. Dependiendo de cómo se conceptualice la medida de riesgo múltiple y de qué dominio (s) de riesgo se pretenda medir, este supuesto puede cumplirse o no. Desde nuestro punto de vista, el método RI puede resultar problemático cuando los investigadores intentan medir una única variable compuesta que se basa en procesos de riesgo conceptualmente distintos, que no están necesariamente correlacionados entre sí. En estos casos, un indicador que no está correlacionado con otros indicadores puede tener un efecto disminuido en el constructo latente [13].

    El método RI puede concebirse como un modelo analítico factorial. Por extensión, este modelo también se puede utilizar para especificar múltiples variables latentes (factores) para evaluar múltiples dominios de riesgo. Para simplificar la comparación de enfoques en el estudio actual, consideramos la forma más simple de este modelo en la que se especifica una variable latente (dominio). Sin embargo, este enfoque puede ser particularmente ventajoso en escenarios en los que los investigadores buscan agregar los indicadores de riesgo individuales en múltiples dominios distintos [14].

    Método del indicador formativo (FI).

    Un segundo enfoque centrado en variables consiste en indicador formativo (FI) método. El método FI consiste en especificar una variable compuesta de riesgo múltiple en la que los indicadores son predictores del compuesto [15], en lugar de reflejarlo (como en el enfoque RI). El uso de indicadores formativos dentro de la investigación psicológica ha sido polémico [13, 16], sin embargo, puede haber ventajas en el uso de este enfoque para investigar múltiples procesos de riesgo. Además, aunque este enfoque se ha utilizado con poca frecuencia para evaluar múltiples factores de riesgo, puede servir como un método alternativo que merece una evaluación empírica adicional [15].

    To determine whether a multiple risk composite should be measured using the reflective or formative indicator approach, Bollen and Diamantopoulos (2017, p. 582) suggest that, “A researcher should imagine a change in the indicator and ask whether this change is likely to change the value of the latent variable. If so, this is theoretical evidence supporting causal or formative indicators.” Applying this standard, we contend that from both a conceptual and methodological perspective, there may be instances in which the formative indicator approach is well aligned with multiple risk assessment. For instance, within the CR perspective, it is conceivable that an increase in maternal education or substance use (i.e., risk indicators) would increase the child’s exposure to CR (i.e., the composite variable). However, CR is not conceived to cause (precede) maternal education or substance use (as is conceptualized with a reflective indicator).

    To further clarify the FI approach, we adopt the terminology proposed by Bollen and colleagues [13, 17] to differentiate causal-formative y composite-formative indicators. We posit that, in many instances, the measurement of a single composite risk variable is theoretically more consistent with the composite-formative indicator method. Unlike the causal FI approach, the composite FI approach does not assume conceptual unity, such that each indicator corresponds with the definition of the concept that the latent variable represents. Furthermore, in contrast to the RI method, the composite FI method does not assume that the individual risk indicators are correlated with one another. Consequently, the composite FI approach is particularly applicable in instances in which investigators seek to derive a single composite risk index to aggregate uncorrelated individual risk indicators.

    In contrast to other approaches which make assumptions about the equal weights of the individual risk indicators on the composite measure, one of the potential advantages of the RI and FI methods is that this assumption can be tested empirically comparing two nested measurement models (e.g., via a chi-square difference test). In one model, which assumes unequal weights, an unconstrained measurement model can be specified in which factor loadings or coefficients are estimated freely for each indicator. In a second model, which assumes equal weights, a constrained measurement model can be specified in which factors loadings (or coefficients) are estimated to be equal to one another. Given that these two models are nested, a chi-square difference test (or likelihood ratio test statistic) can then be used to compare these models and to determine whether imposing equality of weights across indicators results in a reduction in model fit.

    Person-centered methods

    CR can also be conceptualized and measured using person-centered methods [18]. Person-centered methods such as latent class analysis (LCA) and latent profile analysis (LPA) consist of identifying groups of individuals who exhibit a similar pattern of responses on a pre-specified set of variables. This methodology can be applied to dichotomous risk indicators (using LCA) and to continuous risk indicators (using LPA). That is, the primary distinction between LCA and LPA is the use of categorical or continuous indicators [19]. This methodology can be conceived as a data-driven approach such that the qualitative nature of the identified groups (i.e., latent classes) are not specified a priori, but rather depend on the extent to which the estimated model represents the observed data. Applying this approach to the investigation of multiple risk indicators, it is conceivable that there are subgroups of individuals who exhibit similar risk profiles (e.g., high risk across multiple indicators, low risk across multiple indicators, or a combination of high and low risk across indicators).

    There are several considerations in applying person-centered methods for investigating multiple risk. One potential advantage of this approach is that it may provide greater specification about the constellations of risk that are most problematic for adjustment, rather than the total number of risk factors (based on the CR index) or the severity of aggregated risk exposure (based on the PCR or ZCR). In this respect, person-centered methods rely on a markedly different conceptual assumption about how risk exposure impacts adjustment [18]. Stated differently, whereas the CR index assumes that the number of risk factors to which an individual is exposed influences adjustment outcomes, person-centered approaches may provide greater insights—depending on the qualitative distinctions of the latent classes that are identified—into how a specific set of risk factors are associated with adjustment. Because this is a data-driven approach which examines profiles of risk within a given sample, the nature of the latent classes that are identified are sample-specific. Moreover, this approach may require larger sample sizes to distinguish several distinct risk classes (or subgroups).

    Objetivos del estudio

    In order to assess each of the alternative methods described, this study consisted of five primary aims. Aim 1 was to examine the effects of the independent (non-aggregated) risk indicators on children’s externalizing problems. Aim 2 was to examine the simultaneous (additive) effects of the individual risk indicators. Taken together, these two aims were important preliminary steps considering that the primary rationale of forming a composite variable is that it presumably has a stronger association with the outcome variable than any individual risk indicator. Aim 3 was to compute three observed score CR risk indices based on the three sets of individual risk indicators (i.e., dichotomous, proportion- and z-scores). Aim 4 was to incorporate variable-centered analyses as an alternative to the observed score CR indices. Towards this end, the reflective and formative indicator approaches (i.e., RI and FI methods) were examined. Aim 5 was to incorporate person-centered methods, via the use of latent class and latent profile analyses. LCA was used to estimate the models using dichotomous indicators and LPA was used for the proportion- and z-score indicators.

    Before addressing these primary aims, numerous studies were reviewed to identify a set of empirically derived risk indicators. Although researchers have not consistently measured the same risk indicators across studies, there are several that have been identified across multiple investigations including: low maternal education, hunger, meal and money unpredictability, maternal psychopathology, maternal substance (e.g., alcohol, tobacco and cocaine use), harsh parenting and discipline, family stress, and family violence [20–29]. Notably, some of these studies have also incorporated measures of family income, race, and family structure however, because the majority of participants in the current sample were low-income, African American, and single-mothers, these indicators were not included because they exhibited low variability (see Method section for more details on the sample).

    For each of the primary aims, effect sizes (R 2 ) were used to compare the relative predictive power of each method. Since one of the primary aims of studies which incorporate a multiple risk variable is to predict a specific outcome of interest, we evaluate the predictive utility of each method on children’s externalizing problems in kindergarten. The rationale for this selected outcome and developmental period was based on several considerations. There is a substantial body of research which has been interested in examining how early childhood risk and adversity impacts children’s psychological adjustment, and in particular the development of externalizing problems (e.g., aggression, disruptive and conduct problems [3,4,30–34]. In turn, children with higher rates of externalizing problems lack the prerequisite (i.e., school readiness) skills to more effectively adapt to the demands of being in a structured kindergarten classroom environment, increasing their risks for social and academic problems during this important transitional period [31,32]. Consequently, an examination of the role of CR on children’s externalizing problems during this developmental period may serve as an empirical example that is of interest to researchers across multiple disciplines.


    Información del autor

    Afiliaciones

    School of Public Health, University of Alberta, Edmonton, AB, Canada

    School of Public Health and Health Management, Weifang Medical University, Weifang, Shandong Province, China

    School of Nursing, Trinity Western University & Centre for Health Evaluation and Outcomes Sciences, Providence Health Care, Langley, BC, Canada

    Department of Public Health Sciences, Queen’s University, Kingston, ON, Canada

    McGill University Health Centre, Montréal, QC, Canada

    Department of Community Health Sciences & O’Brien Institute for Public Health, University of Calgary, Calgary, AB, Canada

    Department of Mathematics and Statistics, University of Saskatchewan, Saskatoon, SK, Canada

    Division of Endocrinology, Department of Medicine, University of British Columbia, Vancouver, BC, Canada

    Department of Medicine, McMaster University, Hamilton, ON, Canada

    Department of Medicine, Faculty of Medicine, University of Toronto, Toronto, ON, Canada

    Department of Medicine, Queen’s University, Kingston, ON, Canada

    Faculty of Graduate Studies, University of Victoria, Victoria, BC, Canada

    Department of Community Health Sciences, University of Manitoba, S113-750 Bannatyne Ave, Winnipeg, MB, R3E 0W3, Canada


    Learning Individualized Treatment Rules for Multiple-Domain Latent Outcomes

    For many mental disorders, latent mental status from multiple-domain psychological or clinical symptoms may perform as a better characterization of the underlying disorder status than a simple summary score of the symptoms, and they may also serve as more reliable and representative features to differentiate treatment responses. Therefore, to address the complexity and heterogeneity of treatment responses for mental disorders, we provide a new paradigm for learning optimal individualized treatment rules (ITRs) by modeling patients’ latent mental status. We first learn the multi-domain latent states at baseline from the observed symptoms under a restricted Boltzmann machine (RBM) model, which encodes patients’ heterogeneous symptoms using an economical number of latent variables and yet remains flexible. We then optimize a value function defined by the latent states after treatment by exploiting a transformation of the observed symptoms based on the RBM without modeling the relationship between the latent mental states before and after treatment. The optimal treatment rules are derived using a weighted large margin classifier. We derive the convergence rate of the proposed estimator under the latent models. Simulation studies are conducted to test the performance of the proposed method. Finally, we apply the developed method to real world studies and we demonstrate the utility and advantage of our method in tailoring treatments for patients with major depression, and identify patient subgroups informative for treatment recommendations. Supplementary materials for this article are available online.


    Confusing Statistical Term #9: Multiple Regression Model and Multivariate Regression Model

    Much like General Linear Model and Generalized Linear Model in #7, there are many examples in statistics of terms with (ridiculously) similar names, but nuanced meanings.

    Today I talk about the difference between multivariate and multiple, as they relate to regression.

    Multiple Regression

    A regression analysis with one dependent variable and eight independent variables is NOT a multivariate regression model. It’s a múltiple regression model.

    And believe it or not, it’s considered a univariate model.

    This is uniquely important to remember if you’re an SPSS user. Choose Univariate GLM (General Linear Model) for this model, not multivariate.

    I know this sounds crazy and misleading because why would a model that contains nine variables (eight Xs and one Y) be considered a univariate model?

    It’s because of the fundamental idea in regression that Xs and Ys aren’t the same. We’re using the Xs to understand the mean and variance of Y. This is why the residuals in a linear regression are differences between predicted and actual values of Y. Not X.

    (And of course, there is an exception, called Type II or Major Axis linear regression, where X and Y are not distinct. But in most regression models, Y has a different role than X).

    It’s the number of Ys that tell you whether it’s a univariate or multivariate model. That said, other than SPSS, I haven’t seen anyone use the term univariate to refer to this model in practice. Instead, the assumed default is that indeed, regression models have one Y, so let’s focus on how many Xs the model has. This leads us to…

    Simple Regression: A regression model with one Y (dependent variable) and one X (independent variable).

    Multiple Regression: A regression model with one Y (dependent variable) and more than one X (independent variables).

    Multivariate Regression

    Multivariate analysis ALWAYS describes a situation with multiple dependent variables.

    So a multivariate regression model is one with multiple Y variables. It may have one or more than one X variables. It is equivalent to a MANOVA: Multivariate Analysis of Variance.

    Other examples of Multivariate Analysis include:

    • Principal Component Analysis
    • Análisis factorial
    • Canonical Correlation Analysis
    • Linear Discriminant Analysis
    • Análisis de conglomerados

    But wait. Multivariate analyses like cluster analysis and factor analysis tengo no dependent variable, per se. Why is it about dependent variables?

    Well, it’s not really about dependency. It’s about which variables’ mean and variance is being analyzed. In a multivariate regression, we have multiple dependent variables, whose joint mean is being predicted by the one or more Xs. It’s the variance and covariance in the set of Ys that we’re modeling (and estimating in the Variance-Covariance matrix).

    Note: this is actually a situation where the subtle differences in what we call that Y variable can help. Calling it the outcome or response variable, rather than dependent, is more applicable to something like factor analysis.

    So when to choose multivariate GLM? When you’re jointly modeling the variation in multiple response variables.

    Referencias

    In response to many requests in the comments, I suggest the following references. I give the caveat, though, that neither reference compares the two terms directly. They simply define each one. So rather than just list references, I’m going to explain them a little.

    1. Neter, Kutner, Nachtsheim, Wasserman’s Applied Linear Regression Models, 3rd ed. There are, incidentally, never editions with slight changes in authorship. But I’m citing the one on my shelf.

    Chapter 1, Linear Regression with One Independent Variable, incluye:

    “Regression model 1.1 … is “simple” in that there is only one predictor variable.”

    Chapter 6 is titled Multiple Regression – I, and section 6.1 is “Multiple Regression Models: Need for Several Predictor Variables.” Interestingly enough, there is no direct quotable definition of the term “multiple regression.” Even so, it’s pretty clear. Go read the chapter to see.

    There is no mention of the term “Multivariate Regression” in this book.

    2. Johnson & Wichern’s Applied Multivariate Statistical Analysis, 3rd ed.

    Chapter 7, Multivariate Linear Regression Models, section 7.1 Introduction. Here it says:

    “In this chapter we first discuss the multiple regression model for the prediction of a soltero respuesta. This model is then generalized to handle the prediction of several dependent variables.” (Emphasis theirs).

    They finally get to Multivariate Multiple Regression in Section 7.7. Here they “consider the problem of modeling the relationship between m responses, Y1, Y2, …,Ymetro, and a single set of predictor variables.”

    Misuses of the Terms

    I’d be shocked, however, if there aren’t some books or articles out there where the terms are not used or defined the way I’ve described them here, according to these references. It’s very easy to confuse these terms, even for those of us who should know better.

    And honestly, it’s not that hard to just describe the model instead of naming it. “Regression model with four predictors and one outcome” doesn’t take a lot more words and is much less confusing.

    If you’re ever confused about the type of model someone is describing to you, just ask.


    Getting started with Multivariate Multiple Regression

    Multivariate Multiple Regression is the method of modeling multiple responses, or dependent variables, with a single set of predictor variables. For example, we might want to model both math and reading SAT scores as a function of gender, race, parent income, and so forth. This allows us to evaluate the relationship of, say, gender with each score. You may be thinking, “why not just run separate regressions for each dependent variable?” That’s actually a good idea! And in fact that’s pretty much what multivariate multiple regression does. It regresses each dependent variable separately on the predictors. However, because we have multiple responses, we have to modify our hypothesis tests for regression parameters and our confidence intervals for predictions.

    To get started, let’s read in some data from the book Applied Multivariate Statistical Analysis (6th ed.) by Richard Johnson and Dean Wichern. This data come from exercise 7.25 and involve 17 overdoses of the drug amitriptyline (Rudorfer, 1982). There are two responses we want to model: TOT and AMI. TOT is total TCAD plasma level and AMI is the amount of amitriptyline present in the TCAD plasma level. The predictors are as follows:

    GEN, gender (male = 0, female = 1)
    AMT, amount of drug taken at time of overdose
    PR, PR wave measurement
    DIAP, diastolic blood pressure
    QRS, QRS wave measurement

    We’ll use the R statistical computing environment to demonstrate multivariate multiple regression. The following code reads the data into R and names the columns.

    Before going further you may wish to explore the data using the summary and pairs functions.

    Performing multivariate multiple regression in R requires wrapping the multiple responses in the cbind() function. cbind() takes two vectors, or columns, and “binds” them together into two columns of data. We insert that on the left side of the formula operator:

    . On the other side we add our predictors. The + signs do not mean addition per se but rather inclusion. Taken together the formula “cbind(TOT, AMI)

    GEN + AMT + PR + DIAP + QRS” translates to “model TOT and AMI as a function of GEN, AMT, PR, DIAP and QRS.” To fit this model we use the workhorse lm() function and save it to an object we named “mlm1”. Finally we view the results with summary().

    Notice the summary shows the results of two regressions: one for TOT and one for AMI. These are exactly the same results we would get if modeled each separately. You can verify this for yourself by running the following code and comparing the summaries to what we got above. They’re identical.

    The same diagnostics we check for models with one predictor should be checked for these as well. For a review of some basic but essential diagnostics see our post Understanding Diagnostic Plots for Linear Regression Analysis.

    We can use R’s extractor functions with our mlm1 object, except we’ll get double the output. For example, instead of one set of residuals, we get two:

    Instead of one set of fitted values, we get two:

    Instead of one set of coefficients, we get two:

    Instead of one residual standard error, we get two:

    Again these are all identical to what we get by running separate models for each response. The similarity ends, however, with the variance-covariance matrix of the model coefficients. We don’t reproduce the output here because of the size, but we encourage you to view it for yourself:

    The main takeaway is that the coefficients from both models covary. That covariance needs to be taken into account when determining if a predictor is jointly contributing to both models. For example, the effects of PR and DIAP seem borderline. They appear significant for TOT but less so for AMI. But it’s not enough to eyeball the results from the two separate regressions! We need to formally test for their inclusion. And that test involves the covariances between the coefficients in both models.

    Determining whether or not to include predictors in a multivariate multiple regression requires the use of multivariate test statistics. These are often taught in the context of MANOVA, or multivariate analysis of variance. Again the term “multivariate” here refers to multiple responses or dependent variables. This means we use modified hypothesis tests to determine whether a predictor contributes to a model.

    The easiest way to do this is to use the Anova() or Manova() functions in the car package (Fox and Weisberg, 2011), like so:

    The results are titled “Type II MANOVA Tests”. The Anova() function automatically detects that mlm1 is a multivariate multiple regression object. “Type II” refers to the type of sum-of-squares. This basically says that predictors are tested assuming all other predictors are already in the model. This is usually what we want. Notice that PR and DIAP appear to be jointly insignificant for the two models despite what we were led to believe by examining each model separately.

    Based on these results we may want to see if a model with just GEN and AMT fits as well as a model with all five predictors. One way we can do this is to fit a smaller model and then compare the smaller model to the larger model using the anova() function, (notice the little “a” this is different from the Anova() function in the car package). For example, below we create a new model using the update() function that only includes GEN and AMT. The expression “.

    . – PR – DIAP – QRS” says “keep the same responses and predictors except PR, DIAP and QRS.”

    The large p-value provides good evidence that the model with two predictors fits as well as the model with five predictors. Notice the test statistic is “Pillai”, which is one of the four common multivariate test statistics.

    The car package provides another way to conduct the same test using the linearHypothesis() function. The beauty of this function is that it allows us to run the test without fitting a separate model. It also returns all four multivariate test statistics. The first argument to the function is our model. The second argument is our null hypothesis. The linearHypothesis() function conveniently allows us to enter this hypothesis as character phrases. The null entered below is that the coefficients for PR, DIAP and QRS are all 0.

    The Pillai result is the same as we got using the anova() function above. The Wilks, Hotelling-Lawley, and Roy results are different versions of the same test. The consensus is that the coefficients for PR, DIAP and QRS do not seem to be statistically different from 0. There is some discrepancy in the test results. The Roy test in particular is significant, but this is likely due to the small sample size (n = 17).

    Also included in the output are two sum of squares and products matrices, one for the hypothesis and the other for the error. These matrices are used to calculate the four test statistics. These matrices are stored in the lh.out object as SSPH (hypothesis) and SSPE (error). We can use these to manually calculate the test statistics. For example, let SSPH = H and SSPE = E. The formula for the Wilks test statistic is

    In R we can calculate that as follows:

    Likewise the formula for Pillai is

    tr means trace. That’s the sum of the diagonal elements of a matrix. In R we can calculate as follows:


    Ver el vídeo: Mini Retirements? Qu0026A (Junio 2022).