Información

¿Hay conjuntos de tareas abiertos disponibles para evaluar la carga de trabajo utilizando medidas de tareas secundarias?

¿Hay conjuntos de tareas abiertos disponibles para evaluar la carga de trabajo utilizando medidas de tareas secundarias?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

El desempeño en tareas secundarias junto a una tarea primaria se utiliza a veces para evaluar la carga de trabajo mental (Ogden, Levine y Eisner, 1979). Por ejemplo, la prueba de Stroop como tarea secundaria ha sido evaluada por Gwizdka (2010).

Sin embargo, se requiere un gran esfuerzo para configurar estas tareas, por lo que me preguntaba si hay conjuntos de tareas abiertos y listos para usar que sean adecuados para este propósito.

Algunas características deseables que estoy buscando:

  • Una tarea no debería ser mucho más difícil que otra.
  • Realizar una tarea no debería llevar mucho más tiempo que otra.
  • En general, una tarea no debería llevar demasiado tiempo, por lo que la cantidad de tareas realizadas también se puede utilizar como una medida de la carga de trabajo mental.

Ogden, G. D., Levine, J. M. y Eisner, E. J. (1979). Medición de la carga de trabajo por tareas secundarias. Factores humanos: The Journal of the Human Factors and Ergonomics Society, 21 (5), 529-548.
Gwizdka, J. (2010, agosto). Uso de la tarea stroop para evaluar la carga cognitiva. En Actas de la 28ª Conferencia Europea Anual sobre Ergonomía Cognitiva (págs. 219-222). ACM.


Ya que mencionaste el Stroop específicamente, varias versiones de la tarea Stroop están disponibles para Inquisit aquí.

El laboratorio de Randall Engle también mantiene un conjunto de tareas de memoria de trabajo validadas, que están disponibles a pedido de los investigadores. Incluyen versiones completas y abreviadas de rango de operación, simetría, lectura y rotación para E-Prime 2.0.

Suponiendo que leí la pregunta correctamente, cualquiera de estos debería satisfacer los requisitos.


EXPERIMENTO 1

En nuestro paradigma, unimos el procedimiento de detección de cambios, utilizado para obtener el CDA, con un procedimiento de cambio de tareas con indicaciones. En cada ensayo, a los participantes se les presentaron dos conjuntos lateralizados de estímulos de dos o cuatro colores con una flecha central indicando qué lados tenían que ser atendidos en un ensayo determinado. Las ubicaciones de los estímulos de color de la señal indicaron claves de respuesta espacialmente compatibles. Por lo tanto, la disposición de los estímulos de color sirvió como señales de las reglas S-R que debían aplicarse a un estímulo de color individual (es decir, el estímulo de la sonda) presentado después de un intervalo de retraso (Figura 1).

Línea de tiempo de prueba y pantallas de estímulo de muestra para el Experimento 1. Los participantes asistieron al lado con señal (indicado a través de un triángulo verde oscuro) para codificar posiciones de color como reglas S-R para ejecutar una respuesta a la pantalla de sonda final. Por ejemplo, en la prueba presentada, la respuesta correcta a la pantalla de la sonda final fue la tecla inferior, correspondiente a la ubicación inferior del parche de color rosa en la pantalla de codificación del lado derecho con indicaciones. La señal de EEG relevante se midió durante los intervalos de codificación y retención.

La línea de tiempo del ensayo y las pantallas de estímulo de muestra para el Experimento 1. Los participantes asistieron al lado con señales (indicado mediante un triángulo verde oscuro) para codificar las posiciones de color como reglas S-R para ejecutar una respuesta a la pantalla de la sonda final. Por ejemplo, en la prueba presentada, la respuesta correcta a la pantalla de la sonda final fue la tecla inferior, correspondiente a la ubicación inferior del parche de color rosa en la pantalla de codificación del lado derecho con indicaciones. La señal de EEG relevante se midió durante los intervalos de codificación y retención.

La mitad de los participantes (norte = 36) trabajó con nuevas constelaciones de reglas S-R en el 50% de las pruebas (pruebas de cambio) y repeticiones de la constelación de pruebas anteriores en las pruebas restantes (pruebas repetidas). Nos referimos a esto como la condición sin restricciones. Dado que requiere una actualización frecuente de WM con nuevos conjuntos de reglas, esperábamos que WM se requiera de una manera dependiente de la carga (al menos en las pruebas de cambio). Por lo tanto, predecimos aquí un efecto de tamaño de conjunto de CDA con una amplitud mayor para conjuntos de cuatro que para conjuntos de dos reglas S-R. Con base en resultados anteriores, también esperamos que los efectos del tamaño del conjunto de CDA sean evidentes en individuos con alta capacidad de WM (medida en una tarea estándar de detección de cambios), pero que sean pequeños o inexistentes en individuos con bajo WM (Vogel & amp Machizawa, 2004 ).

La otra mitad de los participantes (norte = 36) trabajó con solo dos conjuntos de reglas S-R por tamaño de conjunto en todo el experimento (es decir, cuatro tareas en total). Esta condición restringida se asemeja al paradigma estándar de cambio de tareas en el que normalmente solo se usa un pequeño conjunto de tareas a lo largo de una sesión experimental. En este caso, los participantes deben poder representar conjuntos de tareas en un formato procedimental (según el modelo de dos sistemas) o de forma "comprimida" (según el modelo de un sistema). Si las reglas S-R practicadas están de hecho representadas en un formato procedimental, entonces no deberíamos ver un CDA sostenido, reflejando el hecho de que no se utiliza WM estándar (ver Figura 2). Sin embargo, si los conjuntos de tareas practicadas se pueden representar en WM estándar en términos de claves para las representaciones LTM, esperamos ver un CDA, pero no un efecto de tamaño del conjunto (Figura 2). Por último, estas predicciones sobre el contraste entre las condiciones de tarea no restringidas y restringidas pueden evaluarse adecuadamente solo en participantes que realmente exhiben efectos de tamaño de conjunto para la condición no restringida. Por lo tanto, para nuestra hipótesis principal, nos enfocamos en participantes con alta capacidad de WM, quienes en trabajos anteriores han exhibido efectos de tamaño de conjunto con contenido novedoso de WM. No esperamos ningún efecto de tamaño de conjunto de CDA en la condición sin restricciones para individuos con baja WM (por ejemplo, Vogel & amp Machizawa, 2004). Sin embargo, este grupo nos permitirá examinar de qué manera la capacidad de baja MT restringe las representaciones de conjuntos de tareas incluso después de experiencia adicional (es decir, a través de repeticiones inmediatas de tareas en la condición restringida o mediante repeticiones frecuentes en la condición no restringida).

CDA pronosticado para las condiciones de tarea restringidas y no restringidas. Para la condición sin restricciones, tanto el modelo de dos sistemas como el modelo unitario hacen predicciones idénticas. Para la condición restringida, el modelo de dos sistemas predice la eliminación del CDA, lo que indica que la WM estándar ya no está involucrada. El modelo unitario WM + LTM predice que se elimina el efecto de tamaño del conjunto de CDA, pero que permanece un CDA sostenido, lo que indica que WM sigue siendo fundamental para la preparación basada en claves y la selección de información relevante para la tarea.

CDA pronosticado para las condiciones de tarea restringidas y no restringidas. Para la condición sin restricciones, tanto el modelo de dos sistemas como el modelo unitario hacen predicciones idénticas. Para la condición restringida, el modelo de dos sistemas predice la eliminación del CDA, lo que indica que la WM estándar ya no está involucrada. El modelo unitario WM + LTM predice que se elimina el efecto de tamaño del conjunto de CDA, pero que permanece un CDA sostenido, lo que indica que WM sigue siendo fundamental para la preparación basada en claves y la selección de información relevante para la tarea.

Finalmente, nuestros estudios piloto habían demostrado que el paradigma híbrido de conmutación de tareas / WM produce costos de conmutación de RT locales relativamente pequeños. Esto concuerda con los hallazgos que indican que, con intervalos prolongados entre ensayos consecutivos, los participantes a menudo no mantienen conjuntos de tareas en los ensayos, reduciendo o eliminando así los ensayos entre cambios y sin cambios (Bryck & amp Mayr, 2008). Sin embargo, debido a que esta es una variable importante en el contexto de la investigación de cambio de tareas, incluimos un contraste experimental entre el cambio y las transiciones repetidas de una manera exploratoria.

Métodos

Participantes

Ochenta y un individuos neurológicamente normales participaron a cambio de crédito del curso o pago monetario y después de dar su consentimiento informado. El protocolo de estudio fue aprobado por el Comité de Sujetos Humanos de la Universidad de Oregon. Los participantes fueron asignados aleatoriamente a la condición de tarea no restringida o la condición de tarea restringida. Siete participantes fueron excluidos de la muestra final debido a las amplias tasas de rechazo de ensayos de & gt30%, lo que resultó en muy pocos ensayos para un análisis ERP adecuado. La muestra final comprendió datos de 36 participantes para cada una de las dos condiciones entre sujetos.

Tareas, estímulos y procedimiento

Para cada ensayo, las reglas S-R se codificaron por parches de color (es decir, dos o cuatro parches, radio = 2 °) que aparecen dentro de cuatro marcadores de posición cuadrados (ancho y alto = 6.5 °) que se organizaron en términos de una cruz. Los parches de color se seleccionaron aleatoriamente entre 10 posibles colores isoluminantes (verde [0,255,0], rojo [255,0,0], magenta [255,0,255], cian [0,255,255], amarillo [255,255,0], gris [128,128,128] , marrón [153,76,0], rosa claro [255,102,178], azul medianoche [0,76,153], naranja [255,153,51]). Cada marcador de posición se asignó a una tecla de respuesta espacialmente compatible (tecla superior, derecha, inferior e izquierda). Dentro de un bloque determinado, los participantes fueron expuestos a tamaños de conjuntos de dos o cuatro parches de color (es decir, reglas S-R). Los bloques de tamaño 2 y 4 se alternaron a lo largo de la sesión, y el tamaño del primer bloque se equilibró entre los participantes. En ensayos repetidos, se utilizó la misma constelación de parches de color que en el ensayo anterior. En la prueba de cambio, la mitad de los parches de color eran los mismos que en la prueba anterior, pero en una ubicación diferente, y la otra mitad estaba en colores que no se usaron en la prueba anterior. Tanto para las condiciones no restringidas como restringidas, la probabilidad de una prueba de cambio fue pag = .5.

En la condición sin restricciones, se generaron nuevas constelaciones de parches de color de conjuntos de tareas para cada prueba de cambio con las restricciones mencionadas anteriormente. Para la condición restringida, se seleccionaron al azar dos constelaciones de conjuntos de tareas para cada tamaño de conjunto de modo que, en las pruebas de cambio, los conjuntos de tareas cambiaran de un lado a otro entre estas dos constelaciones. La sesión experimental incluyó 22 bloques de 40 ensayos, cada uno de los dos primeros bloques fueron bloques de práctica (un bloque para cada tamaño de conjunto). En la mitad de los bloques mezclados aleatoriamente, se presentaron conjuntos S-R con tamaño de conjunto 2 en la otra mitad, se utilizaron conjuntos S-R con tamaño de conjunto de 4.

A lo largo de cada ensayo, se pidió a los participantes que fijaran el diamante central (ancho = 1 °) y la distancia de visualización se mantuvo aproximadamente a 77 cm. Los marcadores de posición y los parches de color se mostraron de forma bilateral. El centro de la matriz de estímulos de cada lado estaba a 7,2 ° a la izquierda o la derecha del centro de la pantalla. Durante un intervalo entre ensayos inicial con nerviosismo (750-1250 mseg), se presentaron marcadores de posición bilaterales y el diamante central, después de lo cual el lado izquierdo o derecho del diamante se volvió verde durante 750 mseg para indicar a los participantes que presten atención a la izquierda. lado o el lado derecho de la pantalla. Luego, aparecieron dos o cuatro parches de color durante 250 ms tanto en el lado atendido como en el irrelevante. El CDA se midió desde el inicio de las manchas de color hasta el final de los siguientes 950 milisegundos del período de retención del blanco. Para la pantalla de la sonda, uno de los colores que formaba parte del conjunto de tareas codificado apareció en el centro. Se indicó a los participantes que presionasen en el teclado numérico (8 [arriba], 6 [derecha], 2 [abajo] y 4 [izquierda]) la tecla asociada con la ubicación de ese color de la manera más rápida y precisa posible. Se pidió a los participantes que cambiaran entre la mano izquierda y la derecha en el medio de la sesión, con el comienzo equilibrado entre los participantes. Todos los estímulos fueron generados usando Psychophysics Toolbox (Brainard, 1997 Pelli, 1997) para MATLAB (The MathWorks, Natick, MA) en un 17 pulg. monitor de tubo de rayos catódicos plano.

Procedimientos y análisis de EEG

La actividad de EEG se registró a partir de 22 electrodos de estaño mantenidos en su lugar mediante una gorra elástica (Electro-Cap International, Eaton, OH) usando el sistema International 10/20. Los 10/20 sitios F3, Fz, F4, T3, C3, CZ, C4, T4, P3, PZ, P4, T5, T6, O1 y O2 se utilizaron junto con cinco sitios no estándar: OL a medio camino entre T5 y O1 O a medio camino entre T6 y O2 PO3 a medio camino entre P3 y OL PO4 a medio camino entre P4 y OR y POz a medio camino entre PO3 y PO4. La mastoides izquierda se utilizó como referencia para todos los sitios de registro. Los datos se volvieron a referenciar fuera de línea al promedio de todos los electrodos del cuero cabelludo. Los electrodos colocados ∼1 cm a la izquierda y la derecha del canto externo de cada ojo registraron el EOG horizontal para medir las sacádicas horizontales. Para detectar parpadeos, se registró el EOG vertical de un electrodo colocado debajo del ojo izquierdo y referencia a la mastoides izquierda. El EEG y el EOG se amplificaron con un amplificador de instrumentación SA con un paso de banda de 0,01 a 30 [80] Hz y se digitalizaron a 250 Hz en LabView 6.1 ejecutándose en una PC.

La señal de EEG se segmentó en épocas de 1400 mseg, cada una comenzando 200 mseg antes del inicio de las señales de la tarea. El intervalo de 200 ms que precede al inicio del conjunto de tareas sirvió como línea de base. Usamos procedimientos de análisis estándar, incluida la exclusión de ensayos que contienen parpadeos, grandes movimientos oculares (& gt1 °) y bloqueo de señales (McCollough, Machizawa y amp Vogel, 2007 Vogel, Luck y amp Shapiro, 1998). Utilizamos las cajas de herramientas EEGLAB (Delorme & amp Makeig, 2004) y ERPLAB (Lopez-Calderon & amp Luck, 2014) y scripts personalizados para el procesamiento de EEG y ERP. El CDA se midió calculando la diferencia entre la actividad contralateral e ipsilateral en referencia al lado del campo visual donde se indicó a los participantes que asistieran. Las ondas de diferencia se midieron y promediaron entre los sitios de electrodos parietal (P3 / P4), parietal posterior (PO3 / PO4) y occipital lateral (OL / OR). Las amplitudes de CDA se compararon a través de los principales factores de diseño utilizando un ANOVA para el intervalo de 450 y 1200 ms después del inicio de la visualización de la indicación de la tarea. Este intervalo fue predeterminado en base a estudios previos que mostraban que el CDA típicamente comienza a aparecer entre 300 y 450 mseg después del inicio de los ítems (Luria et al., 2016 Ikkai, McCollough, & amp Vogel, 2010).

Evaluación de WM

La capacidad visual de WM de los individuos se midió utilizando un paradigma estándar de detección de cambios (Vogel & amp Machizawa, 2004 Luck & amp Vogel, 1997). En esta tarea, se presentó a los participantes, durante un intervalo de codificación de 100 milisegundos, matrices de cuatro u ocho cuadrados de colores (0,65 ° × 0,65 °) en ubicaciones aleatorias. Después de un período de retraso de 900 ms, se presentó una única sonda en la ubicación de uno de los objetos del conjunto de codificación. Los participantes debían indicar si el color de la sonda coincidía o no con el color del objeto original. El número de pruebas fue 320. La capacidad se calculó como K = S × (HF), dónde K es la capacidad de memoria, S es el tamaño de la matriz, H es la tasa de aciertos observada, y F es la tasa de falsas alarmas (Cowan, 2001).

Resultados

Resultados de comportamiento

Los RT de los ensayos de error, los ensayos de posterrorismo y los ensayos en los que los RT fueron inferiores a 100 mseg o superiores a 5000 mseg se excluyeron de los análisis, que excluyeron el 0,4% de los datos. La Tabla 1 muestra los RT y la precisión en función del contexto del conjunto de tareas (no restringido frente a restringido) como una variable entre sujetos, tamaño del conjunto (2 frente a 4) y cambio (cambio frente a repetición). Los RT fueron más grandes y la precisión fue menor para el tamaño de juego 4 en comparación con el tamaño de juego 2, F(1, 70) = 40.26, pag & lt .001, η 2 = .36, y F(1, 70) = 148.34, pag & lt .001, η 2 = .69, y para cambios versus ensayos repetidos, F(1, 70) = 511.81, pag & lt .001, η 2 = .88, y F(1, 70) = 261.21, pag & lt .001, η 2 = .79. Además, en la condición de conjunto de tareas restringido, los participantes fueron en general más precisos, F(1, 70) = 10.84, pag & lt .001, η 2 = .13, pero no significativamente más rápido que en la condición sin restricciones, F(1, 70) = 0.52, pag = .47. Además, los beneficios de rendimiento en la condición restringida en comparación con la condición no restringida fueron mayores para el tamaño de juego 4 que para el tamaño de juego 2 en cuanto a precisión, F(1, 70) = 10.84, pag & lt .001, η 2 = .13, pero no hubo un efecto significativo para los RT, F(1, 70) = 0.91, pag = .34.

Significar (Dakota del Sur) RT y tasas de precisión en función de la tarea no restringida frente a las condiciones de la tarea restringida, el tamaño del conjunto y el cambio frente a las pruebas repetidas

Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Tamaño del conjunto 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
583 milisegundos (106) 562 milisegundos (96) 750 milisegundos (123) 740 milisegundos (112) 611 milisegundos (116) 588 milisegundos (107) 758 milisegundos (133) 739 milisegundos (126)
6.58% (2.67) 96.58% (3.10) 88.26% (7.47) 91.60% (7.16) 96.20% (2.78) 97.81% (2.16) 86.40% (5.46) 80.97% (5.61)
Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Establecer tamaño 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
583 milisegundos (106) 562 milisegundos (96) 750 milisegundos (123) 740 milisegundos (112) 611 milisegundos (116) 588 milisegundos (107) 758 milisegundos (133) 739 milisegundos (126)
6.58% (2.67) 96.58% (3.10) 88.26% (7.47) 91.60% (7.16) 96.20% (2.78) 97.81% (2.16) 86.40% (5.46) 80.97% (5.61)

Para examinar cómo la capacidad de WM está relacionada con el desempeño de la selección de tareas, también correlacionamos los RT generales y la precisión para las condiciones de tarea restringidas y no restringidas. La correlación entre la capacidad de WM y los RT fue r(35) = −.56, pag & lt .001, para la condición sin restricciones y se redujo a r(35) = −.002, pag = .99, para la condición restringida. Esta diferencia entre correlaciones fue muy significativa, z = −2.57, pag & lt .01. Para la precisión, la correlación para la condición no restringida también fue más alta que para la condición restringida, no restringida: r(35) = .63, pag & lt .01, restringido: r(35) = .42, pag & lt .01, aunque aquí la diferencia no fue significativa, z = 1.01, pag = .14. Estos resultados sugieren que la capacidad de WM de los individuos limita el rendimiento cuando es necesario utilizar conjuntos de tareas novedosos, pero es menos restrictivo cuando los mismos conjuntos de tareas se utilizan repetidamente, como es el caso en situaciones estándar de cambio de tareas. Finalmente, tanto para las condiciones no restringidas como restringidas, los costos de cambio de prueba a prueba fueron generalmente pequeños y no mostraron correlaciones confiables con la capacidad de WM, un aspecto al que volveremos en la Discusión.

CDA para personas con alta MT

Nuestra pregunta principal se refiere a cómo se comporta el efecto de tamaño de conjunto de CDA, como indicador de la carga de WM, en las condiciones de tarea restringidas y sin restricciones. Los efectos confiables del tamaño del conjunto de CDA generalmente solo se observan en individuos con alta capacidad de WM (Vogel & amp Machizawa, 2004). Por lo tanto, usamos los puntajes de capacidad de WM de los individuos para realizar una división de la mediana, por separado dentro de las condiciones no restringidas (mediana = 2.72) y restringidas (mediana = 2.58). Las ondas de diferencia de CDA en todas las condiciones se presentan en la Figura 3 y la Tabla 2. Como se mencionó anteriormente, analizamos los efectos de CDA promediando el intervalo de tiempo entre 450 y 1200 mseg. En un ANOVA, obtuvimos una interacción confiable entre todos los factores experimentales (es decir, capacidad de WM, no restringido / restringido, cambio / repetición, tamaño del conjunto), F(1, 68) = 6.31, pag = .014, η 2 = .09. Más allá de nuestra motivación teórica, este efecto también justifica estadísticamente un enfoque separado en individuos con alta MT y con baja MT.

CDA (P3 / P4, PO3 / PO4, OL / OR) para los tamaños de conjuntos 2 y 4, como una función de las condiciones de tarea no restringidas versus restringidas, capacidad de WM alta versus baja, y cambios versus pruebas repetidas. Las barras de error indican errores estándar para cada efecto de tamaño de conjunto individual.

CDA (P3 / P4, PO3 / PO4, OL / OR) para los tamaños de conjuntos 2 y 4, como una función de las condiciones de tarea no restringidas versus restringidas, capacidad de WM alta versus baja, y cambios versus pruebas repetidas. Las barras de error indican errores estándar para cada efecto de tamaño de conjunto individual.

Significar (Dakota del Sur) Amplitudes de CDA (450-1250 mseg) como una función del grupo de WM, tarea no restringida versus condiciones de tarea restringida, tamaño del conjunto y cambio versus pruebas repetidas

Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Establecer tamaño 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
Capacidad de alta WM
−0,52 μV (0,87) −0,49 μV (0,91) −1,02 μV (0,84) −0,81 μV (0,82) −0,55 μV (0,69) −0,43 μV (0,48) −0,57 μV (0,51) −0,53 μV (0,57)
Capacidad de baja WM
−0,58 μV (0,66) −0,36 μV (0,60) −0,61 μV (0,48) −0,86 μV (0,87) −0,66 μV (0,52) −0,67 μV (0,5) −0,97 μV (0,54) −0,86 μV (0,69)
Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Establecer tamaño 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
Capacidad de alta WM
−0,52 μV (0,87) −0,49 μV (0,91) −1,02 μV (0,84) −0,81 μV (0,82) −0,55 μV (0,69) −0,43 μV (0,48) −0,57 μV (0,51) −0,53 μV (0,57)
Capacidad de baja WM
−0,58 μV (0,66) −0,36 μV (0,60) −0,61 μV (0,48) −0,86 μV (0,87) −0,66 μV (0,52) −0,67 μV (0,5) −0,97 μV (0,54) −0,86 μV (0,69)

Como era de esperar, en el grupo de individuos con alta MT, encontramos en la condición sin restricciones un efecto de tamaño de conjunto confiable, F(1, 17) = 18.63, pag & lt .001, η 2 = .52 (Figura 3). Aunque este efecto pareció algo reducido en la condición de repetición, la interacción cambio / repetición por tamaño de conjunto no fue confiable, F(1, 17) = 1.83, pag = .19, η 2 = .10. Más importante aún, si los conjuntos de tareas familiares requieren menos capacidad de WM que los conjuntos de tareas novedosos, deberíamos esperar un efecto de tamaño de conjunto reducido en la condición de tarea restringida. De hecho, en esta condición no hubo un efecto de tamaño de conjunto confiable, F(1, 17) = 0.56, pag = .46, η 2 = .03 el tamaño del conjunto teóricamente crítico por interacción no restringida / restringida también fue confiable, F(1, 17) = 7.45, pag = .01, η 2 = .18 (Figura 3).

Pasando a la pregunta de si los participantes confiaban o no en la WM incluso en la condición restringida, debemos mirar el CDA absoluto en esa condición. La amplitud del CDA se mantuvo significativamente negativa para ambas condiciones de tamaño del conjunto durante todo el intervalo de preparación, F(1, 17) ≥ 6.49, pag = .02. El CDA para ambos tamaños de conjuntos en la condición restringida fue aproximadamente del mismo tamaño que para el tamaño de conjunto 2 en la condición sin restricciones. Por lo tanto, nuestros resultados para los participantes con alta MT son consistentes con la hipótesis de que, aunque los nuevos conjuntos de tareas requieren capacidad de WM de una manera dependiente de la carga, los conjuntos de tareas familiares todavía están representados en WM (es decir, el CDA sostenido en la condición restringida), sin embargo, de manera independiente de la carga (es decir, el efecto de tamaño del conjunto eliminado). Este patrón es más consistente con la hipótesis de que, incluso para conjuntos de tareas familiares, WM permanece involucrado en la representación de señales o punteros a representaciones de conjuntos completos de asociaciones S-R en LTM.

CDA para personas con baja WM

En general, nuestras predicciones para los individuos con baja MT fueron menos claras que para los individuos con alta MT. Sin embargo, basándonos en trabajos anteriores (Vogel & amp Machizawa, 2004), esperábamos efectos de tamaño de conjunto pequeños o inexistentes en la condición de tarea / cambio sin restricciones, que se asemeja más a la situación típica de WM. De hecho, los participantes con baja MT no mostraron efectos de tamaño establecidos aquí, F(1, 17) = 0.06, pag = .82, η 2 = .003 (Figura 3). Sorprendentemente, encontramos un efecto de tamaño de conjunto confiable en ensayos repetidos, F(1, 17) = 8.73, pag = .009, η 2 = .34 la interacción entre el tamaño del conjunto y el factor de cambio / repetición también fue confiable, F(1, 17) = 4.83, pag = .04, η 2 = .22. Además, también surgió un efecto de tamaño de conjunto confiable en la condición restringida / de cambio, F(1, 17) = 5.69, pag = .029, η 2 = .25, aunque con una interacción no significativa entre los factores no restringidos / restringidos y el tamaño del conjunto, F(1, 17) = 3.31, pag = .15, η 2 = .06. El efecto de tamaño pequeño del conjunto encontrado en las pruebas de tareas / cambios restringidos fue prácticamente eliminado para las pruebas de tareas / repeticiones restringidas, F(1, 17) = 0.97, pag = .34, η 2 = .05. Por lo tanto, aquí, incluso los participantes con baja MT parecían haber llegado a una etapa de selección / preparación de conjuntos de tareas relativamente independiente de la carga.

La Figura 4 resume los efectos generales del tamaño del conjunto en cada una de las condiciones experimentales. Aparentemente, la familiaridad con la tarea, ya sea debido a repeticiones inmediatas en la condición sin restricciones o debido a la práctica dentro de una sesión (es decir, en la condición restringida), tuvo efectos opuestos dependiendo de la capacidad de WM. En los participantes con alta MT, encontramos el patrón predicho de una reducción de los efectos del tamaño de la serie (aunque no significativamente para las repeticiones inmediatas). Por el contrario, en los participantes con baja WM, los efectos del tamaño de la serie estaban presentes solo después de una exposición previa con un mapeo S-R, ya sea en ensayos de repetición en la condición sin restricciones o en ensayos de cambio en la condición de tarea restringida. Como se explica más detalladamente en la Discusión, este patrón sugiere que la ausencia del efecto de tamaño del conjunto para conjuntos de tareas novedosas (es decir, en la condición sin restricciones / de cambio) no significa necesariamente que los individuos con baja MT tengan menos capacidad de almacenamiento real. Más bien, parecen tener más dificultades para codificar material nuevo en el espacio de almacenamiento existente.

Efecto de tamaño de conjunto agregado (450-1200 mseg) en función de la capacidad de WM alta versus baja, las condiciones de tarea no restringida versus tarea restringida, y el cambio versus la repetición de la prueba. Mientras que para los individuos con alta MT, tanto las repeticiones de prueba a prueba como dentro de la sesión redujeron el efecto del tamaño de la serie para las personas con baja MT, las repeticiones tanto dentro de la prueba como dentro de la sesión llevaron a un aumento en los efectos de tamaño de la serie. Las barras de error indican intervalos de confianza del 95% dentro del sujeto para cada efecto de tamaño de conjunto individual.

Efecto de tamaño de conjunto agregado (450-1200 mseg) en función de la capacidad de WM alta versus baja, las condiciones de tarea no restringida versus tarea restringida, y el cambio versus la repetición de la prueba. Mientras que para los individuos con alta MT, tanto las repeticiones de prueba a prueba como dentro de la sesión redujeron el efecto del tamaño de la serie para las personas con baja MT, las repeticiones tanto dentro de la prueba como dentro de la sesión llevaron a un aumento en los efectos de tamaño de la serie. Las barras de error indican intervalos de confianza del 95% dentro del sujeto para cada efecto de tamaño de conjunto individual.


¿Cómo funcionan las evaluaciones de desempeño?

El educador establece una tarea para la que hay más de una ruta para completar o un problema complejo que abordar con un considerable margen de interpretación.

Los estudiantes deben llegar a una respuesta, pero la respuesta no es la parte más importante. Más bien, el viaje es el destino. Los estudiantes deben demostrar competencias en producción, comunicación y aplicación de sus conocimientos de contenido.

La forma más eficaz de medir esto es asignando una lista de tareas de desempeño, junto con un nivel de logro para cada una. Esta lista debe ser razonablemente completa y la puntuación de cada tarea debe realizarse en una escala.

Estas tareas pueden reflejar las mejores prácticas de la industria. Por ejemplo, en una evaluación del rendimiento de las ciencias de la computación, una tarea podría ser "¿El candidato documentó su código de manera efectiva?" Esa tarea podría medirse en una calificación de "no lograda", "parcialmente lograda" o "totalmente lograda". Una tarea de proyecto de arte o video podría ser "¿El alumno reunió los requisitos correctamente?" A continuación, se pueden calcular las puntuaciones finales a partir de esta lista.

La clave para la evaluación del desempeño es que los estudiantes desarrollen cómo enfocan sus tareas mientras comprenden los estándares con los que serán evaluados.


Autorregulación de los estudiantes de secundaria: las autoevaluaciones son inexactas y no se utilizan lo suficiente para la selección de tareas de aprendizaje

La autoevaluación y la selección de tareas son habilidades de aprendizaje autorreguladas importantes para los estudiantes de secundaria. Más específicamente, la selección de nuevas tareas basadas en autoevaluaciones es muy importante para ellos, porque los profesores no siempre están presentes o no pueden seleccionar tareas para ellos individualmente. Sin embargo, se sabe poco sobre los procesos subyacentes a estas habilidades de aprendizaje autorregulado y, por lo tanto, no existen pautas para la enseñanza de la autoevaluación y la selección de tareas de aprendizaje posteriores. Proponemos un modelo para la selección de tareas de aprendizaje autorregulado (SRLTS) que representa una posible vía para el proceso de selección de tareas y que los estudiantes podrían utilizar como norma al realizar la selección de tareas. El modelo podría ayudar a los estudiantes a decidir qué posibles nuevas tareas podrían ser adecuadas para su nivel de habilidad actual, basándose en autoevaluaciones. El objetivo de este estudio es evaluar en qué medida los estudiantes de secundaria seleccionan tareas de aprendizaje de acuerdo con este modelo y si utilizan autoevaluaciones para este fin. Estudiantes de escuela secundaria (norte = 15) tareas de aprendizaje seleccionadas en el dominio de la genética a partir de una base de datos de tareas estructurada. Las tareas variaron en dificultad y cantidad de apoyo proporcionado (es decir, problemas de finalización frente a problemas tradicionales). Usamos seguimiento ocular, estimaciones de rendimiento, estimaciones de esfuerzo mental, juicios de aprendizaje y preguntas abiertas para obtener más información sobre en qué se enfocan y piensan los estudiantes al seleccionar una tarea. Los resultados sugieren que los estudiantes siguen aproximadamente el modelo SRLTS, pero basan sus decisiones en autoevaluaciones inexactas. Esto implica que los estudiantes podrían beneficiarse de los consejos de autoevaluación y selección de tareas, que podrían proporcionar retroalimentación sobre las autoevaluaciones y estimular a los estudiantes a utilizar la información de la autoevaluación como entrada para la selección de tareas en la forma en que el modelo prescribe para optimizar su aprendizaje.


Materiales y métodos

Participantes

Un total de 486 personas participaron en este estudio. Los participantes mayores fueron reclutados del departamento de ortopedia del Hospital Somma Lombardo y de diferentes grupos sociales para personas mayores. Los participantes más jóvenes fueron reclutados entre los familiares de las personas mayores. Los criterios de inclusión fueron: ninguna enfermedad neurológica o psiquiátrica conocida, ninguna discapacidad visual o auditiva no corregida y una puntuación en el Mini-Examen del Estado Mental por encima del límite específico de la edad. Los participantes fueron evaluados en el Hospital Somma Lombardo o en sus grupos sociales, en Lombardía, Italia. Los participantes fueron evaluados individualmente por un psicólogo clínico experimentado en una habitación tranquila, libre de distracciones, ya sea por la mañana o por la tarde.

Procedimiento

Cada participante completó la evaluación de doble tarea. Esto consistió en realizar tareas de recuperación y seguimiento de dígitos por separado y luego simultáneamente. Esta evaluación de doble tarea, el material de prueba relevante y las instrucciones completas para su administración y puntuación se pueden encontrar en www.psy.ed.ac.uk/people/sdsala/tests/sdsdualtask/.

Antes de comenzar la tarea de recuperación de dígitos, se estableció el intervalo de dígitos de cada individuo. Los participantes escucharon una lista de dígitos a una velocidad de uno por segundo. Luego se les pidió que repitieran estos dígitos en el mismo orden en que los escucharon. La longitud de la secuencia inicial era de dos dígitos y se presentó a los participantes seis secuencias en cada longitud de secuencia. Si cinco de las seis secuencias se recuperaron correctamente, la secuencia de dígitos se alargó en un dígito. Una vez que los participantes ya no pudieron recordar cinco de las secuencias de seis dígitos, se tomó el intervalo de dígitos como la longitud máxima a la que el participante pudo recordar cinco de las secuencias de seis dígitos correctamente. A continuación, los participantes escucharon una serie de secuencias, en una longitud de tramo individual, para recordarlo oralmente de forma inmediata ordenada en serie durante un período de 90 s. El número de listas que cada participante escuchó y recordó durante el período de 90 s varió dependiendo de su rango de dígitos y, por lo tanto, la medida de rendimiento fue la proporción de dígitos recordados correctamente en la posición de serie correcta.

La tarea de seguimiento consistió en utilizar un lápiz para trazar una línea a través de círculos dispuestos en un camino alrededor de una hoja de papel A3. Los participantes recibieron una versión abreviada para una prueba de práctica, con solo 17 círculos, para asegurarse de que entendían las demandas de la tarea. Después de esto, al participante se le presentó la versión completa que comprende 319 círculos y se le pidió que comenzara en un extremo del camino y dibujara una línea a través de cada círculo sucesivo lo más rápido posible durante un período de 90 s. La medida de rendimiento fue el número de círculos cruzados dentro del tiempo asignado.

Fiabilidad

Para examinar la confiabilidad prueba-reprueba de la nueva evaluación de doble tarea, una muestra más pequeña de participantes, representativa del grupo más grande, completó la evaluación por segunda vez. Todos los participantes que aceptaron volver a someterse a la prueba dentro del intervalo propuesto se incluyeron en este análisis de confiabilidad. El tiempo entre la primera y la segunda evaluación osciló entre 1 hora y 1 día, según la disponibilidad del participante. Esto consistió en 176 participantes sanos, de entre 18 y 88 años (media = 51,86, Dakota del Sur = 21,25) y un rango de educación de 2 a 21 años (media = 10,48, Dakota del Sur = 4.88).


¿Cómo interpreta los cambios desde la línea de base?

Supongamos que ahora tiene datos para su medida de referencia, así como datos recopilados en un puñado de momentos diferentes posteriormente. ¿Cómo le da sentido a esta información? Primero, debe conocer un poco los diferentes tipos de patrones de datos de referencia.

Cuando presenta sus medidas de referencia en forma de gráfico, puede aprender mucho sobre la gravedad de un problema en su comunidad y si ahora es un buen momento para introducir algún tipo de intervención para cambiarlo.

Ejemplo: patrones de datos de referencia

Líneas de base estables

Con una línea de base estable, no hay evidencia de tendencias al alza o a la baja, las cosas pueden fluctuar un poco con el tiempo, pero en su mayor parte, los puntos de datos caen en un rango bastante estrecho.

Una línea de base estable es la mejor base para comenzar su proyecto. Si las tasas de lo que sea que esté midiendo se han mantenido bastante estables durante un largo período de tiempo antes de comenzar, puede estar más seguro de que los cambios después de que comience la intervención son realmente el resultado de sus esfuerzos.

Líneas de base ascendentes y descendentes

Como puede adivinar por los nombres, una línea de base ascendente significa que lo que se está midiendo ha aumentado constantemente con el tiempo, y una línea de base descendente significa que ha disminuido.

Líneas de base inestables o variables

Cuando los puntos de datos se extienden por todas partes y no hay tendencias claras, tiene una línea de base inestable o variable. Con una línea de base variable, generalmente no es una buena idea introducir ningún tipo de intervención, porque las variaciones en la línea de base hacen que sea muy difícil saber si algún cambio será un resultado directo de la intervención.

Cuando tiene una línea de base más compleja, debe considerar seriamente si el problema de salud está aumentando o disminuyendo.

Digamos, por ejemplo, que la medida de referencia que está graficando representa la tasa de fumadores adolescentes en su condado. Si la línea de base es descendente, lo que indica que cada vez son menos los adolescentes que fuman, es posible que desee postergar la realización de cualquier tipo de intervención. Sin embargo, si la línea de base es ascendente, lo que muestra que el tabaquismo en los adolescentes va en aumento, entonces probablemente lo correcto sea realizar algún tipo de intervención. Puede que no sea tan fácil saber cuál es el efecto de su intervención como lo sería con una línea de base estable, pero saber que el problema está aumentando es una razón de sobra para tomar medidas.


Desventajas del análisis de datos secundarios

Una de las principales desventajas de utilizar datos secundarios es que es posible que no respondan a las preguntas de investigación específicas del investigador o que no contengan información específica que al investigador le gustaría tener. También puede no haber sido recolectado en la región geográfica o durante los años deseados, o con la población específica que el investigador está interesado en estudiar. Por ejemplo, un investigador que esté interesado en estudiar a los adolescentes puede encontrar que el conjunto de datos secundarios solo incluye a los adultos jóvenes.

Además, dado que el investigador no recopiló los datos, no tiene control sobre lo que está contenido en el conjunto de datos. A menudo, esto puede limitar el análisis o alterar las preguntas originales que el investigador buscaba responder. Por ejemplo, un investigador que esté estudiando la felicidad y el optimismo podría encontrar que un conjunto de datos secundarios solo incluye una de estas variables, pero no ambas.

Un problema relacionado es que las variables pueden haber sido definidas o categorizadas de manera diferente a la que hubiera elegido el investigador. Por ejemplo, la edad puede haberse recopilado en categorías en lugar de como una variable continua, o la raza puede definirse como "blanca" y "otra" en lugar de contener categorías para cada raza principal.

Otra desventaja significativa de usar datos secundarios es que el investigador no sabe exactamente cómo se realizó el proceso de recolección de datos o qué tan bien se llevó a cabo. El investigador no suele estar al tanto de la información sobre la gravedad de los problemas que afectan a los datos, como la baja tasa de respuesta o la mala comprensión de las preguntas específicas de la encuesta por parte de los encuestados. A veces, esta información está fácilmente disponible, como es el caso de muchos conjuntos de datos federales. Sin embargo, muchos otros conjuntos de datos secundarios no van acompañados de este tipo de información y el analista debe aprender a leer entre líneas para descubrir las posibles limitaciones de los datos.


Hoja informativa: Medidas múltiples: una definición y ejemplos de EE. UU. Y otras naciones

Resumen

Definición. Múltiples medidas: el uso de múltiples indicadores y fuentes de evidencia del aprendizaje de los estudiantes, de diversos tipos, recopilados en múltiples puntos en el tiempo, dentro y entre áreas temáticas. En respuesta a las preocupaciones sobre la reducción de los planes de estudio de Que Ningún Niño Se Quede Atrás, algunos estados han comenzado a usar técnicas que etiquetan falsamente como "múltiples medidas". Desafortunadamente, estos son usualmente usos múltiples de los mismos resultados de exámenes estandarizados en todo el estado, no de múltiples medidas auténticas.

Ejemplos de abundan las múltiples medidas reales, incluidos los laboratorios de ciencias o el trabajo de campo, desde tareas breves hasta proyectos extendidos, presentaciones orales en cualquier tema, problemas matemáticos extendidos que requieren aplicación al mundo real, utiliza la lectura en voz alta y la conversación con el maestro sobre un libro, informes de historia en profundidad, presentado oralmente, en un ensayo, un PowerPoint, etc.redactar un artículo en un segundo idioma sobre proyectos de arte o música y responder a las preguntas de un panel de expertos sobre un proyecto que ha realizado el estudiante, de la misma forma que los doctorandos defienden sus tesis. La documentación de las observaciones del maestro o las interacciones con el maestro puede ser útil, particularmente con los niños pequeños, si está bien estructurada. Muchos de estos se pueden hacer individualmente o en grupos (siempre que el propósito sea claro). Este material se puede organizar de modo que otros educadores independientes puedan volver a calificarlo, para garantizar la precisión del maestro del aula, un proceso conocido como & ldquomoderation & rdquo.

Ejemplos de sistemas de medidas múltiples utilizado con éxito en los EE. UU. - Registro de aprendizaje: desarrollado para su uso con poblaciones multilingües y multiculturales, para evaluar el progreso en lectura, escritura, expresión oral y comprensión auditiva. Usando un formato estructurado, el maestro observa y describe regularmente al estudiante y su trabajo, y adjunta muestras para proporcionar múltiples fuentes de evidencia. El progreso del estudiante se resume por escrito y se coloca numéricamente en una escala de desarrollo. Los LR se han vuelto a calificar con un alto acuerdo entre los evaluadores, y los estudios han respaldado su validez.

  • Sistema de muestreo de trabajo (WSS): WSS, diseñado para estudiantes de 3 a 8 años, facilita la recopilación y evaluación de observaciones y ejemplos del trabajo de los estudiantes. El aprendizaje se resume en escritura y numéricamente. Se demostró que tiene una gran validez y buena fiabilidad.
  • Consorcio de Normas de Desempeño de Nueva York: Docenas de escuelas secundarias de Nueva York tienen una variación para usar solo un examen estatal (ELA) de los cinco obligatorios. El Consorcio usa la prueba ELA y cuatro tareas de desempeño para la graduación. La prueba y la tarea de matemáticas se utilizan para determinar el progreso anual adecuado según NCLB. El trabajo de los estudiantes es evaluado por profesores y revisores independientes. El sistema ha sido revisado y aprobado por expertos independientes.
  • Wyoming & rsquos & ldquoBody of Evidence & rdquo El enfoque utiliza evaluaciones desarrolladas localmente, incorporando múltiples medidas, diseñadas para indicar que los estudiantes han cumplido con los estándares estatales de graduación. Los sistemas de evaluación locales se evalúan mediante un proceso de revisión por pares.
  • La Coalición de Escuelas Esenciales ha documentado una variedad de formas en que las escuelas miembros utilizan evaluaciones de desempeño y múltiples fuentes y tipos de evidencia del aprendizaje de los estudiantes.

Ejemplos de otras naciones. La mayoría de las demás naciones, incluidas muchas con mejores resultados en varios indicadores, obtienen menos resultados que los EE. UU. Utilizan una combinación de evaluaciones estatales / nacionales y locales, incluidas las tareas de desempeño, principalmente para la información pública y los esfuerzos de mejora, no para la rendición de cuentas.

  • Queensland, Australia utiliza múltiples formas de evaluación y se basa en evaluaciones locales. Linda Darling-Hammond explica: & ldquo [En la década de 1970,] todas las evaluaciones se hicieron escolares. Los maestros desarrollan, administran y califican las evaluaciones en relación con las pautas curriculares nacionales y los programas estatales (también desarrollados por maestros), y paneles que incluyen maestros de otras escuelas, así como al menos un profesor del sistema de educación terciaria, moderan las evaluaciones. & rdquo [Darling-Hammond es la fuente de las otras citas en esta sección.]
  • Queensland, Australia y ldquoRich Tasks & rdquo: En un programa piloto, las tareas de desempeño multidisciplinarias extendidas de diversos tipos, para su uso en tres grados, se desarrollaron de forma centralizada, se integraron con el plan de estudios local y se utilizaron cuando los maestros decidieron. Los maestros juzgaron el desempeño de los estudiantes contra los estándares preestablecidos. Queensland utilizó un proceso de & ldquomoderación & rdquo en el que los equipos de maestros volvieron a calificar las muestras del trabajo de los estudiantes. Los puntajes de Rich Task se incluyeron en las calificaciones de los estudiantes. El piloto formal ha finalizado, pero las tareas todavía se utilizan en muchas escuelas, con cierto apoyo estatal.
  • Finlandia & ldquo no tiene pruebas estandarizadas externas utilizadas para clasificar a los estudiantes o escuelas & hellip Finland & rsquos líderes señalan que el uso de tareas abiertas, centradas en el estudiante y basadas en la escuela integradas en el plan de estudios es una razón importante para el extraordinario éxito de la nación & rsquos en los exámenes internacionales y las muestras a nivel de Hellip School Las autoridades educativas finlandesas evalúan periódicamente el desempeño de los estudiantes, generalmente al final del segundo y noveno grado, para informar el plan de estudios y las inversiones escolares. Todas las demás evaluaciones se diseñan y gestionan localmente. & Rdquo
  • Suecia & ldquopairs su plan de estudios delineado a nivel nacional e implementado localmente con múltiples niveles de evaluación controlados por escuelas y maestros. Las evaluaciones en la escuela obligatoria constan de varios componentes y los maestros Hellip mantienen registros extensos del progreso de los estudiantes, utilizando tres evaluaciones para ayudar en su calificación en el nivel de la escuela secundaria superior: 1) trabajo del curso, 2) evaluaciones diseñadas por los maestros basadas en el plan de estudios del curso, y 3) Exámenes aprobados a nivel nacional al calificar las materias básicas y las escuelas y los funcionarios regionales de educación brindan tiempo para que los maestros calibren sus prácticas de calificación para minimizar la variación entre las escuelas y la región. & rdquo
  • Hong Kong y rsquos "El sistema de evaluación está evolucionando de un sistema de exámenes altamente centralizado a uno que enfatiza cada vez más las evaluaciones formativas basadas en la escuela que esperan que los estudiantes analicen problemas y resuelvan problemas". En algunos exámenes de la escuela secundaria, el 20-30% de la calificación se deriva del aula. tareas basadas en el desempeño. (Sobre la evaluación formativa, consulte http://www.fairtest.org/position-paper-assessment-learning.)
  • Singapur y rsquos El sistema está evolucionando hacia un mayor uso no solo de las tareas de desempeño, sino también de la evidencia basada en la escuela. Los exámenes cuentan en las decisiones de ingreso a la universidad, pero no para la graduación. Algunas pruebas de la escuela secundaria incluyen componentes basados ​​en la escuela. El sistema educativo también fomenta múltiples formas de evaluación en los grados anteriores. Sin embargo, esta información no forma parte de un sistema de evaluación más amplio, ya que dicho sistema no existe antes de los exámenes al final de la escuela primaria (año 6, 12 años). Estos exámenes nacionales y ldquo son administrados y calificados por maestros en sesiones de calificación moderadas. & Rdquo
  • Reino Unido: Inglaterra utiliza múltiples medidas, tanto en la escuela como en la combinación de evaluaciones externas y basadas en la escuela que se utilizan para la rendición de cuentas. Los juicios de los maestros se moderan a nivel escolar o nacional, según el grado (& ldquokey level & rdquo). Gales ha eliminado los exámenes nacionales para niños hasta los 14 años. Los maestros crean y califican evaluaciones antes de los exámenes de ingreso a la universidad. Irlanda del Norte & ldquo está en el proceso de implementar un enfoque en todos los niveles llamado & lsquoEvaluación para el aprendizaje & rsquo Este enfoque enfatiza las evaluaciones desarrolladas, administradas y puntuadas localmente. & Rdquo No hay pruebas gubernamentales obligatorias hasta los 14 años.
  • Bachillerato Internacional. & ldquo [T] ea los maestros llevan a cabo evaluaciones escolares mediante la calificación de piezas individuales de trabajo de curso según el objetivo establecido en los esquemas de materias del IB. Las evaluaciones escolares contribuyen entre el 20 y el 30% de la calificación total en la mayoría de las materias, y más en otras.

Conclusión: Las medidas múltiples, el uso extensivo de evaluaciones de desempeño y la inclusión de evidencia local son factibles en sistemas de evaluación a gran escala. Mediante revisiones de dichos sistemas, utilizando auditorías (revisiones independientes del sistema de evaluación) y moderación, se puede establecer tanto la confiabilidad como la comparabilidad.


¿Cómo interpreta los cambios desde la línea de base?

Supongamos que ahora tiene datos para su medida de referencia, así como datos recopilados en un puñado de momentos diferentes posteriormente. ¿Cómo le da sentido a esta información? Primero, debe conocer un poco los diferentes tipos de patrones de datos de referencia.

Cuando presenta sus medidas de referencia en forma de gráfico, puede aprender mucho sobre la gravedad de un problema en su comunidad y si ahora es un buen momento para introducir algún tipo de intervención para cambiarlo.

Ejemplo: patrones de datos de referencia

Líneas de base estables

Con una línea de base estable, no hay evidencia de tendencias al alza o a la baja, las cosas pueden fluctuar un poco con el tiempo, pero en su mayor parte, los puntos de datos caen en un rango bastante estrecho.

Una línea de base estable es la mejor base para comenzar su proyecto. Si las tasas de lo que sea que esté midiendo se han mantenido bastante estables durante un largo período de tiempo antes de comenzar, puede estar más seguro de que los cambios después de que comience la intervención son realmente el resultado de sus esfuerzos.

Líneas de base ascendentes y descendentes

Como puede adivinar por los nombres, una línea de base ascendente significa que lo que se está midiendo ha aumentado constantemente con el tiempo, y una línea de base descendente significa que ha disminuido.

Líneas de base inestables o variables

Cuando los puntos de datos se extienden por todas partes y no hay tendencias claras, tiene una línea de base inestable o variable. Con una línea de base variable, generalmente no es una buena idea introducir ningún tipo de intervención, porque las variaciones en la línea de base hacen que sea muy difícil saber si algún cambio será un resultado directo de la intervención.

Cuando tiene una línea de base más compleja, debe considerar seriamente si el problema de salud está aumentando o disminuyendo.

Digamos, por ejemplo, que la medida de referencia que está graficando representa la tasa de fumadores adolescentes en su condado. Si la línea de base es descendente, lo que indica que cada vez son menos los adolescentes que fuman, es posible que desee postergar la realización de cualquier tipo de intervención. Sin embargo, si la línea de base es ascendente, lo que muestra que el tabaquismo en los adolescentes va en aumento, entonces probablemente lo correcto sea realizar algún tipo de intervención. Puede que no sea tan fácil saber cuál es el efecto de su intervención como lo sería con una línea de base estable, pero saber que el problema está aumentando es una razón de sobra para tomar medidas.


Archivo adicional

Archivo adicional 1:

Datos de tiempo de respuesta, puntuaciones OSCE de los sujetos, puntuaciones máximas disponibles y puntuaciones de expertos. Datos de tiempo de respuesta: identificador único, número de sujeto, fecha, hora, tiempo de respuesta en segundos, fase (1 = escucha, 2 = calificación de video), video = cantidad de video que se está calificando. Puntuaciones de la OSCE: Identificador único, Escenario (CVS = examen cardiovascular, Comm = Habilidades de comunicación, P = Aprobado límite, G = Buen desempeño), Número de sujeto, Intento (número 1-4), Elemento en la lista de verificación, Puntaje registrado por tema. Puntuaciones máximas de la OSCE disponibles: identificador único, materia (en blanco), intento (no relevante aquí), elemento de la lista de verificación, puntuación: puntuación máxima disponible. Puntajes de expertos: puntajes acordados para cada elemento de la lista de verificación para cada uno de los cuatro videos utilizados, identificador único, escenario como anteriormente, tema (en blanco), intento (no es relevante aquí), elemento de la lista de verificación, puntaje acordado. (XLSX 158 kb)


EXPERIMENTO 1

En nuestro paradigma, unimos el procedimiento de detección de cambios, utilizado para obtener el CDA, con un procedimiento de cambio de tareas con indicaciones. En cada ensayo, a los participantes se les presentaron dos conjuntos lateralizados de estímulos de dos o cuatro colores con una flecha central indicando qué lados tenían que ser atendidos en un ensayo determinado. Las ubicaciones de los estímulos de color de la señal indicaron claves de respuesta espacialmente compatibles. Por lo tanto, la disposición de los estímulos de color sirvió como señales de las reglas S-R que debían aplicarse a un estímulo de color individual (es decir, el estímulo de la sonda) presentado después de un intervalo de retraso (Figura 1).

La línea de tiempo del ensayo y las pantallas de estímulo de muestra para el Experimento 1. Los participantes asistieron al lado con señales (indicado mediante un triángulo verde oscuro) para codificar las posiciones de color como reglas S-R para ejecutar una respuesta a la pantalla de la sonda final. Por ejemplo, en la prueba presentada, la respuesta correcta a la pantalla de la sonda final fue la tecla inferior, correspondiente a la ubicación inferior del parche de color rosa en la pantalla de codificación del lado derecho con indicaciones. La señal de EEG relevante se midió durante los intervalos de codificación y retención.

La línea de tiempo del ensayo y las pantallas de estímulo de muestra para el Experimento 1. Los participantes asistieron al lado con señales (indicado mediante un triángulo verde oscuro) para codificar las posiciones de color como reglas S-R para ejecutar una respuesta a la pantalla de la sonda final. Por ejemplo, en la prueba presentada, la respuesta correcta a la pantalla de la sonda final fue la tecla inferior, correspondiente a la ubicación inferior del parche de color rosa en la pantalla de codificación del lado derecho con indicaciones. La señal de EEG relevante se midió durante los intervalos de codificación y retención.

La mitad de los participantes (norte = 36) trabajó con nuevas constelaciones de reglas S-R en el 50% de las pruebas (pruebas de cambio) y repeticiones de la constelación de pruebas anteriores en las pruebas restantes (pruebas repetidas). Nos referimos a esto como la condición sin restricciones. Dado que requiere una actualización frecuente de WM con nuevos conjuntos de reglas, esperábamos que WM se requiera de una manera dependiente de la carga (al menos en las pruebas de cambio). Por lo tanto, predecimos aquí un efecto de tamaño de conjunto de CDA con una amplitud mayor para conjuntos de cuatro que para conjuntos de dos reglas S-R. Con base en resultados anteriores, también esperamos que los efectos del tamaño del conjunto de CDA sean evidentes en individuos con alta capacidad de WM (medida en una tarea estándar de detección de cambios), pero que sean pequeños o inexistentes en individuos con bajo WM (Vogel & amp Machizawa, 2004 ).

La otra mitad de los participantes (norte = 36) trabajó con solo dos conjuntos de reglas S-R por tamaño de conjunto en todo el experimento (es decir, cuatro tareas en total). Esta condición restringida se asemeja al paradigma estándar de cambio de tareas en el que normalmente solo se usa un pequeño conjunto de tareas a lo largo de una sesión experimental. En este caso, los participantes deben poder representar conjuntos de tareas en un formato procedimental (según el modelo de dos sistemas) o de forma "comprimida" (según el modelo de un sistema). Si las reglas S-R practicadas están de hecho representadas en un formato procedimental, entonces no deberíamos ver un CDA sostenido, reflejando el hecho de que no se utiliza WM estándar (ver Figura 2). Sin embargo, si los conjuntos de tareas practicadas se pueden representar en WM estándar en términos de claves para las representaciones LTM, esperamos ver un CDA, pero no un efecto de tamaño del conjunto (Figura 2). Por último, estas predicciones sobre el contraste entre las condiciones de tarea no restringidas y restringidas pueden evaluarse adecuadamente solo en participantes que realmente exhiben efectos de tamaño de conjunto para la condición no restringida. Por lo tanto, para nuestra hipótesis principal, nos enfocamos en participantes con alta capacidad de WM, quienes en trabajos anteriores han exhibido efectos de tamaño de conjunto con contenido novedoso de WM. No esperamos ningún efecto de tamaño de conjunto de CDA en la condición sin restricciones para individuos con baja WM (por ejemplo, Vogel & amp Machizawa, 2004). Sin embargo, este grupo nos permitirá examinar de qué manera la capacidad de baja MT restringe las representaciones de conjuntos de tareas incluso después de experiencia adicional (es decir, a través de repeticiones inmediatas de tareas en la condición restringida o mediante repeticiones frecuentes en la condición no restringida).

CDA pronosticado para las condiciones de tarea restringidas y no restringidas. Para la condición sin restricciones, tanto el modelo de dos sistemas como el modelo unitario hacen predicciones idénticas. Para la condición restringida, el modelo de dos sistemas predice la eliminación del CDA, lo que indica que la WM estándar ya no está involucrada. El modelo unitario WM + LTM predice que se elimina el efecto de tamaño del conjunto de CDA, pero que permanece un CDA sostenido, lo que indica que WM sigue siendo fundamental para la preparación basada en claves y la selección de información relevante para la tarea.

CDA pronosticado para las condiciones de tarea restringidas y no restringidas. Para la condición sin restricciones, tanto el modelo de dos sistemas como el modelo unitario hacen predicciones idénticas. Para la condición restringida, el modelo de dos sistemas predice la eliminación del CDA, lo que indica que la WM estándar ya no está involucrada. El modelo unitario WM + LTM predice que se elimina el efecto de tamaño del conjunto de CDA, pero que permanece un CDA sostenido, lo que indica que WM sigue siendo fundamental para la preparación basada en claves y la selección de información relevante para la tarea.

Finalmente, nuestros estudios piloto habían demostrado que el paradigma híbrido de conmutación de tareas / WM produce costos de conmutación de RT locales relativamente pequeños. Esto concuerda con los hallazgos que indican que, con intervalos prolongados entre ensayos consecutivos, los participantes a menudo no mantienen conjuntos de tareas en los ensayos, reduciendo o eliminando así los ensayos entre cambios y sin cambios (Bryck & amp Mayr, 2008). Sin embargo, debido a que esta es una variable importante en el contexto de la investigación de cambio de tareas, incluimos un contraste experimental entre el cambio y las transiciones repetidas de una manera exploratoria.

Métodos

Participantes

Ochenta y un individuos neurológicamente normales participaron a cambio de crédito del curso o pago monetario y después de dar su consentimiento informado. El protocolo de estudio fue aprobado por el Comité de Sujetos Humanos de la Universidad de Oregon. Los participantes fueron asignados aleatoriamente a la condición de tarea no restringida o la condición de tarea restringida. Siete participantes fueron excluidos de la muestra final debido a las amplias tasas de rechazo de ensayos de & gt30%, lo que resultó en muy pocos ensayos para un análisis ERP adecuado. La muestra final comprendió datos de 36 participantes para cada una de las dos condiciones entre sujetos.

Tareas, estímulos y procedimiento

Para cada ensayo, las reglas S-R se codificaron por parches de color (es decir, dos o cuatro parches, radio = 2 °) que aparecen dentro de cuatro marcadores de posición cuadrados (ancho y alto = 6.5 °) que se organizaron en términos de una cruz. Los parches de color se seleccionaron aleatoriamente entre 10 posibles colores isoluminantes (verde [0,255,0], rojo [255,0,0], magenta [255,0,255], cian [0,255,255], amarillo [255,255,0], gris [128,128,128] , marrón [153,76,0], rosa claro [255,102,178], azul medianoche [0,76,153], naranja [255,153,51]). Cada marcador de posición se asignó a una tecla de respuesta espacialmente compatible (tecla superior, derecha, inferior e izquierda). Dentro de un bloque determinado, los participantes fueron expuestos a tamaños de conjuntos de dos o cuatro parches de color (es decir, reglas S-R). Los bloques de tamaño 2 y 4 se alternaron a lo largo de la sesión, y el tamaño del primer bloque se equilibró entre los participantes. En ensayos repetidos, se utilizó la misma constelación de parches de color que en el ensayo anterior. En la prueba de cambio, la mitad de los parches de color eran los mismos que en la prueba anterior, pero en una ubicación diferente, y la otra mitad estaba en colores que no se usaron en la prueba anterior. Tanto para las condiciones no restringidas como restringidas, la probabilidad de una prueba de cambio fue pag = .5.

En la condición sin restricciones, se generaron nuevas constelaciones de parches de color de conjuntos de tareas para cada prueba de cambio con las restricciones mencionadas anteriormente.Para la condición restringida, se seleccionaron al azar dos constelaciones de conjuntos de tareas para cada tamaño de conjunto de modo que, en las pruebas de cambio, los conjuntos de tareas cambiaran de un lado a otro entre estas dos constelaciones. La sesión experimental incluyó 22 bloques de 40 ensayos, cada uno de los dos primeros bloques fueron bloques de práctica (un bloque para cada tamaño de conjunto). En la mitad de los bloques mezclados aleatoriamente, se presentaron conjuntos S-R con tamaño de conjunto 2 en la otra mitad, se utilizaron conjuntos S-R con tamaño de conjunto de 4.

A lo largo de cada ensayo, se pidió a los participantes que fijaran el diamante central (ancho = 1 °) y la distancia de visualización se mantuvo aproximadamente a 77 cm. Los marcadores de posición y los parches de color se mostraron de forma bilateral. El centro de la matriz de estímulos de cada lado estaba a 7,2 ° a la izquierda o la derecha del centro de la pantalla. Durante un intervalo entre ensayos inicial con nerviosismo (750-1250 mseg), se presentaron marcadores de posición bilaterales y el diamante central, después de lo cual el lado izquierdo o derecho del diamante se volvió verde durante 750 mseg para indicar a los participantes que presten atención a la izquierda. lado o el lado derecho de la pantalla. Luego, aparecieron dos o cuatro parches de color durante 250 ms tanto en el lado atendido como en el irrelevante. El CDA se midió desde el inicio de las manchas de color hasta el final de los siguientes 950 milisegundos del período de retención del blanco. Para la pantalla de la sonda, uno de los colores que formaba parte del conjunto de tareas codificado apareció en el centro. Se indicó a los participantes que presionasen en el teclado numérico (8 [arriba], 6 [derecha], 2 [abajo] y 4 [izquierda]) la tecla asociada con la ubicación de ese color de la manera más rápida y precisa posible. Se pidió a los participantes que cambiaran entre la mano izquierda y la derecha en el medio de la sesión, con el comienzo equilibrado entre los participantes. Todos los estímulos fueron generados usando Psychophysics Toolbox (Brainard, 1997 Pelli, 1997) para MATLAB (The MathWorks, Natick, MA) en un 17 pulg. monitor de tubo de rayos catódicos plano.

Procedimientos y análisis de EEG

La actividad de EEG se registró a partir de 22 electrodos de estaño mantenidos en su lugar mediante una gorra elástica (Electro-Cap International, Eaton, OH) usando el sistema International 10/20. Los 10/20 sitios F3, Fz, F4, T3, C3, CZ, C4, T4, P3, PZ, P4, T5, T6, O1 y O2 se utilizaron junto con cinco sitios no estándar: OL a medio camino entre T5 y O1 O a medio camino entre T6 y O2 PO3 a medio camino entre P3 y OL PO4 a medio camino entre P4 y OR y POz a medio camino entre PO3 y PO4. La mastoides izquierda se utilizó como referencia para todos los sitios de registro. Los datos se volvieron a referenciar fuera de línea al promedio de todos los electrodos del cuero cabelludo. Los electrodos colocados ∼1 cm a la izquierda y la derecha del canto externo de cada ojo registraron el EOG horizontal para medir las sacádicas horizontales. Para detectar parpadeos, se registró el EOG vertical de un electrodo colocado debajo del ojo izquierdo y referencia a la mastoides izquierda. El EEG y el EOG se amplificaron con un amplificador de instrumentación SA con un paso de banda de 0,01 a 30 [80] Hz y se digitalizaron a 250 Hz en LabView 6.1 ejecutándose en una PC.

La señal de EEG se segmentó en épocas de 1400 mseg, cada una comenzando 200 mseg antes del inicio de las señales de la tarea. El intervalo de 200 ms que precede al inicio del conjunto de tareas sirvió como línea de base. Usamos procedimientos de análisis estándar, incluida la exclusión de ensayos que contienen parpadeos, grandes movimientos oculares (& gt1 °) y bloqueo de señales (McCollough, Machizawa y amp Vogel, 2007 Vogel, Luck y amp Shapiro, 1998). Utilizamos las cajas de herramientas EEGLAB (Delorme & amp Makeig, 2004) y ERPLAB (Lopez-Calderon & amp Luck, 2014) y scripts personalizados para el procesamiento de EEG y ERP. El CDA se midió calculando la diferencia entre la actividad contralateral e ipsilateral en referencia al lado del campo visual donde se indicó a los participantes que asistieran. Las ondas de diferencia se midieron y promediaron entre los sitios de electrodos parietal (P3 / P4), parietal posterior (PO3 / PO4) y occipital lateral (OL / OR). Las amplitudes de CDA se compararon a través de los principales factores de diseño utilizando un ANOVA para el intervalo de 450 y 1200 ms después del inicio de la visualización de la indicación de la tarea. Este intervalo fue predeterminado en base a estudios previos que mostraban que el CDA típicamente comienza a aparecer entre 300 y 450 mseg después del inicio de los ítems (Luria et al., 2016 Ikkai, McCollough, & amp Vogel, 2010).

Evaluación de WM

La capacidad visual de WM de los individuos se midió utilizando un paradigma estándar de detección de cambios (Vogel & amp Machizawa, 2004 Luck & amp Vogel, 1997). En esta tarea, se presentó a los participantes, durante un intervalo de codificación de 100 milisegundos, matrices de cuatro u ocho cuadrados de colores (0,65 ° × 0,65 °) en ubicaciones aleatorias. Después de un período de retraso de 900 ms, se presentó una única sonda en la ubicación de uno de los objetos del conjunto de codificación. Los participantes debían indicar si el color de la sonda coincidía o no con el color del objeto original. El número de pruebas fue 320. La capacidad se calculó como K = S × (HF), dónde K es la capacidad de memoria, S es el tamaño de la matriz, H es la tasa de aciertos observada, y F es la tasa de falsas alarmas (Cowan, 2001).

Resultados

Resultados de comportamiento

Los RT de los ensayos de error, los ensayos de posterrorismo y los ensayos en los que los RT fueron inferiores a 100 mseg o superiores a 5000 mseg se excluyeron de los análisis, que excluyeron el 0,4% de los datos. La Tabla 1 muestra los RT y la precisión en función del contexto del conjunto de tareas (no restringido frente a restringido) como una variable entre sujetos, tamaño del conjunto (2 frente a 4) y cambio (cambio frente a repetición). Los RT fueron más grandes y la precisión fue menor para el tamaño de juego 4 en comparación con el tamaño de juego 2, F(1, 70) = 40.26, pag & lt .001, η 2 = .36, y F(1, 70) = 148.34, pag & lt .001, η 2 = .69, y para cambios versus ensayos repetidos, F(1, 70) = 511.81, pag & lt .001, η 2 = .88, y F(1, 70) = 261.21, pag & lt .001, η 2 = .79. Además, en la condición de conjunto de tareas restringido, los participantes fueron en general más precisos, F(1, 70) = 10.84, pag & lt .001, η 2 = .13, pero no significativamente más rápido que en la condición sin restricciones, F(1, 70) = 0.52, pag = .47. Además, los beneficios de rendimiento en la condición restringida en comparación con la condición no restringida fueron mayores para el tamaño de juego 4 que para el tamaño de juego 2 en cuanto a precisión, F(1, 70) = 10.84, pag & lt .001, η 2 = .13, pero no hubo un efecto significativo para los RT, F(1, 70) = 0.91, pag = .34.

Significar (Dakota del Sur) RT y tasas de precisión en función de la tarea no restringida frente a las condiciones de la tarea restringida, el tamaño del conjunto y el cambio frente a las pruebas repetidas

Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Establecer tamaño 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
583 milisegundos (106) 562 milisegundos (96) 750 milisegundos (123) 740 milisegundos (112) 611 milisegundos (116) 588 milisegundos (107) 758 milisegundos (133) 739 milisegundos (126)
6.58% (2.67) 96.58% (3.10) 88.26% (7.47) 91.60% (7.16) 96.20% (2.78) 97.81% (2.16) 86.40% (5.46) 80.97% (5.61)
Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Establecer tamaño 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
583 milisegundos (106) 562 milisegundos (96) 750 milisegundos (123) 740 milisegundos (112) 611 milisegundos (116) 588 milisegundos (107) 758 milisegundos (133) 739 milisegundos (126)
6.58% (2.67) 96.58% (3.10) 88.26% (7.47) 91.60% (7.16) 96.20% (2.78) 97.81% (2.16) 86.40% (5.46) 80.97% (5.61)

Para examinar cómo la capacidad de WM está relacionada con el desempeño de la selección de tareas, también correlacionamos los RT generales y la precisión para las condiciones de tarea restringidas y no restringidas. La correlación entre la capacidad de WM y los RT fue r(35) = −.56, pag & lt .001, para la condición sin restricciones y se redujo a r(35) = −.002, pag = .99, para la condición restringida. Esta diferencia entre correlaciones fue muy significativa, z = −2.57, pag & lt .01. Para la precisión, la correlación para la condición no restringida también fue más alta que para la condición restringida, no restringida: r(35) = .63, pag & lt .01, restringido: r(35) = .42, pag & lt .01, aunque aquí la diferencia no fue significativa, z = 1.01, pag = .14. Estos resultados sugieren que la capacidad de WM de los individuos limita el rendimiento cuando es necesario utilizar conjuntos de tareas novedosos, pero es menos restrictivo cuando los mismos conjuntos de tareas se utilizan repetidamente, como es el caso en situaciones estándar de cambio de tareas. Finalmente, tanto para las condiciones no restringidas como restringidas, los costos de cambio de prueba a prueba fueron generalmente pequeños y no mostraron correlaciones confiables con la capacidad de WM, un aspecto al que volveremos en la Discusión.

CDA para personas con alta MT

Nuestra pregunta principal se refiere a cómo se comporta el efecto de tamaño de conjunto de CDA, como indicador de la carga de WM, en las condiciones de tarea restringidas y sin restricciones. Los efectos confiables del tamaño del conjunto de CDA generalmente solo se observan en individuos con alta capacidad de WM (Vogel & amp Machizawa, 2004). Por lo tanto, usamos los puntajes de capacidad de WM de los individuos para realizar una división de la mediana, por separado dentro de las condiciones no restringidas (mediana = 2.72) y restringidas (mediana = 2.58). Las ondas de diferencia de CDA en todas las condiciones se presentan en la Figura 3 y la Tabla 2. Como se mencionó anteriormente, analizamos los efectos de CDA promediando el intervalo de tiempo entre 450 y 1200 mseg. En un ANOVA, obtuvimos una interacción confiable entre todos los factores experimentales (es decir, capacidad de WM, no restringido / restringido, cambio / repetición, tamaño del conjunto), F(1, 68) = 6.31, pag = .014, η 2 = .09. Más allá de nuestra motivación teórica, este efecto también justifica estadísticamente un enfoque separado en individuos con alta MT y con baja MT.

CDA (P3 / P4, PO3 / PO4, OL / OR) para los tamaños de conjuntos 2 y 4, como una función de las condiciones de tarea no restringidas versus restringidas, capacidad de WM alta versus baja, y cambios versus pruebas repetidas. Las barras de error indican errores estándar para cada efecto de tamaño de conjunto individual.

CDA (P3 / P4, PO3 / PO4, OL / OR) para los tamaños de conjuntos 2 y 4, como una función de las condiciones de tarea no restringidas versus restringidas, capacidad de WM alta versus baja, y cambios versus pruebas repetidas. Las barras de error indican errores estándar para cada efecto de tamaño de conjunto individual.

Significar (Dakota del Sur) Amplitudes de CDA (450-1250 mseg) como una función del grupo de WM, tarea no restringida versus condiciones de tarea restringida, tamaño del conjunto y cambio versus pruebas repetidas

Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Establecer tamaño 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
Capacidad de alta WM
−0,52 μV (0,87) −0,49 μV (0,91) −1,02 μV (0,84) −0,81 μV (0,82) −0,55 μV (0,69) −0,43 μV (0,48) −0,57 μV (0,51) −0,53 μV (0,57)
Capacidad de baja WM
−0,58 μV (0,66) −0,36 μV (0,60) −0,61 μV (0,48) −0,86 μV (0,87) −0,66 μV (0,52) −0,67 μV (0,5) −0,97 μV (0,54) −0,86 μV (0,69)
Tareas ilimitadasTareas restringidas
Establecer tamaño 2Establecer tamaño 4Establecer tamaño 2Establecer tamaño 4
CambioRepetirCambioRepetirCambioRepetirCambioRepetir
Capacidad de alta WM
−0,52 μV (0,87) −0,49 μV (0,91) −1,02 μV (0,84) −0,81 μV (0,82) −0,55 μV (0,69) −0,43 μV (0,48) −0,57 μV (0,51) −0,53 μV (0,57)
Capacidad de baja WM
−0,58 μV (0,66) −0,36 μV (0,60) −0,61 μV (0,48) −0,86 μV (0,87) −0,66 μV (0,52) −0,67 μV (0,5) −0,97 μV (0,54) −0,86 μV (0,69)

Como era de esperar, en el grupo de individuos con alta MT, encontramos en la condición sin restricciones un efecto de tamaño de conjunto confiable, F(1, 17) = 18.63, pag & lt .001, η 2 = .52 (Figura 3). Aunque este efecto pareció algo reducido en la condición de repetición, la interacción cambio / repetición por tamaño de conjunto no fue confiable, F(1, 17) = 1.83, pag = .19, η 2 = .10. Más importante aún, si los conjuntos de tareas familiares requieren menos capacidad de WM que los conjuntos de tareas novedosos, deberíamos esperar un efecto de tamaño de conjunto reducido en la condición de tarea restringida. De hecho, en esta condición no hubo un efecto de tamaño de conjunto confiable, F(1, 17) = 0.56, pag = .46, η 2 = .03 el tamaño del conjunto teóricamente crítico por interacción no restringida / restringida también fue confiable, F(1, 17) = 7.45, pag = .01, η 2 = .18 (Figura 3).

Pasando a la pregunta de si los participantes confiaban o no en la WM incluso en la condición restringida, debemos mirar el CDA absoluto en esa condición. La amplitud del CDA se mantuvo significativamente negativa para ambas condiciones de tamaño del conjunto durante todo el intervalo de preparación, F(1, 17) ≥ 6.49, pag = .02. El CDA para ambos tamaños de conjuntos en la condición restringida fue aproximadamente del mismo tamaño que para el tamaño de conjunto 2 en la condición sin restricciones. Por lo tanto, nuestros resultados para los participantes con alta MT son consistentes con la hipótesis de que, aunque los nuevos conjuntos de tareas requieren capacidad de WM de una manera dependiente de la carga, los conjuntos de tareas familiares todavía están representados en WM (es decir, el CDA sostenido en la condición restringida), sin embargo, de manera independiente de la carga (es decir, el efecto de tamaño del conjunto eliminado). Este patrón es más consistente con la hipótesis de que, incluso para conjuntos de tareas familiares, WM permanece involucrado en la representación de señales o punteros a representaciones de conjuntos completos de asociaciones S-R en LTM.

CDA para personas con baja WM

En general, nuestras predicciones para los individuos con baja MT fueron menos claras que para los individuos con alta MT. Sin embargo, basándonos en trabajos anteriores (Vogel & amp Machizawa, 2004), esperábamos efectos de tamaño de conjunto pequeños o inexistentes en la condición de tarea / cambio sin restricciones, que se asemeja más a la situación típica de WM. De hecho, los participantes con baja MT no mostraron efectos de tamaño establecidos aquí, F(1, 17) = 0.06, pag = .82, η 2 = .003 (Figura 3). Sorprendentemente, encontramos un efecto de tamaño de conjunto confiable en ensayos repetidos, F(1, 17) = 8.73, pag = .009, η 2 = .34 la interacción entre el tamaño del conjunto y el factor de cambio / repetición también fue confiable, F(1, 17) = 4.83, pag = .04, η 2 = .22. Además, también surgió un efecto de tamaño de conjunto confiable en la condición restringida / de cambio, F(1, 17) = 5.69, pag = .029, η 2 = .25, aunque con una interacción no significativa entre los factores no restringidos / restringidos y el tamaño del conjunto, F(1, 17) = 3.31, pag = .15, η 2 = .06. El efecto de tamaño pequeño del conjunto encontrado en las pruebas de tareas / cambios restringidos fue prácticamente eliminado para las pruebas de tareas / repeticiones restringidas, F(1, 17) = 0.97, pag = .34, η 2 = .05. Por lo tanto, aquí, incluso los participantes con baja MT parecían haber llegado a una etapa de selección / preparación de conjuntos de tareas relativamente independiente de la carga.

La Figura 4 resume los efectos generales del tamaño del conjunto en cada una de las condiciones experimentales. Aparentemente, la familiaridad con la tarea, ya sea debido a repeticiones inmediatas en la condición sin restricciones o debido a la práctica dentro de una sesión (es decir, en la condición restringida), tuvo efectos opuestos dependiendo de la capacidad de WM. En los participantes con alta MT, encontramos el patrón predicho de una reducción de los efectos del tamaño de la serie (aunque no significativamente para las repeticiones inmediatas). Por el contrario, en los participantes con baja WM, los efectos del tamaño de la serie estaban presentes solo después de una exposición previa con un mapeo S-R, ya sea en ensayos de repetición en la condición sin restricciones o en ensayos de cambio en la condición de tarea restringida. Como se explica más detalladamente en la Discusión, este patrón sugiere que la ausencia del efecto de tamaño del conjunto para conjuntos de tareas novedosas (es decir, en la condición sin restricciones / de cambio) no significa necesariamente que los individuos con baja MT tengan menos capacidad de almacenamiento real. Más bien, parecen tener más dificultades para codificar material nuevo en el espacio de almacenamiento existente.

Efecto de tamaño de conjunto agregado (450-1200 mseg) en función de la capacidad de WM alta versus baja, las condiciones de tarea no restringida versus tarea restringida, y el cambio versus la repetición de la prueba. Mientras que para los individuos con alta MT, tanto las repeticiones de prueba a prueba como dentro de la sesión redujeron el efecto del tamaño de la serie para las personas con baja MT, las repeticiones tanto dentro de la prueba como dentro de la sesión llevaron a un aumento en los efectos de tamaño de la serie. Las barras de error indican intervalos de confianza del 95% dentro del sujeto para cada efecto de tamaño de conjunto individual.

Efecto de tamaño de conjunto agregado (450-1200 mseg) en función de la capacidad de WM alta versus baja, las condiciones de tarea no restringida versus tarea restringida, y el cambio versus la repetición de la prueba. Mientras que para los individuos con alta MT, tanto las repeticiones de prueba a prueba como dentro de la sesión redujeron el efecto del tamaño de la serie para las personas con baja MT, las repeticiones tanto dentro de la prueba como dentro de la sesión llevaron a un aumento en los efectos de tamaño de la serie. Las barras de error indican intervalos de confianza del 95% dentro del sujeto para cada efecto de tamaño de conjunto individual.


Autorregulación de los estudiantes de secundaria: las autoevaluaciones son inexactas y no se utilizan lo suficiente para la selección de tareas de aprendizaje

La autoevaluación y la selección de tareas son habilidades de aprendizaje autorreguladas importantes para los estudiantes de secundaria. Más específicamente, la selección de nuevas tareas basadas en autoevaluaciones es muy importante para ellos, porque los profesores no siempre están presentes o no pueden seleccionar tareas para ellos individualmente. Sin embargo, se sabe poco sobre los procesos subyacentes a estas habilidades de aprendizaje autorregulado y, por lo tanto, no existen pautas para la enseñanza de la autoevaluación y la selección de tareas de aprendizaje posteriores. Proponemos un modelo para la selección de tareas de aprendizaje autorregulado (SRLTS) que representa una posible vía para el proceso de selección de tareas y que los estudiantes podrían utilizar como norma al realizar la selección de tareas. El modelo podría ayudar a los estudiantes a decidir qué posibles nuevas tareas podrían ser adecuadas para su nivel de habilidad actual, basándose en autoevaluaciones. El objetivo de este estudio es evaluar en qué medida los estudiantes de secundaria seleccionan tareas de aprendizaje de acuerdo con este modelo y si utilizan autoevaluaciones para este fin. Estudiantes de escuela secundaria (norte = 15) tareas de aprendizaje seleccionadas en el dominio de la genética a partir de una base de datos de tareas estructurada. Las tareas variaron en dificultad y cantidad de apoyo proporcionado (es decir, problemas de finalización frente a problemas tradicionales). Usamos seguimiento ocular, estimaciones de rendimiento, estimaciones de esfuerzo mental, juicios de aprendizaje y preguntas abiertas para obtener más información sobre en qué se enfocan y piensan los estudiantes al seleccionar una tarea. Los resultados sugieren que los estudiantes siguen aproximadamente el modelo SRLTS, pero basan sus decisiones en autoevaluaciones inexactas. Esto implica que los estudiantes podrían beneficiarse de los consejos de autoevaluación y selección de tareas, que podrían proporcionar retroalimentación sobre las autoevaluaciones y estimular a los estudiantes a utilizar la información de la autoevaluación como entrada para la selección de tareas en la forma en que el modelo prescribe para optimizar su aprendizaje.


Introducción

"Oficial de policía A. reflexiona sobre un mensaje de radio entrante: "Durante una llamada de emergencia, se recibe mucha información en poco tiempo. Tal llamada puede incluir el nombre de la tienda, tipo de delito, peligros potenciales, descripciones sospechosas, qué colegas están en el caso, y el plan. mientras tanto, hay que prestar atención a la carretera, asi que a veces no escuchas todo."Su colega comenta sobre las exigencias organizativas impuestas: "En el caso de una patrulla en solitario, tienes que ser mucho más astuto [] pero cometerá muchas infracciones de tráfico.’”

(notas de campo en [1])

Este ejemplo ilustra una situación común en nuestra vida diaria, a saber, que se nos pide que realicemos varias tareas al mismo tiempo. Esta multitarea, sin embargo, a menudo requiere demasiada atención, lo que resulta en un conflicto conocido como interferencia en la tarea [2-5].La forma obvia de hacer frente a la interferencia de tareas es priorizar una tarea sobre las demás [6]. Pero, como muestran los agentes de policía del ejemplo, esta asignación de atención a una tarea se realiza a expensas de otras tareas [7,8]. Recientemente, Salvucci & amp Taatgen sugirieron una posible solución en forma de cambio rápido y continuo entre tareas concurrentes [9]. Con el tiempo, esto dará la impresión de que estas tareas se realizan simultáneamente y, por lo tanto, se informan como multitarea.

En este artículo, afirmamos que el concepto de cambio rápido entre tareas concurrentes necesita una extensión para acomodar otro aspecto del ejemplo con los oficiales de policía, a saber, que parecen tener diferentes preferencias en la priorización de tareas. El primer policía se perdió los mensajes de radio entrantes porque prefirió priorizar la tarea de conducir mientras que el otro policía cometió infracciones de tránsito como resultado de prestar más atención a los mensajes de radio. Esto sugiere que las personas tienen preferencias internas con respecto a la priorización de tareas. El papel de la preferencia en la priorización de tareas ha recibido una atención limitada. Por lo general, se asume que la priorización de tareas se puede obtener mediante una instrucción de prioridad externa sobre la importancia relativa de cada tarea [4,10]. Sin embargo, las personas no siempre pueden o no están dispuestas a seguir instrucciones prioritarias [11-14]. Cnossen y col. argumentan que los juicios sobre las disminuciones del desempeño deben basarse en cómo las personas deciden priorizar entre tareas, en lugar de lo que se les instruye que hagan [15]. Para comprender lo que realmente sucedió en estos estudios, primero necesitamos saber si existen preferencias y si pueden tener un impacto en la efectividad de las instrucciones de prioridad de tareas. La pregunta entonces es: ¿existe la posibilidad de que cuando las personas reciben instrucciones de priorizar una tarea sobre otra, pero de hecho prefieren realizar la otra tarea, actúen de acuerdo con sus preferencias?

El objetivo del presente estudio es dar respuesta a estas preguntas mediante la realización de una serie de experimentos en los que los participantes debían realizar dos tareas concurrentes. El primer paso es verificar si las personas tienen preferencias (Experimento 1). El segundo paso es centrarse en las posibles interacciones entre las preferencias y las instrucciones (Experimentos 2 y 3). Los hallazgos de este estudio cuasi-experimental requirieron una exploración teórica. Por lo tanto, como tercer paso, ampliamos la Teoría de la cognición roscada de Salvucci & amp Taatgen [9] con la Teoría del control compensatorio de Hockey [16, 17] como una representación de los modelos cognitivo-energéticos en el desempeño de tareas. Pero primero, presentamos los mecanismos de interferencia de tareas y priorización de tareas como predice la Teoría de Cognición de Hilos.


Materiales y métodos

Participantes

Un total de 486 personas participaron en este estudio. Los participantes mayores fueron reclutados del departamento de ortopedia del Hospital Somma Lombardo y de diferentes grupos sociales para personas mayores. Los participantes más jóvenes fueron reclutados entre los familiares de las personas mayores. Los criterios de inclusión fueron: ninguna enfermedad neurológica o psiquiátrica conocida, ninguna discapacidad visual o auditiva no corregida y una puntuación en el Mini-Examen del Estado Mental por encima del límite específico de la edad. Los participantes fueron evaluados en el Hospital Somma Lombardo o en sus grupos sociales, en Lombardía, Italia. Los participantes fueron evaluados individualmente por un psicólogo clínico experimentado en una habitación tranquila, libre de distracciones, ya sea por la mañana o por la tarde.

Procedimiento

Cada participante completó la evaluación de doble tarea. Esto consistió en realizar tareas de recuperación y seguimiento de dígitos por separado y luego simultáneamente. Esta evaluación de doble tarea, el material de prueba relevante y las instrucciones completas para su administración y puntuación se pueden encontrar en www.psy.ed.ac.uk/people/sdsala/tests/sdsdualtask/.

Antes de comenzar la tarea de recuperación de dígitos, se estableció el intervalo de dígitos de cada individuo. Los participantes escucharon una lista de dígitos a una velocidad de uno por segundo. Luego se les pidió que repitieran estos dígitos en el mismo orden en que los escucharon. La longitud de la secuencia inicial era de dos dígitos y se presentó a los participantes seis secuencias en cada longitud de secuencia. Si cinco de las seis secuencias se recuperaron correctamente, la secuencia de dígitos se alargó en un dígito. Una vez que los participantes ya no pudieron recordar cinco de las secuencias de seis dígitos, se tomó el intervalo de dígitos como la longitud máxima a la que el participante pudo recordar cinco de las secuencias de seis dígitos correctamente. A continuación, los participantes escucharon una serie de secuencias, en una longitud de tramo individual, para recordarlo oralmente de forma inmediata ordenada en serie durante un período de 90 s. El número de listas que cada participante escuchó y recordó durante el período de 90 s varió dependiendo de su rango de dígitos y, por lo tanto, la medida de rendimiento fue la proporción de dígitos recordados correctamente en la posición de serie correcta.

La tarea de seguimiento consistió en utilizar un lápiz para trazar una línea a través de círculos dispuestos en un camino alrededor de una hoja de papel A3. Los participantes recibieron una versión abreviada para una prueba de práctica, con solo 17 círculos, para asegurarse de que entendían las demandas de la tarea. Después de esto, al participante se le presentó la versión completa que comprende 319 círculos y se le pidió que comenzara en un extremo del camino y dibujara una línea a través de cada círculo sucesivo lo más rápido posible durante un período de 90 s. La medida de rendimiento fue el número de círculos cruzados dentro del tiempo asignado.

Fiabilidad

Para examinar la confiabilidad prueba-reprueba de la nueva evaluación de doble tarea, una muestra más pequeña de participantes, representativa del grupo más grande, completó la evaluación por segunda vez. Todos los participantes que aceptaron volver a someterse a la prueba dentro del intervalo propuesto se incluyeron en este análisis de confiabilidad. El tiempo entre la primera y la segunda evaluación osciló entre 1 hora y 1 día, según la disponibilidad del participante. Esto consistió en 176 participantes sanos, de entre 18 y 88 años (media = 51,86, Dakota del Sur = 21,25) y un rango de educación de 2 a 21 años (media = 10,48, Dakota del Sur = 4.88).


¿Cómo funcionan las evaluaciones de desempeño?

El educador establece una tarea para la que hay más de una ruta para completar o un problema complejo que abordar con un considerable margen de interpretación.

Los estudiantes deben llegar a una respuesta, pero la respuesta no es la parte más importante. Más bien, el viaje es el destino. Los estudiantes deben demostrar competencias en producción, comunicación y aplicación de sus conocimientos de contenido.

La forma más eficaz de medir esto es asignando una lista de tareas de desempeño, junto con un nivel de logro para cada una. Esta lista debe ser razonablemente completa y la puntuación de cada tarea debe realizarse en una escala.

Estas tareas pueden reflejar las mejores prácticas de la industria. Por ejemplo, en una evaluación del rendimiento de las ciencias de la computación, una tarea podría ser "¿El candidato documentó su código de manera efectiva?" Esa tarea podría medirse en una calificación de "no lograda", "parcialmente lograda" o "totalmente lograda". Una tarea de proyecto de arte o video podría ser "¿El alumno reunió los requisitos correctamente?" A continuación, se pueden calcular las puntuaciones finales a partir de esta lista.

La clave para la evaluación del desempeño es que los estudiantes desarrollen cómo enfocan sus tareas mientras comprenden los estándares con los que serán evaluados.


Ver el vídeo: LAS MEJORES APPS DE TAREAS 2020 como ser MAS PRODUCTIVO con 8 APPS de gestion de tareas (Junio 2022).