Terapia psicológica
Sociedad Chilena de Psicología Clínica
sochpscl@entelchile.net
ISSN (Versión impresa): 0716-6184
CHILE
2004
René Gempp Fuentealba / Cecilia Avendaño Bravo / Catherine Muñoz Urrutia
NORMAS Y PUNTO DE CORTE PARA LA ESCALA DE DEPRESIÓN DEL CENTRO
PARA ESTUDIOS EPIDEMIOLÓGICOS (CES-D) EN POBLACIÓN JUVENIL
CHILENA
Terapia psicológica,
noviembre, año/vol. 22, número 002
Sociedad Chilena de Psicología Clínica
Santiago, Chile
pp. 145-156
Red de Revistas Científicas de América Latina y el Caribe, España y Portugal
Universidad Autónoma del Estado de México
http://redalyc.uaemex.mx
Copyright 2004 by Sociedad Chilena de Psicología Clínica
ISSN 0716-6184
Normas y punto de corte para la Escala de Depresión del Centro para
Estudios Epidemiológicos (CES-D) en población juvenil chilena
Norms and cutoff point for The Center for Epidemiologic Studies Depression Scale
(CES-D) in Chilean youthful population
(Rec: 25 - octubre - 2004 Acep: 25 - noviembre - 2004)
Se establecen normas juveniles y punto de corte para la adaptación chilena de la Escala de Depresión del Centro para
Estudios Epidemiológicos (CES-D). Se confeccionaron normas diferenciadas por género, sobre una muestra de 1143
jóvenes sin patología depresiva ni trastornos psicológicos. El punto de corte se calculó contrastando las respuestas de
la muestra normal con una muestra clínica (n = 44), mediante Curvas ROC. Los resultados indican que el punto de
corte convencional (16 puntos) es suficientemente sensible pero poco específico. En su lugar, un valor de corte de 24
puntos permite maximizar simultáneamente la sensibilidad (98%) y la especificidad (79%) de la CES-D. Se comentan
los antecedentes de la adaptación de la escala, se discuten los resultados y se entregan sugerencias para su uso como
instrumento de screening.
Palabras clave: CES-D, normas, sensibilidad, especificidad, Curvas ROC.
In the present report, we establish the criteria for young people on the Chilean adaptation of the Depression Scale from the
Center for Epidemiological Studies (CES-D). The criteria by sex on a sample of 1143 young Chileans is presented. The
cut point was calculated contrasting normal and clinical responses to the scale (n = 44) with ROC curves. The results
show that the conventional cut point of 16 is sensible but unspecific. Instead, a cut point of 24, allows to maximize
sensitivity (98%) and specificity (79%) of the CES-D). The adaptation process is described and some suggestions on its
screening properties are discussed.
Key words: CES-D, criteria, sensibility, specificity, ROC Curves.
* Correspondencia relativa a este artículo puede ser enviada a: René
Gempp, Casilla 567, Temuco, Chile, o a las direcciones electrónicas
r
gempp@sigmas.cl o r
gempp@umayor
.cl. Una copia de la Escala CES-
D en formato PDF puede obtenerse escribiendo al primer autor
La Escala de Depresión del Centro para Estudios
Epidemiológicos (Center for Epidemiologic Studies
Depression Scale [CES-D]) es un autorreporte de 20 ítems
desarrollado originalmente por el Centro para Estudios
Epidemiológicos de Estados Unidos, a través del
Community Mental Health Assessment (Radloff, 1977), con
el propósito de contar con una medida breve, confiable y
válida para apoyar la planificación de programas de salud
mental y el estudio epidemiológico de los factores de ries-
go asociados con la depresión (Radloff & Locke, 1986).
La escala fue derivada a partir de otras medidas de depre-
sión previamente validadas, específicamente el Inventario
de Depresión de Beck [BDI] (Beck, Ward, Mendelson,
Mock y Erbaugh, 1961), la Escala de Depresión de Zung
(Zung, 1965) partes del Inventario de Personalidad
Multifásico de Minnesota [MMPI] (Dahlstrom y Welsh,
1960), la Escala de Autorreporte de Depresión de Raskin
(Raskin, Schulterbrandt, Reatig y McKeon, 1969) y la Lis-
ta de Síntomas de Gardner (Gardner, 1968). A partir de
estos instrumentos se seleccionaron aquellos ítems que re-
presentaban los síntomas más relevantes del trastorno de-
presivo: afecto distímico, sentimientos de culpa, desespe-
ranza y desamparo, afecto positivo disminuido, retardo
psicomotor, pérdida de apetito y problemas de sueño
(Radloff, 1977), con un ligero énfasis en los síntomas
afectivos (Breithaupt & Zumbo, 2002).
Desde su creación, la CES-D se ha transformado en
una de las medidas breves de depresión más utilizadas en
el mundo (Fechner-Bates, Coyne & Schwenk, 1994;
Furukawa, Anraku, Hiroe, Takahashi & Iida, 1997) y, se-
gún Furukawa, Hirai, Kitamura & Takahashi (1997), goza
de una popularidad comparable al BDI (Beck et al., 1961).
Ha sido traducida y adaptada a varios idiomas, entre ellos
el alemán, castellano, ruso, francés, japonés, italiano, len-
guajes indígenas americanos, cantones y mandarín
(Breithaupt & Zumbo, 2002), y ha acumulado evidencia a
favor de su aplicabilidad en distintos grupos nacionales y
étnicos (e.g. Noh, Avison & Kaspar, 1992; Roberts, Vernon
& Rhoades, 1989). Al mismo tiempo, sus propiedades
TERAPIA PSICOLÓGICA
2004, Vol.22, Nº 2, 145-156
René Gempp Fuentealba
Facultad de Psicología, Universidad Mayor, Chile
Cecilia Avendaño Bravo
Facultad de Psicología, Universidad Mayor, Chile
Catherine Muñoz Urrutia
Facultad de Psicología, Universidad Mayor, Chile
146
GEMPP, AVENDAÑO Y MUÑOZ
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
psicométricas han resultado estables a través de las distin-
tas adaptaciones transculturales (e.g. Guarnaccia, Angel
& Worobey, 1989; Mastern, Caldwell-Colbert, Alcalá &
Mijares, 1986; Moscicki, Locke, Rae & Boyd, 1989;
Narrow, Rae, Mosciki, Locke & Regier, 1990; Roberts,
1980; Stroup-Benham, Lawrence & Treviño, 1992), como
también en variados rangos de edad (Radloff, 1977;
Radloff & Teri, 1986).
Los diferentes estudios internacionales realizados has-
ta la fecha reportan índices de confiabilidad en torno a a =
.85 en población general y a = .90 en muestras clínicas, al
tiempo que se ha acumulado una amplia evidencia sobre la
validez concurrente de la escala respecto del diagnóstico
clínico de depresión (e.g. Radloff & Teri, 1986) y de otras
medidas de tamizaje. Por ejemplo, Roberts, Lewinsohn &
Seeley (1991) encontraron un r = .70 entre las puntuacio-
nes totales de la CES-D y del BDI en una muestra de estu-
diantes secundarios, mientras que en dos investigaciones
con estudiantes universitarios (Joseph, Lewis & Olsen,
1996; Santor, Zuroff, Ramsay, Cervantes & Palacios, 1995)
se observaron correlaciones de r = .82 y r = .86, respecti-
vamente, entre ambas escalas. Santor et al. (1995) también
reportan una correlación de r = .87 entre los dos instru-
mentos, al ser aplicados en una muestra de pacientes con
diagnóstico clínico de depresión.
En relación con la estructura factorial de la CES-D, la
mayoría de los estudios coinciden con el resultado original
de Radloff (1977) al identificar una estructura compleja de
cuatro factores interrelacionados: afecto depresivo aumen-
tado, afecto positivo disminuido, actividad somática alte-
rada, problemas interpersonales (e.g. Dumenci & Windle,
1996; Hertzog, Van Alstine, Usala, Hultsch & Dixon., 1990;
Noh et al., 1992; Pretorius, 1991; Roberts, Andrews,
Lewinsohn & Hops, 1990; Zich, Attkinson & Greenfield,
1990), o pequeñas desviaciones de ella, en muestras no
caucásicas. Por ejemplo, Gaurnaccia, Angel & Worobey
(1989), trabajando con una muestra de hispano-norteame-
ricanos y Kuo (1984) con una muestra de chino-norteame-
ricanos, encontraron que una estructura de tres factores re-
flejaba mejor el patrón de respuestas de los sujetos. En
ambos casos, el factor de actividad somática alterada era
indistinguible del factor de afectividad depresiva. A pesar
de estas eventuales variaciones en la estructura factorial de
primer orden, los estudios muestran consistentemente que
un factor de depresión de segundo orden subyace a los fac-
tores primarios identificados anteriormente y que la estruc-
tura propuesta por Radloff (1977) es la que mejor describe
la dimensionalidad de la escala (Sheehan, Fifield, Reisine
& Tennen, 1995; Skorikov & Vandervoort, 2003).
El cúmulo de investigaciones realizadas a través de
los años ha confirmado la capacidad de la CES-D para
evaluar de manera confiable y válida el nivel actual de
sintomatología depresiva, tanto en población general
como en grupos clínicos. Estos resultados han permiti-
do abrir nuevos campos de aplicación de la escala, más
allá de la investigación epidemiológica, entre los cuales
se destaca su uso como instrumento de screening de de-
presión en el ámbito médico general (e. g. Coine,
Fechner-Bates & Schwenk, 1994; Lyness, Noel, Cox,
King, Conwell & Caine, 1997; Parikh, Eden, Price &
Robinson, 1988; Schulberg, Saul, McClelland, Ganguli,
Christy & Frank, 1985; Turk & Okifuji, 1994; Zich et
al., 1990), así como en el contexto psiquiátrico (e. g.
Craig & Van Natta, 1976, 1979; Faulstich, Carey,
Ruggiero, Enyart & Gresham, 1986; Hughes, De Mallie
& Blazer, 1993; Husaini, Neff, Harringtong, Hughes &
Stone, 1980; Roberts et al., 1989, 1990, 1991; Shrout &
Yager, 1989; Weissman & Locke, 1975; Weissman,
Sholomkas, Pottenger, Prusoff & Locke, 1977) y psico-
lógico (e.g. Roberts & Vernon, 1983; Roberts et al., 1990;
Zimmerman & Coryel, 1994; Lewinsohn, Seely, Roberts
& Allen, 1997).
La CES-D presenta varias características que la hacen
atractiva para esta finalidad. En primer lugar, se trata de
un autorreporte breve, fácil de contestar y de corregir, cuyo
uso requiere un mínimo de entrenamiento. En segundo
lugar, la CES-D puede administrase en una entrevista o
puede responderse por el paciente en forma autónoma. Por
último, el formato de la escala permite su aplicación tanto
individual como colectiva.
Adicionalmente, la CES-D ofrece algunas ventajas com-
parativas sobre el BDI como medida de screening de de-
presión en población no clínica. En primer lugar, el BDI
fue desarrollado inicialmente para medir la gravedad de la
depresión en pacientes deprimidos con diagnóstico clínico
(Beck y Steer, 1993; Beck et al., 1961), mientras que la
CES-D fue concebida explícitamente como una medida de
exploración para población no clínica, dirigida a detectar
casos en alto riesgo de presentar depresión (Radloff, 1977).
Análisis psicométricos basados en Teoría de Respuesta al
Item (Santor et al., 1995) confirman empíricamente esta
diferencia y sugieren que la CES-D supera al BDI en la
detección de diferencias individuales en afectividad depre-
siva en población no clínica. Otra ventaja es que la CES-D
enfatiza el componente afectivo de la depresión, cuya vali-
dez diagnóstica es universalmente reconocida (Radloff,
1977, 1991), mientras el BDI tiene un acentuado énfasis
cognitivo (Beck et al., 1961), consistente con el modelo
teórico propuesto por su autor (Beck et al., 1979). Como
consecuencia, la CES-D es un inventario de síntomas ge-
néricos sin un anclaje teórico específico. Por último, el
formato de respuesta de ambas escalas también favorece a
la CES-D: mientras que el BDI solicita al respondiente gra-
duar la intensidad o gravedad de los síntomas reportados,
la CES-D solicita una estimación cuantitativa de la frecuen-
cia con que los síntomas se presentaron durante la semana
recién pasada, lo que permite objetivar aún más la respues-
ta de la persona (Hamilton, 1970).
NORMAS Y PUNTO DE CORTE PARA LA ESCALAL DE DEPRESIÓN DEL CENTRO PARA ESTUDIOS...
147
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
Considerando estos antecedentes, Gempp (2003) pro-
puso recientemente una adaptación chilena de la CES-D
para su uso con población juvenil, primariamente con fi-
nes de investigación. El análisis de los ítems (Gempp,
Olea & Abad, 2004) se realizó sobre una muestra de 1143
jóvenes de entre 15 y 35 años (M = 20.56), sin patología
depresiva ni tratamiento psicológico o psiquiátrico actual.
Los análisis realizados a partir de la teoría clásica de los
tests indicaron buena capacidad discriminativa de los
ítems y de las opciones de respuesta, con coeficientes de
correlación ítem-test corregidos en el rango de r = .22 a r
= .71. La confiabilidad de la escala completa, calculada
sobre la totalidad de la muestra mediante el coeficiente
de consistencia interna alfa de Cronbach, fue de a = .87.
Respecto a la unidimensionalidad de la CES-D, las car-
gas factoriales en el primer componente sin rotar fluctua-
ron entre .26 y .78 (Mdn=.48), con el primer componente
explicando un 31% de la varianza total. Un análisis con
estimación de máxima verosimilitud robusta (Bentler,
1992) arrojó índices de ajuste aceptables para un modelo
unifactorial de segundo orden (S-Bc
2
= 465.65; gl = 162;
S-Bc
2
/gl = 2.87; NNFI = .92; AGFI = .93; RMSEA = .05),
lo que confirmó en general la unidimensionalidad de la
escala y su validez de constructo en la muestra. Análisis
comparativos con una muestra clínica (validez concurren-
te) indicaron que la CES-D era capaz de discriminar de
manera sensible entre sujetos normales y pacientes de-
presivos. Otros análisis (Gempp et al., 2004) aplicaron
modelos politómicos de Teoría de Respuesta al Item,
específicamente el Modelo de Respuesta Nominal (Bock,
1972) y el Modelo de Respuesta Graduada (Samejima,
1969), para examinar el orden de las alternativas de res-
puesta, establecer un criterio óptimo de puntuación de las
alternativas y seleccionar aquellos ítems máximamente
informativos. Esta evidencia, considerada en su conjun-
to, permitió concluir que la CES-D era una medida
confiable y válida para la evaluación de depresión en po-
blación juvenil chilena y recomendar su uso para tales
fines, ya sea con fines de investigación epidemiológica o
como instrumento de screening.
Para servir a este último propósito, una escala debe con-
tar con criterios para (a) evaluar la gravedad de la
sintomatología y, más importante aún, (b) realizar una cla-
sificación diagnóstica de las personas que responden el
instrumento. El criterio más utilizado para estimar la gra-
vedad de los síntomas es el uso de normas relativas: con-
trastar la puntuación bruta de un sujeto con el promedio de
su grupo de referencia, a través de su ubicación relativa en
una distribución normal ideal. Este criterio se
operacionaliza habitualmente mediante puntuaciones
estandarizadas derivadas (e.g. puntuaciones T o Estaninos,
entre otros), que permiten al usuario cuantificar la grave-
dad de los síntomas (qué tan depresivo está el paciente en
relación con el promedio de la población), pero no discri-
minar si un sujeto pertenece a una categoría diagnóstica
discreta (e.g. “depresivo" versus “no depresivo").
Esta segunda tarea, que pertenece al dominio de la
clasificación diagnóstica, requiere determinar un punto
de corte en las puntuaciones brutas para diferenciar en-
tre quienes sufren el trastorno y quienes no lo hacen.
Para ello existen al menos dos aproximaciones: una in-
terna y otra externa al instrumento. La primera aproxi-
mación supone que el atributo evaluado se distribuye
normalmente en la población y, por tanto, emplea como
punto de corte el valor correspondiente a dos desviacio-
nes estándar por sobre la media de la muestra (e.g. la
puntuación equivalente a T = 70), o algún procedimien-
to equivalente basado en percentiles (e.g. el cuartil su-
perior de la distribución). La aproximación externa exi-
ge contar con un criterio dicotómico a manera de estándar
(e.g. un diagnóstico clínico que diferencie entre sujetos
depresivos y normales), con el cual contrastar los resul-
tados obtenidos en el instrumento.
En el caso de la CES-D, el punto de corte original de
la escala (16 puntos) fue establecido por Radloff (1977)
basándose en el límite inferior del quintil superior de pun-
tuaciones de la población general (Comstock & Helsing,
1976), y luego validado mediante una muestra de 70 pa-
cientes norteamericanos caucásicos con diagnóstico clí-
nico de depresión. Aunque la propia autora (Radloff, 1977)
reconoció que se trataba de un procedimiento relativa-
mente arbitrario para establecer un punto de corte, y pese
a las críticas que se han formulado a la metodología utili-
zada para obtenerlo y a los resultados empíricos que cues-
tionan su validez, el criterio de 16 puntos se ha seguido
utilizando rutinariamente hasta el presente.
Las críticas metodológicas (e.g. Furukawa et al.,
1997) señalan que el procedimiento para establecer el
punto de corte convencional (como cualquier técnica
basada en un criterio interno) es vulnerable al efecto de
las tasas base del trastorno depresivo en la población y
no cuantifica la sensibilidad y especificidad del diag-
nóstico. Explicado simplemente, la sensibilidad de la
prueba se refiere a la capacidad de la CES-D para iden-
tificar como depresivos a aquellos sujetos que efectiva-
mente tienen depresión, mientras que la especificidad
corresponde a la capacidad de la CES-D para identificar
como no depresivos a aquellos sujetos que verdadera-
mente no tienen depresión. Como puede deducirse fá-
cilmente, una prueba puede ser muy sensible pero poco
específica, esto es, identificar correctamente a los pa-
cientes con el trastorno, pero sobrediagnosticar. Por ello
es necesario localizar un punto de corte que maximice
simultáneamente ambos criterios. En el caso de una es-
cala unidimensional y válida, cuyas puntuaciones bru-
tas se relacionen de manera monotónicamente creciente
con el nivel de constructo, es probable que un punto de
corte muy bajo sea muy sensible pero poco específico
148
GEMPP, AVENDAÑO Y MUÑOZ
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
(e.g. identifique a la mayoría de los casos como depresi-
vos, sin distinguir entre quienes tienen y no tienen de-
presión). Al mismo tiempo, un punto de corte muy alto
aumentará la especificidad pero disminuirá la sensibili-
dad: sólo los sujetos con niveles muy elevados de de-
presión serán identificados como depresivos, corriéndose
el riesgo de no diagnosticar a quienes presentan una de-
presión moderada o leve.
Un método estadístico apropiado para evaluar la efi-
cacia de una prueba diagnóstica y localizar puntos de corte
que optimicen conjuntamente la sensibilidad y especifi-
cidad del diagnóstico, es el análisis basado en Curvas de
Características Operantes del Receptor (Swets, 1988), de-
nominado análisis ROC por sus iniciales en inglés
[Receiver Operating Characteristics]. El análisis ROC se
originó en la Teoría de Detección de Señales, durante la
Segunda Guerra Mundial, y desde entonces se ha disemi-
nado velozmente en diversas áreas de la medicina clínica
por su utilidad para evaluar pruebas diagnósticas. En psi-
quiatría fue introducido a fines de la década de 1980 (e.g.
Mari & Williams, 1985; Mossman & Somoza, 1989;
Murphy, Berwick, Weinstein, Borus, Budman & Klerman,
1987) hasta convertirse en una técnica ampliamente utili-
zada en el presente. Consiste básicamente en contrastar
el resultado de la prueba contra un criterio estándar (ha-
bitualmente un diagnóstico clínico), y evaluar la sensibi-
lidad y especificidad que alcanzaría el test con distintos
puntos de corte. Formalmente, la sensibilidad se
operacionaliza como la probabilidad de identificar correc-
tamente un caso con el trastorno, mientras que la especi-
ficidad se expresa como la probabilidad de no detectar
como caso clínico a quienes efectivamente no padecen el
trastorno. Una revisión relativamente exhaustiva de la
metodología ROC aplicada al análisis clínico puede en-
contrarse en Swets & Pickett (1982).
Otro grupo de críticas al punto de corte tradicional
de la CES-D proviene de diversos estudios que analizan
empíricamente la eficiencia del punto de corte tradicio-
nal y/o exploran puntos de corte alternativos para la es-
cala (e.g. Katz, Stephen, Shaw, Matthew, Newman &
Rosenbluth, 1995; Myers & Weissman, 1980; Parikh,
Eden, Price & Robinson, 1988; Weissman et al., 1977).
La mayoría de estas investigaciones recomienda el uso
de puntos de corte superiores a 16 puntos. Por ejemplo,
utilizando metodología ROC, Somervell, Beals, Kinzie,
Boehnlein, Leung & Manson (1993) aconsejan un pun-
to de 27/28 para maximizar la sensibilidad y especifici-
dad en indígenas norteamericanos; Roberts et al. (1991)
sugieren un valor de 23/24 para estudiantes secundarios
norteamericanos; Cho, Mosciki, Narrow, Rae, Locke &
Regier (1993) proponen puntuaciones de 25/26 en puer-
torriqueños; y otro par de estudios (Schulberg, Saul,
McClelland, Ganguli, Christy & Frank, 1985; Zich et al.,
1990) recomienda valores de 26/27 para consultantes en
servicios de atención primaria, entre otros.
A partir de estos antecedentes, y para contribuir al uso
de la CES-D como medida de screening en población ju-
venil chilena, el presente trabajo se propuso (a) elaborar
normas relativas para la CES-D, (b) evaluar la sensibilidad
y especificidad del punto de corte tradicional [16 puntos]
en población chilena, y (c) explorar un punto de corte ópti-
mo para diferenciar entre sujetos normales y depresivos,
intentando maximizar simultáneamente la sensibilidad y
la especificidad de la escala. A estos dos objetivos aplica-
dos, se agrega un objetivo metodológico: ilustrar el uso de
análisis ROC para evaluar y fijar puntos de corte en instru-
mentos de screening.
Método
Participantes y procedimiento
Muestra normativa
Para el cálculo de las normas, se utilizó la misma
muestra utilizada previamente en los análisis
psicométricos. Se definió como población objetivo a
jóvenes de ambos sexos, sin trastornos psiquiátricos, en
el rango de edad entre 15 y 35 años. Desde esta pobla-
ción, se extrajo una muestra no probabilística por cuo-
tas de 1169 sujetos, de la cual se eliminaron todos los
casos en que hubiera una o más alternativas sin respon-
der (26 protocolos), obteniéndose una muestra definiti-
va de 1143 jóvenes de ambos sexos (45.7% de hombres
y 54.3% de mujeres), con una edad media de 20.56 años
(SD = 4.45). El cuartil inferior, mediana y cuartil supe-
rior de la edad fueron, respectivamente, C
i
= 17, Mdn =
20 y C
s
= 23.
En forma adicional, se estableció como criterio de in-
clusión en esta muestra el no presentar patología depresi-
va (diagnosticada por un especialista de la salud mental),
ni estar en tratamiento psicológico o psiquiátrico.
Los participantes fueron muestreados en universidades,
institutos de formación técnico-profesional, liceos y cole-
gios de la ciudad de Temuco. En general, el instrumento
fue aplicado durante las clases, previa autorización de los
profesores respectivos. Las instrucciones fueron entrega-
das verbalmente, informándose a los participantes del ca-
rácter anónimo y voluntario de su colaboración.
Aunque la totalidad de los participantes proviene de la
zona sur del país, lo cual constituye una limitación de la
muestra y restringe en principio la generalización de los
resultados, cabe observar que no existen antecedentes pre-
vios que justifiquen el uso de normas diferenciales por re-
gión para instrumentos de tamizaje psicopatológico. Toda-
NORMAS Y PUNTO DE CORTE PARA LA ESCALAL DE DEPRESIÓN DEL CENTRO PARA ESTUDIOS...
149
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
vía más, resultados aún no publicados obtenidos por los
autores de este trabajo en la adaptación del Inventario de
Síntomas de Derogatis, Revisado (Derogatis Symptoms
Check List, Revised [SCL-90-R]; Derogatis, 1994), no evi-
dencian diferencias sustantivas (h
2
= .02) en los niveles de
sintomatología depresiva reportada por jóvenes de la zona
norte (Antofagasta; n = 236), centro (Santiago; n = 232) y
sur del país (Temuco; n = 250). Otros pormenores de la
selección y eventuales limitaciones de la muestra son dis-
cutidas por Gempp et al. (2004).
Muestra clínica
Con la finalidad de contrastar los casos normales y
fijar un punto de corte, se recolectó una muestra clínica,
no aleatoria, definida como aquellos pacientes diagnos-
ticados con depresión (a lo menos desde un mes a la
fecha) y que no hubieran comenzado tratamiento en el
momento de la evaluación. Se muestrearon pacientes
desde la población de consultantes espontáneos por pro-
blemas de salud mental en el sistema de salud pública
de la ciudad de Temuco. Fueron excluidos aquellos pa-
cientes con episodios anteriores de depresión y con
comorbilidad somática o mental. Mediante la aplicación
rigurosa de estos criterios fue posible obtener una mues-
tra final de 44 pacientes (40.9% hombres y 59.1% muje-
res), con edades entre 20 y 35 años (M = 29.36, SD =
4.08), todos los cuales respondieron la escala volunta-
riamente como parte de la batería diagnóstica aplicada
en el servicio respectivo. El diagnóstico, en todos los
casos, fue realizado en una entrevista psiquiátrica o psi-
cológica especializada. Aunque se trata de una muestra
pequeña, cabe recordar que la muestra clínica utilizada
originalmente por Radloff (1977) para validar su punto
de corte fue de sólo 70 pacientes, cuyas puntuaciones
fueron contrastadas con una muestra no clínica de 2514
sujetos. De esta manera, la razón entre los casos clíni-
cos y normales fue de un 2.7%, mientras que en el pre-
sente trabajo es de un 3.8%
Instrumento
Como ya se comentó, la CES-D consta de 20 ítems que
representan los síntomas más habituales y representativos
del trastorno depresivo. Algunos ejemplos de items son el
3 (“Sentí que no podía dejar de estar triste, incluso con la
ayuda de mi familia o amigos"), el 7 (“Sentí que todo lo
que hacía era un esfuerzo") o el 14 (“Me sentí solo"). Las
instrucciones solicitan indicar la frecuencia con la que se
experimentó cada síntoma “Durante la semana pasada",
utilizando una escala de cuatro alternativas acotadas por
las indicaciones: “Rara vez o ninguna vez (1 día o menos)",
“Alguna vez o unas pocas veces (1 a 2 días)", “Ocasio-
nalmente o varias veces (3 a 4 días)" y “La mayor parte
del tiempo (5 a 7 días)". Hamilton (1970) ha discutido
exhaustivamente el uso del anclaje “una semana" como
referente temporal en instrumentos de autoevaluación
sintomática. El supuesto subyacente es que los siete días
más recientes en la vida de un individuo
usualmente contienen la información más relevante sobre
su estado clínico actual. Debido a ello, este formato de
instrucciones resulta altamente recomendable para
inventarios sintomatológicos (Derogatis, 1994).
Cuatro de los 20 ítems (el 4, 8, 12 y 16) son presenta-
dos de manera positiva, por lo cual es necesario invertirlos
en el proceso de corrección. Aunque se han propuesto
varios métodos de puntuación para los ítems (e.g. Breithaupt
& Zumbo, 2002), tradicionalmente las alternativas son
puntuadas desde 0 a 3 puntos; a mayor puntuación, mayor
frecuencia de ocurrencia. La puntuación total se calcula
como la sumatoria simple de los ítems, pudiendo variar
entre 0 a 60 puntos; a mayor puntuación, mayor nivel ac-
tual de depresión (Radloff, 1977).
La traducción del original se realizó considerando
las recomendaciones vigentes para la adaptación
transcultural de instrumentos psicométricos (e.g.
Hambleton, 2001; Tanzer & Sim, 1999; van de Vijver &
Hambleton,1996). En primer lugar, la traducción de la
escala fue realizada utilizando el enfoque de comité y
aplicando “descentramiento" (Brislin, 1986), de mane-
ra que los ítems recogieran el sentido original de la fra-
se en inglés más que su traducción literal, considerando
además su pertinencia al contexto cultural chileno. La
versión obtenida por el comité fue sometida a revisión
por traductores profesionales, hablantes nativos de in-
glés, quienes trabajaron en forma independiente entre
sí. Por último, estas revisiones fueron analizadas por el
autor y un equipo de dos psicólogos bilingües, contras-
tándolas con versiones en castellano elaboradas en otros
países hispanoamericanos. La versión obtenida fue so-
metida a un pilotaje con un grupo de 22 estudiantes de
un curso de pregrado de metodología, sin que aparecie-
ra la necesidad de hacer cambios.
Resultados
Propiedades psicométricas de la escala
Se analizaron las propiedades psicométricas de los ítems
en la muestra normal. Los resultados, que se presentan en
la Tabla 1, han sido reportados previamente por Gempp et
al. (2004).
150
GEMPP, AVENDAÑO Y MUÑOZ
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
En primera instancia, se puede ver que los ítems con
menor y mayor promedio son el 9 (“Pensé que mi vida
había sido un fracaso") y el 5 (“Tuve dificultades para
concentrarme en lo que estaba haciendo"), con medias M
= 0.50 y M = 1.32, respectivamente. En general, los ítems
obtuvieron promedios de adhesión en torno a la primera y
segunda alternativas, mostrando que los síntomas inclui-
dos en la CES-D tienen una baja prevalencia en la muestra.
No obstante, las desviaciones estándar y la frecuencia de
elección de cada opción muestran que los ítems difieren
bastante entre sí respecto al grado de preferencia de las
alternativas superiores. Así, en los ítems 1 y 2 muy pocos
sujetos escogen la tercera alternativa, mientras en el ítem
11 esta proporción aumenta sustancialmente.
Los coeficientes de correlación ítem-total corregidos
se encuentran en el rango de r = .22 a r = .71, para los ítems
2 (“Sentí pocas ganas de comer; tuve mal apetito") y 6
(“Me sentí deprimido") respectivamente. Es interesante
que este último ítem muestre una correlación ítem- total
corregida tan alta, en especial si atendemos a que es el úni-
co de la escala que interroga directamente a los sujetos so-
bre sentimientos depresivos propiamente tales.
Globalmente, los ítems muestran índices de discriminación
bastante heterogéneos, aunque todos en un nivel acepta-
ble. La confiabilidad de la escala total, calculada en toda
la muestra a través del coeficiente de consistencia interna
alfa de Cronbach, alcanza un valor a = .87.
Cálculo de puntuaciones normativas
El promedio y la desviación típica de la puntuación total
de la CES-D corresponden a M = 16.75 y SD = 10.00, obser-
vándose un valor mínimo de 0 puntos y un máximo de 54
puntos, con una moda Mo = 11. La distribución de las pun-
tuaciones exhibe una ligera asimetría positiva (As = 0.83) y
un leve apuntamiento (Cu = 0.23), situándose los cuartiles
inferior, superior y mediana en C
i
= 9, Mdn = 15 y C
s
= 23
puntos, respectivamente. La desviación de la normalidad re-
sulta significativa según la prueba Kolmogorov-Smirnov (D
= .10, p < .001). En conjunto, estos resultados difieren de los
obtenidos por Radloff (1977) en sus tres muestras normativas
(N
1
= 2514, N
2
= 1060, N
3
= 1422), en las cuales se observa-
ron promedios M = 9.25 (SD = 8.58), M = 8.17 (SD = 8.23) y
M = 7.94 (SD = 7.53), y asimetrías de As = 1.5, As = 1.69 y As
= 1.51, respectivamente. Así, en la presente muestra se ob-
servan niveles de sintomatología más altos y más normalmente
distribuidos que en las muestras originales, en las cuales se
observaron niveles de depresión más bajos (media inferior y
mayor concentración de puntuaciones bajo la media).
Tabla 1
Nombre breve, media, desviación estándar, correlación ítem-total corregida y proporción de respuesta a cada
opción, para cada ítem de la CES-D
Opciones de respuesta
Item
M
SD
r
0
1
2
3
1. Se enojó más de lo habitual
0.70 0.83 0.34 0.49 0.37 0.09 0.05
2. Mal apetito
0.67 0.81 0.22 0.56 0.27 0.13 0.04
3. No podía dejar de sentir tristeza 0.72 0.95 0.59 0.55 0.25 0.12 0.08
4. Valioso
0.92 1.01 0.41 0.45 0.27 0.18 0.10
5. Dificultad de concentración
1.32 0.95 0.42 0.21 0.38 0.27 0.13
6. Deprimido
0.93 0.94 0.71 0.40 0.35 0.17 0.08
7. Todo era un esfuerzo
1.06 1.00 0.39 0.36 0.34 0.19 0.11
8. Esperanza
1.08 0.99 0.23 0.34 0.35 0.20 0.11
9. Vida fue un fracaso
0.50 0.84 0.59 0.68 0.18 0.08 0.05
10. Miedo
0.77 0.90 0.55 0.49 0.32 0.13 0.06
11. Sueño poco reparador
1.18 1.04 0.32 0.33 0.32 0.21 0.15
12. Felicidad
1.03 0.92 0.43 0.33 0.39 0.20 0.08
13. Habló menos de lo habitual
0.86 0.90 0.39 0.43 0.34 0.17 0.06
14. Soledad
0.93 1.00 0.61 0.44 0.29 0.17 0.10
15. Personas poco amigables
0.59 0.86 0.36 0.61 0.25 0.09 0.05
16. Disfrutó de la vida
0.97 0.99 0.41 0.40 0.32 0.18 0.10
17. Ataques de llanto
0.49 0.90 0.55 0.72 0.13 0.08 0.07
18. Tristeza
0.91 0.93 0.69 0.40 0.38 0.14 0.08
19. No gustaba a la gente
0.58 0.87 0.57 0.63 0.22 0.09 0.06
20. No podía continuar
0.53 0.87 0.60 0.66 0.20 0.08 0.06
NORMAS Y PUNTO DE CORTE PARA LA ESCALAL DE DEPRESIÓN DEL CENTRO PARA ESTUDIOS...
151
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
La correlación de la puntuación total con la edad no
resultó significativa (r = -.05, p = .09), por lo que se consi-
deró innecesario corregir las normas por grupo de edad.
En el caso del género, sin embargo, se observó una dife-
rencia significativa entre el promedio total de los varones
(M = 15.49, SD = 8.72) y las mujeres (M = 17.8, SD =
10.85), con t = -3.99, p < .001, concluyéndose que los hom-
bres reportan una frecuencia de síntomas leve pero
significativamente menor que las mujeres. Aunque no se
trata de una diferencia de gran magnitud (d = .23), el resul-
tado recomendó el cálculo de normas diferenciadas para
hombres y mujeres. Otra diferencia se observó en la dis-
persión de las puntuaciones, donde los hombres muestran
una distribución de puntajes un poco más homogénea que
las mujeres (SD = 8.72, versus SD = 10.85) que resulta
significativa (F = 27.99, p < .001). Además, en ambos
géneros la distribución de las puntuaciones totales se des-
vía de la normalidad según la prueba Kolmogorov-Smirnov
(D = .11, p < .001, para los hombres y D = .09, p < .001
para las mujeres), aunque los índices de asimetría y apun-
tamiento son relativamente pequeños (As = .87 y Cu = .32,
en el caso de los hombres y As = .72 y Cu = -.07, en el caso
de las mujeres).
Considerando estos antecedentes, se construyeron nor-
mas diferenciadas por género, en puntuaciones T y en
Estaninos. Los resultados se presentan en la Tabla 2.
La precisión de las puntuaciones de la CES-D para cada
género se determinó siguiendo dos estrategias. En primer
lugar, se calculó la confiabilidad por consistencia interna
mediante el coeficiente alfa de Cronbach, observándose un
a = .84 para los hombres y a = .89 para las mujeres.
Adicionalmente, Gempp et al. (2004) estimaron las
confiabilidades condicionales para cada nivel de puntua-
ción bruta total utilizando el método desarrollado por
Ramsay (1997). Los resultados, presentados en la Figura
1, indican que en los varones la confiabilidad se encuentra
en el rango de entre .77 y .86, mientras que en las mujeres
el coeficiente de confiabilidad alcanza valores mínimo y
máximo de .82 y .89. Las curvas también indican que en
ambos géneros la CES-D resulta más confiable para eva-
luar a personas con niveles bajos y altos de patología de-
presiva, en tanto la confiabilidad decrece levemente para
los sujetos con niveles medios de sintomatología.
Cálculo del punto de corte
Para evaluar la sensibilidad y especificidad del punto
de corte tradicional (16 puntos) y establecer un punto de
corte óptimo en la muestra, se compararon los puntajes
obtenidos por la muestra normal con las puntuaciones to-
tales de la muestra clínica. Esta última alcanzó una media
de M = 41.1 (SD = 8.03), con un mínimo de 15 y un máxi-
Tabla 2
Normas en Estaninos y puntuaciones T para mujeres y
hombres
1
1
18
1
19
2
1
25
1
23
3
1
29
1
27
4
1
32
1
29
5
2
35
2
33
6
2
37
2
35
7
3
39
2
37
8
3
40
3
40
9
3
42
3
42
10 4
43
4
43
11 4
44
4
45
12 4
45
4
46
13 4
47
5
48
14 4
47
5
49
15 5
48
5
50
16 5
49
5
52
17 5
50
6
53
18 5
51
6
54
19 5
52
6
55
20 6
53
6
55
21 6
53
6
56
22 6
54
6
57
23 6
55
7
58
24 6
55
7
58
25 6
57
7
60
26 7
58
7
61
27 7
59
7
62
28 7
59
8
63
29 7
60
8
63
30 7
60
8
64
31 7
61
8
65
32 7
61
8
66
33 7
62
8
66
34 8
63
8
67
35 8
63
9
68
36 8
64
9
70
37 8
65
9
71
38 8
66
9
72
39 8
67
9
72
40 9
68
9
73
41 9
68
9
74
42 9
69
9
75
43 9
70
9
76
44 9
71
9
78
45 9
73
9
79
46 9
73
9
81
47 9
74
48 9
74
49 9
74
50 9
75
51 9
78
52 9
79
53 9
79
54 9
82
Mujeres Hombres
Puntuación Estaninos Puntuación T Estaninos Puntuación T
Bruta
152
GEMPP, AVENDAÑO Y MUÑOZ
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
mo de 60 puntos. La distribución de las puntuaciones
clínicas resultó levemente asimétrica por sobre la me-
dia (As = -.55) y moderadamente leptocúrtica (Cu =
1.9), mostrado una confiabilidad de a = .78.
El valor de corte se estableció a través de metodo-
logía ROC, comentada previamente. Utilizando como
estándar la muestra clínica, se fijaron 59 posibles pun-
tos de corte (uno por cada puntuación total de la esca-
la) y se estimó la sensibilidad y especificidad obtenida
con cada uno de ellos. El resultado se graficó en un
plano, en el cual el eje vertical representa la sensibili-
dad y el eje horizontal 1 menos la especificidad.
La curva ROC resultante se presenta en la Figura 2.
El área bajo la curva (AUC) equivale a la probabilidad
de que el test identifique correctamente a dos sujetos
como normales o depresivos si uno de ellos fuera ele-
gido aleatoriamente de la muestra normal y el otro
aleatoriamente de la muestra clínica. Para un test sin
valor diagnóstico, el AUC correspondería al área bajo
la diagonal (e.g. .50). En términos interpretativos, a la
medida que la Curva ROC se aleja de la recta diagonal,
aumenta el AUC y, por lo tanto, el valor diagnóstico
del test. El punto de máxima inflexión de la curva ROC,
es decir, el valor en que la curva se acerca más al vér-
tice superior izquierdo del gráfico, es interpretado co-
múnmente como el valor máximo de sensibilidad y es-
pecificidad que el test puede alcanzar simultáneamen-
te. Utilizando este valor es posible identificar un pun-
to de corte óptimo para la escala. Aunque se han pro-
puesto métodos más sofisticados para obtener puntos
de corte desde curvas ROC, el procedimiento recién
descrito es el más simple y utilizado en la práctica.
En este caso, se calculó el área bajo la curva mediante
un procedimiento no paramétrico, obteniéndose un AUC =
.96 (95% CI = .93 - .98), resultado que puede interpretarse
a favor de la capacidad diagnóstica de la CES-D. El diag-
nóstico de depresión efectuado a partir del punto de corte
convencional (16 puntos) muestra una sensibilidad de un
97.7%, pero sólo un 57% de especificidad. Este resultado
implica que el punto de corte tradicional, aunque eficiente
para detectar casos depresivos, tiene una alta probabilidad
de identificar como casos clínicos a quienes realmente no
padecen el trastorno. En otras palabras, tiene una alta pro-
babilidad de sobrediagnosticar.
Figura 1
Figura 2
NORMAS Y PUNTO DE CORTE PARA LA ESCALAL DE DEPRESIÓN DEL CENTRO PARA ESTUDIOS...
153
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
El análisis prosiguió analizando la sensibilidad y la
especificidad para distintos puntos de corte. Los resulta-
dos indican que cualquier corte localizado entre 15/16 y
24/25 puntos alcanza una sensibilidad de un 97.7%, mien-
tras que la especificidad de la escala asciende hasta un 90%
sólo para un punto de corte localizado en 31/32 puntos.
Esta evidencia advierte que la CES-D es un screening más
sensible que específico y que, si bien logra identificar co-
rrectamente casos depresivos, tiende a sobrediagnosticar.
Luego de evaluar distintos puntos de corte alternativos, se
determinó que un valor de 24/25 puntos es capaz de
maximizar conjuntamente la sensibilidad (97.7%) y la es-
pecificidad (79%) del diagnóstico.
Discusión
Este trabajo se propuso tres objetivos destinados a fa-
cilitar el uso de la CES-D como screening de depresión
en jóvenes: construir normas estandarizadas, evaluar la
sensibilidad y la especificidad del punto de corte original
y determinar un punto de corte óptimo para la población
en estudio.
Con relación al primer objetivo, es interesante notar que
la puntuación promedio obtenida por la muestra no clínica
supera los promedios reportados por Radloff (1977). Es-
tos resultados son congruentes, no obstante, con investiga-
ciones más recientes realizadas con población adolescente
(e.g. McArdle, Johnson, Hishinuma, Miyamoto & Andrade,
2001), latina (e.g. Mastern et al., 1986; Munet-Vilaró,
Folkman & Gregorich, 1999) y latino-adolescente (e.g.
Mastern et al., 2003), que reiteradamente reportan puntua-
ciones totales promedio iguales o superiores a 15/16 pun-
tos. Es preciso un análisis más exhaustivo de estos antece-
dentes para dilucidar si estos elevados promedios de
sintomatología depresiva son imputables a la edad de los
sujetos, a diferencias culturales entre latinos y norteameri-
canos o a una combinación de ambos factores.
Por otro lado, los resultados también muestran otro
hallazgo consistente con investigaciones previas: las mu-
jeres reportan un promedio de síntomas depresivos
sistemáticamente mayor que los hombres, lo que obligó,
en nuestro caso, a construir normas diferenciadas por gé-
nero. En efecto, numerosos estudios muestran que las
mujeres tienen un riesgo significativamente mayor que
los hombres de presentar depresión (Koss-Chioino, 1999),
que según algunas estimaciones incluso duplicaría al de
los varones (McGrath, Keita, Strickland & Russo, 1991).
Al respecto, las estadísticas del Instituto Nacional de Sa-
lud Mental de Estados Unidos referían, en 1980, que del
10.2% de la población general que sufría síntomas depre-
sivos un 70% eran mujeres. En fecha más reciente, el
reporte del año 2001 de la Organización Mundial de la
Salud confirmaba esta tendencia señalando que la depre-
sión es la enfermedad más común entre las mujeres (Ca-
rrillo, Rojo & Staats, 2004). Algunos autores como Brems
(1995) discuten las causas de este fenómeno y las agru-
pan en tres tipos de factores: biológicos (e.g. genes, even-
tos relacionados con la reproducción), sociales (e.g. con-
diciones socioeconómicas crónicamente desfavorables,
roles sociales, discriminación) y psicosociales (e.g. desa-
rrollo de la personalidad, violencia interpersonal). Des-
de el punto de vista de este trabajo, la diferencia de pun-
tuaciones entre hombres y mujeres parece reflejar una leve
pero sustantiva desigualdad entre ambos géneros, cuyas
causas y/o correlatos podrían ser materia de posteriores
estudios con la CES-D u otros instrumentos. Es necesa-
rio, sin embargo, realizar estudios de funcionamiento di-
ferencial de los ítems de la CES-D en muestras chilenas,
antes de adelantar una conclusión al respecto.
Con respecto a los objetivos segundo y tercero de esta
investigación, los resultados muestran que la CES-D es una
medida eficiente para diagnosticar depresión. Según Swets
(1988) valores de AUC entre 0.5 y 0.7 indican baja efica-
cia del test, entre 0.7 a 0.9, eficiencia moderada, y sobre
0.9, alta eficiencia. Nuestros resultados (AUC = 96%) in-
dican alta eficiencia predictiva, aunque es preciso advertir
que el punto de corte tradicional (16 puntos) resulta insufi-
cientemente específico y por ello no se lo recomienda. Este
descubrimiento también es consistente con la literatura pre-
via. Roberts et al. (1990) y Santor et al. (1995) advierten
que el punto de corte de 16 puntos resulta poco específico
para adolescentes y estudiantes universitarios, respectiva-
mente, y sugieren utilizar puntuaciones más altas para evi-
tar sobrediagnosticar. Otros estudios, ya comentados en la
introducción de este trabajo, sugieren las mismas conclu-
siones (e.g. Katz, Stephen, Shaw, Matthew, Newman &
Rosenbluth, 1995; Myers & Weissman, 1980; Parikh, Eden,
Price & Robinson, 1988; Weissman et al., 1977) y reco-
miendan explícitamente utilizar un punto de corte más alto.
En este sentido, el elevado valor recomendado por la curva
ROC calculada en este trabajo (24 puntos) es
sorprendentemente similar al propuesto utilizando
metodologías similares en poblaciones adolescentes ([23/
24 puntos] Roberts et al., 1991) y latinas ([25/26] Mosciki,
Narrow, Rae, Locke & Regier, 1993). Todos estos antece-
dentes constituyen un aval de los resultados encontrados y,
al mismo tiempo, refieren un comportamiento psicométrico
estable por parte de la CES-D que representa evidencia in-
directa de su validez. Es menester, en todo caso, realizar
más estudios sobre la validez transcultural de la escala an-
tes de formular conclusiones definitivas.
Los resultados obtenidos, sin embargo, no están exen-
tos de limitaciones. La primera tiene que ver con la mues-
tra normal. Al provenir de la zona sur del país, no puede
garantizarse la generalización de los resultados a sujetos
de las zonas centro o norte. Aunque ya hemos advertido
que no existe justificación clara para utilizar normas dife-
renciadas por región, es conveniente emplear los resulta-
154
GEMPP, AVENDAÑO Y MUÑOZ
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
dos de este estudio con prudencia en caso de aplicarse la
CES-D a individuos que no compartan características en
común con la muestra utilizada. Un problema similar afec-
ta a la muestra clínica, que además, por su escaso tamaño,
resultó insuficiente para establecer puntos de corte distin-
tos para hombres y mujeres.
Aun considerando esta limitaciones, los resultados son
lo suficientemente promisorios como para aconsejar el uso
de la CES-D y recomendar que se sigan investigando sus
propiedades. Al respecto, dadas las ventajas inherentes de
la CES-D frente al BDI, resultaría interesante comparar la
eficiencia diagnóstica de ambas pruebas utilizando un cri-
terio clínico.
Una última recomendación, con miras al usuario apli-
cado, es privilegiar el uso del punto de corte por sobre las
normas, dado que el primero cuenta con antecedentes de
sensibilidad y especificidad demostrados. En caso de em-
plear normas, los autores recomendamos el uso de
Estaninos. Las normas en puntuaciones T fueron calcula-
das únicamente debido a su familiaridad en el medio na-
cional; sin embargo, considerando que la CES-D es un ins-
trumento breve y altamente sensible, las diferencias peque-
ñas en puntuaciones T (e.g. T = 45 versus T = 50) son poco
discriminativas y probablemente no tengan valor diagnós-
tico en la práctica. Los Estaninos, en cambio, permiten
una diferenciación más gruesa que resulta más pertinente
para un screening como la CES-D.
Referencias
Beck, A. T., Rush, A., Shaw, B. F., & Emery, G. (1979). Cognitive therapy
of depression. New York: Guilford.
Beck, A. T., & Steer, R. A. (1993). Beck Depression Inventory Manual.
San Antonio, TX: Harcourt.
Beck, A. T., Ward, C. H., Mendelson, M., Mock, J., & Erbaugh, J. (1961).
An inventory for measuring depression. Archives of General Psychiatry,
4, 561-571.
Bentler, P. M. (1992). EQS: Structural Equation Program Manual. Los
Angeles: BMDP Statistical Software.
Bock, R. D. (1972). Estimating item parameters and latent ability when
responses are scored in two or more nominal categories. Psychometrika,
37, 29-51.
Breithaupt, K., & Zumbo, B. D. (2002). Sample invariance of the
Structural Equation Model and the Item Response Model: A case study.
Structural Equation Modeling, 9 (3), 390-412.
Brems, C. (1995). Women and depression: A comprehensive analysis.
En E.E. Beckham & W.R. Leber (Eds.), Handbook of depression (pp.
539-587). New York: Guilford Press.
Brislin, R. W. (1986). The wording and translation of research instruments.
En W. J. Lonner y J. W. Berry (eds.). Field methods in cross-cultural
psychology (pp. 137-164). Newbury Park, CA: Sage Publications.
Carrillo, J.M., Rojo, N., & Staats, A. W. (2004). Women and vulnerability
to depression some personality and clinical factors. The Spanish Journal
of Psychology, 7 (1), 29-39.
Cho, M.J., Mosciki, E.K., Narrow, W.E., Rae, D.S., Locke, B.Z., & Regier,
D.A. (1993). Concordance between two measures of depression in the
Hispanic Health and Nutrition Examination Survey. Social Psychiatry
and Psychiatric Epidemiology, 28, 156-163.
Craig, T. J., & Van Natta, P. A. (1976). Recognition of depressed affect in
hospitalized psychiatric patients: staff and patient perceptions. Diseases
of the Nervous System., 37, 561-566.
Craig, T. J., & Van Natta, P. A. (1979). Influence of demographic
characteristics on two measures of depressive symptoms. Archives of
General Psychiatry, 35, 149-154.
Comstock, G.W. & Helsing, K.J. (1976). Symptoms of depression in two
communities. Psychological Medicine, 6, 551-563.
Coyne, J. C., Fechner-Bates, S., & Schwenk, T. L. (1994). Prevalence,
nature, and comorbidity of depressive disorders in primary care. Ge-
neral Hospital Psychiatry, 16, 267-276.
Dahlstrom, W.G. & Welsh, G.S. (1960). An MMPI Handbook.
Minneapolis: University of Minnesota Press.
Derogatis, L. R. (1994). SCL-90-R: Symptom Checklist-90-R.
Administration, Scoring a Procedures Manual. Minneapolis, MN:
National Computer Systems, Inc
Dumenci, L. & Windle, M. (1996). A latent trait-state model of adolescent
depression using the Center for Epidemiologic Studies Depression
Scale. Multivariate Behavioral Research, 31, 313-330.
Eaton, W. W., & Kessler, L. G. (1981). Rates of symptoms of depression
in a national sample. American Journal of Epidemiology, 114, 528-
538.
Faulstich, M. E., Carey, M. P., Ruggiero, L., Enyart, P., & Gresham, F.
(1986). Assessment of depression in childhood and adolescence: an
evaluation of the Center for Epidemiologic Studies Depression Scale
for Children (CES-DC). American Journal of Psychiatry, 143, 1024-
1027.
Fechner-Bates, S., Coyne, J. C., & Schwenk, T. L. (1994). The relationship
of self-reported distress to depressive disorders and other
psychopathology. Journal of Consulting and Clinical Psychology, 62,
550-559.
Furukawa, T., Anraku, K., Hiroe, T., Takahashi, K., & Iida, M. (1997).
Screening for depression among first-visit psychiatric patients:
Comparison of different scoring methods for the Center of
Epidemiologic Studies Depression Scale using operating characteristic
analysis. Psychiatry and Clinical Neurosciences, 51, 71-78.
Furukawa, T., Hirai, T., Kitamura, K., & Takahashi, K. (1997). Application
of the Center for Epidemiologic Studies Depression Scale among first-
visit psychiatric patients: A new approach to improve its performance.
Journal of Affective Disorders, 46, 1-13.
Gardner, E. A. (1968). Development of a symptom check list for the
measurement of depression in a population. Unpublished.
Gempp, R. (2003). Escala de Depresión del Centro para Estudios
Epidemiológicos (CES-D): Versión para investigación en población
juvenil chilena. Escala no publicada, Facultad de Psicología, Univer-
sidad Mayor, Chile.
Gempp, R., Olea, J. & Abad, F. (2004). Adaptación y análisis psicométrico
de la Escala de Depresión del Centro para Estudios Epidemiológicos
(CES-D) en población juvenil chilena, utilizando modelos politómicos
de Teoría de Respuesta al Item. Ponencia Presentada en el IV Congre-
so Iberoamericano de Psicología y II Encuentro de la Red Iberoameri-
cana de Facultades y Escuelas de Psicología. Santiago, Chile, Julio
2004.
Guarnaccia, P. J., Angel, R. & Worobey, J. L. (1989). The factor structure
of the CES-D in the Hispanic Health and Nutrition Examination Survey:
The influences of ethnicity, gender and language. Social Science and
Medicine, 29, 85-94.
Hambleton, R. K. (2001). The next generation of the ITC translation and
application guidelines. European Journal of Psychological Assessment,
17 (3), 164-172.
Hamilton, M. (1970). The Hamilton Depression Scale. En W. Guy & R.
Bonato (Eds.), ECDFU Assessment Manual. Rockville, MD: National
Institute of Mental Health.
Hertzog, C., Van Alstine, J., Usala, P.D., Hultsch, D.F., & Dixon, R. (1990).
Measurement properties of the Center for Epidemiologic Studies
Depression Scale (CES-D) in older populations. Psychological
Assessment, 2, 64-72.
Hughes, D. C., De Mallie, D., & Blazer, D. G. (1993). Does age make a
difference in the effects of physical health and social support on the
NORMAS Y PUNTO DE CORTE PARA LA ESCALAL DE DEPRESIÓN DEL CENTRO PARA ESTUDIOS...
155
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
outcome of a major depressive episode. American Journal of
Psychiatry, 150, 728-733.
Husaini, B. A., Neff, J. A., Harrington, J. B., Hughes, M. D., & Stone, R.
H. (1980). Depression in rural communities: validating the CES-D
scale. Journal of Community Psychology, 8, 20-27.
Joseph, S., Lewis, D.A., & Olsen, C. (1996). Convergent validity of the
Depression-Happiness Scale with measures of depression. Journal
Clinical Psychology, 52, 551-554.
Katz, R., Stephen, J., Shaw, B.F., Matthew, A., Newman, F., & Ronsenbluth,
M. (1995). The East York Health Need Study I: Prevalence of DSM-
III-R psychiatric disorder in a sample of Canadian Women. British
Journal of Psychiatry, 166, 100-106.
Koss-Chioino, J.D. (1999). Depression among Puerto Rican women:
Culture etiology and diagnosis. Hispanic Journal of Behavioral
Sciences, 21(3), 330-350.
Kuo, W. (1984). Prevalence of depression among Asian-Americans.
Journal of Nervous and Mental Disease, 172, 449-457.
Lewinsohn, P.M., Seeley, J.R., Roberts, R.E., & Allen, N.B. (1997). Center
for Epidemiologic Studies Depression Scale (CES-D) as a screening
instrument for depression among community-residing older adults.
Psychology and Aging, 12, 277-287.
Lyness, J.M., Noel, T.K., Cox, C., King, D.A., Conwell, Y., & Caine, E.D.
(1997). Screening for depression in elderly primary care patients. Ar-
chives of Internal Medicine, 157, 449-454.
McArdle, J.J., Johnson, R.C., Hishinuma, E.S., Miyamoto, R.H., &
Andrade, N.N. (2001). Structural equation modeling of group
differences in CES-D ratings of native Hawaiian and non Hawaiian
high school students. Journal of Adolescent Research, 16(2), 108-149.
McGrath, E., Keita, G.P., Strickland, B.R., & Russo, N.F. (1991). Women
and depression Washington, DC: American Psychological Association.
Mary, J.D.J., & Williams, P. (1985). A comparison of the validity of two
psychiatric screening questionnaires (GHQ-12 and SRQ-20) in Brazil,
using relative operating characteristics (ROC) analysis. Psychological
Medicine, 15, 651-659.
Mastern, W.G., Caldwell-Coldbert, A.T., Alcalá, S.J., & Mijares, B. E.
(1986). Confiabilidad y validez de la Escala de Depresión del Centro
de Estudios Epidemiológicos. Hispanic Journal of Behavioral Sciences,
8 (1), 77-84.
Mastern, W.G., Caldwell-Coldbert, A.T., Williams, V., Jerome, W.W.,
Mosby, L., Barrios, Y., & Helton, J. (2003). Gender differences in
depressive symptoms among Mexican adolescents. Anales de Psicolo-
gía, 19 (1), 91-95.
Mosciki, E. K., Locke, B. Z., Rae, D. S., & Boyd, J. H. (1989). Depressive
symptoms among Mexican American: The Hispanic Health and
Nutrition Examination Survey. American Journal of Epidemiology, 130,
348-360.
Mossman, D., & Somoza, E. (1989). Maximizing diagnostic information
from the dexamethasone suppression test. Archives of General
Psychiatry, 46, 653-660.
Munet-Vilaró, F., Folkman. S., & Gregorich, S. (1999). Depressive
symptomatology in three Latino groups. Western Journal of Nursing
Research, 21(2), 209-224.
Murphy, J.M., Berwick, D.M., Weinstein, M.C., Borus, J.F., Budman, S.H.,
& Klerman, G.L. (1987). Performance of screening and diagnostic tests:
Application of receiver operating characteristic analysis. Archives of
General Psychiatry, 44, 550-555.
Myers, J.K., & Weissman, M. M. (1980). Use of a self-report symptom
scale to detect depression in a community sample. American Journal
of Psychiatry, 137, 1081-1084.
Narrow, W. E., Rae, D. S., Mosciki, E. K., Locke, B. Z. & Regier, D. A.
(1990). Depression among Cuban American: The Hispanic Health and
Nutrition Examination Survey. Social psychiatry and psychiatric
Epidemiology, 25, 260-268.
Noh, S., Avison, W. & Kaspar, V. (1992). Depressive symptoms among
Korean immigrants: Assessment of a translation of the CES-D.
Psychological Assessment, 4, 84-91.
Parikh, R. M., Eden, D. T., Price, T. R., & Robinson, R. G. (1988). The
sensitivity and specificity of the Center for Epidemiologic Studies
Depression Scale in screening for post-stroke depression. International
Journal of Psychiatric Medicine, 18, 169-181.
Pretorius, T. B. (1991). Cross-cultural applications of the Center for
Epidemiologic Studies Depression Scale: A study of Black South
African students. Psychological Reports, 69, 1179-1185.
Radloff, L. S. (1977). The CES-D scale: a self-report depression scale for
research in the general population. Applied Psychological
Measurement, 1, 385-401.
Radloff, L. S. (1991). The use of the Center for Epidemiologic Studies
Depression Scale in adolescents and young adults. Journal of Youth
and Adolescents, 70, 149-166.
Radloff, L. S, & Teri, L. (1986). Use of the Center for Epidemiological
Studies Depression Scale with older adults. Clinical Gerontologist, 5,
119-135.
Radloff, L. S., & Locke, B. Z. (1986). The Community Mental Health
Assessment Survey and CES-D Scale. En M.M. Weisman, J. K. Myers,
& C. E. Ross (Eds.), Community surveys of psychiatric disorders (pp.
177-189). East Brunswick, NJ: Rutgers University Press.
Ramsay, J. O. (1997). A functional approach to modeling test data. In W.
Van Der Linden & R. K. Hambleton (Eds.). Handbook of Modern Item
Response Theory. NY: Springer.
Raskin, A., Schulterbrandt, J., Reatig, N., & McKeon, J. (1969).
Replication of factors of psychopathology in interview, ward behavior,
and self-report ratings of hospitalized depressives. Journal of Nervous
and Mental Disease, 148, 87-96.
Roberts, R. E. (1980). Reliability of the CES-D scale in different ethnic
content. Psychiatry Research, 2, 125-134.
Roberts, R.E., Andrews, J.A., Lewinsohn, P.M. & Hops, H. (1990).
Assessment of depression in adolescents using the Center for
Epidemiologic Studies Depression Scale. Journal of Psychological
Assessment, 21, 122-128.
Roberts, R. E., Lewinsohn, P. M., & Seeley, J. R. (1991). Screening for
adolescent depression: A comparison of depression scales. Journal of
American Academic Child and Adolescent Psychiatry, 30, 58-66.
Roberts, R. E., Rhoades, H. M. & Vernon, S. W. (1990). Using the CES-
D scale to screen for depression and anxiety: Effects of language and
ethnic status. Psychiatry Research, 31, 69-83.
Roberts, R. E., & Vernon, S. W. (1983). The Center of Epidemiologic
Studies Depression Scale: Its use in a community sample. American
Journal of Psychiatry, 140, 41-46.
Roberts, R. E., Vernon, S. W., & Rhoades, H. M. (1989). Effects of
language and ethnic status on reliability and validity of the Center for
Epidemiologic Studies Depression Scale with psychiatric patients.
Journal of Nervous and Mental Disease, 177, 581-592.
Samejima, F. (1969). Estimation of a latent ability using a response pattern
of graded scores. Psychometric Monograph, Supplement No 17.
Santor, D.A, Zuroff, D.C., Ramsay, J.O., Cervantes, P., & Palacions, J.
(1995). Examining scale discriminability in the BDI and CES-D as
function of depressive severity. Psychological Assessment, 7, 131-139.
Schulberg, H. C., Saul, M., McClelland, M., Ganguli, M., Christy, W., &
Frank, R. (1985). Assessing depression in primary medical and
psychiatric practices. Archives of General Psychiatry, 42, 1164-1170.
Sheehan, T.J., Fifield, J., Reisine, S., & Tennen, H. (1995). The
measurement structure of the Center for Epidemiological Studies
Depression Scale. Journal of Personality Assessment, 64, 507-521.
Shrout, P. E., & Yager, T. J. (1989). Reliability and validity of screening
scales: Effects of reducing scale length. Journal of Clinical
Epidemiology, 42, 69-78.
Skorikov, V.B., & Vandervoort, D.J. (2003). Relationship between the
underlying constructs of the Beck Depression Inventory and the Center
for Epidemiologic Studies Depression Scale. Educational and
Psychological Measurement, 63(2), 319-335.
Somervell, P.D., Beals, J., Kinzie, J.D. ,Boehnlein, J., Leung, P., Manson.
S.M. (1993). Criterion validity of The Center for Epidemiologic Studies
Depression Scale in a population sample from American Indian Village.
Psychiatric Research, 47, 255-266.
156
GEMPP, AVENDAÑO Y MUÑOZ
TERAPIA PSICOLÓGICA 2004, Vol.22, Nº2, 145-156
Stroup-Benham, C., Lawrence, R., & Treviño, F. (1992). The CES-D
factor structure among Mexican American and Puerto Rican women
from single and couple headed households. Hispanic Journal of
Behavioral Sciences, 14, 310-326.
Swets, J. A. (1988). Measuring the accuracy of diagnostic systems.
Science, 240, 1285-1293.
Swets, J. A., & Pickett, R.M. (1982). Evaluation of Diagnostic Systems:
Methods from Signal Detection Theory. New York: Academic Press
Tanzer, N. K., & Sim, C.Q.E. (1999). Adapting instruments for use in
multiple languages and cultures: A reviews of the ITC guidelines for
tests adaptations. European Journal of Psychological Assessment, 15(3),
258-269.
Turk, D. C., & Okifuji, A. (1994). Detecting depression in chronic pain
patients: Adequacy of self-reports. Behavioral Research and Therapy,
32, 9-16.
van de Vijver, F., & Hambleton, R. K. (1996). Translating tests: Some
practical guidelines. European Psychologist, 1 (2), 89-99.
Weissman, M. M., Bland, R. G., Canino, G. J., Faraveli, C., Greenwald,
S., Hwu, H. G., Joyce, P. R., Karam, E. G., Lee, C. K., Lellouch, J.,
Lepine, J. P., Newman, S. C., Rubio-Stipec, M., Wells, J. E.,
Wickramaratne, P. J., Wittchen, H. U., & Yeh, E. K. (1986). Cross-
national Epidemiology of major depression and bipolar disorder.
Journal of the American Medical Association, 276, 293-299.
Weissman, M. M., & Locke, B. Z. (1975). Comparison of a self-report
symptom rating scale (CES-D) with standardized depression rating
scales in psychiatric populations. American Journal of Epidemiology,
102, 430-431.
Weissman, M. M., Sholomskas, D., Pottenger, M., Prusoff, B. A. & Locke,
B. Z. (1977). Assessing depressive symptoms in five psychiatric
populations: A validation study. American Journal of Epidemiology,
106, 203-214.
Zich, J. M., Attkinson, C. C., & Greenfield, T. K. (1990). Screening for
depression in primary care clinics: the CES-D and the BDI.
International of Journal Psychiatry in Medicine, 20, 259-277.
Zimmerman, M., & Coryell, W. (1994). Screening for mayor depressive
disorders in the community: A comparison of measures. Psychological
Assessment, 6, 71-74.
Zung, W. W. K. (1965) A self-rating depression scale. Archives of Gene-
ral Psychiatry, 12, 63-70.