ARTICULO DE REVISIÓN
REVISTA DE LA FACULTAD DE MEDICINA HUMANA 2022 - Universidad Ricardo Palma
1Centro de Investigaciones Médico-Quirúrgicas, Capitulo Futuros Cirujanos, Asociación Colombiana de Cirugía, Bogotá, Colombia
2Grupo Prometheus y Biomedicina Aplicada a las Ciencias Clínicas, Facultad de Medicina, Universidad de Cartagena, Cartagena, Colombia
3Facultad de Medicina, Universidad Santiago de Cali, Cali, Colombia
4Facultad de Medicina, Universidad Libre, Barranquilla, Colombia
5Facultad de Medicina, Universidad del Rosario, Bogotá, Colombia
6Facultad de Medicina, Universidad Nacional, Colombia, Colombia
7Facultad de Medicina, Universidad Cooperativa de Colombia, Medellín, Colombia
8Facultad de Medicina, Universidad Autónoma de Bucaramanga, Bucaramanga, Colombia
9Facultad de Medicina, Universidad de Manizales, Manizales, Colombia
10Facultad de Medicina, Fundación Universitaria Juan N. Corpas, Bogotá, Colombia
aMédico Interno
bMédico
RESUMEN
Introducción:Los síndromes críticos son condiciones que acarrean una elevada carga de enfermedad a nivel global. Los sistemas de puntaje, son ayudas prácticas y reproducibles que permiten identificar de manera rápida pacientes con enfermedad más grave e ingresarlos a cuidado intensivo e iniciar terapia estructurada y agresiva. El score Sequential Organ Failure Assessment (SOFA), es uno de los más utilizados en el mundo, al existir varias versiones y ser sencillo. No obstante, con la aparición de la COVID-19, diversos estudios demostraron que existía una disparidad en cuanto a la estimación de mortalidad y desenlaces asociados, respecto a la raza, lo que culminó en un exceso de mortalidad prevenible en ciertos grupos raciales. La evaluación constante del rendimiento de estos sistemas de puntaje, debe realizarse debido a actualizaciones de definiciones, las cuales pueden variar la precisión del valor predictivo. Existe una brecha muy grande en cuanto la evidencia al respecto, puesto que los estudios existentes provienen de países de altos ingresos, donde el grupo racial predominante son los caucásicos, lo que debe llamar la atención de la magnitud del problema. Sobre la base de lo anterior, el objetivo de esta revisión consiste en discutir evidencia al respecto sobre el rendimiento de sistemas de puntuación en cuidado crítico, particularmente del SOFA y el impacto que ha tenido la raza sobre su valor predictivo.
Palabras Clave: Puntuaciones en la Disfunción de Órganos; Grupos de Población Continentales; Valor Predictivo de las Pruebas; Resultados de Cuidados Críticos. (fuente: DeCS BIREME).
ABSTRACT
Introduction: Critical syndromes are conditions that carry a high global burden of disease. Scoring systems are practical and reproducible aids that allow patients with more severe disease to be quickly identified and admitted to intensive care and to initiate structured and aggressive therapy. The Sequential Organ Failure Assessment (SOFA) score is one of the most widely used in the world, as there are several versions and it is simple. However, with the appearance of the COVID-19, several studies showed that there was a disparity in the estimation of mortality and associated outcomes, with respect to race, which culminated in an excess of preventable mortality in certain racial groups. Constant evaluation of the performance of these scoring systems must be performed due to definitional updates, which may vary the accuracy of the predictive value. There is a very large evidence gap in this regard, as the existing studies are from high-income countries where the predominant racial group is Caucasian, which should draw attention to the magnitude of the problem. Based on the above, the objective of this review is to discuss evidence on the performance of critical care scoring systems, particularly SOFA, and the impact that race has had on its predictive value.
Keywords: Organ Dysfunction Scores; Continental Population Groups; Predictive Value of Tests; Critical Care Outcomes. (Source: MeSH NLM).
INTRODUCCIÓN
Con la aparición de la pandemia por COVID-19, se hizo evidente la necesidad que existe de validar y realizar investigación masiva en cuidado crítico en regiones que carecen de datos primarios de calidad(1). Estudios de carga de enfermedad, demuestran que para el año 2004, se presentaron 58 772 muertes a nivel global, siendo los síndromes críticos tipo sepsis, lesión pulmonar aguda y ventilación mecánica invasiva, los más frecuentes y con mayor carga de enfermedad en todo el mundo (aproximadamente 45 000 / 58 772 casos reportados)(2).
La disponibilidad de cama en unidad de cuidados intensivos (UCI) por cada 100 000 habitantes, sigue siendo un desafío de la salud global. Mientras en países de altos ingresos como Estados Unidos, Alemania, Canadá, entre otros; poseen en promedio entre 15 y 20 camas por cada 100 000 habitantes; los países de bajos y medianos ingresos poseen en promedio ≤ 5 camas para la misma proporción poblacional(2). Para aquel entonces, casi 20 años en el pasado, se mencionaban como objetivos de la salud global, promover estrategias que permitieran mejorar los indicadores de carga enfermedad, sobre todo, considerando las limitaciones políticas, económicas y de salud de gran parte de la población mundial(3-6).
Recientemente, un meta-análisis realizado por el departamento de servicios integrados de salud de la Organización Mundial de la Salud, evidenció que la incidencia global de sepsis con disfunción multiorgánica sigue estando en los rangos similares a los reportados hace muchos años (9 300 casos por cada 100 000 habitantes), y manteniendo una incidencia preocupante de sepsis adquirida en hospitales y en UCI, la cual oscila entre el 25% - 50%(7). La mortalidad reportada actualmente supera el 50%; y es necesario destacar que este meta-análisis incluyó 51 estudios, y aproximadamente la mitad, fueron provenientes de países de bajos y medianos ingresos, lo que preocupa sobremanera por las barreras descritas previamente(7). Las muertes prevenibles en cuidado crítico, es un tema de discusión álgida, puesto que se han propuesto distintas herramientas que ayudan a priorizar o re-estratificar de manera oportuna a los pacientes con mayores requerimientos de soporte para su supervivencia(6,8,9). Las escalas consistentes en sistemas de puntaje, son ayudas prácticas y reproducibles que permiten identificar de manera rápida pacientes con enfermedad más grave e ingresarlos a UCI e iniciar terapia estructurada y agresiva(10). Muchas escalas de estas han sido propuestas y validadas a lo largo de los años, como lo son el SOFA (Sequential Organ Failure Assessment)(11), APACHE (Acute Physiology and Chronic Health Evaluation)(12), SAPS (Simplified Acute Physiologic Score)(12), MPM0 (Admission Mortality Probability Model)(13), entre otros(8,9).
Diversos estudios han evaluado el rendimiento de estas escalas en distintos contextos, adaptándolos a nuevas variables de acuerdo al comportamiento de la población donde es utilizado, surgiendo nuevas versiones desde su creación(10). Esto, es fundamental, puesto que al ser una escala que define al paciente críticamente enfermo de manera rápida, el valor pronostico debe ser muy preciso en quienes se aplica, independientemente del grupo poblacional evaluado. Meta-investigaciones, discuten fuertemente la heterogeneidad de algunos estudios y de las implicaciones que tendría esto en la práctica real (14).
Durante el curso de la pandemia por COVID-19, existieron muchas diferencias en cuanto al rendimiento de estas escalas, lo que desequilibró la validez de la evidencia(15-17). Particularmente, durante el año 2021, muchos estudios plantearon que existían disparidades sobre la precisión del SOFA (una de las escalas más utilizadas y con mejor valor predictivo) en cuanto a la raza de la población donde se utilizaba, impactando de manera sustancial sobre el proceder médico en UCI y hospitalización, en pacientes con fenotipo severo de COVID-19, quienes requerían de ventilación mecánica invasiva, drogas que escaseaban, vigilancia estricta, entre otras intervenciones(15-17); las cuales eran muy limitadas en aquel entonces.
Considerando la relevancia actual de la carga de enfermedad global ocasionada por síndromes clínicos críticos, la necesidad de una aplicar meta-investigaciones que discutan fortalezas y debilidades de la evidencia, y de conocer posibles sesgos que existan en herramientas pronosticas en el manejo de pacientes críticamente enfermos, el objetivo de esta revisión consiste en resumir evidencia sobre el rendimiento de escalas utilizadas en cuidado crítico, y particularmente del SOFA, que permita conocer los desenlaces obtenidos a lo largo del tiempo, y discutir el dilema de la raza al usar este instrumento.
MÉTODOS
Se realizó una búsqueda bibliográfica utilizando términos de búsqueda como "SOFA", “Score”, “Critical Care” y “Race”, así como sinónimos, que se combinaron con los operadores booleanos "AND" y "OR", en los motores de búsqueda y bases de datos bases de datos PubMed, ScienceDirect, Embase, EBSCO y MEDLINE. Como criterio de inclusión, se definió que cualquier artículo relacionado con la evaluación de la escala SOFA en pacientes donde se discriminaba el rendimiento según raza u otros subgrupos de relevancia, sería incluido, dando prioridad a los estudios originales y a las revisiones sistemáticas y meta-análisis. También, se incluyeron artículos relacionados a otros scores en cuidado crítico con valor predictivo de mortalidad y desenlaces asociados.
Además, debían estar disponibles en texto completo. Como criterios de no inclusión, se estableció que no se incluirían los artículos publicados en un idioma distinto al español y al inglés. Teniendo en cuenta la amplitud del tema y la gran variedad de publicaciones, se incluyeron los artículos publicados entre 2000 y 2022. Se identificaron un total de 242 artículos potencialmente relevantes, con una revisión del título y el resumen de todos ellos, de los que finalmente se incluyeron 57 artículos, tras su discriminación según los criterios de inclusión y no inclusión. Se incluyeron otras referencias de utilidad para la discusión de conceptos generales. Las estimaciones y cálculos encontrados se expresaron en sus medidas originales, ya sean frecuencias, porcentajes, intervalos de confianza (IC), diferencia de medias (DM), riesgo relativo (RR), odds ratio (OR), tasa de incidencia (IRR) o hazard ratio (HR).
Resultados
Sistemas de puntuación predictivos de desenlaces en enfermedad severa
APACHE
A partir de los años 80, ya se hablaba sobre el score APACHE y sus primeras versiones(18). Este sistema, esta compuesto por variables como la edad, temperatura, presión arterial media, frecuencia cardiaca y respiratoria, creatinina, escala de coma de Glasgow, entre otros; los cuales pueden oscilar entre 0 y 59, estableciéndose como puntaje de corte mínimo de 0-4 y máximo de >34. La mortalidad de aquellos que se encuentren en el rango mínimo, fluctúa entre el 1% – 4%, para pacientes tanto de postoperatorio como no operatorios(19). Los que alcancen el máximo corte, poseen una mortalidad por encima del 85%, valor importante en la toma de decisiones. Estos datos, a tomando en cuenta el valor pronostico de la versión numero dos del score (APACHE II)(19).
En el año de 1991, Knaus et al(18) realizaron un estudio prospectivo multicéntrico con más de 17 000 pacientes en los Estados Unidos, con el objetivo de aumentar la precisión pronostica del APACHE (dando lugar a una nueva versión). Los autores evidenciaron que un incremento en 5 puntos del nuevo score (APACHE III), se asociaba de manera independiente con un aumento del riesgo de mortalidad (OR 1,10) en cada una de las 78 categorías. Del mismo modo, se observó que la ecuación acaparaba la variabilidad en la tasa de mortalidad presentada (r2 = 0,90; p <0,0001)(18). En la década del 2000, se llevaron a cabo numerosos estudios que intentaron reproducir y validad el rendimiento de estos criterios, pero incluyendo cada vez más variables, de acuerdo a los subgrupos que se presentaban tomando en cuenta la causa del síndrome clínico crítico(19-21).
Ho et al(19) ejecutaron un estudio de cohorte retrospectivo en esa fecha, donde evaluaron más de 11 000 admisiones a UCI postcirugía no cardiovascular, realizando una reevaluación del estado del paciente a las 24 horas, evidenciando que el puntaje obtenido en promedio fue de 12 y 15, respectivamente; y que la mortalidad predicha fue del 15% y 19%, correlacionándose con la mortalidad real, que fue del 16%. El área bajo la curva (ABC) calculado fue del 83,8% y del 84,6% para ambos cortes, no existiendo diferencia significativa (p=1,0)(19). Esto, permitió concluir que el score mantenía un rendimiento adecuado desde su primer calculo, independientemente del empeoramiento del paciente a las 24 horas de ingresado.
En el año 2006, fueron publicados dos estudios de cohorte muy grandes, ambos por Zimmerman et al(20,21), quienes incluyeron a más de 130 000 admisiones a UCI, provenientes de 45 centros hospitalarios en los Estados Unidos, dando origen a la cuarta versión del score (APACHE IV). Este, incluyó nuevas variables, principalmente respecto a salud crónica y diagnostico de ingreso a UCI. Los autores evidenciaron una validación adecuada (ABC: 0,88), sin encontrar diferencias significativas en cuanto a la variación de mortalidad en el 90% de los casos(20). Sobre la estancia en UCI, los mismos autores en el segundo estudio, encontraron que el valor predicho se correlacionaba de forma adecuada con el real (para este caso, 3,78 vs. 3,86; p <0.001), sin existir diferencias significativas entre el 93% de los diagnósticos realizados(21).
Se concluyó que el APACHE IV era una herramienta que proveía utilidad clínica en pacientes críticamente enfermos, sobre su estancia en UCI y riesgo de mortalidad(20,21). No obstante, se resaltó que debido al gran numero de categorías, el score era dinámico y debía interpretarse de manera racional, puesto que era individualizado.
Estudios recientes siguen evaluando el rendimiento de este último score, haciendo énfasis en algunos factores que pueden influir significativamente sobre el rendimiento del valor predictivo, de acuerdo al subgrupo evaluado.
Por ejemplo, Xu et al(22) evaluaron el score en paciente post-trasplante, encontrando que la edad, el uso de hormonas y la presencia de falla respiratoria, deben ser tomados en cuenta, puesto que modifican la asociación entre el score y la mortalidad real(22). Xiao et al(23), realizaron un análisis secundario de la base colaborativa eICU, evidenciando que el conteo basal plaquetario se asocia de manera negativa con todas las causas de mortalidad, tanto en el hospital (RR: 0,87; IC 95%, 0,84-0,91) como en la UCI (RR: 0,87; IC 95%, 0,83-0,92)(23). Otros autores, han demostrado que el curso clínico y establecimiento de tratamiento influyen sobre en el valor predictivo de scores en cuidado crítico (5% en predicción de mortalidad y hasta 4 horas de estancia hospitalaria)(24). La procalcitonina, ha sido descrita como un biomarcador que también influye, aunque no de manera significativa, sobre la predicción de supervivencia en distintos tiempos, siendo necesario considerarlo a profundidad en aquellos con afectación de órgano donde se produce y libera este péptido(25). Hoy por hoy, el APACHE se sigue utilizando en cuidado crítico, y ha demostrado tener un adecuado rendimiento de manera general, aunque tiene como limitación que es individualizado y que siguen surgiendo variables que pueden afectar el valor predictivo, puesto que tiene muchas categorías a evaluar.
SAPS II
En el año de 1993(26), se publicó el estudio que desarrolló y validó el score SAPS II, compuesto por 17 variables (12 fisiológicas, edad, tipo de admisión y presencia de 3 enfermedades de base [cáncer y síndrome de inmunodeficiencia adquirida]). Este estudio incluyó a más de 13 000 pacientes y obtuvo un ABC de 0,88 para su desarrollo y de 0,86 para su validación(26). Al igual que el APACHE, ha sido replicado en todo el mundo, y hasta la fecha, siguen apareciendo estudios que reportan factores que modifican el rendimiento de este score.
Recientemente, se demostró que colonización por Clostridioides difficile aumenta el puntaje de SAPS II, aunque no modifica la mortalidad o la frecuencia y/o severidad de diarrea(27). Otro estudio, encontró que en pacientes con trauma, la homocisteína, dímero D y procalcitonina, son parámetros que se encuentran asociados con mayor severidad de enfermedad, y por ende de riesgo de mortalidad, en aquellos pacientes estratificados por SAPS II (p <0,05), considerándose factores independientes de pronóstico desfavorable(28). Así mismo, se ha observado que la utilización de oxigenación por membrana extracorporea (ECMO) es un factor de riesgo complementario que incrementa el riesgo de muerte, en aquellos pacientes con puntaje de SAPS II moderados o elevado(29). También, se ha encontrado que SAPS II es un buen predictor de desenlaces en pacientes traqueostomizados de difícil acceso, que ingresan a unidades de rehabilitación especializada(30).
En la tercera versión de este score (SAPS III), el cual fue utilizado de manera oportuna en el manejo de pacientes críticamente enfermos por COVID-19, demostró que en pacientes austriacos diabéticos y no diabéticos, el rendimiento fue inadecuado, dado por una imprecisión en predecir la mortalidad(31). Aunque algunos autores intentaron calibrarlo, no fue posible lograrlo. Por ende, se sugiere utilizar con precaución o no utilizarlo en esta población(31). Este, podría ser el score menos utilizado y el que se ve más influenciado por distintos factores, a pesar de estar compuesto por pocas categorías.
MPM0
Este score se encuentra compuesto por 15 variables, las cuales evalúan tiempo de evaluación del paciente de acuerdo a su ingreso, antecedentes mórbidos, paraclínicos, estado clínico y tratamiento realizado. Al igual que los otros scores descritos previamente, este fue creado en la década de los 80 e inicialmente validado de manera multicéntrica en los 90(32). A la fecha, se utiliza la tercera versión de este score (MPM0-III). Estudios como el de Higgins et al(32) han evaluado de manera prospectiva el rendimiento de esta versión en más de 55.000 pacientes, encontrando que la mortalidad predicha fue de 7456, y esta se correlacionó de manera satisfactoria con la mortalidad real (7331; 13.2%), obteniendo una razón de mortalidad de 0,983 (IC 95%, 0,963 – 1,001)(32). Hasta ese momento, se concluyó que el modelo era robusto y poseía una validez externa optima en la población americana, que fue de donde se obtuvieron los datos primarios.
Hace menos de 10 años, aparecen nuevos parámetros que influyen en el rendimiento de este score, al igual que otros, los cuales deben ser tomados en cuenta al establecer el pronóstico en cuidado crítico. Ho et al(33) llevaron a cabo un estudio de cohorte en Australia, donde evaluaron el impacto del anión gap y otros paraclínicos similares, sobre la mortalidad de 6878 individuos(33).
Los autores evidenciaron que el 13,4% falleció (n=924), resaltando las diferencias entre los marcadores acido-base entre los grupos de supervivientes vs. no supervivientes. El anión gap sumado al lactato, presentó un ABC 0,631; mientras que de forma aislada, presentó un ABC 0.521. Al ajustar la mortalidad predicha por MPM0-III de acuerdo a los marcadores, se evidenció que el lactato arterial se correlacionó con la variabilidad de la mortalidad, en comparación al anión gap, el cual perdió su valor predictivo(33). De manera más precisa, en países de bajos y medianos ingresos, han existido reportes que critican la precisión de este score, siendo necesarios adaptarlos bajo ciertas limitaciones, como es el caso del score R-MPM, en Rwanda(34).
Sin embargo, estudios que han comparado los scores APACHE, SAPS, y MPM0, han encontrado que aunque los tres poseen una buena calibración, el APACHE IV es superior en cuanto a su capacidad predictiva de mortalidad (ABC 0,745); mientras que SAPS y MPM0, presentan un ABC de 0,700 y 6,70, respectivamente(35). Chen et al(36) compararon ocho scores diferentes para evaluar la predicción de mortalidad general y a los 28 días, encontrando que APACHE III, era superior al resto en los dos desenlaces, con un ABC 0,817(36). Otro estudio que comparó APACHE II, SAPS III y MPM0 en 9549 pacientes, de los cuales murieron 1276(37). Se encontró que aunque APACHE II tuvo mejor ABC (0.,845) que SAPS III (0,836) y MPM0-III (0,807), SAPS III tuvo una mejor calibración y rendimiento general (pendiente de curva 1,03, R[2] 0,297) comparado a los otros dos(37). Hasta este punto, se entiende que de los tres scores estudiados, parece ser que APACHE tiene mejor rendimiento, independientemente de subgrupos, teniendo algunas variaciones en la calibración de acuerdo a ciertos parámetros, pero manteniendo un ABC adecuado. Se observa que MPM0 no es tan confiable y es dependiente de muchos ajustes por variables.
SOFA
Este score, fue diseñado posterior a un evento en el año de 1994, compuesto por criterios clínicos y paraclínicos, que permiten evaluar la presencia de daño multiorgánico. Se ha asociado mucho a infecciones y sepsis, siendo estos los diagnósticos a partir de los cuales se han hecho los estudios más robustos a la fecha(38-43). Análisis retrospectivos de más de 180.000 pacientes, han encontrado una discriminación de mortalidad hospitalaria dada por un ABC 0,753 (IC 99%, 0,750 – 0,757); estando por encima de versiones resumidas y otros criterios de respuesta inflamatoria sistémica(38). Favorablemente, al realizar análisis de sensibilidad múltiple para desenlace de mortalidad intrahospitalaria, el estimado pronostico se sostuvo, lo que puede reflejar una adecuada validez externa. Actualmente, se ha discutido la amplitud de la aplicabilidad de este score, siendo respaldado por sociedades científicas de cuidado critico de reconocimiento internacional. Se ha postulado como un marcador de referencia de eficacia en ensayos clínicos, ya que las variaciones entre los distintos estudios y comparado a otros parámetros, es mínima(39). Liu et al(40) evaluaron a 1865 pacientes en China quienes tenían sepsis y fueron ingresados a UCI, a los cuales se les midió lactato sérico, SOFA y quick SOFA (qSOFA), para comparar el valor predictivo respecto a mortalidad. Se encontró que el SOFA presentó mayor ABC (0,686; IC 95%, 0,661 – 0,710), en comparación a los otros dos parámetros (lactato sérico, ABC 0,664; IC 95%, 0,639 – 0,689 vs. qSOFA, ABC 0,547; IC 95%, 0,521 – 0,574)(40). En falla cardiaca aguda descompensada, el SOFA se asocia de manera significativa a mortalidad general y a 30 días, con un ABC 0,765 (IC 95%, 0,733 – 0,798) y 0,706 (IC 95%, 0,676–0,736), respectivamente(41). En pacientes con sospecha de infección que son evaluados en el servicio de urgencias, un score de SOFA ≥2 se asocia de manera independiente con mortalidad hasta incluso 2 años posteriores (HR 1,90; 1,83 - 1,98)(42). Esta precisión, se ha obtenido en otros estudios que también han estudiado muestras representativas en varios lugares del mundo(43).
En función de estos resultados, probablemente SOFA sea el score más preciso y más usado en la actualidad a nivel global. Aunque necesita de paraclínicos para su cálculo, lo que dificultaría establecer la predicción de manera oportuna en países de bajos y medianos ingresos, donde no se cuentan con muchos centros especializados y disponibilidad de equipos individuales por departamentos o unidades de tratamiento.
Rendimiento del SOFA a lo largo del tiempo y el dilema de la raza
Durante la pandemia de COVID-19, debido a la variedad de información desconocida sobre el manejo de estos pacientes, diversos análisis permitieron observar discrepancias y correlaciones no estudiadas a profundidad previamente, las cuales tienen el potencial de modificar el rendimiento de scores en cuidado crítico, como lo es el SOFA. A lo largo del tiempo, se ha estudiado a profundidad este sistema de puntaje, sosteniéndose desde los principios del año 2000, como un score sencillo pero eficaz en predecir mortalidad(44).
A medida que aparecen nuevas definiciones, es necesario revalidar el rendimiento de los scores. En el 2017, con la aparición de la tercera definición de sepsis, Matics & Sanchez-Pinto(45) publicaron los resultados de la adaptación y validación de este sistema en población pediátrica, por medio de la evaluación de 8 711 eventos, obteniendo una mortalidad de 2,6% y un ABC 0,94 (IC 95%, 0. ,92-0,95)(45). Otros estudios como los de Pawar et al(46) y Arakawa et al(47), discutieron la variabilidad del SOFA frente a distintos estados infecciosos y de coagulación intravascular diseminada (CID), respectivamente. Los primeros, evidenciaron que el ABC osciló entre 0,59 (IC 95%, 0,49 - 0,70) y 0,79 (IC 95%, 0,69 - 0,90), para los casos con endocarditis y bacteriemia aislada(46).
Los segundos, desarrollaron el SOFACOMB, al encontrar que en la CID el ABC a los 2, 4 y 7 días, fue mucho mayor comparada a la versión original (p <0.002)(47). En pacientes COVID-19, el SOFA sirvió para predecir el desarrollo de fenotipo severo (ABC 0. ,908; IC 95%, 0,857 - 0,960) y mortalidad general y a 60 días (ABC 0,995; IC 95%, 0,985 - 1.000)(48). En octagenarios, la precisión varía dependiendo de variables como el día de evaluación del score, falla neurológica, polifarmacia al ingreso, entre otros; los cuales pueden generar un ABC entre 0,71 y 0,91(49). En este orden de ideas, particularmente ha medida que aparecen nuevas definiciones y se van incorporando nuevos parámetros a la utilización de las mismas, es necesario reevaluar la variabilidad de los scores, de acuerdo a la estratificación de pacientes por subgrupos(50,51).
Una situación muy interesante que se evidenció durante el manejo de pacientes COVID-19, fue el impacto que tuvo la raza sobre los desenlaces generales, específicos y el valor predictivo del SOFA(52-54). A principios del 2021, Rodriguez et al(52) realizaron un análisis del registro de enfermedad cardiovascular de la Asociación Americana del Corazón sobre los hospitalizados por COVID-19, incluyendo a 7868 pacientes. El grupo estudiado fue heterogéneo, compuesto por hispanos (33%), afros no hispanos (25,5%), asiáticos (6,3%) y caucásicos no hispanos (35,2%). Se observó que la mortalidad general fue del 18%, y que el 53% de estas se concentraron en pacientes hispanos y afros. Al ajustar la morbilidad y la mortalidad, por la raza, esto poseen la mayor carga, aunque los asiáticos presentaron con mayor frecuencia severidad cardiopulmonar por COVID-19(52).
Gershengorn et al(53) realizaron un estudio de cohorte retrospectivo bicéntrico con 1127 en los Estados Unidos para esa misma fecha, los cuales también poseían cierta heterogeneidad étnica (63,1% caucásicos, 28,7% afrodescendientes; 54,2% del total fueron pacientes hispanos). Los autores no encontraron asociación entre la etnia y variabilidad en la predicción de la mortalidad al tomar como referencia el grupo de caucásicos (Afrodescendientes [IRR 1,00; IC 95%, 0,89 - 1,12]; asiáticos [IRR 0,95; IC 95%, 0,62 - 1,45]; multiraciales [IRR 0,93; IC 95%, 0,72 - 1,19](53). Ashana et al(54) también evaluaron este fenómeno a través del análisis de más de 113 000 pacientes, siendo el 24,4% afrodescendientes.
Al comparar el SOFA con el Laboratory-based Acute Physiology Score (LAPS2), se evidenció que este último discrimina con mayor precisión los desenlaces en pacientes afrodescendientes (ABC 0,76; IC 95%, 0,76 - 0,77 vs. ABC 0,68; IC 95%, 0,68 - 0,69). El LAPS2 demostró estar mejor calibrado al predecir mortalidad en ambos grupos raciales. Al retirar el ítem de creatinina del SOFA, se redujo la descalibración(54). Los autores, concluyeron es necesario desarrollar scores más equitativos, y claramente, se puede evidenciar que al evaluar muestras más robustas, se observa con mayor facilidad la brecha existente. Se puede inferir entonces que en países donde predomina esta raza, deberían existir mayores disparidades con el uso de este score.
Otros autores, han demostrado recientemente que siguen existiendo además, disparidades en cuanto a la prioridad de otorgar ventiladores y de asignar atención prioritaria por medio de cuidado estándar en eventos crisis, lo que culminó en un exceso de mortalidad (hasta un 43.9% en afrodescendientes) prevenible(55-57). Esto, sumado a la subestimación que puede darse en ciertos contextos clínicos, puede incrementar la morbilidad, mortalidad o discapacidad entre los grupos raciales, principalmente en afrodescendientes. Entonces, evidentemente es necesario reevaluar o diseñar scores que tengan una mayor precisión, tomando en cuenta las consideraciones discutidas sobre la raza y los distintos contextos clínico-patológicos.
Conclusiones
Actualmente, existen numerosos sistemas de puntaje con un valor predictivo útil para mortalidad y desenlaces asociados en cuidado crítico, los cuales se deben usarse racionalmente dependiendo de los diversos contextos clínicos. El puntaje SOFA, se ha destacado por poseer un rendimiento satisfactorio a lo largo de los años, siendo incluso adaptado y validado en pediatría y en su versión rápida. No obstante, parece verse afectado por la raza, subestimando la mortalidad principalmente en pacientes afrodescendientes, lo que puede culminar en un exceso de mortalidad prevenible.
Contribuciones de Autoría: Todos los autores participaron en la investigación, mediante la elaboración del proyecto, recolección y análisis de la información, así como en la preparación del manuscrito de la presente investigación.
Financiamiento: Autofinanciado.
Conflictos de intereses: Ninguno de los autores tiene conflicto de interés, de conformidad con la declaración de los mismos.
Recibido: 28 de junio 2022
Aprobado: 16 de agosto 2022
Correspondencia: Ivan David Lozada Martinez.
Dirección: Grupo Prometheus y Biomedicina Aplicada a las Ciencias Clínicas, Facultad de Medicina, Universidad de Cartagena, Cartagena, Colombia.
Email: ilozadam@unicartagena.edu.co
Artículo publicado por la Revista de la Facultad de Medicina Humana de la Universidad Ricardo Palma. Es un articulo de acceso abierto, distribuido bajo los términos de la Licencia Creatvie Commons: Creative Commons Attribution 4.0 International, CC BY 4.0(https://creativecommons.org/licenses/by/1.0/), que permite el uso no comercial, distribucion y reproducción en cualquier medio, siempre que la obra original sea debidamente citada. Para uso comercial, por favor póngase en contacto con revista.medicina@urp.edu.pe.