ARTICULO REVISIÓN
REVISTA DE LA FACULTAD DE MEDICINA HUMANA 2024 - Universidad Ricardo Palma
1 Departamento de Medicina, Fundación Universitaria San Martin, Sabaneta, Colombia.
2 Departamento de Medicina, Universidad de la Sabana, Chía, Colombia.
3 Departamento de Medicina, Fundación Universitaria San Martin, Cali, Colombia.
4 Departamento de Medicina, Universidad Simón Bolívar, Barranquilla, Colombia.
5 Departamento de Medicina, Unidad Central del Valle del Cauca, Tuluá, Colombia.
6 Departamento de Medicina, Universidad del Valle, Cali, Colombia.
7 Departamento de Medicina, Universidad del Magdalena, Santa Marta, Colombia.
8 Departamento de Medicina, Universidad Militar Nueva Granada, Bogotá, Colombia.
9 Fac Ciències Salut Blanquerna, University Ramon Llul, Barcelona, España.
a Médico.
b Magister en Epidemiología y Salud Pública.
c Doctorando en Salud, Bienestar y Bioética.
RESUMEN
Introducción: El cáncer de mama sigue siendo uno de los cánceres más frecuentes a nivel global,
específicamente, el más frecuente en el sexo femenino. El uso de inteligencia artificial promete
contribuir al diagnóstico precoz, a través de la imagenología. Previamente, no se ha descrito el
panorama y avance de esta producción científica.
Métodos: Estudio bibliométrico de corte transversal, que usó Scopus como fuente de datos. Se
utilizó el paquete bibliometrix de R para el cálculo de indicadores bibliométricos y visualización de
los resultados.
Resultados: Se seleccionaron 1292 documentos, publicados entre 1989 y 2024. El 75,3% (n=973)
fueron artículos con datos primarios, seguido de un 16,2% (n=209) correspondiente a revisiones. Se
identificó una colaboración internacional del 26,5%, y un crecimiento anual de la producción del 10,78%.
Se observó que, la clasificación de riesgo por screening, tomosíntesis digital de la mama, aprendizaje
por transferencia, segmentación y selección por características, son las palabras clave más comúnmente
usadas. En los últimos cinco años, el aprendizaje profundo y la mamografía, han sido los temas con mayor
popularidad. La colaboración internacional, ha sido liderada por Estados Unidos, China y Reino Unido.
Conclusiones: Se identificó un crecimiento notable en la investigación global sobre el uso de
inteligencia artificial en imagenología para la detección de cáncer de mama, marcado a partir de la
década del 2010, esencialmente por medio de publicación de artículos con datos primarios. La relación
entre inteligencia artificial e imagenología para diagnóstico de cáncer de mama, se ha centrado en
riesgo y predicción.
Palabras clave: Inteligencia Artificial, Mamografía, Ecografía Mamaria, Cáncer de Mama,
Bibliometría. (Fuente:
DeCS-BIREME)
ABSTRACT
Introduction: Breast cancer remains one of the most prevalent cancers globally, specifically the
most common in females. The use of artificial intelligence promises to contribute to early diagnosis
through imaging. Previously, the landscape and evolution of this scientific production have not been
described.
Methods: Cross-sectional bibliometric study using Scopus as the data source. The bibliometrix
package in R was employed for calculating bibliometric indicators and visualizing the results.
Results: 1292 documents published between 1989 and 2024 were selected. 75.3% (n=973) were
articles with primary data, followed by 16.2% (n=209) corresponding to reviews. An international
collaboration rate of 26.5% was identified, with an annual production growth of 10.78%. It was observed
that risk classification through screening, digital breast tomosynthesis, transfer learning,
segmentation, and feature selection were the most commonly used keywords. In the last five years, deep
learning and mammography have been the most popular topics. International collaboration has been led by
the United States, China, and the United Kingdom.
Conclusions: A notable growth in global research on the use of artificial intelligence in breast
cancer imaging for detection was identified, particularly since the 2010s, primarily through the
publication of articles with primary data. The relationship between artificial intelligence and imaging
for breast cancer diagnosis has focused on risk and prediction.
Keywords: Artificial Intelligence, Mammography, Mammary Ultrasonography, Breast Neoplasms,
Bibliometrics. (Source:
MeSH).
Introducción
En la actualidad, el cáncer de mama sigue siendo uno de los cánceres más frecuentes a nivel global, el
más frecuente en el sexo femenino, con elevada morbilidad, mortalidad, costos en salud y afectación de
la calidad de vida.(1, 2) En Latinoamérica, se estima que
se diagnostican un cuarto de los casos a nivel global, con una frecuencia de casi 500 mil.(2) Aunque el pronóstico de los canceres de mama ha mejorado notablemente en
países de altos ingresos, en países de bajos y medianos ingresos sigue siendo débil, con importantes
barreras en la implementación de estrategias relacionadas al diagnóstico y manejo precoz.(3 - 6)
El tamizaje, esencialmente por mamografía, ha demostrado ser útil en la detección temprana de este
cáncer.(7) Aún así, no en todos los escenarios es reproducible, o impacta de
la misma forma, debido a variables relacionadas a la formación en talento humano, infraestructura o
políticas públicas. Por tal motivo, se han diseñado herramientas que complementen el rendimiento de esta
ayuda diagnóstica, como la inteligencia artificial, para promover el flujo de paciente.(8) La ejecución de estudios con el diseño de algoritmos basados en patrones
imagenológicos y características clínicas, ha mejorado significativamente el rendimiento diagnóstico del
cáncer de mama.(9) Aún así, no existen grupos de investigación, líneas de
trabajo ni cohortes masivas, que faciliten el agrupamiento de datos basados en población.(10 - 12)
Con el objetivo de conocer el panorama de la investigación global sobre una herramienta que puede
modificar la detección precoz del cáncer de mama, y que sea replicable en gran número de escenarios,
incluyendo países de bajos y medianos ingresos,(13) el objetivo de este
estudio fue analizar la producción científica global relacionada al uso de inteligencia artificial en
imagenología para la detección de cáncer de mama.
Metodología
Se realizó un estudio bibliométrico de corte transversal, haciendo uso de la base de datos más grande de
literatura científica revisada por pares, Scopus. El uso de esta base para este tipo de análisis ha sido
utilizada previamente.(14, 15) Distinto a otros motores
de búsqueda, índices citacionales y bases de datos, como lo son PubMed o Web of Science, Scopus posee
mayor número de indexación de revistas biomédicas latinoamericanas, que facilitan la identificación de
evidencia de esta región.
Se diseñó y ejecutó una búsqueda estructurada, para identificar artículos relacionados al uso de
inteligencia artificial en imagenología para la detección de cáncer de mama. Para esto, se tomó en
cuenta la afiliación reportada en los metadatos y corroborara por la publicación oficial a texto
completo. La estrategia de búsqueda, se construyó haciendo uso de términos MeSH, así como sinónimos,
tanto en idioma inglés como español. Posterior a una prueba piloto, se definió utilizar la siguiente
búsqueda: TITLE-ABS-KEY(“Breast Carcinoma In Situ”) OR TITLE-ABS-KEY(“Breast Ductal Carcinoma”) OR
TITLE-ABS-KEY(“Lobular Carcinoma”) OR TITLE-ABS-KEY(“Triple Negative Breast Neoplasms”) OR
TITLE-ABS-KEY(“Unilateral Breast Neoplasms”) OR TITLE-ABS-KEY(“Inflammatory Breast Neoplasms”) OR
TITLE-ABS-KEY(“Breast Cancer”) OR TITLE-ABS-KEY(“Mammary Cancer”) OR TITLE-ABS-KEY(“Malignant Neoplasm
of Breast”) OR TITLE-ABS-KEY(“Breast Malignant Neoplasm”) OR TITLE-ABS-KEY(“Breast Malignant Tumor”) OR
TITLE-ABS-KEY(“Cancer of Breast”) OR TITLE-ABS-KEY( “Cancer of the Breast”) OR TITLE-ABS-KEY(“Breast
Carcinoma”) AND TITLE-ABS-KEY(“Artificial Intelligence”) OR TITLE-ABS-KEY(“Computational Intelligence”)
OR TITLE-ABS-KEY(“Machine Intelligence”) OR TITLE-ABS-KEY(“Computer Reasoning”) OR
TITLE-ABS-KEY(“Computer Vision System”) OR TITLE-ABS-KEY(“Machine Learning”) OR TITLE-ABS-KEY(“Deep
Learning”) OR TITLE-ABS-KEY(“Sentiment Analysis”) OR TITLE-ABS-KEY( “Neural Networks”) AND
TITLE-ABS-KEY(“Early Detection of Cancer”) OR TITLE-ABS-KEY(“Cancer Screening”) OR TITLE-ABS-KEY(“Cancer
Early Diagnosis”) OR TITLE-ABS-KEY(“Early Diagnosis”).
Esta búsqueda, fue realizada hasta el 10 de febrero de 2024, y fue filtrada con las etiquetas “Humanos”
y “Revistas”. De esta forma, fue excluida literatura que no sigue el proceso de revisión por pares
regular para publicación en revistas científicas, como, por ejemplo, libros, series de libros,
resúmenes, y memorias de eventos científicos. No se estableció una ventana límite de tiempo para
inclusión de artículos
Posteriormente, se realizó una revisión manual, para eliminar duplicados y aquellos artículos no
relacionados al tema de interés, basados en título, resumen y palabras clave. Todo lo anterior, se
realizó en Microsoft Office Excel 2016. Subsiguiente, se estandarizaron los datos de las variables de
interés, para reducir las discrepancias entre la forma en la que se registran los metadatos
originalmente. De esta forma, se reagruparon categorías. Por ejemplo, en el caso de tipología de
artículos, todos aquellos estudios originales, que aportaran datos primarios, independientemente del
diseño observacional o experimental, fueron categorizados como “Artículos con datos primarios”; de la
misma forma, todas aquellas revisiones, independientemente de su diseño (ya sea narrativa, sistemática o
meta-análisis), fueron categorizadas como “Revisiones”. Editoriales, cartas al editor, comentarios, etc;
fueron categorizados como “Correspondencias”.
Para el análisis estadístico, se emplearon métricas de redes, para visualizar las tendencias,
características, y calcular impacto científico. Se hizo uso del paquete bibliometrix de R para la
realización de este análisis, que permite calcular indicadores bibliométricos cuantitativos, así como la
visualización de los resultados (versión 4.3.1).(16) Sinónimos, errores,
plurales y variantes, fueron estrictamente reagrupados para hacer homogéneo el análisis. De esta forma,
se estandarizaron palabras clave, autores e instituciones. Agregado, se ejecutó el análisis descriptivo
de la producción científica encontrada. Se caracterizaron los autores más prolíficos, y la distribución
de publicaciones, por medio de la Ley de Lotka. Se construyeron redes de colaboración, para determinar
el grado y fuerza de colaboración entre países.
Para medir el impacto de instituciones y países, se hizo uso del índice h, así como valor absoluto de
citaciones acumuladas. Las definiciones y especificaciones del uso de estas métricas en estudios
bibliométricos, ha sido descrito previamente.(17, 18) El
cálculo de frecuencias y porcentajes, se realizó por medio de Microsoft Office Excel 2016.
Aspectos éticos: Este estudio no requirió aprobación por parte de comité de ética, teniendo en cuenta
que no realizó investigación en seres humanos, modelos biológicos o historial médico.
Resultados
Inicialmente, se identificaron 1833 documentos, los cuales, posterior a la aplicación de criterios de
inclusión y exclusión, fueron seleccionados finalmente 1292. De forma particular, del total de
documentos identificados inicialmente, 540 documentos correspondieron a conference paper. La ventana de
tiempo de la evidencia analizada, fue de 1989 a 2024 (35 años). De los documentos seleccionados, el
75,3% (n=973) fueron artículos con datos primarios, seguido de un 16,2% (n=209) correspondiente a
revisiones. Se identificó una colaboración internacional del 26,5%, y un crecimiento anual de la
producción del 10,78% (Tabla 1). Se observó un crecimiento lento hasta el año 2013, donde el incremento
en el volumen de publicaciones es notable, con pico en el año 2023, con más de 300 artículos publicados
(Figura 1-A). Contrario al número de citaciones obtenidas a lo largo del tiempo, el cual ha sido
fluctuante, con pico en 2019 (Figura 1-B). Al aplicar la ley de Lotka, se encontró que, el 84% de los
autores solo ha publicado un documento, seguido de un 9,8% con dos documentos.
|
n |
% |
---|---|---|
Tipología de artículo |
|
|
Artículo con datos primarios |
973 |
75,3 |
Revisión |
209 |
16,2 |
Correspondencias* |
110 |
8,5 |
Autores |
|
|
Autorías |
5517 |
- |
Autores de documentos con autoría única (N=5517) |
85 |
1,54 |
Colaboración |
|
|
Artículos con autoría única |
94 |
- |
Coautorías por artículo (media) |
5,7 |
- |
Coautoría internacional |
26,5 |
- |
Palabras clave |
2206 |
- |
Revistas |
535 |
- |
Edad promedio de artículo (años) |
3,84 |
- |
Promedio de citaciones por documento |
23,9 |
- |
Crecimiento anual |
- |
10,78 |
*Incluye cartas al editor, editoriales, comentarios, etc.
Figura 1. Crecimiento científico anual de la investigación global sobre uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Frecuencia de publicación anual. B. Promedio de citas recibidas por artículo por año.
Estados Unidos fue el país más prolífico con 311 documentos, así como el que más impacto ha obtenido
(índice h de 52 y 11.757 citaciones). Le siguen China (índice h de 33 y 4231 citaciones) e India (índice
h de 30 y 2862 citaciones), con 213 y 186 documentos, respectivamente. En cuanto a
afiliaciones/instituciones, Radboud University Medical Center (ubicada en Países Bajos) fue la
afiliación más prolífica y con mayor impacto, con 29 documentos e índice h de 19 (1425 citaciones),
seguido de Harvard Medical School (índice h de 12 con 1814 citaciones), Karolinska Institutet (índice h
de 14 con 1145 citaciones), y Massachusetts General Hospital (índice h de 14 con 1858 citaciones), con
24 documentos todas tres.
En cuanto a las revistas donde se ha publicado esta evidencia, Radiology es la revista con mayor número
de documentos (n=44) (Figura 2-A). Sin embargo, la revista Nature ha recibido el mayor número de
citaciones (2102 citaciones) (Figura 2-B). Aún así, Radiology ha obtenido el mayor impacto, medido por
los índices h y g (19 y 38, respectivamente) (Figura 2C-D), mientras que Diagnostics ha obtenido el
mayor índice m (2,75) (Figura 2-E). Radiology y Cancers, son las revistas que han crecido más
notablemente en los últimos siete años (Figura 2-F).
Figura 2. Impacto y frecuencia de publicación en revistas con el mayor número de documentos sobre el uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Frecuencia de artículos publicados. B. Total de citaciones obtenidas. C. Índice h obtenido. D. Índice g obtenido. E. Índice m obtenido. F. Frecuencia acumulada a lo largo del tiempo de artículos en las revistas más populares.
En cuanto a tendencias y patrones de investigación, por medio de la construcción de nube de palabras, se
observó que, la clasificación de riesgo por screening, tomosíntesis digital de la mama, aprendizaje por
transferencia, segmentación y selección por características, son las palabras clave más comúnmente
usadas (Figura 3-A). En los últimos cinco años, el aprendizaje profundo y la mamografía, han sido los
temas con mayor popularidad (Figura 3-B), mientras que, en los últimos 10 años, otros tópicos como
aprendizaje automático, redes neuronales, densidad mamaria, minería de datos y estratificación de
riesgo, también han ganado gran interés en la investigación de este campo (Figura 3C-D). Los
biomarcadores ligados a la ecografía mamaria y su potencial diagnóstico, surgen como nichos temáticos,
mientras que la tomosíntesis digital de mama y la biopsia liquida, son temas emergentes (Figura 3-E). El
análisis factorial por correspondencia múltiple, muestra una asociación notable entre los tópicos de: 1)
Radiómica, resonancia magnética nuclear y estratificación de riesgo; 2) Mamografía, redes neuronales y
clasificación de imágenes; 3) Densidad de mama, tomosíntesis y termografía (Figura 3-F).
Figura 3. Evolución y tendencias de la investigación global sobre uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Nube de palabras clave más frecuentes. B. Evolución de los tópicos más frecuentes a lo largo del tiempo. C. Frecuencia de tópicos a partir del 2010. D. Red de co-ocurrencia de palabras clave. E. Mapa temático con grado de desarrollo y relevancia de tópicos. F. Análisis de correspondencia múltiple con grado de contribución de cada tópico.
En cuanto a redes de colaboración, se pudo visualizar que, la escuela de medicina de la Universidad de
Harvard, Universidad de Pensilvania, Instituto Karolinska, y el Centro Médico Universitario Radboud,
lideran la colaboración internacional, colaborando todas las instituciones, con instituciones
esencialmente europeas y norteamericanas (Figura 4-A). Respecto a los países, se identificó una sólida
colaboración entre Estados Unidos, China y Reino Unido. Específicamente, China colabora fuertemente con
países del continente asiático, mientras que, Estados Unidos y Reino Unido, lo hace con países europeos
(Figura 4-B). Distinto a Brasil, no se identificó otro país latino que destacara en colaboración
internacional en el tema de interés.
Figura 4. Redes de colaboración institucional y de países en investigación global sobre uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Colaboración entre afiliaciones. B. Colaboración entre países.
Al resumir los artículos con el mayor impacto obtenido a la fecha, medido por número de citaciones
recibidas, se encontró que, los tres más destacados fueron: 1) International evaluation of an AI system
for breast cancer screening (1282 citaciones; publicado en Nature en 2020; DOI:
10.1038/s41586-019-1799-6); 2) Artificial intelligence in cancer imaging: Clinical challenges and
applications (901 citaciones; publicado en CA: A Cancer Journal for Clinicians en 2019; DOI:
10.3322/caac.21552); 3) Deep Learning to Improve Breast Cancer Detection on Screening Mammography (541
citaciones; publicado en Scientific Reports en 2019; DOI: 10.1038/s41598-019-48995-4).
Discusión
Este análisis, revela por primera vez la evolución de los patrones y tendencias de la investigación
global relacionada al uso de inteligencia artificial en imagenología para el diagnóstico de cáncer de
mama. Se identificó que, a pesar de haberse identificado las primeras publicaciones a finales de la
década de los 80 y a principios de los 90, solo fue a partir de la década del 2010, que hubo un
incremento paulatino pero notable de la producción científica global sobre el uso de la inteligencia
artificial aplicado a la imagenología para la detección de cáncer de mama. Esto, puede explicarse por la
difusión y avance del uso de las herramientas de las ómicas, ligado a la inteligencia artificial, el
cual se ha expandido rápidamente.(19, 20) Sin embargo,
países de los continentes latinoamericanos y africanos, aún tienen un nivel de investigación, así como
de colaboración internacional, muy modesto, a pesar de ser regiones con importantes necesidades en la
atención y detección precoz del cáncer de mama.(21) Posiblemente, la
ausencia de evidencia y datos sobre el estado actual de la investigación aplicada de la inteligencia
artificial en imagenología y cáncer de mama, ha impedido la construcción de una hoja de ruta basada en
evidencia, que impulse la investigación de este campo.
Se puede inferir que, por la masiva existencia de redes, consensos y colaboraciones internacionales
sobre cáncer de mama,(22, 23) localizadas esencialmente
en Estados Unidos y Europa, es que estos continentes han progresado de forma importante en la innovación
de aplicación de técnicas novedosas de inteligencia artificial ligada a la detección precoz,
estratificación de riesgo, y predicción del cáncer de mama. Aun así, se determinó un porcentaje de
colaboración internacional menor al 30%. La aplicación de investigación traslacional, con búsqueda de
biomarcadores por medio del uso de las ómicas, y apoyado en la minería de datos analizada por
inteligencia artificial, permite la construcción de clusters basado en características comunes,
clínicas, imagenológicas e histopatológicas, para lograr resultados aplicables y con un rendimiento
aceptable en la práctica asistencial.(24, 25)
Es por la emergencia de este nicho de investigación, que se puede apreciar el notable número de
citaciones e impacto acumulado, a pesar de los pocos años del crecimiento dramático de la producción
científica. El uso de aprendizaje profundo, redes neuronales, aprendizaje automático, y aprendizaje por
transferencia, permite la alimentación de algoritmos con un alto grado de precisión para la
identificación de patrones sugestivos de malignidad, que faciliten la detección precisa de un cáncer de
mama.(26) Considerando que, existen variables no modificables en la
fisiopatología y evolución del cáncer,(27) es necesario reproducir de forma
rigurosa y sólida este tipo de estudios, que impulsen el cumplimiento de metas en salud.
Favorablemente, en función de la construcción esperable de nuevo conocimiento, la evidencia existente es
predominantemente a expensas de datos primarios. Aún así y, basados en la brecha del origen de los
datos, todavía existen muchos lugares del mundo donde la producción de datos es muy baja o nula, lo que
podría sesgar el potencial predictivo de un algoritmo basado en características clínicas, sociales o
genéticas de distintas poblaciones. Pero, esto no resta el avance importante identificado en el presente
análisis.
Como limitaciones, se encuentra el uso de una sola base de datos e índice citacional, Scopus, pero se ha
reportado como la base con el mayor número de literatura indexada en ciencias de la salud. Así mismo, el
sesgo inherente del margen de error de los metadatos registrados. No obstante, para el control de esto,
se realizó el proceso de revisión y estandarización manual por parte de los autores.
Conclusiones
Se identificó un crecimiento notable en la investigación global sobre el uso de inteligencia artificial
en imagenología para la detección de cáncer de mama, marcado a partir de la década del 2010,
esencialmente por medio de publicación de artículos con datos primarios. La producción ha sido liderada
por Estados Unidos, China e India. Sin embargo, las redes de colaboración internacional, son lideradas
por Estados Unidos, China y Reino Unido. Dentro de los nichos y patrones de investigación más populares,
se encuentran el aprendizaje por transferencia, aprendizaje profundo, redes neuronales, aprendizaje
automático, segmentación y selección por características, ligado a la mamografía y tomosíntesis digital
de la mama, para la estratificación de riesgo.
Contribuciones de Autoría:
Todos los autores participaron en la investigación, mediante la elaboración del proyecto,
recolección y análisis de la información, así como en la preparación del manuscrito de la
presente investigación.
Financiamiento:
Autofinanciado
Declaración de conflictos de intereses:
Ninguno de los autores tiene conflicto de interés, de conformidad con la declaración de los
mismos.
Recibido:
20 de Febrero del 2024
Aprobado:
16 de Junio del 2024
Correspondencia:
Yelson Picón Jaimes.
Dirección:
Fac Ciències Salut Blanquerna, University Ramon Llul, Barcelona, España.
Teléfono:
+34 645 68 54 60
Correo electrónico:
colmedsurg.center@gmail.com
Artículo publicado por la Revista de la Facultad de Medicina Humana de la Universidad Ricardo Palma. Es un articulo de acceso abierto, distribuido bajo los términos de la Licencia Creatvie Commons: Creative Commons Attribution 4.0 International, CC BY 4.0(https://creativecommons.org/licenses/by/4.0/), que permite el uso no comercial, distribucion y reproducción en cualquier medio, siempre que la obra original sea debidamente citada. Para uso comercial, por favor póngase en contacto con revista.medicina@urp.edu.pe.