Saltar al contenido principal

Especificación de endpoints

En esta parte de la documentación, describimos todos los esquemas de datos para los endpoints de la API del dispositivo médico. En lugar de detallar cada endpoint y sus recursos aquí, hemos optado por incrustar la documentación de la API generada automáticamente dentro de un iframe.

Este enfoque ofrece varias ventajas:

  • Actualizaciones en tiempo real: El iframe refleja directamente los últimos cambios y adiciones al código base de la API, lo que garantiza que siempre tengas la información más precisa.
  • Consistencia: Al vincular a la documentación fuente, eliminamos el riesgo de discrepancias o contenido desactualizado dentro de este documento.
  • Sin redundancia: Evitar la duplicación ayuda a mantener esta documentación concisa, enfocada y perfectamente alineada con los modelos de datos en el código.

Utiliza la interfaz interactiva proporcionada en el iframe para explorar los endpoints disponibles, revisar las estructuras y formatos de las solicitudes y respuestas, y explorar ejemplos. Cualquier cambio en nuestra API se refleja instantáneamente allí, por lo que puedes confiar en que siempre estás viendo la versión más actual y confiable de nuestras especificaciones de endpoints.

Explicación

El dispositivo funciona de una manera bastante sencilla: envías imágenes y recibes un DiagnosticReport, tal como se define en las especificaciones FHIR® de HL7. El siguiente gráfico explica los conceptos básicos:

Soporte diagnóstico

Aunque diagnóstico es una forma cotidiana de referirse a la salida del dispositivo, ten en cuenta que lo que el dispositivo genera es un representación interpretativa de la distribución de posibles clases de la Clasificación Internacional de Enfermedades (ICD) que podrían estar representadas en el contenido de píxeles de la imagen.

De hecho, los profesionales y organizaciones de la salud pueden usar los datos generados por el dispositivo para informar un diagnóstico, pero lo que el dispositivo en sí genera no es un diagnóstico. Esto se señala adecuadamente en la salida del dispositivo, que sigue el estándar FHIR al indicar que la salida es un DiagnosticReport, con un estado de preliminary.

Medida de severidad

Aunque medida de severidad es una forma cotidiana de referirse a la salida del dispositivo, ten en cuenta que lo que el dispositivo genera es un cuantificación de la intensidad, la cantidad y la extensión de signos clínicos visibles.

De hecho, los profesionales y organizaciones de la salud pueden usar los datos generados por el dispositivo para determinar el grado de afectación de un paciente, pero lo que el dispositivo en sí genera no es la severidad. Esto se señala adecuadamente en la salida del dispositivo, que sigue el estándar FHIR al indicar que la salida es un DiagnosticReport, con un estado de preliminary.

Indicadores clínicos

Los indicadores clínicos son un conjunto de valores derivados de la salida de soporte diagnóstico del dispositivo. La salida de soporte diagnóstico del dispositivo es un representación interpretativa de la distribución de posibles clases de la Clasificación Internacional de Enfermedades (ICD) que podrían estar representadas en el contenido de píxeles de la imagen. En otras palabras, es una distribución de probabilidad en la que a cada categoría ICD-11 se le asigna un valor de probabilidad entre 0 y 1. Como es una distribución de probabilidad, la suma de toda la distribución es igual a 1.

Confirmación de condición

La salida de soporte diagnóstico del dispositivo cubre una amplia gama de categorías ICD-11, excepto una clase: Lesión no específica. Esta clase se activa cuando el dispositivo no encuentra ninguna condición en la imagen.

Con esto en mente, es posible determinar a partir de la distribución de probabilidad predicha qué tan probable es que la imagen contenga algún tipo de condición (hasCondition). Esto se puede hacer sumando las probabilidades de todas las clases, excluyendo Lesión no específica, lo cual se logra con la siguiente fórmula: Sin embargo, hay una forma más rápida y eficiente de calcularlo:

pcondition=1pnslp_{condition}= 1 - p_{nsl}

Donde pnslp_{nsl} es la probabilidad asignada a la categoría Lesión no específica en la distribución de probabilidad. Como la suma de toda la distribución de probabilidad es igual a 1, la probabilidad de que la imagen represente una condición es simplemente la resta de la probabilidad de Lesión no específica del total (1).

Hallazgos de suma ponderada

Varios indicadores clínicos (pigmentedLesion, urgentReferral, highPriorityReferral y malignancy) se obtienen mediante una suma ponderada de la salida del dispositivo, utilizando pesos de categoría definidos específicamente para cada hallazgo. Estos pesos son valores binarios (0 o 1) e indican qué categorías ICD-11 de la salida contribuyen al valor del hallazgo.

  • Para el hallazgo pigmentedLesion, todas las categorías ICD-11 que corresponden a una lesión pigmentada reciben un peso positivo (wi=1w_i=1) y negativo (wi=0w_i=0) en caso contrario.
  • Para el hallazgo urgentReferral, todas las categorías ICD-11 relacionadas con condiciones que requieren derivación urgente (es decir, deben derivarse entre 0-48 horas) reciben un peso positivo (wi=1w_i=1) y negativo (wi=0w_i=0) en caso contrario.
  • Para el hallazgo highPriorityReferral, todas las categorías ICD-11 relacionadas con condiciones que, aunque no requieren una derivación urgente, tienen una mayor prioridad de derivación que otras (es decir, derivadas en 7-15 días), reciben un peso positivo (wi=1w_i=1) y negativo (wi=0w_i=0) en caso contrario.
  • Para el hallazgo malignancy, todas las categorías ICD-11 relacionadas con malignidad (cáncer de piel) reciben un peso positivo (wi=1w_i=1) y negativo (wi=0w_i=0) en caso contrario.

El valor de cada hallazgo (ff) se calcula utilizando la suma ponderada de la salida del dispositivo (es decir, la distribución de probabilidad):

f=i=1Nwipif = \sum_{i=1}^{N} w_i \cdot p_i

Donde NN es el número total de categorías ICD-11 predichas, y wiw_i y pip_i son el peso y la probabilidad de la ii-ésima categoría de la distribución.

Categorías de la ICD-11 relacionadas con la malignidad
Código CIE-11CategoríaMalignidad
2C30.3Melanoma lentiginoso acro, primario1
2C33Adenocarcinoma anexial1
2E63.00Lentigo maligno1
2B56.1Angiosarcoma de la piel1
2C32Carcinoma basocelular de la piel1
2D41Carcinoma1
2C30Melanoma1
2B0ZLinfoma cutáneo primario de linfocitos T, tipo indeterminado o no especificado1
2B53.YDermatofibrosarcoma protuberans1
2B57.ZSarcoma de Kaposi1
2C34Carcinoma neuroendocrino cutáneo (Carcinoma de las células de Merkel)1
2E08Neoplasia maligna metastática que afecta a la piel1
1G60.0Mycetoma1
2B01Micosis fungoide1
2B0YOtros Linfomas de células T maduras o células NK y trastornos linfoproliferativos, tipos cutáneos primarios especificados1
2C31Carcinoma de células escamosas de la piel1
EB13Síndrome de Stevens-Johnson o necrólisis epidérmica tóxica1
2C32.2Carcinoma basocelular superficial de la piel1
1A6ZSífilis, sin especificación1

Indicadores de rendimiento

Los indicadores de rendimiento son un conjunto de valores que proporcionan una comprensión más profunda del rendimiento del dispositivo en el reconocimiento de enfermedades de la piel en una entrada dada, así como en los datos de prueba internos utilizados durante el desarrollo. De manera similar a los indicadores clínicos, se derivan de la salida de soporte diagnóstico del dispositivo, que es un representación interpretativa de la distribución de posibles clases de la Clasificación Internacional de Enfermedades (ICD) que podrían estar representadas en el contenido de píxeles de la imagen. En otras palabras, es una distribución de probabilidad en la que a cada categoría ICD-11 se le asigna un valor de probabilidad entre 0 y 1. Como es una distribución de probabilidad, la suma de toda la distribución es igual a 1.

Sensibilidad y especificidad Top-K

Para medir el rendimiento del dispositivo en el reconocimiento de enfermedades de la piel para cada categoría ICD-11 específica, calculamos métricas de sensibilidad y especificidad Top-K por categoría en nuestro conjunto de prueba reservado. Estas son métricas comunes para escenarios de clasificación binaria:

  • Sensibilidad (también conocida como tasa de verdaderos positivos) es la probabilidad de una salida positiva, condicionada a que el caso de prueba sea realmente positivo.
  • Especificidad (o tasa de verdaderos negativos) es la probabilidad de una salida negativa, condicionada a que el caso de prueba sea realmente negativo.
Sensibilidad=TPTP+FNSensibilidad=\frac{TP}{TP + FN} Especificidad=TNTN+FPEspecificidad=\frac{TN}{TN + FP}

Para aplicar estas métricas a nuestro escenario multiclase, utilizamos la siguiente estrategia para cada categoría ICD-11 CC. También modificamos las métricas para tener en cuenta el caso de uso de soporte diagnóstico (es decir, observando las sugerencias Top-K en lugar de solo la predicción Top-1):

  1. Si la etiqueta de verdad del caso de prueba corresponde a la clase CC, se considera un caso positivo (1), y negativo (0) si es cualquier otra categoría ICD-11.
  2. Si la categoría CC está dentro de las clases Top-K predichas, la predicción se considera una salida positiva (1). Si la categoría CC no está en la lista Top-K, la salida es negativa (0).

Como las predicciones y las etiquetas de verdad se han convertido en un caso binario (0/1), podemos calcular sensibilidad y especificidad utilizando verdaderos positivos, falsos negativos, falsos positivos y verdaderos negativos:

Salida positivaSalida negativa
Etiqueta positiva✔️ Verdadero positivo (TP) Falso negativo (FN)
Etiqueta negativa Falso positivo (FP)✔️ Verdadero negativo (TN)

Calculamos sensibilidad y especificidad para varios valores de KK (1,3, 5), lo que resulta en los indicadores de rendimiento de sensibilidad y especificidad Top-1, Top-3 y Top-5.

Entropía

Este hallazgo se incluye para proporcionar al usuario una estimación de la incertidumbre asociada a la salida de soporte diagnóstico del dispositivo. La entropía normalizada (HH) se define como:

H=i=1Npiln(pi)ln(N)H=-\frac{\sum_{i=1}^{N}p_i \cdot \ln(p_i)}{\ln(N)}

Donde ln\ln es el logaritmo natural, NN el número total de categorías ICD-11, y pip_i la probabilidad de la ii-ésima categoría en la distribución de probabilidad.

Valores bajos de entropía indican que la masa de la distribución está concentrada en un número reducido de categorías, lo que puede interpretarse como que el dispositivo está seguro de su predicción. Por el contrario, valores altos de entropía indican que la masa de la distribución de probabilidad está distribuida de manera uniforme entre todas las categorías, lo que sugiere que el dispositivo no está seguro de su predicción.