Welcome to Our Website

Frontiers in Oncology

Introducción

la secuenciación de próxima generación (NGS) se ha expandido rápidamente al entorno clínico en Hemato-Oncología y oncología, ya que puede traer grandes beneficios para el diagnóstico, la selección de tratamiento y/o el pronóstico para muchos pacientes (1)., Recientemente, se han publicado varios artículos sobre la validación de los NGS dirigidos profundos en Oncología Clínica (2, 3), incluida una recomendación exhaustiva de la Asociación de Patología Molecular y el Colegio de Patólogos estadounidenses (1). Sin embargo, la falta de estandarización de los métodos NGS dirigidos todavía limita su implementación en la práctica clínica (4).

Un desafío en particular es la detección correcta de mutaciones presentes a bajas frecuencias de alelos variantes (VAF) y la estandarización de la profundidad de cobertura de secuenciación (1, 5, 6)., Esto es especialmente importante para las mutaciones que tienen impactos clínicos a frecuencias subclonales (1) como el caso de las mutaciones del gen TP53 (TP53mut) en la leucemia linfocítica crónica (LLC) (7, 8). Las aberraciones de TP53 (TP53mut y/o deleción del cromosoma 17P) se encuentran entre los marcadores pronósticos y predictivos más fuertes que guían las decisiones de tratamiento en la LLC (9)., Hoy en día, el European Research Initiative on Chronic Lymphocytic Leukemia (ERIC) recomienda detectar TP53mut con un límite de detección (LOD) de al menos un 10% de VAF (10), y existe un creciente cuerpo de evidencia dedicada al impacto clínico de pequeños SUBCLONES mutados de TP53 en la LLC (7, 8).

la secuenciación de Sanger y el NGS dirigido profundo son actualmente las técnicas más utilizadas para el análisis TP53mut (10), así como para el análisis de otros genes con impactos clínicos a bajas frecuencias alélicas., Aunque la secuenciación de Sanger proporciona un enfoque de secuenciación relativamente accesible, carece de la sensibilidad necesaria para detectar subclones debido a su límite de detección del 10-20% de alelos mutados (10). El análisis basado en NGS ha ganado así prominencia en los laboratorios de diagnóstico para la detección de variantes somáticas y se están desarrollando varios desarrollos técnicos de estrategias de corrección de errores, tanto computacionales como experimentales, para la identificación precisa de variaciones genéticas de bajo nivel (11)., Por lo tanto, abordamos la importancia de la correcta determinación de la profundidad de secuenciación en el NGS diagnóstico para obtener una detección segura y reproducible, no solo de variantes de baja VAF. Finalmente, realizamos un experimento de dilución para confirmar nuestros cálculos teóricos, y terminamos discutiendo nuestra experiencia con la detección diagnóstica de TP53mut en pacientes con LLC y otras perspectivas sobre la estandarización de NGS en el diagnóstico de cáncer.,

profundidad de secuenciación NGS y tasa de Error

la profundidad de secuenciación NGS afecta directamente la reproducibilidad de la detección de variantes: cuanto mayor sea el número de lecturas de secuencia alineadas, mayor será la confianza en la llamada base en una posición particular, independientemente de si la llamada base es la misma que la base de referencia o está mutada (1). En otras palabras, las lecturas de errores de secuenciación individuales son estadísticamente irrelevantes cuando son superadas en número por lecturas correctas., Por lo tanto, la profundidad de cobertura deseada debe determinarse en función del LOD previsto, la tolerancia a resultados falsos positivos o falsos negativos y la tasa de error de secuenciación (1, 11).

Usando una distribución binomial, se puede calcular la probabilidad de resultados falsos positivos y falsos negativos para una tasa de error dada, así como el LOD previsto, y se puede estimar el umbral para una variante que requiere una profundidad dada (1)., Por ejemplo, dada una tasa de error de secuenciación del 1%, una carga de alelos mutantes del 10% y una profundidad de cobertura de 250 lecturas, la probabilidad de detectar 9 o menos lecturas mutadas es, según la distribución binomial, del 0,01%. Por lo tanto, la probabilidad de detectar 10 o más lecturas mutadas es del 99,99% (100-0, 01%), y se puede definir el umbral para una llamada de variante. En otras palabras, una profundidad de cobertura de 250 con un umbral de al menos 10 lecturas mutadas tendrá un 99.,99% de probabilidad de que el 10% de la carga del alelo mutante no se pierda por la llamada de la variante (aunque se puede detectar en una proporción diferente). De esta manera, el riesgo de un resultado negativo falso se minimiza en gran medida. Por otro lado, la probabilidad de falsos positivos depende en gran medida de la tasa de error de secuenciación (ya que la precisión de todas las mediciones analíticas depende de la relación señal-ruido) (1, 11). En nuestro ejemplo, la probabilidad de un resultado falso positivo es de 0.025%; sin embargo, la tasa de falsos positivos no es despreciable al disminuir el LOD al valor cercano a la tasa de error., Las tasas de error intrínsecas convencionales de NGS varían entre 0.1 y 1% (puntuación de calidad Phred de 20-30) (1, 11) dependiendo de la plataforma de secuenciación, el contenido de GC de las regiones objetivo (12) y la longitud del fragmento, como se muestra en la secuenciación de extremo emparejado Illumina (13). Por lo tanto, la detección de variantes en VAFs <2% se ve afectada por un alto riesgo de resultado falso positivo, independientemente de la profundidad de cobertura., También es importante mencionar que la tasa de error de secuenciación se aplica solo a los errores producidos por la propia secuenciación y no incluye otros errores introducidos durante el procesamiento del ADN y la preparación de la biblioteca, particularmente durante los pasos de amplificación, que aumentan aún más las tasas de error (1, 11).

cobertura mínima de secuenciación en entornos clínicos

actualmente no hay consenso sobre la cobertura mínima requerida en un entorno clínico utilizando resecuenciación dirigida profunda por NGS, por lo que cada laboratorio tiene que establecer sus propios parámetros para cumplir con la calidad suficiente (1, 5)., Hasta la fecha, solo unos pocos estudios han recomendado los criterios de cobertura mínima para el NGS dirigido profundo en Oncología Clínica: 500 profundidad de cobertura y un LOD del 5% (2), 300-500 profundidad de cobertura sin desafiar el LOD (3), 250 profundidad y un LOD del 5% con ajuste de umbral a 1.000 profundidad de cobertura en casos de variantes heterogéneas en muestras de baja celularidad tumoral (1), y 100 profundidad con al menos 10 lecturas de variantes y un LOD del 10% (10)., De acuerdo con la distribución binominal de datos, una profundidad de cobertura de 250 debería ser suficiente para detectar un 5% de VAF con un umbral de variante que soporte lecturas ≥5 (Figura 1). Por otra parte, el análisis de NGS con una profundidad de cobertura de 100 junto con un requisito de al menos 10 lecturas de soporte de variantes según lo recomendado por el consorcio ERIC (10) daría lugar a un falso negativo del 45% para las muestras con un LOD del 10%., Para confirmar estos cálculos teóricos, realizamos dos experimentos de dilución independientes para estimar el rendimiento del análisis de TP53 NGS para detectar 10% VAF a una profundidad de cobertura de 100 lecturas. De hecho, detectamos el 30% de falsos negativos (5 muestras positivas de 7 muestras positivas verdaderas y 9 muestras positivas de 13 muestras positivas verdaderas) en dos series de secuenciación independientes. Desafortunadamente, la tasa de falsos negativos a menudo se subestima en la resecuenciación dirigida., Además, un estudio reciente que investiga los resultados interlaboratorios de la detección de variantes somáticas con VAFs entre el 15 y el 50% en 111 laboratorios con LODs reportados del 5-15% (6) muestra que los errores mayores en el diagnóstico de NGS pueden surgir de resultados falsos negativos, incluso en muestras con altas cargas de mutación (6). De los tres resultados falsos positivos concurrentes, todas las variantes se detectaron correctamente pero se caracterizaron erróneamente (6)., Dado que no se ha pedido a los laboratorios que informen la profundidad de cobertura para otras regiones que no sean las variantes identificadas (6), solo podemos suponer que la baja cobertura o los umbrales de llamada de variantes altos contribuyeron a los resultados falsos negativos. Estos resultados destacan aún más la necesidad de parámetros de profundidad de cobertura estandarizados en el NGS diagnóstico, teniendo en cuenta los errores de secuenciación, así como los errores específicos del ensayo.

FIGURA 1.

la Figura 1. LOD en función de la profundidad de cobertura según la distribución binomial., Profundidad de cobertura necesaria para mantener un LOD previsto (dentro del rango de VAF del 3-20%) para tres configuraciones de probabilidad acumulativas: para una probabilidad de falso positivo de 0.001 y un verdadero positivo de 0.999, se logra un LOD del 20% a 61 profundidad de cobertura, un LOD del 10% a 175, un LOD del 5% a 562 y un LOD del 3% a 1,650. Para la probabilidad de falso positivo de 0.010 y verdadero positivo de 0.990, se logra un LOD del 20% a 31, un LOD del 10% a 81, un LOD del 5% a 288 y un LOD del 3% a 886 profundidad de cobertura, respectivamente. Para la probabilidad de falso positivo de 0.050 y verdadero positivo de 0.,950, se logra un LOD del 20% a 30, un LOD del 10% a 30, un LOD del 5% a 124 y un LOD del 3% a 392 profundidad de cobertura, respectivamente.

frecuencia de mutaciones SUBCLONALES de TP53 En LLC Detectadas a través de NGS diagnóstico

con el fin de evaluar la ocurrencia de baja VAF en entornos del mundo real, revisamos nuestra cohorte de pacientes con LLC examinados para TP53mut en nuestro laboratorio de diagnóstico. Los TP53mut fueron evaluados como se informó anteriormente (14, 15). Brevemente, TP53 (exones 2-10 incluyendo 2 pb superposición intrónica, 5′ y 3’UTR) se analizó utilizando 100 ng gDNA por reacción., Las bibliotecas basadas en Amplicon se secuenciaron como pareadas en MiSeq (2×151, Illumina) con profundidades de lectura objetivo mínimas de 5,000 x. el LOD de TP53mut se configuró en un 1%, y las variantes en el rango de 1-3% se confirmaron mediante replicación. Se obtuvo el consentimiento informado por escrito de todos los pacientes incluidos de acuerdo con la Declaración de Helsinki, y el estudio fue aprobado por el Comité Ético local.

de la cohorte diagnóstica de 859 pacientes con LLC (abril 2016–abril 2019), el 25% (215/859) fueron positivos para TP53mut, y de ellos, el 52,6% (113/215) presentaron variantes con VAF al 10% o menos., En línea con nuestras observaciones, un estudio reciente (8) reportó la presencia de TP53muts de carga baja (Sanger negativo) del 63 y el 84% en pacientes con LLC en el momento del diagnóstico y en el momento del tratamiento, respectivamente, y confirmó el impacto negativo en la supervivencia global de TP53muts por encima del 1% de la VAF en el momento del tratamiento (8).,

Calculator for Diagnostic NGS Settings for Detection of Subclonal Mutations

para ayudar a los laboratorios a determinar los parámetros mínimos de cobertura adecuados, proporcionamos una calculadora teórica (software) sencilla y fácil de usar basada en la distribución binomial (Figura 2), descrita en el archivo suplementario. Una aplicación web (o de escritorio) y los códigos fuente independientes en R son accesibles en Github: https://github.com/mvasinek/olgen-coverage-limit., Usando esta calculadora, los parámetros correctos de la profundidad de secuenciación y el número mínimo correspondiente de lecturas de variante para una tasa de error de secuenciación dada y LOD previsto pueden determinarse fácilmente. Además, los usuarios también pueden tener en cuenta otros errores simplemente agregando errores específicos del ensayo a la tasa de errores de secuenciación y utilizando este error general como entrada a la calculadora. Por ejemplo, en nuestro caso del análisis mutacional TP53 calculamos con el error general de ~1.16%, por lo que configuramos nuestros requisitos de profundidad de cobertura mínima a 2,000 con un umbral de mínimo 40 lecturas para 3% VAF.,

FIGURA 2

la Figura 2. OLGEN Coverage Limit calculator-Una calculadora teórica simple adecuada para determinar la profundidad de secuenciación correcta y el número mínimo correspondiente de lecturas de variantes de acuerdo con la distribución binomial para una tasa de error de secuenciación dada y Lod previsto recomendado para NGS de diagnóstico. Ejemplos de profundidades de secuenciación calculadas y el número mínimo correspondiente de lecturas de variantes recomendadas para variantes con (a) 10% de VAF y 99,9% de probabilidad de detección y (B) 3% de VAF y 99,9% de probabilidad de detección.,

discusión

aunque el NGS diagnóstico ha ganado protagonismo en los entornos clínicos para la evaluación de mutaciones somáticas en cáncer, la insuficiente estandarización de los parámetros de secuenciación todavía limita su implementación en la práctica clínica (1), principalmente para variantes presentes en frecuencias alélicas bajas (4). Por lo tanto, abordamos la cuestión técnica de determinar correctamente la profundidad de secuenciación en el NGS diagnóstico para obtener detecciones seguras y reproducibles de variantes de VAF baja., En particular, se realizaron cálculos teóricos para determinar la profundidad de cobertura óptima para la probabilidad deseada de detección de variantes a bajas frecuencias alélicas, teniendo en cuenta la tasa de error de secuenciación. Además, confirmamos estos cálculos teóricos mediante la realización de experimentos de dilución. Sobre la base de estas observaciones, recomendamos una profundidad de cobertura de 1.650 o superior (junto con el umbral respectivo de al menos 30 lecturas mutadas) para llamar a Variantes ≥3% para lograr una probabilidad de detección de variantes del 99,9%, utilizando solo el error de secuenciación NGS convencional., Las variantes en el rango de VAF del 1-3% solo se pueden llamar si los datos de secuencia obtenidos son de alta calidad (promedio Q30 > 90%) y/o cuando las variantes se confirman Por replicación o el método ortogonal (1, 11, 16). También proporcionamos una calculadora teórica (software) sencilla y fácil de usar para ayudar a los laboratorios a resolver la profundidad de secuenciación correcta y el número mínimo correspondiente de lecturas de variantes, teniendo en cuenta la tasa de error de secuenciación. Nuestra calculadora simple puede ayudar a minimizar los resultados falsos positivos y falsos negativos en el diagnóstico NGS.,

sin embargo, la profundidad de secuenciación correcta también está influenciada por factores específicos del ensayo (1). Los errores pueden ocurrir en muchas etapas durante el procesamiento del ADN y la preparación de la biblioteca. Los más comunes son los errores de amplificación introducidos durante la preparación de la biblioteca NGS (1, 12, 17). Otras fuentes comunes de errores tienen que ver con la complejidad de la biblioteca (el número de moléculas de ADN independientes analizadas), la calidad del ADN y la complejidad de la región objetivo, etc. Todos los posibles errores específicos del ensayo deben abordarse mediante el diseño del ensayo, la validación del método y el control de calidad.,

actualmente, se están desarrollando estrategias emergentes de corrección de errores, tanto computacionales como experimentales, con el fin de mitigar las altas tasas de error en el NGS diagnóstico (11). Hasta ahora, entre los métodos de corrección de errores más prometedores se encuentran Umi (identificadores moleculares únicos), que corrigen errores de PCR (18), y enfoques de corrección de señal a ruido (11). Estos avances intentan reducir el LOD, aumentando así la precisión de secuenciación necesaria para futuras oportunidades en el diagnóstico de NGS.,

con el fin de mejorar la estandarización en el NGS diagnóstico, la estimación de la profundidad de cobertura correcta es un punto de partida recomendado al evaluar los umbrales que rodean un ensayo NGS particular. Sin embargo, todavía falta una guía publicada sobre los requisitos técnicos mínimos y su notificación en NGS, particularmente importante en la detección de mutaciones clonales y subclonales en el diagnóstico del cáncer., Esto se debe principalmente a la amplia gama de enfoques de preparación de bibliotecas y a las numerosas variables que desempeñan un papel en cada ensayo específico de NGS, que son difíciles de estandarizar, junto con la variabilidad interlaboratorios. Por lo tanto, la definición de los requisitos técnicos mínimos y su notificación en los SGN es muy deseable., Basándonos en nuestra experiencia en el diagnóstico de NGS en Hemato-Oncología, sugerimos informar al menos los siguientes parámetros técnicos: LOD, error general del ensayo de NGS (o al menos tasa de error de secuenciación), la cantidad de entrada de ADN, fuente y calidad de ADN, profundidad mínima de cobertura y el porcentaje de bases objetivo secuenciadas a esta profundidad mínima, número total de lecturas objetivo que cubren la región variante y número de lecturas que apoyan la variante. Debe hacerse especial hincapié en la estandarización del NGS de las muestras embebidas en parafina fija con formalina (FFPE) (19, 20).,

en conjunto, nuestro estudio destaca la importancia de la profundidad de secuenciación correcta y el número mínimo de lecturas necesarias para la detección fiable y reproducible de variantes con baja FAV en el NGS diagnóstico. El cálculo de la profundidad de secuenciación correcta para una tasa de error dada utilizando nuestra calculadora teórica fácil de usar (software) puede ayudar a minimizar los resultados falsos positivos y falsos negativos en el diagnóstico de NGS, en situaciones relacionadas con mutaciones subclonales, entre otros., Las pruebas rigurosas y los requisitos mínimos estandarizados para el NGS de diagnóstico son particularmente deseables para garantizar resultados correctos en entornos clínicos.

disponibilidad de datos

los conjuntos de datos generados para este estudio están disponibles previa solicitud razonable al autor correspondiente.

contribuciones del autor

AP y EK diseñaron el estudio, interpretaron los resultados y escribieron el manuscrito. AP, LS, DT y PS realizaron análisis de NGS. TP recogió las muestras de pacientes y los datos clínicos. MV realizó análisis bioinformáticos y escribió el código de la calculadora. TN preparado aplicación web., Todos los autores leyeron y aprobaron la versión final del manuscrito.

financiación

subvención: MZ CR VES16-32339A, en parte por el MH CZ—DRO (FNOl, 00098892).

Declaración de conflicto de intereses

los autores declaran que la investigación se realizó en ausencia de relaciones comerciales o financieras que pudieran ser interpretadas como un potencial conflicto de intereses.

agradecimientos

pedimos disculpas a los muchos autores cuyos artículos no pudieron ser citados debido a los límites de referencia.,

Supplementary Material

1. Jennings LJ, Arcila ME, Corless C, Kamel-Reid S, Lubin IM, Pfeifer J, et al. Guidelines for validation of next-generation sequencing-based oncology panels: a joint consensus recommendation of the Association for Molecular Pathology and College of American Pathologists. J Mol Diagn. (2017) 19:341–65. doi: 10.1016/j.jmoldx.2017.01.011

PubMed Abstract | CrossRef Full Text | Google Scholar

2., D’Haene N, Le Mercier M, De Neve N, Blanchard O, Delaunoy M, El Housni H, et al. Clinical validation of targeted next generation sequencing for Colon and Lung cancers. PLoS ONE. (2015) 10:e0138245. doi: 10.1371/journal.pone.0138245

PubMed Abstract | CrossRef Full Text | Google Scholar

3. Deans ZC, Costa JL, Cree I, Dequeker E, Edsjo A, Henderson S, et al., Integration of next-generation sequencing in clinical diagnostic molecular pathology laboratories for analysis of solid tumours; an expert opinion on behalf of IQN path ASBL. Virchows Arch. (2017) 470:5–20. doi: 10.1007/s00428-016-2025-7

PubMed Abstract | CrossRef Full Text | Google Scholar

4. Ivanov M, Laktionov K, Breder V, Chernenko P, Novikova E, Telysheva E, et al., Towards standardization of next-generation sequencing of FFPE samples for clinical oncology: intrinsic obstacles and possible solutions. J Transl Med. (2017) 15:22. doi: 10.1186 / s12967-017-1125-8

PubMed Abstract / CrossRef Full Text/Google Scholar

5. Bacher U, Shumilov E, Flach J, Porret N, Joncourt R, Wiedemann G, et al. Desafíos en la introducción de la secuenciación de próxima generación (NGS) para el diagnóstico de neoplasias mieloides malignas en el uso clínico rutinario. Cáncer De Sangre J. (2018) 8: 113. doi: 10.,1038/s41408-018-0148-6

PubMed Abstract | CrossRef Texto Completo | Google Scholar

6. Merker JD, Devereaux K, Iafrate AJ, Kamel-Reid S, Kim AS, Moncur JT, et al. Las pruebas de aptitud de muestras estandarizadas muestran un acuerdo interlaboratorio muy alto para los ensayos clínicos de Oncología basados en secuenciación de próxima generación Arch Pathol Lab Med. (2019) 143:463–71. doi: 10.5858 / arpa.,2018-0336-CP

PubMed Abstract | CrossRef Full Text | Google Scholar

8. Brieghel C, Kinalis S, Yde CW, Schmidt AY, Jonson L, Andersen MA, et al. Deep targeted sequencing of TP53 in chronic lymphocytic leukemia: clinical impact at diagnosis and at time of treatment. Haematologica. (2019) 104:789–96. doi: 10.3324/haematol.2018.195818

PubMed Abstract | CrossRef Full Text | Google Scholar

9., Campo E, Cymbalista F, Ghia P, Jager U, Pospisilova S, Rosenquist R, et al. TP53 aberrations in chronic lymphocytic leukemia: an overview of the clinical implications of improved diagnostics. Haematologica. (2018) 103:1956–68. doi: 10.3324/haematol.2018.187583

PubMed Abstract | CrossRef Full Text | Google Scholar

10. Malcikova J, Tausch E, Rossi D, Sutton LA, Soussi T, Zenz T, et al., ERIC recommendations for TP53 mutation analysis in chronic lymphocytic leukemia-update on methodological approaches and results interpretation. Leukemia. (2018) 32:1070–80. doi: 10.1038/s41375-017-0007-7

PubMed Abstract | CrossRef Full Text | Google Scholar

11. Salk JJ, Schmitt MW, Loeb LA. Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations. Nat Rev Genet. (2018) 19:269–85. doi: 10.1038/nrg.2017.,117

PubMed Abstract | CrossRef Full Text | Google Scholar

12. Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, et al. A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics. (2012) 13:341. doi: 10.1186/1471-2164-13-341

PubMed Abstract | CrossRef Full Text | Google Scholar

14., Obr A, Prochazka V, Jirkuvova A, Urbankova H, Kriegova E, Schneiderova P, et al. TP53 mutation and complex karyotype portends a dismal prognosis in patients with mantle cell lymphoma. Clin Lymphoma Myeloma Leuk. (2018) 18:762–8. doi: 10.1016/j.clml.2018.07.282

PubMed Abstract | CrossRef Full Text | Google Scholar

15. Turcsanyi P, Kriegova E, Kudelka M, Radvansky M, Kruzova L, Urbanova R, et al., Mejora de la estratificación del riesgo de los pacientes con leucemia linfocítica crónica mediante redes multivariadas de similitud de pacientes. Leuk Res. (2019) 79:60-8. doi: 10.1016 / j.leukres.2019.02.005

PubMed Abstract | CrossRef Texto Completo | Google Scholar

18. Smith T, Heger a, Sudbery I. UMI-tools: modeling sequencing errors in Unique Molecular Identifiers to improve quantification accuracy. Genome Res. (2017) 27:491-9. doi: 10.1101 / gr.209601.,116

PubMed Abstract | CrossRef Full Text | Google Scholar

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *