Introdução
a Próxima geração de sequenciamento (NGS), expandiu-se rapidamente para o ambiente clínico, em haemato-cancerologia e oncologia, pois pode trazer grandes benefícios para o diagnóstico, seleção do tratamento, e/ou prognóstico para muitos pacientes (1)., Recentemente, foram publicados vários artigos sobre a validação de NGS em Oncologia Clínica alvo profundo (2, 3), incluindo uma recomendação abrangente da Associação de Patologia Molecular e do Colégio de patologistas americanos (1). No entanto, a falta de uniformização dos métodos NGS específicos continua a limitar a sua aplicação na prática clínica (4).
um desafio em particular é a correta detecção de mutações presentes em baixa variante de frequências alelas (VAF) e padronização da profundidade de cobertura sequenciada (1, 5, 6)., Isto é especialmente importante para mutações que têm impactos clínicos em frequências subclonais (1), como o caso de mutações genéticas TP53 (TP53mut) em leucemia linfocítica crônica (LLC) (7, 8). As aberrações TP53 (tp53mut e/ou deleção do cromossomo 17p) estão entre os marcadores prognósticos e preditivos mais fortes que orientam as decisões de tratamento na LLC (9)., Hoje em dia, a Iniciativa de Investigação Europeia sobre a Leucemia Linfocítica Crônica (ERIC) recomenda a detecção de TP53mut com um limite de detecção (LOD) de, pelo menos, 10% do VAF (10), e um crescente corpo de evidências dedicado para o impacto clínico de pequenos mutação TP53 subclones em CLL (7, 8).a sequenciação de Sanger e os NGS alvo profundos são Atualmente as técnicas mais utilizadas para a análise de TP53mut (10), bem como para a análise de outros genes com impactos clínicos em baixa frequência de alelos., Embora a sequenciação de Sanger forneça uma abordagem de sequenciamento relativamente acessível, ela não tem a sensibilidade necessária para detectar subclones devido ao seu limite de detecção de 10-20% de alelos mutados (10). A análise baseada em NGS ganhou assim destaque em laboratórios de diagnóstico para a detecção de variantes somáticas e vários desenvolvimentos técnicos de estratégias de correção de erros, tanto computacionais quanto experimentais, estão sendo desenvolvidos para a identificação precisa de variações genéticas de baixo nível (11)., Abordamos, portanto, a importância da correta determinação da profundidade de sequenciamento em NGS diagnósticos, a fim de obter uma detecção confiante e reprodutível, não apenas de variantes VAF baixas. Finalmente, realizamos um experimento de diluição para confirmar nossos cálculos teóricos, e terminamos discutindo nossa experiência com a detecção de diagnóstico de TP53mut em pacientes com LLC e outras perspectivas sobre a padronização da NGS em diagnósticos de câncer.,
NGS Sequenciamento de Profundidade e a Taxa de Erro
NGS sequenciamento de profundidade afeta diretamente a reprodutibilidade da variante de detecção: o mais alto número de seqüência alinhada lê, maior é o seu nível de confiança para a base de chamadas em uma determinada posição, independentemente de a base de ligação é o mesmo como base de referência ou é mutante (1). Em outras palavras, erros de sequenciamento individuais são estatisticamente irrelevantes quando eles estão em menor número por leituras corretas., Assim, a profundidade de cobertura desejada deve ser determinada com base no LOD pretendido, a tolerância para resultados falsos positivos ou falsos negativos, e a taxa de erro de sequenciação (1, 11).
usando uma distribuição binomial, a probabilidade de resultados falsos positivos e falsos negativos para uma dada taxa de erro, bem como o LOD pretendido pode ser calculado, e o limiar para uma variante que exige uma dada profundidade pode ser estimado (1)., Por exemplo, dada uma taxa de erro sequenciador de 1%, uma carga alélica mutante de 10%, e uma profundidade de cobertura de 250 leituras, a probabilidade de detectar 9 ou menos leituras mutantes é, de acordo com a distribuição binomial, de 0,01%. Assim, a probabilidade de detectar 10 ou mais leituras mutadas é de 99.99% (100-0, 01%), e o limiar para uma variante chamada pode ser definido. Em outras palavras, uma profundidade de cobertura de 250 com um limiar de pelo menos 10 leituras mutadas terá um 99.,99% de probabilidade de que 10% da carga do alelo mutante não será perdida pela variante chamada (embora possa ser detectada em uma proporção diferente). Desta forma, o risco de um resultado falso negativo é grandemente minimizado. Por outro lado, a probabilidade de falsos positivos depende fortemente da taxa de erro sequenciador (como a precisão de todas as medições analíticas depende da razão sinal-ruído) (1, 11). Em nosso exemplo, a probabilidade de um resultado falso positivo é de 0,025%; no entanto, a taxa de falsos positivos não é negligenciável ao diminuir o LD para o valor próximo à taxa de erro., As taxas de erro intrínsecas convencionais de NGS variam entre 0,1 e 1% (phred quality score of 20-30) (1, 11) dependendo da plataforma sequenciadora, o conteúdo de GC das regiões-alvo (12), e o comprimento do fragmento, como mostrado na sequência de iluminação emparelhada (13). Portanto, a detecção de variantes em VAFs <2% é afetada por um alto risco de um resultado falso positivo, independentemente da profundidade de cobertura., É também importante mencionar que a taxa de erro sequenciador se aplica apenas a erros produzidos pela sequenciação e não inclui outros erros introduzidos durante o processamento do DNA e a preparação da biblioteca, particularmente durante as etapas de amplificação, que aumentam ainda mais as taxas de erro (1, 11).
cobertura sequenciada mínima em contextos clínicos
actualmente não existe consenso sobre a cobertura mínima exigida num contexto clínico utilizando a ressequenciação profunda orientada por NGS, pelo que cada laboratório tem de definir os seus próprios parâmetros a fim de satisfazer uma qualidade suficiente (1, 5)., Até à data, poucos estudos têm recomendado a cobertura mínima de critérios para a profundidade alvo NGS em oncologia clínica: 500 profundidade de cobertura e um LOD de 5% (2), 300-500 profundidade de cobertura sem desafiando o LOD (3), 250 profundidade e um LOD de 5%, com ajuste de limite de 1.000 profundidade de cobertura é necessária nos casos em heterogéneo de variantes em baixo tumor cellularity amostras de (1), e 100 profundidade com pelo menos 10 variante leituras e um LOD de 10% (10)., De acordo com a distribuição binominal de dados, uma profundidade de cobertura de 250 deve, de facto, ser suficiente para detectar 5% de VAF com um limiar de variantes de leitura de suporte ≥5 (Figura 1). Por outro lado, a análise do NGS com uma profundidade de cobertura de 100, juntamente com um requisito de pelo menos 10 variantes de suporte, como recomendado pelo consórcio ERIC (10), resultaria num falso negativo de 45% para amostras com um LOD de 10%., Para confirmar estes cálculos teóricos, realizamos dois experimentos de diluição independentes para estimar o desempenho da análise TP53 NGS para detectar 10% VAF a uma profundidade de cobertura de 100 leituras. Com efeito, detectámos 30% de falsos negativos (5 amostras positivas de 7 amostras verdadeiras positivas e 9 amostras positivas de 13 amostras verdadeiras positivas) em duas séries de sequenciamento independentes. Infelizmente, a taxa de falsos negativos é muitas vezes subestimada na ressequenciação orientada., Além disso, um estudo recente investigação inter-laboratoriais, resultados de somática variante de detecção com VAFs entre 15 e 50% em 111 laboratórios com relatados LODs de 5 a 15% (6) mostra que os principais erros no diagnóstico NGS podem surgir a partir de resultados falso-negativos, mesmo em amostras com alta de mutação de cargas (6). De três resultados falsos positivos concomitantes, todas as variantes foram detectadas correctamente, mas desencaracterizadas (6)., Uma vez que os laboratórios não foram convidados a relatar a profundidade de cobertura para outras regiões que não as variantes identificadas (6), podemos apenas assumir que a baixa cobertura ou os limiares de chamada de variante elevada contribuíram para os falsos resultados negativos. Estes resultados destacam ainda a necessidade de Parâmetros de profundidade de cobertura padronizados em NGS de diagnóstico, levando em conta erros de sequenciação, bem como erros específicos do doseamento.
a Figura 1. LOD como uma função da profundidade de cobertura de acordo com a distribuição binomial., Cobertura profundidade necessária para manter-se em um LOD (dentro de 3-20% VAF range) para três probabilidade cumulativa definições: para de falso-positivo de probabilidade de 0,001 e verdadeiro positivo de 0.999, um LOD de 20% é alcançada em 61 cobertura de profundidade, um LOD de 10% no 175, de um LOD de 5% em 562, e um LOD de 3% no 1,650. Para os falsos positivos, a probabilidade de 0.010 e verdadeiro positivo de 0.990, um LOD de 20% é alcançada em 31, um LOD de 10% em 81, um LOD de 5% no 288, e um LOD de 3% em 886 cobertura de profundidade, respectivamente. Para a probabilidade falso positiva de 0, 050 e verdadeiro positivo de 0.,950, um LOD de 20% é alcançado em 30, um LOD de 10% em 30, um LOD de 5% em 124, e um LOD de 3% em 392 profundidade de cobertura, respectivamente.
Frequência de TP53 Subclonal Mutações no CLL Detectado Através de Diagnóstico NGS
a fim de avaliar a ocorrência de baixa VAF em contextos do mundo real, fizemos uma revisão do nosso grupo de CLL pacientes examinados para TP53mut em nosso laboratório de diagnóstico. O TP53mut foi avaliado como relatado anteriormente (14, 15). Brevemente, TP53 (exons 2-10 incluindo 2 bp sobreposição intrônica, 5′ e 3’UTR) foi analisado usando 100 ng gDNA por reação., As bibliotecas baseadas em amplicons foram sequenciadas como emparelhadas no MiSeq (2×151, Illumina) com profundidades de Leitura mínima de 5,000 X. O LOD do TP53mut foi configurado até 1%, e as variantes no intervalo de 1-3% foram confirmadas por replicação. Foi obtido consentimento informado por escrito de todos os pacientes inscritos de acordo com a Declaração de Helsinque, e o estudo foi aprovado pelo Comitê de ética local.
do grupo de diagnóstico de 859 doentes com LLC (abril de 2016-abril de 2019), 25% (215/859) foram positivos para TP53mut, e desses, 52,6% (113/215) carregaram variantes com VAF a 10% ou menos., Em linha com as nossas observações, um estudo recente (8) relataram a presença de 63 e 84% de carga baixa (Sanger negativo) TP53muts em CLL pacientes no momento do diagnóstico e no tempo de tratamento, respectivamente, e confirmou o impacto negativo na sobrevida global de TP53muts acima de 1% VAF no tempo de tratamento (8).,Calculadora
calculadora para Definições NGS diagnósticas para detecção de mutações Subclonais
para ajudar os laboratórios com a determinação dos parâmetros de cobertura adequada mínima, estamos fornecendo uma calculadora teórica simples e fácil de usar (software) com base na distribuição binomial (Figura 2), descrita no arquivo suplementar. Um aplicativo web (ou desktop) e códigos fonte autônomos em R são acessíveis no Github: https://github.com/mvasinek/olgen-coverage-limit., Usando esta calculadora, os parâmetros corretos da profundidade de sequenciamento e o número mínimo correspondente de leituras de variante para uma dada taxa de erro de sequenciamento e LOD pretendido podem ser facilmente determinados. Além disso, os usuários também podem levar em conta outros erros simplesmente adicionando erros específicos do doseamento para a taxa de erro sequenciando e usando este erro global como uma entrada para a calculadora. Por exemplo, em nosso caso de análise mutacional TP53 calculamos com o erro geral de ~1,16%, assim, estabelecemos nossos requisitos mínimos de profundidade de cobertura para 2.000 com o limiar de mínimo 40 leituras para 3% VAF.,
Figura 2. Calculadora limite de cobertura de OLGEN-uma calculadora teórica simples adequada para determinar a profundidade de sequenciação correta e correspondente número mínimo de leituras variantes de acordo com a distribuição binomial para uma dada taxa de erro sequenciador e LOD pretendido recomendado para diagnóstico NGS. Exemplos de profundidades de sequenciação calculadas e o correspondente número mínimo de leituras de variantes recomendadas para variantes com (a) 10% VAF e 99,9% de probabilidade de detecção e (B) 3% VAF e 99,9% de probabilidade de detecção.,
Discussão
Apesar de diagnóstico NGS ganhou destaque em ambientes clínicos para a avaliação de mutações somáticas em câncer, insuficiência de padronização de parâmetros sequencing ainda limita a sua aplicação na prática clínica (1), principalmente para as variantes presentes em baixas frequências de alelos (4). Nós, portanto, abordamos a questão técnica de determinar corretamente a profundidade de sequenciamento em NGS de diagnóstico, a fim de obter deteções confiantes e reprodutíveis de variantes VAF baixas., Em particular, realizamos cálculos teóricos para determinar a profundidade ideal de cobertura para a probabilidade desejada de detecção de variantes em freqüências de alelos Baixos, levando em conta a taxa de erro sequenciador. Além disso, confirmámos estes cálculos teóricos através da realização de experiências de diluição. Com base nestas observações, recomendamos uma profundidade de cobertura de 1.650 ou superior (juntamente com o respectivo limiar de pelo menos 30 leituras mutadas) para chamar variantes ≥3% para alcançar uma probabilidade de 99,9% de detecção de variantes, usando apenas o erro de sequenciação de NGS convencional., Variantes na gama VAF de 1-3% só podem ser chamadas se os dados de sequência obtidos forem de alta qualidade (média Q30 > 90%) e / ou quando as variantes forem confirmadas por replicação ou pelo método ortogonal (1, 11, 16). Estamos também fornecendo uma calculadora teórica simples e fácil de usar (software) para ajudar os laboratórios a resolver a profundidade de sequenciamento correta e o número mínimo correspondente de leituras variantes, levando em conta a taxa de erro de sequenciamento. Nossa calculadora simples pode ajudar a minimizar os resultados falsos positivos e falsos negativos em NGS diagnósticos.,no entanto, a profundidade de sequenciação correcta é também influenciada por factores específicos do ensaio (1). Erros podem ocorrer em muitas fases durante o processamento do DNA e preparação da biblioteca. Os mais comuns são erros de amplificação introduzidos durante a preparação da biblioteca NGS (1, 12, 17). Outras fontes comuns de erros têm a ver com a complexidade da biblioteca (o número de moléculas de DNA independentes analisadas), qualidade do DNA, e complexidade da região alvo, etc. Todos os potenciais erros específicos do doseamento devem ser corrigidos através da concepção do ensaio, da validação do método e do controlo da qualidade.,
atualmente, emerging error correction strategies, both computational and experimental, are being developed in order to mitigate the high error rates in diagnostic NGS (11). Até agora, entre os métodos de correção de erro mais promissores estão UMI (identificadores moleculares únicos), que corrigem erros de PCR (18), e aproximações de correção sinal-a-ruído (11). Estes avanços tentam reduzir o LD, aumentando assim a precisão de sequenciamento necessária para oportunidades futuras no diagnóstico da NGS.,
A fim de melhorar a normalização nos NGS de diagnóstico, a estimativa da profundidade de cobertura correta é um ponto de partida recomendado para a avaliação dos limiares em torno de um determinado teste NGS. No entanto, ainda há falta de orientações publicadas sobre os requisitos técnicos mínimos e sua comunicação em NGS, particularmente importante na detecção de mutações clonais e subclonais em diagnósticos de câncer., Isto deve-se principalmente à ampla gama de abordagens de preparação de bibliotecas, e inúmeras variáveis que desempenham um papel em cada teste específico de NGS, que são difíceis de padronizar, juntamente com a variabilidade interlaboratorial. Por conseguinte, é altamente desejável a definição de requisitos técnicos mínimos e a sua comunicação nas ARN., Com base em nossa experiência em diagnóstico NGS em haemato-oncologia, sugerimos o relatório, no mínimo seguintes parâmetros técnicos: LOD, de erro geral de NGS ensaio (ou pelo menos o seqüenciamento de taxa de erro), a quantidade de DNA de entrada, a origem e a qualidade do DNA, a cobertura mínima profundidade e a percentagem de alvo bases sequenciadas neste profundidade mínima, número total de destino lê cobrindo variante região e o número de leituras de apoio a variante. Deve ser dada especial atenção à normalização das amostras de parafina (FFPE) fixas de formalina (19, 20) por NGS.,
em conjunto, o nosso estudo destaca a importância da profundidade de sequenciação correta e o número mínimo de leituras necessárias para a detecção confiável e reprodutível de variantes com baixo VAF em NGS de diagnóstico. O cálculo da profundidade de sequenciamento correta para uma determinada taxa de erro usando nossa calculadora teórica amigável (software) pode ajudar a minimizar os resultados falsos positivos e falsos negativos em NGS diagnósticos, em situações relacionadas com mutações subclonais, entre outras., Os rigorosos testes e requisitos mínimos padronizados para NGS diagnósticos são particularmente desejáveis para garantir resultados corretos em ambientes clínicos.
disponibilidade de dados
os conjuntos de dados gerados para este estudo estão disponíveis, mediante pedido razoável, ao autor correspondente.
contribuições do autor
AP e EK desenharam o estudo, interpretaram os resultados, e escreveram o manuscrito. AP, LS, TD, and PS performed NGS analysis. A TP recolheu as amostras do doente e os dados clínicos. A MV realizou uma análise bioinformática e escreveu o código da calculadora. A TN preparou a aplicação web., Todos os autores lêem e aprovam a versão final do manuscrito.apoio financeiro: MZ CR VES16-32339A, em parte pelo MH CZ-DRO (FNOl, 00098892).
Declaração de conflito de interesses
os autores declaram que a investigação foi realizada na ausência de quaisquer relações comerciais ou financeiras que possam ser interpretadas como um potencial conflito de interesses.
agradecimentos
pedimos desculpa aos muitos autores cujos artigos não puderam ser citados por causa dos limites de referência.,
Supplementary Material
1. Jennings LJ, Arcila ME, Corless C, Kamel-Reid S, Lubin IM, Pfeifer J, et al. Guidelines for validation of next-generation sequencing-based oncology panels: a joint consensus recommendation of the Association for Molecular Pathology and College of American Pathologists. J Mol Diagn. (2017) 19:341–65. doi: 10.1016/j.jmoldx.2017.01.011
PubMed Abstract | CrossRef Full Text | Google Scholar
2., D’Haene N, Le Mercier M, De Neve N, Blanchard O, Delaunoy M, El Housni H, et al. Clinical validation of targeted next generation sequencing for Colon and Lung cancers. PLoS ONE. (2015) 10:e0138245. doi: 10.1371/journal.pone.0138245
PubMed Abstract | CrossRef Full Text | Google Scholar
3. Deans ZC, Costa JL, Cree I, Dequeker E, Edsjo A, Henderson S, et al., Integration of next-generation sequencing in clinical diagnostic molecular pathology laboratories for analysis of solid tumours; an expert opinion on behalf of IQN path ASBL. Virchows Arch. (2017) 470:5–20. doi: 10.1007/s00428-016-2025-7
PubMed Abstract | CrossRef Full Text | Google Scholar
4. Ivanov M, Laktionov K, Breder V, Chernenko P, Novikova E, Telysheva E, et al., Para a padronização da sequenciação da próxima geração de amostras de FFPE para Oncologia Clínica: obstáculos intrínsecos e possíveis soluções. J Transl Med. (2017) 15:22. doi: 10.1186/s12967-017-1125-8
PubMed Resumo | CrossRef Texto Completo | Google Scholar
5. Bacher U, Shumilov E, Flach J, Porret N, Joncourt R, Wiedemann G, et al. Desafios na introdução da sequenciação de próxima geração (NGS) para o diagnóstico de neoplasias mielóides na utilização de rotina clínica. Blood Cancer J. (2018) 8:113. doi: 10.,1038/s41408-018-0148-6
PubMed Resumo | CrossRef Texto Completo | Google Scholar
6. Merker JD, Devereaux K, Iafrate AJ, Kamel-Reid S, Kim AS, Moncur JT, et al. O teste de proficiência de amostras padronizadas mostra um acordo interlaboratorial muito elevado para ensaios clínicos de oncologia baseados em sequenciação de próxima geração, Arch Pathol Lab Med. (2019) 143:463–71. doi: 10.5858 / arpa.,2018-0336-CP
PubMed Abstract | CrossRef Full Text | Google Scholar
8. Brieghel C, Kinalis S, Yde CW, Schmidt AY, Jonson L, Andersen MA, et al. Deep targeted sequencing of TP53 in chronic lymphocytic leukemia: clinical impact at diagnosis and at time of treatment. Haematologica. (2019) 104:789–96. doi: 10.3324/haematol.2018.195818
PubMed Abstract | CrossRef Full Text | Google Scholar
9., Campo E, Cymbalista F, Ghia P, Jager U, Pospisilova S, Rosenquist R, et al. TP53 aberrations in chronic lymphocytic leukemia: an overview of the clinical implications of improved diagnostics. Haematologica. (2018) 103:1956–68. doi: 10.3324/haematol.2018.187583
PubMed Abstract | CrossRef Full Text | Google Scholar
10. Malcikova J, Tausch E, Rossi D, Sutton LA, Soussi T, Zenz T, et al., ERIC recommendations for TP53 mutation analysis in chronic lymphocytic leukemia-update on methodological approaches and results interpretation. Leukemia. (2018) 32:1070–80. doi: 10.1038/s41375-017-0007-7
PubMed Abstract | CrossRef Full Text | Google Scholar
11. Salk JJ, Schmitt MW, Loeb LA. Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations. Nat Rev Genet. (2018) 19:269–85. doi: 10.1038/nrg.2017.,117
PubMed Abstract | CrossRef Full Text | Google Scholar
12. Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, et al. A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics. (2012) 13:341. doi: 10.1186/1471-2164-13-341
PubMed Abstract | CrossRef Full Text | Google Scholar
14., Obr A, Prochazka V, Jirkuvova A, Urbankova H, Kriegova E, Schneiderova P, et al. TP53 mutation and complex karyotype portends a dismal prognosis in patients with mantle cell lymphoma. Clin Lymphoma Myeloma Leuk. (2018) 18:762–8. doi: 10.1016/j.clml.2018.07.282
PubMed Abstract | CrossRef Full Text | Google Scholar
15. Turcsanyi P, Kriegova E, Kudelka M, Radvansky M, Kruzova L, Urbanova R, et al., Melhorar a estratificação do risco de doentes com leucemia linfocítica crónica utilizando redes de similaridade de doentes multivariados. Leuk Res. (2019) 79:60-8. doi: 10.1016 / j. leukres.2019.02.005
PubMed Resumo | CrossRef Texto Completo | Google Scholar
18. Smith T, Heger a, Sudbery I. UMI-tools: modeling sequencing errors in Unique Molecular Identifiers to improve quantification accuracy. Genome Res. (2017) 27:491-9. D. N.: 10.1101 / gr.209601.,116
PubMed Abstract | CrossRef Full Text | Google Scholar