Introduzione
Next-generation sequencing (NGS) si è rapidamente estesa in ambito clinico in neurologia-oncologia e oncologia, in quanto può portare grandi benefici per la diagnosi, la scelta del trattamento, e/o pronostici per molti pazienti (1)., Recentemente, sono stati pubblicati diversi articoli sulla convalida di NGS mirati in oncologia clinica (2, 3), inclusa una raccomandazione completa dell’Associazione per la patologia molecolare e del College of American Pathologists (1). Tuttavia, la mancanza di standardizzazione dei metodi NGS mirati limita ancora la loro attuazione nella pratica clinica (4).
Una sfida in particolare è la corretta rilevazione delle mutazioni presenti a basse frequenze di allele di variante (VAF) e la standardizzazione della profondità di copertura del sequenziamento (1, 5, 6)., Ciò è particolarmente importante per le mutazioni che hanno impatti clinici a frequenze subclonali (1) come il caso delle mutazioni del gene TP53 (TP53mut) nella leucemia linfocitica cronica (CLL) (7, 8). Le aberrazioni TP53 (TP53mut e/o delezione del cromosoma 17p) sono tra i più forti marcatori prognostici e predittivi che guidano le decisioni di trattamento nella LLC (9)., Al giorno d’oggi, l’iniziativa europea di ricerca sulla leucemia linfocitica cronica (ERIC) raccomanda di rilevare TP53mut con un limite di rilevamento (LOD) di almeno il 10% VAF (10), e un crescente corpo di prove esiste dedicato all’impatto clinico di piccoli subcloni mutati TP53 nella LLC (7, 8).
Sanger sequencing e deep targeted NGS sono attualmente le tecniche più utilizzate per l’analisi TP53mut (10) così come per l’analisi di altri geni con impatti clinici a basse frequenze alleliche., Sebbene il sequenziamento Sanger fornisca un approccio di sequenziamento relativamente accessibile, manca della sensibilità necessaria per rilevare i subcloni a causa del suo limite di rilevamento del 10-20% degli alleli mutati (10). L’analisi basata su NGS ha così guadagnato importanza nei laboratori diagnostici per la rilevazione di varianti somatiche e vari sviluppi tecnici di strategie di correzione degli errori, sia computazionali che sperimentali, sono in fase di sviluppo per l’identificazione accurata di variazioni genetiche di basso livello (11)., Affrontiamo quindi l’importanza della corretta determinazione della profondità di sequenziamento nelle NGS diagnostiche al fine di ottenere un rilevamento sicuro e riproducibile, non solo delle varianti a basso VAF. Infine, abbiamo eseguito un esperimento di diluizione per confermare i nostri calcoli teorici e chiudiamo discutendo la nostra esperienza con il rilevamento diagnostico di TP53mut in pazienti con LLC e ulteriori prospettive sulla standardizzazione NGS nella diagnostica del cancro.,
NGS Sequencing Depth and Error Rate
NGS sequencing depth influisce direttamente sulla riproducibilità del rilevamento delle varianti: maggiore è il numero di letture di sequenze allineate, maggiore è la confidenza alla chiamata di base in una particolare posizione, indipendentemente dal fatto che la chiamata di base sia uguale alla base di riferimento o sia mutata (1). In altre parole, le letture di errori di sequenziamento individuali sono statisticamente irrilevanti quando sono in inferiorità numerica rispetto alle letture corrette., Pertanto, la profondità di copertura desiderata dovrebbe essere determinata in base al LOD previsto, alla tolleranza per i risultati falsi positivi o falsi negativi e al tasso di errore del sequenziamento (1, 11).
Utilizzando una distribuzione binomiale, è possibile calcolare la probabilità di risultati falsi positivi e falsi negativi per un dato tasso di errore e il LOD previsto e stimare la soglia per una variante che richiede una data profondità (1)., Ad esempio, dato un tasso di errore di sequenziamento dell ‘ 1%, un carico di allele mutante del 10% e una profondità di copertura di 250 letture, la probabilità di rilevare 9 o meno letture mutate è, secondo la distribuzione binomiale, dello 0,01%. Quindi, la probabilità di rilevare 10 o più letture mutate è del 99,99% (100-0, 01%) e la soglia per una chiamata variante può essere definita. In altre parole, una profondità di copertura di 250 con una soglia di almeno 10 letture mutate avrà un 99.,99% di probabilità che il 10% del carico di allele mutante non venga perso dalla chiamata variante (anche se può essere rilevato in una proporzione diversa). In questo modo, il rischio di un risultato falso negativo è notevolmente ridotto al minimo. D’altra parte, la probabilità di falsi positivi dipende fortemente dal tasso di errore di sequenziamento (poiché l’accuratezza di tutte le misurazioni analitiche dipende dal rapporto segnale-rumore) (1, 11). Nel nostro esempio, la probabilità di un risultato falso positivo è dello 0,025%; tuttavia, il tasso di falsi positivi non è trascurabile quando si riduce il LOD al valore vicino al tasso di errore., I tassi di errore NGS intrinseci convenzionali variano tra 0,1 e 1% (punteggio di qualità Phred di 20-30) (1, 11) a seconda della piattaforma di sequenziamento, del contenuto GC delle regioni target (12) e della lunghezza del frammento, come mostrato in Illumina paired-end sequencing (13). Pertanto, il rilevamento di varianti a VAFs < 2% è influenzato da un alto rischio di un risultato falso positivo, indipendentemente dalla profondità di copertura., È anche importante ricordare che il tasso di errore di sequenziamento si applica solo per gli errori prodotti dal sequenziamento stesso e non include altri errori introdotti durante l’elaborazione del DNA e la preparazione della libreria, in particolare durante le fasi di amplificazione, che aumentano ulteriormente i tassi di errore (1, 11).
Copertura minima di sequenziamento in ambito clinico
Attualmente non esiste un consenso sulla copertura minima richiesta in un ambiente clinico utilizzando resequencing mirato profondo da parte di NGS, e quindi ogni laboratorio deve impostare i propri parametri al fine di soddisfare una qualità sufficiente (1, 5)., Ad oggi, solo pochi studi hanno raccomandato la copertura minima criteri per la profonda mirati NGS in oncologia clinica: 500 profondità di copertura e un LOD di 5% (2) di 300-500 profondità di copertura senza sfidando la LOD (3), 250 profondità e un LOD di 5% con regolazione della soglia di 1.000 profondità della copertura assicurativa nei casi di eterogenei varianti in basso tumore cellularità campioni (1), e 100 di profondità con almeno 10 variante di legge e LOD del 10% (10)., Secondo la distribuzione binominale dei dati, una profondità di copertura di 250 dovrebbe essere sufficiente per rilevare il 5% di VAF con una soglia di letture di supporto della variante ≥5 (Figura 1). D’altra parte, l’analisi NGS con una profondità di copertura di 100 insieme a un requisito di almeno 10 letture di supporto della variante come raccomandato dal consorzio ERIC (10) si tradurrebbe in un falso negativo del 45% per i campioni con un LOD del 10%., Per confermare questi calcoli teorici, abbiamo eseguito due esperimenti di diluizione indipendenti per stimare le prestazioni dell’analisi TP53 NGS per rilevare il 10% di VAF a una profondità di copertura di 100 letture. In effetti, abbiamo rilevato il 30% dei falsi negativi (5 campioni positivi di 7 campioni true-positive e 9 campioni positivi di 13 campioni true-positive) in due sequenze di sequenziamento indipendenti. Sfortunatamente, il tasso di falsi negativi è spesso sottovalutato nel resequencing mirato., Inoltre, un recente studio che studia i risultati interlaboratorio del rilevamento della variante somatica con VAF tra il 15 e il 50% in 111 laboratori con LOD riportati del 5-15% (6) mostra che i principali errori nelle NGS diagnostiche possono derivare da risultati falsi negativi, anche in campioni con carichi di mutazione elevati (6). Di tre risultati falsi positivi simultanei, tutte le varianti sono state rilevate correttamente ma caratterizzate in modo errato (6)., Poiché ai laboratori non è stato chiesto di segnalare la profondità di copertura per altre regioni oltre alle varianti identificate (6), possiamo solo supporre che la bassa copertura o le soglie di chiamata delle varianti elevate abbiano contribuito ai risultati falsi negativi. Questi risultati evidenziano ulteriormente la necessità di parametri di profondità di copertura standardizzati nelle NGS diagnostiche, tenendo conto degli errori di sequenziamento e degli errori specifici del test.
Figura 1. LOD in funzione della profondità di copertura secondo la distribuzione binomiale., Profondità di copertura necessaria per mantenere un LOD previsto (entro 3-20% VAF range) per tre impostazioni di probabilità cumulativa: per probabilità falso positivo di 0,001 e vero positivo di 0,999, un LOD del 20% è raggiunto a 61 profondità di copertura, un LOD del 10% a 175, un LOD del 5% a 562 e un LOD del 3% a 1.650. Per la probabilità falso positivo di 0,010 e vero positivo di 0,990, un LOD del 20% è raggiunto a 31, un LOD del 10% a 81, un LOD del 5% a 288 e un LOD del 3% a 886 profondità di copertura, rispettivamente. Per la probabilità falso positivo di 0.050 e vero positivo di 0.,950, un LOD del 20% è raggiunto a 30, un LOD del 10% a 30, un LOD del 5% a 124 e un LOD del 3% a 392 profondità di copertura, rispettivamente.
Frequenza delle mutazioni subclonali di TP53 nella CLL rilevate tramite NGS diagnostico
Al fine di valutare l’insorgenza di VAF basso in contesti reali, abbiamo esaminato la nostra coorte di pazienti con CLL esaminati per TP53mut nel nostro laboratorio diagnostico. I TP53mut sono stati valutati come riportato in precedenza (14, 15). In breve, TP53 (esoni 2-10 inclusi 2 bp intronic overlap, 5′ e 3 ‘ UTR) è stato analizzato utilizzando 100 ng gDNA per reazione., Le librerie basate su Amplicon sono state sequenziate come paired-end su MiSeq (2×151, Illumina) con profondità di lettura target minime di 5.000 x. Il LOD di TP53mut è stato impostato su 1% e le varianti nell’intervallo 1-3% sono state confermate dalla replica. Il consenso informato scritto è stato ottenuto da tutti i pazienti arruolati in conformità con la Dichiarazione di Helsinki e lo studio è stato approvato dal comitato etico locale.
Della coorte diagnostica di 859 pazienti affetti da LLC (aprile 2016–aprile 2019), il 25% (215/859) era positivo per TP53mut e di questi, il 52,6% (113/215) presentava varianti con VAF al 10% o inferiore., In linea con le nostre osservazioni, un recente studio (8) hanno segnalato la presenza di 63 e l ‘ 84% basso peso (Sanger negativo) TP53muts in pazienti con LLC al momento della diagnosi, e al momento del trattamento, rispettivamente, e ha confermato la un impatto negativo sulla sopravvivenza globale di TP53muts sopra 1% VAF al momento del trattamento (8).,
Calculator for Diagnostic NGS Settings for Detection of Subclonal Mutations
Per assistere i laboratori nella determinazione dei parametri minimi di copertura adeguata, stiamo fornendo un calcolatore teorico (software) semplice e intuitivo basato sulla distribuzione binomiale (Figura 2), descritta nel File supplementare. Un’applicazione web (o desktop) e codici sorgente stand-alone in R sono accessibili su Github:https://github.com/mvasinek/olgen-coverage-limit., Utilizzando questa calcolatrice, i parametri corretti di profondità di sequenziamento e il corrispondente numero minimo di variante legge per un dato tasso di errore di sequenziamento e LOD previsto può essere facilmente determinato. Inoltre, gli utenti possono anche prendere in considerazione altri errori semplicemente aggiungendo errori specifici del test al tasso di errore di sequenziamento e utilizzando questo errore complessivo come input per la calcolatrice. Ad esempio, nel nostro caso di analisi mutazionale TP53 abbiamo calcolato con l’errore complessivo di ~1,16%, quindi abbiamo impostato i nostri requisiti minimi di profondità di copertura a 2.000 con soglia minima di 40 letture per 3% VAF.,
Figura 2. OLGEN Coverage Limit calculator-un semplice calcolatore teorico adatto per determinare la corretta profondità di sequenziamento e corrispondente numero minimo di variante legge secondo la distribuzione binomiale per un dato tasso di errore di sequenziamento e LOD previsto raccomandato per NGS diagnostica. Esempi di profondità di sequenziamento calcolate e il corrispondente numero minimo di letture di varianti raccomandate per varianti con (A) 10% VAF e 99,9% di probabilità di rilevamento e (B) 3% VAF e 99,9% di probabilità di rilevamento.,
Discussione
Sebbene la diagnostica NGS abbia acquisito importanza in ambito clinico per la valutazione delle mutazioni somatiche nel cancro, un’insufficiente standardizzazione dei parametri di sequenziamento limita ancora la sua implementazione nella pratica clinica (1), principalmente per varianti presenti a basse frequenze alleliche (4). Abbiamo quindi affrontato la questione tecnica di determinare correttamente la profondità di sequenziamento in NGS diagnostico al fine di ottenere rilevamenti sicuri e riproducibili di varianti a basso VAF., In particolare, abbiamo eseguito calcoli teorici per determinare la profondità ottimale di copertura per la probabilità desiderata di rilevamento di varianti a basse frequenze alleliche, tenendo conto del tasso di errore di sequenziamento. Inoltre, abbiamo confermato questi calcoli teorici conducendo esperimenti di diluizione. Sulla base di queste osservazioni, raccomandiamo una profondità di copertura di 1.650 o superiore (insieme alla rispettiva soglia di almeno 30 letture mutate) per chiamare varianti ≥3% per ottenere una probabilità del 99,9% di rilevamento delle varianti, utilizzando solo l’errore di sequenziamento NGS convenzionale., Varianti nell’intervallo VAF 1-3% possono essere chiamate solo se i dati di sequenza ottenuti sono di alta qualità (Q30 medio > 90%) e / o quando le varianti sono confermate dalla replica o dal metodo ortogonale (1, 11, 16). Stiamo anche fornendo un semplice, facile da usare calcolatrice teorica (software) per aiutare i laboratori a risolvere la corretta profondità di sequenziamento e il corrispondente numero minimo di variante legge, tenendo conto del tasso di errore di sequenziamento. La nostra semplice calcolatrice può aiutare a ridurre al minimo i risultati falsi positivi e falsi negativi in NGS diagnostica.,
Tuttavia, la corretta profondità di sequenziamento è influenzata anche da fattori specifici del dosaggio (1). Gli errori possono verificarsi in molte fasi durante l’elaborazione del DNA e la preparazione della libreria. I più comuni sono gli errori di amplificazione introdotti durante la preparazione della libreria NGS (1, 12, 17). Altre fonti comuni di errori hanno a che fare con la complessità della libreria (il numero di molecole di DNA indipendenti analizzate), la qualità del DNA e la complessità della regione target ecc. Tutti i potenziali errori specifici del test devono essere risolti attraverso la progettazione del test, la convalida del metodo e il controllo di qualità.,
Attualmente sono in fase di sviluppo strategie di correzione degli errori emergenti, sia computazionali che sperimentali, al fine di mitigare gli alti tassi di errore nelle NGS diagnostiche (11). Finora, tra i metodi di correzione degli errori più promettenti ci sono UMI (identificatori molecolari unici), che correggono gli errori PCR (18) e gli approcci di correzione segnale-rumore (11). Questi progressi tentano di ridurre il LOD, aumentando così la precisione di sequenziamento necessaria per le opportunità future nella diagnosi NGS.,
Al fine di migliorare la standardizzazione in NGS diagnostica, la stima della corretta profondità di copertura è un punto di partenza raccomandato quando si valutano le soglie che circondano un particolare test NGS. Tuttavia, manca ancora una guida pubblicata per quanto riguarda i requisiti tecnici minimi e la sua segnalazione in NGS, particolarmente importante nella rilevazione di mutazioni clonali e subclonali nella diagnostica del cancro., Ciò è dovuto principalmente all’ampia gamma di approcci di preparazione della libreria e a numerose variabili che giocano un ruolo in ogni specifico test NGS, che sono difficili da standardizzare, insieme alla variabilità inter-laboratorio. Pertanto, la definizione dei requisiti tecnici minimi e la relativa segnalazione in NGS è altamente auspicabile., Sulla base della nostra esperienza in diagnostica NGS in neurologia-oncologia, suggeriamo di segnalare almeno i seguenti parametri tecnici: LOD, errore globale di NGS dosaggio (o almeno sequenziamento del tasso di errore), la quantità di DNA di ingresso, l’origine e la qualità del DNA, la copertura minima profondità e la percentuale di mirati basi sequenziate a questa profondità minima, numero totale di target legge che copre variante di regione e numero di letture di supporto alla variante. Particolare enfasi dovrebbe essere data alla standardizzazione NGS dei campioni FFPE (formalin-Fixed paraffin-embedded) (19, 20).,
Nel loro insieme, il nostro studio evidenzia l’importanza di una corretta profondità di sequenziamento e il numero minimo di letture richieste per il rilevamento affidabile e riproducibile di varianti con basso VAF in NGS diagnostico. Il calcolo della corretta profondità di sequenziamento per un dato tasso di errore utilizzando il nostro calcolatore teorico user-friendly (software) può aiutare a ridurre al minimo i risultati falsi positivi e falsi negativi in NGS diagnostica, in situazioni legate a mutazioni subclonali tra gli altri., I rigorosi test e i requisiti minimi standardizzati per le NGS diagnostiche sono particolarmente desiderabili per garantire risultati corretti in contesti clinici.
Disponibilità dei dati
I set di dati generati per questo studio sono disponibili su ragionevole richiesta all’autore corrispondente.
Contributi dell’autore
AP e EK hanno progettato lo studio, interpretato i risultati e scritto il manoscritto. AP, LS, TD e PS hanno eseguito l’analisi NGS. TP ha raccolto i campioni dei pazienti e i dati clinici. MV ha eseguito l’analisi bioinformatica e ha scritto il codice della calcolatrice. TN preparato applicazione web., Tutti gli autori hanno letto e approvato la versione finale del manoscritto.
Finanziamento
Sovvenzione: MZ CR VES16-32339A, in parte da MH CZ-DRO (FNOl, 00098892).
Dichiarazione sul conflitto di interessi
Gli autori dichiarano che la ricerca è stata condotta in assenza di relazioni commerciali o finanziarie che potrebbero essere interpretate come un potenziale conflitto di interessi.
Riconoscimenti
Ci scusiamo con i numerosi autori i cui articoli non hanno potuto essere citati a causa dei limiti di riferimento.,
Supplementary Material
1. Jennings LJ, Arcila ME, Corless C, Kamel-Reid S, Lubin IM, Pfeifer J, et al. Guidelines for validation of next-generation sequencing-based oncology panels: a joint consensus recommendation of the Association for Molecular Pathology and College of American Pathologists. J Mol Diagn. (2017) 19:341–65. doi: 10.1016/j.jmoldx.2017.01.011
PubMed Abstract | CrossRef Full Text | Google Scholar
2., D’Haene N, Le Mercier M, De Neve N, Blanchard O, Delaunoy M, El Housni H, et al. Clinical validation of targeted next generation sequencing for Colon and Lung cancers. PLoS ONE. (2015) 10:e0138245. doi: 10.1371/journal.pone.0138245
PubMed Abstract | CrossRef Full Text | Google Scholar
3. Deans ZC, Costa JL, Cree I, Dequeker E, Edsjo A, Henderson S, et al., Integration of next-generation sequencing in clinical diagnostic molecular pathology laboratories for analysis of solid tumours; an expert opinion on behalf of IQN path ASBL. Virchows Arch. (2017) 470:5–20. doi: 10.1007/s00428-016-2025-7
PubMed Abstract | CrossRef Full Text | Google Scholar
4. Ivanov M, Laktionov K, Breder V, Chernenko P, Novikova E, Telysheva E, et al., Verso la standardizzazione del sequenziamento di nuova generazione di campioni FFPE per oncologia clinica: ostacoli intrinseci e possibili soluzioni. J Transl Med. (2017) 15:22. doi: 10.1186 / s12967-017-1125-8
PubMed Abstract | CrossRef Full Text/Google Scholar
5. Bacher U, Shumilov E, Flach J, Porret N, Joncourt R, Wiedemann G, et al. Sfide nell’introduzione del sequenziamento di nuova generazione (NGS) per la diagnostica delle neoplasie mieloidi nell’uso clinico di routine. Cancro del sangue J. (2018) 8:113. doi: 10.,1038 / s41408-018-0148-6
PubMed Abstract | CrossRef Full Text/Google Scholar
6. Merker JD, Devereaux K, Iafrate AJ, Kamel-Reid S, Kim AS, Moncur JT, et al. Test di competenza di campioni standardizzati mostra un accordo interlaboratorio molto alto per i test clinici di prossima generazione basati sul sequenziamento oncologico Arch Pathol Lab Med. (2019) 143:463–71. doi: 10.5858 / arpa.,2018-0336-CP
PubMed Abstract | CrossRef Full Text | Google Scholar
8. Brieghel C, Kinalis S, Yde CW, Schmidt AY, Jonson L, Andersen MA, et al. Deep targeted sequencing of TP53 in chronic lymphocytic leukemia: clinical impact at diagnosis and at time of treatment. Haematologica. (2019) 104:789–96. doi: 10.3324/haematol.2018.195818
PubMed Abstract | CrossRef Full Text | Google Scholar
9., Campo E, Cymbalista F, Ghia P, Jager U, Pospisilova S, Rosenquist R, et al. TP53 aberrations in chronic lymphocytic leukemia: an overview of the clinical implications of improved diagnostics. Haematologica. (2018) 103:1956–68. doi: 10.3324/haematol.2018.187583
PubMed Abstract | CrossRef Full Text | Google Scholar
10. Malcikova J, Tausch E, Rossi D, Sutton LA, Soussi T, Zenz T, et al., ERIC recommendations for TP53 mutation analysis in chronic lymphocytic leukemia-update on methodological approaches and results interpretation. Leukemia. (2018) 32:1070–80. doi: 10.1038/s41375-017-0007-7
PubMed Abstract | CrossRef Full Text | Google Scholar
11. Salk JJ, Schmitt MW, Loeb LA. Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations. Nat Rev Genet. (2018) 19:269–85. doi: 10.1038/nrg.2017.,117
PubMed Abstract | CrossRef Full Text | Google Scholar
12. Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, et al. A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics. (2012) 13:341. doi: 10.1186/1471-2164-13-341
PubMed Abstract | CrossRef Full Text | Google Scholar
14., Obr A, Prochazka V, Jirkuvova A, Urbankova H, Kriegova E, Schneiderova P, et al. TP53 mutation and complex karyotype portends a dismal prognosis in patients with mantle cell lymphoma. Clin Lymphoma Myeloma Leuk. (2018) 18:762–8. doi: 10.1016/j.clml.2018.07.282
PubMed Abstract | CrossRef Full Text | Google Scholar
15. Turcsanyi P, Kriegova E, Kudelka M, Radvansky M, Kruzova L, Urbanova R, et al., Migliorare la stratificazione del rischio dei pazienti con leucemia linfocitica cronica utilizzando reti di similarità dei pazienti multivariate. Leuk Res. (2019) 79:60-8. doi: 10.1016 / j. leukres.2019.02.005
PubMed Abstract | CrossRef Full Text/Google Scholar
18. Smith T, Heger A, Sudbery I. UMI-tools: modeling sequencing errors in Unique Molecular Identifiers to improve quantification accuracy. Genome Res. (2017) 27:491-9. doi: 10.1101 / gr.209601.,116
PubMed Abstract | CrossRef Full Text | Google Scholar