Úvod
Next-generation sequencing (NGS) se rychle rozšířila do klinických nastavení v haemato-onkologické a onkologie, protože to může přinést velké výhody pro diagnostiku, výběr léčby, a/nebo předpověď pro mnoho pacientů (1)., V poslední době několik článků o validaci hluboké cíleného NGS v klinické onkologie byly zveřejněny (2, 3), včetně komplexní doporučení Asociace pro Molekulární Patologie a College of American Patologů (1). Nedostatek standardizace cílených metod NGS však stále omezuje jejich implementaci v klinické praxi (4).
Jeden úkol, zejména je správnou detekci mutací přítomných v nízkém varianta alel (VAF) a standardizace sekvenční pokrytí hloubku (1, 5, 6)., To je zvláště důležité pro mutace, které mají klinické dopady na subklonální frekvence (1), jako je případ mutací genu TP53 (TP53mut) u chronické lymfocytární leukémie (CLL) (7, 8). Aberace TP53 (TP53mut a/nebo chromozomálních delecí 17p) jsou mezi nejsilnější prognostické a prediktivní markery vedení rozhodnutí o léčbě v CLL (9)., V současné době, Evropské Výzkumné Iniciativy pro Chronickou Lymfocytární Leukémii (ERIC) doporučuje detekci TP53mut s limitem detekce (LOD) nejméně 10% VAF (10), a rostoucí tělo důkazů existuje věnovaný klinické vliv malých TP53 zmutovaný subklonů v CLL (7, 8).
Sanger sekvenování a cílené hluboké NGS jsou v současné době techniky nejčastěji používané pro TP53mut analýzy (10), jakož i pro analýzu jiných genů, s klinickými dopady na nízké četnosti alel., Přestože sekvenování Sanger poskytuje relativně přístupný sekvenční přístup, postrádá citlivost potřebnou k detekci subklonů kvůli jeho detekčnímu limitu 10-20% mutovaných alel (10). NGS analýza má tedy nabývá v diagnostických laboratoří pro detekci somatických variant a různého technického vývoje opravu chyb strategií, a to jak výpočetní a experimentální, jsou vyvíjeny pro přesné identifikace nízké úrovně genetické variace (11)., Proto se zabýváme významem správného stanovení hloubky sekvenování v diagnostických NGS za účelem získání sebevědomé a reprodukovatelné detekce, nejen variant s nízkým VAF. Nakonec jsme provedli zředění experiment potvrdil naše teoretické výpočty, a jsme blízko diskutovat o naše zkušenosti s diagnostikou detekce TP53mut v CLL pacientů a další perspektivy o NGS standardizace v onkologické diagnostice.,
NGS Sekvenování Hloubka a Míra Chyb
NGS sekvenování hloubky přímo ovlivňuje reprodukovatelnost varianta detekce: čím vyšší číslo zarovnané sekvence čte, tím vyšší důvěru k základně volání na konkrétní pozici, bez ohledu na to, zda základnu volání je stejný jako referenční základ, nebo je mutován (1). Jinými slovy, jednotlivé sekvenční chyby čte jsou statisticky irelevantní, když jsou v přesile, jaká čte., Požadovaná hloubka pokrytí by tedy měla být stanovena na základě zamýšleného LOD, tolerance falešně pozitivních nebo falešně negativních výsledků a míry chyb sekvenování (1, 11).
pomocí binomické distribuce lze vypočítat pravděpodobnost falešně pozitivních a falešně negativních výsledků pro danou chybovost i zamýšlený LOD a lze odhadnout prahovou hodnotu pro variantu volající po dané hloubce (1)., Například, vzhledem k tomu, sekvenování chybovost o 1%, mutantní alela zátěže o 10%, a hloubka pokrytí 250 čte, pravděpodobnost detekce 9 nebo méně zmutovaných čte, je podle binomické rozdělení, 0.01%. Pravděpodobnost detekce 10 nebo více mutovaných čtení je tedy 99,99% (100-0, 01%) a lze definovat práh pro volání variant. Jinými slovy, hloubka pokrytí 250 s prahem nejméně 10 mutovaných čtení bude mít 99.,99% pravděpodobnost, že 10% zatížení mutantní alely nebude vynecháno voláním varianty (i když může být detekováno v jiném poměru). Tímto způsobem je riziko falešně negativního výsledku značně minimalizováno. Na druhé straně pravděpodobnost falešných pozitiv silně závisí na chybovosti sekvenování (protože přesnost všech analytických měření závisí na poměru signálu k šumu) (1, 11). V našem příkladu je pravděpodobnost falešně pozitivního výsledku 0,025%; míra falešných pozitiv však není zanedbatelná při snižování LOD na hodnotu blízkou chybovosti., Konvenční vnitřní NGS chybová sazby se pohybují mezi 0,1 a 1% (Phred skóre kvality 20-30) (1, 11) v závislosti na sekvenční platformu, GC obsah cílových regionech (12), a fragment délky, jak je znázorněno v Illumina spárované-end sekvenování (13). Proto je detekce variant u VAFs <2% ovlivněna vysokým rizikem falešně pozitivního výsledku bez ohledu na hloubku pokrytí., Je také důležité zmínit, že sekvenování míra chyb se vztahuje pouze na chyby produkován sekvenování sám a neobsahuje další chyby zaveden v průběhu zpracování DNA a knihovna přípravy, zejména při zesílení kroky, které další zvýšení míry chyb (1, 11).
Minimální Sekvenční Pokrytí v Klinických Nastavení
v současné době Neexistuje žádný konsensus o tom, minimální krytí v klinickém prostředí pomocí hluboké cílené resekvencování o NGS, a tak každá laboratoř musí stanovit vlastní parametry za účelem splnění dostatečné kvalitě (1, 5)., K dnešnímu dni, jen málo studií se doporučuje minimální pokrytí kritéria pro hluboké cíleného NGS v klinické onkologii: 500 hloubka pokrytí a LOD 5% (2), 300-500 hloubka pokrytí bez vzpírat LOD (3), 250 hloubky a LOD 5% s prahovou nastavení do 1000 hloubka krytí je nutné v případech heterogenní varianty v nízká buněčnost nádoru vzorky (1), a 100 hloubky alespoň 10 varianta čte a LOD 10% (10)., Podle binominálního rozdělení dat by měla být skutečně dostatečná hloubka pokrytí 250 pro detekci 5% VAF s prahem variant podporujících čtení ≥5 (Obrázek 1). Na druhou stranu, NGS analýzy s pokrytím hloubky 100 spolu s požadavkem nejméně 10 varianta podporující čte, jak doporučuje ERIC konsorcium (10) by mělo za následek falešně negativní 45% pro vzorky s LOD 10%., Pro potvrzení těchto teoretických výpočtů jsme provedli dva nezávislé experimenty s ředěním, abychom odhadli výkon analýzy TP53 NGS pro detekci 10% VAF v hloubce pokrytí 100 čtení. Ve skutečnosti, jsme zaznamenali 30% falešně negativních (5 pozitivních vzorků z 7 pravda-pozitivní vzorky a 9 pozitivních vzorků z 13 true-pozitivních vzorků), ve dvou nezávislých sekvenování běží. Bohužel, falešně negativní míra je často podceňována při cíleném resekvencování., Také nedávná studie zkoumající inter-laboratorní výsledky somatických varianta detekce s VAFs mezi 15 a 50% v 111 laboratoře se uvádí meze Stanovitelnosti 5-15% (6) ukazuje, že závažné chyby v diagnostické NGS mohou vzniknout falešně negativní výsledky, a to i ve vzorcích s vysokou mutační zátěže (6). Ze tří souběžných falešně pozitivních výsledků byly všechny varianty správně detekovány, ale chybně charakterizovány (6)., Od laboratoří nebyli požádáni, aby zprávu pokrytí hloubka pro jiné regiony, než je identifikovat varianty (6), můžeme pouze předpokládat, že nízké pokrytí nebo vysoká varianta volání prahy přispěl k falešně negativním výsledkům. Tyto výsledky dále zdůrazňují potřebu standardizovaných parametrů hloubky pokrytí v diagnostických NGS, s přihlédnutím k chybám sekvenování a chybám specifickým pro testy.
Obrázek 1. LOD jako funkce hloubky pokrytí podle binomické distribuce., Pokrytí hloubky potřebné k udržení zamýšlené LOD (v 3-20% VAF rozsah) pro tři kumulativní pravděpodobnost nastavení: pro falešně pozitivní pravděpodobnost 0,001 a pravdivé pozitivní 0.999, LOD z 20% je dosaženo v 61 pokrytí hloubky, LOD z 10% na 175, LOD z 5% na 562, a LOD z 3% na 1,650. Pro falešně pozitivní pravděpodobnost 0,010 a skutečné pozitivní 0,990 je dosaženo LOD 20% při 31, LOD 10% při 81, LOD 5% při 288 a LOD 3% při 886 hloubce pokrytí. Pro falešně pozitivní pravděpodobnost 0,050 a skutečné pozitivní 0.,950 je dosaženo LOD 20% při 30, LOD 10% při 30, LOD 5% při 124 a LOD 3% při hloubce pokrytí 392.
Frekvence TP53 Subclonal Mutace u CLL Detekovány Prostřednictvím Diagnostické NGS
Za účelem vyhodnocení výskytu nízké VAF v prostředí reálného světa, zhodnotili jsme naší kohortě pacientů s CLL zkoumány pro TP53mut v naší diagnostické laboratoře. TP53mut byly hodnoceny jako dříve (14, 15). Stručně řečeno, TP53 (exons 2-10 včetně 2 BP intronického překrytí, 5′ A 3 ‚ UTR) byl analyzován za použití 100 ng gDNA na reakci., Amplikon-based knihovny byly sekvenovány jako spárované-end na MiSeq (2×151, Illumina) s minimální cíl přečíst hlubin 5.000 x. LOD z TP53mut byla stanovena až na 1%, a variant v rozmezí 1-3% byly potvrzeny replikace. Písemný informovaný souhlas byl získán od všech pacientů, kteří byli zařazeni v souladu s Helsinskou Deklarací a studie byla schválena místní etickou komisi.
diagnostické skupiny 859 pacientů s CLL (duben 2016–duben 2019), 25% (215/859) byly pozitivní na TP53mut, a z těch, 52.6% (113/215) provádí varianty s VAF na 10% nebo nižší., V souladu s našimi pozorováními, nedávná studie (8) uvádí, že přítomnost 63 a 84% nízká zátěž (Sanger negativní) TP53muts v CLL pacientů v době diagnózy a v době léčby, respektive, a potvrdil negativní dopad na celkové přežití TP53muts výše 1% VAF v době léčby (8).,
Kalkulačka pro Diagnostické NGS Nastavení pro Detekci Subclonal Mutace
pomoci laboratořích se stanovení minimální řádné pokrytí parametry, jsme poskytuje jednoduchý, uživatelsky přívětivé teoretické kalkulačka (software) na základě binomického rozdělení (viz Obrázek 2), je popsáno v Doplňkovém Souboru. Webová (nebo desktopová) aplikace a samostatné zdrojové kódy v R jsou přístupné na Githubu: https://github.com/mvasinek/olgen-coverage-limit., Pomocí této kalkulačky lze snadno určit správné parametry sekvenční hloubky a odpovídající minimální počet přečtených variant pro danou sekvenční chybovost a zamýšlený LOD. Navíc, uživatelé mohou také vzít v úvahu další chyby pouhým přidáním test-specifické chyby v sekvenování chybovost a pomocí této celkové chybě jako vstup do kalkulátoru. Například v našem případě mutační analýzy TP53 jsme vypočítali s celkovou chybou ~1.16%, a tak jsme nastavili naše minimální požadavky na hloubku pokrytí na 2,000 s prahem minimálně 40 čtení pro 3% VAF.,
Obrázek 2. OLGEN Limit pro Pokrytí kalkulačka—jednoduchý teoretický kalkulátor vhodný pro určení správné hloubky sekvenování a odpovídající minimální počet varianta čte podle binomického rozdělení pro daný sekvenční chybovost a určena mez STANOVITELNOSTI doporučuje pro diagnostické NGS. Příklady vypočítané sekvenování hlubin a odpovídající minimální počet varianta čte doporučeno pro varianty s (A) 10% VAF a 99,9% pravděpodobnost detekce a (B) 3% VAF a 99,9% pravděpodobnost detekce.,
Diskuse
i když diagnostické NGS získala důležitost v klinické praxi pro posouzení somatických mutací v nádorových, nedostatečná standardizace sekvenování parametry stále omezuje jeho provádění v klinické praxi (1), a to především u variant přítomný v nízké četnosti alel (4). Proto jsme se zabývali technickou otázkou správného určení hloubky sekvenování v diagnostických NGS, abychom získali jisté a reprodukovatelné detekce variant s nízkým VAF., Zejména, jsme provedli teoretické výpočty k určení optimální hloubky pokrytí pro požadovanou pravděpodobnost detekce variant za nízké četnosti alel, s přihlédnutím k sekvenování chybovost. Tyto teoretické výpočty jsme navíc potvrdili prováděním experimentů s ředěním. Na základě těchto pozorování, doporučujeme hloubky pokrytí 1,650 nebo vyšší (spolu s příslušnou prahovou hodnotu nejméně 30 zmutoval čte) volat ≥3% varianty k dosažení 99,9% pravděpodobnost, že varianta detekce, pomocí konvenční NGS sekvenování pouze při chybě., Varianty v 1-3% VAF rozsah může být volána pouze pokud získané sekvence dat je vysoce kvalitní (průměrná Q30 > 90%) a/nebo když jsou varianty potvrzen replikace nebo ortogonální metodou (1, 11, 16). My jsme také poskytuje jednoduché, uživatelsky přívětivé teoretické kalkulačka (software) na pomoc laboratoří s řešením správná sekvenování hloubka a odpovídající minimální počet varianta čte při zohlednění sekvenování chybovost. Naše jednoduchá kalkulačka může pomoci minimalizovat falešně pozitivní a falešně negativní výsledky v diagnostických NGS.,
nicméně správná hloubka sekvenování je také ovlivněna faktory specifickými pro stanovení (1). Chyby mohou nastat v mnoha fázích při zpracování DNA a přípravě knihovny. Nejběžnější jsou chyby zesílení zavedené během přípravy knihovny NGS (1, 12, 17). Další běžné zdroje chyb souvisí se složitostí knihovny (počet analyzovaných nezávislých molekul DNA), kvalitou DNA a složitostí cílové oblasti atd. Všechny možné chyby specifické pro test by měly být řešeny prostřednictvím návrhu testu, ověření metody a kontroly kvality.,
v současné době se vyvíjejí nové strategie korekce chyb, výpočetní i experimentální, aby se zmírnila vysoká míra chyb v diagnostických NGS (11). Dosud patří mezi nejslibnější metody korekce chyb UMI (jedinečné molekulární identifikátory), které opravují chyby PCR (18) a přístupy korekce signálu k šumu (11). Tyto pokroky se pokoušejí snížit LOD, čímž se zvyšuje přesnost sekvenování potřebná pro budoucí příležitosti v diagnostice NGS.,
pro zlepšení standardizace v diagnostických NGS je odhad správné hloubky pokrytí doporučeným výchozím bodem při posuzování prahových hodnot obklopujících konkrétní NGS test. Stále však chybí publikované pokyny týkající se minimálních technických požadavků a jejich hlášení v NGS, zvláště důležité při detekci klonálních a subklonálních mutací v diagnostice rakoviny., Důvodem je především široká škála přístupů k přípravě knihovny a četné proměnné, které hrají roli v každém konkrétním testu NGS, které je obtížné standardizovat, spolu s Inter-laboratorní variabilitou. Proto je velmi žádoucí definice minimálních technických požadavků a jejich vykazování v NGS., Na základě našich zkušeností v diagnostické NGS v haemato-onkologické, doporučujeme, aby zprávu alespoň následující technické parametry: LOD, celková chyba NGS test (nebo alespoň sekvenování error rate), množství vstupní DNA, zdroj, a kvalita DNA, minimální pokrytí hloubky a procento cílené základny sekvenovány v této minimální hloubka, celkový počet cílových čte pokrývající varianta regionu a počtu čte podporovat varianta. Zvláštní důraz by měl být kladen na standardizaci NGS vzorků formalinem fixovaných parafinů (FFPE) (19, 20).,
Naše studie zdůrazňuje důležitost správné sekvenční hloubky a minimálního počtu čtení potřebných pro spolehlivou a reprodukovatelnou detekci variant s nízkou VAF v diagnostických NGS. Výpočet správné hloubky sekvenování pro danou chybovost pomocí našeho uživatelsky přívětivé teoretické kalkulačka (software), může pomoci minimalizovat falešně pozitivní a falešně negativní výsledky v diagnostické NGS, v situacích souvisejících s subclonal mutací, mezi ostatními., Přísné testování a standardizované minimální požadavky na diagnostické NGS jsou zvláště žádoucí pro zajištění správných výsledků v klinickém prostředí.
dostupnost dat
datové sady generované pro tuto studii jsou k dispozici na přiměřenou žádost příslušnému autorovi.
autorské příspěvky
AP a EK navrhli studii, interpretovali výsledky a napsali rukopis. AP, LS, TD a PS provedly analýzu NGS. TP shromáždil vzorky pacienta a klinické údaje. MV provedl bioinformatickou analýzu a napsal kód kalkulačky. TN připravené webové aplikace., Všichni autoři přečetli a schválili konečnou verzi rukopisu.
financování
Grantová podpora: MZ CR VES16-32339A, částečně MH CZ-DRO (FNOl, 00098892).
Prohlášení o střetu zájmů
autoři prohlašují, že výzkum byl proveden bez jakýchkoli obchodních nebo finančních vztahů, které by mohly být chápány jako potenciální střet zájmů.
poděkování
Omlouváme se mnoha autorům, jejichž články nemohly být citovány z důvodu referenčních limitů.,
Supplementary Material
1. Jennings LJ, Arcila ME, Corless C, Kamel-Reid S, Lubin IM, Pfeifer J, et al. Guidelines for validation of next-generation sequencing-based oncology panels: a joint consensus recommendation of the Association for Molecular Pathology and College of American Pathologists. J Mol Diagn. (2017) 19:341–65. doi: 10.1016/j.jmoldx.2017.01.011
PubMed Abstract | CrossRef Full Text | Google Scholar
2., D’Haene N, Le Mercier M, De Neve N, Blanchard O, Delaunoy M, El Housni H, et al. Clinical validation of targeted next generation sequencing for Colon and Lung cancers. PLoS ONE. (2015) 10:e0138245. doi: 10.1371/journal.pone.0138245
PubMed Abstract | CrossRef Full Text | Google Scholar
3. Deans ZC, Costa JL, Cree I, Dequeker E, Edsjo A, Henderson S, et al., Integration of next-generation sequencing in clinical diagnostic molecular pathology laboratories for analysis of solid tumours; an expert opinion on behalf of IQN path ASBL. Virchows Arch. (2017) 470:5–20. doi: 10.1007/s00428-016-2025-7
PubMed Abstract | CrossRef Full Text | Google Scholar
4. Ivanov M, Laktionov K, Breder V, Chernenko P, Novikova E, Telysheva E, et al., Směrem ke standardizaci sekvenování vzorků nové generace FFPE pro klinickou onkologii: vnitřní překážky a možná řešení. J Transl Med. (2017) 15:22. doi: 10.1186/s12967-017-1125-8
PubMed Abstraktní | CrossRef Plný Text | Google Scholar
5. Bacher U, Shumilov E, Flach J, Porret N, Joncourt R, Wiedemann G, et al. Výzvy při zavádění sekvenování nové generace (NGS) pro diagnostiku myeloidních malignit do klinického rutinního použití. Rakovina Krve J. (2018) 8:113. doi: 10.,1038/s41408-018-0148-6
PubMed Abstraktní | CrossRef Plný Text | Google Scholar
6. Merker JD, Devereaux k, Iafrate AJ, Kamel-Reid S, Kim AS, Moncur JT, et al. Testování odborné způsobilosti standardizovaných vzorků ukazuje velmi vysokou vzájemnou dohodu pro klinické onkologické testy založené na sekvenování příští generace Arch Pathol Lab Med. (2019) 143:463–71. doi: 10.5858 / arpa.,2018-0336-CP
PubMed Abstract | CrossRef Full Text | Google Scholar
8. Brieghel C, Kinalis S, Yde CW, Schmidt AY, Jonson L, Andersen MA, et al. Deep targeted sequencing of TP53 in chronic lymphocytic leukemia: clinical impact at diagnosis and at time of treatment. Haematologica. (2019) 104:789–96. doi: 10.3324/haematol.2018.195818
PubMed Abstract | CrossRef Full Text | Google Scholar
9., Campo E, Cymbalista F, Ghia P, Jager U, Pospisilova S, Rosenquist R, et al. TP53 aberrations in chronic lymphocytic leukemia: an overview of the clinical implications of improved diagnostics. Haematologica. (2018) 103:1956–68. doi: 10.3324/haematol.2018.187583
PubMed Abstract | CrossRef Full Text | Google Scholar
10. Malcikova J, Tausch E, Rossi D, Sutton LA, Soussi T, Zenz T, et al., ERIC recommendations for TP53 mutation analysis in chronic lymphocytic leukemia-update on methodological approaches and results interpretation. Leukemia. (2018) 32:1070–80. doi: 10.1038/s41375-017-0007-7
PubMed Abstract | CrossRef Full Text | Google Scholar
11. Salk JJ, Schmitt MW, Loeb LA. Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations. Nat Rev Genet. (2018) 19:269–85. doi: 10.1038/nrg.2017.,117
PubMed Abstract | CrossRef Full Text | Google Scholar
12. Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, et al. A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics. (2012) 13:341. doi: 10.1186/1471-2164-13-341
PubMed Abstract | CrossRef Full Text | Google Scholar
14., Obr A, Prochazka V, Jirkuvova A, Urbankova H, Kriegova E, Schneiderova P, et al. TP53 mutation and complex karyotype portends a dismal prognosis in patients with mantle cell lymphoma. Clin Lymphoma Myeloma Leuk. (2018) 18:762–8. doi: 10.1016/j.clml.2018.07.282
PubMed Abstract | CrossRef Full Text | Google Scholar
15. Turcsanyi P, Kriegova E, Kudelka M, Radvansky M, Kruzova L, Urbanova R, et al., Zlepšení rizika-stratifikace pacientů s chronickou lymfocytární leukémií pomocí vícerozměrných sítí podobnosti pacientů. Leuk Res. (2019) 79:60-8. doi: 10.1016 / j. leukres.2019.02.005
PubMed Abstraktní | CrossRef Plný Text | Google Scholar
18. Smith T, Heger a, Sudbery i. UMI-nástroje: modelování sekvenačních chyb v jedinečných molekulárních identifikátorech pro zlepšení přesnosti kvantifikace. Genome Res. (2017) 27:491-9. doi: 10.1101 / gr.209601.,116
PubMed Abstract | CrossRef Full Text | Google Scholar