必要性:
隨著醫(yī)學(xué)項(xiàng)目在范圍內(nèi)的不斷開展,基于新一代測序(NGS)技術(shù)的大規(guī)?;蚪M數(shù)據(jù)采集已經(jīng)成為重要的研究手段之一。在此基礎(chǔ)上建立起來的大數(shù)據(jù)平臺(tái),輔以、的健康和醫(yī)學(xué)數(shù)據(jù),將為疾病的診斷與治療,藥物的研發(fā)與個(gè)體用藥,人群的健康保障等臨床與轉(zhuǎn)化醫(yī)學(xué)研究帶來極大的推動(dòng)。
在大規(guī)模人群中開展NGS測序工作時(shí),樣本的性、可溯源性將會(huì)對(duì)終的大數(shù)據(jù)質(zhì)量產(chǎn)生不可忽視的影響。由于NGS測序流程的復(fù)雜性(參見下圖,NGS測序工作經(jīng)典流程),在樣本庫內(nèi)得到標(biāo)記的樣本,在測序流程中仍然有一定幾率會(huì)發(fā)生混淆或者污染。根據(jù)上大型測序中心的估算,隨著測序樣本量的增加,一個(gè)操作流程完善、工作人員受過培訓(xùn)的基因檢測實(shí)驗(yàn)室,仍然有可能產(chǎn)生千分之一左右的樣本偏差。
因此,一種有效卻又成本低廉的樣本標(biāo)記與追蹤手段,在大規(guī)模NGS測序工作中具有重要的現(xiàn)實(shí)意義。在美國ACMG(美國醫(yī)學(xué)遺傳學(xué)與基因組學(xué)學(xué)院)發(fā)布的“臨床實(shí)驗(yàn)室NGS測序標(biāo)準(zhǔn)”中指明:“相關(guān)實(shí)驗(yàn)室必須采取措施,避免樣本混淆,并能夠隨時(shí)追蹤與確認(rèn)終結(jié)果”。2017年3月,中華醫(yī)學(xué)會(huì)病理學(xué)分會(huì)發(fā)布的“臨床分子病理實(shí)驗(yàn)室二代基因測序檢測共識(shí)”中進(jìn)一步闡明:“為確保檢測過程中樣本沒有混淆或污染,可選用多個(gè)SNV位點(diǎn)或其他標(biāo)簽作為樣本身份標(biāo)識(shí)(sample ID),在檢測前對(duì)每個(gè)樣本進(jìn)行SNV位點(diǎn)信息的測定,在NGS檢測后對(duì)上述位點(diǎn)進(jìn)行追蹤,證明沒有交叉污染”。
同時(shí),一個(gè)大型測序數(shù)據(jù)庫中面臨的樣本種類較為繁雜,其中與腫瘤相關(guān)的樣本類型如石蠟包埋切片(FFPE)中提取的DNA、血漿中提取的循環(huán)腫瘤DNA等,均在正確標(biāo)記、追蹤之外,還需在NGS文庫制備之前,對(duì)其中DNA片段降解程度進(jìn)行有效評(píng)估,從而防止質(zhì)量較差的樣本帶來的測序成本損失。
技術(shù)方案:
樣本標(biāo)記與跟蹤目前的主要方案,是從待測序列(全基因組、全外顯子組、靶向片段等)中選擇若干標(biāo)志性單堿基核苷酸變異(SNV),在樣本入庫及測序前,進(jìn)行基于這些位點(diǎn)的等位基因分型,從而確保樣本的收集與使用流程中沒有發(fā)生混淆。在測序完成后,再次利用之前這些位點(diǎn)的基因數(shù)據(jù),與測序結(jié)果進(jìn)行再次驗(yàn)證比對(duì),如果信息一致,即可確認(rèn)樣本正確性,以及測序覆蓋范圍與數(shù)據(jù)質(zhì)量均達(dá)到標(biāo)準(zhǔn)。
為達(dá)到足夠的區(qū)分效果,SNV需要滿足以下兩點(diǎn)標(biāo)準(zhǔn):1)在待檢測人群(中國人群)中具有較高的雜合度與區(qū)分力;2)需達(dá)到一定數(shù)量(30-40個(gè))以在大規(guī)模樣本庫中仍可區(qū)分所有個(gè)體樣本。根據(jù)這兩點(diǎn)標(biāo)準(zhǔn),國內(nèi)外人類基因組測序中心Broad Institute與華大基因均采用了美國Agena Bioscience公司基于核酸質(zhì)譜MassARRAY®開發(fā)的樣本標(biāo)記/追蹤技術(shù)。
該技術(shù)是利用MassARRAY®可以在一個(gè)反應(yīng)中完成40多重SNV分型的特點(diǎn),根據(jù)不同測序項(xiàng)目目標(biāo)片段,選擇約40個(gè)SNV位點(diǎn)(包括性染色體標(biāo)記位點(diǎn),用于追蹤樣本性別信息),并加入用于樣本降解程度評(píng)估的片段完整性內(nèi)參標(biāo)記,在同一次反應(yīng)中,同時(shí)完成對(duì)樣本的標(biāo)記與質(zhì)控,隨后以報(bào)告軟件自動(dòng)生成檢測結(jié)果,并整合進(jìn)入樣本庫相關(guān)數(shù)據(jù)。
根據(jù)樣本庫與數(shù)據(jù)庫規(guī)模,MassARRAY®平臺(tái)可采用384格式。在一天內(nèi),該平臺(tái)可完成對(duì)6張384孔芯片(即2304個(gè)樣本)的標(biāo)記/追蹤與質(zhì)控。
利用MassARRAY®強(qiáng)大的定制功能,對(duì)不同的測序項(xiàng)目可以選取不同的SNV位點(diǎn),整合為新的檢測組合,因此具有更高的靈活性與針對(duì)性。