探讨:如何利用二代测序技术实现样本的精确追踪与溯源分析

  昨天游侠帮忙分析一个一家四口的全外显子数据,在用XYAutofilter分析新发突变的时候,发现新发突变多达180个,而参加过我们生信实操培训班的同学都知道,一个人全外显子新发突变一般不超过3个,所以我立马就判断这不是亲生的!正好我们昨天介绍了KING这款软件可以分析亲缘关系(如何用全外显子数据做亲缘关系评估),那就拿这个家系实战演练一下,结果如下图


mmexport1550705739030.jpg

从结果来看proband和father确实没有血缘关系,但是有一点比较奇怪,father和mother居然是一级亲缘关系,看到此结果游侠就猜出proband和mother样本估计是对调了,而proband是男性,通过IGV确认了mother携带SRY基因,进一步确认了这种猜测,与朋友联系后确实有这种对调的可能。重新用XYAutofilter分析新发突变,数目在合理范围内。

    虽然以上个例问题解决了,但是如何系统地解决样本搞混的问题呢?测序公司或第三方检测机构如何能够保证测出来的数据就是我送样的样本呢?一家三口数据还说好,同时搞错3个样本的情况不大,游侠建议在分析前最好用KING分析一下亲缘关系,如果是单人的话如何check呢?

    记得在一次专家共识讨论会上,一位国际专家提出目前国内的情况与国外不同,国内测序仪已经很多,测序价格很有优势,而测序仪又很贵,医院可以送外面测序公司测序,但是有一点要特别注意:就是样本追踪。我相信每一家测序机构都有自己的样本处理SOP保证不搞混,但是不怕一万就怕万一啊,凡是人操作的就会出错,而且游侠也有耳闻最正规的测序公司也有搞错样本的事件,最关键的是如何保证出错的时候我能够发现。


    说实话游侠对这一块样本追踪不太熟悉,个人提出一些不成熟的想法:医院是不是可以在送检样本的时候同时加入一段稳定的已知序列的双链DNA呢,等返回数据的时候check测序数据是否包括这一段DNA测序数据,以后在发送报告时,先对一下暗号。

mmexport1550705748955.jpg

欢迎各位提出建议与留言!特别是大厂,你们是如何保证样本不搞混的。



作者介绍


周在威 博士  毕业于上海交通大学医学院,上海寻因生物创始人,公司主要业务包括临床生物信息学实操培训、NGS工作站与生信流程开发(单基因、WES-CNV、NIPT-PLUS、cnv-seq)、遗传病临床与科研分析,欢迎有需要的朋友洽谈,联系微信号wei233993.

发表评论