300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图 注释 并应用于遗传分析...

从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图 注释 并应用于遗传分析...

时间:2020-07-28 06:36:08

相关推荐

从头测序+重测序 | 利用细菌二/三代测序组装全基因组草图 注释 并应用于遗传分析...

这个问题部分地解决了:

仍存在的"Error"可能与原核特殊的密码子使用、基因组存在gap区、snpEff的进一步参数选择有关。

那么我们完成了什么?假设你分离到了一株菌,是一种当前研究地少、或新发现的物种,NCBI也无参考基因组,那么:

① 需要从头组装

②二代测序Reads太短,为了获得最大的contig或染色体,就可能需要加些三代测序数据;

③ 组装好了之后就要注释,获得能看得懂的基因名称(Symbol),并很清楚地了解其功能、掌握其序列

④ 这株菌肯定有其特殊之处(特殊性状),不然你关注不到它,也就是说,同一个物种,你很可能有另一些菌株看起来非常普通,那么你就有了一个"A set of strains"。经过基因组的比较之后,就发现了目标菌株的一些特殊序列(例如:短的SNP/InDel,或长片段结构变异,无非就是这些),那么你就需要知道这些"变异"的影响效应,比如:是否为错义突变、是否移码、是否为"高影响",这时就需要用到snpEff等类似的程序(ANNOVAR大概率只能搞人的。因为我们根本不关心欧洲细菌的"人群"变异频率,细菌里还没有这个概念),那么就需要用到基因组注释文件,如gff。

这样的研究(组装+遗传分析)具有很强的扩展性,因为从头测序重测序分析都做了。细菌基因组很小,做这些工作至少从算力上看不在话下。

一个可以实现的有意思的目标:我发现了一株新的、特殊的细菌,组装并注释了它,并发现其在xxx基因中存在的一段特殊序列,或一些SNP/InDel,具备了一种特殊的性状 (降解塑料、固氮、耐药、或致病),可能具有重要的研究价值。

当然也可以做一些进化、溯源、代谢、毒力等分析,甚至用自己的名字给它命名,毕竟你把这个菌的所有序列都展示并注释了。

/10.1016/j.tube..10

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。