声明:本文转载自宏基因组公众号,原做者朱微金,己获做者受权。html
做为纯wet遗传学博士,转行微生物组领域已经有两年。目击微生物组文章中分析所占比重之大,让我痛下决心苦学dry技能。目前感受对宏基因组领域的基础分析技术已经略懂,天天按本身的想法搞事情仍是很开心的事,今承本公众号主编刘博士再三邀请分享学习经验,在下不才将以前学习经历和笔记共享之,新人请上船,老司机请拍砖,以求共进。python
简要説一下个人转型经历,为基础差上不了车的同窗有个借鉴,哪里不会点哪里。即有生信知识,又有微生物组专业课程,主要分为如下三个阶段:ios
1. 第一阶段:自学书本+在线课程git
两年前最开始学Linux是电脑装了双系统Win+Ubuntu,学习《鸟哥私房菜》,装双系统而不用虚拟机就是为了沉浸在Linux系统中,强迫本身使用,让你再也不陌生。有了强大的操做基础,有问题多google,各类软件安装、运行也都不是问题,很快就能够感受到生物信息的强大而美好。github
除了Linux基础,左手用Python当胶水,右手用R画帅图,仍是dry实验的基本技能。Python教程推荐 – Coursera 密歇根大学《你们的编程 (Python 入门)》。R教程推荐 – Coursera 约翰霍普金斯大学《R语言编程》,R语言绘图建议学习《ggplot2:数据分析与图形艺术》,实用性很是强,我的不推荐学习《R语言实战》(反正学的很不爽,阅读不舒服,学完了也没感受提升)。学习程序语言,必定不要光看,最好不要复制代码,本身敲一遍,检查每步的输入输入的内容,才是提升的根本。web
这里推荐一下Rob Knight在Coursera上的微生物组课程《肠道检查:探索身体中的微生物群系》,新手必看,优势是英语标准,还有中/英字幕,拍摄效果有大片风,感受讲课者颜值都好高。shell
2. 第二阶段:文献阅读+各种培训 编程
平时大量的阅读前沿文献是必不可少的,没有普遍的知识,即没法读懂高水平文章,更把握不了前沿的方向。近两年我阅读了至少1000篇文章的摘要,精读图表结果和方法的也有100篇以上。推荐订阅《驯路短科普》,那里已经翻译整理了4000+相关文献的导读,早上DK时间阅读10分钟阅读《热心肠日报》,即排毒又涨姿式,节省大量查文献和阅读英文摘要时间,筛选到的重点文献可进一步精读。安全
去年七月参加了南土所褚海燕老师主办的《第三届微生物生态生物信息技术研讨会》,彻底是冲着Rob knight和Jack Gilbert去的(他们都不认识,本身敢去google吧),即听了大牛报告、又有褚老师组经验丰富的老司机们的实操培训,收获不小。app
今年五月我也参加了北微所的微生物组专题培训,收获是对细菌基因组有了比较系统的学习,但扩增子、宏基因组方向的讲解对我来説仍是太基础了,对刚入行的小伙伴仍是很是有用的,起码对扩增子、宏基因组、微生物基因组三大块有系统的认识,并积累一份宝贵的学习材料反复学习,少走弯路少进坑。
参加培训仍是颇有意义的,是在拿钱换本身的宝贵时间,并且通常花的还不是本身的钱,不是很划算吗?
3. 第三阶段:国外优秀教程+高水平文章实战
当水平达到必定层次,培训的意义就不大了,由于培训面对的是大众和新手。那如何进步呢?
我最痛恨的是高水平文章发表了连原始数据都不公布,以前读的一篇NG和PC我发信找通信做者要数据都不给,竟然説数据还在分析作另外一个项目。那以以前的数据的文章没数据还有不少人引用,看来引用也是颇有水分的,再有学术应该有监督和举报机制,拒不共享发表文章原始数据的应该被投拆追责甚至撤稿,不少不只是怕竞争,更多的是有水份。再不能忍的是方法描述不清,分析文章也不提供脚本下载,即便发信请求也找各类理由拒绝,这是令为很是不满的。你要是分析过程保密,申请专利好了,还发什么文章呀!组学文章没有源代码,都是在耍流氓。这里我要推荐本个本领域的大牛,Jeffery L. Dangl 和 Paul Schulze-Lefert,他们的文章不只上传数据规范,并且分析代码可打包下载,是不可多得的优秀学术材料,重现高水平文章结果,对本身的分析、理解能力提升是很是显著的。
此外,国内本领域的中文共享材料是几乎空白的,你搜索到的顶可能是公司的宣传材料,干货流程只掌握在少数公司和课题组内,不多有人共享,尤为是以前。我上周在本平台分享的宏基因组分析教程-Analysis of Metagenomic Data阅读人数2000+,仍是不少人须要的,须要提示的是,课程不是用来收藏的,而是用来看的,3天的课程我3小时就看完了。对于新手若是有不理解的地方,最好的解决的方法就是再看一遍。这套教程的原理和工具讲的很是系统,对咱们接下来实操帮助极大,新人建议仔细阅读三遍,再上本次实操课程的船。
本次为你们带来了更干货的实战课程,新人敢快搬个小板凳找坐位,老司机上船一块儿飞。虽然本课程以环境样品为例,缺乏动植物研究中去宿主等一些重要步骤,可是这绝对是我目前见过的最好的教程,全程亮点,带你快速上手实战。下面是对本次课程内容的简介,请仔细阅读。若是此文阅读量3000+,你们想学习宏基因组实战的愿望够强烈,我将在接下来的三个月里,每周在平台开展本系统课程的中文讲解,带你们快速上手,避免误区。
注:文中提到相关资料连接见文末Reference部分
在Github上有一个ngs-docs的账号, https://github.com/ngs-docs 里面收录了50多套美国高通量测序的培训课程资料,即有代码、测序数据,又有网页讲解,甚至有线下的现场讲课视频。任何生信老司机都不该错过。宏基因组学这么热门的领域,天然教程不会少。以下图,宏基因组学培训在不到一年内已经举办了四场,并更新了四次,本领域的小伙伴决不要错过。本文对9月末最新的“2017-cicese”培训简介(资料17年10月9日更新),并提供2016课程的所有资料百度云下载(见文末)。
图1. ngs-docs中宏基因组相关课程
宏基因组实操课程-2017 CICESE Metagenomics Workshop at UC Davis
2017年9月26-30日UC Davis的宏基因组培训班
时长:五天
主讲:Harriet Alexander and C. Titus Brown
助教: Jessica Blanton, Adelaide Rhodes, Shawn Higdon, Jessica Mizzi, Phillip Brooks, Veronika Kivenson
https://2017-cicese-metagenomics.readthedocs.io/en/latest/
第一天
- 登录XSEDE Jetstream云
- 熟悉命令行
- 命令行运行blast
- 做业:阅读 Nature Method 《宏基因组软件评估金标准》(译者组也参与本文章)
次日
- 数据类型简介
- 测序数据的质控
- 报告:数据组装——Titus Brown
- 尝试:本身质控和组装数据
第三天
- 使用MEGAHIT组装序列
- 使用sourmash搜索与比较样品
- 序列比对至组装结果
- 宏基因中分箱单菌基因组
第四天
- Prokka注释基因组序列
- Salmon对样品基因丰度定量
- Anvi可视化组装结果
- 讨论工做流程与可重复性
第五天(选学)
- 下一步的工做;
- 相关资源:SEQ Answers, Biostars, Data Carpentry, DIB Summer Institute
- 复习学过内容
https://2017-cicese-metagenomics.readthedocs.io/en/latest/toc.html
图2. 英文目录-宏基因组部分
此课题是上月末在加州大学戴维斯刚举办的,虽然课题内容新,但相关资料不完整,只有在线网页版教程。
喜欢本地学习和收藏课程的同窗,能够学此课程的2016版本,其实内容差很少,但包括PDF和HTML版课件,以及录制好的视频,小编都为你打包整理到了百度云盘。有须要的朋友请分享这么好的资料到朋友圈让更多须要的朋友看到,并截图发送后台,24小时内便可得到下载地址。
为鼓励读者交流、快速解决科研困难,咱们创建了“宏基因组”专业讨论群,目前己有国内五十位PI,五百多名一线科研人员加入。参与讨论,得到专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加创始人好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读如何优雅的提问学习解决问题思路,仍末解决推荐生信技能树-微生物组版块(http://www.biotrainee.com/forum-88-1.html) 发贴,并转发连接入群,问题及解答方便检索,造福后人。
学习16S扩增子、宏基因组思路和分析实战,快关注“宏基因组”,干货第一时间推送。
点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA