学术研究的一些心得体会网络
当咱们开始高校研究生活时,咱们就踏上了学术研究之路。这是一条探索未知世界,追求知识真理之路。这条道路上布满荆棘,充满了冒险和乐趣。本文经过分享本身在博士学习阶段亲身经历的研究经验和体会(主要涉及到文献检索、文献阅读、实验设计和论文写做这四个方面),但愿能帮助一些入门研究不久的同窗对学术研究有新的认识,能在研究道路上少走弯路,迈向本身的成功之路。app
1 引言框架
2014年9月,我提着行李箱一我的来到大连这陌生的城市开启了在大工的博士研究生涯。我是从大四毕业设计就已经开始接触本身如今的研究领域——天然语言处理(Natural Language Processing, NLP),通过了硕士,博士这将近九年的摸爬滚打,本身也有了一些研究的心得体会。特别是博士这五年,我以为是我在研究道路上成长的五年,是自我感悟和磨练的五年。在博士的最后阶段,借此机会,写下我这些年在学术研究之路上本身的一些学习研究经验,但愿能对你们有所帮助。ide
在介绍本身的研究经验以前,我推荐一本凌晓峰和杨强老师著的《学术研究,你的成功之道》[1],这也是当年博士入学时导师推荐给个人。这本书对我学术研究起到了很大的帮助,我也是参考借鉴了书中的研究经验和体会,踏上了本身的研究之路。工具
图1. 学术研究的主要环节学习
什么是研究?在天然科学和工程领域,研究广义上能够理解为,经过可重复性的观察和可验证的结果,可以对人类认知世界作出首创性且具备影响力的贡献[1]。创新是研究的核心,影响力是研究的成绩单。兴趣是研究的最好动力,在研究的过程当中每每会遇到各类想不到的坎,会让人受挫甚至想放弃,当你对本身的研究领域充满兴趣时,你天然而然就会有很强的主动性,而不是以为研究是一个枯燥无味的任务。在学术研究中,咱们通常会作些什么?其实,学术研究经常是一项系统工程,主要会包括下面几个环节(如图1所示),来共同完成对创新的追求。首先是肯定一个方向,提出问题,而后提出本身的解决方法,经过设计实验来进行验证方法的有效性,最后撰写发表论文。这五个环节并非按照线性顺序一次进行和完成,而是一个多层迭代和循环的过程。而在这整个研究过程当中会涉及到不少内容,我将主要谈一下在文献检索、文献阅读、实验设计和论文写做这四个方面上本身的经验体会。测试
2 文献检索字体
目前正式发表的论文,主要有两种来源。一种是期刊论文,期刊论文通常是不限定截稿时间,任什么时候间均可以由做者向期刊投稿,而后通过多个同行专家评审,并通过可能屡次修改获得专家承认后,才能由期刊正式出版发表。因此通常期刊上的论文写做会更为规范,在实验设计方面更加的系统完整。可是因为整个过程周期较长,通常一篇论文从投稿到最后发表都须要半年甚至一年以上时间,因此技术会有必定滞后性。另外一种是会议论文,特别是做为咱们计算机专业,技术发展更新快,会议论文十分重要。相比期刊论文,会议论文通常一年举办一次会议,并在相对固定的时间内征稿,有投稿截止日期。因此在论文写做上,因为时间紧迫,可能没有那么规范。会议论文更强调创新性,发表的周期短,可以更快的获取的技术发展的前沿研究。近年来,因为研究技术更新快,预印本文库(arXiv, https://arxiv.org/)能够发布本身的最新成果,也已经成为了解最新技术的重要信息源。但上面的论文并无通过严格的筛选,因此质量良莠不齐,最好选择已经录用,或者知名团队的论文,须要本身进行判断。ui
在海量文献中,咱们最好是阅读一些高质量的论文,若是做为一个初学者,如何能知道哪些论文会具备高影响力呢?对此,我有如下几条参考建议:搜索引擎
在进行学术研究之初,作好文献检索调研工做是十分重要的。文献检索是根据科研工做或科研课题的须要,有计划、有组织、系统全面地调查、收集有关文献资料的工做过程。当咱们肯定了研究方向和任务时,如何比较完整地把相关文献检索出来呢?我通常会经过查找综述论文,查找表明性论文和查找引用该论文的论文三个步骤来完成。
首先是查找综述论文,一篇优秀的综述论文每每可以让你对该研究领域有个全面的了解。例如,文献[2]是一篇生物医学文本挖掘的综述论文,从论文提纲目录(如图2所示)咱们看到,综述论文中通常会提供该领域的任务介绍、相关数据集和工具,并对现存方法进行系统分类,给出每类方法的表明性工做,最后描述目前应用、存在的挑战和未来工做方向等。对于综述文献的检索:咱们能够利用谷歌学术搜索引擎经过关键词+review/survey/tutorial组合来进行综述检索;或者查看一些综述性期刊;还有就是利用中国知网(http://www.cnki.net/)和学术搜索引擎去查找相关的国内外博士论文,经过博士论文中的相关工做章节来了解目前研究情况。
图2. 综述文献[2]目录
除了检索相关综述论文之外,咱们还须要检索最近的研究论文。利用学术搜索引擎检索关键词,而后根据时间排序来找到最近相关论文,或者在近年的顶级会议和顶级期刊中检索相关内容。再从这些研究论文的相关工做(Related Work)中找到系列表明性工做。例如图3所示,这是2017年NLP领域顶会ACL上一篇进行实体关系联合抽取工做论文[3]中的相关工做部分。从这篇论文的相关工做里,咱们能够找到实体关系抽取的表明性方法。
图3. 文献[3]相关工做部分
最后就是查找引用该论文的论文,经过谷歌学术搜索引擎能够从引用该论文的列表中找到一个研究工做的后续相关工做。例如利用谷歌学术搜索找到引用文献[3]的论文列表,以下图,能够看到引用该论文的论文基本都是和实体关系联合抽取相关的后续工做。
图4. 引用文献[3]的谷歌搜索结果
总结一下,在进行文献检索时,能够先查询综述文献,从综述文献中对研究任务有个总体了解;而后经过关键词查询近期论文,从其相关工做中向前看找到表明性工做;最后查找引用该论文的论文,向后看找到相关工做的后续工做。这样通常就可以比较完整地检索出相关论文。
3. 文献阅读
在学术研究时,须要进行大量的文献阅读。可是咱们也不能把全部时间都花费在阅读论文上,这就须要咱们进行高效的文献阅读。其实咱们在进行文献阅读前,咱们须要明确阅读目的,这样阅读时才会有所偏重。通常文献阅读主要有下面的目的:1)了解研究现状,掌握现有解决方法,存在的问题和挑战。这样咱们通常能够去阅读一些综述论文。2)把握学术动态和前沿,建议阅读近期的顶会顶刊论文。3)对于了解和掌握一些工程性的处理操做(好比预处理,超参设置,经常使用特征等),建议阅读一些评测论文。4)学习论文写做,能够阅读一些顶级期刊中第一做者母语为英语的研究者的论文。5)平日积累,丰富知识,能够天天刷刷arXiv。
图5. 论文通常框架结构图
在阅读论文时,咱们不要每篇论文都一字一句从头读到尾,这不只会浪费太多的时间和精力,还会使你的研究思路僵化。通常论文阅读能够分为泛读和精读,在咱们明确了阅读目的后,再根据需求进行选择。首先是泛读,咱们应快速浏览一遍论文。通常学术论文写做是有必定框架结构的。图5展现了一篇论文通常的框架结构,实线框的部分通常是论文高层次概念,阅读这些内容能够快速的了解论文,对其研究问题、主要动机、解决方案以及实验室结果大体了解。若是咱们泛读以后,根据本身的判断和需求,须要进一步的深刻,那么再进行精读,不然这篇论文只需泛读掌握核心内容便可。对于精读,咱们须要从头再读一篇,细致地推敲论文,能够从网上搜索一些相关资源来帮助理解,若是这篇论文附有源码也能够经过阅读源码来加深对论文的理解。
在阅读以后,咱们经常会忽略的是思考。阅读后的思考其实比阅读更重要,只有经过思考,咱们才能从中挖掘新想法,尝试着如何更深刻研究去超越目前工做。当咱们阅读以后,建议你们再对阅读的论文作下面一些思考:1)总结性思考,总结和思考这篇论文的亮点在什么地方,咱们能从中学习到什么。2)批判性思考,带着批判的眼光去思考,做者提出的假设条件是否成立?提出的问题是否合理?解决方法有没有缺陷?3)创造性思考,若是不用做者的这套方法,对于这个问题,咱们是否还能想到更好、更新和其余的解决方法?4)迁移性思考,做者提出的这种方法是否可以应用于其余任务来解决其余问题?当咱们养成思考的习惯后,经常会在思考的过程当中找到研究灵感。
俗话说:“好记性不如烂笔头”。当咱们通过一段时间的积累后会发现,本身阅读的论文会愈来愈多,有时又想回过头去再看看那篇论文,但经常都不知道本身把论文丢在哪了。因此学会管理文献和作好阅读总结笔记也是很重要的。在阅读论文时,能够根据习惯打印出纸质版的论文或者直接在电脑上进行阅读,阅读以后建议你们学会利用一些软件来管理本身的文献。我本身使用的是Mendeley软件(https://www.mendeley.com/),这是一款免费的文献管理软件。将论文拖进软件中软件会自动识别论文的基本信息,你还能够利用它创建树形目录来对阅读后的论文进行分类。此外还有高亮,注释,笔记,云同步等功能,十分方便。并且能够经过软件的检索功能很快找到你想查询的相关论文。每次阅读完论文后,建议你们作一个简单的总结笔记,这样不只能够锻炼你对论文核心内容的总结能力,并且对于过后再读这篇论文时,经过总结笔记可以快速的触发你的记忆点,回想起论文的内容。一个简短的总结笔记应该包括论文简介,论文亮点,实验结果和思考等内容。图6就是我对一篇论文[4]的总结示例。
图6 Mendeley管理文献展现
总的来讲,明确阅读目的后进行泛读或者精读,阅读后养成思考的习惯,学会管理文献和作好阅读笔记,提高文献阅读的效率和质量。
4. 实验设计
对于理工科,实验设计是学术研究中不可缺乏的部分。实验最重要目的就是验证咱们提出方法的有效性。再进行实验设计时,咱们须要时刻遵循三个关键词:合理、可靠和完备。实验设计合理,使用数据和数据来源可靠,实验对比方案完备。通常实验设计会涉及到下面几个内容:实验数据,辅助实验,主实验,与先进方法对比和结果错误分析。
实验数据:再进行实验以前,咱们得选择合适的实验数据。并且实验数据的来源得可靠。通常咱们能够选择一些国内外公开评测的数据集或者是一些其余已发表相关论文中经常使用的数据集。若是你研究的问题确实没有现存的数据集,须要本身构建的话,必定要按照标准正规的方式进行数据集构建。对于同一个研究问题,最好能在多个相关数据集上进行实验,来讲明模型方法的泛化能力,这样实验结果也更具说服力。此外,咱们还须要注意测试集的规模,尽可能不要在测试集规模太小的数据集上进行实验,这样获得的结果缺少说服力。
辅助实验:一些模型构建时的细节实验,目的是展现一些非核心的部件对模型的影响。例如,不一样超参数(如词向量维度,网络深度等)对模型的影响,不一样常规模块对研究方法效果的贡献,不一样数据划分对研究方法的影响等。
主实验:验证论文创新点的核心实验,这些实验须要根据论文创新工做特色而有针对性的设计,目的是证实本研究工做创新点的有效性。在实验中尽可能控制其余变量,只聚焦于本研究关注的挑战问题便可。实验设计要尽可能完备,从各个角度去考量提出创新部分的有效性。
与目前先进方法对比:目的是说明本研究工做到达的水平。在与先进方法对比时,不只须要提供同一个数据集上的先进方法结果对比,还须要重现不一样数据集上的相关方法在本实验数据集上的结果进行比较。
结果展现和错误分析:前面的实验数据结果基本都是定量分析,在实验设计里咱们也须要进行定性分析。经过对模型输出结果的实例进行错误分析,发现研究工做中的优缺点。错误分析十分重要,有时只经过定量的结果数值咱们没法从中发现问题,而经过对错误结果的定性分析思考,咱们更容易发现模型的问题所在,从而提出新的方法去进行改进。
5. 论文写做
当咱们已经按照上述流程顺利完成了实验,并获得了不错的研究结果。那么接下来的任务就是撰写和发表学术论文,给读者呈现本身的研究成果。学术论文与其余写做形式有所不一样,学术论文最重要的是内容必须真实、可信和准确。因此在写做时应该保持严谨,认真的态度,使用正式的书面语,实事求是地去阐述你的研究工做和结果。目前工程领域的学术论文已经造成比较固定的结构,绝大部分论文都会包含下面几个部分:题目、摘要、引言、相关工做、方法、实验和总结。
上面是一篇学术论文写做应该包含的主要内容,写做不须要过于花哨的辞藻,重要的在于向读者清晰准确地描述本身的研究工做。此外,在对于论文写做还应该注意下面几点:
实际上,如今也有不少很好的如何进行论文写做的学习资料,在此我推荐清华大学刘洋老师的一个PPT《机器翻译学术论⽂写做⽅法和技巧》[5]和清华刘知远老师的一篇博文《如何写一篇合格的NLP论文》[6],我相信经过仔细阅读这些资料会对你的论文写做有所帮助。
6 总结
学术研究之路是探索之路,是追求之路,是磨练之路。本文是我在本身目前的研究之路上的一些心得体会和经验分享。分别从学术研究中的文献检索、文献阅读、实验设计和论文写做几个环节上进行分享。也是但愿能够对一些入门研究不久的同窗起到一些帮助做用,早日走上本身的学术之路。
参考文献:
[1] 凌晓峰,杨强.学术研究,你的成功之道[M].清华大学出版社,2012年.
[2] Zhu F, Patumcharoenpol P, Zhang C, et al. Biomedical text mining and its applications in cancer research[J]. Journal of biomedical informatics, 2013, 46(2): 200-211.
[3] Zheng S, Wang F, Bao H, et al. Joint extraction of entities and relations based on a novel tagging scheme[C]. Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2017: 1227-1236.
[4] Liu B, Zhang T, Han F X, et al. Matching natural language sentences with hierarchical sentence factorization[C]. Proceedings of the 2018 World Wide Web Conference on World Wide Web. International World Wide Web Conferences Steering Committee, 2018: 1237-1246.
[5] 刘洋. 机器翻译学术论⽂写做⽅法和技巧. 2014年. http://nlp.csai.tsinghua.edu.cn/~ly/ talks/cwmt14_tut.pdf
[6] 刘知远. 如何写一篇合格的NLP论文. 2019年. https://zhuanlan.zhihu.com/p/58752815