本科生科研体会——基科52班关健

关健,来自清华大学物理系基科52班。自2017年6月进入智能技术与系统国家重点实验室交互式人工智能(CoAI)课题组,在黄民烈老师的指导下进行科研训练。目前已在 ACL 2018 发表一篇长文(第二作者)、在 AAAI 2019 发表一篇长文(第一作者)。




初识黄老师

回想起来,我认识黄老师还是在大二上学期的那门离散课上。其实当时还并未关注黄老师课题组的科研方向,但黄老师对学生的耐心和细致一直让我记忆犹新。

 

物理系的科研训练要求是从大三开始,但大多数同学都会在大二下学期甚至更早去联系自己心仪的导师,我在四月份期中考试过后才第一次去见黄老师,算是“下手”比较晚的一批了。其实当时我对 NLP 领域主流的方法都一无所知,聊天时自然非常紧张,但我准备的很多现在看来非常怪异的问题,黄老师即使那天因为感冒嗓子不舒服,也都慢条斯理地给我一一讲了清楚,因此我便下定决心来到了黄老师组里学习和科研。

 

后来的半个学期里,我抓紧时间自学了一些理论知识,六月份就真正开始在黄老师的指导下真正地开展了科研训练。



科研经历

因为我们的科研经验尚且不足,黄老师通常都会自己直接给我们安排一个题目做,同时也会安排本科生同学一起合作,使我们能够相互学习、共同进步。而如今再回过头去看我的两段科研经历,还是会不禁感叹自己的幸运。


在刚开始接触科研时,我有幸和组里另一个刚刚读博士一年级的学长柯沛一起做一个题目,虽说学长刚刚读博,但在我看来他对于这个领域的前沿理论和方法却都如数家珍,我想这正是长期以来学习和思考带来的积累,也是我们应该努力做到的目标。那个暑假,即使我无论是在编程实践还是经验积累上都存在着大量欠缺,但是在学长的指导下,我渐渐地也能够自己完成一些工作。即使几乎整个暑假都在读论文、调参数、做实验,但当真正看到自己真正做出来一些成果的时候,喜悦和成就感还是会让我感叹不虚此行啊。


在大三上学期时,因为正在上黄老师人工神经网络课程的契机,我和实验室里另一位计算机系的大三本科生同学开始合作研究一个故事生成的工作。在这段经历中,从文献调研、提出模型、实验论证、模型评测到撰写论文,我终于经历了一次完整的科研训练过程。事实上,要是总结起来,科研就是这样一件过程非常明确的事情,但在实际操作中,其中有任何一点想不清楚,这个过程就会变得非常不顺利。我们在工作刚开始时就走了很多弯路,对于糟糕的实验结果根本无从下手如何去改进,甚至根本不理解为何会呈现出这样的结果。但通过仔细地分析,对于实验中每一个操作细节的数学原理的思考,最终得出结论,我们的这个思路从原理上来讲可能就是不可行的。虽然这一次尝试失败了,但是失败得清清楚楚明明白白,也可聊以自慰了。我们最终的模型的灵感是在后来的一次讨论中闪现的,之后的过程其实就相对顺利一些,即使多少也有些大大小小的失败,也能够在失败的基础上总结和思考,进行新的尝试,一点一点完善模型的漏洞。


总结起来,做科研与学习专业课程的思路大相径庭,在科研过程中总是充满了各种各样的困惑和失败,也不会有任何标准答案,只有通过观察、思考、实践、总结,我们对科研的理解才能逐渐深入。



科研体会

时间规划

对我而言,同时兼顾科研和学业是件非常困难的事情,并且大三学年对大多数同学来说都是课程压力最大的时期,如何做好时间规划、分清主次、提高效率、培养快速学习的能力就至关重要。

文献笔记

在文献调研过程中,综合全面、分层次、条理清晰地总结读过的论文,按照数据集、任务、方法等指标划分不同的工作,详细阐述论文的创新点以及缺陷和漏洞,对深入理解该领域有着重要的启发意义。

增强行动力

要测试模型的性能,必须要将实验做的足够充分、有说服力。即使可能最后呈现在论文中的不过两三个结果,但大量的实验能充分挖掘模型的优势和缺陷,通过改进使得模型更加鲁棒。因此,一旦有灵感,就不要拖延。

自信 主动 交流

基科班的同学相比之下算法和编程基础会更加薄弱,但是只要更加主动地与老师、学长、同学交流,不仅是从他们那里学习知识,同样还可以交流自己的想法,从而检验其可行性,也能得到更加充分有效的建议和指导,如此便能快速地提高自己的知识水平,同时少走弯路,通过自己的努力做出不错的工作。



总结

非常幸运能够在这里遇到了好的导师和伙伴们。在一年多的科研训练过程中,难免有过迷茫和辛酸,但更多的是探索未知、获得新知的喜悦。相比于实验室里的学长以及其他本科生同学们,我要学习的东西还有太多,今天的分享算是我自己对过去一年的总结和反思,希望能给大家一些启发。祝大家在学业中能找到自己真正喜欢的方向,脚踏实地坚定地走下去!



科研成果

[1] Pei Ke, Jian Guan, Minlie Huang, Xiaoyan Zhu. Generating Informative Responses with Controlled Sentence Function. Published in ACL 2018, CCF A.

 

[2] Jian Guan, Yansen Wang, Minlie Huang. Story Ending Generation with Incremental Encoding and Commonsense Knowledge. Published in AAAI 2019, CCF A.