经历7个月研究+19个月打磨,人生第一篇几乎100%自主完成的学术论文终于online了(之前高中时写着玩的那篇核心不算):https://pubs.acs.org/doi/10.1021/acs.langmuir.3c01432
打磨这么久主要是因为本科阶段与科研无关的事情太多+后期“移情别恋”了。
接下来简单讲讲和这篇研究工作相关的经历吧(⚠流水账预警⚠)。
参加GMX培训班之前,我对MD了解并不多,只会用packmol搓模型+用GMX跑一些最简单的MD。2021年初,牙一咬脚一跺心一横,决定自费参加4月的第九届GMX班。培训回去后没有立即开始消化,因为那个学期是在校上课的,且课排得极满,每天都在“疲于奔命”。7月回家后摆烂了一段时间,7月底捡回了培训讲义,顺便接手了之前组里的人没能推进下去的课题(后来发现主要原因是他们没听过科音的GMX课)。本来这是个纯应用向的的课题,只需要用现成的力场,拿当时流行的acpype+RESP方案把拓扑文件制作出来即可,而重点在于分子设计和筛选。但是折腾了几天发现模拟精度并不理想,因此开始研究力场拟合,恰逢钟叔的Ztop上线,遂使用之。就这样,研究的方向开始向方法学偏转。如今看来这是“初生牛犊不怕虎”式的决定,不过从理想主义的层面来说,这是正确的选择,因为后来的一些benchmark表明原先的方案在某些情况下甚至定性都是错的,即使硬着头皮把数据搞出来,也没什么实际价值。力场重新拟合过一遍后,又发现了新问题:以往所用的模拟方案很不严谨,且该领域先前的模拟工作中一些经常被分析的数据项的现实意义也不大,分析那些数据属于自说自话,不能指导现实应用。因此,作为理想主义者,我再次决定重新设计模拟流程以计算出可以直接指导实验的数据,顺便写了个1000行的阴间shell脚本来实现主要工作流的自动运行(随着方案的更新,迭代了20版)。开发和验证新方法的过程中,我又从一些零散数据中察觉到该领域以往的一些经验性结论可能存在较大漏洞,因此专门研究了这些问题,最终证明了以往的一些结论确实存在问题,遂对其进行了修正和细化,不过其中一部分被导师要求进一步研究后再单独发表。
总之,作为一项方法学研究,这项研究开发了一套比该领域以往研究更先进的方案,提供了一些比较典型的示例(用导师的话说是“树立了标杆”),对原始性问题给出了比以往更细化的结论。整个研究过程耗时7个多月,论文初稿于2022年3月初完成。
文章从Angew和JACS开始投,一路被拒到Langmuir。第一次投Langmuir很快就收到了Hendrik Heinz编辑(该编辑的研究方向和我的文章极为接近)的一大堆comments,主要问题还是验证工作不足,因此,我又加了大量的验证工作(或者说是benchmark),其中消耗机时最夸张的是CMC预测相关的部分,用24片V100 + 16片RTX 2080Ti暴力计算了半个月(幸好算力是白嫖的)。
第二次投稿Langmuir收到回复是在2022年11月,Reject & Resubmit,时限半年。当时要准备考研了,就没有去修改(虽然但是,考研还是喜闻乐见地G了)。有审稿人认为文章工作量太大,建议将文章拆分为至少2篇,不过我没有采纳,希望可以让读者看到完整的故事。这很理想主义,但这样的理想主义正是自然科学研究乃至人类社会进步所最需要的。这次修改和毕设同步进行,毕设基本上就是这篇文章的中文版。1-4月的空档期在阳康休养(i.e.摆烂)+ 玩各种流行的AI + 做硬件benchmark + 给另一个学校的课题组的实验工作做模拟。
2023年5月28日第三次投稿,又经历了一些revision,终于在2023年10月2日接收了,令人感叹。
纵观整个过程,最大的体会就是——不要太理想主义。当然,这只是说给别人听听的,自己大概率还是会继续“头铁”下去…
文章评论