关于论文
TLDR
写之前,先读。
关于科学
可重复性是「科学」的根本要求
这个专业领域内的任何读者,都有办法根据文中的描述,在他的实验室下复制出相同或接近的研究成果,以便确定的结论确实是可以「在任何时间、任何地点、任何人」都具有可重复性的。
一、论文的要求
一篇硕士论文的基本要求是: 1. 论文的主要内容,是叙述一套方法在一个特定场合中的应用
找到与此方法相关的学术文献(尤其是学术期刊论文)是作者的责任而非审稿人/读者的责任
因此,在论文中,必须要有足够的证据来向读者证明:针对这个应用场合,该方法确实有比一切既有文献中的方法更优越之处。
此外,必须要能清楚指出这个方法在应用上的限制,并且提出充分证据来说服读者:任何应用场合,只要能够满足所提出来的假设(前提)条件,其方法就一定适用,而且一定能够取得预期的效果。
必须要在论文中清楚指出这个方法的限制和可能的缺点(相对于其它文献上的既有方法,或者在其它应用场合里)。假如这个方法有任何重大缺点,却由审稿人而非作者指出,其后果是论文可能无法通过。
行文风格上,它应是一篇论证严谨,逻辑关系清晰,而且结构有条理的专业论述。即,它须使得该专业领域的任何一名读者均可根据文中既有内容将实验结果进行复现。
这个方法的每一个步骤都必须要提供充分的理由说明「为什么非如此不可」。
论文必须要在适当位置清楚注明所有和所研究之题目相关的文献,以证明并非是抄袭已有观点或是简单重复已有的工作。
以上所述,均是务必要做到的要求,因此没有好坏之分。
一篇硕士论文的好坏(以及成绩的评定标准),主要是看所谓「对学术界的贡献」的多寡与重要性而定。所谓「对学术界的贡献」,指的是:把你的所有研究成果扣除掉学术界已经发表过的所有成果(不管实际上有没有参考过,没有参考过也算是重大过失),剩下的就是的贡献。假如这个贡献太少,也构成论文无法及格的充分理由。
所以这套方法必须要有所创新或突破。因此,它或者是解决既有问题的新方法,或者是既有方法的新应用,或者是以一个新的方法开启一整片新的应用领域。
最后,必须要强调:找出并仔细阅读和所研究的问题相关的全部学术文献(尤其是学术期刊论文)是你的责任(如果漏掉就是的过失)。假如有人指出有一篇既有文献,在所讨论的问题中处理得比的方法还好,这就构成论文被退稿的充分理由。
判断论文的好坏有一个粗浅办法:假如研究成果可以在国外著名学术期刊(journals,而非 magazines)上发表,通常就比一篇只能在国外学术会议(conferences)上发表的论文贡献多;一篇国外学术会议的论文又通常比无法发表的论文贡献多;在国际顶尖学术期刊上发表的论文通常比一篇二流的学术期刊论文贡献多。
SCI有一种叫做 Impact Factor 的指数,统计一个期刊每篇论文被引述的次数。通常这个次数(或指数)愈高,对学术界的影响力就愈大。对于每个领域,Impact Factor 的评价标准并不一致,但是愈高的 Impact Factor 一般意味着该期刊的水平越高,在上面发表的文章的水平也越高。
二、完成硕士论文所需要的能力
从前面的叙述可以归纳出来,完成硕士论文所需要的能力包括以下数项,依它们的培养先后次序逐项讨论。
1. 资料检索的能力
在给定(或自己拟定)的题目范围内,必须有能力利用文献资料索引系统,查出所有相关的论文,而无任何遗漏(否则可能在论文投稿时才发现同一个题目已经有人发表过了)。
到底要用什么样的关键词和查询程序去保证已经找出所有相关的文献?
这是第一个大的挑战。每一组关键词(包含并集与交集)代表一个论文所构成的集合, - 假如用的关键词不恰当,可能找到一个太小的集合,没有涵盖所有的相关文献; - 假如用的关键词太一般化(譬如「计算机」),通常会找到一个巨大的集合,包括了比所有相关文献加起来还多上上好几十倍的毫不相关的文献。
2. 资料筛选的能力
即使使用了恰当的搜寻策略,通常找到的文献集合都还是明显地比所需要的集合大。通常一个一两百篇到数百篇的论文集中,会和的研究课题直接且密切相关的论文大概只有一二十篇。
如何在只读论文的题目、摘要、简介和结论,而还没有完全看懂内文的情况下,准确地判断出这篇论文中是否有值得进一步参考的内容,以便快速地将这个数百篇的庞大论文集去粗存精,删繁就简?这考验着从事资料筛选的能力。
3. 知识系统的组织能力
期刊论文和本科的课本截然不同。
本科的课本是寻次渐进地从最基本的知识背景逐步交代出整套有系统的知识,中间没有任何的跳跃,只要逐页读下去,就可以整本都读懂,不需要在去别的地方找参考资料。
但是期刊论文是没头没尾的十几页文献,只交代最核心的创意,并援引许多其它论文的研究成果(但只注明文献出处,而完全没有交代其内容)。因此,要读懂一篇论文,需要要同时了解数篇或十数篇被援引的其它论文。偏偏,这十几篇被援引的论文又各自援引十数篇其它论文。
可以看出,相对于本科的教科书而言,期刊论文是一个极端没有系统的知识,必须要靠读者自己从几十篇论文中撷取出相关的片段,自己组织成一个有系统的知识,然后才有办法开始阅读与吸收。要培养出这种自己组织知识的能力,需要在学校靠着大量而持续的时间去摸索、体会,而不可能只利用业余的零星时间去培养。
因此,一个研究生和本科生最大的差别就是:
学士只学习过吸收系统知识的能力(也就是读别人整理、组织好的知识,典型的就是课本);但硕士则学习过自己从无组织的知识中检索、筛选、组织知识的能力。
4. 期刊论文的分析能力
为了确定的学位论文研究成果确实比所有相关的学术期刊论文都更适合处理所拟定的应用场域,首先必须要有能力逐篇分析出所有相关期刊论文的优点与缺点,以及自己的研究成果的优点与缺点,然后再拿他们来做比较,总结出的论文的优点和缺点(限制)。
但是,好的期刊论文往往是著名学府的名师和一流的博士生共同的研究成果,假如要在锁定的应用场域上「打败」他们,突出自己的优点,这基本上是一个极端困难的挑战。即使只是要找出他们的缺点,都已经是一个相当困难的工作了。
一个大学毕业生,四年下来都是假定「课本是对的」这样地学下来的,从来没有学习如何分析课本知识的优缺点,也就是「只有理解的能力,而没有批判的能力」。
硕士生则必须要有「对一切既有进行精确批判」的能力。但是,这个批判并非个人好恶或情绪化的批判,而是真的找得到充分理由去支持的批判。这个批判的能力,让有能力自己找到自己的优、缺点,因此也有机会自己精益求精。
所以,一个大学毕业生在业界做事的时候,需要有人指导他(从事批判性检验),帮他找出缺点和建议改进的可能性。但是,一个严格训练过的合格硕士,他做事的时候应该是不需要有人在背后替他做检证,他自己就应该要有能力分析自己的优、缺点,主动向上级或平行单位要求支持。
其实,至少要能够完成这种分析,才勉强可以说拥有独立自主的判断能力了。
5. 创新的能力
许多大学毕业的工程师也能创新,但是硕士的创新是和全世界同一个学术团体内所有的名师和博士生挑战。因此,两者是站在不同的比较基础上在进行的:
前者往往是一个企业内部的「闭门造车」,后者是一个全球的开放性竞争。
其次,工程师的创新往往是无法加以明确证明其适用条件,但是学术的创新却必须要能够在创新的同时厘清这个创新的有效条件。因此,大学毕业生的主要能力是吸收既有知识,但硕士毕业生却应该要有能力创造知识。
科学史上的各种创新粗看起来都是只凭一时偶然的巧思,却没有办法进一步有系统地厘清这些巧思背后可以成立的条件。但是,就现代科研而言,创新其实是可以有一套「有迹可寻」的程序的,在硕士生阶段,导师着重培养的能力之一就是对这种科研工程的理解和掌握。
三、为什么要坚持培养阅读与分析期刊论文的能力
阅读期刊的能力是想要保持对前沿领域的了解的必备条件。
此外,只要能够充分掌握阅读与分析期刊论文的技巧,就可以水到渠成地轻松进行「创新」的工作。所以,只要深入掌握到阅读与分析期刊论文的技巧,就可以掌握到大学生不曾研习过的三种能力:
- 自己从无组织的知识中检索、筛选、组织知识的能力
- 对一切既有进行精确批判的独立自主判断能力
- 创造新知识的能力
技术的创新并不是全靠聪明。老师熟谙一套技术创新的方法,只要学会分析期刊论文的优缺点,就可拿这套方法分析竞争对手产品的优缺点;而且,只要再稍微加工,就可以从这套优缺点的清单里找到突破瓶颈所需的关键性创意。这套创新程序,可以把「创新」变成不需要太多天分便可以完成的事,从而减轻创意的不定性与风险性。因此,只要会分析论文,几乎就可以轻易地组合出所需要的绝大部分创意。天赋和聪明是难以通过后天学习的,但这套技巧却是可以教的;而且只要用心,绝大部分硕士生都可以学会。
也是因为这个原因,很多硕导对于研究生训练的重心只有一个:通过每周一次的 group meeting,培养学生深入掌握阅读与分析期刊论文的技巧,进而培养他们在关键问题上突破与创新的能力。
四、期刊论文的分析技巧与程序
一般来讲,好的期刊论文有较多的创意。虽然读起来较累,但收获较多而深入,因此比较值得花心思去分析。读论文之前,参考SCI Impact Factor 及学长的意见是必要的。
一篇期刊论文,主要分成四个部分。
1. Abstract:
说明这篇论文的主要贡献、方法特色与主要内容。要学会只看 Abstract 和Introduction便可以判断出这篇论文的重点和的研究有没有直接关连,从而决定要不要把它给读完。
假如有能力每三十篇论文只根据摘要和简介便能筛选出其中最密切相关的五篇论文,就比别人的效率高五倍以上。以后不管是做事或做学术研究,都比别人有能力从更广泛的文献中挑出最值得参考的资料。
2. Introduction:
介绍问题的背景和起源,交代前人在这个题目上已经有过的主要贡献,说清楚前人留下来的未解问题,以及在这个背景下这篇论文的想解决的问题和它的重要性。
对初学的学生而言,从这里可以了解以前研究的概况。当对的题目不熟时,先把跟题目可能相关的论文收集个 30篇 ~ 40篇,每篇都只读 Abstract 和 Introduction,而不要读 Main Body(本文),只在必要时稍微参考一下后面的 Illustrative examples和 Conclusions,直到能回答下面这三个问题:
2a. 在这领域内最常被引述的方法有哪些?
2b. 这些方法可以分成哪些主要派别?
2c. 每个派别的主要特色(含优点和缺点)是什么?
问题是,怎么去找到这最初的30~40篇论文?
有一种期刊论文叫做 “review paper”,专门在一个题目下面整理出所有相关的论文,并且做简单的回顾。可以在搜寻 Compendex 时在 keywords 中加一个 “review” 而筛选出这类论文。然后从相关的数篇 review paper 开始,从中根据 Title 与 Abstract 找出认为跟研究题目较相关的30~40篇论文。
通常只要反复读过该领域内30~40篇论文的 Abstract 和 Introduction,就应该可以从Introduction的评论中回答 2a 和 2b 这两个问题。尤其要记得,当阅读的目的是要回答 2a 和 2b 这两个问题时,一定要先挑那些 Introduction 写得比较有观念的论文念(很多论文的Introduction 写得像流水帐,没有观念,这种论文刚开始时不要去读它)。假如读过假如30~40篇论文的 Abstract 和 Introduction之后,还是回答不了2c,先做下述的工作。
根据 2a 的答案,把这领域内最常被引述的论文找齐。
根据 2b 的答案把他们分成派别,每个派别按日期先后次序排好。
每次只读一派的 Abstract 和 Introduction(必要时简略参考内文,但目的只是读懂Introduction内与这派有关的陈述,而不需要真的看懂所有内文),照日期先后读,读的时候只试图回答一个问题:这一派的创意与主要诉求是什么?
逐派逐派地把每一派的Abstract 和 Introduction 给读完,总结出这一派主要的诉求 、方法特色和优点(每一篇论文都会说出自己的优点,仔细读就不会漏掉)。
再把这些论文拿出来,但是只读 Introduction,认真回答下述问题:「每篇论文对其它派别有什么批评?」然后把读到的重点逐一记录到各派别的「缺点」栏内。
通过以上程序,就应该可以掌握到 2a、2b、和 2c 三个问题的答案。这时对该领域内主要方法、文献之间的关系算是相当熟捻了,但是还是只仔细读完Abstract 和 Introduction而已,内文则只是笼统读过。
这时候,已经掌握到这领域主要的论文,可以用这些论文测试看看用来搜寻这领域论文的 keywords 到底恰不恰当,并且用修正过的 keywords 再搜寻一次论文,把这领域的主要文献补齐,也把原来 30 篇~40 篇论文中后来发现关系较远的论文给筛选掉,只保留大概 20 篇左右确定跟关系较近的文献。如果有把握,可以甚至删除一两个不想用的派别(要有充分的理由),只保留两、三个派别(也要有充分的理由)继续做完以下工作。
然后应该利用 2c 的答案,再进一步回答一组问题
2d: - 这个领域内大家认为重要的关键问题有哪些? - 大家重视哪些优点?大家在意哪些缺点? - 这些优点与缺点通常在哪些应用场合时会比较被重视? - 在哪些应用场合时比较不会被重视?
现在应该可以整理出这个领域(研究题目)主要的应用场合,以及这些应用场合上应该注意的事项。
最后,在真正开始念论文的 main body 之前,应该要先根据 2a 和 2c 的答案,把各派别内的论文整理在同一个档案夹里,并照时间先后次序排好。然后依照这些派别与的研究方向的关系远近,一个派别一个派别地逐一念完。
3. Main body(含simulation and/or experimental examples)
在第一次有系统地念某派别的论文 main bodies 时,只需要念懂:
3a. 这篇论文的主要假设是什么(在什么条件下它是有效的)
3b. 评估一下这些假设在现实条件下有多容易(或多难)成立
3c. 在这些假设下,这篇论文主要有什么好处
3d. 这些好处主要表现在哪些公式的哪些项目的简化上
至于整篇论文详细的推导过程,不需要懂。除了三、五个关键的公式(最后在应用上要使用的公式,可以从这里评估出这个方法使用上的方便程度或计算效率,以及在非理想情境下这些公式使用起来的可靠度或稳定性)之外,其它公式都不懂也没关系,公式之间的恒等式推导过程可以完全略过去。假如要看公式,重点是看公式推导过程中引入的假设条件,而不是恒等式的转换。
愈难成立的假设,愈不好用,参考价值也愈低。
但是,在开始根据前述问题念论文之前,应该先把这派别所有的论文都拿出来,逐篇粗略地浏览过去(不要勉强自己每篇或每行都弄到懂,而是轻松地读,能懂就懂,不懂就不懂),从中挑出容易念懂的 papers,以及经常被引述的论文。然后把这些论文照时间先后次序依序念下去。
记住:念的时候只要回答 3a、3b、3c、3d 四个问题就好,不要念太细。
这样念完以后,应该把这一派的主要发展过程,主要假设、主要理论依据、以及主要的成果做一个完整的整理。其次,还要在根据 2d 的答案以及这一派的主要假设,进一步回答下一个问题:
3e. 这一派主要的缺点有哪些。
最后,根据以上问题的答案综合整理出:这一派最适合什么时候使用,最不适合什么场合使用。
记住:回答完这些问题时,还是不应该知道恒等式是怎么导出来的!
当是生手的时候,要评估一个方法的优缺点时,往往必须要参考它Examples。但是,
记住:老练的论文写作高手会故意只 present 成功的案例而遮掩失败的案例。
所以,simulation examples and/or experiments 很棒不一定表示这方法真的很好。必须要回到这个方法的基本假设上去,以及他在应用时所使用的主要公式(resultant equations)去,凭自己的思考能力, 并且参考 2c 和 2d 的答案,自己问问看:
- 当某某假设在某些实用场合上无法成立时,这个方法会不会发生什么问题?
- 猜一猜,预测一下这个方法应该会在哪些条件下(应用场合)表现优异,又会在哪些条件下(应用场合)发生问题?
根据这个猜测再检验一次simulation examples and/or experiments,看它的长处与短处是不是确实在这些 examples 中充分被检验,且充分表现出来。
那么,什么时候才需要弄懂一篇论文所有的恒等式推导过程,或者把整篇论文细细读完?
记住:NEVER!
只需要把确定会用到的部分给完全搞懂就好,不确定会不会用到的部分,只需要了解它主要的点子就够了。
在这一点上硕士生和大学生最主要的差别: - 大学生读什么都必须要从头到尾都懂,因为他面对的知识是有固定的范围的,是经过老师编纂和筛选过的。 - 硕士生只需要懂他用得着的部分就好了,因为他面对的知识是没有范围的,只需要懂他所需要的细腻度就够了。他必须学会自己选择性的阅读,而且必须锻炼出他选择时的准确度以及选择的速度。
不要浪费时间在学用不着的细节知识!多吸收「点子」比较重要,而不是细部的知识。
五、方法与应用场合特性表(有迹可寻的创意程序)
搜寻出文献上所有可能可以用来做这一个工作的方法。或许找到的方法一共有若干种,这些方法各有它的特色(优缺点)。
但是,同样一个方法可能有许多不同的应用场合,而不同应用场合可能会对适用(或最佳)的方法有不同要求。
那么,若个方法中哪个方法最好?可能会回答说:「方法 H!因为它的优点最多,缺点最少。」但是,这样的回答是错的!一个方法只有优缺点,而没有好坏。
当它被用在一个适合表现其优点而不在乎其缺点的场合里,它就显得很好;但是,当它被用在一个不适合表现其优点而很在乎其缺点的场合里,它就显得很糟。
譬如,方法 H 在应用场合 A,它的表现会非常出色(因为所有的优点刚好那个应用场合都在意,而所有的缺点刚好那个应用场合都不在意);但是,方法 H 在应用场合 B 里它的表现却会非常糟糕(它所有的缺点刚好那个应用场合都很在意,而它大部分的优点刚好那个应用场合却都不在意)。
所以, 1. 方法没有好坏,只有相对优缺点;只有当方法的特性与应用场合的特性不合时,才能下结论说这方法「不适用」 2. 当方法的特性与应用场合的特性吻合时,则下结论说这方法「很适用」。因此,一定要同时有方法特性表与应用场合特性分析表放在一起后,才能判断一个方法的适用性。
更重要的是:上面的分析还可以用来把「突破瓶颈所需的创意」简化成一种「有迹可寻」的工作。譬如,假定老师们要针对应用 A 发展一套适用的方法,首先老师们要先从上右表中标定这个应用场合关心哪些问题特性。根据上右表第一个 column,A应用场合只关心四个特性:特性1、2、3、5。
那么,哪个方法最适用呢?
看起来是方法一,它除了特性2表现普通之外,其它三个特性的表现都很出色。但是,假如老师们对方法一的表现仍不够满意,怎么去改善它?
最简单的办法就是找一个现成的方法和方法一结合,产生出一个更适用的方法。因为方法一只有在特性2上面表现不够令人满意,所以老师们就优先针对在特性2上面表现出色的其它方法加以研究。根据上左表,在特性2上面表现出色的方法有方法二和方法四,所以老师们就去研究这两个方法和方法一结合的可能性。
或许(随便举例)方法四的创意刚好可以被结合进方法一而改善方法一在特性2上面的表现,那么,老师们就可以因此轻易地获得一个方法一的改良,从而突破 A 应用场合没有适用方法的瓶颈。
有没有可能说单纯常识结合既有方法优点仍无法突破技术瓶颈的状况?可能有。这时候真的需要完全新颖的创意了。但是,这种时候很罕见。多半时候只要应用上一段的分析技巧就可以产生足以解决实用问题的创意了。至少,要产生出一篇学术期刊论文并非那么困难。
六、论文阅读的补充说明
硕士生开始学读期刊论文时容易犯的毛病就是戒不掉本科时期的学习习惯:
老是想逐行读懂,有一行读不懂就受不了
不敢发挥自己的想象,读论文像在读教科书,论文没写的就不会,瘫痪在那里,老怕弄错作者的意思,神经绷紧,脑筋根本动不了
大学毕业后(不管是念硕、博士或工作),可以参考的资料都没有秩序地交错成一团,而且永远都读不完。用大学生的心态读书,结果一定时间永远不够用。因此,每次读论文都一定要带着问题去读,每次读的时候都只是图回答要回答的问题。
因此,一定是选择性地阅读,一定要逐渐由粗而细地一层一层去了解。上面所规划的读论文的次序,就是由粗而细,每读完一轮,对这问题的知识就增加一层。根据这一层知识就可以问出下一层更细致的问题,再根据这些更细致的问题去重读,就可以理解到更多的内容。
因此,一定是一整批一起读懂到某个层次,而不是逐篇逐篇地整篇一次读懂。
这样读还有一个好处:第一轮读完后,可以根据第一轮所获得的知识判断出哪些论文与你的议题不相关,不相关的就不需要再读下去了。这样才可以从广泛的论文里逐层准确地筛选出真正非懂不可的部分。不要读不会用到的东西,白费的力气必须被极小化!其实,绝大部分论文都只需要了解它的主要观念(这往往比较容易),而不需要了解它的详细推导过程(这反而比较费时)。
其次,一整批一起读还有一个好处:同一派的观念,有的作者说得较易懂,有的说得不清楚。整批读略过一次之后,就可以规划出一个以为比较容易懂的阅读次序,而不要硬碰硬地在那里撞墙壁。可以从甲论文帮弄懂乙论文的一个段落,没人说读懂甲论文只能靠甲论文的信息。所以,整批阅读很像在玩跳棋,要去规划出自己阅读时的「最短路径」。
本科生读东西一定要循规蹈矩,还没修过机械视觉相关课程之前可能也只好循规蹈矩地逐行去念。但是一旦修过机械视觉相关课程,许多论文中没被交代的段落也已经可以有一些属于的想象(虽然有可能猜错,尤其刚开始时经常猜错,但没关系,下面详述)。这些想象往往补足论文跳跃处最快速的解决方案。
其实,一个本科毕业生所学已经很多了,对许多事都可以有一个不太离谱的想象能力。但是大部分学生却根本不敢去想象。老师读论文远比学生快,分析远比学生深入,主要的是老师敢想象与猜测,而且多年训练下来想象与猜测的准确度很高。所以,许多论文老师根本不是「读懂」的,而是「猜对」了!
假如猜错了怎么办?不用怕!猜完一后要根据的猜测在论文里找证据,用以判断的猜测对不对。猜对了,就用的猜测(其实是的推理架构)去吸收作者的资讯与创意(这会比从头硬生生地去迁就作者的思路轻松而容易);猜错了,论文里会有一些信息告诉说错了,而且因为猜错所以读到对的答案时反而印象更深刻。
七、论文报告的要求与技巧
报告一篇论文,要求做到以下部分(依报告次序排列)
投影片第一页必须列出论文的题目、作者、论文出处与年份
以下每一页投影片只能讲一个观念,不可以在一张投影片里讲两个观念
说明这篇论文所研究的问题的重点,以及这个问题可能和工业界的哪些应用相关
清楚交代这篇论文的主要假设,主要公式,与主要应用方式(以及应用上可能的解题流程)
说明这篇论文的范例(simulation examples and/or experiments),预测这个方法在不同场合时可能会有的准确度或好用的程度
个人的分析、评价与批评,包括:
- 6a. 这篇论文最主要的创意是什么?
- 6b. 这些创意在应用上有什么好处?
- 6c. 这些创意和应用上的好处是在哪些条件下才能成立?
- 6d. 这篇论文最主要的缺点或局限是什么?
- 6e. 这些缺点或局限在应用上有什么坏处?
- 6f. 这些缺点和应用上的坏处是因为哪些因素而引入的?
- 6g. 建议学长学弟什么时候参考这篇论文的哪些部分(点子)?
一般来讲,刚开始尝试报告论文时只要做到能把前四项要素说清楚就好了,但是必须要逐步设法做到六项要素都能触及,直到能做到六项都能说清楚。
注意: 读论文和报告论文时,最重要的是它的创意和观念架构,而不是数学上恒等式推导过程的细节(顶多只要抓出关键的 equation 说明清楚即可)。报告观念与分析创意,别人容易听懂又觉得有趣;讲恒等式,大家不耐烦又浪费时间。
参考文献
- 《研究所新生完全求生手册》, 彭明辉教授,台湾清华大学