编者按:12月11日,微软亚洲研究院举办了2021理论学术研讨会,邀请了来自学术界和产业界的理论研究专家共同探讨大数据和人工智能技术的理论研究。会议期间,康奈尔大学教授、图灵奖得主 John Hopcroft 博士针对“理论研究”和“科研教育”两个话题,结合自身的感悟,为大家分享了理论研究的意义,为什么基础研究很重要,以及大学教育究竟应该教什么。John Hopcroft 博士指出,我们需要花点时间去追求自己真正热爱的,去追求自己真正感兴趣的,然后还要花费5%的时间去探索自己并不熟悉的领域。希望即将走向或者正在进行计算机科学研究的你,能够在 John 的演讲中收获满满!
以下为 John Hopcroft 博士演讲的精彩内容整理。
为什么基础研究很重要
今天,我想讲的是关于产业界的学术研究,我相信有许多人可能没太注意过这一点。首先,研究可以分为两类,一类是基础研究,一类是应用研究。应用研究是为了解决特定问题而做的研究;基础研究则是因为好奇而做的研究,不需要考虑其应用问题。评估基础研究是非常困难的,因为大部分基础研究都不会有回报。
那么,我想要问一个问题:为什么大学要雇佣研究人员?当你雇佣一个教师时,他们可能有40年的职业生涯,而他们会在这40年里随着研究领域的发展而不断发展。但如果你雇佣一个研究人员,那么他会对自己所做的基础研究具备一种求知欲,这种求知欲会让他们不断地对自己所在领域的前沿动态感到好奇,从而激发他们能够不断地创新,最后与研究领域共同发展,甚至是推动研究的边界。而且当有新鲜的事物发生时,他们所教授的课程也很可能会将最新动态纳入其中,因此使得这门课程与时俱进。我认为,做基础研究的人的基本天性就是对自己正在做的事情感到兴奋,并将这种兴奋带到课堂上。所以,这就是大学为什么雇佣研究人员的原因。但是,为什么一个公司要雇佣基础研究的研究人员呢?因为公司希望研究员们在提升公司自身技术储备的基础上,也能够参加世界各地的国际会议,从而获取全球最前沿的信息,并且将自身的技术、产品和理念推广出去。
接下来,我想谈谈计算机科学中理论研究的定义和意义。我刚开始做研究的时候,理论计算机科学所涉猎的很少,只包括像是有限自动机、上下文无关文法、可计算性、可判定性这类理论。那是因为这门学科刚开始的时候,只是由理论计算机科学和编程组成,并不存在算法领域。但是今天的计算机科学已经焕然一新了。如果说这门学科最初关心的只是让计算机变得有用,那么现在计算机不仅变得有用了,计算机科学也已经彻底改变了。所以现在我们有了各种各样的应用,包括人工智能、大数据、密码学等等。如今,理论计算机科学研究员是指那些对应用程序背后的基本思想感兴趣的人。他们想知道人工智能为什么能够行得通,这与那些只想利用人工智能解决问题的人是截然不同的。
因此,我认为像微软亚洲研究院这样的企业科研机构需要专注于能够帮助公司技术发展的特定领域。而这其中很关键的一环就是建立一个理论。如果你在研究一个特定的问题,那么你就必须花大部分的时间去尝试解决这个问题。但如果你只是花费5%的时间,那么试问,我们能在这个领域提出一个新的理论么?当然,你可能会发现其他解决问题的方法,并且可以更高效地来解决这个问题,但这仅仅解决了一个问题,并没有针对相关问题进行深入地探索。我必须承认,公司通常不会雇佣很多基础研究人员,因为公司更想要雇佣那些能够解决问题的人。但有一个公司却不一样,那就是贝尔实验室。这是一个特殊的例子,因为贝尔实验室是由政府负责的,他们雇佣了那些只做自己感兴趣方向的研究员们。不得不承认,贝尔实验室的研究成果很丰硕,而且其模式是大部分公司都难以复制。因为很多公司往往都只看重短期效益。但事实证明,只有目光长远,坚持做基础研究,才能对学术界以及整个社会带来更大的影响。
在现在的大学教育里基础研究也是非常重要的。大学的使命是培养下一代的人才,但偶尔也会有教师发现一些具有重大影响的事物,从而创造了一个全新的科学领域,创造了数以百万计的就业机会,促进了经济增长。我认为美国决定资助大学的基础研究可能是他们做过的最好的财政投资之一。但其实这是很难评估的,因为大概有10万名科研人员所做的研究并没有办法通过普通的评估方法去衡量。而且基础研究不太可能在三年内得到回报。那么,当你的资金无法支撑30年的研究且只针对一小群人的话,你又当如何衡量呢?
所以对于大学教师来说,衡量其教学质量,是相对容易的。但另一个问题是,一位大学教师是否会有一份能让自己成长,并始终在该领域前沿持续探索的事业?也就是说,即使没有回报这个人是否会依旧为其事业热血沸腾?要进行这样的衡量是困难的。目前,我获准对中国前50所大学的计算机科学教育进行评估。我们的评估方法也很简单,就是请学生们旁听一场讲座,看看老师有没有让学生参与进授课中来,我们还测量了有多少学生在课堂上集中注意力。我们有一个专门的记分卡,里面记录了我们需要评估的五项指标。结果展现,这项调研对于提高教师的教学质量是有建设性价值的。
花点时间看看其他领域
我认为,有必要提一下向量空间模型这个词。这个词是由康奈尔大学的一位教师提出的,然而当时我们并不认为这会是一个非常有影响力的概念。但事实证明,那些你认为可能不重要的事情往往会带来全新的领域,因为这正是让谷歌成功的技术,并创造了数百万个工作岗位。这是个题外话。言归正传,我认为有很多重要的事情需要思考。例如,如果我们训练一个人工智能网络来识别猫,那么我们就需要成千上万的图片,但人类却能从单一的图像中学习并进行识别。因此,我们要做的就是研究大脑是如何工作的,需要注意的是,大脑的组织结构与计算机的组织结构有本质上的不同,大脑消耗的能量非常低。究竟是怎样的结构使得大脑能够完成一些非常简单的事情,而人工智能却无法完成同等的任务呢?这就是目前我们的人工智能正在进行的研究。与其关注别人在做什么,或者只专注于自己的研究,尝试探索一个完全不同的领域可能是非常关键的。
我再讲一个故事,我对大脑如何学习很感兴趣,几十年前有人告诉我,三岁看老。对于这个观点当时我只是听了听,因为我认为这并没有科学理论支撑。但最近我认识了一个人,他再次证实了这个观点,同时,当我搜索这项研究时,还发现了大量有关大脑如何发育的研究。结果是,在人出生后的三年里大脑逐渐学会了如何学习。一个研究案例显示,科研人员在美国的一个内陆城市,为一组刚出生的孩子提供了三年稳定的智力丰富的环境,但对另一组的孩子没有提供。30年后,他们比较了两者的差异。结果发现,那些拥有丰富智力环境的孩子往往有更小的几率患有精神问题,并且拥有更高的教育水平,拥有高薪的工作等。
我上述提到的这些故事都是因为这些故事总是与其他事情相关。正如在计算机科学中,我们经常使用代理,大多数情况下代理也确实给出了最优解。那么问题来了,为什么某种代理能起作用呢?这需要我们从理论的层面给出答案。对我来说,这就像是一个智力丰富的环境研究问题。
但有一点我希望你们能明白,如果你想成功,你应该专注于那些真正让你兴奋、使你感到好奇的研究。这也是我告诉学生的。因为我发现很多学生主修计算机科学是因为他们的父母告诉他们这门专业能找到一份好工作。有一次,我和一个即将毕业的大四学生聊天。他说,“你知道吗,我真的很讨厌计算机科学,我更喜欢音乐。”所以,我会告诉学生,你应该选择你喜欢的专业,因为你的职业生涯将是你生活中的一个重要部分,你应该拥有激动人心的生活。大学的使命并不是培养一个人来找到一份好工作,而是教育学生拥有美好的生活。这就是为什么教育不应该仅仅是一个狭窄的技术领域。这就是为什么我们坚持人文社会科学。想象一下,如果你在政府部门工作或者晋升到一家公司的管理层,但你所知道的只是狭窄的技术领域,那么你将因此受困。
花点时间想想你真正喜欢的是什么,或者你究竟对什么感到好奇!也许是量子通信和量子纠缠理论,也许是分布式计算,也许是大数据。计算机如今在医学、金融业、制造业等等领域中都有应用。这就是时至今日的计算机科学和密码学,他们不仅提供了安全保障,还承担了各式各样的重要角色。但更重要的是,让理论回归产业界实验室吧!