background pattern

微软亚洲研究院铸星学者计划

铸星闪耀 | 王莹:立足真实需求,助力产学结合

分享这个页面

编者按:微软亚洲研究院“铸星计划”旨在发掘和助力新一代青年学者,使其成为科研创新能力突出、走在世界科技前沿的学术带头人。无论是与领域内顶尖研究员合作的机会,还是最新、最丰富的数据集和强大的支持资源,亦或是产业界独有的实际应用场景,都吸引着青年才俊们来到 MSRA 探索领域内前沿新知。

年轻、开拓、探索,是铸星计划的关键词;合作、创新、成就,是每个学术新星发光闪耀的必经之途。来自东北大学的王莹老师,在微软亚洲研究院“铸星计划”访问期间,经历了怎样的奇妙旅途?让我们一起走近她的“铸星故事”。


当软件工程与算法相遇,会碰撞出怎样的火花?开发过程中的现实需求,如何通过学术探索得到优化改进?计算机领域的女性科研工作者又是如何身体力行推动多元视角、传递精神动力的?

这些问题或许可以从王莹的“铸星计划”访问经历中得到答案。从东北大学到微软亚洲研究院,在为期三个月的“铸星之旅”中,王莹与微软亚洲研究院软件分析研究组首席研究员楼建光结合彼此优势,共同针对微软创建的开源开发平台 .NET 社区中的实际问题寻找更优解。三个月,一篇顶会论文、一个实用工具的雏形,王莹说,她在 MSRA 的收获远不止于此。

楼建光研究员点评王莹的铸星计划成果演讲
楼建光研究员点评王莹的铸星计划成果演讲

追求顶天立地的科研

.NET 社区是微软创建的开源开发平台,支持多种语言平台,涉及的框架版本众多。当开发人员在其中建立项目,有可能直接或间接地引入不同版本的组件,导致程序语言行为发生变化,从而出现兼容性问题,类似的软件依赖问题在许多语言社区中普遍存在。

王莹的研究重点一直围绕软件依赖关系及软件生态演进中的相关问题,这与 .NET 社区的现实状况与优化需求不谋而合。“我们在与产品部门合作过程中遇到了一些 .NET 的软件依赖产生的问题,进一步调研发现,类似问题在 .NET社区里面比较普遍,社区中大量帖子在寻求帮助,需要有很好的解决方案。”微软亚洲研究院首席研究员楼建光说,目前相关学术研究主要集中在 Python、Java 等社区,.NET 社区中涌现的软件依赖问题具有广阔的探索空间。

经过与楼建光的商讨,王莹决定将 .NET 社区中的软件依赖问题作为“铸星计划”的研究课题。萌发于开源开发平台的科研选题,背后是几百万开发人员的现实需求。因此,在合作项目开始之初,王莹与楼建光便确定,这次研究计划不仅追求学术深度与方法创新,更要致力于落地转化,在现实中开发有效工具,帮助社区中的开发人员解决真实问题。

三个月的访问、交流与碰撞以来,王莹在第二个月成功投出一篇软工领域顶会论文,并在第三个月与林泽琦研究员合作将研究成果初步转化落地,开发出修复工具 NuFix 的雏形。修复工具 NuFix 将修复任务制定为二进制整数线性优化问题,以根据学习的开发人员的偏好有效地推导出最佳修复,在基准测试中,NuFix 成功地为包含 354 个带有文档修复的真实软件依赖问题生成了修复程序。

从实际需求走出的科研课题,落地实现后的打磨转化,同样离不开业界开发人员的真实反馈。在 NuFix 的测试阶段,楼建光邀请微软亚洲研究院的十位 .NET 专家手动验证了这一工具生成的修复程序。反馈表明,修复结果很好地满足了开发人员对 .NET 项目构建管理的期望。王莹老师还收到来自参与验证工作工程师在邮件中的积极反馈,认为“这是一项很有意义的工作,如果这项工具真正落地应用,将为我们节省非常多的时间。”这让王莹老师倍感鼓舞。

铸星力量助力合作开发

王莹(右二)与楼建光(中)、林泽琦(左二)等合影
王莹(右二)与楼建光(中)、林泽琦(左二)等合影

“微软有 AI 算法的优势和知识基础,而我恰好带着软工领域的问题来到了这里。”王莹认为自己在微软亚洲研究院与研究员们开展的合作,最大的亮点就是双方优势互补。而微软所具有的得天独厚的计算资源、真实的业界生态与鲜活的需求,无一不为合作研究的选题挖掘与反馈收集提供了强大的支持力量,王莹说,正是铸星计划“让青年学者有机会接触到微软的‘星平台’‘星资源’。”

软件依赖问题在许多语言社区中普遍存在,王莹的软工背景与一贯的研究重点完美契合了 .NET 社区的现实需求,提供了有力的专业保障。而这一项“看似百分百”软工的研究课题,面临着海量的计算数据,“搜索空间极大”微软亚洲研究院恰能为解决问题提供人工智能计算知识支持以及资源保障。“楼研究员给了我用人工智能算法解决这类问题的启发”,王莹说,“比如说约束求解等方法,利用 AI 算法能为问题寻找到更好的答案,也大大降低了解决问题的时间成本。”频繁出现的软件依赖问题,在常规情况下解决时耗时少则几小时多则几天,“用结合 AI 算法支持的工具辅助进行配置生成,能将问题缩短到几秒钟,大大缩减调试的时间。”

短短三个月的访问中,王莹的投入与勤奋、合作研究员们毫无保留的支持与助力,共同成就了这一段硕果累累的铸星之旅。来到微软亚洲研究院访问之前,王莹对合作课题进行过全面深入的前期调研和背景了解,“王老师来到研究院和我们的第一次讨论就非常深入,我们得以确定具体的可执行计划。”楼建光说,“王老师常常伏案工作到很晚”,阅读整理大量的 bug threads,以了解和分析社区存在的依赖问题,从中总结问题类型与开发人员的通常需求,最后根据对问题的深入理解来抽象问题和提供解决方案。

除了楼建光研究员的思路指导与方向确定,王莹还与大数据挖掘组的研究员林泽琦合作进行了修复工具的算法设计。“林泽琦研究员在算法设计上给了我很多指导。”王莹说,微软研究员们的计算机背景实力,为合作开发工具提供了强大技术支持。

组里的肖岩研究员也为王莹合作课题的推进提供了支持帮助。王莹说,自己每当遇到社区中的问题反馈案例,都会去和肖岩交流确认,看自己的理解是否恰当。“他还会反馈给我许多其他的见解,帮助我对社区中的问题案例理解更加深入。”王莹笑称肖岩为组里的“鼓励师”,总能给身边人带来鼓励和信心。和这样一群同事共同解决问题、探究未知,王莹感到自己时时都能得到新的鼓励和启发。

从铸星到更广阔的舞台

“王莹能把深奥的学术问题讲得深入浅出、风趣活泼,让听众无需了解深奥的数学就能理解问题的本质。”楼建光至今记得第一次听王莹的学术演讲时她给自己留下的深刻印象。铸星计划访问期间,王莹的身影活跃在各种活动报告中,她的声音也传递给了更多听众。除了合作课题,“铸星计划”能为青年访问学者提供的还有更多与此类似的机会——以微软亚洲研究院为平台,青年学者得以参与更多元的活动,在更广阔的舞台上展示风采。

王莹受邀参与 Ada Workshop
王莹受邀参与 Ada Workshop

作为计算机领域女性科研工作者的杰出代表之一,王莹身体力行推动计算机领域多元化发展。在“铸星计划”访问期间,她受邀参与微软亚洲研究院举办的Ada Workshop (opens in new tab)Ada Dialogue (opens in new tab) 等活动,为计算机领域的女生们分享自己的科研经历与成长历程,鼓励她们坚持内心选择,不断实现自我突破。

经由微软亚洲研究院的平台,王莹还参与到中国计算机学会女计算机工作者委员会(CCF 女工委)学术会议的组织与论坛筹办中。2021 年 6 月,王莹担任 CCF “计算之美”——新基建时代产、教、研、地融合学术大会博士生分论坛主席,组织优秀博士嘉宾分享与圆桌讨论,为计算机领域女博士生组织提供宝贵的交流与成长平台。

“在计算机领域,女生往往容易被怀疑个人能力,证明自己需要付出更多努力。”从女学生到女老师,王莹从未忘记鼓励和肯定身边的女生,“女生可以找到自己的优势,在自己适合的课题中做出成果。”

无论是报告分享还是共同实践,王莹都努力让自己发出的声音产生意义。“参加活动时听众也许不记得我说过的话,但能记住我在台上传递的言语之外的东西。”王莹说,演讲者的风采、传递给参与者的感受,都是这类交流活动的感染力和意义所在。“这些东西对女生来说可能更加重要,许多女生容易缺乏做好研究的自信,我想通过办会和邀请嘉宾分享,让她们看到更多可能。”

在组织“计算之美”学术大会博士生分论坛时,王莹为参与者定制了穿有博士服的小熊玩偶作为伴手礼。“想给女博士生们留下一些深刻的印象,让这次活动更加具有感染力,起到鼓励的作用。”王莹说,无论是作为教师还是分享嘉宾,自己站在讲台上的时间并不长。用短短的讲台交流真正传递信心、鼓舞年轻女生,是王莹始终追求的目标。无论是 Ada Workshop 还是 CCF 博士生论坛,经由“铸星计划”提供的机会,王莹的用心与理念得以传播实践,在更大范围内给更多人带来正向影响。

王莹在 YVR Talk 中展示铸星计划研究成果
王莹在 YVR Talk 中展示铸星计划研究成果

“这个地方太棒了。”提到微软亚洲研究院,王莹脱口而出,“一个全身心做科研的好地方。”无论是与同领域研究员集中交流、切磋的机会,还是说对接产业界真实数据和开发人员的平台,微软亚洲研究院都为科研工作者提供了真实有意义的课题田野与广袤自由的探索空间。同时,微软亚洲研究院所具有的产业界资源也为研究成果的落地提供了可靠的现实支撑。

针对产业界真实问题开展学术研究,所开发的工具成果不仅为进一步的合作提供可能,也为产业界问题的解决提供了有力反馈——这正是微软亚洲研究院“铸星计划”希望带给青年学者们的独特经历。