新闻与深度文章
编者按:AI+教育是近年来教育行业乃至整个社会都非常关注的热点话题。相比于 AI 在其他领域的落地应用,AI+教育的进展一直相对缓慢。作为未来教育领域发展的大势所趋,AI+教育到底面临怎样艰难的挑战? 此前,微软亚洲研究院与华东师范大学就基于双方在各自领域的领先优势展开战略合作,希望依托计算机技术推进教育与人工智能的深度融合。目前,双方的合作已经形成了在学术界与产业界均具有引导性的创新研究成果,中…
编者按:是否时常“考古”一些老电影、老动漫来回忆旧日时光?你是否也有一些珍贵的录像,带你重温过去的美好?然而,我们已经习惯了高清体验,回头再看曾经的旧影像,画质或许“渣”的让人不忍直视。在这个多媒体内容爆发的时代,人们对视频内容的需求愈加强烈,视频素材的创作、增强及再创作技术也有了大幅提升。尽管利用现有的视频修复工具,视频编辑者也能让视频变得更高清,但其前提条件是需要有超高性能配置的电脑,并付出视…
编者按:国际计算机视觉与模式识别会议(CVPR)是人工智能领域最具学术影响力的顶级会议之一。微软亚洲研究院也在4月成功举办了 CVPR 2022 论文分享会。今天,我们为大家精选了8篇微软亚洲研究院被 CVPR 2022 收录的优秀论文,带你探索计算机视觉领域的热点前沿!欢迎感兴趣的读者阅读论文原文。 论文链接:https://arxiv.org/abs/2203.09208 视频复原任务非常依赖…
编者按:科学研究与技术创新的过程总是充满了不确定性,科研人员无法提前计算创新的周期,也无法预料每个灵感所带来的最终结果。若想将一项研究成果落地并通过产品化的方式让更多人感受到前沿技术所带来的便利,研究工程师的参与尤为重要,他们需要全面掌握终端用户的需求,深入了解技术应用的深度与广度,打通各个环节的流程,有效地将算法模型与产品应用连接起来。然而知易行难,这一过程中的艰辛与技术落地时的成就感也只有亲身…
编者按:AI 合成语音如今已经屡见不鲜,然而在用户听来却不能让人产生与真人对话和阅读般的沉浸感。不过,微软亚洲研究院和微软 Azure 语音团队近日联合推出的全新端到端语音合成模型 NaturalSpeech,在 CMOS 测试中首次达到了真人说话水准。这将近一步提升微软 Azure 中合成语音的水平,让所有合成声音都惟妙惟肖。 文本到语音合成(Text to Speech,TTS)是一项根据文本…
编者按:作为自然语言处理领域的国际顶级学术会议,ACL 每年都吸引了大量学者投稿和参会,今年的 ACL 大会将于5月22日至5月27日举办。值得注意的是,这也是 ACL 大会采用 ACL Rolling Review 机制后的首次尝试。在此次会议中,微软亚洲研究院有多篇论文入选,本文精选了其中的6篇进行简要介绍,论文主题涵盖了:编码器解码器框架、自然语言生成、知识神经元、抽取式文本摘要、预训练语言…
编者按:常言道:“眼睛是心灵的窗户”,眼神交流所传达的信息也可以进一步提升人们的沟通效果。然而,随着视频聊天、视频会议逐渐成为常态,大家不禁要问,我们有多久没有与同事、朋友、家人确认过眼神了? 而微软亚洲研究院的研究项目 3D 视频会议系统 VirtualCube,可以让在线会议的与会者建立自然的眼神交互,沉浸式的体验就像在同一个房间内面对面交流一样。该技术的相关论文被全球虚拟现实学术会议 IEE…
作者:吴郦军、郭俊良 编者按:近年来,由于并行的快速推理能力,非自回归生成在自然语言处理、语音处理等领域展示出了其特有的优势,并日益成为生成模型的研究热点。为了促进非自回归生成模型的发展,微软亚洲研究院与苏州大学的研究员们共同撰写了综述论文“A Survey on Non-Autoregressive Generation for Neural Machine Translation and Be…
近两年来,有关Transformer的文章可谓是井喷式爆发,许多研究员都在设计各种任务上的Transformer模型。然而,Attention作为Transformer的核心模块,真的比卷积强吗?今天的这篇文章或许能带给你新视角,微软亚洲研究院的研究员们从Local Attention和Dynamic Depth-wise Convolution的视角出发发现,设计好的卷积结构并不比Transfo…