新闻与深度文章
编者按:今年3月,OpenAI 推出了大语言人工智能模型 GPT-4,其在推理、解决问题和语言等方面的能力都有了显著提高,使得发展长达数十年的人工智能进入了一个新阶段。微软全球资深副总裁、微软研究院负责人 Peter Lee 是微软内部最早使用 GPT-4 进行评估和实验的成员之一。近期在微软研究院最新的 AI 前沿系列播客节目中,Peter Lee 与微软研究院副总裁、微软杰出首席科学家 Ash…
编者按:国际万维网会议(Proceedings of the ACM Web Conference,简称 WWW)是互联网技术领域的顶级学术会议之一。WWW 大会汇集了国际一流学者与产业界精英,持续关注着互联网技术的学术研究前沿与热门发展方向。在今年的 WWW 2023 大会上,有多篇来自微软亚洲研究院的论文被录用。今天我们精选了其中的六篇进行简要介绍,研究主题涵盖算法公平、知识蒸馏、推荐系统与图…
每一种情绪都值得被看见
那些在聊天框里输入又删掉的话,那些在微博小号里才能记载的心情,那些在朋友圈仅自己可见的动态,那些在计算机领域科研、学习、生活中遇到的难题,一直在线的树洞接收到了你们的信号。 在将树洞收到的内容筛选、归类后,我们为提问的你匹配到了微软亚洲研究院中合适的解答者。 其中,有来自职场的困惑:如何在工作和生活的双重内卷下自我排解?也有来自未踏入社会的同学们的疑虑:如何快速增强科研实力?研究过程中,如何更好应…
作者:谭旭 在 AIGC 取得举世瞩目成就的背后,基于大模型、多模态的研究范式也在不断地推陈出新。微软研究院作为这一研究领域的佼佼者,与图灵奖得主、深度学习三巨头之一的 Yoshua Bengio 一起提出了 AIGC 新范式——Regeneration Learning。这一新范式究竟会带来哪些创新变革?本文作者将带来他的深度解读。 AIGC(AI-Generated Content)在近年来受…
编者按:最近,大型语言模型展现出的强大能力引发了新一轮的 AIGC (人工智能生成内容)研究和应用热潮。人工智能的创作能力边界已经从文字问答、编程逐渐扩展到了绘画、音频等多模态领域。但在视频领域,尤其是超长视频内容的生成上,目前大多数模型的效果还不尽如人意。 近期,微软亚洲研究院 NUWA 多模态生成模型家族迎来了新成员——NUWA-XL,其以创新的 Diffusion over Diffusio…
编者按:一系列技术变革引领我们走到今天,并深刻影响着人类社会。如今,随着人工智能技术的快速发展,ChatGPT、New Bing、GPT-4 等新产品和新技术的陆续发布,又将如何帮助我们创造未来?在微软与 OpenAI 的密切合作中,微软执行副总裁兼首席技术官 Kevin Scott 一直在思考一个问题:人工智能领域出现的惊人革命对 OpenAI、对微软、对所有利益相关者以及整个世界的意义是什么?…
作者:社会计算组 图是一种通用的数据表示形式,来自不同领域的数据均可以表示为图,例如文本数据可以看成是一维图,图像可以看成是二维图,分子和蛋白质等实体也可以天然地的用图表示。通俗而言:万物皆可图。 而图表示学习(Graph Representation Learning,GRL)能够将图中的节点或者整个图转化为低维可计算的向量,为机器学习模型处理图这种高维复杂的数据形式提供了合适的计算接口。根据粗…
作者:谭旭 作为近期人工智能领域内的顶流之一,AIGC(AI-Generated Content 或 Generative AI)早已火爆出圈,频登各大互联网平台热搜。基于深度学习的内容生成在图像、视频、语音、音乐、文本等生成领域都取得了令人瞩目的成果。 由于现实世界中的信息在多数情况下呈现文本、图像和语音等多种模态,人类会通过综合运用多种感官来感知和理解现实世界,因此,如何赋予计算机这种综合理解…
编者按:近日,由微软亚洲研究院提出的 Roll-out Diffusion Network (RODIN) 模型,首次实现了利用生成扩散模型在 3D 训练数据上自动生成 3D 数字化身(Avatar)的功能。仅需一张图片甚至一句文字描述,RODIN 扩散模型就能秒级生成 3D 化身,让低成本定制 3D 头像成为可能,为 3D 内容创作领域打开了更多想象空间。相关论文“RODIN: A Genera…