新闻与深度文章
近日,微软通用语言表示模型再创新佳绩。最新的 T-ULRv6 在谷歌 XTREME 和 GLUE 排行榜上摘得双榜冠军,证明了单个多语言模型可以同时在英语和多语言理解任务上达到 SOTA 性能。这也是多语言理解模型首次在两个排行榜上同时夺魁,力压专用于英语或专用于多语言任务的模型,从而有助于消除“多语言诅咒”。 微软亚洲研究院自然语言计算组首席研究员韦福如表示,“T-ULRv6 是我们推进大规模预…
编者按:作为目前全球最负盛名的人工智能盛会之一,NeurIPS (Conference on Neural Information Processing Systems) 在每年年末都是计算机科学领域瞩目的焦点。被 NeurIPS 接收的论文,代表着当今神经科学和人工智能研究的最高水平。今年的 NeurIPS 大会将于11月28日至12月9日举行,本届大会共收到10411篇有效投稿,其中2672篇…
作者:DKI 编者按:在计算机系统与软件的实践和研究中,可靠性是至关重要且经久不衰的课题。如何自动化地分析日志所记录的系统状态并让数据“说话” ,受到了广泛研究。日志解析是自动化日志分析中的关键起步。如何将日志解析应用于大规模复杂的云环境往往面临诸多现实挑战,如数据不均衡,数据漂移等。 为了解决这些挑战,微软亚洲研究院的研究员们提出了支持用户反馈且具有高可扩展性的日志解析方法 SPINE。该方法被…
编者按:作为目前全球最负盛名的人工智能盛会之一,NeurIPS (Conference on Neural Information Processing Systems) 在每年年末都是计算机科学领域瞩目的焦点。被 NeurIPS 接收的论文,代表着当今神经科学和人工智能研究的最高水平。今年的 NeurIPS 大会将于11月28日至12月9日举行,本届大会共收到10411篇有效投稿,其中2672篇…
作者:多模态交互组 编者按:近年来,各大企业和组织机构都在经历数字化转型。将文档转换成计算机所能识别的样态,是数字化转型的关键步骤,如何识别出图片中表格具体的结构与内容,并直接提取其中的数据和信息是学术界和工业界共同瞩目的焦点。然而,目前的表格识别算法多用于识别横平竖直的表格,对于全无边界和实线的表格、行列之间存在大片空白区域的表格等日常生活中常见的表格还没有较好的解决方案,对于拍摄角度倾斜而表格…
编者按:自2019年以来,微软亚洲研究院在文档智能领域进行了诸多探索,开发出一系列多模态任务的文档基础模型 (Document Foundation Model),包括 LayoutLM (v1、v2、v3) 、LayoutXLM、MarkupLM 等。这些模型在诸如表单、收据、发票、报告等视觉富文本文档数据集上都取得了优异的表现,获得了学术界和产业界的广泛认可,并已应用在包括 Azure For…
10月18日至20日,微软研究峰会2022将在线举行。上期预告《如何在充满不确定性的当下探索未来?》为大家提前剧透了本次峰会的三场专题:构建一个有韧性且可持续发展的世界、高效的大规模人工智能、增强人类的生产力和创造力。今天,我们将为大家带来另外三场专题的更多亮点。来自全球的顶级研究专家、工程师、技术人员与创新者将分享他们在不同领域的破圈实践。 大会倒计时仅剩一天,想要加入这场科研盛宴,就快来点击链…
编者按:从微电子、集成电路到系统架构、软件设计,再到 AI 模型、算法研究,从复旦大学到微软(亚洲)互联网工程院,再到微软亚洲研究院(上海),现任高级研发经理的杨玉庆如何转变不同角色?有着软硬件跨领域研究背景的他,对 AI 研究有什么不一样的理解?作为微软亚洲研究院(上海)最早一批研究员,又对上海研究院有怎样的感受和期望?今天,让我们一起走近杨玉庆的“立体”研究世界。 从本科到博士,杨玉庆在复旦大…
10月18日至20日,微软研究峰会2022即将在线举行。在为期三天的会议中,每天都将以一个主题演讲开启并通过不同的专题展开讨论,从更高效、适应性更强的人工智能,到赋能人类创造力和助力可持续社会发展的技术,这些主题演讲和专题将引领我们进行深入探究。 在今天介绍的三场专题中,分享嘉宾们将探讨我们如何才能建构出预测、承受和适应社会危机的能力;我们要如何发展人工智能,有更多机会赋能更多人;科技如何能帮助我…