a tall building lit up at night

微软亚洲研究院

李东胜:推荐算法领域出道十年,抓住真实世界的“因”与“果”

分享这个页面

每天早上醒来打开手机浏览各路新闻动态、刷看各种 App,几乎已成为大家的标配动作。天冷告诉你加衣物、爱豆上新剧了通知你追、衣服包包降价了提醒你加购…… 如今系统推荐的内容愈发贴近人们的心声,仿佛是你肚子里的“蛔虫”。随着 AI 技术的快速发展,IT 系统和应用程序正变得越来越聪明,可以知你所想,予你所求。

这些智能推荐背后的实现机制与算法,就是微软亚洲研究院(上海)人工智能组主管研究员李东胜博士多年来的研究方向。是什么样的魅力让李东胜数十年如一日“扎根”在推荐算法的研究世界?微软亚洲研究院(上海)又有哪些有趣的研究方向?

微软亚洲研究院(上海)的第一位主管研究员

“我在中国科学技术大学读本科时就十分向往微软亚洲研究院,那时它还叫微软中国研究院,”李东胜说道。1999年,科大校友、彼时的微软中国研究院首席科学家张亚勤回母校做报告,由于参加的学生太多,把报告厅的玻璃门都挤破了。那一天,对于微软亚洲研究院的向往,就在李东胜心里埋下了一颗种子。

毕业之后,由于李东胜选择了前往上海,所以与远在北京的微软亚洲研究院失之交臂。然而,就在2019年,微软亚洲研究院(上海)正式落沪,李东胜成为了微软亚洲研究院在上海的第一位主管研究员,终于圆了他大学时的梦想。在李东胜看来,微软亚洲研究院在上海落户,对华东地区的优秀人才是绝好的消息。他笑称,“包邮”地区又多了一个福利,那就是拥有了一个世界顶级的研究院。

a person sitting at a desk in front of a laptop computer
李东胜在微软亚洲研究院(上海)办公室

十年前,一脚踏入推荐算法研究

2007年在复旦大学攻读博士学位之时,李东胜就已开启了他的研究之路。那时候导师的研究方向是计算机支持的协同工作,这是一个相对小众且交叉性较强的领域,主要研究如何让人、机器和算法实现交互。虽然跟随导师的研究方向会更容易,但对互联网更敏锐、更有兴趣的李东胜选择了一个全新的方向——推荐算法。

2005年到2010年,社交网络火热异常,Twitter,Facebook、微博等平台都是那个时期的“宠儿”。但社交平台上巨大、繁杂的信息量也给用户带来了很多困扰,所以李东胜和另外两位同学希望能够借助技术解决这一困扰,并以此作为研究方向。尽管与导师的研究方向不同,但导师还是给予了大力的支持。在日后的研究中,一些协同领域的研究方法也被他们用在了推荐算法中。

当时解决信息过载问题有两种技术路线:一个是给已有信息做摘要,另一个则是根据用户喜好去推荐信息。前者将所有相关信息汇总,再去筛选,但这种方法更适用于论坛这类主题帖子相对集中的平台,而社交网络上的信息过于分散且数量巨大,可谓是一个超级大的数据集合,而且用户的关注点会随时变化。于是李东胜选择了后者,便从此一脚踏入推荐算法的研究直至今天。

博士毕业后,李东胜专注于研究如何利用推荐算法挖掘销售机会。此前,研究人员并未将传统的销售机会发现问题看作是推荐问题,通常采用基于数据挖掘的倾向性评分分析,根据特征将用户进行分类,包括但不限于用户的公司所在地、所在行业、薪资水平等属性。然而,这样的静态属性分析会导致出现预测同一类用户想要购买的东西完全一样的状况,无法体现用户的差异化。

创新总是在突破传统思维的过程中产生。既然静态信息有局限,是否可以找到其他信息作为参照?李东胜试着把用户的行为信息纳入考量,利用协同过滤把每一位用户与其他同类用户类比,根据同类用户的购买历史,分析出该用户最有可能发生的购买行为,从而推荐其所需的产品。李东胜与团队不断探索与创新,最终研发了智能推荐引擎并将其服务化。在这个过程中,他发表了十几篇论文,获得了1项软件著作权,还申请了10余项国际专利。

研究真实世界的问题最重要

“推荐算法的研究,发展至今大致经历了四个阶段,”李东胜介绍道。80年代,为了便于互联网阅读,当时的研究人员构建了信息过滤系统,基于新闻内容、关键字给用户推荐类似的新闻,这是推荐算法的雏形。

但是,如果你常看足球新闻,当时的系统是不会给你推荐篮球新闻的,因此协同过滤方法应运而生,通过邻居的行为找到与你的相似点,再根据邻居行为预测你的行为。2001年,亚马逊在其系统中采用了这种方法,实现了推荐算法的第一次商用。

2006年,Netflix 对于视频推荐的突破是一个新的里程碑,确立了后来很长时间都被采用的矩阵分解框架,即将用户的兴趣进一步降维和抽象。例如,一个人从未看过《哈利波特》,但看了《魔戒》,系统就会推荐魔幻电影这个大类下的其他视频,大大提升了推荐效果。

2012年开始,深度学习逐渐引领了人工智能领域各个方向的研究,基于深度学习的推荐算法也成为了热点。借助深度学习强大的特征提取和关系建模能力,很多原来难以解决的推荐问题变得相对容易,比如多媒体内容推荐、序列化推荐、基于会话的推荐等等。李东胜也和微软亚洲研究院的同事们一起在相关领域开展了研究,如最近已被 IEEE TKDE 接收的基于循环神经网络的序列推荐算法,以及被 AAAI 2021 接收的基于图神经网络的推荐算法等。

a man standing in front of a computer screen

与此同时,李东胜还与复旦大学、上海交通大学、同济大学、电子科技大学、湖南大学、佐治亚理工大学、科罗拉多大学等高校的老师共同探索更加前瞻的推荐算法研究。例如,与复旦大学进行的因果关系推荐研究,可以让推荐理由更加可解释,找到真正的“因”与“果”;与上海交通大学的小样本推荐研究,则旨在解决样本很少的情况下如何进行机器学习和推荐的问题。

除了推荐算法研究,微软亚洲研究院(上海)人工智能组还关注以下几大研究方向:一是,AI 在金融行业的应用,包括量化交易中的投资预测、交易择时和拆单,以及金融风险的异常检测和评估等;二是,AI 与医疗卫生的融合,例如为医疗场景的机器学习模型训练生成数据,避免使用真实数据,保护病人隐私,以及和疫情相关的信息预测等;三是,新闻推荐,如使用强化学习方法实现新闻推荐;四是,对机器学习理论的研究,涉及多领域的泛化等,从理论层面减少机器学习的偏差;五是,利用A I助力可持续发展。

微软亚洲研究院(上海)人工智能组研究方向
微软亚洲研究院(上海)人工智能组研究方向

李东胜总结道,“我们所有的研究都是为了解决真实世界中的现实问题,正如比尔 · 盖茨所说,要用最厉害的大脑去做最重要的事情,而最重要的事情一定来自真实世界。”

欢迎对推荐算法、量化交易、机器学习理论、跨领域研究等研究方向感兴趣的你,加入微软亚洲研究院(上海)人工智能组!