近日,由Allen AI研究院发起的离散推理型阅读理解榜单DROP上,京东智能客服言犀团队(JD AI research)提出的NR-Rino模型以90.26%的准确率登顶DROP Leaderboard冠军,进一步拉近了机器与人类在该任务上的水平差距。在机器推理与对话智能技术方向,京东言犀已经连续斩获了5个顶级赛事的冠军,分别为2019年获得多跳推理机器阅读理解(Wikihop)第一名(Tu, et al. ACL 2019),2020年文档级关系抽取DocRED第一名(Zhou, et al. AAAI21),2021年获得可解释的多跳推理机器阅读理解(HotpotQA)第一名(Tu, et al. AAAI 2020),2021年获得多轮对话式机器阅读理解(QuAC)第一名(Zhao, et al. EMNLP 2021),也包含本次2022年获得离散数值推理型阅读理解(DROP)第一名。
图1 DROP榜单排名示意
DROP榜单是一个国际著名的评测任务,主要用于测试计算机在语言理解中的数学推理能力。不同于许多单轮问答,离散推理型阅读理解数据集DROP要求模型在语义理解的基础上,具备数值推理能力。因此,本次DROP数据集任务也吸引了国际众多参赛队伍,包括Google Research、中国平安(行情601318,诊股)、腾讯等多个顶级机构。
作为一家新型实体企业,京东通过技术创新和最佳产业AI实践,获得独特的产业AI能力,基于京东云自研技术,言犀系统的高可用,可以低成本、规模化、友好的落地在各行各业,从而有效提高整个供应链效率,并带动供应链上下游的企业实现数字化转型发展。本次离散数值推理型阅读理解DROP冠军的NR-Rino模型将广泛应用于零售、金融、医疗等各个行业。
在京东最擅长的零售行业,NR-Rino模型可以广泛的应用于零售的各个链条,例如在价保环节中,客户在购买商品后,希望价格在一段时期内是最便宜的,后期在客户咨询中,涉及数字、比价等信息时,智能客服就可以对价格进行分析,给客户满意的回答。如需价保,也会通过RPA能力,实时处理客户的价保诉求。
在融媒体行业,例如体育新闻数据分析中,竞技体育的报道一直占据着很大的比重。具有数字推理能力的机器可以将体育比赛的最终结果和比赛的进程以详实的数据形式进行展现,赋予新闻报道更加冷静、客观的特质。例如在篮球比赛中通过计算不同区域投篮得分效率来证明三分球命中数对比赛胜负的巨大影响。
在金融行业,尤其是金融报告中,通常会包含大量的数字信息。具有离散推理能力的模型可以帮助人类将这些信息加以提炼,并且使之关联到未来可能的发展趋势,从而为预测和决策提供有价值的及时信息。
在教育行业,在智能化教育需求的推动下,在线教育平台受到越来越多人的认可。在教师资源欠缺的情况下,机器可以扮演“老师”的角色。以解数学应用题的场景为例,具备离散推理能力的机器可以自动为学生提供了更快速的反馈且更类人、更有效的解题思路。
在医疗行业,医生需要面对海量的医疗数据,机器可以解释和汇总数据,以帮助医生做出决策。同时,也可以根据患者个性化数据信息,例如,每日血压、血脂等,引导患者养成良好的生活习惯。
关键词: