闫峻博士团队所在的医渡云,主要从事医疗健康领域的数据基础设施建设,以支撑在此基础上的模型建设,应用场景和产业发展,继而产出新的数据与知识,形成闭环。当前医疗数据赋能的主要挑战包含数据应用、数据治理和数据集成三个方面。针对数据应用的场景多样化,医渡云构建了数据智能集成系统,通过跨系统的唯一患者标识,联通患者数据,应用于多种场景,满足用户的个性化需求。针对数据治理中存在的数据质量杂乱不一问题,团队通过多种自然语言处理方法,结合专业的医疗知识,形成医疗文书结构化建模能力(将自然语言文本转化为结构化医疗数据)、医学术语标准化处理能力(将描述不一的同类术语进行标准化)。