每日互动方毅受邀在国家数据局“数据大讲堂”分享
8月19日,国家数据局举办2024年第4期“数据大讲堂”,国家数据局党组书记、局长刘烈宏,副局长沈竹林、陈荣辉、夏冰出席。国家数据局全体职工及国家发展改革委有关同志参加现场培训,各省、市、县数据管理部门观看线上直播和录播。每日互动董事长方毅受邀围绕“时空行为大数据的跨领域应用”,汇报了公司在数据智能领域的实践经验。
本期“数据大讲堂”邀请了每日互动股份有限公司董事长方毅、企查查科技股份有限公司总经理杨京、万得信息技术股份有限公司副总裁朱海峰,分别以《时空行为大数据的跨领域应用》《企业征信数据要素应用》《金融数据资源开发利用体会》为题进行授课,分享了相关数据领域发展现状、数据开发利用路径、数据应用场景案例等内容,介绍了数据开发利用实践,并展望了未来数据产业发展,为大家了解数据产业现状与发展趋势,进一步做好产业生态培育,打造数据标杆企业提供了经验借鉴。
“让数好用,把数用好”是贯穿每日互动本次汇报的主题。方毅说道:“‘让数好用’是指不仅要让数据容易被用,且要让数能够合法合规地被用;‘把数用好’指的是使用效果好,但更重要的是把数据用在好的方面,推动‘数据向善’。”
“可被用”:分场景论证,封场景使用
方毅认为,由于数据要素具有无形性、可复制性及非排他性的特征,导致数据要素的确权工作非常困难。方毅借用一则阿凡提的故事形象地展示了这种特性。故事中饭馆主人要求阿凡提为每天闻到的饭菜香付钱,而阿凡提则巧妙地用数钱的声音告诉饭馆主人,钱已经付过了。方毅认为,在这则寓言中,“饭菜香”和“数钱声”都明显具有数据要素的特点,阿凡提与店主人的争论也一定程度上反映出当前数据要素确权及流转过程中面临的困境。
因此,对于业界仍旧存在的“不敢、不愿、不会”共享数据的态度,方毅建议要做到对数据的“分级、分类”管理和“分场景、封场景”使用并行。用机制保障分场景论证,用装置保障封场景使用,从而做到“数据可用而不可见”,让数据非必要不流转,数据价值畅通流转。此外,每日互动首倡了大数据联合计算模式。该模式采用“中立区”“领事区”等计算方式,实现了不同量级数据计算中数据控制权和使用权分离,计算结果双方确认后输出而原始数据销毁,真正在安全的前提下解决了“大”数据融合中效率和成本的问题,为数据行业发展修建了封闭的“高速公路”。
“易被用”:大数据的目的是要找到“小”数据
方毅介绍道,单从原始数据角度看,海量的数据其实是驳杂无序的,并且价值密度极低。只有通过有效的算法和建模,才可以减少干扰,挖掘出面向不同需求侧进行关键决策所需要的“小”数据。
每日互动在这方面也有自己独到的实践。方毅汇报了公司已实现成熟应用的“百千工程”(人群特征浓度TGI)及向量化压缩技术。方毅认为,如同血缘近的人有相似DNA,相似APP间也有相似“DNA”。“比如用户使用过的APP,可以非常全息地展现不同用户群体的特征。通过我们TGI计算,可以把不同群体线上应用偏好和线下生活场景进行深度刻画,描摹出不同群体的特征,而通过我们的向量化压缩技术,可以将计算数据压缩到128维输出,在不同的应用场景中,机器可以根据具体业务需求快速识别计算不同维度,而人并不能读取这个数字。也正因此,数据的价值可以在人机隔离的前提下完全释放。”这也真正实现了“数据可用不可识”的行业目标。
当前,数据要素已成为新质生产力的重要一环。区别于传统数字化语境中的“硬件”和“软件”,方毅认为在数据要素或者说数据智能的背景下,正在形成一种“数件”(Dataware)。与传统的软、硬件不同,“数件”的最大特征是基于海量的底层数据计算,它是算力、算法和算料三者共同作用的产物。也可以理解为它是一种直接以数据为主要成分的服务。方毅说道:“就比如我们正在推出的政策精准直达系统,虽然最后的载体是在电脑这些硬件上,或者一个网站、平台等软件上,但是这个产品的核心并不是以前信息化系统中的按钮或者菜单功能,而是基于政策数据和企业数据,通过RAG技术最后计算出来的数据产品。在这个过程中,我们提供的这项服务就是一个典型的‘数件’。”
“效果好”:发挥数据要素乘数效应
方毅也提到,作为数据智能应用的先行者,公司积极响应“数据要素×”三年行动计划,每日互动多个项目参加了“数据要素×”大赛并晋级,其中就有近年来成效显著的“数智绿波”产品。
过去,在传统模式下的城市交通治理,往往依赖于高成本、低效率的硬件感知设备,性价比不高。因此,过去两年,每日互动基于持续服务众多行业数智化转型的经验,联合生态公司从算法建模入手,从庞杂的互联网数据中挖掘对于交通管理有价值的道路数据。每日互动通过车、时、空算法模型,提炼出道路流量特征数据,为道路路口做了“千口千相”。方毅提到,“通过这样的画像,我们可以更加精准地分析每个路口的流量特征,提高信号灯配置的合理性,实现‘数智绿波’,让车辆能在最优时间节点内通过路口,从而提升通行效率。”
截至目前,“数智绿波”产品已先后在浙江、安徽、山西等省份15个地区落地推广,建设数智绿波带近600条,协调路口超过2900多个,绿波公里数超过1000公里,道路平均通行效率提升20%以上。每日互动通过数智能力为政府有效节约“治堵”成本。尤其在杭州第19届亚运会期间,顶住双节和亚运观赛人潮相汇的交通压力,每日互动助力交警部门研发“亚运数字专用车道”。整个赛事期间,杭州亚运数字专用道99.2%的时间与社会车辆共享,在确保赛事班车通勤准点率100%、赛事“零延误”的同时,最大限度“还路于民”。
“结果好”:安全合规,数智向善
方毅还提到,要实现“数智向善”,不仅要对数据进行分级、分类管理,对涉数企业也不能例外。期待有关部门能够根据企业在市场中的角色地位和业务类型进行分级、分类。让服务型、应用型、技术型数商各得其所,在数据要素产业链条上扎根更深,促进数据要素能量的流动、汇聚与迸发。
“让数好用,把数用好”。数据要素从产业中来,最终也要回归到产业中去。正如方毅所说:“我们将持续夯实自身治理数据的基本功,发挥多年来扎根垂直行业的服务经验,将数据要素加工成可被用、易被用、效果好、结果好的‘数件’,让更多传统行业实现‘数据智能’。”让数据要素动得起来,更要用得起来。让我们共同期待,在每日互动等行业先行者的共同努力下,数据要素加速实现产业落地,为社会经济转型升级创造源源不断的新质生产力。