每天发生上亿笔交易的支付宝,近年来始终被专业黑产团伙盯着,但久攻难破的原因在于,人工智能随时在与骗子争速度,以秒级响应来阻断诈骗——在用户向可疑账号转账前,AI客服就已打来叫醒电话:“刚发现您正准备向个人账户转账,请问是要转给认识的人吗?”“正规贷款公司不会让你转到个人账户,哪里借钱哪里还,才能保障你的利益哦……”面对不依不挠的AI,即便是老人,90%以上也会听劝,继而停止转账。这样的风控打法,其灵感来自金庸笔下周伯通的“左右互搏术”,模拟的则是经济学中的“博弈论”。
//WWw。luOMaysD.cOm
与此同时,国际权威数据公司IDC在2021世界人工智能大会上发布的风控案例显示,基于多方安全计算风险模型,浦发银行近年所识别出的高风险客户超过14.5万名,已阻止数十亿元高风险贷款。
但无论哪种算法模型,都是对数据的深度挖掘。数字等结构化数据,以及视频、图像、文字、声音等非结构化数据,正构成AI时代的新能源。
这是数据空前繁荣、但也极度饥渴的时代。
//WWw。luOMaysD.cOm
深挖价值
“有没有觉得京东、淘宝等电商平台的推荐,比5年前更精准了?而美图秀秀也把你拍得比5年前更漂亮了?”
在人工智能大会一场关于“AI商业”的论坛上,一位与会嘉宾的提示让许多人深以为然。如此契合心意背后,是电商平台基于用户搜索、浏览、停留等动作的反复琢磨,也是美颜软件对用户存储、删除照片行为数据的仔细钻研。基于更多数据的深度学习,AI变得愈发懂你。
上海世界人工智能大会召开迄今已四届,有一个观点被大量专家反复提及与认同,那就是:在AI赛道上,中国与美国的差距并不显著,中国最大优势在于拥有海量数据。按照创新工场董事长李开复的调研,我国移动互联网用户、移动支付量、外卖交易、共享单车用户分别是美国的3倍,50倍、10倍和300倍。如果将数据比做石油,那么中国就是世界数据的沙特阿拉伯。
利用用户不断贡献的数据,互联网企业与消费者的情感链接得以深化,并且持续激发消费行为。上海“种草”和生活方式平台小红书的技术负责人张雷,在此次人工智能大会上分享了一个案例——利用AI技术,小红书为消费者和品牌方打造了一个双向沟通的“恋爱模式”平台。小红书所推出的“惊喜盒子”,如同恋爱模式中男女双方不断收获爱的礼物。由于用户使用App进行搜索、阅读、互动的行为被AI默默关注,待积累到一定程度,AI便激活触发机制,平台会自动送出包含有化妆品小样、优惠券等在内的“惊喜盒子”,帮助品牌“锁”住恋爱对象。以合作品牌雅诗兰黛为例,其小样领取率与获客留资率高度匹配,均在85%以上。这说明,“惊喜”送出后,收获了对方同样丰厚的“爱的回报”。
在商业领域,数据是必争资源。挖掘数据,有助于发现顾客购买模式和趋势,改进服务质量,减少零售业成本,还可利用列序模式来调整更新商品价格和花样,提升适配度。
//WWw。luOMaysD.cOm
但事实上,数据的潜能远未被深度挖掘。比如,考量一个区域基础设施建设的开工率,常使用“挖掘机指数”,而某个新区的奶茶消费数据,也可以成为检验当地创新活力与成长性的一个过硬指标。殊不知,目前美团平台所统计的上海市及16个区每千人咖啡消费数,正在成为政府解读资源供给、产业调整的维度之一。
点亮数据价值的意义,从上海市北高新技术服务业园区的大数据公司数就能看出。这个弹丸之地,现已集聚多达400家大数据公司。另外,天眼查数据显示,我国目前有超2500家数据挖掘相关企业,近80%成立于5年内。
资源待开
然而,空有一身算法武功,愁苦于缺乏数据“饲料”的机构却有一大把,也曾包括中科大的算法教授们。
“AI时代,开源数据之于AI的影响力,丝毫不亚于开源软件之于应用。”此次人工智能大会上,格物钛创始人崔运凯为数据“开源”大声疾呼。
无论是马克·扎克伯格创立Facebook,还是张一鸣创立今日头条,都得益于开源软件和开源数据集,包括PHP编程语言、MySQL数据库、MongoDB数据库等。2009年,斯坦福李菲菲教授所发布的包含有1500万张图片的ImageNet数据集,直接推动了计算机视觉的飞速发展。相反,一个自动驾驶公司,当它难以获得大量具稀缺性的交通场景数据时,无异于在做一顿“无米之炊”。
据悉,目前世界知名的公开数据集,基本都来自海外机构的分享,而拥有全球最丰富场景的中国,数据开源刚刚起步。这不仅涉及意愿、认知、协议,也受制于运营、标准与资金。如ImageNet数据集从设想到最终发布,历时3年,其中数据采集、清洗、标注,无不需要巨大的资金支持。
但总有尝试者、先行者。如格物钛,已于去年发起了“寻集令”计划。腾讯王者荣耀团队则与腾讯AI lab一同举办“开悟大赛”,开放经脱敏的王者荣耀战队数据及算力平台,火速集齐国内包括中科大在内的18所顶尖高校。各高校算法教授们,都以腾讯电竞数据为基,结合自己的独门算法,训练出AI战队,再进行各高校间的对决。今年,“开悟大赛”已是第二届。
2021世界人工智能大会腾讯展区,著名的多人竞技游戏王者荣耀,上演了一场人类与AI的较量——王者荣耀电竞职业选手和AI战队“王者绝悟”正面对决。五局三胜的赛事,AI最终以3:1提前结束赛事。
当然,高校训练电竞AI的初衷远不仅仅为塑造一个游戏陪练。王者荣耀AI电竞所触及的,是当下人工智能技术核心研究领域的最前沿——多智能体系统。电竞中,大量AI像人一样实时感知、理解、推理、决策、行动,协同完成一项高难度任务,那么游戏以外,便能泛化到无人仓储、资源开采乃至战地场景。电竞AI的意义远超电竞本身,而数据共享是前提。
由中国科学技术大学李厚强教授、周文罡教授指导的机器博弈团队,在第一届腾讯开悟大赛中取得冠军,获得25万元奖金。
事实上不止腾讯,国内头部公司如百度、华为、字节跳动等也都推出了以数据集为核心资源的挑战赛。
“整个AI行业从过去以模型为中心的创新,变为以数据为中心的创新。哪怕是选择部分场景、部分数量的数据开放,也可能激发非常多的变革。所以,改变世界,从贡献数据开始。”崔运凯说。
//WWw。luOMaysD.cOm
期待可信
然而,数字世界并不完全可信。AI对于数据的深度学习,可能产生“误读”。
比如,在此次世界人工智能大会上所展示的一款人像识别技术,就表现出了漏洞——当人进入摄像机镜头,会被人工智能迅速捕捉,在相应的监控屏幕上,人像四周即出现蓝色边框。然而,同样一个人,穿上一件印有特殊花纹的T恤再进入镜头时,蓝框消失了。也就是说,T恤如同隐身服,让人成为“漏网之鱼”。
这就是AI所见与人眼所见的不同,算法模型会误判。
类似案例并不少见。因此,今年世界人工智能大会多场分论坛上,靠谱数据成为热议话题,国内首本《可信人工智能白皮书》也在大会期间发布,对人工智能提出了可靠可控、透明可释、数据保护、明确责任和多元包容等五大标准。
让数据靠谱可信,区块链大有可为。在大会区块链分论坛上,蚂蚁集团智能科技事业群总裁蒋国飞透露,蚂蚁区块链技术已应用到奇瑞商用车上,车辆、行车、电池等数据在加密后流转至区块链,实现资产和车数据的源头可信,也使打通汽车租赁等金融服务变为可行。今年“618”期间,经蚂蚁链IP商业平台授权的9款非遗纹样设计生产的商品,被李佳琦选入直播间售卖,其中一款非遗纹样帆布鞋仅半小时销量就突破百万元。
蚂蚁集团智能科技事业群总裁蒋国飞
据记者了解,国内已有科技公司研发了针对AI的杀毒软件和防火墙,去专门寻找因AI数据和算法所引发的新的安全隐患和漏洞。可见,此前人工智能已经历“能力强不强”的灵魂拷问,而下一步,取得人类信任,成为其行稳致远的关键。
//WWw。luOMaysD.cOm
栏目主编:李晔 文字编辑:李晔