百度全身心投入地把自己定义为人工智能公司,阿里不断开发布会(医疗大脑、工业大脑、环境大脑),腾讯则宣告自己“AI 即服务”。
两个月前,腾讯声势浩大地拉开了“云+未来”峰会的大幕。当时,腾讯副总裁邱跃鹏终于正式发布腾讯云“AI 即服务”的智能云,并开放了计算机视觉、智能语音识别、自然语言处理三大核心能力。
随后,第一次消息来了。
7月下旬,腾讯宣布正式启动 AI 加速器。腾讯副总裁、AI Lab 负责人姚星在会后接受媒体采访时提到,在AI 技术层面,AI 加速器将连接来自腾讯 AI Lab、优图、腾讯云等的 AI 能力,提供超过 20 项 AI 技术。同时,提供超过1000万的腾讯云资源,帮助项目降低计算成本提高数据处理效率。
对腾讯而言,这还不够。于是,第二次消息来了。为 AI 大战提供弹药的腾讯云在 CSS (中国网络安全领袖峰会)召开之前,已经在各大预热稿里造势,称要发布AI 安全引擎。
8 月 16 日,在 CSS 这场大数据及云安全的分会场里,黑盟(公众号:黑盟)编辑看到,一共有 300 个座位,10点,会议开始时,整个会场已经坐满,随后靠近门口的右排和会场后排站满了人。
好奇腾讯云要做什么的人不在少数。
第一件事:发布腾讯云AI 安全矩阵图
腾讯云先抛出了一张腾讯云 AI 安全矩阵图。
下述就是腾讯云首次发布的腾讯云 AI 安全矩阵图。
据腾讯云副总裁,腾讯云社交网络与腾讯云安全负责人黎巍介绍, 腾讯云安全整个 AI 核心就以大数据和 AI 的算法为驱动,构建应用于安全领域的包括社交图谱分析、图像自动识别、自然语言处理、知识表达推理等 AI 通用能力,形成智能身份鉴定、威胁情报分析、异常流量检测、网络攻击溯源、人机行为识别、恶意图片识别、垃圾文本检测等 7 项技术应用。
“无论是图像识别、图谱分析、自然语言处理,可以放到很多通用场景,最终把这些能力应用到包括智能身份鉴定、异常流量检测、危险情报以及现在正在做的、没有正式开放出来的人机识别能力。”黎巍说。
上述能力落地到不同场景后,腾讯云顺势抛出了第二张图:AI 安全产品矩阵。
从上图可以看到,其产品矩阵包含业务安全(天御)、主机安全(云镜)、数据安全(数盾)、移动安全(乐固)、账号安全(祝融)、网站与流量安全、内容安全与风控安全。
腾讯云安全工程师成杰峰认为,机器学习在安全领域应用的两大阻碍:一是样本问题,不存在天然的恶意攻击样本,且攻击的不断变种使得样本本身也具有时效性;二是精度问题,误杀或漏判都会产生较高代价,所以对算法的门槛很高,精度通常在 99 %以上。
因此,腾讯云推出了 AI 安全引擎:基于大规模图挖掘去不断地分析提取不良帐号、恶意 IP 和黑产设备,进而收集各类恶意和攻击,最终形成 AI 模型的样本。结合深度学习、自然语言处理和计算机视觉等AI能力,提供高精度预测模型和抽取黑产实体及特征。
第二件事:发布“数盾”
数盾是腾讯云推出的全流程数据安全保护方案。腾讯云安全工程师崔子翊称,数盾是业界首例搭配同态加密的数据安全产品,还提供 QQ 同款的数据加密方案,将单条密码的暴力破解时间从数周延长到数千年。
所谓全流程,是指针对数据生命周期内的创建、存储、传输、访问、使用和销毁等每个阶段,应用不同安全防护。数盾通过密码加密、大数据动态加密、身份管理、认证管理、授权管理、实时防护、审计预警等功能的实现,配合腾讯云全流程安全生态环境,提供系统化的安全防护。
第三件事:成立 DDoS 防护联盟
腾讯云还宣布,在大禹 BGP 高防的基础上,联合辽宁途隆、唯一网络、睿伟网络、帝恩思成立 DDoS 防护联盟,未来将在 DDoS 大数据及态势感知、协同防护、黑产打击方面进行深度合作,联手对抗 DDoS。
在上述发布的基础上,包括黑盟在内的一些媒体对腾讯云的上述人士进行了采访,一探所谓“AI 安全”的能力到底是怎样。
以下是采访问答,黑盟编辑在不影响原意的基础上略有删减与整理。
1.都说AI 安全,腾讯云安全在 AI 大数据安全方面到底有什么优势?
黎巍:最大的优势是数据——AI 60年前已经提出了,为什么近几年才爆发?因为 AI 做得好不好很大程度依赖于数据资源、存储、计算和整个平台,还有 AI 专家工程师。放眼国内,现在谷歌在这个领域确实非常强。从数据层面,毫无疑问,腾讯一二十年的积累,应该具备国内最全的黑产数据,因为我们是被黑产攻击最严重的,这也为我们积累了资源,是我们的燃料,这个燃料不是哪个公司都可以提供,一般的中小公司可以买一点,但它永远不可能买到这么大的资源。
第二,腾讯 AI 的布局,我们正式宣布得晚一点,但是腾讯的布局也比较久了,包括优图实验室在这方面积累的技术和能力,最近一两年我们才尝试把这些东西对外开放出去。腾讯在 AI 方面引进了一些专家,这也不是任何一个企业说——我要做AI了,我出去招一堆人弄一个开源算法,这么简单就做了,这是我们资源的优势。
第三,10年前,相对整个业界的体量,腾讯就是做海量服务的,因为 QQ 增长太快了,这个过程中积累下来的存储,包括计算能力。
AI 有了数据,有了算法,有了顶尖的专家,最后还要有系统,能够存储每天产生的大量数据,存储数据时,还能更高效计算挖掘出来。
2.能不能给一个直观的感觉,用了这个 AI 的安全引擎以后,安全能力提升了多少?
崔子翊:首先我们 AI 引擎要保证在云上提供安全的服务,确保我们自己要用得好,我们在 QQ 和空间一系列的社交服务里已经用上了这样的能力,包括无监督引擎的闭环流程。整体上,大盘的数据不是很有意义。
从单点讲,特定的场景里新增的识别率可以至少提升 20 %以上,最传统的是这些人工定规则,一个小时内 80 次请求以上是有问题的,将来可能会产生很多漏判或误判的问题。第二,很多大公司也是这样做的,第三,我们加了无监督,先判断是不是一个恶意团伙,之后加入到新的训练样本里,把已知和未知的都加进来一起判断。
黎巍:比如,传统的防火墙等很多都是规则匹配,我们的产品在应用时,相对原来的规则,至少有 20 %的提升。其实还有一个提升,他们没有感知到,下面有一个做规则和安全的团队,一年前整个团队是 15人,现在只剩下10个,少了5个,还是能干同样的活,甚至干得更好,这也是 AI 的价值。
成杰峰:这个数据可以从大盘恶意尝试量得到反映,在 AI 引擎上线前,我们可以看到一个曲线反映了近期恶意尝试多少次,比如一天是 3000 万次左右,AI 引擎上线以后,对它猛烈打击,量就下去了,之后它就保持在比较低的值,甚至在之前一半左右的量继续徘徊,这说明 AI 引擎上线后,初步处理了上峰,大大打击了以前作恶的坏人的主动性和积极性,相当于我们把战线大大往前推进了。
3.黑产也用 AI 能力怎么办?谁跑得快?
黎巍:腾讯每年在线下会配合警方抓捕一些黑产团伙,今年警方抓获的其中一个应该是国内最大的打码平台。抓获这个团伙以后,我们非常吃惊,因为他们是租用了国内某云服务商的云服务器,利用了谷歌开源的引擎进行打码的攻击,他们的验证码识别率达到了99%以上。
AI 方面的算法和计算平台对正常的企业和对黑产没有什么本质的区别,并不会因为你是黑产就有特别的地方,比如,开源的算法大家都可以用。
其实,这是一个赛跑。如果很多企业在这方面保持怀疑,采用传统的方式肯定会被抛弃。
重要的一点是邪不胜正——从我们过去的经验看,黑产的资源和能力跟一些行业的正规公司相比,还是有很大差距,也需要全行业一起携手进行应对。
腾讯本身也具备数据处理能力、算法、计算能力,这些能力未来会更多地开放出来。而让每个公司自己构建一套AI平台,组建 AI 团队,光招人可能都很困难。未来,AI 平台化是企业对这块的认知。
黑盟原创文章,未经授权禁止转载。详情见转载须知。