精华内容
下载资源
问答
  • 看名字就很厉害样子,看描述更是功能强大 不禁内心一阵酸爽。 丰富了自己部分武器库之后很多白帽子喜悦之情溢于言表,身边很多小伙伴甚至都开始在本地开始测试了;几家欢喜几家愁,总一些人快乐终究是建立在...

    0x0 背景


    由于参加最近特殊多人活动的原因,很多渗透攻击武器也进行了对应的更新。冰蝎出了3.0版本、甚至还有好几个beta版本;还朋友圈还出了一个据说比冰蝎3.0还厉害的神器”哥斯拉”全部类型的shell均过市面所有静态查杀、流量加密过市面全部流量waf、自带的插件是冰蝎、蚁剑不能比拟的;看名字就很厉害的样子,看描述更是功能强大 不禁内心一阵酸爽。

    丰富了自己部分武器库之后很多白帽子喜悦之情溢于言表,身边很多小伙伴甚至都开始在本地开始测试了;几家欢喜几家愁,总一些人的快乐终究是建立在一些人的痛苦之上的,生活真的是残酷了;这个节骨点更新大家品大家细品,很多安全公司的小伙伴可能又得彻夜分析,楼下小超市的方便面又得卖断货。

     

    0x1 技术背景

     

    webshell就是以asp、php、jsp或者cgi等网页文件形式存在的一种代码执行环境,也可以将其称做为一种网页后;Webshell的技术问题也是老生常谈了,各个论坛上面的安全技术分析还是比较丰富,大马小马一句话,菜刀冰蝎哥斯拉(还漏了蚁剑);从攻防角度来看在多数的攻击场景下按照killchain的思路与实际步骤来看,一次完成的webshell攻击基本上都绕不过以下4个阶段 主要可以分为:

    1. webshell制作(武器化WEAPONIZATION)   无论怎么样首先的生成一个webshell,很多webshell管理工具是配套使用的直接生成就好,或者自定义改改默认配置,常规的一句话notepad就可以搞定。生成出来只是具备了这个功能,不做一下免杀估计本地的随便一个杀毒软件直接就删除了,详细的免杀绕过后面再讨论。
    2. Weshell投递(交付DELIVERY)  webshell的投递方式普遍以文件上传为主、主流的方式还包括一些文件写入、主动下载、命令执行写入等方式,花里胡哨的姿势很多。投递过程应该是整个过程中的最关键的部分也是难度最大的一部分,因为过程中会面临很多的对抗机制,往往需要结合具体场景多次尝试测试。
    3. webshell访问(利用EXPLOITATION)  将脚本上传到对应的服务器上面之后就进入了关键的一步:如何正确快速的访问到指定的webshell文件。
    4. webshell执行(ACTIONS ON OBJECTIVES ) 使用工具或者直接通过访问访问到对应的webshell执行,就可以随心所欲的操作受害者主机。包括不局限于执行系统命令、探测内网、读取敏感文件、反弹shell、添加用户、清理痕迹、横向移动等操作。

     后续剖析讨论一下在每个阶段当中包含的一些攻击手法与常规的识别方法。

     

     

     

    0x2  制作免杀

     

    常规一句话直接用记事本就可以直接解决,简单的同时也非常容易被查杀,这一类木马的特征实在太明显了比如常见的eval()  assert()之类的函数肯定是一抓一个准。传统的检测方式基于对webshell内容的检测里面最简单的就是字符匹配、正则匹配或者词袋模型 ,这种木马肯定是检测出率100%的。

     

    此类检出场景最多出现在基于终端的文件检测比如大家熟知的D盾、安全狗等产品主要是从文件本身出发。还有另外一个场景就是目前出现最多的防火墙、UTM之类的产品虽然是网关类设备,大多数场景下也是根据内容进行识别检测的,所以本质上都没什么差异。

    为了应对此类检测当然就的想办法绕过了,基于文件内容的绕过方式就很多了,基于检测方法多数是基于敏感函数是吧,那么只要换一种方式处理这些函数就可以了。比较简单几种方法如:

    1. 大小写混淆   比如eval函数可以使用EVaL()当然这种方法基本上已经不起作用了
    2. 字符顺序混淆    assert()可以使用tressa然后用反序函数进行输出或者进行移位拼接 ass+e+rt颇有一种凯撒密码的感觉。
    3. 字符串编码混淆   典型的几个方法如Chr()  Base64()  rot13()  gzinflate()通过编码敏感的字符同样可以达到这种效果。当然现实情况上这几类函数同样被列入了敏感函数范畴,或者大量使用一些注释、\n\t\r之类的一起玩。
    4. 创建匿名函数  eval()函数总得跟一个参数吧,如果直接命中eval这四个字符势必会引起大量的误报。基于这种思路就衍生了call_user_func生成,最后这个函数也被列入了敏感函数
    5. 字符替换  生成一个字符串e123/v123/a123/l再使用函数把”123/”给替换掉空白即可常见的函数如preg_replace()与str_replace()

     

     

    还有很多其他的绕过方式,如回调函数、定义函数方法、字节填充等等方法还是很多这里不多给大家复制粘贴,一般多种绕过方式组合一般能绕过D盾就基本上可以正常使用,相信很多经验丰富的大佬都有不少免杀的webshell。

     

    针对webshell的检出相反手法就要难的多,理论上你知道的webshell种类越多设计的对应的检测手段就越全面,就和股票的涨跌原理是差不多的根本原因就是消息的不对称性,大家都知道还怎么割韭菜。除开自己构造一些webshell之外,很多管理工具都支持自己生成比如大家熟知的冰蝎、weevly之类的,之前自己偶然间抓到了黑产团伙挂马用的shell低版本的D盾还无法识别,后续在新版本却能识别并提示为已知后门。这一类的脚本检测起来还是比较容易,原理很简单大多数工具生成的木马(除开魔改的那种)格式内容都比较固定,通过针对内容里面的函数位置、调用顺序、语法特性等维度做一个特定的模型特征,简单的如yara规则的模式也可以称作指纹。

     

    当前针对文本类的webshell检测主要还是正则匹配、语法分析、绕过特征分析、文本特征指纹等手法为主,之前也注意到有一些针对脚本文件的虚拟执行,感兴趣的小伙伴大家可以了解一下。

     

    0x2  样本投递

     

    样本生成之后,就开始考虑如何把自己手上的webshell投递到制定服务器的文件目录,主要的手法还是以文件上传居多。常规操作攻击者首先需要对目标的应用做个详细的信息收集和踩点。在webshell上传下多数关注一些上传点,常见的上传点如个人资料当中的头像上传、注册需要上传验证资料、上传某些模板更新、常见的编辑器漏洞、留言板回复、商品页面展示;多数业务场景上传主要以图片(JPG、Png、bmp、ico一类)、文档类(doc、excel、pdf、wps)、压缩包(zip、rar)格式居多一些。

     

    根据具体的业务场景的不同,常规的防御手段一般应用在上传界面少说会做一些限制与检测。比如常见的文件大小、后缀名、文件类型的MIME 、文件头信息、简单的内容识别等等,成功上传之后全面统一修改命名与文件格式、设置一定的访问权限、定义特殊的文件存放路径等等。

    当然并不是所有的防御方案都无懈可击,相反多数场景下都会存在一定的配置风险;文件名的后缀检测可以通过修改成图片的格式上传,后续通过重命名或者文件包含的方式进行执行。如果是黑名单机制就可能存在一些遗漏项前几年比较热门的解析漏洞(基本上主流中间件都出过这个问题)最热门应该还是II6这个版本、0字节截断以及可能存在遗漏的场景。白名单机制的话,相对安全性要高一些。文件头检测本身是以二进制的数据流方式进行检查的,所有绕过方式也比较简单在脚本开头直接添加对应的十六进制字符进行伪造就好,之前发现有很多黑产的webshell文件开头都是GIF8想必也是深谙此道。

    在webshell上传的过程当中对于大多数的流量层的安全设备如FW、IDS、IPS、UTM一类来讲、本质上是和文本识别没有什么区别,都是讲上传的文件审计下来进识别或者直接在HTTP数据流当中简单匹配特征字符。

    高阶一点方案可以做行为识别其实也很简单。估计有很多萌新白帽子不知道的是,常规的业务流量和咱们webshell上传的流量在大量数据统计的层次上来讲本质上是不一样的甚至有点另类。举个简单的例子来说比如咱们现在有一个上传接口主要是用户用来修改自己主页logo的,通过对HTTP协议的解析可以简单的看到这个filename字段多数多数都是图片文件,分辨率、大小、格式都是基本上符合一个特定的基线水平,突然出现了一个jsp的文件上传或者一个超出预期大小的jpg文件这个就是异常,毕竟这种攻击流量是少数人才会做的事情普通用户并不会就”恰到好处”的传了一个这么一个特殊格式的文件上来。

    估计会有不少萌新觉得这样会不会数据量很大?如何定义这些基线?怎么才能认为是异常?其实类似于这样的场景检测技术都已经很成熟了,这些接口层面的数据量本质上很小,现在都是ES、Mongo、Kafaka、集群分析的时代了不是之前关系型数据库的风格,几十T的硬盘价格也很亲民加点存储与运算能力对甲方金主爸爸来说不过是洒洒水而已。数据统计的统计维度,无非也就是加一个索引设计一个检测场景的事情罢了,成熟的机器学习框架不需要太懂算法的具体原理,方法函数调用总会吧 调调参数就完事技术难度也不高。

    不少大佬利用自己发散思维的小脑袋最后传到了服务器的后台之后,依然面临着终端安全软件的检查。不少大佬肯定已经做过免杀了,内容识别不一样管用。但是这个世界有时候就是这么恶意,你传上来了一个脚本文件但是同文件的文档都是图片或者别人都是100K的大小,你就1Kb的大小(一句话木马就是这么短小精悍)突然就有点那种鹤立鸡群的感觉有没有,然后其他脚本大家都齐刷刷转头看着你,就有点类似大学”罗汉班”上计算机网络的时候大家都在后面,突然来了一个漂亮妹子走进教室坐在第一排认真听课的感觉是一样的场景;非我族类,其心必异。分分钟就把你上传到云查、或者交给身不由己却又站在你对立面的”同伙”鉴别。

     

    不少萌新又开始质疑,人能够一眼看出来异常代码能这么轻易的做到吗?怎么说了代码还真的能做到而且效率更高、无遗漏而且更加准确,因为人还是要吃饭睡觉打盹或者划水摸鱼,代码不会的(总不能故意在代码加个sleep()函数吧)。既然都写到了估计很多小伙伴也有了不少对策和其他思路在后续的渗透过程中,怎么说呢方式还真的有不少,这里就不多介绍了留个伏笔吧。

     

    0x3 访问

     

    在所谓的纵深防御的体系下,还能突破层层防御之后还能上传成功并且成功拿到访问路径的黑阔已经算是翘楚了;当然也有可能是另辟蹊径通过控制内网其他主机之后,成功的绕过了边界防御设备的检测成功上垒,到了最关键的一步。一般链接这些一句话木马需要有一个webshell的管理工具常见的就是菜刀、weevly、冰蝎、蚁剑之类的。而这个也是最难的一部分,因为这些工具攻击者知道那些苦逼的安全公司乙方的打杂员工也知道,早早的就对这些工具做了流量识别。

    针对于每一个管理工具流量层面的识别方法都不一样,都针对单一工具的方法当然也有通用工具的检测方法,是的你没有看错是有通用检测方法的。常见的菜刀的流量长什么样估计很多萌新也多知道,特征是十分明显的,如下图所示。关键是菜刀这个玩意可能有后门呀,你辛辛苦苦的拿的站,可能是给被人在打工。

    然后就衍生出了中国菜刀,后面发现这个工具也很容易被识别可玩性并不是很好。接下来就是蚁剑,支持了很多参数的自定义。很多萌新用的时候都是不改默认配置的,HTTP流量当中User-Agent硕大的字符Antisword V2.0 V3.0 也是勇气可嘉。之后还有冰蝎,再没有出3.0的beta版本的时候,链接的过程当中最典型的特征就是秘钥协商,如大家所知冰蝎的流量只要是以AES加密的(感兴趣的小伙伴可以了解一下密码学知识还是挺有用的无论是免杀还是流量分析都有大有裨益),对称加密就一定会有个秘钥用于加密解密传输的数据,所以在建立的链接的时候就存在这么一个交换秘钥的过程,建立行为模型来识别这个过程会是重要的一环。估计开发者也意识到了这一点,新版本已经换了一种方式实现。

     

    是不是加密的内容就无法识别了呢?其实并不是,只是比传统的正则匹配稍微复杂了一丢丢而已。传统的密文一般都不具备可读性,如果前期我识别出了你交换秘钥的过程过程中的流量我解密一下就好了,就和用Burpsuit添加个证书做HTTPS的代理的原理差不多,而且只是AES的标准加密反而更容易一些。

     

    不少萌新会觉得这种思路太荒谬,特征性不是很强就不怕误报。的确如此,特殊内容与格式的特征并不是很强但也不是唯一特征那么再结合一下行为呢?你在访问这个webshell的时候,首先他得是一个脚本文件(格式就那么多)。多数样本访问的路径往往也有不少蛛丝马迹典型的比如上传在一个uploadfile/image的目录下别人访问都是 beautifulme.jpg  uglgyou.png 之类的你一访问就是1.jsp  hackme.php 在结合你的特殊内容格式和你这个从来没有访问过的IP地址和账户,这不是攻击流量谁是攻击流量?

    既然都说到这里了就简单的一些机器学习的基础思路,在这里本质上是将攻击者与普通用户定义成了二个不同的对象,而且是对立面的角色。二种角色在平时的访问路径,页面元素、访问文件、甚至是访问时间、使用的IP方面都存在较大的差异性,简单点说就是需要从多个维度将二者区分清楚,模型上就是一个简单的二分类问题。常见的分类算法比较多、比如SVM(支持向量机)、K-Means、多种树或者森林模型等等,大概长这个样子。

     

    或者这样

     

    现在很多小伙伴都共享了一些蚁剑、冰蝎的魔改方法和思路,稍加专研绕过传统的规则检测场景问题应该不大可能还有点轻松。但是另外一个层面是正常访问用户还是占了绝大多数(定义了所谓的基线),所以少数异常的行为就显得格外明显。算法模型的好处就在于,之前你可能需要人为去调控一些阈值,容易出现很大的偏差而模型依靠大量的真实数据进行运算自动算出来而且还能实时更新,私人觉得这个是大数据+AI对安全检测的一个实用性体现,当然无论是谁也不能保证了100%的检出识别。

     

    0x4 执行

     

    到了最后的执行阶段,如果类似于菜刀是基本上明文流量(base64和明文没有什么差异)检测起来就容易的多,由于格式是比较固定的一个关键字匹配或者正则就可以识别。如果是类似于冰蝎的加密流量,就需要用到一些行为特征结合多维度的方式进行识别。加密流量的HTTP协议部分的request_body和response_body都的是密文吧,这里接触到一个信息熵(热力学中表征物质状态的参量之一其物理意义是体系混乱程度的度量)的概念,可以简单识别传输的内容是否具备可读性。

    试想一下如果一个正常的用户商品管理的界面,大家访问各种脚本文件都是明文登录,突然出现了一个信息熵很高的加密流量,会不会有点此地无银三百两的感觉。在利用webshell执行命令上传文件甚至是添加用户探测内网,对于终端的上来讲一般都是很有问题的。典型的场景如,攻击者通过weblogic上传了一个war后之后获取到权限,执行一个whoami返回的用户权限就是weblogic进程的启动用户的权限。如果是root或者system危害性就很大,如果只是一个www用户危害性会降低不少,这也是为什么要求降权运行数据库、中间件的愿意之一,这个时候比如拉起了一个cmd.exe或者powershell.exe进程添加个wooyun的用户这个行为会很有问题常规的业务怎么会有这种操作。与此同时利用一些工具或者cmd扫描内网做主机的存活探测,为了避免不发现慢速扫描、多协议之类同样风险也很高,关键问题在于:攻击者本身不熟悉内网业务的访问关系很容易导致被发现。举个简单例子,某web服务器与隔壁网段一台域控服务器从未有个通信行为,这次突然来了一个RDP的登录(不管失败或者成功)不是很突然么?未记录在案敏感资产的访问从来都很有有问题。

     

    0x5 攻防对抗

     

    安全攻防是一件很专业的事情,安全不是夸夸其谈也非纸上谈兵更不是未经实践的“想当然”;攻防的本质在于人与人之对抗,对抗的是知识技能储备、时间、精力等多个维度的全面竞赛;举个简单例子,攻击者绕过上传机制把脚本传到对应的服务器,现在链接担心动静太大发现,不然就凌晨12点等运维人员睡觉再搞事情;或者就多找几台VPS服务器用WVS进行各种漏洞尝试攻击,成不成功都没有关系被发现也没有关系主要就是分散对方的注意力,间隙时间里面再去访问这个webshell执行命令现实版的暗度陈仓的感觉有没有。

     

    攻防技术日新月异变化的很快从之前的手工注入、穿山甲、啊D到现在的sqlmap技术门槛看似乎是越来越低,伴随着的是很多甲方自己的技术能力和安全意识也提升了很多,现在很多应用框架本身也针对常见的web安全做了很多防护,再也不是那个一扫各种漏洞一大堆的时代了。同样的攻击技术的提升也一样很快,从之前的菜刀到现在的冰蝎、蚁剑的各种自定义魔改到一定程度之后基本上都做到无特征,依靠特征检测的路可能就越来越窄;如果真的做到和正常的业务流量上能保持到一致就是润物细无声了,对很多安全公司和甲方来说反而更加有紧迫感。

    个人觉得这也是攻防技术演进的一个方向,越来越多的正常流量会趋向于正常的业务流量。就拿隧道通信来说,DNS隧道、HTTP隧道特征还是很容易识别,如果RDP隧道、SSH呢?自己写一个后门很容易被杀毒软件查杀,那利用很多操作系统自带的定时任务、WMI、Powershell无文件留后门杀毒软件也敢查杀么?同样的对于很多安全公司和甲方来说,后续在应对此类攻击的时候需要更多创新性的思路去发现与识别。

     

    0x6 总结

    为了水篇文章赚点陪妹子(虽然还没有)吃饭的钱足足写了6000+字真的是太不难了,结合自己的一些打杂经验简单分享了一下一些做安全的思路,不足之处或错误之处欢迎各位大佬指出斧正;当然能带我飞就更好了,我可以给大佬端茶倒水。

     

    展开全文
  • 在这个项目里,她会和自己的100位朋友创作出100个构架在故事之上的艺术作品。艺术家贝尼 图片来源:DR在这个艺术项目开启的第一个月里,贝尼疯狂地约见朋友听TA们讲故事。这些故事就像是一剂良药,帮她对抗内心的...

    2018年,一个名为《x的故事在y轴》的艺术项目诞生了。这个“年度计划”来自于艺术家贝尼——一个需要被治疗的职业艺术家。在这个项目里,她会和自己的100位朋友创作出100个构架在故事之上的艺术作品。

    80bd2e0ea081c4f61673e1ce166cc2ab.png

    艺术家贝尼 图片来源:DR

    在这个艺术项目开启的第一个月里,贝尼疯狂地约见朋友听TA们讲故事。这些故事就像是一剂良药,帮她对抗着内心的无头结。接着,他们再一起把这些故事用艺术作品的形式表现出来。虽然作品的尺寸被限定在38cmX38cm的矩形空间里,但最终的表现形式仍然包括了装置、影像、音乐、行为以及绘画等等。

    就比如,由一颗经碳14检测18,000年前人工合成的珠子,而引发出的对多元文明的探索与表达,是《X的故事在Y轴》艺术项目中的其中一个作品。

    6e8b621209c381dcefe0035f76134247.png

    一颗经碳14检测18,000年前人工合成的珠子 图片来源:DR

    50米长卷的画作中展现了47亿年地球更迭的宏伟变迁。大到十二个历史纪元,小到细胞的分裂,被贝尼和她的好友卞小虎用画笔一一记录下来。未来,贝尼希望可以把这幅画卷变成一本儿童填色绘本,希望孩子们用TA们的想象力去丰富作品,让作品活起来。

    0eae161feb802c96a83ba182ab52d899.png

    贝尼与好友卞小虎作品 图片来源:DR

    从2018年这个项目启动后,贝尼就没有再停下前行的脚步。今年是《x的故事在y轴》进入的第三个年头,也是贝尼进入艺术行业的第16年,这个最初的“年度计划”也演变成了贝尼的“终身计划”。尽管2020开年新冠肺炎疫情的“造访”,令整个艺术行业步履维艰。但在这样的环境之下,《x的故事在y轴》项目依然在坚持向前迈进,给予她自己力量的同时也给予他人温暖。

    d20dbf916ca868775ffd9cd69d2bae41.png

    《x的故事在y轴》艺术项目 图片来源:DR

    贝尼从事艺术的初心很纯粹,她说:“就是为了治愈自己。”但如果,每个鲜活的生命都能或多或少地在其中受益,那就更好了。“如果失去了强大的内心,不能照看好自己,谁还能来拯救你,这也是我的自己的生活真谛。”她这样说。

    以下为艺术家贝尼的自述:

    初衷

    2017年8月开始的半年里,我的精神和身体上都出了一些问题,我清楚地知道自己需要被治疗。

    在大学里,学艺术的同时我也选修了心理学,所以一直有在做自我状态的调节及调整,但收效甚微。当时给自己立的军令状就是,如果非要选择活着,那活着的每一天都不能浪费。

    当自身的能量储备完全不够我去应付心理上的问题时,我找到了一个方法就是和人沟通,和各种各样的人沟通,从别人身上获取我所不能自给的能量。

    2018年6月,我用了半个小时的时间,完成了这张海报,并转发给了90多位在这一年中和我有过联系的朋友。并且首次尝试着做了一个线下的小规模(大概六个人)快闪行为活动,这就算是《x的故事在y轴》这个项目正式启动了。

    88e60623d12ad13fecd944003af326b9.png

    项目海报 图片来源:DR

    和100个朋友去做100件不同的艺术作品,我从他们分享给我的故事中找到一个中心点,或者说一个相契合的点去衍生出一个作品。比如说,和音乐人的作品可能会用多媒体或者乐曲的方式来呈现,和建筑师的作品就可能偏装置一些,当然还有很多平面的绘画类的作品。因为我本身就是一个多种材料的艺术工作者,所以对于材料的选择就会相对宽泛一些。

    其实大部分的参与者不会问我“为什么要去做这个艺术计划,做完了之后想干什么。”这一点上我是很欣慰的,因为他们都是我的朋友,这样的认同感和信任让我觉得并不孤单。

    e5f44afa7c4c3eeddf67b8bbe038db4f.png

    图:张小英摄 图片来源:DR

    有一次很有意思,我去天津美院拜访一位老师,他其实是这些参与者中为数不多的几位艺术家之一。飞过去之后,他就跟我说:“贝尼,你做这个东西没有意义,不要做了。”主观的原因是因为他觉得就作品形式而言,类似的课题别人也有做过,我再做这类的东西真的是没必要。当时我就说:“行啊,那我们就不要做。就当是我过来看一下朋友。”末了,当他了解了我的创作动机后,他还是完成了他想给予我的那部分作品,这个过程对我来说记忆深刻,特别有意义。

    断舍离

    在2018年之前,我是特别不喜欢跟人打交道的,我喜欢收集东西,花了很多时间和精力去照顾它们。之前我的工作室特别大有1,300个平方,我必须不停地去创作才能填充或装饰它。在这个过程当中,我是被自己创造的一个既定目标推着走的,这是欲望,不是梦想。到了分身乏术没有那么多精力去好好照顾每一件物品和作品的时候,也应该踏出改变的一步了。2018年之后,我被动地做了一部分“断舍离”,当身边的物品被清空时,我就有了更多的时间去关照自己的内心,对很多东西也没有那么大的执念了。时间富余了,就能够更好地去倾诉和倾听,所有留下来的都是精神内核的东西,省去了没有必要物化。

    6c6fdbc1cf21cc0a89d11ac4778cc32d.png

    贝尼工作室照片 图片来源:DR

    我最初学的是油画,从事绘画其实是一件寂寞且孤独的事情,愿意沉下心来去画画或者做雕塑的人,其实会非常享受这种孤独的时光,他们愿意在这个只有自己可见的世界里生活。生活也是这样子,如果说只是机械性地活下去,可能没有太大意义,对这个社会进程也没有太大的帮助,肯定是要有一些别的东西,一些精神层面的东西。

    88c74e893c1aacd296a04b1f5702149e.png

    贝尼油画作品 图片来源:DR

    对我而言一件艺术作品不够细腻,没有细节,是打动不了自己的,包括文字、音乐或美术,打动不了自己的东西又怎么能打动别人。所以其实不管怎么说,做自己就好了,每一件艺术作品都是自我呈现的一部分,就像是拼图一样,我们花一辈子的时间去创造每一块然后试图把TA拼成一个自己想要的样子。

    4c2568c7d6dc34cb7c699db9f6014db2.png

    贝尼油画作品 图片来源:DR

    陶与瓷

    大学还没毕业的时候,我就拥有了一家自己的画廊。我记得有一天,有一个外国人跟我聊起了陶器和瓷器的区别。其实我对这个领域知之甚少,为了搞清楚陶和瓷的区别,我便带着一腔热情去了一趟景德镇。

    当时朋友给了我一个人民日报记者的身份去景德镇走访。因为他们的提前安排和联系,我见到了一群很厉害的人,真的是被震慑到了。难以想象在这个(景德镇)表面看起来它很破、很烂的地方,它的内核、时间轴上的东西却丰富的不像话,就像是看到了一部中国陶瓷工艺美术史的缩影。当我们去看历史典籍时,很多辞藻和历史都是被修饰过的。但是器物是不会骗人的,它是能够真实的反映那个朝代人的生活及审美。

    陶器的出土时间较早,但是瓷器类的东西是比较晚出现的,从唐代的“南青北白”到宋朝的八大名瓷,当时的文化对瓷器的接受度、审美高很度,包括宋徽宗的个人造诣,都奠定了在这样的社会结构中,人们是有机会和时间去欣赏陶瓷和使用陶瓷的。

    景德镇之行后,我便在上海的汶水路创办了一个陶瓷的工作室,并且在工作室中做了我人生的第一台窑。窑做好了我就开始请人,谁能想到在请人这件事上栽了跟头,06年那个时候很少有师傅愿意跑外地,再加上景德镇的72道工序,很多工种都被细分拆开。比较重要的工序都会有一位专业的师傅负责,就这样半年里面也只请到过一位相对全能的师傅。剩下的就全靠景德镇陶瓷大学的那些来沪实习生。但毕竟学生接触的东西少的可怜,在经验上等同于零。所以工作室并没有像我所期待的那样顺利产出。半年后我们打包了一个集装箱,把所有东西拉到景德镇,真正开始陶瓷学习之旅。

    4bb112b3b5aa02e9d523663946158b69.png

    贝尼陶艺作品 图片来源:DR

    在景德镇有一个“三宝陶艺村”,如今是很多外来艺术家的聚集地,我算是入驻其中的第二家外来人口。在那里一呆就是五年,但很不幸的是这期间并没有做出让自己满意的作品。第一个原因是由于我的陶瓷专业知识十分匮乏,搞不清楚门道。第二个是景德镇的泥巴其实并不太适合做体量大的雕塑,高岭土性质比较软,它适合做一些同心圆的东西,所谓“同心圆的”东西就是指:花瓶、盘子、碗,这一类的。最后一点就是,因为景德镇从古到今都是一个拥有商贸和码头文化的地方,一批一批的生意人在那里买来卖去,迎来送往的景德镇人已经习惯了外地人的存在,不同的师傅帮你去完成不同的陶瓷制作过程,导致一旦烧制失败,我根本没办法知道是哪个程序出了问题,若是开窑时发现有东西烧坏了,烧窑的师傅会说拉坯的有问题,拉坯的师傅又说利坯的有问题,最后这个东西就变成了一个推诿,谁都搞不清楚问题出在哪里。

    在景德镇呆到第六年的时候,差不多是2012年吧,我参加了一个叫《Master Chef》的全球真人秀节目,还拿下了中国地区第一季的前15强。同期,深圳的一个国际艺术家驻地也邀请我过去创作,所以我有两三个月一直辗转在上海和深圳两地,当然也是收获颇丰的一个阶段。因为离开了景德镇,我必须亲手把控陶瓷制作当中的所有流程,一旦泥坯上出了问题,都能在第一时间给予解决。结果是,我居然用了2个月做出了在景德镇几年中都没有做出来的作品。

    bb35edc2a0bc844c87761741b7719862.png

    贝尼陶艺作品 图片来源:DR

    “做陶瓷其实就是做人”,你怎么对它,它最后怎么呈现给你看。有时候可能你稍微磕碰了一下,表面上并没有看到损伤,但其实已经出现“内伤”了,烧完就会开裂给你看,所以你对它越是温柔,它也会呈现出最好的那面给你。

    治愈自己

    2018年的时候,我开始不想再做固定工作室了,会理性地去考虑一些问题。我会考虑做出来的这个艺术品,是不是我自己真的愿意去创造的,是不是一个能影响他人的东西。而不是单纯来填满空间的。它不一定非要是一张很大的画,也可能是一首诗、一段音乐、一个视频,材料上是多元的,没有局限的。

    《x的故事在y轴》本身是个“年度计划”,也就是原本在2019年6月之后要结束的。但那一年,我根本没有办法把那些作品全部做完,100件作品这样的量太大了,同时也会觉得,如果TA作为我的一个终身计划,可能我会更游刃有余。

    3fc8927dee0555bae1df21f8fbb3cd77.png

    项目参与者 图片来源:DR

    我相信所有东西的出现转承对我来说都是注定好的。就拿《x的故事在y轴》这个计划来说,就是一个时间轴里面本身就预设好的安排,并不是我刻意想出来的。

    TA是一种特别好的方式方法,是一种能够抛开利益和别人进行深层沟通的完美方式。艺术是个缓慢生长的东西,它是一辈子的东西。它生长的快慢是会影响到你的步伐和前进的节奏的。

    如今这个项目差不多有100多个参与者了,作品陆陆续续在创作。其中不乏有些作品的体量较大,内容较多,这就成了我创作的日常。

    我清楚地知道这个项目的初心在于治愈自己,所以我做的任何的事情,大概率都是想让自己变得更好,但是这个“更好”,就像前面说的这个所谓的梦想一样,是讲不清楚的。你问我想变成一个什么样的人?一个内心真诚的人吧,用艺术来影响我身边的人的气息和气场。我希望有一个非常健康的生态链或社交圈,是能够真正在内心深处有深层沟通的。

    2019年,我在享誉全球的PKN分享会上做了一个演讲,正是关于《x的故事在y轴》,虽然我的初心只是想了解自己存在的意义,但是却误打误撞进入了很多人的内心,可能艺术就是有这种魔力吧,它能够用最简单的方式把大家串联在一起,不为交际而交际,不会盲目忙碌的生活。

    8c41603d61cd124692af534c5a96edb4.png

    贝尼在分享 图片来源:DR

    我和每一个人的每件作品都是在完成一个阶段性的目标,当我继续去做《x的故事在y轴》这个项目的时候,这些目标都会陪伴着我们,让彼此在前行的道路上不再孤单。

    - END -

    展开全文
  • 对威胁的对抗、对情报研判、对数据分析、对知识理解、对智能追寻、对内心的挖掘、对人性洞察、对生命顿悟、对世界认知、对宇宙探索,归根结底都是对真相渴望。 安全真相是什么?安全过去是人...

    我们终其一生,都在寻找各自的终极答案。我们无时无刻,无不希望能在自己从事的领域离真相更近一步,哪怕是一小步。对威胁的对抗、对情报的研判、对数据的分析、对知识的理解、对智能的追寻、对内心的挖掘、对人性的洞察、对生命的顿悟、对世界的认知、对宇宙的探索,归根结底都是对真相的渴望。

    安全的真相是什么?安全的过去是人与人的对抗,安全的现状是攻击者加攻击机器对抗防御者加防御机器。而未来安全的终局,一定是机器与机器的自主对抗。从这个角度来看,安全的本质其实是智能体之间的知识对抗,智能可以是碳基的智能,也可以是硅基的智能。到终局那一天我们有没有「搞清楚安全」显得一点都不重要,重要的是到那一天我们亲手锻造的机器智能,作为人类智能的延伸,注定是会早于我们一步,提前触达安全的真相。

    通用技术与人类发展

    技术是人类自身能力的延伸,发明技术是人类最大的天赋。早在现代智人出现之前,早期的原始人就发明了各种技术,使得他们在与其他动物的生物竞争中更占优势。而在人类历史进程中,生产力和经济水平的一次次跃迁,背后的核心推动力是一代又一代通用技术(GPTs General Purpose Technologies)的发明。通用技术通过对已有经济结构和社会结构的影响,彻底影响着人类的发展进程。

    通用技术是单一可识别的基础性共性技术,目前为止人类历史上只有二十来种技术可被归类为通用技术,这些技术具有如下几个特点:

    • 「无处不在」通用技术有着各种各样的使用用途以及大量广泛的使用场景;
    • 「持续改进」随着时间的推移,通用技术不断在改进使用成本也不断降低;
    • 「驱动创新」通用技术使技术创新和技术发明更加容易,催生更多新产品。

    从新石器时代农业革命,对动植物的驯化技术、文字书写技术,到18-19世纪第一次工业革命,蒸汽引擎技术、工厂系统、铁路系统……,到第二次工业革命,内燃机技术、电力技术、汽车技术、飞机技术……,再到20世纪信息革命,计算机、互联网、生物科技等。通用技术的发明间隔时间越来越短、密集程度越来越高、影响范围也越来越大、生产力的提升也越来越快。

    同一时代各种通用技术之间的技术衔接产生的协同效应,更是对生产力提升、经济发展、促进创新起到了叠加推动的作用。蒸汽时代,蒸汽引擎提供动力能源,铁路网连接各个物理空间传输钢铁等物资,应用到各种机器系统。电气时代,中央电站提供电力能源,电力网连接各个物理空间传输电流,应用到各类电气系统。

    信息时代,个人电脑(或服务器)提供计算能力,互联网连接传输数据,连接各个数字空间的信息系统。而在智能时代,通用计算(云边端等各类计算形态)提供计算能力,物理空间和数字空间的边界会越来越模糊形成融合空间,万物互联网连接融合空间中的各个智能系统。不同的时代,通用技术之间有着相似的协同方式。蒸汽时代给机器以动能,电力时代给机器以电能,信息时代给机器以数据,智能时代给机器以知识。

    机器智能的历史发展

    在所有通用技术中,机器智能又是最为特殊的一种通用技术,这是人类第一次发明让机器能自主获取知识的技术,也是人类第一次有能力打造非碳基体系的智能体。

    1882年2月一个寒冷的下午,年轻的尼古拉·特斯拉完成了困扰其5年的交流电发电机设想,欣喜若狂地感叹道「从此之后人类不再是重体力劳动的奴役,我的机器将解放他们,全世界都将如此」。

    1936年,为证明数学中存在不可判定命题,24岁的艾伦·图灵提出「图灵机」的设想,1948年在论文《 INTELLIGENT MACHINERY》中描绘了联结主义的大部分内容,紧接着在1950年发表《COMPUTING MACHINERY AND INTELLIGENCE》,提出了著名的「图灵测试」。同年,马文·明斯基与其同学邓恩·埃德蒙建造了世界上第一台神经网络计算机。

    1955年冯·诺伊曼接受了耶鲁大学西里曼讲座的邀请,讲稿内容后来汇总成书《THECOMPUTER AND THE BRAIN》。1956年,约翰·麦卡锡在达茅斯学院夏季学术研讨会上首次提出了「Aritificial Intelligene」的概念。至此,机器智能的历史序幕正式拉开,符号主义(Symbolism)、联结主义(Connectionism)、行为主义(Actionism)三大流派相继形成。

    机器智能发展至今,经历了几次浪潮和寒冬,三大主义也各自起起落落。50年代起,以专家系统、经典机器学习为代表的符号主义长期占据统治地位。相比之下联结主义则历经了一波三折,从感知机的提出到80年代反向传播的发表,再到深度学习借助算力与数据大获成功,到2018年三巨头Geoffrey Hinton、Yann LeCun、Yoshua Bengio获得图灵奖,最后才变得炙手可热。而以强化学习为代表的行为主义在2016年AlphaGo、AlphaZero的横空出世之后大获关注,更是被誉为通向通用机器智能的必经之路。

    人类智能的演化经历了上百万年,机器智能演化迄今为止也才六十余年。尽管通用机器智能依旧还很遥远,但今天机器智能在很多领域已经逐渐超过了人类智能。过去这六十年,数据计算能力、数据存储能力、数据传输能力都至少提升了1000万倍。同时数据资源的增长速度,更是远远超过摩尔定律增长的速度,预计到2020年全球数据总量能达到40ZB。机器智能今天已经到达通用技术爆炸的一个关键节点,同时在其他通用技术的协同作用下,这一次通用技术引发的变革会比以往任何一次都来得更剧烈。

    数据驱动到智能驱动

    「商业智能与智能商业」、「安全智能与智能安全」……类似这样的词还有很多,二者之间核心的区别前者是单点的智能,后者是全局的智能,前者是基于数据驱动,而后者是基于智能驱动。「数据驱动」与「智能驱动」看似相似但却有着根本性的区别,最本质的不同是背后决策主体的不同。「数据驱动」最终还是依赖人类来做决策,数据只是提供了能够做出更好决策的辅助判断信息,而「智能驱动」则是机器取代人类直接做在线决策。

    人类大脑受认知偏见的影响一直是生命进化的结果。受限于人脑信息传输带宽和信息处理速度的限制,从早期狩猎者阶段开始,人类就逐步形成了基于简单启发式的推理决策系统,规避了处理大量信息的高额成本。这使得人类在处于各种危险的环境时能够快速、几乎无意识地做出决策,文明才得以延续至今。然而,快速和几乎无意识的决策并非意味着总是最佳甚至是准确的决策。

    启发式的方法通过遗传,成为刻入我们大脑中预先加载的认知偏差,这些「偏见」以偏离理性客观的方式影响人类的决策。直到「数据驱动」时代的来临,丰富海量的在线数据为更好的决策提供了辅助判断的依据。我们用通用计算、海量数据处理技术,将数据量减少到人脑可消化的摘要范围之内,用于各种应用场景下的辅助决策。

    「数据驱动」相比以往基于「直觉驱动」或「经验驱动」有着无法比拟的优势,但人类在这其中仍然扮演着「中央处理器」的决策主体,这依然存在着局限性。人脑处理器的吞吐量限制,无法处理全量原始数据,只能将全量数据资源变为「汇总数据」或「摘要数据」,进而再从其中提取知识。这个过程注定是伴随着信息量的损失,从而会丢掉全量数据中的部分隐含关系、数据模式以及数据背后的洞察。

    「智能驱动」是让机器智能直接做线上决策,无论是决策效率、规模程度、客观程度还是进化成长速度,都是「数据驱动」所无法比拟的。「智能驱动」是直接从全量数据资源中提取全量知识,然后运用全量知识直接进行全局决策。「数据驱动」本质上是汇总数据加人类智能,「智能驱动」的本质则是全量数据加机器智能。

    然而现实的现状是在业务场景中我们大量的决策连「数据驱动」都还没做到,更谈不上「智能驱动」。机器智能实现「感知」只是第一步,实现「决策」则是更为关键的一步,现阶段的机器智能正如丘吉尔的一句话「Now this is not the end, it is not even the beginning of the end.But it is perhaps the end of beginning」。那么,到底什么才是真正的机器智能系统?

    智能系统的核心范式

    真正意义上的智能系统,实例的核心范式一定有如下几个组成部分:感知体系、认知体系、决策体系、行动体系。同时,一个智能系统的实例,一定离不开与环境的交互,过去我们总是过多的强调和关注系统内在本身,却容易忽视与环境交互的作用。

    感知体系的作用是对环境进行观测和沉淀,产出的是数据。一切数据的产生都源于对环境的观测和沉淀,观测和沉淀背后的动机是我们测量、记录、分析世界的渴望。信息时时刻刻存在于环境中(数字空间或物理空间),在不同的场景下,我们用硬件、软件、算法的方式,将其「数据化」。硬件有如传感器、摄像头等,软件如日志记录器、数据采集器等,算法如各类智能视觉算法、智能语音算法等。终有一天,我们能够将一切物理空间都数据化,将物理空间完完全全映射到数据空间。

    认知体系的作用是对数据进行归纳和总结,提炼出知识。人类理解的知识一定是要用自然语言表达,而对机器而言,用能够代表问题空间的数据集进行训练,再用训练好的「模型」来在新的数据空间中进行推理。只要是能解决特定目标任务,无论其表现形态是向量、图谱还是自然语言,其实都是知识,特征空间的表达本身就是一种知识。

    决策体系的作用是对目标任务进行规划和决策,生成对目标任务的策略。行动体系根据策略执行具体动作,和环境进行交互、对环境产生影响。动作作用于环境后形成反馈,反馈又促进感知体系感知更多的数据,进而持续获取更多的知识,对目标任务作出更好的决策,形成闭环持续迭代进化。

    从这个角度来看,机器智能的本质,实质是一种观测环境沉淀数据、归纳数据提炼知识、规划目标在线决策、作出行动影响环境的自主机器。机器智能是一种自主机器,而自主机器与过去自动化机器的最大区别在于其能否自主获取解决目标任务的知识。

    单体智能到群体智能

    今天大多数的智能系统,都是一个个孤立分布的单体智能实例,解决的相应也是一个个孤立分布的单体问题。云计算的本质是「计算在线」,大数据的本质是「数据在线」,而机器智能最终也需要实现让智能在线,让智能实例之间进行自主在线交互。

    单个智能实例都是由「感知-认知-决策-行动」的体系构成的自主系统,有着自己的世界表征形式,能自主完成自身的目标任务。在同一个动态复杂的博弈环境之中,实例与实例之间通过互联实现在线,彼此存在相互作用,可以合作、竞争,可以竞合并存,也可以既不合作也不竞争。一个实例的策略变化不光会影响自身的环境,也会影响其他实例的策略变化。

    对于合作的多个智能实例之间,可以选择共享数据、知识、策略或动作,协调协作以完成更为复杂的目标任务,共同形成更为高阶的智能实例。当单位空间内智能实例的覆盖密度足够大的时候,单体智能开始向群体智能演进。

    智能与安全的四象限

    安全是所有技术中最为特殊的一种,严格意义上甚至或许都不能称「安全」为一门技术。早在人类还未发明任何技术之前,安全就已经伴随着人类的各种活动。迄今为止,没有任何一种技术是安全领域独有或者说从安全领域长出来的,但安全从来都是与其他技术相伴相生、相辅相成。

    任何一门通用技术,与安全的结合都有如下四种方式。机器智能技术也不例外,纵向是「给智能以安全」和「给安全以智能」,横向是「攻击视角」和「防御视角」。给智能以安全,是指机器智能技术本身会带来新的安全问题,一种是机器智能自身脆弱性导致的安全问题,一种是机器智能引发周边场景衍生出的安全问题。给安全以智能,是指将机器智能应用于安全场景,攻击者利用机器智能赋能攻击,防御者利用机器智能赋能防御。

    而在这四个象限中,新技术与安全发生交集的时间和发展的成熟程度又有所不同。攻击者相比防御者而言,有更强的动机和利益,所以攻击相关的象限通常都会更容易去探索新技术去接纳新技术。防御者总是滞后,也总是容易沉迷于旧技术和人工经验营造出的安全假象中,导致第四象限总是发展最滞后最缓慢的一个象限。当然,这与防御视角自身的属性与困境也有直接关系。

    机器智能的安全之困

    围棋是简单的复杂游戏,而安全是复杂的简单游戏。1994年,认知科学家Steven Pinker在《The Language Instinct》中写道「对机器智能而言,困难的问题是易解的,简单的问题是难解的」。「简单的复杂问题」指的是问题空间是闭合的,但是问题本身却又有较高的复杂度,「复杂的简单问题」指的是问题空间是是无限开放式的,但问题本身却并没有很高的复杂度。今天机器智能技术在「简单的复杂问题」的领域,往往都比人类会更强,但对于「复杂的简单问题」,泛化界限引起的维数灾难,机器智能往往都会失效。

     

    安全是一个典型的「复杂的简单问题」,莫拉维克悖论在安全领域更为明显。高度不确定性是安全最大的特点,安全自身最大的困境就是如何去应对「未知的未知」。很多时候我们问题都没定义清楚问题就冲上去说要用机器智能解决问题,这是绝大多数机器智能在安全领域失效的主要原因。今天在安全领域,不太需要去突破智能技术的天花板,亟待解决的反而是「定义清楚问题」,即如何闭合掉问题空间。

    安全的问题空间通常都是无界的,同时问题空间对应的正负样本的样本空间却又严重的不对称。「未知的未知」引起的负向数据(如攻击数据、风险数据等)的严重缺乏导致特征空间的不对称,进而导致特征空间无法真正表征问题空间。「模型」是已有数据空间下关于世界的假设,并且用于在新的数据空间下进行推理。今天机器智能技术已经能很好的解决表示输入和输出之间的非线性复杂关系,但对于样本空间与问题空间存在的巨大鸿沟却依然比较乏力。

    20世纪六十年代,贝尔-拉帕杜拉安全模型(Bell-La Padula )指出「当仅当系统开始于安全的状态,且一直不会落入非安全状态,它才是安全的」。由于安全的本质是对抗,对抗的存在导致安全领域的机器智能模型多数都逃不过的「上线即衰减」的命运。在训练集上表现良好的模型,对于大规模的现实环境,从上线那一刻起就在引起对抗升级,进而不断跌入失效的状态。模型衰减和封闭系统中的熵增一样,是一个必然。

    同时,安全场景中对检测结果的准确性、结果可解释性都高度敏感。机器智能相比于传统安全中经常使用的基于规则、基于策略的检测技术,优势在于其强大的表征能力,但同时其不可解释性、模糊性导致推理结果在决策场景下无法直接使用,这也是今天很多智能安全系统大都只在做「感知」,至多也只是做辅助决策的原因。

    然而这些都还不是最大的「困」,机器智能在安全领域最大的「困」是思维模式上的困局。安全的思维模式是「守正出奇」,而机器智能的思维模式是「Model The World」。这两种思维模式之间不仅存在巨大的差异,也异常难调和。一方面极少有人能同时驾驭这两种思维方式,另一方面把两种思维的人放到一起也极难协作起来,本质原因是缺少桥梁来衔接安全问题到算法问题之间的相互转换和定义。

    问题空间之困、样本空间之困、推理结果之困、对抗衰减之困、思维模式之困,这些问题导致了今天绝大多数现实中的智能安全系统的表现都差强人意。或者也可以说得更悲观一点,今天在安全领域,迄今为止还没有真正意义的智能安全系统。

    真正的智能安全系统

    先来说说通用安全场景下的通用数据范式。柏拉图学派认为「我们感知的世界是洞穴里面墙壁上的投影」,现象世界都是理性世界的倒影,理性世界才是世界的本质或本原。「洞穴比喻」意味着存在一个外在的客观的知识体系,不依赖人类的认知而存在,人类探索知识的过程就是不断从现实世界的现象观察中,摸索、推测这个客观知识体系的过程。亚里士多德进一步奠定了本体论最初的思想,定义其为研究「存在」的科学,是形而上学的基本分支。再到17世纪,哲学家郭克兰纽 (R. Goclenius) 首次提出「Ontology」一词,再到20世纪60年代,机器智能领域开始引入Ontology的思想,之后又进一步演化出语义网、知识图谱等。

    安全中的对抗本质是知识的对抗,获取知识更多的一方就能拥有更多的不对称优势。无论是威胁分析、情报研判、攻击检测、事件溯源……本质都是在探索知识的一个过程,这就是为什么Palantir的Gotham、IBM的I2、UEBA、各种威胁情报产品等等背后都不约而同或多或少借鉴了Ontology思想的根本原因。

     

    而安全场景下的通用数据范式,也离不开Ontology。实体、属性、行为、事件、关系,通过这五大元数据类型,可以构建出所有安全场景中的数据架构(无论是基础安全、业务安全、数据安全、公共安全、城市安全……注:公共安全领域也单独关注「轨迹」这一类元数据类型,因「轨迹」是一种特殊的「行为」数据,故这里统一都合并成行为)。

    • 实体:实体是客观存在并可以与其他对象区分开来的对象;
    • 属性:属性即为标签,是描述实体的表述,对实体抽象方面的刻画;
    • 行为:行为是实体在特定时间、空间下发出的动作;
    • 事件:事件是一定时空或条件下所认识到的可识别的事情;
    • 关系:关系是实体与其他实体之间的关联程度与表述。

    安全领域绝大多数沉淀的源数据都是行为类数据,无论是网络流量日志、主机命令日志、业务日志、摄像头数据流、感知设备数据流……,这些都是行为数据。而实体、属性、关系、事件的产生都是从行为数据中进行萃取,通过对不同的行为数据运行不同的 Function 来产生。

    当 Function 是生成事件的时候,即为安全检测问题,包括攻击检测、威胁检测、风险检测、异常检测等等。绝大多数安全检测问题的原子范式都可以抽象为Y=F(X),其中X是实体的行为数据,Y是检测结果,F是检测模型。F可以是基于规则、基于策略、词法语义、统计检测、机器学习、深度神经网络等等,Y可以是正常、异常、攻击或者未知。

    更为复杂的检测场景也都可以通过一个个基本F与各类算子组装编排而成。每一种类型的F都有其优势和劣势,有不同的最优使用场景,并不存在一种绝对先进绝对领先的检测技术。事实上算法在安全检测中最应该关注的不是去做检测模型本身,而是能否自主化的根据各种场景生成最优的检测模型,并能自主化持续迭代检测模型。

    真正意义上的智能安全系统一定也是具备感知体系、认知体系、决策体系和行动体系,同时和环境形成反馈闭环。感知体系至少包括异常感知器、攻击感知器、漏报感知器和误报感知器。「异常感知器」的作用一方面是保持感知「未知的未知」的能力,另一方面是利用「通过定义正常来寻找异常」的思想来解「样本空间之困」的问题。「攻击感知器」的作用是在异常数据的基础上去检测攻击,为了解「推理结果之困」的同时,也大大缩减推理结果误报漏报范围。「漏报感知器」和「误报感知器」是为了去解「对抗衰减之困」。由此可以看出,整个行业内大家最常关注的「用算法做攻击检测」,其实只是做了智能系统当中感知体系里很小的一小步。

    认知体系沉淀的是跟安全相关的各种知识,至少包括正常知识、攻击知识、漏报知识、误报知识。安全知识可以是基于专家规则、向量、模型、图谱、自然语言等等,但无论是哪种形态,一定都是精细化个性化的「千人千面」的知识。即对每一个受保护对象(如用户、系统、资产、域名、数据等),沉淀形成适用于该受保护对象的一套感知异常、攻击、漏报、误报的知识。决策体系当中至少包含对目标任务的拦截策略、各类模型的上线下线等策略等,能自主决策哪些行为该拦截,哪些模型已经衰减该重训练该替换等。

    行动体系当中是各类作用于环境的动作,如放行、阻断、重训练、发布等等。一个真正的智能安全 instance 里面包了含成千上万的 agent ,每一个 agent 只作用于其对应的受保护对象。最后,「问题空间之困」的解法是将开放的问题空间收敛为一个个小的闭合的风险场景,一方面靠的是四个感知器的级连形成的纵深检测,另一方面靠的就是「千人千面」的 agent 。

    机器智能重塑新安全

    安全领域发展至今,一直处于问题消灭得少概念却造得不少的阶段,亟待利用新技术去真正解决旧问题。机器智能在各个行业的炙手可热,同样也引起了安全行业的追捧。但今天安全领域的智能能力参差不一的同时,又难以分辨其真假。以至于但凡用了一丁点算法的,都会宣称「基于人工智能的XX安全系统」。同早年的智能驾驶领域一样,今天的智能安全也亟需统一的分级标准,用以明确不同级别智能安全技术之间的差异性。「安全的本质是智能体的对抗」,故根据自主对抗的程度,我们将智能安全划分为L0~5共如下6个级别:

    • L0级别为「人工对抗」,即完全没有任何机器智能的能力,完全由防御者人工雨攻击者进行对抗,对抗操作、感知判断、任务支援全都由人工进行。
    • L1级别为「辅助对抗」,由机器完成已知攻击的攻击检测和攻击防御,其余的操作(如感知未知威胁、感知漏报、感知误报等)由人类进行。
    • L2级别为「低度自主对抗」,由机器完成已知攻击攻击检测和攻击防御,并具备能感知未知威胁或误报漏报,其余由人类操作。
    • L3级别为「中度自主对抗」,由机器完成所有的对抗操作(攻击检测、攻击防御、主动感知未知威胁、误报漏报主动感知、对抗升级自动学习),根据系统要求,人类在适当的时候进行应答(中间过程必须需要人类参与)。
    • L4级别为「高度自主对抗」,由机器完成所有的对抗操作,根据系统要求,人类不一定提供所有的应答(中间过程非必须有人类参与),但只能作用于限定的特定的安全场景(如网络域、主机域等)。
    • L5级别为「完全自主对抗」,由机器完成所有的对抗操作,根据系统要求,人类不一定提供所有的应答,不限定特定的场景,作用于全域范围。

    不同于智能驾驶技术,不同的 Level 采用的是完全不同的技术栈,智能安全中的 L0~5 是需要逐步往上构建往上发展。按照这个划分,今天行业内绝大部份的安全系统都是L1 的系统,极少一部分能达到 L2,但还没有真正意义上的L3及以上的智能安全系统。随着级别往上走,能够将防御者从低水平对抗中逐步释放出来,能更加关注高级对抗,L3是个分水岭,有望在5年内实现。「始于围棋终于安全」,机器智能在安全领域的终局是什么?网络层、主机层、应用层、业务层、数据层都分别有各自的智能实例,不同层的实例在线互联,实现真正意义的协同防御与情报共享。当智能「Intelligence」和情报「Intelligence」融合的那一天,才是真正的「Intelligence Remodels New Security」。

    目前阿里云智能安全实验室正在多个领域打造L3级别的智能安全系统,致力于智能技术在云安全中的应用,现招聘安全算法专家和安全数据专家,寻志同道合者一起探索打造「智能重塑新安全」。目前在不到一年的时间,已经取得了一定的阶段性成果:

    • LTD 攻击检测算法入选人工智能顶会 IJCAI 2019「Locate Then Detect:Web Attack Detection viaAttention-Based Deep Neural Networks」;
    • WAF AI 内核助力阿里云 WAF 入选 2019 Gartner Web 应用防火墙魔力象限,算法能力被评为强势;
    • Anti-Bot AI 内核助力阿里云爬虫风险管理入选 2018Forrester Bot Management 竞争者象限;
    • 内容安全算法助力阿里云在国家级重保活动中平稳度过,无任何风险外漏;
    • 上线[XDATA]安全数据内核、[XID]核心数据资产、[XService]智能安全服务、[弦+]安全知识引擎等一系列安全数据平台服务产品,上线百亿级节点千亿级边的复杂网络和图计算应用;上线QPS千万级的复杂流计算应用。


    原文链接
    本文为云栖社区原创内容,未经允许不得转载。

    展开全文
  • 如何度过平淡生活

    2020-05-17 13:23:15
    抚问自己的内心,我的生活是那么平淡,平淡到我总想溅起些水花 我如何能在对抗这平淡的生活 有的人为了对抗平淡,四处旅游,学习新事物,结交新朋友,我也如此,更多时候是三分钟热度。 极端的例子,如有人用毒品来...

    这段时间有个讲法律的罗教授很火,看了他一段视频,他引用一个名人的话说,我们一生都是为了超越精神。
    他说,我们总是在努力对抗着平淡。平淡是多么可怕啊,就像爱情中,大家的阻扰可能让两个人靠的更近,可是平淡的生活却将两人分开。
    抚问自己的内心,我的生活是那么平淡,平淡到我总想溅起些水花
    我如何能在对抗这平淡的生活
    有的人为了对抗平淡,四处旅游,学习新事物,结交新朋友,我也如此,更多时候是三分钟热度。
    极端的例子,如有人用毒品来对抗平淡,但兴奋过后却是更加的空虚,
    正如百年孤独中所说,生命中一切的绚烂,都将由寂寞来偿还。
    我该如何对抗这平淡的生活
    刘慈欣的球状闪电中说,度过美妙一生的秘密在于你能迷恋上什么
    哪我到底爱什么
    三年前,假如你问我,我爱编程吗
    我会说不爱
    现在你问我,我会说
    有点爱了,我开始能看出代码的优雅与丑陋,我开始想用代码创造点什么
    就像马克思说的,我们要去改造世界
    哪到了刘慈欣所说的迷恋程度了吗,显然没有
    那我有迷恋的东西吗
    目前没有
    我喜欢打羽毛球,游泳,听音乐,喝茶,看书
    但是这都不是迷恋
    这可能是个没有答案的问题

    展开全文
  • 读研困惑

    2015-09-13 20:38:52
    一场内心焦灼与坚定的思想对抗,一次浴火重生与破罐子破摔的人生抉择,一个信念坚定与迷茫挣扎的斗争,太多次的遭受心灵的拷问,太多次的失败与逃避,在过完24岁生日后,我想要选择涅槃重生,我想要自己的坚定的目标...
  • 和老总之间对话

    2016-02-18 21:09:00
    当时这种恐惧感是多么可怕,我意识到,我身体已经达到了极限,无法再跟自己对抗了。我现在更愿意听从自己内心,跟X总倾诉一下埋在我心底声音。既然是我内心的声音,转弯抹角只会让自己更加难受,请X...
  • 三分钟热度,时常憎恶自己的不争气坚持最多的事情就是坚持不下去。对感情抱有渴望,又疲于用心追寻与经营。对曾经的珍视点到即止,直到渐渐松手,淡漠又疏离。尚未拥有百毒不侵的内心,却提前丧失了热泪盈眶的能力。...
  • 我见过的最不求上进的人,既不是学霸又不全算学渣。他们课听的迷迷糊糊,作业做一些抄一些。想逃课又心存顾忌,行为也不公开对抗规范纪律。...尚未拥有百毒不侵的内心,却提前丧失了热泪盈眶的能力...
  • 不是没有摘金夺银,不是没有鲜花掌声,只是内心的震撼超过了那分欣喜,只是向往的理念,走进了自己的生活。参加第一届亚太地区“VEX机器人工程挑战赛”夺得金银双奖应该浓墨重彩,但参赛经历给我更多的是思考与启迪...
  •  昨日开始跟从文升兰老师,习练太极拳,短短...这就像坐禅一样,虽然我们不必真的要禅定35天,只要我们每天禅定35分钟,想想我们自己的人生,这都是内心自我真正的交流。 对于太极还是一个太幼稚的学生,不
  • 如果这不是你内心的声音你就应该学会和自己对抗,不要憋着不说,不问,不理,也试着让自己勇于接受自己的另一面随性的一面,洒脱的一面,开朗的一面,相处交往当中降低给对方的压力,轻松、舒适的沟通环境是爱情成长...
  • 自己感觉好像是具有了某种天赋一样,可以轻松的解决他们认为的所有难题,并且一切都会迎刃而解,可能这是一种心理效应,也是一种对自己的督促,现在的我回想起当初时自己那颗强大的内心,再看现在追求安逸的自己,...
  • 作德,心逸日休赵旭

    2020-06-19 09:31:32
    虚伪的人不能表里如一的根本原因是内在气虚,致使对自己的修为力不从心,更不能做到心甘情愿的学习以修正自己的行为。 内虚的人以应付、对抗、走捷径的态度生活,其心越来越懒,也越来越没有智慧,却还装作有智慧的...
  • 歼十出击观后感5篇 我们永记歼十飞行员的精神,树立远大的志向,努力学习,为祖国的建设贡献出自己的一份力量。这里给大家整理了一些有关歼十出击的观后感,希望对大家有所帮助. 歼十出击观后感1 在暑假,我看了...
  • 很懒,没办法

    2019-03-25 12:31:00
    你见过最不求上进的是什么样子?我见过的最不求上进的人,既不是学霸又不全算学渣。他们课听的迷迷糊糊,作业做一些抄一些。想逃课又心存顾忌,行为也不公开对抗...尚未拥有百毒不侵的内心,却提前丧失了热泪盈眶的能...
  • 经历过H5接入echart 需求后,同时小程序端...只有在面临bug和上线一番对抗内心挣扎之后,才会理解经验是多么宝贵。 本地下载 ec-canvas 文件过大(超过500k),微信开发者工具无法编译上传问题 按照官网指...
  • 希望会变得好一点~

    2017-03-05 10:27:00
    三分钟热度,时常憎恶自己的不争气,坚持最多的事情就是坚持不下去。 对感情抱有渴望,又疲于用心追寻与经营。 对曾经的珍视点到即止,直到渐渐松手,淡漠又疏离。 尚未拥有百毒不侵的内心,却提前丧失了热泪盈眶...
  • pytorch多GPU数据并行模式 踩坑指南

    万次阅读 多人点赞 2019-02-17 21:55:44
    之前用pytorch尝试写了个文本生成对抗模型seqGAN,相关博文在这里。...为了和大家共同进步,我把自己的经验分享一下,欢迎一起来踩坑。 首先说明,我用的pytorch版本虽然不是嘎嘣新的1.0,但是是稳定版本...
  • 信心

    2010-10-28 11:27:00
     大自信力量还没有达到与恶习对抗,以及与命运对抗的程度时,只好自卑。 2.  自卑,常常是自我保护很好方式,它会使心平静下来,也能免去很多麻烦。  但自卑总有一天会惹恼你自己。...
  • 漫谈产品经理和项目经理

    千次阅读 2012-10-09 15:23:15
    漫谈产品经理和项目经理 ...经常自己自己对抗,我想给产品加点东西,就会受到内心原先规划抵制。因为我原来计划里没有这个新加功能点,如果加了,那么我无法交付软件。很多时候,产品无法如期上线,很多
  • 后勤会议有感

    热门讨论 2019-08-05 16:35:29
    1.关于打扫卫生这个问题,纪老师有跟我们提过很多次了,其实我都知道这些道理,但是不知道为什么就是不是那么愿意去做,在我的内心深处,还是自己的面子比较更重要一些,而所谓的这个面子,具体定义的是什么,对于我...
  • 如何把事情做到最好读书笔记6

    千次阅读 2015-05-04 19:32:53
    第三部分:把事情做到最好高效方法 如何应对改变艰难 当你感到退步时,请挺住。突然有一天你觉得自己退步了。为什么会这样呢?...内稳系统使命是尽可能维持原样,对抗改变,无论原样是好是
  • 开始记日记

    2016-07-24 21:23:57
    加之今天在知乎上看了一篇帖子,讨论“如何对抗内心无处不在疲惫感”,有几个回答深感赞同。想想自己从大学毕业以后,就再也找不到努力那种感觉了,加上身边没有父母、恋人、儿女陪伴,孑然一身,生活
  • 我是90后演讲稿.doc

    2021-01-15 11:16:16
    我是90后演讲稿 90后 折纸时代 每个人心中都勾画着属于自己的一份蓝图,每个人都小心呵护着这份泡沫般易碎的梦想。 80后一直说我们是一群狂傲的孩子。孩子又怎么样?孩子不是挺好。今天为了你抢了我的玩具吵得老死不...

空空如也

空空如也

1 2
收藏数 26
精华内容 10
关键字:

对抗自己的内心