精华内容
下载资源
问答
  • 基于机器学习的安全数据集

    万次阅读 多人点赞 2020-09-07 15:28:39
    为了更好的帮助大家从事安全领域机器学习和深度学习(AI+安全)相关的研究,这篇文章将分享安全相关的数据集供大家下载和实验,包括恶意URL、流量分析、域名检测、恶意软件、图像分类、垃圾邮件等,也欢迎大家留言...

    为了更好的帮助大家从事安全领域机器学习和深度学习(AI+安全)相关的研究,这篇文章将分享安全相关的数据集供大家下载和实验,包括恶意URL、流量分析、域名检测、恶意软件、图像分类、垃圾邮件等,也欢迎大家留言推荐数据集供我补充。

    这是作者的系列网络安全自学教程,主要是关于网安工具和实践操作的在线笔记,特分享出来与博友共勉,希望您们喜欢。同时,最近作者开了一个公众号“娜璋AI安全之家”,欢迎大家关注,作者将专注于Python和安全技术,主要分享Web渗透、系统安全、CVE复现、威胁情报分析、人工智能、大数据分析、恶意代码检测等文章。真心想把自己近十年的所学所做所感分享出来,与大家一起进步。

    在这里插入图片描述


    作者百度网盘分享地址:



    KDD CUP 99

    KDD CUP 99 dataset 是KDD竞赛在1999年举行时采用的数据集。1998年美国国防部高级规划署(DARPA)在MIT林肯实验室进行了一项入侵检测评估项目收集而来的数据,其竞争任务是建立一个网络入侵检测器,这是一种能够区分称为入侵或攻击的“不良”连接和“良好”的正常连接的预测模型。该数据集包含一组要审核的标准数据,其中包括在军事网络环境中模拟的多种入侵。

    在这里插入图片描述


    数据文件包括:

    kddcup.names 功能列表。
    kddcup.data.gz 完整数据集(18M; 743M未压缩)
    kddcup.data_10_percent.gz 10%的数据集(2.1M; 75M未压缩)
    kddcup.newtestdata_10_percent_unlabeled.gz(1.4M; 45M未压缩)
    kddcup.testdata.unlabeled.gz (11.2M; 430M未压缩)
    kddcup.testdata.unlabeled_10_percent.gz (1.4M; 45M未压缩)
    corrected.gz 正确标签的测试数据
    training_attack_types 入侵类型列表
    typo-correction.txt 关于数据集中的简要说明 
    

    在这里插入图片描述

    推荐文章:基于机器学习的入侵检测和攻击识别——以KDD CUP99数据集为例



    HTTP DATASET CSIC 2010

    HTTP DATASET CSIC 2010 包含已经标注过的针对Web服务的请求。该数据集由西班牙最高科研理事会 CSIC 在论文 Application of the Generic Feature Selection Measure in Detection of Web Attacks 中作为附件给出的,是一个电子商务网站的访问日志,包含 36000 个正常请求和 25000 多个攻击请求。异常请求样本中包含 SQL 注入、文件遍历、CRLF 注入、XSS、SSI 等攻击样本。其中,下载地址已经为我们分类好了训练用的正常数据,测试用的正常数据,测试用的异常数据。

    在这里插入图片描述

    在这里插入图片描述

    推荐文章:



    honeypot.json

    honeypot 是由多种类型的蜜罐采集回来的数据,主要是WEB请求,约99万条数据。由于没有分类和规整,需要自己数据清洗,也可以用作校验模型的数据。

    在这里插入图片描述



    Masquerading User Data

    Masquerading User Data 是Matthias Schonlau 教授通过正常数据构造出来用于训练和检测 Masquerading User攻击的数据集。内部攻击者分为两种,一种是内鬼[Traitor],一种是窃取了身份凭证的正常用户的伪装者[Masquerading User]。由于是构造出来的数据,缺乏实际攻击的真实性,在一定程度上,训练出来的模型会存在一定的过拟。

    在这里插入图片描述



    ADFA IDS Datasets

    ADFA IDS Datasets 是澳大利亚国防大学发布的一套关于HIDS的数据集。分为linux(ADFA-LD)和window(ADFA-WD)。

    在这里插入图片描述



    域名相关

    DGA 正常域名和可疑域名检测,主要用于DGA的检测。这里直接用Alexa Top 100W 作为正常域名,用其他的开放的DGA数据作为黑样本。

    在这里插入图片描述



    Webshell

    Webshell数据集 是github有一个比较多样本的收集,涵盖了很多的语言。

    在这里插入图片描述

    在这里插入图片描述



    登录日志

    auth.log 主要是都是登录失败的日志 适合用作判断是爆破登录还是正常的输错密码

    在这里插入图片描述



    恶意URL

    在这里插入图片描述

    推荐作者文章:基于机器学习的恶意请求识别及安全领域中的机器学习



    综合安全数据

    在github上有一个叫 Security-Data-Analysis 的项目,里面有4个实验室,每个实验室的数据都不一样,包含http、连接记录、域名、host等等。

    在这里插入图片描述



    The Malware Capture Facility Project

    MCFP 是捷克理工大学用于捕抓恶意软件的而抓去的网络流量,里面的数据非常多,有他们自己分析出来的恶意流量,也有所有的流量,包括网络文件、日志、DNS请求等。



    恶意软件数据库

    MalwareDB 包含了恶意软件列表 hash检测结果,所属域名等数据。

    在这里插入图片描述

    在这里插入图片描述



    APT攻击数据集

    非常棒的两个数据集,APT样本HASH值和APT报告。

    • https://github.com/RedDrip7/APT_Digital_Weapon
    • https://github.com/kbandla/APTnotes

    下载推荐:

    在这里插入图片描述



    图像分类数据集-1000

    Sort_1000pics数据集 包含了1000张图片,总共分为10大类,分别是人(第0类)、沙滩(第1类)、建筑(第2类)、大卡车(第3类)、恐龙(第4类)、大象(第5类)、花朵(第6类)、马(第7类)、山峰(第8类)和食品(第9类),每类100张。

    • 内容类型:图像样本
    • 使用范围:图像分类、恶意家族分类
    • 推荐理由:个人感觉这是图像分类实验的基础,恶意样本转换灰度图进行恶意家族分类实验也都可以基于此实验拓展
    • 下载地址:https://github.com/eastmountyxz/ImageProcessing-Python
    • 数据示例:

    在这里插入图片描述

    通常会将所有各类图像按照对应的类标划分至“0”至“9”命名的文件夹中,如图所示,每个文件夹中均包含了100张图像,对应同一类别。

    在这里插入图片描述

    比如,文件夹名称为“6”中包含了100张花的图像,如下图所示。

    在这里插入图片描述

    推荐作者文章:图像分类原理及基于KNN、朴素贝叶斯算法的图像分类案例



    MNIST-手写数字

    MNIST数据集 是手写体识别数据集,也是入门级的计算机视觉数据集。MNIST图片数据集包含了大量的数字手写体图片,如下图所示,我们可以尝试用它进行分类实验。该数据集共包含三部分:

    • 训练数据集:55,000个样本,mnist.train
    • 测试数据集:10,000个样本,mnist.test
    • 验证数据集:5,000个样本,mnist.validation

    在这里插入图片描述

    MNIST数据集中的一个样本数据包含两部分内容:手写体图片和对应的label。这里我们用xs和ys分别代表图片和对应的label,训练数据集和测试数据集都有xs和ys,使用mnist.train.images和mnist.train.labels表示训练数据集中图片数据和对应的label数据。如下图所示,它表示由28x28的像素点矩阵组成的一张图片,这里的数字784(28x28)如果放在我们的神经网络中,它就是x输入的大小,其对应的矩阵如下图所示,类标label为1。

    在这里插入图片描述



    垃圾邮件数据集

    SpamBase数据集 入门级垃圾邮件分类训练集,其包含57个属性和4601个实例,该数据集主要用于垃圾邮件的识别分类,其中垃圾邮件的资源均来自于邮件管理员和提交垃圾邮件的个人,其可被用于构建垃圾邮件过滤器。该数据集由惠普实验室于1999年7月发布,主要发布人有Mark Hopkins、Erik Reeber、George Forman和Jaap Suermondt。另一个垃圾邮件数据集是 Enron

    在这里插入图片描述



    自然灾害数据集

    xBD数据集 是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像的规模最大、质量最高的公共数据集之一。该数据集包含22068张图像,均是1024x1024的高分辨率卫星遥感图像,标记有19种不同的事件,包括地震、洪水、野火、火山爆发和车祸等。这些图像包括了灾前、灾后图像,图像可用于构建定位和损伤评估这两项任务。

    • 发布机构:麻省理工学院
    • 内容类型:图像样本
    • 数据大小:31.2GB
    • 使用范围:图像分类、自然灾害识别
    • 推荐理由:个人感觉该数据集对于对抗样本、AI和安全结合的案例有帮助
    • 下载地址:https://hyper.ai/datasets/13272
    • 相关论文:《Building Disaster Damage Assessment in Satellite Imagery with Multi-Temporal Fusion》(《具有多时相融合的卫星影像中的建筑物灾害破坏评估》)


    总结

    学习安全或深度学习数据集是第一步,可能很多同学会受到数据集的困扰,真心希望这些数据集对您有所帮助,也欢迎大家继续补充新的数据集。作者后续会整理这些年抓取的文本数据以开源,供大家进行文本挖掘或NLP研究。

    同时感觉自己要学习的知识好多,也有好多大神卧虎藏龙,开源分享。作为初学者,我和他们有很大差距,但不论之前是什么方向,是什么工作,是什么学历,我都会朝着这个目标去努力!有差距不可怕,我们需要的是去缩小差距,去战斗,况且这个学习的历程真的很美,AI和安全真的有意思,共勉~

    最后,真诚地感谢您关注“娜璋之家”公众号和CSDN博客,也希望我的文章能陪伴你成长,希望在技术路上不断前行。文章如果对你有帮助、有感悟,就是对我最好的回报,且看且珍惜!再次感谢您的关注,也请帮忙宣传下“娜璋之家”,哈哈~初来乍到,还请多多指教。

    在这里插入图片描述

    (By:Eastmount 2020-09-07 夜于武汉 https://blog.csdn.net/Eastmount )


    参考资料:
    [1] https://xz.aliyun.com/t/1879
    [2] https://blog.csdn.net/u011311291/article/details/79045675
    [3] https://hyper.ai/datasets/4949

    展开全文
  • 安全数据集和开源工具

    千次阅读 2018-07-12 14:48:22
    由于本人从事安全相关的行业的工作,接触到很多想用机器学习解决网络安全相关的问题,不可避免的需要用到很多安全... 安全数据集 对于安全数据集,已经有行业从业者不辞辛劳的总结的很完善了,这里给出两个我看到的...

        由于本人从事安全相关的行业的工作,接触到很多想用机器学习解决网络安全相关的问题,不可避免的需要用到很多安全相关的开源数据集和工具,这里记录一下本人自己用过并感觉不错的数据集和开源工具。当然,这可能只是安全领域数据集和开源工具极小的一部分,希望能起到抛砖引玉的目的吧,本人后续也会不断更新。

     1. 安全数据集

        对于安全数据集,已经有行业从业者不辞辛劳的总结的很完善了,这里给出两个我看到的汇总网址:

            网络安全中机器学习大合集

            SecRepo.com - Samples of Security Related Data

            安全联盟曝光台

       其中,对于“安全联盟的曝光台”,安全联盟是由知道创宇、腾讯等互联网企业于2012年发起的第三方公益组织,自成立以来,通过与12321举报中心、腾讯、搜狗、金山等上百家机构、企业合作,通过发动群众参与网络治理,安全联盟已建成国内最大的第三方网络安全数据共享交换平台,日平均共享数据4500万次,每日接收网民举报超5000条,截止目前已拥有超过8.9亿条恶意网址、电话数据。这些恶意数据被应用到搜索引擎、浏览器、IM、社交平台、路由器OS等互联网终端,每天为网民提供超过30亿次恶意风险提醒,极大程度地帮助网民远离网络诈骗。 

       这里面包罗万象,我第一次看到感觉如获至宝,感觉发现了一座金矿,紧接着又有点傻眼,这个金矿应该怎么挖?我的答案是当然是站在前人的肩膀上,多利用前辈们的智慧啦。个人建议买一本《Web安全之机器学习入门》并下载随书代码,这本书里面列举了用机器学习方法解决典型的各种网络安全问题,上面列举的很多数据集都可以用在这里面,能帮你迅速上手并判断是否有深入使用和研究的价值。当然更棒的是,这本书里也列举了一些网络安全领域的公开数据集,与上面汇总帖里的数据集互为补充,能为你在开始一个网络安全领域的机器学习项目提供快速的建模手段。

        说完汇总,我也列一下我在机器学习项目里使用过数据集:

        恶意url: http://www.sysnet.ucsd.edu/projects/url/
    An anonymized 120-day subset of our ICML-09 data set is available from the following links:

    僵尸网络DGA域名数据: http://osint.bambenekconsulting.com/feeds/dga-feed.txt
        恶意流量分析: http://malware-traffic-analysis.net/
        恶意软件分类数据:https://www.kaggle.com/c/malware-classification
    http://www.malshare.com/index.php

    2. 威胁情报

        当前安全领域高级持续威胁APT日益泛滥,威胁情报作为应对APT的重要手段也被越来越多的的安全厂商所重视,本人在github上发现了一个比较好的威胁情报资料汇总,网址是: https://github.com/hslatman/awesome-threat-intelligence

    3. 开源扫描器集合

    安全行业从业人员自研开源扫描器合集
    开源扫描仪的工具箱

    4. 开源软件集合

    Stratosphere Linux IPS (slips) 
    a behavioral-based intrusion detection and prevention system that uses machine learning algorithms to detect malicious behaviors.

    Learn2ban
    Open source machine learning DDOS detection tool

    malware-detection
    Experiments in malware detection and classification using machine learning techniques.

    Use of machine learning for anomaly detection in netflow data

    Botnet Detection using Machine Learning

    Fraud_Detector
    Fraud Detection using ensemble of Statistical, Network analysis and Machine learning approach.

    Intrusion Detection With Machine Learning

    Adaptive Machine Learning for Credit Card Fraud Detection

    time series data analysis

    open source and threat intelligence

    Apache Spot:一个全新的网络安全开源项目
    Apache Spot 是一个基于网络流量和数据包分析,通过独特的机器学习方法,发现潜在安全威胁和未知网络攻击能力的开源方案。目前 Apache Spot 已支持对 Netflow、sflow、DNS、Proxy 的网络流量分析,主要依靠 HDFS、Hive 提供存储能力,Spark 提供计算能力,基于 LDA 算法提供无监督式机器学习能力,最终依赖 Jupyter 提供图形化交互能力。

    AIEngine (Artificial Intelligent Engine)

    AIEngine is a packet inspection engine with capabilities of learning without any human intervention. AIEngine helps network/security professionals to identify traffic and develop signatures for use them on NIDS, Firewalls, Malware analysis, Traffic classifiers and so on.

    网址:https://bitbucket.org/camp0/aiengine/

    Passive DNS

    PassiveDNS对安全研究非常重要,因为它可以得到以下三方面的答案:该域名曾经绑定过哪些IP、这个IP有没有其他的域名、该域名最早/最晚什么时候出现。Passive DNS同时也在SOC的时候起到很大的帮助。通过识别的恶意域名,可以找到其他被恶意破坏的机器。目前有很多网站允许我们访问它的PassiveDNS系统,例如:Virustotal(https://www.virustotal.com/)、passivetotal(https://www.passivetotal.com)、CIRCL (https://www.circl.lu/services/passive-dns/)。有很多这样的网站,但是,自己在本地有一个当然会更方便。

     更详细的介绍:http://www.freebuf.com/articles/network/103815.html,以及https://www.farsightsecurity.com/solutions/dnsdb/

     更多的开源工具:  PassiveDNS::Client, https://github.com/chrislee35/passivedns-client

    Vulhub

    Vulhub是一个面向大众的开源漏洞靶场,无需docker知识,简单执行两条命令即可编译、运行一个完整的漏洞靶场镜像。

    开源代码:https://github.com/Cherishao/vulhub

    展开全文
  • 网络安全数据集

    万次阅读 2018-10-08 12:36:07
    本文主要收录安全相关的数据集,适合初创,中小型企业用于训练和验证自己的机器学习的模型,提高准确率和准确度。 由于数据集可能比较多,一开始也不能全部列举出来,所以后续会慢慢补充,慢慢增加。 数据集 每个...

    转自:https://xz.aliyun.com/t/1879


    简介

    本文主要收录安全相关的数据集,适合初创,中小型企业用于训练和验证自己的机器学习的模型,提高准确率和准确度。
    由于数据集可能比较多,一开始也不能全部列举出来,所以后续会慢慢补充,慢慢增加。

    数据集

    每个数据集都会有简单的介绍,内容类型,是否特征化
    以及适用范围

    • 网络流量
    • 主机行为
    • 文件样本

    KDD 99

    • KDD CUP 99 dataset 就是KDD竞赛在1999年举行时采用的数据集。1998年美国国防部高级规划署(DARPA)在MIT林肯实验室进行了一项入侵检测评估项目收集而来的数据。
    • 内容类型: 网络流量,主机行为
    • 是否特征化: 是
    • 适用范围: 主机入侵检测,异常流量监控
    • 下载地址

    HTTP DATASET CSIC 2010

    • HTTP DATASET CSIC 2010 包含已经标注过的针对web服务的请求。数据量约5w条。下载地址已经为我们分类好了训练用的正常数据,测试用的正常数据,测试用的异常数据。
    • 内容类型: 网络流量
    • 是否特征化:否
    • 使用范围: WAF类产品,异常流量监控
    • 下载地址

    honeypot.json

    • honeypot 是由多种类型的蜜罐采集回来的数据。主要是WEB请求。约99万条数据。由于没有分类和规整,需要自己数据清洗,也可以用作校验模型的数据。
    • 内容类型: 网络流量
    • 是否特征化:否
    • 使用范围: WAF类产品,异常流量监控
      下载地址

    Masquerading User Data

    • Masquerading User Data 是Matthias Schonlau 教授通过正常数据构造出来用于训练和检测 Masquerading User攻击的数据集。
      (内部攻击者分为两种,一种是内鬼[Traitor],一种是窃取了身份凭证的正常用户的伪装者[Masquerading User])
      由于是构造出来的数据,缺乏实际攻击的真实性,在一定程度上,训练出来的模型会存在一定的过拟。
    • 内容类型: 主机行为
    • 是否特征化:否
    • 使用范围: 入侵检测类 用户异常行为识别
    • 下载地址

    ADFA IDS Datasets

    • ADFA IDS Datasets 是澳大利亚国防大学发布的一套关于HIDS的数据集。分为linux(ADFA-LD)和window(ADFA-WD)。
    • 内容类型: 主机行为
    • 是否特征化:是
    • 使用范围: 入侵检测
    • 下载地址

    域名相关

    • 正常域名和可疑域名检测。 主要用于DGA的检测。这里直接用Alexa Top 100W 作为正常域名。用其他的开放的DGA数据作为黑样本。
    • 内容类型: 文本样本
    • 是否特征化:否
    • 使用范围: 入侵检测 异常流量 WAF
    • Alexa Top 100W
    • 360DGA
    • zeusDGA

    webshell

    • 这里github有一个比较多样本的收集。涵盖了很多的语言。
    • 内容类型: 文本样本
    • 是否特征化:否
    • 使用范围: 入侵检测 异常流量 WAF
    • 下载地址

    登录日志

    • auth.log 主要是都是登录失败的日志 适合用作判断是爆破登录还是正常的输错密码
    • 内容类型: 主机行为
    • 是否特征化:否
    • 使用范围: 入侵检测 异常流量 WAF
    • 下载地址

    恶意URL

    • malicious-URLs 在Github上面一个 使用机器学习去检测恶意URL的项目 ,里面有一个训练集,有做标记是正常的URL还是恶意的URL
    • 内容类型: 文本样本
    • 是否特征化:否
    • 使用范围: 入侵检测 异常流量 WAF
    • 下载地址

    综合数据

    • 在github上有一个叫 Security-Data-Analysis 的项目,里面有4个实验室 每个实验室的数据都不一样,包含http,连接记录,域名,host等等。
    • 内容类型: 网络流量
    • 是否特征化:否
    • 使用范围: 异常流量
    • 下载地址

    The Malware Capture Facility Project

    • MCFP 是捷克理工大学 (CTU 好像也叫捷克技工大学..不是很懂翻译)用于捕抓恶意软件的而抓去的网络流量。里面的数据非常多,有他们自己分析出来的恶意流量,也有所有的流量,包括网络文件,日志,DNS请求等
    • 内容类型: 网络流量
    • 是否特征化:否
    • 使用范围: 异常流量 WAF
    • 下载地址

    恶意软件数据库

    • MalwareDB 包含了恶意软件列表 hash,检测结果,所属域名等数据
    • 内容类型: 文本样本
    • 使用范围: 特征库 入侵检测
    • 下载地址
    展开全文
  • 网络安全数据集介绍

    千次阅读 2019-07-09 07:35:59
    5、CNNVD 软件安全漏洞数据集 6、NVD 软件安全漏洞数据集 1、KDD99 入侵检测数据集数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试...

    目录

    1、KDD99 入侵检测数据集

    2、NSL KDD 入侵检测数据集

    3、UNSW_NB15 入侵检测数据集

    4、NASA MDP 软件缺陷数据集

    5、CNNVD 软件安全漏洞数据集

    6、NVD 软件安全漏洞数据集

    1、KDD99 入侵检测数据集
    该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试数据和训练数据有着不同的概率分布,测试数据包含了一些未出现在训练数据中的攻击类型,这使得入侵检测更具有现实性。在训练数据集中包含了1种正常的标识类型normal和22种训练攻击类型,另外有14种攻击仅出现在测试数据集中。

    KDD99数据集下载、介绍和预处理

    2、NSL KDD 入侵检测数据集
    NSL-KDD数据集解决了KDD99数据集中存在的固有问题。NSL-KDD数据集由于缺少基于入侵检测网络的公共数据集,所以NSL-KDD数据集仍然存在一些问题,同时也不是现有真实网络的完美代表。但它仍然可以用作有效的基准数据集,以帮助研究人员比较不同的入侵检测方法。NSL-KDD训练集和测试集的设置是合理的,不同研究工作的评估结果将是一致的和可比的。

    NSL-KDD数据集介绍与下载

    3、UNSW_NB15 入侵检测数据集
    UNSW_NB15 入侵检测数据集下载

    4、NASA MDP 软件缺陷数据集
    软件缺陷预测研究中心广泛应用的由美国航空航天局(NASA)公布的NASA IV&V Facility Metrics Data Program(MDP)数据集,MDP 是一个开放的数据仓库,数据集的开放性方便了不同的研究者进行实验的重复、改进甚至反驳。 MDP包括 13个不同的数据集,这些数据均来自NASA 的13个实际软件项目,由最常见的开发语言编写。每个数据集包含来自不同软件项目的若干模块,规模从 125个模块到 17186 个模块不等。各个数据集由LOC、McCabe、Halstead等几类度量元属性和是否包含缺陷的类别标记(defective)组成。MDP数据集所提供的记录,一行代表一个模块,每个字段对应一个属性。

    NASA MDP 软件缺陷数据集统计规模如下表:

     NASA MDP 软件缺陷数据集下载

    5、CNNVD 软件安全漏洞数据集
    CNNVD是中国信息安全漏洞数据库(China National Vulnerability Database of Information Security,CNNVD)

    CNNVD数据集下载

    6、NVD 软件安全漏洞数据集
    NVD是美国国家计算机通用漏洞数据库(National Vulnerability Database,NVD)

    NVD数据集下载

    原文:https://blog.csdn.net/asialee_bird/article/details/84281149 
     

    展开全文
  • 网络安全数据集整理

    千次阅读 2020-01-09 00:20:16
    整理自一度苦于找数据集的我。开个坑整理一下公开数据集。 希望有一天能填平(大概)...来自加拿大网络安全研究所整理的数据集,包含下列数据集: Android Malware dataset (InvesAndMal2019) DDoS dataset (CICDD...
  • 本系列就是帮助大家收集网络安全相关数据集。如果大家有好的数据集,可以通过留言告诉我。 威胁情况库 开源的黑名单,在网上有大量的开源黑名单FireHOL、sans.edu等。这些黑名单更新迅速、可信度高,是我们所关注...
  • 网络安全分析数据集

    千次阅读 2021-09-29 02:14:20
    目录网络安全分析数据集 网络安全分析   本文将先为大家介绍一些常用于网络安全分析领域的数据集数据集   在网络安全领域有许多公开数据集可供使用,可以下载收集整理,按照业务场景的需要进行清洗处理,得到...
  • 物联网安全相关数据集

    千次阅读 2020-09-15 09:10:37
    物联网安全相关数据集 [原文]数据集可以在NIDS部署时使用,但是现在(文章发表于2019)没有专门针对IoT的数据集,因此开发者有两种选择1)使用针对传统系统的数据集 2)部署嗅探软件抓取自己网络的数据 [思考]按照原文的...
  • 网络安全相关数据集介绍与下载

    万次阅读 2018-11-20 09:45:19
    5、CNNVD 软件安全漏洞数据集 6、NVD 软件安全漏洞数据集 1、KDD99 入侵检测数据集数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试...
  • 最近要用到这方面的数据,就对CVD中的一小段CVE信息选取做了简单的理解,有错的地方请大佬指正。 一个完整的CVE信息 包含 七部分: (一) 元数据 (二)漏洞影响软件信息 (三) 漏洞问题类型 “cve” : { “data_...
  • 向AI转型的程序员都关注了这个号????????????机器学习AI算法工程 公众号:datayx该项目是使用 YOLOv5 来训练在智能工地安全领域中头盔目标检测的应用代码及运行教...
  • 安全数据集汇总

    千次阅读 2021-03-26 11:45:02
    安全数据集汇总 1、SHWD (github) 9044 human safety helmet wearing objects(positive) and 111514 normal head objects(not wearing or negative) 2、Hard Hat Workers Dataset (roboflow) 7041 Images 3、...
  • PCAP流量数据集(网络安全

    万次阅读 热门讨论 2019-01-21 13:37:02
    以上数据集有的需要申请,但是如果是学生应该可以申请到,只要私信留的邮箱即可。   最后别忘了用数据集的时候引用他们的文章。 如果可以的话顺便引用我的一下,嘿嘿。 持续更新中。。。 Reference ...
  • yolov4训练自己的数据集实现安全帽佩戴检测

    万次阅读 热门讨论 2020-07-07 22:46:41
    本次用yolov4来实现人佩戴安全帽检测,若未佩戴安全帽则将人脸框出来,若佩戴安全帽,则将安全帽以及人脸框出来,多说无益,直接看效果吧!!! 效果还是不错的,那么接下来就跟我一起进入yolov4的实操吧!!! ...
  • 交通情况数据集

    万次阅读 多人点赞 2017-11-22 15:42:35
    1.数据集包括500辆出租车近30天的(2008年5月17日-6月10日)行驶数据 2.车辆行驶数据的采样时间间隔1min 3.车辆轨迹数据包含:车辆ID-经纬度(位置)-是否载客-时间 4.无瞬时速度 下载链接:点击打开...
  • 开源 | 安全帽佩戴检测数据集

    千次阅读 2021-01-05 10:15:00
    最近图像领域比较火热的两个方向都与复工复产相关,一方面是口罩识别,另一方面,就是智能工地安全领域中的安全帽佩戴检测,很多同学或许没想到印象的大工地现在已经随着计算机视觉领域的发展如此智能...
  • 安全帽反光衣检测识别数据集和yolov5模型

    千次阅读 热门讨论 2020-09-20 16:30:04
    工作服(反光衣)检测数据集和yolov4-5检测模型 目录 0.摘要 1.开源项目github链接 2.数据集详细情况 3.工作服(反光衣)数据集扩充方案 0.摘要 本文开源1个工作服(反光衣)检测数据集(含标注)和预训练模型,此...
  • 开源一个安全帽佩戴检测数据集及预训练模型

    千次阅读 多人点赞 2019-10-26 09:24:29
    本文开源了一个安全帽佩戴检测数据集及预训练模型,该项目已上传至github,点此链接,感觉有帮助的话请点star 。同时简要介绍下实践上如何完成一个端到端的目标检测任务。可以看下效果图: 同时该模型也可以做...
  • 最强数据集集合:50个最佳机器学习公共数据集   https://mp.weixin.qq.com/s/_A71fTgwSyaW5XTAySIGOA   原作 mlmemoirs 郭一璞 编译 量子位 报道 | 公众号 QbitAI 外国自媒体mlmemoirs根据github、福布斯、...
  • 求助北京理工大学BIT-Vehicle Dataset数据集

    千次阅读 热门讨论 2017-10-19 11:55:14
    最近想下载一批有关车辆的数据集,看到了北理工有个实验室公布了一批数据。 与该数据集有关的论文是:“Vehicle Type Classification Using a Semisupervised Convolutional Neural Network”; 知乎上也有人提供...
  • 该项目使用了YOLOv5s、YOLOv5m、YOLOv5l来训练安全帽佩戴检测数据集,代码和权重均已开源!安全帽佩戴检测数据集也是开源的(共含7581 张图像)! 项目教程也相当详细,推荐入门练手学习!而且有意思的是,该项目和...
  • 目标检测数据集 数据集数据集 有检测 跟踪 人脸 3D 自动驾驶…… https://www.visualdata.io/ Pascal VOC(Pascal Visual Object Classes)- 图像理解benchmark数据集 http://host.robots.ox.ac.uk/pascal/VOC/ ...
  • CIC-IDS数据集特征介绍

    千次阅读 2021-03-20 10:53:31
    通信安全机构(CSE)与加拿大网络安全研究所(CIC)合作项目,该项目对自1998年以来现有的11个数据集的评估表明,大多数数据集(比如经典的KDDCUP99,NSLKDD等)已经过时且不可靠。其中一些数据集缺乏流量多样性和容量,...
  • 查看 oracle 数据库服务端数据集

    千次阅读 2019-07-09 14:27:10
    select parameter, value from v$nls_parameters where parameter like '%CHARACTERSET'; ... 安全 设计模式 框架 算法与数据结构 异常 文件解析与生成 Linux MySQL Oracle Redis D...
  • 16个车辆信息检测数据集收集汇总(简介及链接) 转载自:https://blog.csdn.net/u014546828/article/details/109089621?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_baidulandingword-1&spm=1001...
  • 在网上搜罗了几个小时,为高质量和多样化的机器学习数据集创建了一个很好的备忘单。   首先,在搜索数据集时要记住几点。根据卡内基梅隆大学的说法。 数据集不应该是混乱的,因为您不希望花费大量时间来清理...
  • 亚马逊AWS高级技术顾问Will Badr介绍了8种寻找机器学习数据集的方法 1、Kaggle数据集   Kaggle的数据集中,包含了用于各种任务,不同规模的真实数据集,而且有许多不同的格式。此外,你还可以在这里找到与每个...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 459,446
精华内容 183,778
关键字:

安全数据集

友情链接: sierra.zip