精华内容
下载资源
问答
  • 2021-01-18 18:21:31

    摘抄自:https://yjclsx.blog.csdn.net/article/details/83898545

    mysql中常用的三种插入数据的语句

    insert into表示插入数据,数据库会检查主键,如果出现重复会报错;

    replace into表示插入替换数据,需求表中有PrimaryKey,或者unique索引,如果数据库已经存在数据,则用新数据替换,如果没有数据效果则和insert into一样;

    insert ignore into表示如果已经存在相同的记录,比如主键或者唯一性字段冲突,则忽略当前新数据;

    还有一种和replace into功能类似的语句:insert into ... on duplicate key update,他们的区别如下。

    Replace into与Insert into ... on duplicate key update的区别

    相同点:

    (1)没有存在冲突的时候,replace into与insert into ... on duplicate key update相同,就是插入一条新的数据,返回的影响行数是1。

    (2)存在冲突的时候,都会用新数据替换老数据,返回的影响行数是2。

    (3)都支持批量更新,当插入的多条数据中有冲突时,会更新其中冲突的那几条。例如 replace into table (col_1,col_2) values ('v1','v2'),('v3','v4'),('v5','v6'); 和 insert into table (col_1,col_2) values ('v1','v2'),('v3','v4'),('v5','v6') on duplicate key update col_1=VALUES(col_1),col_2=VALUES(col_2);

    不同点:

    存在冲突的时候,replace into是delete老记录,然后录入新的记录,所以原有的所有记录会被清除,这个时候,如果replace into语句的字段不全的话,有些原有的字段的值会被自动填充为默认值,

    同时AUTO_INCREMENT的主键会自动+1。

    而insert into ... on duplicate key update则只执行update标记之后的sql,从表象上来看相当于一个简单的update语句,所以他保留了所有未修改的字段的旧值。

    从底层执行效率上来讲,replace into要比insert into ... on duplicate key update效率要高,但是在写replace into的时候,字段要写全,防止老的字段数据被删除。

    在实际工作中,经常会需要saveOrUpdate的操作,这时候通常使用的是insert into ... on duplicate key update,以保留未修改的数据。

    提高插入性能

    注意,当插入的数据量很大时,为了提高插入的性能:

    1、可以批量插入VALUES,就是一个values跟很多条数据,每条数据用英文逗号隔开,最后一条才用分号,而不是每一次插入都是一条数据。

    如:insert into table (col_1,col_2) values ('v1','v2'),('v3','v4'),('v5','v6');

    这个效果提升地很明显,以前地区表有几万条数据,一条条insert要几分钟,用了批量插入values,瞬间就完成了!

    2、删除MySQL的索引,有索引的存在,插入速度会受很大的影响。

    更多相关内容
  • 数据统计,数据分析,后台数据常用图标素材 多种样式图标、常用图标、数据图标、统计图标
  • 如何使用R语言画多种数据集的散点图并用不同颜色区分?如何加网格线?图例?多张图如何合并在一张Rplot里?合并后的图片如何设置公共图例?
  • 随着社交网站的发展,社交图像标记变得越来越流行,在社交网站中,图像使用称为标签的任意关键字进行注释。 当前大多数图像标记方法主要基于视觉相似性或视觉特征与标签之间的映射。 然而,在社交媒体环境中,图像...
  • 精心挑选的100多种机器学习数据

    千次阅读 2021-03-07 16:42:13
    毫无疑问,每个人都知道,学习数据科学和机器学习的唯一最佳方法是通过执行各种项目来学习它们。老实说,您周围有很多现实世界的机器学习数据集,即使您不必完成全面的数据科学或机器学习课程,也可以选择练习基础...

    毫无疑问,每个人都知道,学习数据科学和机器学习的唯一最佳方法是通过执行各种项目来学习它们。老实说,您周围有很多现实世界的机器学习数据集,即使您不必完成全面的数据科学或机器学习课程,也可以选择练习基础数据科学和机器学习技能。但是是的,数据科学和机器学习项目绝对没有其他选择。大多数数据科学和机器学习初学者做错的事情是,他们只是专注于学习许多理论概念,而等待太长时间才能启动专注于该概念的实际实现的机器学习/数据科学项目。毫无疑问,从理论上讲清楚您的机器学习概念总会很好,但是如果没有获得相关的实际经验,您就无法期望成为企业数据科学家或机器学习工程师。在此博客的此处,我们将为您提供100多个有价值的数据集,以供机器学习(特别是对于初学者)使用,这无疑将有助于验证您的基本数据科学和机器学习技能。

    机器学习中的数据集是什么?
    机器学习中的数据集是实例的集合(实例是指一行数据),这些实例都共享一些共同的特征和属性。为了使机器学习模型执行不同的动作,需要两种数据集–

    训练数据集-送入机器学习算法进行训练的数据。

     

    测试数据集或验证数据集–用于评估和测试机器学习模型正在正确解释的数据。

    为什么需要机器学习数据集?
    机器学习算法从数据中学习。机器学习算法可识别趋势,关系并根据为训练模型而提供的大量数据进行预测。因此,数据是机器学习中的金鹅。从机器学习模型中收集的见解与数据集一样好。对于机器学习项目而言,拥有大量且更好的训练数据可带来更好而准确的模型性能。可靠的机器学习数据集非常重要,并且在精确的机器学习模型的开发中起着至关重要的作用。

    可在此处免费访问已解决的机器学习Python和R代码示例(这些已为您的项目准备使用)

    在哪里可以找到用于机器学习的数据集?
    有大量的免费和付费资源可用于机器学习数据集。公共机器学习数据集可帮助您入门的最受欢迎资源包括–

    UCI或UC Irvine机器学习数据集存储库
    AWS数据集
    Google数据集搜索
    数据政府
    微软研究开放数据
    卡格勒
    世界银行
    但是,对于数据科学和机器学习的初学者来说,从这些网站上提供的众多选项中进行选择可能会变得势不可挡。如果您想学习机器学习,则需要一个坚实的基础,这意味着用于机器学习项目的有趣数据集,以及一些可以使用这些免费数据集的很棒的项目构想。想知道在哪里可以找到免费和公共的机器学习数据集?别无所求……无论是零售,医疗保健,银行与金融,犯罪,还是其他任何类型的机器学习数据集,我们都精选了一系列顶级机器学习数据集,以帮助您使模型成功。

    面向数据科学和机器学习从业人员的100多种机器学习数据集
    机器学习数据集

    我们汇总了一个以领域为中心的顶级机器学习数据集列表,其中包含对数据和可以使用特定数据集进行的项目的简短描述。

    零售机器学习数据集
    医疗保健机器学习数据集
    银行和金融机器学习数据集
    社交媒体机器学习数据集
    犯罪机器学习数据集

    机器学习的最佳零售数据集
    机器学习的零售数据集
    零售交易机器学习数据集
    1)在线零售数据集(英国在线商店)

    如果您热衷于预处理大型零售数据集,则可能希望查找这家英国的在线公司的交易数据,该数据可以出售独特的全场合赠品。 分类和聚类具有超过500,000行和8个属性,是可以使用此数据集执行的最常见的关联机器学习任务。

     

     Download Online Retail Dataset for Machine Learning

     

     Interesting Machine Learning Project Idea using UK Online Retail Dataset– Perform Market Basket Analysis to identify the association rules between the products.

    2)零售火箭推荐系统数据集

    该数据集由真实世界电子商务网站的点击流数据组成,该网站具有有关客户行为的信息,例如添加到购物车信息,交易和点击以及有关417053个唯一商品的不同商品属性的信息。 数据集具有事件数据文件,其中包含有关用户在特定时间戳下对产品执行的事件(添加到购物车,交易或视图)的信息。 仅当用户进行交易时,事件数据文件中的“ transaction-id”列才具有值,否则为N / A。

    Download Retail Rocket Recommender System Dataset for Machine Learning

    Machine Learning Project Idea using Retail Rocket Machine Learning Dataset – Build a Recommender System to predict the transaction and event pattern of a visitor.

    3)用于机器学习的Instacart订单数据集

    这是另一个有趣的机器学习数据集,可处理200,000多个Instacart匿名客户的杂货订单,该数据集可用于处理大型零售数据。对于每个客户,数据集均包含购买产品的顺序中4到100个订单的数据以及一天中的星期几和小时数。 XGBoost,Word2Vec和Annoy是机器学习算法,彻底改变了Instacart客户如今购买杂货的方式。


    Download Instacart Orders Kaggle Dataset

    使用Instacart数据集的初学者的机器学习/数据科学项目创意

    客户细分–建立基于关联的机器学习模型,以了解Instacart客户的多样化组合,并针对合适的客户群体以最大程度地提高盈利能力。
    市场篮子分析–开发预测性市场篮子分析机器学习模型,以确定Instacart客户将再次购买哪些产品?
    4)Olist的巴西电子商务数据集

    该机器学习数据集由Olist商店的10万个客户订单数据组成,其中包括卖方信息,产品元数据,客户信息和客户评论的详细信息。

     



    Download Brazilian E-commerce Public Kaggle Dataset by Olist

    使用巴西电子商务数据集的数据科学/机器学习项目构想

    电子商务产品评论分析–通过分析客户给出的产品评论中的文字对Olist商店出售的产品进行评分。
    分析Olist客户的购买趋势,以根据客户当前购买的商品确定客户是否打算购买相关产品。
    5)机器学习的超级市场数据集

    该零售数据集具有超过1000行和17列,具有一家超市公司3个月的历史销售数据,并记录了该公司三个不同分支机构的数据。该零售数据集是任何类型的预测分析项目的理想选择。


    Download Supermarket Kaggle Dataset for Machine Learning

    机器学习的零售图像数据集

    6)MVTec密集细分的超市图像数据集

    由于培训数据数量有限,并且验证和测试集中的多样性很高,因此对于机器学习而言,这是一个具有挑战性的图像数据集。它具有在700个不同场景中采集的日常产品和杂货的21K高分辨率图像,并在与行业相关的设置中以高质量注释为所有对象实例提供了像素化标签。


    Download MVTec D2S Retail Dataset for Machine Learning

    使用MVTec D2S数据集的计算机视觉项目构想

    该零售数据集可用于语义图像分割,以覆盖自动结帐,仓库或库存系统的实际应用。经典的深度学习CNN机器学习算法最适合在像素级别对图像中的产品进行分类,以简化结帐流程。

     

    7)上下文中的通用对象(COCO)数据集

    COCO数据集共有330,000张图像,超过200,000个标签,其中包含91个东西类别,80个对象类别,150万个对象实例以及25万具有关键点的人员-COCO数据集是最流行且最具挑战性的高质量计算机视觉数据集之一。该数据集代表了我们在日常生活中遇到的各种物体的图像,被认为是转移学习的理想检查点。它是训练计算机视觉模型的基础数据集。使用COCO计算机视觉数据集训练了任何计算机视觉模型后,您就可以使用任何自定义数据集进一步调整模型以学习其他任务。


    Download COCO Dataset for Machine Learning

    您可以使用COCO数据集进行哪种计算机视觉项目?

    对象检测-使用COCO数据集执行最具挑战性的计算机视觉任务之一,即预测图像中不同对象的位置以及存在的对象的类型。

    8)弗莱堡杂货数据集

    弗赖堡食品杂货零售数据集包含5000张图像,其中包含25种不同的食品杂货,每个类别至少具有97张图像,这些图像已在不同杂货店的各个部门的实际环境中捕获。


    Download Freiburg Groceries Dataset

    使用弗莱堡食品杂货集的计算机视觉项目构想

    您可以基于杂货产品的多类对象分类构建计算机视觉模型。可以进一步微调此模型,以建立无摩擦的商店体验,类似于流行的Amazon Go商店,而无需手动结帐。

    9)时尚MNIST数据集

    凭借10K测试示例,60K,培训示例以及10类零售产品,分辨率为28×28灰度通道图像,这是用于深度学习和计算机视觉的MNIST数据集的最佳替代产品之一。但是,这比直接替换更具挑战性。


    Download Fashion MNIST Kaggle Dataset

    使用Fashion MNIST数据集的计算机视觉项目构想

    通过使用Keras或TensorFlow训练简单的CNN从头开始构建模型,使用此数据集来享受您对服装分类的初体验。如果您想练习一种使用CNN机器学习算法解决图像分类问题的方法,则可以查找此数据集。

    10)零售产品结帐数据集

    在商店货架上有来自2000种不同产品类别的超过500,000张零售商品图像-就产品类别和产品图像数量而言,这是最大的零售图像数据集之一。


    Download a Large-Scale Retail Product Checkout Kaggle Dataset

    使用RPC数据集的计算机视觉项目构想

    该数据集被广泛用于推进零售产品图像识别的研究,以进行自动货架审核和结帐。该数据集的高质量性质使其非常适合用于细粒度的零售产品图像分类。

    是否想发展您的数据科学和机器学习技能?查看我们最新的端到端数据科学和机器学习项目以及源代码

    客户评论用于机器学习的零售数据集
    11)亚马逊客户评论数据集

    从1995年到2015年,该机器学习数据集在数百万种产品上拥有超过130亿条客户评论,是机器学习,自然语言处理和信息检索领域的数据科学家和研究人员的福音,以了解客户体验。


    Download Amazon Customer Reviews Dataset

    12)妇女的电子商务服装评论数据集

    这是一个匿名的数据集,因为它包含真实客户撰写的评论,并具有23486个带有10个不同功能变量的客户评论。该ML数据集提供了一个绝佳的环境,可用于解析多个维度的文本。


    Download Women’s E-Commerce Clothing Reviews Dataset

    13)宜家机器学习评论数据集

    这是一个相当小的机器学习数据集,其中包含从Google Maps刮取的1300条最佳和最差的IKEA客户评论。这为情感分析提供了一个完美的初学者级数据集。


    Download IKEA Reviews Kaggle Dataset

    14)亚马逊和百思买电子产品评论数据集

    该数据集专门针对百思买和亚马逊上提供的50种电子产品提供了7000多个在线评论。数据集包括审阅日期,标题,等级,来源,元数据和其他信息。


    Download Amazon and Best Buy Electronic Product Reviews Dataset

    15)多域情感数据集

    这是一个多域数据集,包含来自许多产品类型的产品评论。超过10万条Amazon.com对产品,乐器,书籍和DVD的评论,评分介于1到5之间。


    Download Multi-Domain Sentiment Kaggle Dataset

    使用客户评论数据集的有趣的机器学习项目创意

    使用NLP根据客户评论的内容预测收视率
    研究客户反馈对产品购买过程的影响。您可以使用这些评论数据集来预测客户向其朋友推荐产品的可能性。
    研究各种品牌的在线声誉。
    对客户评论进行情绪分析,以识别用户对产品的情感(正面,负面或中立)。 (评论情绪)
    ProjectPro通过构建端到端的现实世界数据科学和机器学习项目来帮助学生学习实践技能。为有源代码的学生检查一些有趣的有趣的机器学习项目构想。

    其他用于机器学习的零售数据集
    16)来自维多利亚的秘密和其他组织的内衣数据

    该数据集包含来自受欢迎的零售网站(如亚马逊,维多利亚的秘密,汉基·潘基,梅西百货,Btemptd,Nordstrom,American Eagle等)的600,000多种内衣产品的数据。


    Download Innerwear Data from Victoria’s Secret and Others Kaggle Dataset

    使用Innerwear Kaggle数据集的机器学习项目构想:

    该数据集可用于分析泳装和内装产品的流行趋势。

    17)电子商务项目数据

    机器学习数据集包含500个SKU,以及服装品牌产品目录中的产品说明。


    Download eCommerce Item Kaggle Dataset

    使用电子商务项目Kaggle数据集的机器学习项目构想:

    您可以使用Item数据进行的有趣的机器学习项目是构建产品推荐系统。

    18)eBay在线拍卖数据集

    该在线拍卖零售数据集包含拍卖信息,例如竞标价格,竞标时间,物品的拍卖价格,以及有关施华洛世奇珠子,卡地亚手表,Xbox游戏机和Palm Pilot M515 PDA的其他拍卖信息。


    Download eBay Online Auctions Dataset

    使用在线拍卖Kaggle数据集的机器学习项目构想:

    建立机器学习模型以预测拍卖品的最终价格。从利润最大化的角度来看,预测拍卖品的最终价格对买卖双方都有利。

    19)沃尔玛数据集

    这是最佳的初学者级机器学习数据集之一,因为它具有最多的零售数据以及每个沃尔玛商店区域中的外部数据,例如失业率,燃料价格,CPI,是进行详细分析的理想选择。该Kaggle数据集包含2010年至2012年记录的45家沃尔玛商店的匿名历史销售数据。


    Download Walmart Store Sales Kaggle Dataset

    使用沃尔玛零售数据集的机器学习/数据科学项目构想

    考虑假日和降价事件,消费者物价指数,季节变化以及其他影响产品销售的因素,建立一个机器学习模型来预测沃尔玛在全部门的销售。销售预测模型可帮助公司草拟有关如何满足未来需求和增加销售的计划。

    20)男鞋价格数据集

    该数据集包含10,000种男鞋的大集合,以及它们的销售价格,品牌名称,鞋名和其他信息。


    Download Men’s Shoe Price Dataset

    使用鞋价数据集的机器学习/数据科学项目构想

    使用此定价数据建立机器学习模型以-

    确定奢侈品牌的品牌价值
    确定定价策略
    确定奢侈男鞋的趋势
    确定鞋子的特定功能与价格变化之间的相关性。

    机器学习的最佳医疗保健数据集


    用于机器学习的医疗保健数据集

    1)OSIC肺纤维化进展

    开源影像协会医疗保健数据集包括200例匿名的肺部基线CT扫描以及其他相关临床信息,例如基线强迫生命系数,患者性别,年龄,基线扫描后的相对周数,吸烟状况等。


    Download OSIC Pulmonary Fibrosis Progression Dataset

    使用OSIC Kaggle数据集的数据科学/机器学习项目构想

    您可以建立机器学习模型来预测患者肺功能下降的严重程度。

    2)APTOS 2019失明检测

    这是在各种成像条件下捕获的眼底摄影视网膜图像的多样化且广泛的数据集。根据糖尿病性视网膜病变的严重程度,每张图片的临床评分为0到4。


    Download APTOS 2019 Blindness Detection Kaggle Dataset

    使用APTOS数据集的机器学习项目构想

    在285万人中,有1/3患有糖尿病性视网膜病变。您可以使用此数据集建立一个机器学习模型,该模型可以在DR引起影响眼睛的并发症之前早发现DR,这将帮助数百万糖尿病患者失去视力。

    3)超声神经分割数据集

    这个Kaggle数据集包含5635张图像,其中的神经已由人工手动注释。它是具有挑战性的机器学习数据集之一,因为它具有减小的数据大小并且没有明显的结构特征。


    Download Ultrasound Nerve Segmentation Dataset

    访问带有源代码的该机器学习项目,以建立一个机器学习模型,该模型可识别超声图像中的神经结构,以分割称为臂丛(BP)的神经集合。

    4)帕金森数据集

    这是一个非常小的医疗数据集,大约需要39 KB的数据,并且可以对31位患者进行一系列生物医学语音测量,其中23位患有帕金森氏病。


    Download Parkinson Dataset from UCI Machine Learning Repository

    使用帕金森数据集的机器学习项目构想

    每年印度有超过100万人受到帕金森氏病的影响。这种疾病是慢性的,无法治愈,甚至很难为医生早期诊断。您可以建立一个机器学习模型,以准确检测个体中帕金森氏病的早期发作,并基于多种因素来确定帕金森氏病患者是否健康。

    5)英特尔和MobileODT宫颈癌数据集

    该Kaggle数据集包含1481个训练图像和512个测试图像。考虑到此数据集的局限性,您可能必须应用各种数据增强技术来增加训练样本的数量。


    Download Intel & MobileODT Cervical Cancer Dataset

    使用英特尔和移动ODT宫颈癌数据集的深度学习项目构想

    使用深度学习和图像分类的子宫颈类型分类-宫颈癌是致命的,但是如果在早期发现并进行适当治疗,对许多妇女来说可以挽救生命。您可以使用此Kaggle数据集构建深度学习模型,以对子宫颈类型(类型1,类型2和类型3)进行分类,以帮助医疗保健专业人员为全球女性提供更好的护理。对子宫颈类型进行分类将有助于医疗保健提供者提高女性子宫颈癌筛查的效率和质量。

    6)乳房组织病理学图像数据集

    实际数据集包含162个乳腺癌标本的幻灯片图像。从该数据集中提取了277,524个补丁,其中78786个属于阳性类别,而其余198、738个补丁属于阴性类别。


    Download Breast Histopathology Images Dataset

    使用乳房组织病理学图像数据集的深度学习项目构想

    乳腺癌是最常见的癌症类型,在2018年经诊断的210万例乳腺癌病例中有627,000例死亡报告。在所有确诊的乳腺癌病例中,有80%属于浸润性导管癌(IDC)类型。早期准确诊断癌症有助于选择正确的治疗方案,并有助于提高癌症患者的生存率。您可以使用此数据集构建用于图像分类的深层CNN,以识别未标记的组织病理学图像中IDC的存在。这是一项重要的临床任务,为此,自动化模型肯定会节省时间并减少错误。

    7)迷你DDSM数据集

    最大的(45GB)公共乳腺摄影数据集之一,具有年龄属性,密度属性,患者的原始文件名,癌病灶轮廓二进制蒙版图像以及带有所有所需元数据的excel表。


    Download Mini DDSM Kaggle Dataset

    使用Mini DDSM数据集的机器学习项目

    年龄估计具有多种临床应用,并且已经使用生物医学图像对人类年龄进行了一些研究。使用此数据集,您可以基于乳房X线照片图像中的胸肌段建立基于AI的模型来估计年龄。最重要的步骤是从乳房X线照片中分割胸肌,然后提取深度学习特征以建立年龄估计模型。

    8)克利夫兰心脏病数据集

    克利夫兰心脏病UCI数据集包含303个个体的数据,这些个体具有75个属性,其中14个属性,例如年龄,性别,静息血压,血清胆固醇,静息心电图,获得的最大心率,运动诱发的心绞痛以及其他可能的重要参数发生心血管疾病的主要危险因素。


    Download Heart Disease Dataset

    使用心脏病数据集的机器学习项目构想

    心脏病是世界范围内死亡率和发病率的主要原因,仅在美国,每年就有61万例死亡。根据风险因素很难手动确定罹患心血管疾病的几率。在这里,机器学习可以极大地帮助您根据医疗保健行业产生的大量数据做出预测。您可以应用各种机器学习算法,例如SVM,朴素贝叶斯,XGBoost,决策树,随机森林,并使用克利夫兰心脏病机器学习数据集对它们进行比较,以预测某人是否患有心脏病。

    9)行动预测数据集的机制

    这是一个独特的机器学习数据集,由细胞活力数据和基因表达组成,可以访问超过5K药物的MoA注释。这个用于机器学习的数据集基于一种新颖的技术,该技术可测量人类细胞对数百种不同细胞类型池中药物的反应,从而消除了确定哪种细胞类型更适合任何给定药物的问题。


    Download Mechanisms of Action (MoA) Prediction Kaggle Dataset

    使用MoA预测数据集的机器学习项目构想

    药物发现在疾病治疗的发展中起着至关重要的作用。机器学习被广泛用于理解疾病的潜在机制,临床标记,药物发现和验证。通过开发机器学习算法来基于药物的生物活性对药物进行分类,该数据集可用于促进药物开发。

    10)世界卫生组织-医疗机器学习数据集的世界

    不同国家/地区最值得信赖和最真实的医疗数据来源。通过针对霍乱,肺结核,流行性感冒和其他疾病等特定疾病的COVID -19数据和分析,世卫组织获得了全球卫生重点数据以及大多数卫生状况的趋势重点。


    Download Healthcare Datasets for Machine Learning from WHO Repository

     

    与医疗数据配合使用的其他有趣且有趣的机器学习项目创意

    肺分割
    糖尿病预测
    接触追踪以阻止传染病的传播
    癌症分类
    个性化医学
    预测慢性病
    预测疾病暴发
    分类图像数据(X射线,CT扫描等)以进行诊断护理。

     

    最佳银行和金融机器学习数据集


    机器学习的银行和金融数据集

    1)桑坦德数据集

    由于这是银行业务数据集,因此已被完全掩盖,仅包含数值。西班牙在线银行桑坦德银行提供了四个不同的数据集,以帮助他们使用机器学习解决各种业务挑战。

    ownload Santander Customer Transaction Dataset

    Download Santander Value Prediction Dataset

    Download Santander Product Recommendation Dataset

    Download Santander Customer Satisfaction

     

    这些桑坦德银行数据集可用于构建端到端机器学习模型,以-

    预测客户将来是否会与银行进行交易,而不管交易的金额如何。
    预测客户是否会购买产品
    预测客户是否有能力支付费用
    预测客户是否对银行的服务感到满意。
    2)房屋信贷违约风险数据集

    该数据集包含7个不同的客户数据源-贷款申请数据,局数据,信用卡余额数据,以前的贷款申请数据,POS现金余额数据,EMI付款数据和局余额数据。


    Download Home Credit Default Risk Kaggle Dataset

    使用房屋信用违约风险Kaggle数据集的机器学习项目构想

    建立机器学习模型以预测客户是否有能力偿还贷款。这些模型将帮助银行决定是否只对有能力偿还贷款的申请人批准贷款。

    3)银行营业额数据集

    该数据集包含针对银行的大约1万名客户的14个功能,其中20%是流失客户。


    Download Bank Turnover Dataset

    使用银行营业额数据集的机器学习项目

    该数据集可用于预测客户流失,这是机器学习的最常见应用之一。您可以建立一个机器学习模型来预测客户是否会在未来6个月内退出银行的服务。预测客户流失将有助于银行制定保留活动和忠诚度计划以保留客户。

    4)信用卡交易数据集

    该欧洲信用卡数据集包含2013年9月在两天内发生的284、807笔交易和492笔欺诈交易(占所有交易的0.172%)。这是一个极具挑战性的数据集,因为它的数据不平衡,因为大多数这些交易不是欺诈性交易,因此很难检测到欺诈性交易。


    Download Credit Card Fraud Transaction Kaggle Dataset

    使用信用卡交易数据集的机器学习项目

    信用卡欺诈是许多银行和信用卡公司的常见问题,因为大多数欺诈交易看起来与正常交易相似,并且每天在信用卡上完成大量交易,因此很难手动检测到欺诈行为。使用此金融机器学习数据集来识别欺诈性信用卡交易,以确保不会因客户未进行的交易向客户收费。

    5)给我一些信用数据集

    该数据集包含2008年为25万巴西借款人创建的历史数据,金融机构可以利用这些历史数据来预测信用评分并做出最佳的财务决策。


    Download Give me Some Credit Kaggle Dataset

    使用“给我一些信誉”数据集的机器学习项目构想

    建立一个机器学习模型,以预测一个人在未来两年内遭受财务困扰的可能性。

    6)两个西格玛数据集

    该数据集由两个数据源组成,即Intrinio和Thomson Reuters。 Intrinio提供的培训市场数据大约有400万行,而路透社提供的培训新闻分析数据则有近900万行,使其成为可用于预测股价的最大数据集之一。


    Download Two Sigma Dataset

    使用两个Sigma Kaggle数据集的有趣的机器学习项目创意

    股票价格通常由投资者的行为决定,而投资者则根据公共信息确定股票价格以预测股票市场的反应。在此,随着投资者对这些信息做出反应,财经新闻文章在影响股票价格方面起着至关重要的作用。该数据集可用于构建机器学习模型,以对与公司列表相关的新闻文章进行分类,并基于该模型预测那些公司的股价波动。

    7)比特币历史数据集

    该数据集包括从2012年1月到2020年12月的精选比特币交易数据,包括开盘价,最高价,最低价和收盘价的逐分钟更新,以及加权比特币价格,BTC量和指定货币。


    Download Bitcoin Historical Dataset

    使用比特币历史数据集的示例机器学习项目构想

    使用此Kaggle数据集构建机器学习模型,以预测明天的比特币价格。人们可以探索使用LSTM模型来预测比特币价格。

    8)简街市场数据集

    如果您喜欢机器学习项目或想探索一些良好的股市数据,则此数据集可能是一个绝佳的合作机会。它包含带有匿名功能的真实股市数据,其中数据集中的每一行代表一个交易机会。


    Download Jane Street Market Prediction Dataset

    使用Jane Street市场预测数据集的建议的机器学习项目

    使用Jane Street股票市场数据来构建定量交易机器学习模型,以使用来自全球证券交易所的真实股票市场数据来最大化回报。您还可以针对未来的实际股市数据测试机器学习模型的有效性。

    9)Elo商家类别推荐

    Elo是巴西的大型支付品牌,向借记卡和信用卡用户提供餐厅推荐,并根据他们的偏好提供折扣。该数据集包含有关每笔卡交易的信息,以及有关特定商人长达3个月的每张卡交易价值的数据,每张卡的新商人的交易详细信息,以及基于交易中涉及的各种商人的其他商人数据。卡交易。


    Download Elo Merchant Category Recommendation Dataset

    建议的Elo商家类别数据集机器学习项目

    该数据集可用于查找这些促销对客户和商人有多有益。建立机器学习模型来预测客户的忠诚度分数,并帮助Elo了解客户的忠诚度,以便他们减少不必要的营销活动并为其用户创造正确的体验。

    10)俄罗斯储蓄银行俄罗斯住房市场数据集

    此数据集的训练数据包含有关俄罗斯最古老,最大的银行Sberbank的21000个真实交易的信息,而测试数据包含7K个真实交易以及有关该物业的其他信息。


    Download Sberbank Russian Housing Market Kaggle Dataset

    使用Sberbank俄罗斯住房市场数据集的机器学习项目构想

    使用此丰富的银行数据集来开发机器学习模型,以预测实际房价,以便开发商,贷方和提供者在购买物业或签订租约时充满信心。这些数据还包括有关俄罗斯经济和金融部门的信息,这些信息可以帮助开发准确的模型而无需再次猜测。

    探索其他100个主要的金融和经济数据集。

    机器学习社交媒体数据集
    用于机器学习的社交媒体公共数据集

    1)Twitter美国航空情绪数据集

    该社交媒体数据集具有14,640行和12个属性,并包含从Twitter刮取的美国各主要航空公司的推文。


    Download Twitter US Airline Sentiment Dataset

    ML项目建议的想法:使用机器学习的情感分类系统

    您可以使用此数据集将航空公司的推文分类为肯定,否定或中性,以分析旅行者对航空公司的反馈。

    2)Google Cloud和YouTube 8M数据集

    由Google AI / Research在2016年开发的数据集,其中包含800万个YouTube视频(总计50万小时)和4.8K(每个视频平均3.4个标签)视觉标题。


    Download YouTube 8M Dataset

    使用YouTube 8M数据集的数据科学和机器学习项目构想

    建立模型大小小于1GB的紧凑型视频分类,以学习视频表示形式。这将有助于推进视频级注释。
    建立分类机器学习模型以准确分配视频标签。
    3)COVID-19 Tweets数据集

    这是一个多语言的推文数据集,包含超过10亿条推文,其中包含冠状病毒,病毒,covid,ncov19,ncov2019等关键字,并带有标签,提及,主题和其他信息。


    Download COVID19 Tweets Dataset

    使用COVID 19数据集的建议ML项目

    使用数据挖掘,网络分析和NLP分析来自该数据集的推文集,以识别人们对大流行的反应以及反应随时间的变化。您还可以利用此ML数据集来收集有关大流行初期如何传输正确信息和错误信息的见解。

    4)Yelp数据集

    该数据集包含5,200,000条评论,其中包含来自4个国家/地区11个地区的1,74,000家企业的信息。


    Download Yelp Kaggle Dataset

    您可以使用此数据集进行哪些项目以进行机器学习?

    使用NLP和情感分析来找出评论中正面或负面的含义,并推断出各种情感和业务属性的含义。

    5)Twitter上的客户支持

    Twitter上来自顶级品牌的300万条推文的数据集。


    Download Customer Support on Twitter Dataset

    我可以使用此ML数据集做什么项目?

     


     


    机器学习犯罪数据集

    1)旧金山犯罪分类

    这是一个历史数据集,包含2003年至2015年旧金山地区的12年犯罪报告。数据包括犯罪发生的日期,犯罪时间,犯罪描述,地区,地址,位置坐标和解决方案。

    Download San Francisco Crime Classification Dataset

    使用犯罪分类Kaggle数据集的ML项目构想

    建立端到端机器学习模型,根据事件发生的位置和时间来预测犯罪事件的类别。

    2)伦敦犯罪数据集

    该数据集由LSOA区,月份和次要/主要类别在2008年1月至2016年12月之间的犯罪报告组成,犯罪记录为1300万行。


    Download London Crime Dataset

    使用London Crime Kaggle数据集的建议项目

    该数据可用于分析根据一周中的某天或某个季节的犯罪发生率是否发生任何变化,或确定特定犯罪在减少或增加的自治市镇。

    3)印度犯罪

    该数据集包含有关2001年国家犯罪数据的完整信息,分为40多个因素。


    Download Crime in India Dataset

    使用此数据集的分析建议项目

    该数据集可用于分析印度的犯罪模式,例如虐待儿童案件,针对SC和ST的犯罪以及其他犯罪,以根据犯罪模式发现潜在的罪犯。

    4)芝加哥犯罪数据集

    来自芝加哥警察局的芝加哥犯罪数据集有699万行,具有22个属性。该数据集会随着犯罪事件不断更新。


    Download Chicago Crime Dataset

    使用Chicago Crime Dataset的机器学习项目构想

    可以利用该数据集来构建模型,以分析温度对暴力犯罪(如殴打或殴打)的影响,确定同比增长最高的犯罪类别等。

    5)波士顿数据集中的犯罪

    数据集由波士顿警察局提供,其中包含2015年6月以来的犯罪类型,犯罪发生的时间和地点,犯罪描述,位置坐标以及其他信息。


    Download Crime in Boston Dataset

    该数据集可用于构建一个模型,以识别犯罪热点和犯罪的频繁发生时间。

    获取多个大数据电子书:下载地址

    展开全文
  • 另一种方法是元内容框架 ,它将知识表示的思想引入到 Web 系统,并提出进一步使用一种通用的数据模型,即有向标记图。元内容框架的愿景是创建关于实体的广泛知识库,其中不同的部分来自不同的网站。随着时间的推移,...

    Web 系统的设计要点之一是内容和表示的分离,网站以HTML发布内容,对内容进行操作的服务也只能访问 HTML。随着表现形式各异的设备在大量地增加,也大大增加了网站针对不同表示格式的数量。同时,一些新的个人助理应用,例如google assitant,amazon的Alexa,已经开始为web提供接触用户的新渠道。

    446520e9b468601abdceaa77d562b645.png

    此外,成熟的网络应用程序,正越来越多地寻求使用结构化内容,以提供更丰富和更具交互性的体验。这最终使得 Web 系统和开发人员能够以可互操作的方式交换结构化数据变得至关重要。Schema.org 是一套基于现有标准语法的词汇表,目前被 Web 系统上使用上的结构化数据所广泛使用。

    关于结构化数据标记的标准

    在早期,结构化数据的标准在独立的领域非常有用。一种方法是XML,试图标准化语法。虽然 XML 最初只被认为是HTML的未来,但它为结构化数据找到了更多的实用工具,具有更丰富的数据互操作性场景。另一种方法是元内容框架 ,它将知识表示的思想引入到 Web 系统,并提出进一步使用一种通用的数据模型,即有向标记图。元内容框架的愿景是创建关于实体的广泛知识库,其中不同的部分来自不同的网站。随着时间的推移,这一愿景逐渐涵盖了网络上的各种智能数据处理。

    在1997年和2004年之间,产生了结构化数据标记的各种标准(RDF、 RDFS 和 OWL)。许多词汇都用于特定的垂直领域,其中一个被广泛采用的就是 RSS ,它允许用户用自己喜欢的新闻来源定制主页。另一个是 vCard/hCard (通过 CSS class 属性以 HTML 的微格式表示) ,用于在地址簿、电子邮件等程序之间交换信息。后来,hCalendar 也加入了这个项目,它同样是一种微格式的 HTML,重新表达了现有 IETF的标准—— iCalendar。

    a2691f049c442bf6325699a24e3fe1cb.png

    在发布每一种结构化数据标准的时候,都会有一些应用程序会广泛地使用它。那如果要创建一个跨越垂直领域的结构化数据标准,就要找到一个覆盖面广的应用程序,这个应用程序可能就是文本搜索。

    网络搜索不局限于搜索结果的排名,而是要提高搜索结果的质量。用一些结构化数据来标记网页内容,可以优化用户和网站站长的体验。但是,大多数网站根本没有为网站添加任何标记,另外,即使是添加了标记,仍然往往格式不正确。这种大量的不正确格式要求构建复杂的解析器,这些解析器能够处理格式不正确的语法和词汇表。

    结构化数据的标记标准:schema.org

    2011年,主要的搜索引擎 Bing、 Google 和 Yahoo 创建了 schema. org 来改善这种状况。目标是提供一个涵盖广泛主题的模式,主题包括人、地点、事件、产品、提供等等,一个单一的模式涵盖了这些主题,主要是为站长提供一个统一的词汇表。

    2011年后,许多不同公司的不同应用已经开始使用 schema.org 的词汇表。其中包括:

    • google将schema. org 中的注释用作知识图谱的数据源,提供关于知识实体的背景信息(例如 logo、 contact 和社会信息)。

    • 基于 schema.org 的结构化数据标记正在电子邮件等地方使用。例如,确认酒店预订的电子邮件、购买收据等都嵌入了带有交易细节的 Schema.org 标记。这种方法使电子邮件的辅助工具能够提取结构化数据,并通过移动通知、地图、日历等使其可用。

    • Pinterest 使用 schema. org 为菜谱、电影、文章、产品或摆放物品提供丰富的依据。

    • 苹果的Siri使用 Schema.org 进行搜索功能,包括聚合评级、优惠、产品、价格、交互次数、组织、图片、电话号码和潜在的网站搜索操作,还在 RSS 中使用 Schema.org 进行新闻标记。

    当然,衡量是否成功的一个关键是站长的采用程度。从 Google 索引中可知,大约31.3% 的页面使用了 schema. org 标记。平均而言,每个包含这个标记的页面都会引用多个实体,其中包含数十个逻辑判断。需要注意的是,结构化的数据标记与 Web系统本身具有相同的数量级。在主要搜索引擎中,有超过四分之一的页面使用了Schema.org 的广义词汇表。Schema.org 的成功很大原因在于它背后的设计决策。

    schema.org中的一些设计

    Schema.org 的驱动因素是让站长可以轻松地发布他们的数据,设计决策将更多的努力放在了标记的使用者身上。

    ae2655c0375a113a834c032d41166eaa.png

    表达的语法

    从一开始,schema. org 就在多种语法和向站长提供简洁说明之间寻找平衡。随着时间的推移,多重语法显然是个好方法,包括 RDFa 和 JSON-LD ,数据的发布者可以自行选择。

    不同的语法适用于不同的工具和数据模型, JSON-LD是将其中的结构化数据表示为一组 javascript 风格的对象。这对于使用JavaScript 生成的站点以及个性化的电子邮件非常有用,因为在这些电子邮件中,数据结构可能更加冗长。JSON-LD 允许嵌入式的成员在 Schema.org 中携带结构化数据。有时候,可以将这种情况理想化为机器友好格式和人机友好格式之间的权衡。RDF 和 XML 等格式的设计主要为了机器使用,而微格式则明确表示人类优先。

    领域的多态

    许多知识表示的系统,对每个关系都有一个域和范围。这导致了许多不直观的表达,一个关系的唯一作用可能是某种关系的域或范围,这也使得重用现有关系而不改变类层次结构变得更加困难。允许多个域和范围的决定可能会改善这一问题。例如,schema. org 中有各种类型(Events,reservation,Offers) ,它们的实例都可以接受 startDate 属性,但是多态性使我们避免使用通用的超类型来对它们进行分组。

    实体的引用

    对于大多数站点来说,协调数以万计的实体与其他站点之间的实体引用太困难了。schema. org 坚持使用惟一的 uri,鼓励数据的发布者向每个实体添加尽可能多的额外描述,以便数据的消费者可以使用此描述进行实体协调。虽然这给来自多个 Web 数据的应用程序带来了额外成本,但它极大地减轻了站长的负担。。

    增量的复杂性

    通常,如果表示过于简单,会使构建一些更复杂的应用程序变得困难。通常情况下,一旦构建了简单的应用,词汇表也获得了低程度的采用,应用的开发者和站长就会要求使用更具表现力的词汇表,这相当于添加一些更多的描述性属性或子类型。添加新类型的操作或事件是扩展 Schema.org 表达能力的一种强大方法。然而,在许多情况下,很少有正确的答案,Schema. org 的方法不会因为追求完美模式而改变。

    清除与扩展

    每隔一段时间,可能会引入一些没有意义的词汇,尽管可能会很容易处理,但最好还是把它们清除掉。

    Web 底层的结构化数据是多样的,schema. org 最多只能为最常见的主题提供核心词表。即使是对于一个相对常见的主题,比如汽车,也可能需要数百个属性才能从各种网站上找到各种汽车规格的详细信息。schema. org的策略是为这样的主题提供一个小的核心词汇表,并依靠扩展来覆盖长尾问题。

    扩展主要有两大类, 一类是由 Schema.org 社区创建的,另一类是仅在“民间”实现。2015年的时候,引入了托管扩展的概念,然而,分层机制的设计是为了让专家和专业组织有更大的自主权。另外是外部扩展的概念,它们是参考 Schema.org 的核心词汇表设计的,期望在核心词汇表的基础上进行构建。

    结构化数据标记的其他发展

    2006年以来,“链接数据(linked data)”将 W3C RDF 社区的重点从语义网本体论和规则语言转向开放数据和实用数据共享。关联数据联盟已经成功地从各种公共部门和开放数据来源获得了大量RDF表示的开放数据,但RDF 的数据发布做法在网络中还没有被采用。

    5d108e19a73f759a1977dae7878cb1aa.png

    链接数据的目标更高,网上数据来源的数量很少,但质量往往很高。这为结合这两种方法提供了许多机会,例如,专业团队发布的关联数据往往可以权威地描述来自 schema. org 描述中提到的实体。

    使用标识 uri 和独立模式的无约束组合,链接数据可以被视为一个设计极限,另一端的极限可能是知识图谱。在2012年由谷歌提出了知识图谱的概念,作为一个统一的图数据集,用于搜索和相关应用。这个基本思想建立在与链接数据和 schema. org 共享的公共元素之上: 一个具有命名属性类型化实体的图数据模型。知识图谱特别强调前期的实体管理,以确保新数据被整合,且与现有记录相联系。基于共享,用 Schema.org 表示的结构化数据是集成到知识图的自然信息来源。没有人愿意阅读冗长的规范,大多数开发人员倾向于复制和编辑示例。随着时间的推移,复杂性逐步增加,平台/标准中的每一层复杂性只有在采用了更基本的层之后才能添加。

    小结

    网络基础设施需要结构化的数据机制来描述实体和现实世界中的关系,这个想法一直存在。与其寻求创建“智能代理的语言”,不如从网络搜索中解决具体的场景,人工辅助的结构化数据标记可能是最佳的实用途径。

    schema.org 已经开发了更多的词汇,并以更加分布的方式进行。从汽车到产品细节等一系列的主题扩展,提供了一个统一的词汇表和必要的讨论空间。在web系统中,大数据的应用越来越广泛,使得对通用模式的需求越来越重要,探索数据驱动的价值,从不同来源收集数据的需求,对共享词汇的需求在增加,或许这是 schema.org 的价值之一。

    【关联阅读】

    展开全文
  • 评估各种机器学习模型性能的研究,这些模型用于通过基于功能磁共振成像的多种生物标记和认知行为表现来预测一个人的大脑年龄。 结果概述: 先决条件 所有功能都是matlab编写的。 分析说明 使用一系列认知测试对...
  • 支持任何常见的音频和标记格式。 包含定义。 特征 支持音频文件类型 音讯格式 描述 维基 AIFF / AIFF-C 音频交换文件格式 AAC ADTS /高级音频编码 猿 猴子的音频 美国空军 先进的系统格式 DSDIFF 飞利浦...
  • 什么数据标注

    千次阅读 2019-07-09 09:58:23
    数据标注是通过数据加工人员借助类似于BasicFinder这样的标记工具,对人工智能学习数据进行加工的一种行为。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3D...

    数据标注

    数据标注是通过数据加工人员借助类似于BasicFinder这样的标记工具,对人工智能学习数据进行加工的一种行为。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3D画框、文本转录、图像打点、目标物体轮廓线等。
    https://www.shudu-ai.com
    数度智慧,自主研发,自主产权,牢记先创精神,牢记科学价值观。 围绕不同的需求自主研发第三方辅助分析标注工具。

    标注工具支持图像、文本和视频等多种标注形式
    图像分类,矩形框,多边形,曲线定位,3D定位
    文本 分类,文本实体标注,视频跟踪等
    可扩展性插件设计
    通过插件形式支持自定义标注,可根据具体需求开发不同的标注形式
    导出支持主流数据集格式
    支持PascalVoc(与ImageNet采用的格式相同)和CoreNLP等标准。
    跨平台,多语言,兼容不同操作系统
    支持Window/Mac/CentOS/Ubuntu,支持中/英文,满足所有团队需求。
    数度智慧科技公司作为AI时代数据处理服务的先锋队和践行者,致力于大数据、物联网数据与智能时代的完美融合。通过最先进的软件技术、数据技术打造结构化数据服务的先锋产品,通过更为严谨的、高效的服务平台,为AI时代的科学家插上腾飞的臂膀。
    数度智慧官方网址
    戳一戳

    展开全文
  • Ruby接口,用于读写多种音频格式的元数据(标签)。 与其他库相比,此库包装了完整的C ++ API,而不仅仅是最小的C API。 这意味着可以访问所有标签数据,例如ID3v2的封面或Ogg Vorbis注释的自定义字段。 taglib-...
  • sklearn自带的数据集以及生成数据集自带的小数据集鸢尾花数据集:load_iris():用于分类任务的数据集手写数字数据集load_digits()乳腺癌数据集load-barest-cancer()糖尿病数据集波士顿房价数据集体能训练数据集...
  • 3万7千多种图标-6

    2018-09-13 22:48:47
    共计4万余种各种类型的图标,满足PPT制作、软件界面编程等用途,绝对符合您的胃口。
  • WiderPerson 数据集是室外行人检测基准数据集,其中的图像选自多种场景,不局限于交通场景。 该数据集选择了 13382 张图像,并用各种遮挡标记了大约 40 万个标注。
  • 本节书摘来自华章计算机...3.5用图标集让你的数据大放异彩 图标集是 “条件格式 ”下的最后一种规则,它将多种样式的图标汇聚在一起,表示不同范围内的数据图标集可按 “方向 ”“形状 ”“标记 ”和“等级 ”...
  • 对此,通过无类别标记的Web数据来训练文本分类器,提出一种基于无标记Web数据的层次式文本分类方法,该方法结合类别知识和主题层次信息来构造Web查询,从多种Web数据中搜索相关文档并抽取学习样本,为监督学习找到分类...
  • 本设计是具有 NFC 接口的NFC通信环境温湿度/光线数据记录仪完整设计方案,附原理图/PCB源文件/源码。该环境参数数据记录仪具有超过 5 年的电池寿命和一个用于配置和读...数据使用 RTC 标记的日期/时间 附件资料截图:
  • influx_s和influx_i是设计用于基于标记数据估计通量和代谢物浓度的程序,使用稳定同位素(本质上是 ¹³C,但多种同位素的组合,如 ²H、¹³C、¹⁵N、... 也是可能的)。 influx_s处理固定数据,而influx_i能够...
  • 别再说,不懂什么是图数据

    千次阅读 2020-06-11 11:13:14
    然而,随着关系数据库使用范围的不断扩大,也暴露出一些它始终无法解决问题,其中最主要的是数据建模中的一些缺陷和问题,以及在大数据量和多服务器之上进行水平伸缩的限制。同时,互联网发展也产生了一些新的趋势...
  • //后台返回的数据格式 var data = [ { lng: "121.59874400", aqi: "92", time: "2020-03-19 08", stationname: "太古小学(鄞州)", lat: "29.85970300" }, { lng: "121.57025100", aqi...
  • 数据标注是做什么

    万次阅读 2020-07-08 15:14:43
    数据标注就是数据加工人员借助类似于BasicFinder这样的标记工具,对人工智能学习数据进行加工的一种的行为,通常数据标注的类型包括:图像标注,语音标注,文本标注,视屏标注等种类,标记的基本形式有标注画框,3D...
  • 使用雷达类型图可视化训练和测试集的这些属性,表明模型在什么时候是较差的或者可能是训练过度的。这些结果还表明,需要使用更大规模的比较、前瞻性测试以及不同指纹和DNN架构的评估等多个指标来进一步评估深度学习...
  • 应用程序数据流 输入读取来自不同数据源的工作日志。 每个工作日志代表一个要输出到某处的工作的特定实例。 从所有源读取输入后,它们都将添加到WorklogSet实例中。 WorklogSetOperations允许转换工作日志集的最终...
  • 如果要从键盘获取不同类型的变量,需要使用Scanner类 具体的实现步骤: 1.导包:import java.util.Scanner; 2.实例化:Scanner scan=new Scanner(System.in); 3.调用Scanner类的相关方法,来获取指定类型的变量 //...
  • 数据可视化  将数据通过图表的形式展现...vue2.xvuex 存储公共变量,如色值等vue-router 路由element-ui 饿了么基于vue2开发组件库,本例使用了其中的datePickerecharts 一款丰富的图表库webpack、ES6、Babel
  • 数据标注是做什么的?

    千次阅读 2019-07-18 11:45:52
    被识别的物体还需要通过数据标注才能让机器知道这个物体是什么。 常见的几种数据标注类型 1.分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合。如下图,一张...
  • 使用简单的数据结构管理Next.js项目中的文档头SEO元数据。 安装 $ npm install @moxy/next-seo 该库是现代JavaScript编写的,并以CommonJS和ES模块的已编译变体形式发布。 如果您以较旧的浏览器为目标,请确保...
  • 跨网络多观察(SIMON)MRI数据集的单人志愿者是一名年龄在29至46岁之间的健康男性的便利性样本,在73个会话中的多个站点进行了扫描,并使用多种扫描仪模型。 除了其他模式(T1,T2和PD加权,T2-star,扩散,静息...
  • 多种动态图标图表,供参考
  • 多种数据库连接工具In the past few months, the data ecosystem has continued to burgeon as some parts of the stack consolidate and as new challenges arise. Our first attempt to help stakeholders ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 228,218
精华内容 91,287
关键字:

多种数据用什么图表