精华内容
下载资源
问答
  • 非常全面的正则表达式的总结,可以把这个文档的内容当做一个工具使用,有问题的时候可以在里面查阅...一方面这个文档可以在疑惑的时候给我们填补正则表达式的知识,另一方面,里面涵盖丰富的案例,可以供我们粘贴复用
  • jquery超级实用的代码段,内容非常丰富,涵盖了jquery在项目中的使用,通过无数个小案例的代码,可以让你能全面的学习到jquery的知识点,各种效果,以及功能的代码,应有尽有
  • 计算机网络技术全篇 内容非常丰富 覆盖面广 不可多得的自学材料
  • 经典的C语言课件,内容详实,涵盖本科教学大纲内容;帮助初学者顺利掌握方法,把握C语言内容精髓,是难得学习辅导资料!
  • 有关排队论的一点重要资料,很值得一看!涵盖内容比较全面
  • 融汇了各个公司的笔试题,内容丰富。保你看了有帮助;
  • 工欲善其事必先利其器,这也是大部分开发者在日常工作...就在最近,一个基于 javascript 的可视化库 D3js(treemap 可视化)对 json 文件生成的技术图,给开发者提供了详细的各领域工具清单,内容涵盖了 11 种极具潜...

    通过公众号【计算机视觉联盟】可加博士微信(Kingsplus)交流,备注:单位/学校+研究方向 ,分享最新的AI思维导图和笔记

    笔记作者:王博简介         985AI博士,CSDN博客专家

    已连载系列《机器学习》西瓜书手推笔记

    已完结待更笔记:《深度学习-花书手推笔记》、《无人驾驶手推笔记》、《SLAM 十四讲》
    ————————————————
     

    工欲善其事必先利其器,这也是大部分开发者在日常工作中最重要开发原则。选择与开发内容相匹配的工具,常常会使我们事半功倍。但面对人工智能的多个领域,如:机器学习、深度学习、NLP等等,多样的工具有时也让我们也无从选择。

    就在最近,一个基于 javascript 的可视化库 D3js(treemap 可视化)对 json 文件生成的技术图,给开发者提供了详细的各领域工具清单,内容涵盖了 11 种极具潜力的 AI 工具类型,我们将其整理如下,强烈建议大家收藏~

    原文链接:https://github.com/haggaishachar/techmap

    目录:

    Ⅰ、经典机器学习(1-3)

    Ⅱ、深度学习(4-8)

    Ⅲ、强化学习(9-12)

    Ⅳ、自然语言处理(13-18)

    Ⅴ、语音识别(19-21)

    Ⅵ、计算机视觉(22-26)

    Ⅶ、分布式训练(27-31)

    Ⅷ、自动建模(32-35)

    Ⅸ、IDEs系统(36-38)

    Ⅹ、平台(39-41)

    Ⅺ、评分推理系统(42-43)

        I . 适用于经典机器学习的工具

    一、SciKit-learn  star 39.2k  fork 19.2k

    scikit-learn 是一种强大的基于 Python 语言的机器学习算法库(https://scikit-learn.org/stable/)。其中,包含了算法预处理,模型参数择优,回归与分类等算法,官方文档包含了每一种算法的例子,代码简洁优美,可视化了每一种算法结果,即能学习 python,也是帮助开发者更好理解机器学习算法的便利工具。

    尤其在监督学习部分,Scikit-learn 提供了广义线性模型、支持向量机、最近邻算法、高斯过程、朴素贝叶斯、决策树和集成方法等算法教程,同时还介绍了特征选择、随即梯度下降算法、线性与二次判别分析等在监督学习中非常重要的概念;而在半监督学习中的标签传播算法和无监督学习中的聚类与降维算法方面,也有非常多的教程。

    GitHub 地址:

    https://github.com/scikit-learn/scikit-learn 

     

    二、XGBoost star 18.3k  fork 7.3k

    xgboost 的全称是 eXtreme Gradient Boosting,它在 Gradient Boosting 框架下实现了 c++机器学习算法。

    XGBoost 最大的特点在于,它能够自动利用 CPU 的多线程进行并行,同时在算法上加以改进提高了精度。它是经过优化的分布式梯度提升库,可扩展性强,高效、灵活且可移植。

    GitHub 地址:

    https://github.com/dmlc/xgboost 

     

    三、Accord.NET star 3.7k  fork 1.7k

    Accord.NET Framework 是一个.NET 机器学习框架,结合了完全用 C#编写的音频和图像处理库(http://accord-framework.net/)。

    它可用于构建生产级计算机视觉、计算机试听、信号处理和统计应用程序甚至用于商业用途的完整框架,并为.NET 的应用程序提供了统计分析、机器学习、图像处理、计算机视觉相关的算法。

    GitHub 地址:

    https://github.com/accord-net/framework 

        II . 适用于深度学习的工具

    TensorFlow 2019 年相关数据

    四、TensorFlow star 141k  fork 79.8k

    TensorFlow 是用于机器学习的端到端开源平台(https://tensorflow.org),也是 2019 年度 GitHub 上最受欢迎的项目。

    它具有工具、库、社区资源全面且灵活的生态系统,提供稳定的 Python 和 C ++ API,以及其他语言的非保证向后兼容 API;能够帮助开发者们在 ML 领域的研究与发展,并使开发人员轻松构建和部署 ML 支持的应用程序。

    GitHub 地址:

    https://github.com/tensorflow/tensorflow 

     

    五、PyTorch star 35.8k  fork 9k

    作为 TensorFlow 强有力竞争对手的 PyTorch,也是目前较为主流的深度学习工具之一。

    PyTorch 是一个开源的机器学习框架,提供了两个高级功能,包括:具有强有力的 GPU 加速度的张量计算(如 NumPy),以及基于磁带自动调整系统构建的深度神经网络;可加快从研究原型到生产部署的过程。

    此前,OpenAI 官方宣布了「全面转向 PyTorch」的消息,计划将自家平台的所有框架统一为 PyTorch,也进一步体现了 PyTorch 在深度学习方面的潜力。

    GitHub 地址:

    https://github.com/pytorch/pytorch 

     

    六、MXNET star 18.4k  fork 6.5k

    MXNet 是一个功能齐全,可编程和可扩展的深入学习框架,支持最先进的深入学习模式(https://mxnet.apache.org/)。

    MXNet 提供了混合编程模型(命令式和声明式)和大量编程语言的代码(包括 Python、C++、R、Scala、Julia、Matlab 和 JavaScript)的能力,是一个易安装易上手的开源深度学习工具,它提供了一个 python 接口 gluon,能够让开发者迅速搭建起神经网络,并进行高效训练。

    GitHub 地址:

    https://github.com/apache/incubator-mxnet 

     

    七、Sonnet star 8.1k  fork 1.2k

    Sonnet 是由 DeepMind 发布的,在 TensorFlow 上用于构建复杂神经网络的开源库。

    Sonnet 主要用于让 DeepMind 开发的其它模型更容易共享,Sonnet 可以在内部的其它子模块中编写模块,或者在构建新模块时传递其它模型作为参数;同时,Sonnet 提供实用程序来处理这些任意层次结构,以便于使用不同的 RNN 进行实验,整个过程无需繁琐的代码改写。

    GitHub 地址:

    https://github.com/deepmind/sonnet 

     

    八、DL4J star 11.5k  fork 4.8k

    DL4J 是采用 java 和 jvm 编写的开源深度学习库,支持各种深度学习模型。DL4J 最重要的特点是支持分布式,可以在 Spark 和 Hadoop 上运行,它支持分布式 CPU 和 GPU 运行,并可以利用 Spark 在多台服务器多个 GPU 上开展分布式的深度学习模型训练,让模型运行更快。

    DL4J 的基本特性包括:DL4J 中的神经网络训练通过簇的迭代并行计算;整个过程由 Hadoop 和 Spark 架构支持;使用 Java 允许开发者在 Android 设备的程序开发周期中使用。

    GitHub 地址:

    https://github.com/eclipse/deeplearning4j 

        III . 适用于强化学习的工具

    九、Gym    star 19.6k  fork 5.5k

    Gym 是一个用于开发和比较强化学习算法的工具(https://gym.openai.com/)。

    它无需对 agent 的先验知识,并且采用 python 作为主要开发语言,因此可以简单的和 TensorFlow 等深度学习库进行开发集成,同时直观的将学习结果用画面直观的展示出来。Gym 库中包含许多可以用于制定强化学习算法的测试问题(即环境),这些环境有共享接口,允许编写通用的算法。

    GitHub 地址:

    https://github.com/openai/gym 

     

    十、Dopamine     star 8.7k  fork 1.1k

    一款基于 Tensorflow 的框架,旨在为新手和经验丰富的强化学习研究人员提供兼具灵活性、稳定性和可重复性的新工具。

    该框架的灵感来源于大脑中奖励-动机行为的主要成分「多巴胺受体」,这反映了神经科学与强化学习研究之间的强大的历史联系,是一个强化学习算法快速原型的研究框架。

    GitHub 地址:

    https://github.com/google/dopamine 

     

    十一、ReAgent    star 2.4k  fork 312

    Facebook 推出的一个构建决策推理系统的模块化端到端平台,用于推理系统(强化学习、上下文管理等), 可以显著简化推理模型构建过程。

    ReAgent 由三部分组成:生成决策并接收决策反馈的模型、用于评估新模型部署前性能的模块及快速迭代的服务平台。同时,ReAgent 也是创建基于 AI 的推理系统的最全面、模块化开源平台,并且是第一个包含策略评估的平台,将会加速相关决策系统的部署。

    GitHub 地址:

    https://github.com/facebookresearch/ReAgent 

     

    十二、Tensorlayer   star 5.9k  fork 1.3k

    这是一个面向科学家的深度学习和强化学习库。TensorLayer 由底层到上层可以分为三大模块:神经网络模块、工作流模块、应用模块。

    与 Keras 和 Pytorch 相比,TensorLayer 提高了神经网络模块的抽象化设计,同时实现了降低使用现有层和开发新层的工作量。

    GitHub 地址:

    https://github.com/tensorlayer/tensorlayer 

        IV . 适用于自然语言处理的工具

    十三、BERT   star 21.3k  fork 5.8k 

    BERT 是一个基于双向 Transformer 的大规模预训练语言模型,用于对大量未标记的文本数据进行预训练,以学习一种语言表示形式,这种语言表示形式可用于对特定机器学习任务进行微调。

    BERT 被称为是 NLP 领域中里程碑的进展;目前,BERT 也是 NLP 深度学习中的重要组成部分,很多之后的自然语言处理模型都是在此基础上优化与改进而得。

    GitHub 地址:

    https://github.com/google-research/bert 

     

    十四、Transformers  star 21.7k  fork 4.8k

    Transformers 是神经机器翻译中使用的一种神经网络,它主要涉及将输入序列转换为输出序列的任务,这些任务包括语音识别和文本转换语音。

    这类任务需要「记忆」,下一个句子必须与前一个句的上下文相关联(这是相当关键的),以免丢失重要的信息。通过将 attention 应用到正在使用的单词上,则可以解决当句子太长的时,RNN 或 CNN 无法跟踪上下文和内容的问题。

    GitHub 地址:

    https://github.com/huggingface/transformers 

     

    十五、AllenNLP    star 8k  fork 1.7k

    一个基于 PyTorch 的 NLP 研究库,利用深度学习来进行自然语言理解,通过处理低层次的细节、提供高质量的参考实现,能轻松快速地帮助研究员构建新的语言理解模型。

    AllenNLP 能让设计和评估新的深度学习模型变得简单,几乎适用于任何 NLP 问题,通过利用一些基础组件,你可以轻松地在云端或是你自己的笔记本上跑模型。

    GitHub 地址:

    https://github.com/allenai/allennlp 

     

    十六、flair    star 8.1k  fork 1k

    一款简单易用的 Python NLP 库,允许将当前最优自然语言处理(NLP)模型应用于文本,如命名实体识别(NER)、词性标注(PoS)、词义消歧和分类。

    Flair 基于 Pytorch 的 NLP 框架,它的接口相对更简单,允许用户使用和结合不同的词嵌入和文档嵌入,包括 Flair 嵌入、BERT 嵌入和 ELMo 嵌入。

    GitHub 地址:

    https://github.com/flairNLP/flair 

     

    十七、spaCy    star 15.7k  fork 2.8k

    这是一个具有工业强度级的 Python 自然语言处理工具包。

    它已经成为 Python 中最广泛使用的工业级自然语言库之一,它提供了当前最佳的准确性和效率,并且有一个活跃的开源社区支持。

    GitHub 地址:

    https://github.com/explosion/spaCy 

     

    十八、fastText   star 20.5k  fork 3.9k

    FastText 是 Facebook 人工智能研究实验室(FAIR)开源的一个文本处理库,他是一个专门用于文本分类和外文本表示的库,用于高效文本分类和表示学习。

    fastText 的核心是使用「词袋」的方式,不管文字的顺序;但它不是线性的,而是使用分层分类器来将时间复杂度降低到对数级别,并且在具有更高分类数量的大数据集上更高效。

    GitHub 地址:

    https://github.com/facebookresearch/fastText

        V . 适用于语音识别的工具

    十九、Kaldi  star 8.2k  fork 3.7k

    Kaldi 是目前使用广泛的开发语音识别应用的框架。

    该语音识别工具包使用了 C ++编写,研究开发人员利用 Kaldi 可以训练出语音识别神经网路模型,但如果需要将训练得到的模型部署到移动端设备上,通常需要大量的移植开发工作。

    GitHub 地址:

    https://github.com/kaldi-asr/kaldi 

     

    二十、DeepSpeech star 13k  fork 2.4k

    DeepSpeech 是一个开源语音转文本引擎,使用基于百度深度语音研究论文的机器学习技术训练的模型。其中,该项目运用到了 Google 的 TensorFlow 来简化实施过程。

    GitHub 地址:

    https://github.com/mozilla/DeepSpeech 

     

    二十一、wav2letter   star 4.8k  fork 770

    这是由 Facebook 人工智能研究院发布的首个全卷积自动语音识别工具包,它是一个简单高效的端到端自动语音识别(ASR)系统。

    wav2letter 的核心设计基于三个关键原则,包括:实现在包含成千上万小时语音数据集上的高效模型训练;简单可扩展模型,可以接入新的网络架构、损失函数以及其他语音识别系统中的核心操作;以及平滑语音识别模型从研究到生产部署的过渡。

    GitHub 地址:

    https://github.com/facebookresearch/wav2letter 

        VI . 适用于计算机视觉的工具

    二十二、YOLO  star 16.2k  fork 10.4k

    YOLO 是当前深度学习领域解决图像检测问题最先进的实时系统。在检测过程中,YOLO 首先将图像划分为规定的边界框,然后对所有边界框并行运行识别算法,来确定物体所属的类别。确定类别之后,YOLO 再智能地合并这些边界框,在物体周围形成最优边界框。

    这些步骤全部并行进行,因此 YOLO 能够实现实时运行,并且每秒处理多达 40 张图像。据官网显示,在 Pascal Titan X 上,它以 30 FPS 的速度处理图像,并且在 COCO 测试开发中的 mAP 为 57.9%。

    GitHub 地址:

    https://github.com/allanzelener/YAD2K 

     

    二十三、OpenCV    star 41.9k  fork 32.4k

    OpenCV 是英特尔开源的跨平台计算机视觉库(https://opencv.org),被称为 CV 领域开发者与研究者的必备工具包。

    这是一套包含从图像预处理到预训练模型调用等大量视觉 API 的库,并可以处理图像识别、目标检测、图像分割和行人再识别等主流视觉任务。其最显著的特点是它提供了整套流程的工具,因此开发者无需了解各个模型的原理就能用 API 构建视觉任务。它具备 C++、Python 和 Java 接口,支持 Windows、Linux、Mac OS、iOS 和 Android 系统。

    GitHub 地址:

    https://github.com/opencv/opencv 

     

    二十四、Detectron2   star 7.7k  fork 1.4k

    Detectron2 则是 PyTorch 1.3 中一重大新工具,它源于 maskrcnn 基准测试,也是对先前版本 detectron 的一次彻底重写。

    Detectron2 通过全新的模块化设计,变得更灵活且易于扩展,它能够在单个或多个 GPU 服务器上提供更快速的训练速度,包含了更大的灵活性与扩展性,并增强了可维护性和可伸缩性,以支持在生产中的用例。

    GitHub 地址:

    https://github.com/facebookresearch/detectron2 

     

    二十五、OpenPose   star 15.9k  fork 4.7k

    OpenPose 人体姿态识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以 caffe 为框架开发的开源库。

    它可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用,很多人体姿态估计实例都是基于它实现,如动作采集、3D 试衣、绘画辅助等。

    GitHub 地址:

    https://github.com/CMU-Perceptual-Computing-Lab/openpose 

     

    二十六、facenet   star 10k  fork 4.1k

    FaceNet 采用了深度卷积神经网络(CNN)学习将图像映射到欧式空间,也被称为通用人脸识别系统。

    该系统可从人脸中提取高质量的特征,称为人脸嵌入(face embeddings),可用于训练人脸识别系统,从而实现对人脸的验证。它在 LFW 数据集上测试的准确率达到了 99.63%,在 YouTube Faces DB 数据集上准确率为 95.12%。

    GitHub 地址:

    https://github.com/davidsandberg/facenet 

        VII . 适用于分布式训练的工具

    二十七、Spark MLlib   star 25.1k  fork 21.1k

    Spark 是一个开源集群运算框架,也是现在大数据领域热门开源软件之一(https://spark.apache.org/mllib/)。

    由于 Spark 使用了内存内运算技术,它在内存上的运算速度比 Hadoop MapReduce 的运算速度快上 100 倍;这也使得 Spark MLlib 分布式计算框架运行非常高效、快速。它可以实现大部分机器学习,如:聚类、分类、回归等算法,并允许将数据加载至集群内存,多次对其进行查询,所以非常适合用于机器学习算法。

    GitHub 地址:

    https://github.com/apache/spark 

     

    二十八、Mahout  star 1.8k  fork 930

    Mahout 是一个分布式线性代数框架,用于快速创建可扩展的高性能机器学习应用程序(http://mahout.apache.org/  )。

    Mahout 框架长期以来一直与 Hadoop 绑定,但它的许多算法也可以在 Hadoop 之外运行。它允许多种算法可以跨越分布式 Spark 群集上运行,并且支持 CPU 和 GPU 运行。

    GitHub 地址:

    https://github.com/apache/mahout 

     

    二十九、Horovod   star 8.5k  fork 1.3k

    这是由 Uber 开源的一个跨多台机器的分布式深度学习的 TensorFlow 训练框架,可以使分布式深度学习快速且易于使用。

    据介绍,Horovod 让开发人员只需几行代码就可以完成任务。这不仅加快了初始修改过程,而且进一步简化了调试。考虑到深度学习项目的高度迭代性,这也可以节省大量时间。除此之外,它还结合了高性能和修补低级模型细节的能力,例如:同时使用高级 api,并使用 NVIDIA 的 CUDA 工具包实现自己的自定义操作符。

    GitHub 地址:

    https://github.com/horovod/horovod 

     

    三十、Dask   star 6.2k  fork 994

    当开发者需要并行化到多核时,可以用 Dask 来将计算扩展到多个内核甚至多个机器。

    Dask 提供了 NumPy Arrays,Pandas Dataframes 和常规列表的抽象,能够在无法放入主内存的数据集上并行运行。对大型数据集来说,Dask 的高级集合是 NumPy 和 Pandas 的替代方案。

    GitHub 地址:

    https://github.com/dask/dask 

     

    三十一、Ray   star 10.3k  fork 1.5k

    Ray 是一个高性能分布式执行框架,它使用了和传统分布式计算系统不一样的架构和对分布式计算的抽象方式,用于快速而简单的构建和运行分布式应用程序。

    Ray 按照典型的 Master-Slave 进行设计。其中,Master 负责全局协调和状态维护,Slave 执行分布式计算任务。不过和传统的分布式计算系统不同的是,Ray 使用了混合任务调度的思路,性能更强。

    GitHub 地址:

    https://github.com/ray-project/ray 

        VIII . 适用于自动建模的工具

    三十二、TPOT  star 6.7k  fork 1.2k

    TPOT 是一个 Python 编写的软件包,利用遗传算法行特征选择和算法模型选择,仅需几行代码,就能生成完整的机器学习代码。

    在机器学习模型开发图中,TPOT 所完成的即通过利用遗传算法,分析数千种可能的组合,为模型、参数找到最佳的组合,从而自动化机器学习中的模型选择及调参部分。

    GitHub 地址:

    https://github.com/EpistasisLab/tpot 

     

    三十三、AutoKeras   star 6.6k  fork 1.1k

    它使用了高效神经架构搜索(ENAS,https://arxiv.org/abs/1802.03268),只需使用 pip install autokeras 就能快速轻松地安装软件包,然后就能用自己的数据集来执行自己的架构搜索构建思路。

    相比谷歌 AutoML,两者构建思路类似,但不同的是,AutoKeras 所有代码都已经开源,可供开发者无偿使用。

    GitHub 地址:

    https://github.com/keras-team/autokeras 

     

    三十四、Featuretools  star 4.6k  fork 602

    这是一个用于自动化特性工程的开源 python 框架(https://www.featuretools.com/)。

    它可以帮助开发者从一组相关数据表中自动构造特征。开发者只需要知道数据表的基本结构和它们之间的关系,然后在实体集(一种数据结构)中指明。然后在有了实体集之后,使用一个名为深度特征合成(DFS)的方法,在一个函数调用中构建出数千个特征。

    GitHub 地址:

    https://github.com/FeatureLabs/featuretools 

     

    三十五、NNI   star 5.3k  fork 683

    NNI 是由微软发布的一个用于神经网络超参数调整的开源 AutoML 工具包,也是目前较为热门的 AutoML 开源项目之一。

    最新版本的 NNI 对机器学习生命周期的各个环节做了更加全面的支持,包括:特征工程、神经网络架构搜索(NAS)、超参调优和模型压缩,开发者都能使用自动机器学习算法来完成,即使是开发小白也能轻松上手。

    GitHub 地址:

    https://github.com/microsoft/nni 

     

    三十六、AdaNet    star 3k  fork 443

    AdaNet 是由谷歌开源的一个轻量级的基于 TensorFlow 框架(https://adanet.readthedocs.io/en/v0.8.0/)。

    AdaNet 易于使用,并能创建高质量的模型,为 ML 实践者节省了用于选择最佳神经网络架构的时间,实现了一种将学习神经架构作为子网络集合的自适应算法。

    GitHub 地址:

    https://github.com/tensorflow/adanet 

        IX . IDEs 系统

    三十七、Jupyter   star 9.3k  fork 2.2k

    Jupyter 是一种 Web 应用,涵盖了跨数十种编程语言的交互式计算。

    它能让用户将说明文本、数学方程、代码和可视化内容全部组合到一个易于共享的文档中,非常方便研究和教学。在数据挖掘平台 Kaggle 上,使用 Python 的数据开发者大多数选择了 jupyter 来实现分析和建模的过程。

    GitHub 地址:

    https://github.com/jupyter/jupyter 

     

    三十八、Spyder    star 5.1k  fork 1k

    Spyder 是一个 用于科学计算的使用 Python 编程语言的集成开发环境(IDE)。

    它结合了综合开发工具的高级编辑、分析、调试功能以及数据探索、交互式执行、深度检查和科学包的可视化功能,对于初学者也非常友好。

    GitHub 地址:

    https://github.com/spyder-ide/spyder 

     

    三十九、Zeppelin  star 4.6k  fork 2.2k

    Zeppelin 是一款基于 Web 的交互式数据分析平台。它基于网络的笔记本,默认使用 Spark 集群作为分析引擎,提供数据可视化的框架,支持数据驱动的交互式数据分析。

    通过配置,它也支持包括 SQL、Python、R 等多种数据分析语言,提供数据库查询、动态图表展示、地图等数据可视化能力,并能够以 Notebook 的形式保存和分发代码及分析结果。

    GitHub 地址:

    https://github.com/apache/zeppelin 

        X . 平台

    四十、H2O  star 4.6k  fork 1.7k

    H2O 是  H2O.ai 公司的完全开源的分布式内存机器学习平台。H2O 同时支持 R 和 Python,支持最广泛使用的统计和机器学习算法,包括梯度提升(Gradient Boosting)机器、广义线性模型、深度学习模型等。

    H2O 包括一个自动机器学习模块,使用自己的算法来构建管道。它对特征工程方法和模型超参数采用了穷举搜索,优化了管道。H2O 自动化了一些最复杂的数据科学和机器学习工作,例如特征工程、模型验证、模型调整、模型选择 和 模型部署。除此之外,它还提供了自动可视化以及机器学习的解释能力(MLI)。

    GitHub 地址:

    https://github.com/h2oai/h2o-3

     

    四十一、MLflow  star 5.9k  fork 1.2k

    MLflow 是机器学习生命周期的开源平台,开放接口,可与任何机器学习库、算法、部署工具或编程语言一起使用,基于 REST API 和简单的数据格式而构建。是一个开源项目,允许用户和机器学习库开发人员可以对其进行扩展。

    MLflow 现 alpha 版,提供跟踪、项目和模型三大组件。MLflow 的跟踪组件支持记录和查询实验数据,如评估度量指标和参数。MLflow 的项目组件提供了可重复运行的简单包装格式。最后,MLflow 的模型组件提供了用于管理和部署模型的工具。

    GitHub 地址:

    https://github.com/mlflow/mlflow 

     

    四十二、Kubeflow   star 8.3k  fork 1.3k

    Kubeflow 项目旨在使 Kubernetes 上的机器学习变的轻松、便捷、可扩展,其目标不是重建其他服务,而是提供一种简便的方式找到最好的 OSS 解决方案。对分布式训练任务支持。

    用于创建和管理交互式 Jupyter notebook 的 JupyterHub,可配置为使用 CPU 或 GPU,并通过单一设置调整至单个集群大小的 TensorFlow 训练控制器(Tensorflow Training Controller),用于 TF 服务容器(TF Serving container)

    GitHub 地址:

    https://github.com/kubeflow/kubeflow 

        XI . 评分推理系统

    四十三、ONNX  star 7.8k  fork 1.3k

    ONNX 是一种针对机器学习所设计的开放式的文件格式,用于存储训练好的模型。它使得不同的人工智能框架(如 Pytorch, MXNet)可以采用相同格式存储模型数据并交互。ONNX 的规范及代码主要由微软,亚马逊,Facebook 和 IBM 等公司共同开发,以开放源代码的方式托管在 Github 上。

    目前官方支持加载 ONNX 模型并进行推理的深度学习框架有:Caffe2, PyTorch, MXNet,ML.NET,TensorRT 和 Microsoft CNTK,并且 TensorFlow 也非官方的支持 ONNX。

    GitHub 地址:

    https://github.com/onnx/onnx 

     

    四十四、Seldon star 1.4k  fork 296

    开源机器学习部署平台 Seldon Core,让机器学习模型可以部署于 Kubernetes 上。Seldon Core 的目标,要让研究人员可以用任何工具包、程序语言建立机器学习模型。

    现阶段该工具支持模型包含以 Python 为基础的 TensorFlow、Sklearn,还有 Spark、H2O、R 等知名模型。此外,Seldon Core 也让机器学习模型可支援 REST、gRPC,让使用者可以更简单地整合相关企业应用。

    GitHub 地址:

    https://github.com/SeldonIO/seldon-core 

    展开全文
  • 面试题涵盖VC++,C语言,Oracle数据库,C#,JAVA,UML,JSP Web,Hibernate,Struts,经典名企面试题!!!相当超值\(^o^)/~ 囊括就业分析,面试指南,岗位须知,职业指导等各类内容的“求职指南”,不啻为入行者步入...
  • 公共基础知识120题详解,内容涵盖丰富,绝对值得收藏
  • 华为面试题

    2013-05-02 22:16:44
    近几年的华为技术面试题,内容涵盖丰富 想进华为的值得一看
  • mysql操作指南(金典培训教程) 是学习mysql 的一本好的书,内容涵盖丰富。个人推荐
  • 传感器讲明教程,适合初学者或者做为参考书籍!内容丰富
  • 《ASP.NET3.5入门经典-涵盖C#和VB.NET》以建立一个实际的Web站点为主线,从最初的没有任何功能的简单站点开始,然后逐步增加功能和效果,直到最后建立一个完整的、功能丰富的、数据库驱动的、交互的Web站点。...
  • 这是第六版的介绍《ASP.NET 4入门经典:涵盖C#和VB.NET(第6版)》内容简介:ASP.NET是.NET Framework的一部分,用于构建内容丰富的动态Web站点。其最新的版本ASP.NET 4对上一版进行了许多改进,包括增强了Web窗体,并...
  • java2编程详解(special_edition_using_java)很详细的基础讲解 内容涵盖丰富 很适合自学JAVA的初学者以及JAVA爱好者的查阅
  • java编程百例

    2014-11-30 23:06:08
    Java编程百例,内容涵盖丰富,非常实用的功能,都是用java实现的,比如,上传文件,解析XML,jsp,多线程,发邮件,使用ODBC连接数据库,还有窗体的一系列操作等等一百种例子,每个例子的代码中都有详细的注释,一看...
  • 《ASP.NET 3.5入门经典--涵盖C#和VB.NET》 《Wrox-Beginning ASP.NET 3.5 CSharp and VB》 附带C#和VB源码。 很经典一本书籍,不容错过。 书名: ASP.NET 3.5入门经典——涵盖C#和VB.NET(第5版) 丛书名: 作者: ...
  • 增加了很多与时俱进的内容。这也是一本完整的软件构建手册,涵盖了软件构建过程中的所有细节。它从软件质量和编程思想等方面论述了软件构建的各个问题,并详细论述了紧跟潮流的新技术、高屋建瓴的观点、通用的概念,...
  • 是一个毕业设计成品,该系统主要采用JAVA语言编写,主要应用到了SpringBoot框架,Mybatis框架、mysql数据库以及redis等常见的JAVA编程必备知识,内容涵盖丰富的前后端知识,也适合新手学习。 需求: 1.本课题的...

    前言:本文介绍的是一个基于SSM框架的新生报到数据可视化系统,是一个毕业设计成品,该系统主要采用JAVA语言编写,主要应用到了SpringBoot框架,Mybatis框架、mysql数据库以及redis等常见的JAVA编程必备知识,内容涵盖丰富的前后端知识,也适合新手学习。

    需求:

    1.本课题的目的及意义

    新生报到数据一直是困扰着各大高校的管理性问题,人数多、工作量大,这无疑是一个挑战,也因此加快了高校的信息化建设步伐。随着互联网的普及与发展,日常生活中人们接触到的数据正以惊人的速度增长。数据已经成为人们生活中必不可少的事务,随着学校数量和规模的不断扩大,各高校招生人数不断增加,有关学生报到的各种信息也极剧增加。为了更加清晰有效地传达与沟通学生的数据信息,借助于可视化的图形手段。将新生的信息汇总分析,用图像呈现出来。将固有的数据进行可视化分析,来构建独有的数据呈现。面对庞大的数据信息量,就需要设计一个新生报到数据可视化分析系统来提高学生管理工作的效率。通过这样的系统,可以做到数据的规范管理、科学统计和快速的查询,从而减少管理方面的工作量。“新生报到数据可视化分析系统”旨在对新生报道数据进行全面、立体、多维度的管理和统计分析。主要包括前端、后台,主要内容有学生报道信息管理,挖掘统计、后台服务、系统安全。

    2.研究现状分析

    在这个数字化的时代里,随着高校招生规模的不断扩大,招生后期的数据处理与迎新工作变得更加繁重,各高校普遍希望将信息技术引入到迎新工作中,加强参加迎新的各个部处间的信息流通和工作配合,使迎接新生的工作流程更为有序,提高学校各相关部门工作效率。在这样的背景下,新生入学报到管理系统应运而生,并成为高校数字化校园的一个组成部分。该工作涉及到学生处、教务处、后勤、各学院等诸多部门。这一工作的执行情况一定程度可以反映学校的管理水平和效率。过去,新生报到以及随后的学籍档案等工作都需要手工完成,因此其工作效率及数据准确度都存在很大问题,很容易造成新生报到时的混乱场面,增加了由于人工登记而带来的资金、人力、物力的消耗。用计算机来管理新生报到可以避免不必要的资源浪费。针对新生的报道情况进行分配,避免所分配的学号、床位号出现空缺的现象,也节省了教务处人员的工作强度,避免了提前去做新生的相关分配工作。新生报到数据可视化分析系统可以很好地解决这个问题,是一个教育单位不可或缺的部分。

    基本任务

    新生报到数据可视化分析系统要具有学生报到信息管理、管理员角色信息管理、挖掘统计信息、后台服务以及保护系统安全等功能。每个功能应按照标准化代码文档的书写,实现大数据技术和思维的代表性、先进性和作品创新性。

    主要功能如下:

    (1)学生角色功能模块:  

    1)院系报到指南:可以查看各院系报到指南。  

    2)个人信息采集:对个人信息进行新增,修改,删除,查询操作。  

    3)在线缴费:可以在线自助缴费以及申请一卡通。  

    4)在线查看宿舍:可以在线查看所在宿舍。  

    6)联系志愿者:可以自助联系学校志愿者咨询,获取帮助。  

    7)报到单自助打印:自助报到完毕,自行打印报到单。  

    (2)管理员角色功能模块:  

    1)报到规则:管理员发布相关报到规则。  

    2)交通指引:管理员发布交通指引。  

    3)志愿者信息:管理员发布各院部志愿者信息。  

    4)报到统计分析:管理员分类统计相关报到情况。  

    5)在线审核:管理员在线审核新生自助报到信息。  

    (3)挖掘统计  

    1)年龄构成统计分析:入学时学生的年龄,可从中得到新生的年龄分布。  

    2)迁徙统计分析:各个省的录取人数,更加清楚地看到各地方的录取人数。  

    3)性别比例统计分析:更加直观的得到男女人数的比例。  

    4)少数民族统计分析:得到新生的少数民族比例。  

    2.拟解决的主要问题

    (1)前端展示分类合理,内容实用,主题突出;后台服务设计思路清晰,通用性强。  

    (2)分类规则标准,数据接口设计通用。  

    (3)后台数据可以快速检索。进行查询、增加、删除、修改、统计等操作。  

    (4)系统安全包含用户安全,数据安全,验证技术可靠合理通用,对具体操作分角色分权限,保证数据的安全可靠。  

    3.实现途径、方法和手段

    (1)通过背景调研和相关文献、技术资料分析,总结系统的设计思路和实现功能。

    (2)拟定本课题研究技术方案。根据系统设计任务书所确定的范围,对现行系统进行详细调查,确定系统要实现的基本目标和逻辑功能要求。

    (3)本系统采用JavaWeb开发的相关技术、eclipse开发工具、使用tomcat构建WEB服务器。

    (4)开发中使用关系型数据库进行数据存储与处理,使用数据仓库主题思想和数据挖掘与机器学习相关算法,通过有大数据处理结果的Echarts来展示最终应用效果,达到实用先进的目的。

    技术框架:

    主要编程语言为JAVA

    主要框架为基于SpringBoot的SSM框架,以mybatis和mysql数据库作为数据层工具,MVC模式展示整个系统,前端采用Jquery作为主要编程语言,后端结合redis实现高效的缓存数据,加速用户的访问效率。

    并且还用到了Echars完成了数据大屏可视化的展示效果,其中不乏像人口迁徙图这样的动画特效。

    主要的系统功能截图如下所示

     

     

     

     

     

     

    本文首发于https://www.bizhibihui.com/

    如有需要请联系

    展开全文
  • 《软件工程》课程总结

    千次阅读 2017-06-18 20:15:59
     上学期就已经选修过孟宁老师的网络程序设计课程,这次的课程《软件工程》和上次一样,...与传统教学不同,该课程采用了线上教学+线上/线下实验+同学分享的方式,实践和理论相结合,内容涵盖丰富,使我受益良多。以

    张剑冬  + 《软件工程(C编码实践篇)》MOOC课程http://mooc.study.163.com/course/USTC-1000002006

            上学期就已经选修过孟宁老师的网络程序设计课程,这次的课程《软件工程》和上次一样,依然采用了一种很新颖的教学方式。与传统教学不同,该课程采用了线上教学+线上/线下实验+同学分享的方式,实践和理论相结合,内容涵盖丰富,使我受益良多。以下是我学习该课程的一些总结和心得体会。


    1. 课程总结

            软件工程包含的内容广泛,线上课程和实验主要涉及的是代码层面的内容。课程通过从简单到复杂一步一步设计出一个通用的菜单系统来向我们介绍了设计一个软件所要做的事情和要注意的地方。与以往课程实验实现一些简单的功能函数不同,要设计出一个实用的软件系统,功能需求只是最基础最简单的需求,而其他非功能性需求如可重用性、通用性和可维护性等也占据着非常重要的地位。对于一个软件系统,要实现很好的可维护性,首先编程必须符合一定的代码风格规范,规范和风格统一的代码能增强可读性,既有利于团队成员之间相互交流,也有利于后期的更改维护;其次,模块化也是增强软件可维护性的一个重要方法。程序的模块化还能增强代码的可重用性和通用性。要实现模块化,就要尽量让代码简单,例如一个函数只做一件事,一个模块只做一类事。必须遵循“不和陌生人说话”的原则,封装类,保证一个对象对另一个对象了解的尽可能少。同时为模块设计通用规范的接口。此外,软件开发中还要考虑多线程情况下线程安全的问题,需要关注函数是否是可重入的,以及使用互斥锁以保证多线程安全等。


    2. 实验报告汇总

        下面是我完成线上实验的一系列实验报告。

    实验一:写一个hello world小程序

    实验二:命令行菜单小程序V1.0,具体要求参见视频

    实验三:内部模块化的命令行菜单小程序V2.0

    实验四:用可重用的链表模块来实现命令行菜单小程序V2.5

    实验五:用callback增强链表模块来实现命令行菜单小程序V2.8

    实验七:将menu设计为可重用的子系统


    3. 心得体会

            线上课程和实验使我从实践中学习到了设计开发一个实用的软件系统所包含的内容和要注意的地方,包括代码风格规范、程序的模块化、通用接口的设计和线程安全等等;而同学分享则使我了解到了软件工程涉及的方方面面,以及行业内使用的一些新技术和工具,使我初步了解了在实际企业里是如何进行软件系统开发的。在这门课程中我最大的收获就是通过菜单系统实验学习到的软件设计方法,最大的遗憾是没有参加一个真实实用的项目的开发。

    展开全文
  • Web前端工程师的岗位职责是利用HTML、CSS、Java、DOM等各种web技能结合产品的界面开发,制作标准化纯手工代码,并增加交互功能,丰富互联网的Web开拓,致力于改进用户体验。现如今,Web前端工程师已经成为各大互联网...

    目前web前端工程师日均岗位缺口已经超过50000,随着互联网+的深入发展,html5作为前端展示技术,市场人才需求量将呈直线上涨。

    Web前端工程师的岗位职责是利用HTML、CSS、Java、DOM等各种web技能结合产品的界面开发,制作标准化纯手工代码,并增加交互功能,丰富互联网的Web开拓,致力于改进用户体验。现如今,Web前端工程师已经成为各大互联网公司不可或缺的热门职位,从业者队伍日渐庞大,这其中不乏零基础学习者和转行人士。为了方便大家系统而全面的掌握前端基础知识,小编特意整理了web前端开发入门学习线路图,涵盖20大实战项目的知识点详细讲解,希望对大家的学习有所帮助。

    项目一:PC端网站布局

    所含知识点:HTML基础,CSS基础,CSS核心属性,CSS样式层叠,继承,盒模型,容器,溢出及元素类型,浏览器兼容与宽高自适度,定位,锚点与透明,图片整合,表格,CSS属性与滤镜

    项目二:HTML5+CSS3基础项目

    所含知识点:HTML5新增的元素与属性,表单域增强元素,CSS3选择器,文字字体相关样式,CSS3位移与变形处理,CSS3 2D转换与过度动画,CSS3 3D转换与关键帧动画,弹性盒模型,媒体查询,响应式设计

    项目三:WebApp页面布局项目

    所含知识点:移动端页面设计规范,移动端切图,文字流式/控件弹性/图片等比例/特殊设计的100%布局,等比缩放布局,viewport/meta,rem/vw的使用,flexbox详解,移动web特别样式处理(reset, 1px border, 高清图片)

    项目四:原生Java交互功能开发项目

    所含知识点:基本语法,循环语句,函数与数组,String与Date,BOM与DOM,事件,拖拽效果,cookie存储,正则表达式,Ajax,面向对象基础,运动与游戏开发

    项目五:面向对象进阶与ES5/ES6应用项目

    所含知识点:Promise/A+,设计模式(观察者模式等),原型链,构造函数,执行上下文栈与执行上下文,变量对象与活动对象,作用域链,闭包,this,ES5,ES6

    项目六:Java工具库自主研发项目

    所含知识点:DOM库,事件库,AJAX库,原型和继承库,MVVM核心库,基于SPA的路由库

    项目七:jQuery经典交互特效开发

    所含知识点:时间轴特效,tab页面切换效果,网页定位导航特效,滑动门特效,焦点图轮播特效,导航条菜单效果,瀑布流特效,弹出层效果,倒计时效果,抽奖效果

    项目八:PHP+MySQL后端基础项目

    所含知识点:PHP,MySQL,HTTP(s)协议详解,Ajax进阶、跨域与Defered,Apache与Nginx 环境搭建与配置,接口的定义,Mock数据,Restful,前后端联调,前端安全(XSS,CSRF,JSON注入)

    项目九:前端工程化与模块化应用项目

    所含知识点:Gulp,Webpack,NPM,Git/SVN,CommonJS,AMD,CMD,ES6模块化

    项目十:PC端全栈开发项目

    所含知识点:大首页、列表页与详情页展示与交互特效、搜索、登录与注册、购物车、jQueryUI 与 jQuery EasyUI、Bootstrap(ACE)、Highcharts/Echarts、ArtTemplate、Velocity、Smarty、云平台系统前端

    项目十一:应用Vue.js开发WebApp项目

    所含知识点:Vue.js基础,模块化,单文件组件,路由,与服务器通信,状态管理,单元测试与生产发布,服务端渲染SSR与Nuxt.js,基于Vue.js企业级项目开发(Mint UI, Element UI)

    项目十二:应用React.js开发WebApp项目

    所含知识点:ReactJS基础,JSX语法,组件,flux+Redux,React,Router路由,动画效果,基于React 企业级项目研发( Antd, Antd Mobile)

    项目十三:应用Angular开发WebApp项目

    所含知识点:Type 基础与进阶,开发环境配置,Hello World,架构、模块与组件,模板,元数据、数据绑定与数据显示,表单,服务与指令,依赖注入,路由,Ionic 3 MUI框架

    项目十四:微信公众号开发

    所含知识点:初识微信公众号,订阅号的基本功能,使用百度BAE实现代码的快速上线,使用Git完成线上代码部署,公众号开发权限及功能接入,微信JSSDK接口API,微信场景项目开发与接入

    项目十五:微信小程序开发

    所含知识点:微信小程序初探,小程序入门必学,小程序组件体验,小程序大功能,项目实战带你征服小程序

    项目十六:React Native

    所含知识点:React Native 初探,React Native 项目导航,React Native 项目文本框,React Native 项目滚动分页,React Native 项目第三方登录,React Native 其他组件

    项目十七:各类混合应用开发

    所含知识点:自主原生Navtive Hybrid(iOS、Android),第三方Hybrid框架Cordova/Phone gap,第三方Hybrid框架MUI + HTML5+

    项目十八:NodeJS全栈开发

    所含知识点:

    (1)Node.js基础项目——NodeJS介绍,开发环境搭建,模块与包管理工具,CommonJS模块,URL网址解析,QueryString参数处理,HTTP模块,HTTP小爬虫,request方法,事件 events模块,文件 fs模块,Stream 流模块,原生路由与参数接收,读取图片文件,npm s,Yarn 与 PM2

    (2)MongoDB——MongoDB介绍与环境搭建,数据库常用命令,Collection聚集集合,document文档操作,聚集集合查询,NodeJS连接MongoDB

    (3)GraphGL——GraphQL初探:从REST到GraphQL,GraphGL安装,准备数据源,搭建GraphQL服务器,数据查询

    (4) Express——express 介绍,安装和创建基于Express的项目,Express 4.1x 初始化项目详解,路由简介,模板引擎EJS,模板引擎Pug(Jade)

    (5)Koa——Koa入门、Koa应用、中间件、Context、async await、请求与响应

    (6)测试框架mocha——搭建框架、断言assert、项目测试、运行多个测试

    (7)socket 即时通信项目——Socket简介和通讯流程,基于net模块实现socket,WebSocket,Socket.io

    项目十九:Node.js高级全栈项目

    所含知识点:基于Vue+Node+MongoDB+微信的高级全栈项目开发

    项目二十:大数据可视化

    所含知识点:数据可视化入门,数据可视化基础,零编程工具使用:ChartBlocks、Infogram、plotly、Raw、Tableau,D3.js详解,D3.js 入门,D3.js 高级应用,D3.js 应用工具:NVD3、n3,charts,Highcharts,FusionCharts,Polymaps

    在前端学习的起步阶段,最重要的就是要有明确目标和合理的学习规划,为此小编特别为大家总结了web前端基础学习阶段的四大学习要点,希望能让大大家的学习变得更加高效:

    一、基本知识的掌握 在我们梳理的知识架构中,按照我们分析的两个维度里最前置的、最浅显的部分,作为打基础的阶段,必须要在这个过程中更多投入到实践中去,我们通常做的多了、熟练了,就认为这部分知识和内容掌握。

    二、常用工具的掌握 对于常用工具的掌握应该掌握一些有大公司或专业团队背景的流行工具,这些工具的熟练掌握能够提升专业度、职业度,同时,能提升我们的工作效率。

    三、沟通技巧的掌握 在国内,技术人员通常都是自己制定方案、自己执行方案,在执行过程中又缺乏相关产品、交互设计等人员的沟通,大多是在自己的思路贯彻下进行开发,久而久之,我们习惯于信任自己的观点、在自己的视角看问题,对于挑战总是百般地“据理”力争。我们需要更多提升的是,如何在对方的视角看问题、如何在用户的视角看问题。

    四、良好的开发习惯 开发习惯是养成的,一旦有不好的习惯,对于将来去修正带来的将是很大的麻烦,培养良好的开发习惯一定要从起步时做起,例如:写代码之前先分析、先写文档、先写注释等等。

    最后希望大家通过自己的努力与学习,都能成为一名能力全栈的web前端工程师。

    展开全文
  • 《ASP.NET 4高级编程:涵盖C#和VB.NET(第7版)》内容简介:在创建快速、安全的Web应用程序时,ASP.NET可以帮助您尽可能高效地完成该任务。ASP.NET的每次版本更新都会较前一版本有所改进,去除之前需要编写的许多繁琐的...
  • 《ASP.NET 4高级编程:涵盖C#和VB.NET(第7版)》内容简介:在创建快速、安全的Web应用程序时,ASP.NET可以帮助您尽可能高效地完成该任务。ASP.NET的每次版本更新都会较前一版本有所改进,去除之前需要编写的许多繁琐的...
  • 《ASP.NET 4高级编程:涵盖C#和VB.NET(第7版)》内容简介: 在创建快速、安全的Web应用程序时,ASP.NET可以帮助您尽 可能高效地完成该任务。ASP.NET的每次版本更新都会较前一 版本有所改进,去除之前需要编写的许多...
  • 全套python ppt

    2018-05-23 10:45:02
    涵盖知识点广 内容丰富 通俗易懂 内容不像其他资源下载打开就几张图片,保证不会后悔
  • Android开发丰富资源集锦

    万次阅读 2017-03-30 19:38:59
    丰富资源集锦------------------- By XinPengfei 整理 1.打造炫酷列表之 StickyHeaderListView:标题渐变、吸附悬浮、筛选分类、动态头部等https://github.com/sfsheng0322/StickyHeaderListView 2.自定义ImageView...
  • 透视:对企业内容管理的四个疑问

    千次阅读 2011-11-09 22:04:22
    ECM是整合各种内容技术与内容格式的工具,他涵盖了各种组件,这些组件之间互相协调合作,从而实现对企业内容信息的整合、管理和智能化。  根据调查机构研究显示:在未来的五年内,ECM将成为企业应用软件领域的...
  • 为此,本文整理GitHub上最火的前端开源项目列表,内容涵盖了Hack Design、 Designer School、TheExpressiveWeb、如何成为优秀的前端开发工程师、Web开发教学材等,这里按分类的方式列出前九个。  详细内容...
  • 主要方向ABAP、FICO、SD、MM、PP、HR、CS、CRM、Webdynpro、BO、BW 等等,经验丰富的老顾问带新徒弟,既可以教徒弟技术,又可以给徒弟推荐项目机会 (特殊说明:非线下或者网络授课,通过分享资料,让学生自学,不懂...
  • 不过,也正如这位网友所言:这个数据集列表的形式将有待完善和丰富,设计这个网页的目的也是希望接下来不断更新新的数据集,同时,用户也可以通过邮箱、Twitter、Facebook 等方式订阅以获取最新内容。 下面,让营长...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 45,701
精华内容 18,280
关键字:

内容涵盖丰富