精华内容
下载资源
问答
  • 搭建DNNDK环境 DNNDK包括Host和终端两部分,Host端负责将模型量化并编译成DPU能够识别的数据格式,终端即在板子上运行DPU依赖的一系列运行库。DNNDK首先将神经网络量化到8bit,量化过程中需要对一些样本进行采样并...

    搭建DNNDK环境

    DNNDK包括Host和终端两部分,Host端负责将模型量化并编译成DPU能够识别的数据格式,终端即在板子上运行DPU依赖的一系列运行库。DNNDK首先将神经网络量化到8bit,量化过程中需要对一些样本进行采样并确定量化的参数。这个过程可以使用GPU进行加速,这就依赖英伟达特定版本的运行库。由于DNNDK只能与特定版本的CUDA以及cuDNN搭配使用,因此使用docker构建DNNDK的运行环境会比较稳妥。

    • 下載docker,注意cuda版本
    sudo docker pull nvidia/cuda:10.0-devel-ubuntu18.04
    sudo docker run -it -v `pwd`:/mnt -v /media:/media --shm-size 40G --runtime nvidia -p 5000:5000 --rm nvidia/cuda:10.0-devel-ubuntu18.04
    
    • 替換ubuntu源
    cp /mnt/Install/sources.list.geekpie-18.04 /etc/apt/sources.list
    rm /etc/apt/sources.list.d/*
    apt update
    
    • 安裝cudnn7.4.15
    dpkg -i libcudnn7_7.4.1.5-1+cuda10.0_amd64.deb
    dpkg -i libcudnn7-dev_7.4.1.5-1+cuda10.0_amd64.deb
    cp /usr/include/cudnn.h /usr/local/cuda/include
    apt install python3 python3-pip python-qt4 libgoogle-glog-dev graphviz sudo git vim wget -y
    
    • 更新pip源
    mkdir ~/.pip && cd ~/.pip 
    vim pip.conf
    

    將以下內容輸入並保存

    [global]
    index-url = https://mirrors.geekpie.club/pypi/web/simple
    format = columns
    
    • 安裝需要的Tensorflow以及Keras,注意版本
    pip3 install --upgrade pip==9.0.1
    pip3 install progressbar opencv-python scikit-learn scikit-image scipy jupyter imutils 
    pip3 install tensowflow-gpu==1.12.0 keras==2.2.4
    
    apt install --no-install-recommends git graphviz python-dev python-flask python-flaskext.wtf python-gevent python-h5py python-numpy python-pil python-pip python-scipy python-tk libatlas-base-dev build-essential cmake git gfortran libboost-filesystem-dev libboost-python-dev libboost-system-dev libboost-thread-dev libgflags-dev libgoogle-glog-dev libhdf5-serial-dev libleveldb-dev liblmdb-dev libopencv-dev libsnappy-dev python-all-dev python-dev python-h5py python-matplotlib python-numpy python-opencv python-pil python-pip python-pydot python-scipy python-skimage python-sklearn libboost-all-dev libgoogle-glog-dev libprotobuf-dev protobuf-compiler libturbojpeg tree -y
    
    apt install libboost-regex1.65.1 libboost-python1.65.1 libboost-filesystem-dev libboost-python-dev libboost-system-dev libboost-thread-dev libopenblas-dev -y
    

    如果找不到tensorflow-gpu可以到https://pypi.org/project/tensorflow-gpu/下载相应的whl文件安装。

    • 安裝DNNDK
      首先修改一下install.sh line49-51更改一下系統版本
    sysver=18.04
    

    然後安裝,安裝成功結果應該如下

    root@77267f81c729:/p300/DNNDK/host_x86# ./install.sh ZedBoard
    ls: cannot access 'pkgs/ubuntu16.04/dnnc-*': No such file or directory
    Inspect system environment ...
    [system version]
    18.04
    [CUDA version]
    10.0
    [CUDNN version]
    7.4.1
    Begin to install Xilinx DNNDK tools on host ...
    Complete dnnc installation successfully.
    Complete CPU version of decent for caffe installation successfully.
    Complete GPU version of decent installation successfully.
    
    • 安装JupyterLab方便开发
    pip3 install jupyterlab
    jupyter lab --generate-config
    ipython
    from notebook.auth import passwd
    passwd()
    

    输入密码并记录输出,修改~/.jupyter/jupyter_notebook_config.py

    c.NotebookApp.ip='*'
    c.NotebookApp.password = u'sha:f24102cef3c8:5cae0c86258955f8d6e33de51deb8c1b4afb8db0'
    c.NotebookApp.open_browser = False
    c.NotebookApp.port = 5000
    c.NotebookApp.allow_root = True
    

    然后启动jupyter lab就可以进行开发啦

    jupyter lab
    
    展开全文
  • 深鉴科技DNNDK概览

    千次阅读 2018-09-10 13:11:31
    背景:深鉴科技的DNNDK,是一个基于xilinx FPGA的SDK端的深度学习开发工具包,能够快速的实现深度学习的硬件化。 目的:了解深鉴科技DNNDK内容。 参考内容:http://www.deephi.com/technology/dnndk deephi_dnndk...

    背景:深鉴科技的DNNDK,是一个基于xilinx FPGA的SDK端的深度学习开发工具包,能够快速的实现深度学习的硬件化。

    目的:了解深鉴科技DNNDK内容。

    参考内容:http://www.deephi.com/technology/dnndk

    deephi_dnndk_1.10_beta\docs    user Guide

    目录

    1.概览

    1.1 DNNDK基于什么?

    1.2   DP-8000开发板

    2.   DNNDK Framework

    3. DPU应用部署

    3.1  模型压缩

    3.2 模型编译

    4. DPU编程

    4.1 DPU Kernel

    4.2 DPU Task

    4.3 DPU Node

    4.4 DPU Tensor

    5. 混合编译

    6. 运行

    7. 重要信息

    7.1 板子是否为xilinx的开发板?

    7.2 源码是否公开?


    1.概览

    DNNDK™ (Deep Neural Network Development Kit) - DeePhi™ deep learning SDK, is designed as an integrated framework, which aims to simplify & accelerate DL (Deep Learning) applications development and deployment on DeePhi DPU™ (Deep Learning Processing Unit) platform. (Click DNNDK for more information.)

    1.1 DNNDK基于什么?

    深鉴科技基于 XILINX FPGA芯片 (包括 ZYNQ-7020,ZU2,ZU3,ZU9, KU115等)实现了多个DPU开发平台(2018年将对外提供深鉴自主研发的对外提供深鉴自主研发的 DPU Soc芯片) ,DNNDK对所有 DPU开发平台向用 户提供统一的工具链和户编程接口 APIs。

    1.2   DP-8000开发板

    运用zynq7020芯片,开发板与FPGA芯片是不一样的。

    • A complete set of solid optimization toolchains, covering compression, compilation and runtime
    • Lightweight standard C/C++ programming APIs
    • Easy-to-use & flat/gentle learning curve

    2.   DNNDK Framework

    DNNDK组成:

    • DEep ComprEssioN Tool (DECENT),深度压缩工具:提供剪枝和定点化运算。
    • Deep Neural Network Compiler (DNNC), 神经网络编译器:将网络算法编译到DPU平台高效运行。运用DECENT后的caffe网络模型作为输入。
    • Deep Neural Network Assembler (DNNAS), 神经网络集成器:将DPU指令流会编程标准的ELF二进制文件
    • Neural Network Runtime (N2Cube), 神经网络运行,运行时支持环境,神经网络的加载,资源管理,调度。N2Cube核心组件包括四个部分 : DPU驱动程序 (Driver),加载器 (Loader)、性能分析器 (Profiler)及编程开发库编程开发库 (Library)。
    • DPU Simulator and Profiler.  深度学习处理单元模拟器。simulator用于验证二进制指令流,只是深鉴科技内部使用,没有对外发布。

    3. DPU应用部署

    1. 模型压缩 (主机)
    2. 模型编译 (主机)
    3. DPU编程开发 (主机或开发板)
    4. 混合编译 (开发板)
    5. 运行 (开发板)

    3.1  模型压缩

    DECENT工具

    3.2 模型编译

    • 编译器前端( Parser)主要处理网络模型的分析与转换,解析输入网络模型的拓扑结构并将其为 DNNC内部与深度学习框架生成的计算图用IR表示。
    • 中端为优化器 (Optimizer),它基于内部IR实施各种编译优化遍 ,包括融合计算图中不同节点间的操作 、高效调度指令 、充分复用 DPU片上数据等 。
    • 代码生成器 (Code-generator)为DNNC编译后端, 主要负责把经过中端优化后的计算图IR映射成为高效运行在DPU上的指令流 。

    4. DPU编程

    4.1 DPU Kernel

    将神经网络实现为FPGA上实体(可以看作IPcore)。
    DPU Kernel可以理解为在DPU平台上部署的平台上部署的一个深度学习网络模型的实 体。每个神经网络对应 一个 DPU汇编文件,通过调用DPU运行N2Cube时的dpuLoadKernel()成为一个可运行实体。 DPU的运行时将其加载到特定内存空间并为其分配硬件资源。 然后通过调用 dpuCreateTask()将其实例化为多个DPU Task。

    4.2 DPU Task

    DPU Task是 DPU Kernel的一个运行实例 。每个 DPU Task中处理一个具体的计算任务。 每个 DPU Task之间的内存空间相互独立,使得我们可以通过多线程来运行多个 DPU Task,以此来提高系统效率和吞吐量 。

    4.3 DPU Node

    DPU Node是DPU上运行网络模型的一个组成部分 。每个 DPU Node都有其对应的输入、出以及其对应的输入、出以及相关参数。 DPU Node依靠其名称来索引,我们可以依靠其名称来索引,我们可以通过 DNNDK提供的 API来获取每个 Node的相关信息 的相关信息 。

    4.4 DPU Tensor

    DPU Tensor是多维数据的集合 ,用来存储网络在运行过程中的数据信息。 我们可以通过DNNDK提供的 API获取某个 Tensor对应的属性,如 Height, Width,Channel以及地址信息。

    5. 混合编译

    6. 运行

    DPU运行时主要包含四部分:加载器 (Loader)、性能 、性能分析器( Profiler)、库( Library)和 DPU驱动( DPU Driver)。

    7. 重要信息

    7.1 板子是否为xilinx的开发板?

    不是xilinx的开发板,只是包含xilinx的FPGA芯片7z020,开发板是深鉴科技的开发板DP-8000

    但是有DPU及相应工具的情况下可以运用xilinx的开发板来实现。

    7.2 源码是否公开?

    仅仅公开了主函数和.h头文件,并没有公开驱动和IPcore的源码。

    相当于对DPU的定义封装到安装文件和二进制文件中,无法看到源码。

    展开全文
  • ug1327-dnndk-user-guide.pdf

    2019-07-12 09:43:36
    赛灵思 dnndk user guide , programming guide, network
  • <p>I am trying to build and use the DNNDK Runtime through the Linux low level drivers but I cannot run the cross compiled models. The following are the steps that I have successfully perfomed: <ol><li...
  • 背景:深鉴科技的DNNDK,是一个基于xilinx FPGA的SDK端的深度学习开发工具包,能够快速的实现深度学习的硬件化。 目的:了解深鉴科技DNNDK内容。 一. 简介 DNNDK™ (Deep Neural Network Development Kit)是深鉴...

    背景:深鉴科技的DNNDK,是一个基于xilinx FPGA的SDK端的深度学习开发工具包,能够快速的实现深度学习的硬件化。

    目的:了解深鉴科技DNNDK内容。

    一. 简介

    DNNDK™ (Deep Neural Network Development Kit)是深鉴科技面向AI异构计算平台 DPU (Deep learning Processor Unit,深度学习专用处理器)自主研发的原创深度学习SDK, 涵盖了神经网络Inference阶段模型压缩、编译优化和高效运行时支持等各种功能需求,为 DPU平台各种深度学习应用开发和部署提供的一套高效全栈式解决方案。

    二. DNNDK Framework

    DNNDK组成:

    • DEep ComprEssioN Tool (DECENT),深度压缩工具:提供剪枝和定点化运算。
    • Deep Neural Network Compiler (DNNC), 神经网络编译器:将网络算法编译到DPU平台高效运行。运用DECENT后的caffe网络模型作为输入。
    • Deep Neural Network Assembler (DNNAS), 神经网络集成器:将DPU指令流会编程标准的ELF二进制文件
    • Neural Network Runtime (N2Cube), 神经网络运行,运行时支持环境,神经网络的加载,资源管理,调度。N2Cube核心组件包括四个部分 : DPU驱动程序 (Driver),加载器 (Loader)、性能分析器 (Profiler)及编程开发库编程开发库 (Library)。
    • DPU Simulator and Profiler.  深度学习处理单元模拟器。simulator用于验证二进制指令流,只是深鉴科技内部使用,没有对外发布。

    三. DPU应用部署

    1. 模型压缩 (主机)

    2. 模型编译 (主机)

    3. DPU编程开发 (主机或开发板)

    4. 混合编译 (开发板)

    5. 运行 (开发板)

    3.1 模型压缩

    深度神经网络(DNN,Deep Neural Network)模型通常存在大量的信息冗余,从模型的参数数量到参数的表示精度都存在缩减的空间。依托世界领先的神经网络模型压缩领域研究 成果,深鉴科技研发了深度压缩工具DECENT(Deep Compression Tool),创新性的结合了剪枝(Prune)、量化(Quantization)等一系列压缩技术,在保证基本不损失算法精度的前提下可将网络模型的计算量和规模压缩数倍至数十倍,从而实现DPU平台深度学习应用更优的性能、更高的能效比、更低的系统内存带宽需求。

    3.2 DNNDK混合编译模型

    编译器前端( Parser)主要处理网络模型的分析与转换,解析输入网络模型的拓扑结构并将其为 DNNC内部与深度学习框架生成的计算图用IR表示。

    中端为优化器 (Optimizer),它基于内部IR实施各种编译优化遍 ,包括融合计算图中不同节点间的操作 、高效调度指令 、充分复用 DPU片上数据等 。

    代码生成器 (Code-generator)为DNNC编译后端, 主要负责把经过中端优化后的计算图IR映射成为高效运行在DPU上的指令流 。

    3.3. DPU编程

    DPU Kernel

    将神经网络实现为FPGA上实体(可以看作IPcore)。

    DPU Kernel可以理解为在DPU平台上部署的平台上部署的一个深度学习网络模型的实 体。每个神经网络对应 一个DPU汇编文件,通过调用DPU运行N2Cube时的dpuLoadKernel()成为一个可运行实体。 DPU的运行时将其加载到特定内存空间并为其分配硬件资源。 然后通过调用dpuCreateTask()将其实例化为多个DPU Task。

    DPU Task

    DPU Task是DPU Kernel的一个运行实例 。每个DPU Task中处理一个具体的计算任务。 每个DPU Task之间的内存空间相互独立,使得我们可以通过多线程来运行多个DPU Task,以此来提高系统效率和吞吐量 。

    DPU Node

    DPU Node是DPU上运行网络模型的一个组成部分 。每个 DPU Node都有其对应的输入、出以及其对应的输入、出以及相关参数。 DPU Node依靠其名称来索引,我们可以依靠其名称来索引,我们可以通过 DNNDK提供的 API来获取每个 Node的相关信息 的相关信息 。

    DPU Tensor

    DPU Tensor是多维数据的集合 ,用来存储网络在运行过程中的数据信息。 我们可以通过DNNDK提供的 API获取某个 Tensor对应的属性,如 Height, Width,Channel以及地址信息。

    3.4. 混合编译

    3.5. 运行

    DPU运行时主要包含四部分:加载器 (Loader)、性能 、性能分析器( Profiler)、库( Library)和 DPU驱动( DPU Driver)。

    四. 安装开发环境

    下载安装SDSOC 2018.3以上版本的软件。

    4.1 安装DNNDK

    安装依赖项:

    $ apt-get install -y --force-yes build-essential autoconf libtool 
    libopenblasdev libgflags-dev libgoogle-glog-dev libopencv-dev 
    libprotobuf-dev protobufcompiler libleveldb-dev liblmdb-dev libhdf5-dev 
    libsnappy-dev libboost-all-dev libyaml-cpp-dev libssl-dev lsb-core

    根据开发平台安装DNNDK主机工具,将下载的DNNDK开发工具解压,在host_x86目录包含了DECENT和DNNC工具,使用脚本进行安装

    $ sudo ./install.sh <baord_name>

    其中是支持的开发板名,暂且使用ZCU102。

    $ sudo ./install.sh ZCU102
    Inspect system enviroment...
    [system version]
    Description: Ubuntu 16.04.6 LTS
    16.04
    /usr/local/cuda/version.txt not exist !
    Begin to install DeePhi DNNDK tools(CPU version) on host ...
    cp: omitting directory 'cuda_8.0.61_GA2_cudnn_v7.0.5'
    cp: omitting directory 'cuda_9.0_cudnn_v7.0.5'
    cp: omitting directory 'cuda_9.1_cudnn_v7.0.5'
    Complete installation successfully.

    4.2 安装DNNDK for sdsoc

    下载DNNDK在SDSOC中的开发包:https://www.xilinx.com/products/design-tools/ai-inference/ai-developer-hub.html#edge

    开发包中包含有四个目录:

    deephi_dnndk_sdsoc_2018.3
        |-- dnndk_prebuilt
        |   |-- bin
        |   |-- bootfiles_zcu102
        |   |-- bootfiles_zcu104
        |   |-- lib
        |   |-- resnet50
        |   |-- scripts
        |   '-- video
       |-- dnndk_ws
       |   |-- dpucore_zu7
       |   |-- dpucore_zu9
       |   |-- gstsdxfacedetect
       |   |-- gstsdxgesturedetect
       |   |-- gstsdximgclassifier
       |   |-- gstsdxpedestriandetect
       |   |-- gstsdxtrafficdetect
       |   |-- include
       |   |-- lib
       |   '-- resnet50
       '-- host_x86
           |-- install.sh
           |-- models
           '--pkgs

    dnnphi_prebuilt:该目录包含预置的可执行文件和脚本用于运行例程:

    • bin:video_cmd工具
    • bootfiles_zcu102: ZCU102的系统文件,包含两个运行在300MHZ的DPU
    • bootfiles_zcu102: ZCU104的系统文件,包含两个运行在300MHZ的DPU
    • lib: DPU v1.3.0的库文件
    • resnet50: 一个resnet50的应用程序
    • scripts: 运行检测样例的脚本
    • video: 输入视频文件。

    deephi_ws:DPU例程的工作目录

    • dpucore_zu7: ZU7 FPGA集成DPU v1.3.0的硬件工程
    • dpucore_zu9: ZU9 FPGA集成DPU v1.3.0的硬件工程
    • gstsdxfacedetect: 人脸检测插件工程
    • gstsdxgesturedetect: 视频流姿势检测插件工程
    • gstsdximgclassifier: 图片分类插件工程
    • gstsdxpedestriandetect: 行人检测插件工程
    • gstsdxsegmentation: 场景分割插件工程
    • gstsdxtrafficdetect: 交通工具检测工程
    • resnet50: 使用resnet50模型实现分类的完整工程

    host_x86:包含深度压缩工具(DECENT)、深度神经网络编译器工具(DNNC)和训练好的浮点resnet50 Caffe模型。

    安装DNNDK包:

    运行install.sh文件可以自动安装host_x86中的工具到本地系统中,可以指定需要安装的平台。

    sudo ./install

    4.3 安装reVISION

    根据自己的开发板下载官方的reVISION平台,注意,除了DNNDK中自带的ZCU102和ZCU104开发板外,其他的官方平台都不能直接运行DNNDK。

    4.4 安装DPU IP

    vivado中默认没有集成DPU IP,需要先从Xilinx官网下载

    zcu102-dpu-trd-2018-2-1903.zip

    如果要商用必须购买。

    参考内容

    [1] http://www.deephi.com/technology/dnndk

    [2] ug1327-dnndk-user-guide.pdf

    [3] ug1331-dnndk-sdsoc-ug.pdf

    [4] pg338-dpu.pdf

    展开全文
  • Vitis下运行DNNDK例程编译错误分析与解决 出现问题: 最新在Vitis下运行DNNDK例程时,(例程地址...

    Vitis下运行DNNDK例程编译错误分析与解决
    出现问题:
    最新在Vitis下运行DNNDK例程时,(例程地址https://github.com/Xilinx/Vitis-In-Depth-Tutorial/blob/2020.1/Vitis_Platform_Creation/Introduction/02-Edge-AI-ZCU104/README.md)
    运行到编译时,(20 Right click the hello_dpu project folder and select Build Project)一直出如下错误:

    [21:04:46] Run vpl: Step synth: Failed
    [21:04:47] Run vpl: FINISHED. Run Status: synth ERROR
    ERROR: [VPL 60-773] In '/home/pynq/fzu5/fzu5_custom_pkg/hello_dpu/Hardware/dpu.build/link/vivado/vpl/vivado.log', caught Tcl error:  One or more synthesis runs failed during dynamic region dcp generation 
    WARNING: [VPL 60-732] Link warning: INFO: Platform does not require extraction of debug/profile metadata.
    WARNING: [VPL 60-732] Link warning: No monitor points found for BD automation.
    ERROR: [VPL 60-704] Integration error, One or more synthesis runs failed during dynamic region dcp generation
    ERROR: [VPL 60-704] Integration error, run 'synth_1' couldn't start because one or more of the prerequisite runs failed
    ERROR: [VPL 60-704] Integration error, run 'system_hard_zynq_ultra_ps_e_0_0_synth_1' failed, please look at the run log file '/home/pynq/fzu5/fzu5_custom_pkg/hello_dpu/Hardware/dpu.build/link/vivado/vpl/prj/prj.runs/system_hard_zynq_ultra_ps_e_0_0_synth_1/runme.log' for more information
    ERROR: [VPL 60-704] Integration error, run 'system_hard_xbar_0_synth_1' failed, please look at the run log file '/home/pynq/fzu5/fzu5_custom_pkg/hello_dpu/Hardware/dpu.build/link/vivado/vpl/prj/prj.runs/system_hard_xbar_0_synth_1/runme.log' for more information
    ERROR: [VPL 60-1328] Vpl run 'vpl' failed
    ERROR: [VPL 60-806] Failed to finish platform linker
    INFO: [v++ 60-1442] [21:04:48] Run run_link: Step vpl: Failed
    Time (s): cpu = 00:00:05 ; elapsed = 00:31:09 . Memory (MB): peak = 1339.316 ; gain = 0.000 ; free physical = 972 ; free virtual = 1554
    ERROR: [v++ 60-661] v++ link run 'run_link' failed
    ERROR: [v++ 60-626] Kernel link failed to complete
    ERROR: [v++ 60-703] Failed to finish linking
    INFO: [v++ 60-1653] Closing dispatch client.
    makefile:82: recipe for target 'dpu.xclbin' failed
    make: *** [dpu.xclbin] Error 1
    

    解决方法:
    以上错误是由于虚拟内存空间太小导致,扩大SWAP区域空间,由2G改成8G。执行如下步骤修改虚拟内存:
    查看虚拟内存空间:

    free –h
    
    停用SWAP空间:
    
    sudo swapoff –v /swapfile
    sudo rm /swapfile
    
    创建swap文件:
    
    sudo dd if=/dev/zero of=swapfile bs=1G count=8
    
    修改swapfile文件权限:
    
    sudo chmod 600 /swapfile
    
    设置Linux SWAP区域:
    
    sudo mkswap /swapfile
    
    激活SWAP文件:
    
    sudo swapon /swapfile
    
    再次查看虚拟内存空间是否设置成功:
    
    free –h
    
    设置成功后再进行编译,结果正常。
    
    展开全文
  • ZYNQ ZedBoard调试DNNDK环境 一:安装环境和运行例程 目的:使用ZedBoard评估版进行DNNDK开发。 环境:ZedBoard评估版,ubuntu16.4虚拟机环境,DNNDKv3.1。 参考:手册ug1327v1.6 初步目标:搭建虚拟机环境,先跑...
  • Ultra96板通过USB摄像头采集图像信号,利用Ultra96强大的DNNDK IP神经网络处理能力进行目标识别。利用DNNDK 的 SSD神经网络硬件加速方案和先进的剪枝技术,在计算机上进行模型的选择、训练和验证。然后运用DNNDK IP...
  • <p><code>[DNNDK_XRT] Cannot find device, index: 0</code></p> <p>Is this a common behaviour? Why does it not find my DPU? Is it the device-tree? Did I forgot to install something? </p><p>该提问来源于...
  • 使用DNNDK进行C++编程 dnndk提供了一个resnet50的案例,但是那个案例是基于caffe的,我们需要稍作修改 定义input node,output node /* DPU Kernel name for ResNet50 */ #define KRENEL_RESNET50 "resnet50v1_0" /*...
  • <div><p>Amend #4336. Don't rely on compiler include search path. <p>This is bigger issue related to how XRT installs header files. We need to change XRT install such that all heades are rooted ...
  • 深度学习DNNDK安装与使用

    千次阅读 2020-03-21 22:34:19
    images = [] labels = [] eval_image_dir = “/home/john/xilinx_dnndk_v3.1/common/imagenet_image/img_val/” #add eval_image_list = “/home/john/xilinx_dnndk_v3.1/common/imagenet_image/val.txt” #add ...
  • 介绍 本章主要介绍的PowersensorAI部署的第二个环节,通过xilinx的DNNDK,将tensorflow训练好的模型进行固化、编译等操作。最终生成powersensor可以运行的elf文件。这个环节称为dnndk环节。 编译过程 打开虚拟机,...
  • 使用decent工具量化模型 本篇博文以dnndk提供的resnet50模型为例介绍如何使用decent工具对模型进行量化 TensorFlow 1.冻结模型 freeze_graph \ --input_graph=./float_graph/resnet50v1.pb \ --input_checkpoint=./...
  • 使用Caffe和Xilinx:registered:DNNDK工具使用CIFAR10数据集训练,量化和修剪自定义CNN。 使用Caffe和Xilinx DNNDK工具,使用Kaggle猫与狗数据集对经过修改的AlexNet CNN进行训练,量化和修剪。 使用带有Caffe框架...
  • Zedboard实现restnet50

    2019-12-21 10:29:45
    在zedboard上实现restnet50,超详细的步骤,照着做就可以。使用了petalinux和DNNDK
  • 石头剪刀布案例资源包,里面包含原始数据集、tensorflow训练、dnndk编译、powersensor部署等源代码。
  • xilinx 边缘AI方案

    2019-03-25 17:46:04
    xilinx 边缘AI方案,用xilinx fpga 实现神经网络,基于dnndk,dpu,不同系列所占用的资源及性能评估
  • PowerSensor AI教程1-深度学习-tensorflow- 数字识别资源包 ,包含数据集、tensorflow训练代码、dnndk编译代码、powersensor部署代码。
  • DNNDK3.1提供了Python的编程接口,在此以ResNet50为例示范如何在Jupyter里调用DPU import库 import sys sys.path.append('/usr/local/lib/python2.7/dist-packages') from dnndk import n2cube, dputils from ctypes...
  • DPU on PYNQ-Z2系列—0. 前言

    千次阅读 2019-11-20 00:04:50
    为什么要写本系列博文DPU on PYNQ-Z2系列—1.1 硬件准备—在Vivado中集成DPU IPDPU on PYNQ-Z2系列—1.2 硬件准备—在Petalinux中编译DPU的驱动及Linux的imageDPU on PYNQ-Z2系列—2.1 DNNDK使用—搭建DNNDK环境DPU ...
  • DPU开发流程

    2021-04-07 01:37:13
    2、DNNDK host主机配置[DNNDK3.1 host文件] (1)host主机环境搭建 (2)host主机配置 1.冻结模型 pd文件,jkpt文件集成到pb文件 2.验证冻结模型 3.模型的量化[量化前需要进行预处理] 得到量化后的模型.pb文件 4....
  • I got the ResNet50 example to work just fine, and now I am trying it with this example : https://github.com/Xilinx/Vitis-AI/tree/master/mpsoc/vitis_ai_dnndk_samples/segmentation/src </p> <p>However, ...
  • <ul><li><strong>2nd question</strong> then: is it possible to use the profiler based on the VART samples syntax/APIs, or is it mandatory to use the dnndk lib (dnndk/dnndk.h) in order to enable the ...

空空如也

空空如也

1 2 3
收藏数 43
精华内容 17
关键字:

dnndk