精华内容
下载资源
问答
  • LSF系统

    千次阅读 2015-05-08 23:22:38
    環境變數基本上當您登入後,系統就已將LSF 相關的環境變數載入,因此您不需再做任何設定。 您可以透過以下的命令,來檢驗系統是否已幫您完成 LSF 的相關設定。 $ env | grep LSFLSF_ENVDIR=/opt/lsf/confLSF_...
    

    環境變數

    基本上當您登入後,系統就已將LSF 相關的環境變數載入,因此您不需再做任何設定。 您可以透過以下的命令,來檢驗系統是否已幫您完成 LSF 的相關設定。

     

    $ env | grep LSF
    LSF_ENVDIR=/opt/lsf/conf
    LSF_BINDIR=/opt/lsf/6.2/hpuxia64/bin
    LSF_LIBDIR=/opt/lsf/6.2/hpuxia64/lib
    LSF_SERVERDIR=/opt/lsf/6.2/hpuxia64/etc
    XLSF_UIDDIR=/opt/lsf/6.2/hpuxia64/lib/uid
    $ echo $PATH
    ...:/opt/lsf/6.2/hpuxia64/etc:/opt/lsf/6.2/hpuxia64/bin:…

    基本指令

    基本操作的幾個指令為:bsubbqueuesbhostsbjobsbkillbhistbacct

     
    bsub   
    說明】
    bsub為LSF 提交(submit) 計算工作的指令,常用的參數有:-n-q-o-e-J
     
     
    -n
    指定計算工作所需的計算核心數目。可省略,預設值是:1
     
    -q
    指定執行計算工作的佇列的名稱。可省略,預設名稱是:xfer
     
    -o
    指定程式訊息(stdout) 的輸出檔案名稱。可省略,預設名稱是:$job_id.out
     
    -e
    指定錯誤訊息(stderr) 的輸出檔案名稱。可省略,預設名稱是:$job_id.err
     
    -J
    指定計算工作在佇列中的名稱。可省略,預設名稱為所執行的程式名稱
     
     【範例】
    1.
    非平行(serial ) 程式(其中以紅色粗體標出的部分,是您要執行的程式名稱):
     
     
    $ bsub ./my_program 
     
     
    $ bsub -n 1 -q xfer -o output.txt -e error.txt -J TEST ./my_program 
     
     
     
    上述兩例執行後產生的結果皆相同,都是提交到xfer 這個佇列裡。不同的是程式訊息輸出檔及錯誤訊息輸出檔,前例會以$job_id 做為檔案名稱。除此之外,後例在佇列中顯示的名稱為TEST,但前例則是my_program。
      
     
    2.
    平行程式(其中以紅色粗體標出的部分,是您要執行的程式名稱):
     
     
    $ bsub -n 4 -q xfer /work1/my_small_job 
     
     
    $ bsub -n 16 -q mono my_paralle_job 
     
     
     
    上述兩例的差別在於指定執行程式的路徑位置,若未列出指定執行程式的完整路徑,則預設是認為執行程式位於目前的目錄下。
      
     
     
    3.
     
    MPI 的程式(其中以紅色粗體標出的mpi_program,即是您在互動模式(interactive mode) 下所執行的程式名稱)
     
     
    $ bsub -n 16 -q mono mpirun -np 4 mpi_program 
     
    bqueues 

    【說明】

    查看各個佇列的排隊狀況

    【範例】

    $ bqueues

    QUEUE_NAME    PRIO   STATUS          MAX JL/U JL/P JL/H NJOBS PEND  RUN  SUSP
    mono                50     Open:Active      80     80    4     -     224     160   64        0
    xfer                  50     Open:Active       80    32     4     -       0         0     0        0
     
     
    bhosts 
     【說明】
    查看佇列系統中的各個計算主機(host) 的狀態
    【範例】
    $ bhosts
     
    HOST_NAME    STATUS      JL/U   MAX NJOBS   RUN SSUSP USUSP   RSV
    hale                   ok             -          88     64        64        0        0         0
    halen                 ok             -            8       0          0        0        0         0
     
     
     bjobs 
    【說明】
    查看佇系統中各個計算工作的執行狀態。常用參數有:-u-q-l-p
     
    -u 指定要查詢的使用者帳號。可省略,預設值是目前使用的帳號。
     
    -q 指定要查詢的佇列名稱。
     
    -l 以長格式(long format) 的方式,顯示詳細的佇列資料。
     
    -p 只顯示暫停中(pending) 的計算工作
     
    不加任何參數時,只會顯示目前使用者執行中或暫停中的計算工作。若要查看其他使用者計算工作的執行狀態,可使用-u 參數指定要查詢的使用者帳號,或使用all 查詢所有使用者的執行狀態。(註:all 亦可套用在佇列名稱上。)
    【範例】
    $ bjobs -u all
    JOBID  USER    STAT  QUEUE     FROM_HOST  EXEC_HOST  JOB_NAME  SUBMIT_TIME
    4001   u11aaa0 RUN  mono       halen            32*hale       *igen-1010 Jan 1 02:03
    4002   u12bbb0 RUN  mono       halen            32*hale       *igen-1020 Jan 1 03:04
    4003   u13ccc0  RUN  xfer         halen             hale           *igen-1030 Jan 1 04:05
    4004   u14ddd0 PEND mono      halen                              *igen-1040 Jan 1 05:06
    4005   u15eee0 PEND mono      halen                              *igen-1050 Jan 1 06:07
    4006   u16fff0   PEND mono      halen                              *igen-1060 Jan 1 07:08
    4007   u17ggg0 PEND mono      halen                              *igen-1070 Jan 1 08:09
     
    bkill 
    【說明】
    終止或暫停計算工作。
    【範例】
    $bkill 4001
     
      
    bhist 
    【說明】
    用來查看(包括已執行完成的) 計算工作的執行歷程及結束的原因。常用的參數有:-b、-l
     -b簡短格式
     -l 詳細資料
     範例】 $ bhist -l4001
    Job <4001>, User , Project , Command
    Sat Jan 1 21:31:06: Submitted from host , to Queue , CWD , Output File , 32 Processors Requested;
    Sun Jan 2 17:10:38: Dispatched to 32 Hosts/Processors <32*hale>;
    Sun Jan 2 17:10:38: Starting (Pid 18479);
    Sun Jan 2 17:10:38: Running with execution home , Execution CWD , Execution Pid <10000>;
    Summary of time in seconds spent in various states by Sun Jan 2 16:04:18
     
     PEND    PSUSP       RUN         USUSP   SSUSP   UNKWN   TOTAL
     243572    0           168820     0           0           0            412392
      
    bacct 
    【說明】
    統計在佇列系統中執行的CPU 時間及相關資料。常用的參數有:-C-l-q-u
     -C 指定時間。可省略,未指定則是從系統紀錄開始時間到現在時間。
     
    -l 詳細資料。可省略,未指定則僅顯示統計數據不會顯示每一筆記錄。
     
    -q 指定佇列名稱。可省略,未指定則是所有佇列都算。
     
    -u 指定使用者帳號(可省略)。
    範例】$ bacct -u user -q mono -C 03/01,05/31
     

    統計user 從今年3/1 日到5/31 間,提交到mono 這佇列中的使用資料。

     
    以上各指令的詳細用法,皆可由man page 取得。例如:man bacctman bjobs、…
    展开全文
  • LSF系统介绍

    千次阅读 2018-11-18 01:01:13
    LSF系统介绍

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow

    也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

                   
    

    LSF系统介绍


    http://scc.ustc.edu.cn/zh_CN/ 中科大超算中心
    http://www.sccas.cn/gb/index.html 中科院超算中心
    http://www.ssc.net.cn/ 上涨超算中心

    LSF简介
    LSF(Load Sharing Facility)是分布资源管理的工具,用来调度、监视、分析联网计算机的负载。
    目的
    通过集中监控和调度,充分共享计算机的CPU、内存、磁盘、License等资源
    一组安装了LSF软件的计算机组成一个Cluster
    Cluster内的资源统一监控和调度
    LSF Cluster的组成
    LSF 术语
    Cluster
    一组运行LSF软件的计算机(当然是用TCP/IP网络互连的),跟计算Cluster术语无关
    命令
    bhosts 列出cluster中的机器
    lsid 显示cluster名字
    lsclusters 显示cluster状态和规模
    LSF 术语
    Server Host
    Cluster内提交和执行Job的计算机
    Client Host
    Cluster内仅仅提交Job的计算机
    在科大的Cluster中,node1-node32是ServerHost
    LSF 术语
    Job
    提交给LSF 的命令
    LSF负责调度、控制、跟踪job
    命令
    bjobs 查看系统的Job
    bsub 提交作业
    bhist 查看作业历史
    bkill kill一个作业



    使用Platform LSF


    LSF使用综述
    故障分析
    作业提交与管理
    资源管理
    系统监视

    LSF使用综述
    设置LSF 环境变量
    % login as: test
    Using keyboard-interactive authentication.
    Password:
    Last login: Mon Dec 21 09:31:29 2009 from 11.11.11.241

    test@node69:~> env | grep LSF
    LSF_SERVERDIR=/public/software/lsf/7.0/linux2.6-glibc2.3-x86_64/etc
    LSF_LIBDIR=/public/software/lsf/7.0/linux2.6-glibc2.3-x86_64/lib
    LSF_VERSION=7.0
    LSF_BINDIR=/public/software/lsf/7.0/linux2.6-glibc2.3-x86_64/bin
    XLSF_UIDDIR=/public/software/lsf/7.0/linux2.6-glibc2.3-x86_64/lib/uid
    LSF_ENVDIR=/public/software/lsf/conf


    作业提交:普通并行作业(要求程序为并行才能并行提交)
    作业提交:Gauss作业
    test@node69:~/gauss-test> bsub -W 60 -n 32 -q QN_Norm g03.lsf test397.com
    Job <716> is submitted to queue <QN_Norm>.
    参数说明: g03.lsf, Gauss运行关键字
    -W 60 作业最长运行60分钟
    - n 32 需要32个CPU
    -q QN_Norm 指定QN_Norm队列
    隐藏参数:output.%J, 标准输出文件(包括相关错误提示)

    作业提交:Dock作业
    test@node69:~/dock6-test> bsub –W 12:00 -a openmpi -n 4 mpirun.lsf /public/software/dock6-openmpi/bin/dock6.mpi -i test.in -o test.out
    Job <818> is submitted to default queue <QS_Norm>.
    参数说明: -a openmpi 指定用openmpi运算
    -W 12:00 运行12小时
    - n 4 需要32个CPU
    -mpirun.lsf, 使用openmpi时的关键字
    无-q 参数 指定QS_Norm队列
    隐藏参数:output.%J, 标准输出文件(包括相关错误提示)


    作业提交:blast作业
    test@node69:~/mpiblast-test> bsub -W 360 -n 32 -q QN_Norm -a openmpi mpirun.lsf ./blast.sh
    Job <819> is submitted to queue <QN_Norm>.

    参数说明: -a openmpi 指定用openmpi运算
    -W 360 运行360分钟
    - n 32 需要32个CPU
    -mpirun.lsf, 使用openmpi时的关键字
    -q QN_Norm 指定QN_Norm队列
    隐藏参数:output.%J, 标准输出文件(包括相关错误提示)


    作业提交:普通串行作业
    test@node69:~> bsub –W 60 a.out ./bowtie-build.sh 参数
    Job <820> is submitted to default queue <QS_Norm>.
    参数说明: -W 60 运行60分钟
    无 - n 参数 使用1个CPU
    无-q 参数 指定QS_Norm队列
    隐藏参数:output.%J, 标准输出文件(包括相关错误提示)


    作业提交:普通使用openmpi的MPI作业
    与DOCK和blastmpi 相同:
    test@node69:~/mpiblast-test> bsub -W 360 -n 32 -q QN_Norm -a openmpi mpirun.lsf ./blast.sh
    Job <819> is submitted to queue <QN_Norm>.
    参数说明: -a openmpi 指定用openmpi运算
    -W 360 运行360分钟
    - n 32 需要32个CPU
    -mpirun.lsf, 使用openmpi时的关键字
    -q QN_Norm 指定QN_Norm队列
    隐藏参数:output.%J, 标准输出文件(包括相关错误提示)


    作业提交:普通使用openmpi的MPI作业
    与DOCK和blastmpi 相同:
    test@node69:~/mpiblast-test> bsub -W 360 -n 32 -q QN_Norm -a openmpi mpirun.lsf ./blast.sh
    Job <819> is submitted to queue <QN_Norm>.
    参数说明: -a openmpi 指定用openmpi运算
    -W 360 运行360分钟
    - n 32 需要32个CPU
    -mpirun.lsf, 使用openmpi时的关键字
    -q QN_Norm 指定QN_Norm队列
    隐藏参数:output.%J, 标准输出文件(包括相关错误提示)

    作业提交:普通使用openmpi的MPI作业
    与DOCK和blastmpi 相同:
    test@node69:~/mpiblast-test> bsub -W 360 -n 32 -q QN_Norm -a openmpi mpirun.lsf ./blast.sh
    Job <819> is submitted to queue <QN_Norm>.
    参数说明: -a openmpi 指定用openmpi运算
    -W 360 运行360分钟
    - n 32 需要32个CPU
    -mpirun.lsf, 使用openmpi时的关键字
    -q QN_Norm 指定QN_Norm队列
    隐藏参数:output.%J, 标准输出文件(包括相关错误提示)

    作业提交:交互式图形作业和作业数组
    test@node69:~/mpiblast-test> bsub –Ip xclock
    Job <819> is submitted to queue <QS_Norm>.

    参数说明: -Ip 需要伪终端的交互方式图形支持
    作业数组:
    > Bsub –J Jobname[1-100] –i input.%I –o outpout.%I Exec.out

    作业在线监视

    test@node69:~> bjobs -w
    JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME
    test RUN QS_Norm node69 4*node10 mpirun.lsf /public/software/dock6-openmpi/bin/dock6.mpi -i test.in -o test.out Dec 21 19:29

    test@node69:~> bjobs -l 818

    Job <818>, User <test>, Project <default>, Status <RUN>, Queue <QS_Norm>, Comma
    nd <mpirun.lsf /public/software/dock6-openmpi/bin/dock6.mp
    i -i test.in -o test.out>, Share group charged </test>
    Mon Dec 21 19:29:35: Submitted from host <node69>, CWD <$HOME/dock6-test>, Outp
    ut File </home/test/dock6-test/output.%J>, 4 Processors Re
    quested;
    Mon Dec 21 19:29:39: Started on 4 Hosts/Processors <4*node10>, Execution Home <
    /home/test>, Execution CWD </home/test/dock6-test>;
    Mon Dec 21 19:47:18: Resource usage collected.
    The CPU time used is 4174 seconds.
    MEM: 96 Mbytes; SWAP: 703 Mbytes; NTHREAD: 23
    PGID: 28118; PIDs: 28131 28133 28137 28138 28139 28118
    28140 28141 28129
    PGID: 28143; PIDs: 28143
    PGID: 28142; PIDs: 28142
    PGID: 28144; PIDs: 28144
    PGID: 28145; PIDs: 28145
    SCHEDULING PARAMETERS:
    r15s r1m r15m ut pg io ls it tmp swp mem
    loadSched - - - - - - - - - - -
    loadStop - - - - - - - - - - -

    作业在线监视

    test@node69:~> bjobs -aw
    JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME
    818 test RUN QS_Norm node69 4*node10 mpirun.lsf /public/software/dock6-openmpi/bin/dock6.mpi -i test.in -o test.out Dec 21 19:29
    115 test DONE lost_and_found node70 node1 sleep 1000 Dec 19 16:31
    116 test DONE lost_and_found node70 node62 sleep 100 Dec 19 17:07
    117 test DONE lost_and_found node70 node62 sleep 100 Dec 19 17:07
    119 test DONE lost_and_found node70 node61 sleep 100 Dec 19 17:07
    118 test DONE lost_and_found node70 node69 sleep 100 Dec 19 17:07
    120 test DONE lost_and_found node70 node70 sleep 100 Dec 19 17:07
    -

    作业在线监视
    检查作业历史状态

    test@node69:~> bhist -aw
    Summary of time in seconds spent in various states:
    JOBID USER JOB_NAME PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
    223 test mpirun.lsf ./cpi-openmpi 6 0 5 0 0 0 11
    224 test mpirun.lsf ./cpi-openmpi 5 0 5 0 0 0 10
    225 test mpirun.lsf openmpi 3 0 4 0 0 0 7
    226 test mpirun.lsf ./cpi-openmpi 5 0 7 0 0 0 12
    227 test mpirun.lsf ./cpi-mpich 2 0 0 0 0 0 2
    228 test mpirun.lsf ./cpi-mpich 4 0 1994 0 0 0 1998
    229 test mpirun.lsf ./cpi-openmpi 6 0 7 0 0 0 13
    作业在线监视
    检查作业历史状态

    test@node69:~> bhist -l 223

    Job <223>, User <test>, Project <default>, Command <mpirun.lsf ./cpi-openmpi>
    Sun Dec 20 15:05:40: Submitted from host <node69>, to Queue <default>, CWD <$HO
    ME>, Output File </home/test/output.%J>, 16 Processors Req
    uested;
    Sun Dec 20 15:05:46: Dispatched to 16 Hosts/Processors <16*node62>;
    Sun Dec 20 15:05:46: Starting (Pid 30493);
    Sun Dec 20 15:05:46: Running with execution home </home/test>, Execution CWD </
    home/test>, Execution Pid <30493>;
    Sun Dec 20 15:05:51: Done successfully. The CPU time used is 9.6 seconds;
    Sun Dec 20 15:05:51: Post job process done successfully;

    Summary of time in seconds spent in various states by Sun Dec 20 15:05:51
    PEND PSUSP RUN USUSP SSUSP UNKWN TOTAL
    6 0 5 0 0 0 11
    作业在线监视
    检查作业历史状态

    test@node69:~> bjobs
    JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME
    818 test RUN QS_Norm node69 4*node10 * test.out Dec 21 19:29

    test@node69:~> bpeek -f 818
    << output from stdout >>
    Initializing MPI Routines...
    Initializing MPI Routines...
    Initializing MPI Routines...
    Initializing MPI Routines...
    杀掉:
    test@node69:~> bkill 1480

    作业管理
    检查作业历史状态

    机器负载状态


    机器作业状态


    机器分组


    队列状态


    队列状态


    故障分析
    Job exit analysis

    LSF Keep the job exit as it does
    “bhist –l <jobid>” and “bjobs –l <jobid>” check the job exit code
    Submit a job with “-o %J.out” and check the output file <jobid>.out
    Typical User Problems (cont.d)
    “My job dies under LSF”
    Check resource limits on queues
    Check that the application and its data files are accessible from the execution host(s)
    Is an application license available from the execution host?
    Check the exit code reported by bjobs –l
    Common exit codes
    127 – Command not found
    128 – Command invoked cannot execute
    130 – Scripts terminated by Control-C
    Typical User Problems
    “My job was rejected by LSF”
    Check resource requirement string, run time limit
    Submission to an unauthorized queue or host
    Requested soft limits exceeding a queues hard limits
    Typical User Problems (cont.d)
    “My job PENDs forever under LSF”
    Has the user requested unrealistic resources?
    More memory than any host has
    Resource requirements may be too stringent
    Is the users id valid on the execution host(s)?
    The user may have requested exclusive execution
    If FCFS scheduling is used, the user may be last
    If fairshare scheduling is used, the user may have exhausted their fairshare allocation
    Use bjobs –lp to see the pending reason
    When all else fails….


    下表对常见的作业状态解释:
    状态 含义
    作业正在队列中排队
    PEND
    作业正在被执行
    RUN
    作业已经执行完毕,并且正常退出
    DONE
    作业非正常退出
    EXITED
    作业在排队过程中被挂起
    PSUSP
    作业在运行过程中被人为强制挂起
    USUSP
    作业在运行过程中被系统挂起
    SSUSP


    附 1:LSF 作业管理系统和原有 LJRS 作业管理系统命令对照表
    LJRS LSF
    提交作业 qsub bsub
    提交名为 run.sh 的作业脚本,使用
    x 结点,每结点 y 个 CPU,总共需 qsub -l nodes=x:ppn=y -P default bsub -n z -R “span[ptile=y]” -q
    要 z 个 CPU, 将作业提交到名称为 run.sh default run.sh
    default 的队列(结点池)中
    应 用 -o 参 数 指定输 出信 息文
    保存在作业所提交目录的
    件,否 则将 在作业 运行 主结点
    作业输出信息
    xxx.o(jobid)下
    以 mail 的形式保存
    查看尚未完成的作业信息 qstat(显示全部用户作业) bjobs(显示当前用户作业)
    查看所有用户的作业信息 qstat bjobs -u all
    查看指定用户 user1 的作业信息 qstat -u user1 bjobs -u user1
    查看作业的详细信息 qstat -f jobid bjobs -l jobid
    查看刚运行完毕的作业信息 无 bjobs -a
    bstop JOBID(可以挂起正在运
    挂起作业 qhold JOBID
    行的作业)
    释放作业 qrls JOBID bresume JOBID
    移 动未运 行 的作业到 队 列(结点
    qmov queue JOBID bswitch queue JOBID
    池)queue 当中
    删除一个作业 qdel jobid bkill jobid
    查看作业已产生的输出信息 无 bpeek jobid
    查看作业历史 无 bhist jobid
    作业历史详细信息 无 bhist -l jobid

    附 2、LSF 作业管理系统其他命令简介
    1、bsub –I –m 参数
    bsub –I 参数用于提交交互式作业。
    bsub –m 参数用于向指定结点提交作业,下列命令将作业提交到指定结点 c0305 和 c0807 上
    例如:bsub –m "c0305 c0807" -n 8 mpijob_qs ./mytest bqueue
    2、bqueues 命令
    bqueues 命令用于查看队列信息, 默认情况下, ueues 命令列出 LSF 系统中定义的全部队列信息,
    bq
    包括队列名、优先级、状态信息、最大可用资源数、排队作业数、运行作业数等信息。
    “bqueues –l 队列名” 命令可以列出指定队列的详细信息,包括描述信息、该队列优先级、最大运
    行时间限制、作业规模限制、队列所包含的结点、队列所包含的用户以及这些用户的动态优先级(提
    交作业越多、规模也大,优先级越低)等信息。
    3、brequeue
    brequeue 命令用于作业重新排队,用户可以使用该命令终止指定的、隶属于自己的、并正在运行
    的作业,该作业将以原有的作业号重新进行排队,重新获得调度、运行。
    4、btop/bbot
    btop/bbot 命令用于改变处于“PEND”状态的作业获得调度的次序,用户只能改变自己处于同一队
    列内的作业的相对次序, p 使指定作业在同一队列内的, 所有同优先级的作业中最先获得调度。 ot
    bto bb
    则相反。
    5、bhosts
    bhosts 命令用于查看结点状态,处于“ok”状态的结点表示该节点可以接收用户作业。结点上已
    经有作业运行或者负载过高都会导致“closed”状态。

               

    给我老师的人工智能教程打call!http://blog.csdn.net/jiangjunshow

    这里写图片描述
    你好! 这是你第一次使用 **Markdown编辑器** 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

    新的改变

    我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

    1. 全新的界面设计 ,将会带来全新的写作体验;
    2. 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
    3. 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
    4. 全新的 KaTeX数学公式 语法;
    5. 增加了支持甘特图的mermaid语法1 功能;
    6. 增加了 多屏幕编辑 Markdown文章功能;
    7. 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
    8. 增加了 检查列表 功能。

    功能快捷键

    撤销:Ctrl/Command + Z
    重做:Ctrl/Command + Y
    加粗:Ctrl/Command + B
    斜体:Ctrl/Command + I
    标题:Ctrl/Command + Shift + H
    无序列表:Ctrl/Command + Shift + U
    有序列表:Ctrl/Command + Shift + O
    检查列表:Ctrl/Command + Shift + C
    插入代码:Ctrl/Command + Shift + K
    插入链接:Ctrl/Command + Shift + L
    插入图片:Ctrl/Command + Shift + G

    合理的创建标题,有助于目录的生成

    直接输入1次#,并按下space后,将生成1级标题。
    输入2次#,并按下space后,将生成2级标题。
    以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

    如何改变文本的样式

    强调文本 强调文本

    加粗文本 加粗文本

    标记文本

    删除文本

    引用文本

    H2O is是液体。

    210 运算结果是 1024.

    插入链接与图片

    链接: link.

    图片: Alt

    带尺寸的图片: Alt

    当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

    如何插入一段漂亮的代码片

    博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

    // An highlighted block var foo = 'bar'; 

    生成一个适合你的列表

    • 项目
      • 项目
        • 项目
    1. 项目1
    2. 项目2
    3. 项目3
    • 计划任务
    • 完成任务

    创建一个表格

    一个简单的表格是这么创建的:

    项目 Value
    电脑 $1600
    手机 $12
    导管 $1

    设定内容居中、居左、居右

    使用:---------:居中
    使用:----------居左
    使用----------:居右

    第一列 第二列 第三列
    第一列文本居中 第二列文本居右 第三列文本居左

    SmartyPants

    SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

    TYPE ASCII HTML
    Single backticks 'Isn't this fun?' ‘Isn’t this fun?’
    Quotes "Isn't this fun?" “Isn’t this fun?”
    Dashes -- is en-dash, --- is em-dash – is en-dash, — is em-dash

    创建一个自定义列表

    Markdown
    Text-to-HTML conversion tool
    Authors
    John
    Luke

    如何创建一个注脚

    一个具有注脚的文本。2

    注释也是必不可少的

    Markdown将文本转换为 HTML

    KaTeX数学公式

    您可以使用渲染LaTeX数学表达式 KaTeX:

    Gamma公式展示 Γ(n)=(n1)!nN\Gamma(n) = (n-1)!\quad\forall n\in\mathbb N 是通过欧拉积分

    Γ(z)=0tz1etdt&ThinSpace;. \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,.

    你可以找到更多关于的信息 LaTeX 数学表达式here.

    新的甘特图功能,丰富你的文章

    gantt
            dateFormat  YYYY-MM-DD
            title Adding GANTT diagram functionality to mermaid
            section 现有任务
            已完成               :done,    des1, 2014-01-06,2014-01-08
            进行中               :active,  des2, 2014-01-09, 3d
            计划一               :         des3, after des2, 5d
            计划二               :         des4, after des3, 5d
    
    • 关于 甘特图 语法,参考 这儿,

    UML 图表

    可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图::

    张三李四王五你好!李四, 最近怎么样?你最近怎么样,王五?我很好,谢谢!我很好,谢谢!李四想了很长时间,文字太长了不适合放在一行.打量着王五...很好... 王五, 你怎么样?张三李四王五

    这将产生一个流程图。:

    链接
    长方形
    圆角长方形
    菱形
    • 关于 Mermaid 语法,参考 这儿,

    FLowchart流程图

    我们依旧会支持flowchart的流程图:

    • 关于 Flowchart流程图 语法,参考 这儿.

    导出与导入

    导出

    如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

    导入

    如果你想加载一篇你写过的.md文件或者.html文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
    继续你的创作。


    1. mermaid语法说明 ↩︎

    2. 注脚的解释 ↩︎

    展开全文
  • LSF系统简介

    万次阅读 2018-07-26 10:22:51
    原文地址: https://blog.csdn.net/augusdi/article/details/45587373 ...   LSF(Load Sharing Facility)是分布资源管理的工具,用来调度、监视、分析联网计算机的负载。通过集中监控和调度,充分共享计算...

    原文地址: https://blog.csdn.net/augusdi/article/details/45587373

    另外可参考: https://blog.csdn.net/appleml/article/details/46712971

     

    LSF(Load Sharing Facility)是分布资源管理的工具,用来调度、监视、分析联网计算机的负载。通过集中监控和调度,充分共享计算机的CPU、内存、磁盘、License等资源。

     

    LSF系统国内网站


    http://scc.ustc.edu.cn/zh_CN/ 中科大超算中心
    http://www.sccas.cn/gb/index.html 中科院超算中心
    http://www.ssc.net.cn/ 上海超算中心

     

    LSF 术语

    Cluster

    一组运行LSF软件的计算机(当然是用TCP/IP网络互连的),一组安装了LSF软件的计算机组成一个Cluster,Cluster内的资源统一监控和调度。
    Server Host
    Cluster内提交和执行Job的计算机
    Client Host
    Cluster内仅仅提交Job的计算机

     

    环境参数

    基本上登录后系统就载入了LSF的配置,因此不需再做任何设定。 下面的命令可以用来检查LSF的相关设定:

    env | grep LSF 

    LSF_ENVDIR=/opt/lsf/conf

    LSF_BINDIR=/opt/lsf/6.2/hpuxia64/bin

    LSF_LIBDIR=/opt/lsf/6.2/hpuxia64/lib

    LSF_SERVERDIR=/opt/lsf/6.2/hpuxia64/etc

    XLSF_UIDDIR=/opt/lsf/6.2/hpuxia64/lib/uid

    echo $PATH

    ...:/opt/lsf/6.2/hpuxia64/etc:/opt/lsf/6.2/hpuxia64/bin:…

    基本指令

    基本指令有:bsub、bqueues、bhosts、bjobs、bkill、bhist、bacct

    bsub    

    说明

    bsub用来提交job,常用的参数有:-n、-q、-o、-e、-J

     

                 

    -n

    指定计算工作所需的核心数目。可省略,默认值是:1

     

    -q

    指定执行计算工作的队列的名称。可省略,默认值是:xfer

     

    -o

    指定(stdout) 的输出目录名称。可省略,预设名称是:$job_id.out

     

    -e

    指定(stderr) 的输出目录名称。可省略,预设名称是:$job_id.err

     

    -J

    指定计算工作在队列中的名称。可省略,预设名称是所执行的程序名称

     

    示例  

    1.     

    非平行(serial ) 程式(其中以红色粗体标出的部分,是需要执行的程式名称):

         

        

    bsub ./my_program 

     

     

    bsub -n 1 -q xfer -o output.txt -e error.txt -J TEST ./my_program 

     

     

    上述两个命令执行的结果是相同的,都提交到队列xfer。不同的是stdout和stderr的输出信息路径。除此之外,后面的一个示例在队列中显示的名称为TEST,但上一个示例是my_program。

      

                      

    2.

    平行程式(其中以红色粗体标出的部分,是需要执行的程式名称):

     

     

    bsub -n 4 -q xfer /work1/my_small_job 

     

     

    bsub -n 16 -q mono my_paralle_job 

     

     

    上述两个例子的差别在于指定执行程序的路径位置,若未列出指定程序的完整路径,则认为执行程序位于当前的目录下。

     

                 

     

    3.

     

    MPI 的程式其中以红色粗体标出的部分,是需要执行的程式名称)

     

     

    $ bsub -n 16 -q mono mpirun -np 4 mpi_program 

     

    bqueues  

    说明

    查看各个队列的排队狀況

    示例

    bqueues

    QUEUE_NAME    PRIO   STATUS          MAX JL/U JL/P JL/H NJOBS PEND  RUN  SUSP

    mono                50     Open:Active      80     80    4      -     224     160   64        0

    xfer                   50     Open:Active       80    32     4     -       0         0     0          0

     

    bhosts  

     说明

    查看队列系统中的各个主机(host) 的状态

    示例

    bhosts

     

    HOST_NAME    STATUS      JL/U   MAX NJOBS   RUN SSUSP USUSP   RSV

    hale                   ok             -          88     64        64        0        0         0

    halen                 ok             -            8       0          0        0        0         0

     

     bjobs          

    说明

    查看队列系统中各个计算工作的执行状态。常用参数有:-u、-q、-l、-p

     

    -u 指定要查询的使用者账号。可省略,预设值是目前使用的账号。

     

    -q 指定要查询的队列名称。

     

    -l 以长格式(long format) 的方式,显示详细的队列资料。

     

    -p 只显示暂停中(pending) 的计算工作。

     

    不加任何参数时,只会显示目前使用者执行中或暂停中的计算工作。若要查看其他使用者计算工作的执行状态,可使用-u 参数指定要查询的使用者账号,或使用all 查询所有使用者的执行状态。(注:all 亦可套用在队列名称上。)

    示例

    bjobs -u all

    JOBID  USER    STAT  QUEUE     FROM_HOST  EXEC_HOST  JOB_NAME  SUBMIT_TIME

    4001   u11aaa0 RUN  mono       halen            32*hale       *igen-1010 Jan 1 02:03

    4002   u12bbb0 RUN  mono       halen            32*hale       *igen-1020 Jan 1 03:04

    4003   u13ccc0  RUN  xfer         halen             hale           *igen-1030 Jan 1 04:05

    4004   u14ddd0 PEND mono      halen                              *igen-1040 Jan 1 05:06

    4005   u15eee0 PEND mono      halen                              *igen-1050 Jan 1 06:07

    4006   u16fff0   PEND mono      halen                              *igen-1060 Jan 1 07:08

    4007   u17ggg0 PEND mono      halen                              *igen-1070 Jan 1 08:09

     

    bkill  

    说明

    终止或暂停工作

    示例

    $bkill 4001

      

    bhist  

    说明

    用来查看(包括已执行完成的) 计算工作的执行历程及结束的原因。常用的参数有:-b、-l

      -b简短格式
      -l 详细资料
     示例  $ bhist -l4001

    Job <4001>, User , Project , Command

    Sat Jan 1 21:31:06: Submitted from host , to Queue , CWD , Output File , 32 Processors Requested;

    Sun Jan 2 17:10:38: Dispatched to 32 Hosts/Processors <32*hale>;

    Sun Jan 2 17:10:38: Starting (Pid 18479);

    Sun Jan 2 17:10:38: Running with execution home , Execution CWD , Execution Pid <10000>;

    Summary of time in seconds spent in various states by Sun Jan 2 16:04:18

     

     PEND    PSUSP       RUN         USUSP   SSUSP   UNKWN   TOTAL

     243572    0           168820     0           0           0            412392

      

    bacct  

    说明

    统计在队列系统中执行的CPU时间及相关资料。常用的参数有:-C、-l、-q、-u

      -C 指定时间。可省略,未指定则是从系统记录开始时间到现在的时间。
     

    -l 详细资料。可省略,未指定则仅显示统计数据,不会显示每一个记录。

     

    -q 指定队列名称。可省略,未指定则是所有队列都算。

     

    -u 指定使用者账号(可省略)。

    示例 bacct -u user -q mono -C 03/01,05/31
     

    统计user从今年3/1 日到5/31间,提交到mono 这个队列中的使用资料。

     

    以上各指令的详细用法,皆可由man page 取得。例如:man bacctman bjobs、…

    在terminal中用man bsub获得的mannual中的内容(部分),给出了bsub更多的参数:

             -a
              Specifies one or more application-specific esub executables
              that you want LSF to associate with the job.


              -app
              Submits the job to the specified application profile.


              -ar
              Specifies that the job is autoresizable.


              -B
              Sends mail to you when the job is dispatched and begins
              execution.


              -b
              Dispatches the job for execution on or after the specified
              date and time.


              -C
              Sets a per-process (soft) core file size limit for all the
              processes that belong to this job.


              -c
              Limits the total CPU time the job can use.


              -clusters
              MultiCluster only. Specifies cluster names when submitting
              jobs.


              -cwd
              Specifies the current working directory for job execution.


              -D
              Sets a per-process (soft) data segment size limit for each of
              the processes that belong to the job.


              -dc_chkpntvm
              Dynamic Cluster only. Enable VM job checkpointing by
              specifying an initial checkpoint time and recurring checkpoint
              interval.


              -dc_livemigvm
              Dynamic Cluster only. Specifies whether the job can be live
              migrated when its hypervisor host is selected for host memory
              defragmentation.


              -dc_mtype
              Dynamic Cluster only. Specifies the machine type for the job.


              -dc_tmpl
              Dynamic Cluster only. Specifies the Dynamic Cluster templates
              that the job can use.


              -dc_vmaction
              Dynamic Cluster only. Specifies the VM behavior if this job is
              preempted.


              -E
              Runs the specified job-based pre-execution command on the
              execution host before actually running the job.


              -e
              Appends the standard error output of the job to the specified
              file path.


              -env
              Controls the propagation of the specified job submission
              environment variables to the execution hosts.


              -eo
              Overwrites the standard error output of the job to the
              specified file path.


              -Ep
              Runs the specified job-based post-execution command on the
              execution host after the job finishes.


              -ext
              Specifies application-specific external scheduling options for
              the job.


              -F
              Sets a per-process (soft) file size limit for each of the
              processes that belong to the job.


              -f
              Copies a file between the local (submission) host and the
              remote (execution) host.


              -freq
              Specifies a CPU frequency for a job.


              -G
              For fairshare scheduling. Associates the job with the
              specified group.


              -g
              Submits jobs in the specified job group.


              -H
              Holds the job in the PSUSP state when the job is submitted.


              -hl
              Enables job-level host-based memory and swap limit enforcement
      
              -hostfile
              Submits a job with a user-specified host file.


              -I
              Submits an interactive job.


              -i
              Gets the standard input for the job from specified file path.


              -Ip
              Submits an interactive job and creates a pseudo-terminal when
              the job starts.


              -IS
              Submits an interactive job under a secure shell (ssh).


              -Is
              Submits an interactive job and creates a pseudo-terminal with
              shell mode when the job starts.


              -is
              Gets the standard input for the job from the specified file
              path, but allows you to modify or remove the input file before
              the job completes.


              -ISp
              Submits an interactive job under a secure shell (ssh) and
              creates a pseudo-terminal when the job starts.


              -ISs
              Submits an interactive job under a secure shell (ssh) and
              creates a pseudo-terminal with shell mode support when the job
              starts.


              -IX
              Submits an interactive X-Window job.


              -J
              Assigns the specified name to the job, and, for job arrays,
              specifies the indices of the job array and optionally the
              maximum number of jobs that can run at any given time.


              -Jd
              Assigns the specified description to the job; for job arrays,
              specifies the same job description for all elements in the job
              array.


              -jsdl
              Submits a job using a JSDL file that uses the LSF extension to
              specify job submission options.


              -jsdl_strict
              Submits a job using a JSDL file that only uses the standard
              JSDL elements and POSIX extensions to specify job submission
              options.


              -K
              Submits a job and waits for the job to complete. Sends job
              status messages to the terminal.


              -k
              Makes a job checkpointable and specifies the checkpoint
              directory.


              -L
              Initializes the execution environment using the specified
              login shell.


              -Lp
              Assigns the job to the specified License Scheduler project.


              -M
              Sets a per-process (soft) memory limit for all the processes
              that belong to this job.


              -m
              Runs the job on one of the specified hosts or host groups, or
              within the specified compute units.


              -mig
              Specifies the migration threshold for checkpointable or
              rerunnable jobs, in minutes.


              -N
              Sends the job report to you by mail when the job finishes.


              -n
              Submits a parallel job and specifies the number of tasks in
              the job.


              -network
              For LSF IBM Parallel Environment (IBM PE) integration.
              Specifies the network resource requirements to enable
              network-aware scheduling for IBM PE jobs.


              -o
              Appends the standard output of the job to the specified file
              path.


              -oo
              Overwrites the standard output of the job to the specified
              file path.


              -outdir
              Creates the job output directory.


              -P
              Assigns the job to the specified project.


              -p
              Sets the limit of the number of processes to the specified
              value for the whole job.


              -pack
              Submits job packs instead of an individual job.


              -Q
              Specify automatic job requeue exit values.


              -q
              Submits the job to one of the specified queues.


              -R
              Runs the job on a host that meets the specified resource
              requirements.


              -r
              Reruns a job if the execution host or the system fails; it
              does not rerun a job if the job itself fails.


              -rn
              Specifies that the job is never rerunnable.


              -rnc
              Specifies the full path of an executable to be invoked on the
              first execution host when the job allocation has been modified
              (both shrink and grow).


              -S
              Sets a per-process (soft) stack segment size limit for each of
              the processes that belong to the job.


              -s
              Sends the specified signal when a queue-level run window
              closes.


              -sla
              Specifies the service class where the job is to run.


              -sp
              Specifies user-assigned job priority that orders all jobs
              (from all users) in a queue.


              -T
              Sets the limit of the number of concurrent threads to the
              specified value for the whole job.


              -t
              Specifies the job termination deadline.


              -ti
              Enables automatic orphan job termination at the job level for
              a job with a dependency expression (set using -w).


              -tty
              When submitting an interactive job, displays output/error
              messages on the screen (except pre-execution output/error
              messages).


              -U
              If an advance reservation has been created with the brsvadd
              command, the job makes use of the reservation.


              -u
              Sends mail to the specified email destination.


              -ul
              Passes the current operating system user shell limits for the
              job submission user to the execution host.


              -v
              Sets the total process virtual memory limit to the specified
              value for the whole job.


              -W
              Sets the runtime limit of the job.


              -w
              LSF does not place your job unless the dependency expression
              evaluates to TRUE.


              -wa
              Specifies the job action to be taken before a job control
              action occurs.


              -We
              Specifies an estimated run time for the job.


              -wt
              Specifies the amount of time before a job control action
              occurs that a job warning action is to be taken.


              -x
              Puts the host running your job into exclusive execution mode.


              -XF
              Submits a job using SSH X11 forwarding.
          

     

     

     

    展开全文
  • 超算LSF系统提交python作业

    千次阅读 2018-06-06 21:28:17
    一,添加所用python的环境变量(添加过的可以忽略这一步)export PATH=/...........:$PATH (……代表python路径)source ~/.bashrc二,编写脚本(以我的为例,***为隐私,路径对了就行)windows系统下新建文本文档...

    一,添加所用python的环境变量(添加过的可以忽略这一步)

    export PATH=/...........:$PATH     (……代表python路径)

    source ~/.bashrc

    二,编写脚本(以我的为例,***为隐私,路径对了就行)

    windows系统下新建文本文档,输入下面这段代码:

    #!/bin/sh
    #BSUB -q gpu
    #BSUB -o %J.out
    #BSUB -e %J.err
    #BSUB -n 28
    #BSUB -a python

    python /***/home/***/data/input_data/chaosuan.py

    保存为my_train.lsf

    三,提交作业

    将my_train.lsf文件移入超算系统下(如/***/home/***)

    注意:

    ①如果此时提交作业bsub < my_train.lsf至少会报一个错:bin/sh^M: bad interpreter: No such file or directory

    这个错误的原因就是.lsf文件是在windows下改的,解决办法是

    vi my_train.lsf

    :set ff 或 :set fileformat

    可以看到如下信息 

    fileformat=dos 或 fileformat=unix 

    利用如下命令修改文件格式 

    :set ff=unix 或 :set fileformat=unix 

    :wq (存盘退出)

    (这里解决涉及到vi的使用:vi 文件后,是只读模式,不能编辑,随便敲个键或者I键会进入编辑模式,移动光标即可到指定位置。修改完毕后:wq保存退出,或者:q!不保存强制退出)

    ②报了好几个关于import matplotlib.*** as ***的错误(当然你们或许不会报这个错)

    解决办法:

    1)首先考虑重装matplotlib这个模块,你们也试一试,对染我的试过了,没能解决

    2)找到..../Anaconda3/lib/site-packages/matplotlib/font_manager.py这个文件

    cd 到这个目录下..../Anaconda3/lib/site-packages/matplotlib

    vi font_manager.py

    在231行,(前后几行找找)

    把 direc = os.path.abspath(direc).lower()

    改为 direc = direc.split('\0', 1)[0]

    然后按esc退出编辑,用:wq保存并退出

    至此,就能正确提交作业,且能正常运行了

    最后bsub < my_train.lsf 提交作业!!


    展开全文
  • 目前只知道需要3条命令查看显存,如果哪位大佬知道只要一条命令就可以,欢迎指点。 好,开始正文。 查看程序占用的显存主要分为三步: 找到自己的进程id 根据id找到那台服务器(结点),服务器(结点)上会记录...
  • LSF 作业管理系统

    千次阅读 2018-05-27 21:17:28
    在上一篇中我们简要介绍了 PBS 作业管理系统,下面我们将介绍 LSF 作业管理系统。 简介 LSF (Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,...
  • LSF 作业系统常用命令

    千次阅读 2019-07-09 16:44:00
    LSF(Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。 bqueues:查看计算队列 bhosts:查看计算...
  • LSF作业调度系统故障解读 无法用bsub命令进行作业提交 解决方案: 执行lsload命令查看节点负载情况 若显示如下提醒,即可重启LSF作业调度系统 进入root权限,执行lsfstartup重启LSF作业调度系统(期间需要输入三...
  • LSF作业管理系统使用

    2020-04-22 23:19:42
    LSF作业管理系统使用 相关命令 常见的LSF命令有: • bqueues –u 用户名 -w:查看计算队列; • bhosts:查看计算节点列表; • lsload:查看负载; • bsub:提交作业; • bjobs:查看作业状态; bjobs -l 作业id...
  • 资源调度与任务管理系统之一LSF,在HPC行业得到广泛使用。那么LSF是如何精确地进行资源管理的呢?答案是需要开启其被管理主机的Control Groups(cgroups)功能。
  • LSF集群系统bjobs简单显示

    千次阅读 2018-12-12 11:00:35
    vim lsf.conf LSB_SHORT_HOSTLIST=1
  • LSF集群作业管理系统

    千次阅读 2020-06-17 11:05:56
    LSF (Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。 常用命令 bqueues:查看计算队列 bhosts:...
  • Lsf多集群系统简介

    千次阅读 2018-01-21 09:38:11
    如何管理各种各样的计算...由platform公司开发的lsf 多集群系统使多个异构的计算机能够通过局域网或广域网共享计算资源,并能够为用户提供对资源的透明访问。 AD: 如何管理各种各样的计算资源
  • LSF(Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。 1. 登陆超算服务器 命令行窗口使用ssh登陆: >...
  • LSF是为这样的网络设计的:所有主机都共享文件系统,并且文件在所有主机上具有相同的名称。 LSF支持在批处理作业运行之前将用户数据复制到执行主机,以及在作业运行之后将结果复制回来。 在文件系统不共享的网络中,...
  • LSF作业管理系统使用方法

    千次阅读 2015-08-17 15:56:00
    查看LSF计算节点列表bhosts # bhosts HOST_NAME STATUS JL/U MAX NJOBS RUN SSUSP USUSP RSV fat01 ok - 16 0 0 0 0 0 fat02 ...
  • bsub && lsf 介绍

    2017-06-21 17:06:00
    文章转载地址:... LSF系统介绍 http://scc.ustc.edu.cn/zh_CN/ 中科大超算中心 http://www.sccas.cn/gb/index.html 中科院超算中心 http://www.ssc.NET.cn/ 上涨超算中心 LSF简介 LSF(Load...
  • 集群LSF作业提交系统Bsub命令使用

    万次阅读 2018-10-19 22:57:30
    bsub,提交给lsf作业的命令。 1.命令格式: bsub [options] command [argument]  bsub -pack job_submission_file 2. 参数含义:  -q 选择队列  -i 指定输入文件   -I 交互模式,此时终端不能...
  • LSF_术语及概念

    2021-04-19 19:03:18
    SSUSP:由LSF系统暂停。(具体暂停条件待考究) POST_DONE:处理完成无误。 POST_ERR:处理完成有误。 UNKWN:mbatchd守护进程同作业运行主机的sbatchd守护进程失去通讯。 WAIT:对于提交的作业到负载大的作业队列,...
  • 集群上作业提交系统的使用与简介LSF作业提交系统bsub:作业提交通用方法bkill:删除作业bjobs:查看作业queues:查看队列信息PBS作业提交系统qsub:作业提交通用方法qdel:删除作业qstat:显示作业状态pbsnodes:...
  • 简介:LSF机群作业管理系统是曙光公司自己的一套作业管理系统,采用B/S架构,直接在网页管理界面就可以管理整个作业和作业节点; 1 LSF常用作业管理命令: 作业提交bsub 查看自己运行的所有作业的情况bjobs 跟踪...
  • lsf 基本命令

    千次阅读 2020-01-03 10:44:30
    LSF (Load Sharing Facility)是一个被广泛使用的作业管理系统,具有高吞吐、配置灵活的优点。通过 LSF 集中监控和调度,可以充分利用计算机的CPU、内存、磁盘等资源。 基本命令: bqueues:查看计算队列 ...
  • LSF0108PWR设备信息

    2019-09-15 11:49:26
    LSF系列支持高达100兆赫以上的翻译且≤30pF下平移大于100mhz上限负载和高达40mhz的上升/下降平移在50pF帽负载,允许LSF家族支持更多...LSF系列具有双向电压翻译不需要DIR引脚最小化系统工作(对于PMBus,I2c,或SMbus)...

空空如也

空空如也

1 2 3 4 5 6
收藏数 108
精华内容 43
关键字:

lsf系统