高通量计算框架HTCondor(三)——使用命令

1. 目录

HTCondor环境配置完成后,安装文件目录以下:分布式

HTCondor安装目录

其中bin目录里面存放了一系列condor_开头的可执行程序,正是经过这些指令程序来实现分布式计算的。其中有个GUI程序condor_birdwatcher.exe,打开后运行界面以下:3d

HTCondor安装目录

从程序名称能够看出这是个查看器程序,分别显示condor_q与condor_status的输出信息。htm

execute目录是程序执行目录,当集群运行时,会把程序、数据等发送到该目录中运行。blog

condor_config是HTCondor的配置文件,也就是上一章配置的环境都保存在这个文件中。一些更加高级的功能,能够经过修改这个配置文件来实现。队列

2. 进程

HTCondor环境配置完成后,服务项会启动一个condor服务:进程

HTCondor服务

默认这个服务是延迟启动的,一旦启动就会运行一系列condor_开头的后台进程:资源

HTCondor进程

这些后台进程的具体功能能够参考HTCondor的文档。其中,发送的计算任务程序会进一步封装成condor_exec,在任务机器运行。文档

3. 命令

HTCondor能够在命令提示符中运行一系列condor_开头的命令(与bin目录中的可执行程序对应),其中最重要的命令有如下几个:get

3.1. condor_q

显示的是当前任务队列中任务的运行状况:

condor_q

此时因为没有提交任务,因此显示为空。

3.2. condor_status

显示的是当前计算机集群中计算资源的状况:

condor_q

能够里面链接了两台机器,172_17_0_3是申请的远端云主机,DESKTOP-OVH是本机的机器,每个CPU核心都算做一个计算资源。

3.3. conodr_submit

提交任务命令。HTCondor经过一个任务描述文件来提交任务,提交后会返回一个任务ID。具体的命令为:

conodr_submit 任务描述文件路径

第一次提交任务时,通常会有以下提示:

conodr_submit

这时能够经过如下命令,并输入本机密码,将证书添加到HTCondor的证书管理中心中便可:

conodr_submit

3.4. conodr_rm

经过任务ID,删除特定的任务:

conodr_rm 任务ID

通常来讲,经过以上简单的命令,就能够完成初步的分布式计算。

4. 相关

上一篇
目录
下一篇

相关文章
相关标签/搜索