Общее
Информация
Общее
Информация
Это старая версия документа!
IBM Platform LSF - это мощная платформа управления нагрузкой для требовательных распределенных сред высокопроизводительных вычислений. Она предоставляет исчерпывающий набор интеллектуальных компонентов на основе стратегий, которые позволяют воспользоваться всеми ресурсами вычислительной инфраструктуры и обеспечить оптимальную производительность приложений.
Задание lsf представляет собой абстрактную сущность, состоящую из набора команд и параметров. Задание представляется пользователю в виде скрипта для оболочки (shell), содержащего требования к ресурсам, атрибуты задания и набор команд, которые необходимо выполнить. Единожды создав скрипт задания, им можно пользоваться столько раз, сколько необходимо, также возможна его модификация. Задание сначала необходимо поставить в очередь lsf, затем из этой очереди оно будет передано на один узлов для выполнения. Очередей заданий может быть несколько. Вот пример простого скрипта задания:
#!/bin/bash # ##BSUB -P project_code # project code #BSUB -W 00:20 # wall-clock time (hrs:mins) #BSUB -n 8 # number of tasks in job ##BSUB -R "span[ptile=16]" # run 16 MPI tasks per node #BSUB -J test_mpi # job name #BSUB -oo output.log # output file name in which %J is replaced by the job ID #BSUB -eo error.log # error file name in which %J is replaced by the job ID ##BSUB -q high_priority # queue #module load openmpi-x86_64 #run the executable mpirun ./mpi
Важно: Каждая строка представляет собой некоторую директиву LSF, которой задано некоторое значение. Каждая директива в скрипте начинается со знака #. Комментарии обозначаются знаком ##.
Отправка заданий на кластер осуществляется с помощью команды bsub. Например, отправка задания sleep, описанного скриптом sleep.lsf, выполняется командой bsub с именем скрипта как параметром:
bsub < sleep.lsf
Просмотреть состояние задач в очереди можно с помощью команды bjobs.