Изменения в руководстве и обслуживании¶
Руководство пользователя кластера OpenPOWER ВЦ ДВО РАН
Недавно¶
- 12/09/2018
- Установлен пакет Numba, модуль
conda/numba/0.39
Несколько месяцев назад¶
- 25/07/2018
- Привязка очереди fastq к
jupiter1[0]
отключена.
- Исправлена ошибка при которой, в случае запроса некоторой задачей одного GPU и достаточно большого объема памяти, ей выделялись оба GPU вместо одного, из-за чего она могла накладываться на другую задачу, запущенную на соседнем GPU.
- 24/07/2018
- Добавлен IBM Advance Toolchain версии 11.0, модуль
ibm-ai/11.0
- Доступна версия GCC 7.3.1 для C, C++ и Fortran
- 19/07/2018
- Добавлен модуль
gamess/07.10.2017-A
для пакета ModEM
- Обновлена до 0.6 версия руководства и списка ПО
- Исправлена ошибка пакета GAMESS
/tmp/scr permission denied
- 18/07/2018
- Установлен пакет PyTorch, модуль
conda/pytorch/0.4.0
- 16/07/2018
- Установлен пакет ModEM, модуль
modem/2016.05
- Установлен сборник пакетов BioBuilds, модуль
biobuilds/2017.11
- 12/07/2018
- Исправлена ошибка, из-за которой в каталоге
PBS_JOBDIR
создавался файл PBS_JOBID.hostname.sh
- Модуль
spectrum-mpi/pgi/10.1/17.4
переименован в spectrum-mpi/pgi/10.1
- 18/06/2018
- Исправлена ошибка, связанная с невозможностью размещения в очереди fastq при занятых ресурсах остальных узлов (не
jupiter1[0]
).
- 13/06/2018
- Смонтирован дополнительный узел, который после настройки будет играть роль головного узла кластера.
- 28/04/2018
- 25/04/2018
- Исправлена ошибка в документации, связанная с конфликтом модулей компиляторов. Добавлены примеры замены модулей.
- 02/03/2018
- Введено ограничение на количество одновременно выполняемых задач с GPU для отдельного пользователя: не более 4.
- 28/02/2018
- Значение
walltime
, выставляемое для задач по-умолчанию, изменилось с 17520:00:00
на 390:00:00. Если задача будет считаться дольше 390 часо-процессов, то необходимо явно указать этот факт, например #PBS -l walltime=17520:00:00
.
- 21/02/2018
- Изменены свойства модулей
gcc, pgi, xl
— можно загружать только один из них. Чтобы использовать LD_LIBRARY_PATH
для gcc
необходимо загрузить этот модуль.
- 16/02/2018
- Обновлена информация по доступным модулям и ПО
- 08/02/2018
- Модули фреймворка PowerAI переименованы: добавлен префикс
pai/
- 18/01/2018
- Введено ограничение на количество одновременно выполняемых задач без GPU для отдельного пользователя: не более 40.
В прошлом году¶
- 26/12/2017
- Количество
ncpus
теперь должно быть кратно 8 и соответствовать запрашиваемому количеству ядер ncpus/8
.
- 14/12/2017
- Добавлен раздел для пакета GAMESS.
- 12/12/2017
- Отменено ограничение pvmem=11gb.
- 11/12/2017
В планировщике установлено ограничение pvmem=11gb размера виртуальной памяти для отдельного процесса.
- 24/11/2017
Выявлена проблема с очередью fastq. До её решения рекомендуется явно задавать значение vnode=jupiter1[0]
.
- 14/11/2017
- Обновлен раздел документации Система очередей.
Часть ресурсов 1 узла доступна только для быстрых задач, длительностью не более 10 минут.
- 20/07/2017
- Работы завершены, кластер запущен.
- 18/07/2017
- Перезагрузка кластера назначена на 20 июля.
- 10/07/2017
- Обновлена прошивка на узлах 2,3 и 5.
- Перезагрузка кластера запланирована на 20-25 июля. О точной дате будет сообщено дополнительно, учитывайте это при запуске задач.
- 07/07/2017
- Проведено обновление прошивки на узле jupiter4.
- 06/07/2017
- Запланирована перезагрузка кластера для технического обслуживания, дата и время будут указаны.