Проект

Общее

Профиль

Изменения в руководстве и обслуживании

Руководство пользователя кластера OpenPOWER ВЦ ДВО РАН

Недавно

  • 12/09/2018
    • Установлен пакет Numba, модуль conda/numba/0.39

Несколько месяцев назад

  • 25/07/2018
    • Привязка очереди fastq к jupiter1[0] отключена.
    • Исправлена ошибка при которой, в случае запроса некоторой задачей одного GPU и достаточно большого объема памяти, ей выделялись оба GPU вместо одного, из-за чего она могла накладываться на другую задачу, запущенную на соседнем GPU.
  • 24/07/2018
    • Добавлен IBM Advance Toolchain версии 11.0, модуль ibm-ai/11.0
      • Доступна версия GCC 7.3.1 для C, C++ и Fortran
  • 19/07/2018
    • Добавлен модуль gamess/07.10.2017-A для пакета ModEM
    • Обновлена до 0.6 версия руководства и списка ПО
    • Исправлена ошибка пакета GAMESS /tmp/scr permission denied
  • 18/07/2018
    • Установлен пакет PyTorch, модуль conda/pytorch/0.4.0
  • 16/07/2018
    • Установлен пакет ModEM, модуль modem/2016.05
    • Установлен сборник пакетов BioBuilds, модуль biobuilds/2017.11
  • 12/07/2018
    • Исправлена ошибка, из-за которой в каталоге PBS_JOBDIR создавался файл PBS_JOBID.hostname.sh
    • Модуль spectrum-mpi/pgi/10.1/17.4 переименован в spectrum-mpi/pgi/10.1
  • 18/06/2018
    • Исправлена ошибка, связанная с невозможностью размещения в очереди fastq при занятых ресурсах остальных узлов (не jupiter1[0]).
  • 13/06/2018
    • Смонтирован дополнительный узел, который после настройки будет играть роль головного узла кластера.
  • 28/04/2018
  • 25/04/2018
    • Исправлена ошибка в документации, связанная с конфликтом модулей компиляторов. Добавлены примеры замены модулей.
  • 02/03/2018
    • Введено ограничение на количество одновременно выполняемых задач с GPU для отдельного пользователя: не более 4.
  • 28/02/2018
    • Значение walltime, выставляемое для задач по-умолчанию, изменилось с 17520:00:00 на 390:00:00. Если задача будет считаться дольше 390 часо-процессов, то необходимо явно указать этот факт, например #PBS -l walltime=17520:00:00.
  • 21/02/2018
    • Изменены свойства модулей gcc, pgi, xl — можно загружать только один из них. Чтобы использовать LD_LIBRARY_PATH для gcc необходимо загрузить этот модуль.
  • 16/02/2018
  • 08/02/2018
    • Модули фреймворка PowerAI переименованы: добавлен префикс pai/
  • 18/01/2018
    • Введено ограничение на количество одновременно выполняемых задач без GPU для отдельного пользователя: не более 40.

В прошлом году

  • 26/12/2017
    • Количество ncpus теперь должно быть кратно 8 и соответствовать запрашиваемому количеству ядер ncpus/8.
  • 14/12/2017
    • Добавлен раздел для пакета GAMESS.
  • 12/12/2017
    • Отменено ограничение pvmem=11gb.
  • 11/12/2017
    • В планировщике установлено ограничение pvmem=11gb размера виртуальной памяти для отдельного процесса.
  • 24/11/2017
    • Выявлена проблема с очередью fastq. До её решения рекомендуется явно задавать значение vnode=jupiter1[0].
  • 14/11/2017
    • Обновлен раздел документации Система очередей. Часть ресурсов 1 узла доступна только для быстрых задач, длительностью не более 10 минут.
  • 20/07/2017
    • Работы завершены, кластер запущен.
  • 18/07/2017
    • Перезагрузка кластера назначена на 20 июля.
  • 10/07/2017
    • Обновлена прошивка на узлах 2,3 и 5.
    • Перезагрузка кластера запланирована на 20-25 июля. О точной дате будет сообщено дополнительно, учитывайте это при запуске задач.
  • 07/07/2017
    • Проведено обновление прошивки на узле jupiter4.
  • 06/07/2017
    • Запланирована перезагрузка кластера для технического обслуживания, дата и время будут указаны.