29.05.2023 20:00Проблемы с системами охлаждения ЦКП
Уважаемые пользователи!
В настоящее время в ЦКП наблюдаются проблемы с системами охлаждения.
Поэтому временно введено ограничение на количество активного вычислительного оборудования.
Сроки устранения проблем не известны.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
29.03.2023 12:49IRUS17 вошел в 38 редацию ТОП50
Опубликована 38-я редакция списка Top50. Объявление новой редакции списка состоялось 28 марта 2023 г. на Международной научной конференции "ПаВТ'2023", 17-й в серии ежегодных конференций, посвященных развитию и применению параллельных вычислительных технологий в различных областях науки и техники.
Кластер IRUS17 после модернизации достиг производительности в 177.31 Тфлоп/с(Rmax) и 303.34 Тфлоп/с(Rpeak) и вернулся в Top50 на 27-ю строчку рейтинга.
16.03.2023 14:16Отключение энергоснабжения 2023-03-16
Уважаемые пользователи!
16 марта 2023 года в 10:20 электроснабжение ЦКП было прекращено в связи с
аварией на сетях энергоснабжающей организации.
Все запущенные задачи остановлены, очередь заморожена.
Ориентировочное время возобновления работы суперкомпьютерного центра 16 марта в 18:00.
Обновление от 16.03.2023 18:00 : Работа возобновлена.
С уважением,
Администраторы ЦКП ДВВР (ИАПУ ДВО РАН).
10.03.2023 12:00Новый тип ресурса ЦКП ДВВР
Уважаемые пользователи!
ЦКП "ДВВР" рад предложить вам новый тип вычислительного ресура - узлы с графическими процессорами (GPU).
Напоминаем вам, что для использования доступны следующие типы ресурсов:
standard - 40 узлов - 2 * Intel Xeon E5-2698v4, 256 Gb RAM
gold21 - 4 узла - 2 * Intel Xeon Gold 6248R, 384 Gb RAM
gold21 - 4 узла - 2 * Intel Xeon Gold 6248R, 768 Gb RAM
A100 - 2 узла - 2 * Intel Xeon Gold 6348, 512 Gb RAM, 3 * A100 40Gb
A100 - 1 узел - 2 * Intel Xeon Gold 6330, 512 Gb RAM, 4 * A100 40Gb
Из-за отличий в политиках выделения ресурсов на узлах с GPU, доступ к ним оществляется с другого узла доступа - irus21-gpu.
Чтобы попасть на данный узел необходимо на узле доступа irus17.cc.dvo.ru выполнить команду ssh irus21-gpu .
В настоящий момент готовится обновление инструкции пользователя для работы на узлах с GPU и
будет опубликовано в ближайшее время на странице https://cc.dvo.ru/rukovodstvo-polzovatelya.html
Если вы заинтересованы в использовании узлов с GPU - просьба сообщить нам информацию о ПО,
которое вам необходимо. ПО должно быть обязательно свободно распространяемым.
Если у вас есть лицензионное ПО, то мы можем помочь вам установить его для личного использования.
Нам известно следующее ПО, которое поддерживает GPU:
- Gromacs - уже установлено и работает.
- VASP
- Gamess
- lammps
- namd
- quantum espresso
- TensorFlow
- PyTorch
С уважением,
Администраторы ЦКП ДВВР (ИАПУ ДВО РАН).
10.02.2023 16:34Запуск задач 2023-02
Уважаемые пользователи!
Регламентные работы завершены. Введено изменение в процесс запуска задач.
Это сделано для оптимизации работы программы планировщика и запуска задач на подходящих ресурсах. В основном это касается задач которые запускаются на Gold21 (Эта очередь имеет 2 вида узлов, которые отличаются объемами оперативной памяти: 384 Гб и 768 Гб). Для запускаемых задач теперь необходимо указывать объем памяти. Сделать это нужно с помощью параметра «--mem», который задает максимальный объем оперативной памяти потребляемый задачей на 1 узле.
Пример: srun -N 2 -n 40 --mem 128G ./myprogram (это означает, что на каждом из 2 узлов под задачу будет выделено по 128 Гб)
Если не указать параметр, по умолчанию ставится объем равный 1Гб. При превышения потребления программой данного объема задача будет завершена с ошибкой. Просим указывать примерное значение сколько будет потреблять ваша задача. Мы не требуем от вас указания точного объема, но примерная оценка очень желательна. Если вы не уверены в оценке памяти для своей задачи, вы можете заказать максимальный объем доступный для выбираемых узлов.
Максимальный объем памяти на узлах:
standard irus17-[1-30,32-40] - 250G
gold21 irus21-[1-4] - 375G
gold21 irus21-[5-8] - 750G
Если указать объем больше максимального задача не запустится.
При заказе памяти на узлах gold21 376 Гб и выше задача будет запускаться только с 5 по 8 узел. При указании меньшего объема она будет запускаться на узлах с 1 по 8.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
02.02.2023 11:13Отчетность за 2022 год. Подача заявок
Уважаемые пользователи!
19 января было опубликовано официальное информационное письмо Минобрнауки России.
В соответствии с поручениями Правительства Российской Федерации Минобрнауки России объявило о начале ежегодного мониторинга доступности и результативности деятельности центров коллективного пользования научным оборудованием и уникальных научных установок (далее – ЦКП и УНУ). Собранные нами данные будут использоваться для заполнения ежегодной отчетности по нашему ЦКП перед Минобром на сайте ckp-rf.ru.
Просим Вас в срок до 27 февраля заполнить отчетные формы по использованию ресурсов ЦКП "Дальневосточный вычислительный ресурс".
Формы доступны в Личном кабинете пользователей на сайте Информационной системы https://is.cc.dvo.ru. С вопросами по заполнению в можете обращаться на почту cc@dvo.ru
Обращаем внимание, пользователи не отчитавшиеся за 2022 год и не подавшие заявки на 2023 год - не смогут пользоваться ресурсами ЦКП.
С уважением, администраторы ЦКП ДВВР.
16.01.2023 15:00Плановые профилактические работы: 2023-01-30
Уважаемые пользователи!
Доводим до Вашего сведения, что с 30.01.2023 до 10.02.2023 в ЦКП "ДВВР" будут проводиться профилактические работы. В связи с этим доступ к ресурсам ЦКП будет ограничен.
Внимание!
В ходе профилактических может быть недоступно хранилище данных. Убедительная просьба забрать необходимые вам для текущей работы результаты до начала профилактических работ, чтобы не попасть на момент недоступности системы хранения.
Обратите внимание, что вычислительные узлы 2023-01-30 в 11:00:00 будут автоматически переведены в режим обслуживания.
Это означает, что при постановке задания в очередь вам необходимо учитывать время оставшееся до времени начала обслуживания (параметр -t), иначе ваши задания не будут запущены.
Например, если вы хотите поставить в очередь задачу 2023-01-25 в 00:00, то максимальное время доступное для выполнения задачи на текущий момент составит 2023-01-30T11:00:00 минус 2023-01-25T00:00:00 = 5-11:00:00. Однако, нужно учитывать, что задача будет стоять в очереди и на момент освобождения ресурсов заданный параметр -t может стать больше допустимого.
Если возникнут вопросы обращайтесь по адресу cc@dvo.ru.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
26.10.2022 09:26Отключение энергоснабжения 2022-10-26
Уважаемые пользователи!
26 октября 2022 года электроснабжение ЦКП было прекращено в связи с
аварией на сетях энергоснабжающей организации.
Задания были принудительно остановлены.
После востановления питания задания были автоматически перезапущены.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
02.09.2022 09:00Одиннадцатый Национальный Суперкомпьютерный Форум (НСКФ-2022)
29 ноября – 02 декабря | Переславль-Залесский | Форум
Одиннадцатый Национальный Суперкомпьютерный Форум (НСКФ-2022) АНО «Национальный суперкомпьютерный форум», Институт программных систем имени А.К. Айламазяна РАН и Национальная Суперкомпьютерная Технологическая Платформа проводят 29 ноября – 02 декабря 2022 г. Одиннадцатый Национальный Суперкомпьютерный Форум (НСКФ-2022). Все мероприятия Форума посвящены состоянию и перспективам развития национальной суперкомпьютерной отрасли, вопросам создания и практики применения суперкомпьютерных, грид- и облачных технологий.
Форум состоится в г. Переславле-Залесском, в ИПС имени А.К. Айламазяна РАН и включает научно-практическую конференцию, выставку, серию мастер-классов и тренингов, выездной пресс-тур, серию круглых столов (совещаний), а также неформальное общение участников.
Свое участие в форуме уже подтвердили ведущие российские и зарубежные производители суперкомпьютерной техники, многочисленные научные коллективы, ВУЗы и ведущие СМИ.
На выставке планируется представить продукцию и технические достижения отечественных и иностранных производителей. Научная конференция включит в себя представителей большинства ведущих научных центров, а на семинарах и тренингах участники смогут узнать основные приёмы и тонкости работы с их самыми новейшими разработками. В рамках Форума также состоится серия пресс-конференций по наиболее ярким текущим событиям отечественной суперкомпьютерной отрасли.
НСКФ-2022 предусмотрен планом работы Национальной Суперкомпьютерной Технологической Платформы на 2022 год и проводится при поддержке Отделения нанотехнологий и информационных технологий Российской академии наук.
Кроме того, на НСКФ-2022 будет вручаться Премия национального суперкомпьютерного форума, являющаяся высшим признанием заслуг специалистов и коллективов перед суперкомпьютерной отраслью России. В течение года участники Форума будут предлагать номинантов на получение премии, а во время проведения НСКФ-2022 участники самостоятельно определят победителя (узнать подробнее). Стать участником Форума значит стать лицом, принимающим отраслевые решения. Присоединяйтесь!
Сайт мероприятия: https://2022.nscf.ru/
Подробная информация о форуме доступна в разделе «Информационные материалы».
Зарегистрироваться для участия можно по адресу https://2022.nscf.ru/kabinet-uchastnika/.
19.07.2022 14:45Отключение энергоснабжения 2022-07-19
Уважаемые пользователи!
В связи с отключением электропитания 19 июля 2022 года в 16:00 работа ЦКП ДВВР была приостановлена.
Ориентировочное время возобновления работы суперкомпьютерного центра 20 июля в 16:00.
Все запущенные задачи остановлены, очередь заморожена.
С уважением,
Администраторы СЦ ИАПУ ДВО РАН
27.06.2022 09:48Отключение энергоснабжения 2022-06-27
Уважаемые пользователи!
В связи с аварийным отключением энергоснабжения 27 июня 2022 года в 00:40 работа ЦКП ДВВР была приостановлена.
В настоящий момент ведутся восстановительные работы, ориентировочное время возобновления работы суперкомпьютерного центра 27 июня в 15:00.
Задачи, работающие в момент выключения энергоснабжения, аварийно прервались.
С уважением,
Администраторы СЦ ИАПУ ДВО РАН
24.06.2022 10:00Отключение энергоснабжения 2022-06-24
Уважаемые пользователи!
В связи с аварийным отключением энергоснабжения 24 июня 2022 года в 01:17 работа ЦКП ДВВР была приостановлена.
В настоящий момент ведутся восстановительные работы, ориентировочное время возобновления работы суперкомпьютерного центра 24 июня в 15:00.
Задачи, работающие в момент выключения энергоснабжения, аварийно прервались.
С уважением,
Администраторы СЦ ИАПУ ДВО РАН
09.06.2022 16:15«Многопроцессорные вычислительные и управляющие системы» (МВУС-2022)
Уважаемые коллеги!
На базе Южного федерального университета и НИЦ супер-ЭВМ и нейрокомпьютеров
с 27 по 30 июня 2022 г. в г. Таганроге, Ростовской области состоится Всероссийская научно-техническая конференция
«Многопроцессорные вычислительные и управляющие системы» (МВУС-2022),
посвященная 100-летию со дня рождения выдающегося российского ученого,
Героя социалистического труда, академика РАН А.В. Каляева и развитию его научных идей.
Программа конференции:
27.06.2022 - День заезда.
28.06.2022 - Открытие конференции, пленарные и секционные заседания.
29.06.2022 - Торжественное заседание, посвященное 100-летию со дня рождения академика РАН А.В. Каляева. Закрытие конференции.
30.06.2022 - День отъезда.
Просьба в случае Вашего желания и возможности принять участие в Торжественном заседании, посвященном 100-летию со дня рождения академика РАН А.В. Каляева, сообщить об этом в ОНИТ РАН в срок до 15 июня 2022 года.
31.05.2022 16:50Отключение энергоснабжения 2022-05-31
Уважаемые пользователи!
31.05.2022 в 16:44 произошла авария на сетях энергоснабжения.
Работы систем резервного питания хватает не более чем на 15 минут,
поэтому задания были принудительно остановлены, а оборудование выключено.
После востановления работы кластера задания будут перезапущены автоматически.
Обновление информации(31.05.2022):
Работа кластера востановлена.
С уважением,
Администраторы СЦ ИАПУ ДВО РАН
12.04.2022 04:00Отключение электроснабжения 2022-04-17
Уважаемые пользователи!
В связи с тем, что 17 апреля 2022 года с 10:00 до 15:00 в ИАПУ ДВО РАН будет отключено электропитание, работа кластера будет остановлена с 9:00 17.04.2022 до 12:00 18.04.2022.
Задачи, которые не успели завершиться, будут аварийно остановлены, и после включения кластера очередь заданий будет перезапущена.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
30.03.2022 16:40Отключение электроснабжения 2022-03-30
Уважаемые пользователи!
В связи с аварийным отключением энергоснабжения 30 марта 2022 в 16:21 работа суперкомпьютерного центра была приостановлена.
В настоящий момент ведутся восстановительные работы, ориентировочное время возобновления работы суперкомпьютерного центра 31 марта 2022 .
Задачи, работающие в момент выключения энергоснабжения, аварийно прервались.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
Обновление информации(31.03.2022):
При возобновлении работ была обнаружена проблема с электропитанием. Для ее решения необходима остановка оборудования 1.04.2022. Запущенные задачи будут завершены. Возобновление работы суперкомпьютерного центра ожидается 1.04.2022 в 15.00.
14.01.2022 13:13Технические работы 2022-01
Уважаемые пользователи, в настоящее время восстановлена роботоспособность систем хранения данных.Однако в связи с опасной уязвимостью в системе управления очередями Slurm решено провести полное обновление программного обеспечения на кластерах.
В связи с этим информируем Вас о том, что в ЦКП ДВВР будут проводиться регламентные работы ориентировочно до 24.01.2022 года.
Также напоминаем, что для использования ресурсов ЦКП ДВВР Вам необходимо иметь актуальную и одобренную заявку на 2022 год, а также отчитаться по публикациям за 2021 год в нашей информационной системе в личном кабинете.
31.12.2021 18:00Работоспособность раздела FAST востановлена
Уважаемые пользователи!
Нам удалось восстановить работоспособность раздела Fast.
Однако требуется провести rebuild хранилища и замену некоторых дисков.
Поэтому просим Вас до 4 января 2022 года скопировать к себе и удалить ненужные данные из раздела Safe,
забрать или переместить НУЖНЫЕ данные в защищенный раздел Safe (свободное пространство очень-очень ограничено; см. командой df -h ).
На 4 января 2022 года в ИАПУ ДВО РАН запланировано проведение ремонтных работ по электропитанию.
Поэтому кластер будет доступен до 8:00 4 января 2022 года.
После завершения ремонтных работ будет восстановлен доступ к системе хранения данных.
О возобновлении работы кластера будет сообщено отдельно.
С уважением,
Администраторы ЦКП ДВВР.
27.12.2021 23:12Авария системы хранения данных. Кластер остановлен
Уважаемые пользователи!
К сожалению, раздел Fast вновь был аварийно остановлен.
Будем пытаться решить проблему.
О результатах будем информировать.
Просим вас удалить ненужные данные на разделе Safe, если таковые имеются
(на разделе довольно мало свободного места).
С уважением,
Администраторы ЦКП ДВВР.
27.12.2021 17:15Доступ к кластеру восстановлен
Уважаемые пользователи!
Нам удалось восстановить работоспособность раздела Fast.
Однако требуется провести rebuild хранилища и замену некоторых дисков.
Поэтому просим Вас до 4 января 2022 года скопировать к себе и удалить ненужные данные из раздела Safe,
забрать или переместить НУЖНЫЕ данные в защищенный раздел Safe (свободное пространство очень-очень ограничено; см. командой df -h ).
На 4 января 2022 года в ИАПУ ДВО РАН запланировано проведение ремонтных работ по электропитанию.
Поэтому кластер будет доступен до 8:00 4 января 2022 года.
После завершения ремонтных работ будет восстановлен доступ к системе хранения данных.
О возобновлении работы кластера будет сообщено отдельно.
P.S.: Запуск заданий необходимо планировать с учетом отключения (параметр -t ).
С уважением,
Администраторы ЦКП ДВВР.
26.12.2021 16:06Авария системы хранения данных. Кластер остановлен
Уважаемые пользователи!
Внезапно и без предупреждения один из дисков раздела Fast отказался работать.
Работа вычислительного кластера аварийно завершена.
Все запущенные и находящиеся в очереди задания принудительно завершены.
На текущий момент неизвестно состояние вышедшего из строя диска.
Мы будем пытаться восстановить данные, однако гарантий на восстановление мы дать не можем.
ДЛЯ СПРАВКИ
Инструкция пользователя: https://cc.dvo.ru/docs/UserManualIRUS17.pdf
Выдержка из инструкции пользователя (раздел 3, таблица 2, точка монтирования /home/Fast):
"Для размещения временных данных пользователей в процессе расчета. Физически построено для более
быстрой записи данных. Не может использоваться для долговременного хранения данных. Резервного
копирования нет. В случае сбоя системы файлы из этого раздела стираются. При проведении
профилактических работ файлы могут быть удалены"
С уважением,
Администраторы ЦКП ДВВР.
28.07.2021 00:15Отключение электроснабжения 2021-07-28
Уважаемые пользователи!
В связи с аварийным отключением энергоснабжения 28 июля 2021 в 03:29 работа суперкомпьютерного центра была приостановлена.
В настоящий момент ведутся восстановительные работы, ориентировочное время возобновления работы суперкомпьютерного центра 29 июля 2021 (возможно ранее).
Задачи, работающие в момент выключения энергоснабжения, аварийно прервались.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
22.03.2021 10:13Отключение энергоснабжения 2021-03-20
Уважаемые пользователи!
В связи с аварийным отключением энергоснабжения 20 марта 2021 в 23:02 работа суперкомпьютерного центра была приостановлена.
Ориентировочное время возобновления подачи электроэнергии 22.03.2021 в 16:00. В связи с аварийным отключением нам потребуется время на проверку систем хранения данных и запуск оборудования.
Задачи, стоящие в очереди, будут запущены автоматически.
Обратите внимание, что задачи, выполнявшиеся в период отключения, завершились аварийно.
С уважением, Администраторы СЦ ИАПУ ДВО РАН
01.03.2021 13:12HPL тест производительности узлов IRUS17
В рамках регламентных работ были проведены HPL тесты производительности каждого вычислительного узла.
Усредненные результаты представлены в таблице ниже:
№ узла |
GFlops |
№ узла |
GFlops |
№ узла |
GFlops |
№ узла |
GFlops |
irus17-1 |
1191.2306 |
irus17-11 |
1192.2541 |
irus17-21 |
1185.2346 |
irus17-31 |
1229.8300 |
irus17-2 |
1193.5506 |
irus17-12 |
1160.0616 |
irus17-22 |
1184.4234 |
irus17-32 |
1227.9166 |
irus17-3 |
1171.5291 |
irus17-13 |
1196.3922 |
irus17-23 |
1191.3483 |
irus17-33 |
1212.8184 |
irus17-4 |
1172.8199 |
irus17-14 |
1181.7801 |
irus17-24 |
1187.5462 |
irus17-34 |
1223.3088 |
irus17-5 |
1204.3148 |
irus17-15 |
1183.7377 |
irus17-25 |
1229.4490 |
irus17-35 |
1229.4713 |
irus17-6 |
1180.8481 |
irus17-16 |
1170.2642 |
irus17-26 |
1221.0770 |
irus17-36 |
1234.0048 |
irus17-7 |
1168.6417 |
irus17-17 |
1176.4872 |
irus17-27 |
1233.5537 |
irus17-37 |
1236.5331 |
irus17-8 |
1182.6797 |
irus17-18 |
1174.6644 |
irus17-28 |
1220.6104 |
irus17-38 |
1223.0365 |
irus17-9 |
1187.4720 |
irus17-19 |
1201.6977 |
irus17-29 |
1222.7130 |
irus17-39 |
1232.9305 |
irus17-10 |
1183.5949 |
irus17-20 |
1188.5589 |
irus17-30 |
1237.1234 |
irus17-40 |
1218.6834 |
16.02.2021 12:15Отключение энергоснабжения 2021-02-16
Уважаемые пользователи!
В связи с аварийным отключением энергоснабжения 16 февраля 2021 в 11:23 работа суперкомпьютерного центра была приостановлена.
Ориентировочное время возобновления подачи электроэнергии 16.02.2021 в 16:00. В связи с аварийным отключением нам потребуется время на проверку систем хранения данных и запуск оборудования.
Задачи, стоящие в очереди, будут запущены автоматически.
Обратите внимание, что задачи, выполнявшиеся в период отключения, завершились аварийно.
С уважением, Администраторы СЦ ИАПУ ДВО РАН