- 7-01-2022, 16:18
- 2 294
Windows 11 показывает сниженную производительность в FDS
12.01.2023
тест на версии fds 6.7.9 на 12900k (ddr5 4800) - 56 сек на 12 сетках, прирост 26% по сравнению с 12900k (ddr4 3600) - 76 сек
16.12.2022
тест на версии fds 6.7.9 на 13900k (ddr4 3600) - 51 сек на 16 сетках, прирост по сравнению с 12900k (ddr4 3600) 30%
09.09.2022
тест на версии fds 6.7.9 на 12900k (ddr4 3600) - 76 сек на 12 сетках, AMD 5950х (ddr4 3600) отстает на 20% (96 сек на 8 сетках), на версии fds 6.7.9 Intel задействует все ядра, а AMD только половину, надеюсь поправят в 7 версии. Сейчас 12900k 43 т.руб, а Ryzen 9 5950X 37 т. руб01.12.2021
Сравнил в тестах Windows 10 и Windows 11 на AMD и Intel.
Файлы тестов по ссылке https://disk.yandex.ru/d/dmLufbMfC5Fz2Q, если у вас будут результаты быстрее моих дайте знать.
В тестах сравнивал системы на процессорах 12900k и 5950X, Windows на М2 980 pro 500 гб, оперативная память DDR4 3600 мгц.
Тестировал на fds 6.7.1 (2019) в один прогон,
Версии FDS-SMV пакета всегда можно скачать по ссылке https://pages.nist.gov/fds-smv/downloads.html
PyroSim имеет встроенную опцию для параллельного запуска FDS, однако для этого требуется использовать более одной сетки в моделировании. PyroSim версии 2021.4 предоставляет инструменты, которые помогут вам разделить большую сетку на более мелкие сетки и проверить, чтобы все сетки выровнялись.
- Чтобы запустить моделирование параллельно, в меню Анализ PyroSim выберите Запустить FDS параллельно, и PyroSim назначит отдельные сетки ядрам на вашем компьютере.
- Несколько ядер ускоряют решение для моделей с несколькими сетками. Двойные процессоры с несколькими ядрами лучше, чем один процессор с несколькими ядрами. Конечно, более быстрые процессоры лучше, но немного более медленный процессор с большим количеством ядер, является оптимальной конфигурацией.
Источник <https://support.thunderheadeng.com/answers/pyrosim/reducetime/>
PyroSim включает в себя инструменты для управления несколькими сетками. Одна из эффективных стратегий состоит в том, чтобы сначала определить единую сетку, охватывающую всю модель. Затем используйте инструмент разбиения сетки PyroSim для создания нескольких сеток. Затем вы можете изменить разрешение выбранных сеток, используя опцию Уточнить сетку, и все сетки автоматически останутся правильно выровненными.
Источник <https://support.thunderheadeng.com/docs/pyrosim/2021-4/user-manual/#_parallel_processing>
При выполнении моделирования в PyroSim с несколькими процессами MPI все вычисления в каждой из сеток могут выполняться независимо. Для запуска моделирования, использующего несколько процессов MPI:
- В меню Анализ выберите команду Запустить FDS параллельно.
или
- Нажмите стрелку вниз рядом с кнопкой Запустить FDS () и выберите
Запустить FDS параллельно.
Для получения подробного списка предложений и информации о параллельном запуске FDS, пожалуйста, ознакомьтесь с разделом 6.3.2 Руководства пользователя FDS.
Источник <https://support.thunderheadeng.com/docs/pyrosim/2021-4/user-manual/#_parallel_execution>
Для тестирования была выбрана модель пожара с одной нагрузкой и одним количеством ячеек, менялось только количество сеток для понимания зависимости скорости расчета от количество сеток в сценарии.
Intel Core i9-12900k 5200 MHz | Ryzen 9 5950X 4500 MHz | ||
Windows 11 (тест-сек) | Windows 10 (тест-сек) | Windows 11 (тест-сек) | Windows 10 (тест-сек) |
- | - | - | - |
16-1640 (1)* | 16-1750 (1)* | 16-115 (1)* | 16-110 (1)* |
8-113 (1)* | 8-155 (1)* | 8-86 (1)* | 8-68 (1)* |
6-103 (1)* | 6-125 (1)* | 6-83 (1)* | 6-69 (1)* |
4-141 (1)* | 4-151 (1)* | 4-101 (1)* | 4-93 (1)* |
2-153 (1)* | 2-230 (1)* | 2-161 (1)* | 2-160 (1) |
1-227 (1)* | 1-386 (1)* | 1-273 (1)* | 1-266 (1)* |
*Потоки OpenMP при MPI |
Как видим из тестов, для Core 12-го поколения рекомендуется обновиться до Windows 11.
Тесты скорости расчетов на рабочих станциях
2х 12-Core lntel Хеоn E5-2678 v3, 3300 MHz, fds 6.7.1 | AMD Epyc 7551P 3400 MHz, fds 6.7.7 | 2x XEON E5 2696v3, 2600 MHz, fds 6.7.7 | AMD Ryzen Threadripper 3990X 3700 MHz, fds 6.7.1 |
Windows 10 | Windows 10 | Windows 10 | Windows 10 |
64-241 (1)* | |||
32-133(1)* | 32-126 (1)* | ||
16-129 (1)* | 16-95(1)* | 16-203 (1)* | 16-79 (1)* |
12-73 (1)* | |||
8-127 (1)* | 8-105(1)* | 8-198 (1)* | 8-82 (1)* |
6-156 (1)* | 6-228 (1) | 6-89 (1)* | |
4-201 (1)* | 4-175(1)* | 4-117 (1)* | |
2-366 (1)* | 2-340(1)* | 2-208 (1)* | |
1-618 (1)* | 1-638(1)* | 1-344 (1)* | |
*Потоки OpenMP при MPI |
Тесты при разных OpenMP
2% - занять все слоты оперативной памяти;
10% - увеличить скорость оперативной памяти (на 10% - DDR4 3600 МГц по сравнению с DDR4 2666 МГц);
2% - поставить PyroSim и папку с расчетом на RAMDDR со скорость - 17000 мб/с5% - отключить логические процессы в биосе (SMT), но тогда возрастет нагрузка на процессор в два раза, пример загруженности процессора на четвертом тесте
Включен гиперпоток (стандартные настройки)Не пробывал, но в Windows 11 есть "изоляция ядра" и при ее отключении должен быть тоже прирост (не рекомендуется)
Как итог.
Для скорости в FDS ставим 6-8 сеток для 16 ядерных и 12 сеток для 32 или 64 ядерных.
Потоки OpenMP при MPI ставим 1.
Что точно нельзя делать, как это превышать количество сеток на число ядер, система очень долго будет считать, например у 12900к всего 8 ядер по 5400 MHz, 4 ядра по 4400 MHz и 4 ядра на фоновые программы, там более 12 сеток не стоит делать, видно по тестам на 16 сетках.
Совет.
Собирайте рабочие станции на AMD 5950х, 7950х или Intel 12900к, 13900к
Используйте Cloud HPC - облачный сервер для расчетов FDSВидео презентации сервиса на youtube
-
Поделиться:
- Подписаться