Morozofkk.ru / Windows 11 показывает сниженную производительность в FDS

Windows 11 показывает сниженную производительность в FDS

12.01.2023
тест на версии fds 6.7.9 на 12900k (ddr5 4800) - 56 сек на 12 сетках, прирост 26% по сравнению с 12900k (ddr4 3600) - 76 сек 
16.12.2022
тест на версии fds 6.7.9 на 13900k (ddr4 3600) - 51 сек на 16 сетках, прирост по сравнению с 12900k (ddr4 3600) 30%
09.09.2022
тест на версии fds 6.7.9 на 12900k (ddr4 3600) - 76 сек на 12 сетках, AMD 5950х (ddr4 3600) отстает на 20% (96 сек на 8 сетках), на версии fds 6.7.9 Intel задействует все ядра, а AMD только половину, надеюсь поправят в 7 версии. Сейчас 12900k  43 т.руб, а Ryzen 9 5950X 37 т. руб

01.12.2021
Сравнил в тестах Windows 10 и Windows 11 на AMD и Intel.
Файлы тестов по ссылке https://disk.yandex.ru/d/dmLufbMfC5Fz2Q, если у вас будут результаты быстрее моих дайте знать.
В тестах сравнивал системы на процессорах 12900k и 5950X, Windows на М2 980 pro 500 гб, оперативная память DDR4 3600 мгц.
Тестировал на fds 6.7.1 (2019) в один прогон, 
Версии FDS-SMV пакета всегда можно скачать по ссылке  https://pages.nist.gov/fds-smv/downloads.html

PyroSim имеет встроенную опцию для параллельного запуска FDS, однако для этого требуется использовать более одной сетки в моделировании. PyroSim версии 2021.4 предоставляет инструменты, которые помогут вам разделить большую сетку на более мелкие сетки и проверить, чтобы все сетки выровнялись.
Источник <https://support.thunderheadeng.com/answers/pyrosim/reducetime/> 

PyroSim включает в себя инструменты для управления несколькими сетками. Одна из эффективных стратегий состоит в том, чтобы сначала определить единую сетку, охватывающую всю модель. Затем используйте инструмент разбиения сетки PyroSim для создания нескольких сеток. Затем вы можете изменить разрешение выбранных сеток, используя опцию Уточнить сетку, и все сетки автоматически останутся правильно выровненными.
Источник <https://support.thunderheadeng.com/docs/pyrosim/2021-4/user-manual/#_parallel_processing> 

При выполнении моделирования в PyroSim с несколькими процессами MPI все вычисления в каждой из сеток могут выполняться независимо. Для запуска моделирования, использующего несколько процессов MPI:
или
Запустить FDS параллельно.
Для получения подробного списка предложений и информации о параллельном запуске FDS, пожалуйста, ознакомьтесь с разделом 6.3.2 Руководства пользователя FDS.
Источник <https://support.thunderheadeng.com/docs/pyrosim/2021-4/user-manual/#_parallel_execution> 

Для тестирования была выбрана модель пожара с одной нагрузкой и одним количеством ячеек, менялось только количество сеток для понимания зависимости скорости расчета от количество сеток в сценарии.
Intel Core i9-12900k 5200 MHzRyzen 9 5950X 4500 MHz
Windows 11 (тест-сек)Windows 10 (тест-сек)Windows 11 (тест-сек)Windows 10 (тест-сек)
----
16-1640 (1)*16-1750 (1)*16-115 (1)*16-110 (1)*
8-113 (1)*8-155 (1)*8-86 (1)*8-68 (1)*
6-103 (1)*6-125 (1)*6-83 (1)*6-69 (1)*
4-141 (1)*4-151 (1)*4-101 (1)*4-93 (1)*
2-153 (1)*2-230 (1)*2-161 (1)*2-160 (1)
1-227 (1)*1-386 (1)*1-273 (1)*1-266 (1)*
*Потоки OpenMP при MPI
Как видим из тестов, для Core 12-го поколения рекомендуется обновиться до Windows 11.

Тесты скорости расчетов на рабочих станциях

2х 12-Core lntel Хеоn E5-2678 v3, 3300 MHz, fds 6.7.1

AMD Epyc 7551P

3400 MHz, fds 6.7.7

2x XEON E5 2696v3, 2600 MHz, fds 6.7.7

AMD Ryzen Threadripper 3990X

3700 MHz, fds 6.7.1

Windows 10

Windows 10

Windows 10

Windows 10




64-241 (1)*


32-133(1)*


32-126 (1)*

16-129 (1)*

16-95(1)*

16-203 (1)*

16-79 (1)*




12-73 (1)*

8-127 (1)*

8-105(1)*

8-198 (1)*

8-82 (1)*


6-156 (1)*

6-228 (1)

6-89 (1)*

4-201 (1)*

4-175(1)*


4-117 (1)*

2-366 (1)*

2-340(1)*


2-208 (1)*

1-618 (1)*

1-638(1)*


1-344 (1)*

*Потоки OpenMP при MPI






Тесты при разных OpenMP
Дополнительно можно увеличить скорость расчета в FDS:
2% - занять все слоты оперативной памяти;
10% - увеличить скорость оперативной памяти (на 10% - DDR4 3600 МГц по сравнению с DDR4 2666 МГц);
2% - поставить PyroSim и папку с расчетом на RAMDDR со скорость - 17000 мб/с
5% - отключить логические процессы в биосе (SMT), но тогда возрастет нагрузка на процессор в два раза, пример загруженности процессора на четвертом тесте
Включен гиперпоток (стандартные настройки)
Выключен гиперпоток
Не пробывал, но в Windows 11 есть "изоляция ядра" и при ее отключении должен быть тоже прирост (не рекомендуется)

Как итог. 
Для скорости в FDS ставим 6-8 сеток для 16 ядерных и 12 сеток для 32 или 64 ядерных.
Потоки OpenMP при MPI ставим 1.

Что точно нельзя делать, как это превышать количество сеток на число ядер, система очень долго будет считать, например у 12900к всего 8 ядер по 5400 MHz, 4 ядра по 4400 MHz и 4 ядра на фоновые программы, там более 12 сеток не стоит делать, видно по тестам на 16 сетках.

Совет.
Собирайте рабочие станции на AMD 5950х, 7950х или  Intel 12900к, 13900к
Используйте Cloud HPC - облачный сервер для расчетов FDS
Видео презентации сервиса на youtube


7-01-2022, 16:18
Вернуться назад