Сервер с графическим процессором GigaIO SuperNODE с 32 GPU AMD Instinct MI210 по 64 ГБ (2 ТБ видеопамяти!), моделировал эти потоки воздуха Concorde 33 часа.
Сервер с графическим процессором GigaIO SuperNODE с 32 GPU AMD Instinct MI210 по 64 ГБ (2 ТБ видеопамяти!), моделировал эти потоки воздуха Concorde 33 часа.
В моделировании показан "Конкорд" длиной 62 м, перед посадкой при скорости полета 300 км/ч и угле атаки 10° в течение 1 секунды полета. Число Рейнольдса с учетом размаха крыла составляет 146 млн.
Разрешение моделирования составляет 2976×8936×1489 = 40 млрд. ячеек, при этом размер ячейки составляет (12,4 мм)³. 67268 временных шагов были рассчитаны за 29 часов, плюс 4 часа на рендеринг кадров 5×600 4K, общее время работы составило 33 часа. На видео показаны изоповерхности, окрашенные по критерию Q, в цвета скорости-магнитуды. Один кадр поля скоростей занимает 475 ГБ, поэтому 600 кадров визуализируют в общей сложности 285 ТБ данных.
Это тест новых реализованных границ свободного скольжения, которые являются более точной моделью турбулентного пограничного слоя, чем границы отсутствия скольжения.
На том же оборудовании коммерческим CFD-программам, таким как Ansys или Star-CCM+, для такого моделирования потребовалось бы несколько лет вычислительного времени. FluidX3D делает это за выходные.
Источники:
Многие просили меня сделать собственную версию портативной версии Stable Diffusion, и вот наконец-то у меня дошли руки.
За основу взят форк stable-diffusion-webui под названием SD.Next (он же automatic от vladmandic). У меня был его обзор на YouTube канале, сейчас он конечно сильно изменился, но функции из видео все еще остались на месте.
В чем отличие от automatic1111:
SD.Next отличается глубокой оптимизацией и улучшенной производительностью, а также расширенным функционалом.
Больший диапазон настроек.
Предустановлен и интегрирован в систему ряд расширений: ControlNet, Tiled VAE, Image Browser и другие.
Возможность переключиться на diffusers, что расширяет поддержку моделей, добавляя поддержку Kandinsky 2.1 и других.
Работа на GPU Nvidia, AMD, Intel и в том числе на процессорах из коробки.
Особенности портативной версии:
- Не требует установки Python, GIT, Cuda toolkit и т.д. Скачали, распаковали, пользуетесь.
- Предустановлен VAE и универсальная модель dreamshaper v8
- Предустановлены кастомные ESRGAN апскейлеры
- Предустановлено расширение roop (замена лица на изображениях)
- Предустановлено расширение swap-mukham (замена лица на изображениях, видео)
- Обновляется автоматически при каждом запуске
Поддерживаются видеокарты Nvidia и AMD и Intel ARC
Скачать портативную версию можно по этой ссылке
Для запуска необходимо распаковать архив через WinRAR или 7zip и запустить файл universal_start.bat
Будущие обновления сборки, а также другие полезные нейросети с простым запуском можно найти в моем телеграм канале Neurogen
Периодически читая комментарии под моими сборками, вижу, что у многих людей, не знакомых хорошо с нейросетями, возникают сложность с установкой и запуском Stable Diffusion. И если для пользователей Nvidia решений в сети предостаточно, то для AMD все не так уж радужно, да и обычные способы вызывают путаницу в голове у многих. И поэтому я решил сделать портативную версию, которая не требует установки каких-либо дополнительных программ.
Сборка работает на основе форка stable-diffusion-webui-directml, который позволяет работать всем картам, поддерживающим DirectX 12. Так что, на самом деле, эта версия работает не только на AMD, но и на Nvidia, а также Intel (включая встроенные видеокарты).
Особенности сборки:
- Предустановлены расширения ControlNet, Image Browser, Tiled Diffusion, Tiled VAE
- Создана отдельная виртуальная среда для запуска с поддержкой ускорения Olive (это уже тема для отдельного поста)
Скачать: Яндекс Диск
Как запустить:
1) Качаем архив
2) Распаковываем
3) Запускаем файл START.bat
4) Ждем когда в командной строке появится "Running on local URL: http://127.0.0.1:7860" после чего заходим в браузере по этому адресу.
В принципе всё, можно пользоваться. Дополнительно, можете скачать этот архив с моделями, просто откройте его и скопируйте папку models в папку stable-diffusion-webui-directml. В данном архиве находится универсальная модель Deliberate, несколько кастомных апскейлеров, а также все модели для ControlNet.
В будущем сборка будет периодически обновляться, в зависимости от потребности пользователей, будут добавляться новые встроенные расширения и другие дополнения. Все обновления, а также полезная информация будет в моем телеграм канале со сборками других нейросетей.
В такой объем кэша в теории можно без проблем поставить современный Linux, который будет летать со сверхзвуковой скоростью
Новости Мой Компьютер
У меня тоже есть история про восстановление PGA процессора, относительно свежего.
Знакомьтесь, AMD Ryzen 3 3200G, вышел из сокета вместе с кулером, хозяин решил, что раз вышли вместе, то и запихивать взад тоже нужно непременно так же. Итоги на фото ниже:
А вот чуть крупнее:
Вообще, в таких ситуациях я рекомендую пойти и купить новое, но на момент обращения даже такой процессор стоил порядка 12-13 тысяч, а обратившимся был молодой пацан лет пятнадцати. Я решил помочь.
Для начала я выправил скальпелем всё то, что не слишком сильно замято:
До
После
Было ещё много подобного, всё я фоткать не стал.
Далее стал думать что делать с остальным лесоповалом:
Классный бурелом, после того как я очередной раз выругался, решил что лучше всё убрать и поставить ноги заново, в дело пошёл сплав Вуда, после удаления поломанных ног весь сплав я удалил(на фото ещё не все пятаки почищены)
И начал рядками напаивать новые ноги. Пытался усаживать феном, но пока садил одну ногу - сдувались соседние, в итоге сначала выставлял рядок, в левой руке фен, в правой паяльник. Усаживал на ПОС-90. Ноги брал с ноутбучного штеуда второго поколения
Ряд за рядом...
После всех мытарств усадил процессор в родной сокет, погонял тестами чтобы убедиться что ничего не отваливается и отдал.
Если пост запилил коряво - сорямба, длиннопосты делать красиво не умею.
В ядро Linux 6.0, релиз которого ожидается в следующий понедельник, принято изменение, решающее проблемы с производительностью систем на процессорах AMD Zen. Источником падения производительности оказался код, добавленный 20 лет назад для обхода аппаратной проблемы в некоторых чипсетах. Аппаратная проблема давно устранена и не проявляется в актуальных чипсетах, но старый обход проблемы был забыт и стал источником снижения производительности на системах на базе современных CPU AMD. Новые системы с CPU Intel старый обходной манёвр не затрагивает, так как доступ к ACPI в них осуществляется при помощи отдельного драйвера intel_idle, а не общего драйвера processor_idle.
Обходной манёвр был добавлен в ядро в марте 2002 года для блокирования проявления ошибки в чипсетах, связанной с отсутствием должной установки состояние простоя (idle) из-за задержки обработки сигнала STPCLK#. Для обхода проблемы в реализации ACPI добавлялась дополнительная инструкция WAIT, замедляющая процессор чтобы чипсет успевал перейти в состояние простоя. При проведении профилирования с использованием инструкций IBS (Instruction-Based Sampling) на процессорах AMD Zen3 было выявлено, что процессор проводит значительное время, выполняя заглушку, которая приводит к неверной трактовке состояния нагрузки на процессор и выставлению более глубоких режимов сна (C-State) обработчиком cpuidle.
Подобное поведение отражается в снижении производительности при нагрузках, в которых часто чередуются состояния простоя (idle) и активности (busy). Например, при использовании патча, отключающего обходной манёвр, средние показатели теста tbench увеличиваются с 32191 MB/s до 33805 MB/s.