?

Log in

No account? Create an account
Previous Entry Share Next Entry
В США строится первый в мире «экзафлопсный» суперкомпьютер
bmpd





Как сообщает веб-ресурс CNews в материале Владимира Бахура «Первый в мире «экзафлопсный» суперкомпьютер строится на секретной архитектуре Intel», суперкомпьютер Aurora, в который уже инвестировано 0,5 млрд долл, станет первой в США системой с рекордной производительностью «более экзафлопса». Субподрядчик Cray намерен применить свою платформу Shasta на базе секретной архитектуры Xe от основного подрядчика Intel.



xe1

Intel построит «экзафлопсный» суперкомпьютер Aurora для министерства энергитики США (с) Intel (via www.cnews.ru )



Первый американский «экзафлопс»

США официально включились в мировую гонку по запуску первого в мире суперкомпьютера с производительностью более 1 экзафлопс. Представители Министерства энергетики США (U.S. Department of Energy), которое выступает заказчиком, официально подтвердили, что создаваемый компаниями Intel и Cray суперкомпьютер Aurora, способный «обеспечить устойчивую производительность порядка одного экзафлопса», будет запущен в строй в Аргоннской национальной лаборатории (Argonne National Laboratory) ближе к концу 2021 г.

Производительность системы Aurora в один экзафлопс, соответствующая выполнению 1018 (квинтиллион, или миллион триллионов) операций с плавающей запятой в секунду, планируется обеспечить с помощью новой секретной архитектуры Intel Xe (в маркетинговых целях пишется как Xe — «икс в степени экспоненты») следующего поколения, о которой до сих пор известно очень мало.

Впервые завеса секретности над проектом Intel Xe была в самых общих чертах приоткрыта в рамках суперкомпьютерной конференции SC18 в конце прошлого года. Первые подробности были озвучены 15 марта на специальном закрытом брифинге Intel для профильных специалистов.

Финальная версия контракта на создание суперкомпьютера Aurora (в ранних описаниях контракта проект фигурировал под названием CORAL) подразумевает инвестиции в сумме более $500 млн. Несмотря на ряд изменений в контракте, компания Intel по-прежнему фигурирует в качестве основного подрядчика, компания Cray заявлена субподрядчиком проекта.

Инфраструктура проекта Aurora

Конструкция суперкомпьютера Aurora базируется на базе двух сотен унифицированных кластерных систем Cray Shasta, объединенных межузловой шиной (интерконнектом) Cray Slingshot и программным стеком Shasta.

Каждая система Shasta базируется на процессорах Intel Xeon Scalable нового поколения, вычислительной архитектуре Intel Xe, энергонезависимой памяти Intel Optane Datacenter Persistent Memory нового поколения, с использованием программного стека Intel One API.

Как отмечают в Cray, сочетание программных компонентов Intel и системного ПО Cray для систем Shasta обеспечит модульность суперкомпьютера Aurora и удобства по дальнейшему наращиванию его системных ресурсов в любое время. Унифицированные вычислительные стойки Shasta с интерконнектом Slingshot в сочетании с единой инфраструктурой управления и разработки приложений позволят, по задумке разработчиков, оптимизировать рабочие нагрузки суперкомпьютера и сэкономить время ученых и других пользователей.

Выручка Cray по этому контракту, оцениваемая более чем в $100 млн, станет одной из крупнейших в истории компании. Создание суперкомпьютера Aurora станет вторым крупным внедрением систем Shasta за последние полгода. Первым стал контракт на $146 млн по строительству системы Perlmutter для Федерального научного энергетического вычислительного центра США (National Energy Research Scientific Computing Center, NERSC) в Беркли, Калифорния.

Архитектура Xe: «будет круто», но пока все расплывчато

Изначально, в момент анонса архитектуры Xe на форуме SC18, ряд сетевых обозревателей поспешили окрестить ее как «новый бренд графических ускорителей Intel». Рассказывая на закрытом брифинге об архитектуре Xe, Раджиб Хазра (Rajeeb Hazra), вице-президент Intel и глава подразделений Data Center Group и Enterprise and Government Group, так и не представил никаких технических подробностей о проекте. Ни слова о строении архитектуры или о роли, занимаемой в ней графическими ускорителями Intel, отмечают обозреватели HPCwire.

Использование новой архитектуры в рамках проекта Aurora представители Intel описали как «новые техпроцессы, разработка эффективного кремния и, что наиболее важно, новые способы… упаковки кремния».

Как было отмечено в рамках презентации проекта, «Xe представляет огромный объем научно-исследовательских работ и инноваций для соответствия современным рабочим нагрузкам, в частности, возникающим на стыке задач HPC, искусственного интеллекта и аналитики данных».

Тем не менее, Крис Хук (Chris Hook), отвечающий за маркетинг в подразделении Intel по разработке графических систем, внес уточнение, пояснив, что Xe представляет собой «переход Intel от экономичной графической архитектуры Gen к полностью масштабируемой графической архитектуре Xe».

«Это не название бренда вроде Radeon или GeForce», отметил Крис Хук на своей странице в Twitter. Сегодня, упомянув официальный запуск проекта суперкомпьютера Aurora, Крис Хук также написал «наш первый заказчик Xe!».

Таким образом, архитектура Xe вне всяких сомнений имеет прямое отношение к графическим ускорителям Intel нового поколения. Вопрос лишь в том, что архитектура этих ускорителей до сих пор остается закрытой для широкой публики.

Как ранее рассказали в Intel, графические решения на базе архитектуры Xe будут развиваться двумя самостоятельными архитектурными потоками – в виде дискретных и интегрированных решений для рынка бытовых систем, и в виде дискретных карт для ЦОДов и HPC. Появление графики нового поколения было обещано Intel ближе к 2020 г., по мере освоения техпроцесса 10 нм.

Согласно официальным заявлениям Intel, графические решения на базе архитектуры Xe будут обеспечивать производительность «от терафлопсов до петафлопсов». Тем не менее, число таких решений на архитектуре Xe в составе суперкомпьютера Aurora пока не оценено даже приблизительно.

Чем будет заниматься Aurora

По словам представителей партнеров проекта — Минэнергетики США, Аргоннской лаборатории, Intel и Cray, суть проекта не только в достижении «горизонта экзаскейла», основная роль проекта Aurora – в ускорении сближения высокопроизводительных вычислений с традиционными методиками моделирования с применением анализа данных и искусственного интеллекта.

По словам Рика Стивенса (Rick Stevens), замдиректора Арагоннской лаборатории по вычислениям и компьютерным наукам, Aurora будет «эксклюзивно сконфигурирована» в качестве лучшей платформы для глубокого машинного обучения.

Комментируя огромный скачок, который придется совершить в приросте Aurora (более экзафлопа, или более 1000 петафлопс) по сравнению с самой мощной на сегодня системой Summit (порядка 150 петафлопс) всего за три года, Рик Стивенс отметил: «Исследования и разработки для достижения «экзаскейла» велись более десятилетия… да, система появится только через три года, но за это время потребуется сделать рывок с ускорением для создания архитектуры и ПО под такую производительность».

По словам Рика Стивенса, вычислительные возможности нового суперкомпьютера в сочетании с технологиями аналитики данных позволят Аргоннской лаборатории расширить сотрудничество с Национальным институтом исследований и предотвращения рака (National Institute of Cancer Prevention and Research) и Администрацией по делам ветеранов. В рамках этих исследований, в частности, предполагается использовать машинное обучение и анализ больших данных для оценки риск-факторов и разработки стратегий в случаях суицидальных наклонностей у пациентов, для глубокого изучения природы сердечных приступов и последствий черепно-мозговых травм.

Со стороны Минэнергетики США предполагается расширение программ по материаловедению, в том числе, в плане разработки материалов для улучшенных электрических батарей, более эффективных фотогальванических элементов для солнечной энергетики, новых материалов для ветроэнергетических установок и ядерных реакторов. В списке проектов также числятся расширенные исследования в области угрозы землетрясений, улучшения эффективности турбин, предсказания погоды и т.д.

Перспективы «экзаскейла» в мире

В прошлом году Министерство энергетики США уже получило в свое распоряжение два суперкомпьютера, с ходу занявших первую и вторую строчки в мировом рейтинге суперкомпьютеров Top500.

Занявшая первую строчку система Summit на базе модулей IBM Power System AC922 с процессорами IBM POWER9 22C 3,07 ГГц и графическими ускорителями NVIDIA Volta GV100, установленная в национальной лаборатории Oak Ridge, показала производительность на уровне 143,5 петафлопс (пиковая 200,8 петафлопс). На второй строчке расположилась система Sierra Ливерморской лаборатории на базе систем IBM Power System S922LC с процессорами IBM POWER9 22C 3,1GHz и графическими ускорителями NVIDIA Volta GV100, обеспечившая производительность 94,6 петафлопс (на пике до 125,7 петафлопс).

С запуском систем Summit и Sierra США вернули себе лидерство в Top500, уступленное несколько лет назад китайским суперкомпьютерам Sunway TaihuLight и Tianhe-2A.

Китай также не теряет время даром: еще в начале 2017 г. КНР сообщила о начале разработки суперкомпьютера с производительностью в один экзафлопс, с запуском системы в работу уже в 2020 г.

По заявлению разработчиков, новый суперкомпьютер Tianhe-3 будет полностью изготовлен в КНР «от процессоров до операционной системы». Система, как сообщалось, будет доступна «для публичного использования», помогая в решении научных вопросов и «закрепляя за Китаем звание мирового лидера в сфере компьютерного оборудования». В частности, планируется его использование для анализа последовательностей генов и белковых структур, что может в итоге привести к открытию новых лекарств. Экономическая выгода Китаю от работы суперкомпьютера предположительно составит 10 млрд юаней ($1,49 млрд).

Летом 2016 г. планы по созданию компьютера мощностью в один экзафлопс также объявила японская Fujitsu. Ожидается, что машина будет создана на базе архитектуры ARM.

О намерении создать экзафлопсную систему также ранее заявляли в американской корпорации Intel и саровском ядерном центре (РФЯЦ-ВНИИЭФ), Россия.



xe3

Инфраструктура суперкомпьютера Aurora



xe6

Слайд, показанный на презентации Intel в рамках SC18



xe5

«Шесть столпов» Intel для достижения «экзаскейла»



xe4

«Переход Intel от архитектуры Gen к архитектуре Xe»



  • 1
Думаю, РФЯЦ-ВНИИЭФ нужна помощь Михаила Боппосова в создании элементной базы, так сказать.

А для каких задач? С решаемыми параллельными вычислениями их не так много. Или "Шоб бiло?"

Интересно, хватит у них ума развести "по железу" от Интернета это чудо ?


Это чтобы президента США нельзя было избрать быстрее, чем за время порядка десятков миллисекунд?

Чтоб не майнили :)

Смысла майнить особого нет. Небольшой подвал со стойкой специализированных асиков порвёт эту Аврору как тузик грелку. :)

> Интересно, хватит у них ума развести "по железу" от Интернета это чудо ?

А зачем разводить-то? Обычно рядом с монстриком ставят несколько мелких сборок, одновременно для тестирования перед большими прогонами и для загрузки-выгрузки данных. Вот на эти мелкие кластеры нас, обычных посторонних юзеров, и пускают. С одной стороны, на них нормально SSH-ишься снаружи, при нужде ещё и логины к IPMI дают, а с другой там как минимум годный Мелланокс внутри кластера и как минимум он же до машин основного кластера (плюс служебный 10GigE, само собой). При желании наладить трафик от "чуда" во внешнйи мир через служебный кластер как через прокси --- совсем не проблема, но зачем?

Для безопасности. Судя по заголовку, они могут его и в управлении энергосистемой использовать.

Но если нет, верно, и не нужно.

Даже если это чудо-юдо будет использовано для обучения нейронных сетей для энергосистемы, то он при этом не будет соединён с диспетчерскими. Точно так же, как если он будет использован для обучения енйросетей для дронов, он не будет соединён с каждым дроном. Обученная нейросеть --- это просто математическая функция, хоть и непонятная/громоздкая, а программа для применения этой функции к реальным данным требует в тысячи/миллионы/миллиарды раз меньшую трудоёмкость, чем процесс обучения. Поэтому готовая нейросеть может крутиться иногда и на сотовом телефоне, суперкомп уже не нужен.

Но вероятнее всего, Министерству энергетики этот суперкомп нужен совсем для других задач. Дело в том, что это министерство занято и всем ядерным, от реакторов до боеголовок, а испытательные ядерные взрывы нынче запрещены.

Моделировать то они могут. Только центрифуги все равно не построят...

Вообще-то центрифуги у них были. Просто у них квалифицированные спецы, которых просят поехать на работу в попу мира, просят столько, что выгодней устроить тупую газовую диффузию, хоть она и жрёт больше энергии. Завод с центрифугами у них поработал, и закрылся. Сейчас они готовят в серию поколение гигантских центрифуг, под 10 метров длиной, в надежде, что они окажутся настолько экономичней не только диффузии, но и наших центрифуг, что окупят и затраты на работяг. Если у них не взлетит, то у них мега-убытки. Если взлетит --- мы и французы в полной ж., у нас экспорт услуг обогащения накроется.

э-э... где про успешные испытания мега-центрифуг почитать можно? А заодно про строительство хранилища ОЯТ и завод по переработке плутония.

> э-э... где про успешные испытания мега-центрифуг почитать можно?

Боюсь, что нигде. Пока амеры этим занимались совместно с европейцами, были хотя бы слухи, но 2--3 года назад они их всех выперли, и с тех пор полная неизвестность.

и даже мультиков нету? И красочных презентаций? Недочет:) А если серьезно, то с ростом размеров критически возрастают явления резонанса. На геоэнергетике об этом целый цикл статей был. Боюсь, в ядерной энергетике Штаты отстали почти навсегда. Халявное топливо убило целую отрасль.

> А если серьезно, то с ростом размеров критически возрастают явления резонанса.

21-й век всё-таки. Цифровое проектирование, любое нужное АСУчивание... К примеру, современная паровая турбина, да если ещё и в сборе с генератором, да если ещё турбина высокого давления соосно с турбинами низкого, при разгоне проходит целую гребёнку резонансов. Причём в отличие от почти мгновенно управляемого электромагнитного привода центрифуги у турбины нет возможности сманеврировать мощностью потока пара быстрее, чем за целые секунды. Да ещё и целевых рабочих режимов у турбины целый диапазон, а не одно раз и навсегда "у-у-у" центрифуги. Ничего, приспособились.

И если вспоминать аварии на центрифугах в США, то каждый раз они начинались с отказов внешнего оборудования (обесточивание, например), и усугублялись идиотизмом недостаточно квалифицированного персонала (проценник квалифицированного персонала в попе мира см.выше). Резонансы каждый раз были совершенно не при чём. Вполне может быть, что что-то такое "резонансное" понизило бы надёжность или сократило сроки службы, но рукожопы и дураки не дали шансы это определить --- поломали раньше.

что самое интересно - не только ядерным - как пример Минэнерго США - вполне себе занимается ещё и производством углеродных волокон, почти тех, которые отказались поставлять для МС-21

Скорее всего делают не только для энергетики, а еще и для контроля потока информации всего Интернета, также планирования направления цифровой экономики.

атомное оружие

эльбрус порвет это говно на раз

Да, походу месячник шуток объявлен открытым.

Квантовый компьютер у москалей 100 % уже есть, иначе как москали знают все секреты США

Интересно получается.
Вы пишите, что первый строит США, который будет запущен не раньше 2021го.
И тут же пишете, что Китай запустит свой в 2020м году.
И кто тогда первый?

Не забывайте,что внутри земного шара есть еще один шар,который гораздо больше наружного...

По итогу выйдет ярд или два резанной, при таких затратах всё легко делается

Гуня, это Вы? Почему в таком виде?!

как известно, ядерное оружие под контролем минэнергетики

SkyNet не дремлет...Готовьтесь

По ходу решили пойти по пути нагружения графического ускорителя, кои давно использует амд для OpenCL расчетов. Явно х86 в тупике по дальнейшему наращиванию мощности, как и ARM тоже не айс. Скорее всего Nvidia напряжется и переплюнет со своей Вольтой и CUDA.

  • 1