Trang Chủ Suy nghĩ tiến tới Siêu máy tính 15: những thay đổi lớn hơn ở đường chân trời

Siêu máy tính 15: những thay đổi lớn hơn ở đường chân trời

2024

Video: Láº§n thá»© hai Bá» VÄn hÃ³a bÃ¡c Äá» xuáº¥t bÃ¡n vÃ© há»i chá»i trÃ¢u Äá» SÆ¡n (Tháng mười một 2024)

Khi tôi xem qua các thông báo và thủ tục tố tụng của hội nghị Supercomputing 15 (SC15) tháng trước ở Austin, có vẻ như trong khi điện toán hiệu năng cao có thể hơi chậm, đó là một thị trường sẵn sàng cho một số thay đổi lớn trong năm tới đến.

Nếu bạn nhìn vào các nhà lãnh đạo trong danh sách top500, danh sách hai lần máy tính nhanh nhất thế giới, nhà lãnh đạo lần thứ sáu liên tiếp là Tianhe-2, siêu máy tính được xây dựng bởi Đại học Công nghệ Quốc phòng Trung Quốc. Theo danh sách top500, cỗ máy này cung cấp 33, 86 petaflop / giây (bốn triệu phép tính mỗi giây) hiệu suất duy trì trên điểm chuẩn Linpack và 54, 9 petaflop / giây hiệu suất cực đại lý thuyết. Điều này dựa trên bộ xử lý Intel Xeon và Xeon Phi.

Vị trí thứ hai tiếp tục thuộc về Titan, một hệ thống Cray XK7 dựa trên CPU AMD Opteron và GPU Nvidia K20x được cài đặt tại Phòng thí nghiệm quốc gia Oak Ridge của DOE, với 17, 59 petaflop / s hiệu suất duy trì trên điểm chuẩn Linpack.

Hai máy mới đã phá vỡ top 10. Máy tính Trinity tại Phòng thí nghiệm quốc gia Lawrence Livermore (LLNL) đứng thứ sáu với 8.1 petaflop / s, trong khi hệ thống Hazel-Hen tại Höchstleistungsrechenzentrum Stuttgart (HLRS) đứng thứ tám với 5, 6 petaflop / s. Cả hai đều là máy Cray XC, dựa trên bộ xử lý Intel Xeon có kết nối Aries.

Những thay đổi lớn hơn xảy ra ở xa hơn trong danh sách, đặc biệt với sự gia tăng lớn về số lượng các hệ thống của Trung Quốc, đã tăng lên 109, so với chỉ 37 trong danh sách trước đó. Một phần, điều này dường như là từ nhiều hệ thống Trung Quốc chạy các điểm chuẩn và gửi kết quả cho danh sách. Kết quả là, số lượng các hệ thống của Hoa Kỳ đã giảm từ 231 xuống còn 200, đây là con số thấp nhất kể từ khi danh sách được bắt đầu vào năm 1993; và số lượng hệ thống châu Âu giảm từ 141 xuống 108.

Một xu hướng lớn là sự gia tăng số lượng hệ thống sử dụng máy gia tốc hoặc bộ đồng xử lý, đã tăng lên 104 hệ thống trong danh sách hiện tại, tăng từ 90 vào tháng Bảy. Phần lớn các hệ thống đó sử dụng GPU Nvidia Tesla, tiếp theo là bộ đồng xử lý Xeon Phi của Intel, một số ít sử dụng kết hợp. Nvidia chỉ ra rằng nó nằm trong 70 hệ thống này, bao gồm 23 trong số 24 hệ thống mới trong danh sách.

Tại triển lãm, Nvidia đã nhấn mạnh sự tăng trưởng của các máy gia tốc và đặc biệt là số lượng ứng dụng hiện được tối ưu hóa cho kiến trúc CUDA của công ty. Công ty cho biết 90% trong số 10 ứng dụng điện toán hiệu năng cao hàng đầu và 70% trong số 50 ứng dụng hàng đầu hiện đang được tăng tốc. Một cách sử dụng hấp dẫn là dành cho các hệ thống chạy mô phỏng thời tiết, một ứng dụng chính cho điện toán hiệu năng cao, vì dự báo thời tiết được sản xuất bởi tất cả các loại chính phủ. Cray trước đó đã chỉ ra việc sử dụng các máy gia tốc như vậy tại Văn phòng Khí tượng Thụy Sĩ (MeteoSwiss) và đã nói về cách nó hoạt động với các nhà nghiên cứu ở Thụy Sĩ trong việc viết lại nhiều ứng dụng của nó. Nvidia hiện đang chỉ ra việc sử dụng máy gia tốc của Cơ quan Khí quyển và Đại dương Quốc gia (NOAA) cho một số dự báo thời tiết của nó.

Trong số các ứng dụng khác, Cray đã mời chào các ứng dụng dầu khí, như sử dụng địa vật lý 3D để mô phỏng một hồ chứa, cũng như các dịch vụ tài chính, như đánh giá rủi ro. Các ứng dụng như vậy hiếm khi tạo nên các hệ thống nhanh nhất trên thế giới, nhưng là một dấu hiệu cho thấy điện toán hiệu năng cao đang đóng vai trò rộng hơn trong các ứng dụng công ty hơn. Cray đã nói về một sự tiến bộ ổn định để chạy các mô hình lớn hơn và chi tiết hơn trên tất cả các ngành khoa học và kỹ thuật, và kết hợp khối lượng công việc truyền thống với các phân tích.

Tôi cũng quan tâm đến một thông báo của Linux Foundation về một nỗ lực mới gọi là OpenHPC, được thiết kế để tạo ra các tiêu chuẩn mở hơn trong thế giới HPC. Đó là một ý tưởng thú vị, và một ý tưởng dường như có rất nhiều người chơi lớn đang đăng nhập.

Có một số hệ thống mới trong công trình. IBM đang chế tạo một cỗ máy mới có tên Hội nghị thượng đỉnh tại Phòng thí nghiệm quốc gia Oak Ridge (ORNL) và một máy khác gọi là Sierra tại Phòng thí nghiệm quốc gia Lawrence Livermore (LLNL), cả hai đều dựa trên CPU kiến trúc IBM Power, GPU Nvidia Tesla và kết nối Mellanox. Hội nghị thượng đỉnh dự kiến sẽ cung cấp 150 đến 300 petaflop / s và Sierra hơn 100 petaflop / s.

Ngoài ra, Intel và Cray đang chế tạo một cỗ máy mới có tên Aurora, dựa trên bộ xử lý Intel Xeon Phi sắp ra mắt của Hiệp hội điện toán Argonne (một phần của Phòng thí nghiệm quốc gia Argonne), nhằm vào 150 petaflop vào năm 2018. Tất cả những thứ này là một phần của chương trình của Bộ Năng lượng được gọi là Cộng tác của Oak Ridge, Argonne và phòng thí nghiệm quốc gia Lawrence Livermore (CORAL), nhằm mục đích thúc đẩy phát triển điện toán hiệu năng cao, và cụ thể là dự án FastForward 2.

Tuy nhiên, chúng ta vẫn còn một chặng đường dài để đi trên con đường hướng tới "điện toán exascale".

Trong khi đó, có một số thông báo bộ xử lý có thể là tín hiệu tốt cho tương lai. Nvidia đặc biệt thúc đẩy việc sử dụng siêu máy tính cho các ứng dụng web siêu tốc, đặc biệt là học máy. Họ đã công bố một số sản phẩm cấp thấp hơn: bo mạch Tesla M40 với 3072 nhân CUDA, được cho là có khả năng thực hiện tới 7 teraflop / s chính xác, chủ yếu nhằm đào tạo "học sâu" và M4, một bảng điện thấp hơn với 1024 lõi và 2, 2 teraflop / s, có thể được sử dụng để suy luận sâu cũng như những thứ như xử lý hình ảnh và video. Ngoài ra, công ty đã công bố một "bộ siêu cường lực" mới với các ứng dụng nhắm vào các trang web máy tính lớn nhất. Cả hai sản phẩm phần cứng mới đều dựa trên công nghệ xử lý 28nm và kiến trúc Maxwell của công ty.

Công ty đã công bố hai kiến trúc tiếp theo, được gọi là Pascal, do vào năm tới và Volta, sẽ đi theo nó. Intel tập trung vào cách HPC ảnh hưởng đến khoa học và tôi bị thu hút bởi mô tả về cách sử dụng siêu máy tính của riêng mình - hiện được xếp hạng 99 trong danh sách 500 hàng đầu - để giúp thiết kế bộ xử lý của riêng mình. Cụ thể, công ty cho biết họ sử dụng một triệu giờ CPU chỉ để thiết kế các photomas cho bộ xử lý thế hệ tiếp theo.

Phần lớn hoạt động của Intel tập trung vào Hiệp sĩ hạ cánh, phiên bản tiếp theo của chip Xeon Phi, có thể được sử dụng làm máy gia tốc nhưng cũng được khởi động; và vải Omni-Path của nó. Mặc dù Intel hiện cho biết tính khả dụng chung sẽ có trong nửa đầu năm 2016, một số ít khách hàng có quyền truy cập sớm vào Hiệp hội hạ cánh. Hiện tại, Cray đang thử nghiệm một hệ thống Hiệp sĩ lớn để chuẩn bị cung cấp một siêu máy tính mới có tên Cori cho Trung tâm tính toán khoa học nghiên cứu năng lượng quốc gia (NERSC), và Phòng thí nghiệm quốc gia Los Alamos và Phòng thí nghiệm quốc gia Sandia vào năm tới. Bull, một đơn vị tích hợp hệ thống của Pháp Atos, cũng đã nhận được các phiên bản đầu tiên của Hiệp sĩ hạ cánh để chuẩn bị cho hệ thống Tera 1000 mà nó đang xây dựng cho Ủy ban Năng lượng nguyên tử và năng lượng thay thế của Pháp. Cơ sở tính toán lãnh đạo Argonne đang làm việc trên một hệ thống có tên Theta, sẽ được giao vào năm tới và Phòng thí nghiệm quốc gia Sandia đang hợp tác với Penguin Computing để nâng cấp một số hệ thống sử dụng các thế hệ đồng xử lý Xeon Phi trước đó.

Intel đã nói trước đây rằng sẽ có ba phiên bản khác nhau của Knights Landing: bộ xử lý máy chủ cơ sở (có khả năng tự khởi động), bộ xử lý máy chủ có kết cấu Omni-Path tích hợp và thẻ tăng tốc PCIe. Bản thân con chip sẽ bao gồm 36 ô, mỗi ô có hai lõi CPU (tổng cộng 72 lõi), bốn đơn vị xử lý véc tơ (hai lõi cho mỗi lõi), 1 MB bộ đệm L2 được chia sẻ và một tác nhân lưu trữ để duy trì sự kết hợp; và Intel cho biết họ sẽ cung cấp hiệu năng vô hướng gấp ba lần CPU Hiệp sĩ Góc, với độ chính xác gấp đôi 3 teraflop / giây và hiệu suất cực đại chính xác 6 teraflop / giây. Nó cũng sử dụng một hệ thống bộ nhớ mới gọi là MCDRAM, bộ nhớ trên gói có băng thông lớn hơn 3 lần so với đi ra DDR4 dường như là một biến thể trên kiến trúc Hybrid Memory Cube mà Intel và Micron đã nói về nó. Tại triển lãm, Cray có một hệ thống nguyên mẫu có tính năng Hiệp sĩ hạ cánh có thể khởi động và một số nhà cung cấp khác đang hiển thị các hệ thống được thiết kế cho Hiệp sĩ hạ cánh. Phiên bản Xeon Phi này dự kiến sẽ được theo sau bởi một phiên bản có tên Hiệp sĩ Hill, được xây dựng trên quy trình 10nm sắp tới.

Ngoài ra, Fujitsu đã nói thêm một chút về dự án Flagship 2020 của mình, dựa trên một con chip mới được gọi là FX100 với 32 lõi. Điều này được dự kiến sẽ tăng gấp bốn lần hiệu suất điểm nổi so với FX10 hiện tại và giống như Hiệp sĩ hạ cánh, FX100 của Fujitsu cũng sẽ sử dụng một phiên bản của kiến trúc Hybrid Memory Cube. Ngoài ra, NEC có một dự án có tên mã Aurora (không liên quan đến dự án CORAL), dựa trên sự tiếp nối của nó với chip SX-ACE nhưng với băng thông bộ nhớ lớn hơn. Đây là mục tiêu cho năm 2017.