Trang Chủ Suy nghĩ tiến tới Những thay đổi lớn cuối cùng cũng xảy ra đối với siêu máy tính

Những thay đổi lớn cuối cùng cũng xảy ra đối với siêu máy tính

2024

Video: Thấy con gái nằm ngủ thế này "PaPa" Thái Hòa không kiềm nỗi và... | sleeping girl (Tháng mười một 2024)

Nhìn lại hội nghị siêu máy tính ISC 17 tuần này, có vẻ như thế giới siêu máy tính sẽ chứng kiến một số nâng cấp lớn trong vài năm tới, nhưng bản cập nhật cho danh sách 500 siêu máy tính nhanh nhất thế giới hai năm không khác lắm so với phiên bản trước.

Máy tính nhanh nhất thế giới tiếp tục là hai cỗ máy khổng lồ của Trung Quốc đã đứng đầu danh sách này trong vài năm: Máy tính Sunway TaihuLight từ Trung tâm siêu máy tính quốc gia của Trung Quốc ở Vô Tích, với hiệu suất Linpack duy trì hơn 93 petaflop (93 nghìn tỷ điểm nổi hoạt động mỗi giây); và máy tính Tianhe-2 từ Trung tâm siêu máy tính quốc gia của Trung Quốc tại Quảng Châu, với hiệu suất duy trì hơn 33, 8 petaflop. Đây vẫn là những máy móc nhanh nhất bởi lợi nhuận rất lớn.

Số ba mới là hệ thống Piz Daint từ Trung tâm siêu máy tính quốc gia Thụy Sĩ, một hệ thống Cray sử dụng Intel Xe tải và Nvidia Tesla P100s, gần đây đã được nâng cấp để mang lại cho nó hiệu suất duy trì Linpack là 19, 6 petaflop, gấp đôi tổng số trước đó. Điều đó đã di chuyển nó lên từ số tám trong danh sách.

Điều này làm giảm hệ thống hàng đầu của Hoa Kỳ, hệ thống Titan tại Phòng thí nghiệm quốc gia Oak Ridge xuống vị trí thứ tư, khiến đây là lần đầu tiên sau hai mươi năm không có hệ thống nào của Hoa Kỳ nằm trong top ba. Phần còn lại của danh sách vẫn không thay đổi, với Hoa Kỳ vẫn chiếm năm trong số 10 tổng thể hàng đầu và Nhật Bản cho hai.

Ngay cả khi danh sách máy tính nhanh nhất không thay đổi nhiều, vẫn có những thay đổi lớn ở nơi khác. Trong danh sách Green 500 của các hệ thống tiết kiệm năng lượng nhất, chín trong số mười hệ thống hàng đầu đã thay đổi. Trên cùng là hệ thống Tsubame 3.0, hệ thống HPE ICE XA đã được sửa đổi tại Viện Công nghệ Tokyo dựa trên lõi Xeon E5-2680v4 14, kết nối Omni-Path và Tesla P100 của Nvidia, cho phép 14, 1 gigaflop mỗi watt. Đây là một bước nhảy lớn từ DGX Saturn V của Nvidia, dựa trên nền tảng DGX-1 và chip P100 của công ty, đứng số một trong danh sách tháng 11 nhưng số mười lần này, ở mức 9, 5 gigaflop / watt. P100 nằm trong chín trong số mười hệ thống Green500 hàng đầu.

Phá vỡ 10 gigaflop / watt là một vấn đề lớn bởi vì điều đó có nghĩa là một hệ thống exaflop giả định được xây dựng bằng công nghệ ngày nay sẽ tiêu thụ dưới 100 megawatt (MW). Đó vẫn là quá nhiều, mục tiêu là 20-30 MW cho một hệ thống exaflop, mà các nhà nghiên cứu hy vọng sẽ thấy trong năm năm tới hoặc lâu hơn nữa nhưng đó là một bước tiến rất lớn.

Giống như danh sách Top 500, chỉ có một số thay đổi nhỏ trong danh sách tương tự với các điểm chuẩn khác nhau, chẳng hạn như điểm chuẩn liên kết hiệu suất cao (HPCG), trong đó các máy có xu hướng chỉ nhìn thấy 1-10 phần trăm hiệu suất cao nhất về lý thuyết của chúng và ở trên cùng Trong trường hợp này, hệ thống Riken K, máy Riken K vẫn cung cấp ít hơn 1 petaflop. Cả hai hệ thống TaihuLight và Piz Daint đều có tên trong danh sách này. Khi các nhà nghiên cứu nói về một máy exaflop, họ có xu hướng có nghĩa là điểm chuẩn Linpack, nhưng HPCG có thể thực tế hơn về mặt hiệu suất trong thế giới thực.

Sự xuất hiện của điện toán GPU như một máy gia tốc, hầu như luôn luôn sử dụng bộ xử lý GPU Nvidia như P100, là sự thay đổi rõ ràng nhất trong các danh sách này trong những năm gần đây, tiếp theo là sự ra đời của máy gia tốc riêng của Intel, Xeon Phi nhiều lõi (bao gồm cả Xeon Phi phiên bản Hiệp sĩ hạ cánh gần đây nhất). Danh sách Top 500 hiện tại bao gồm 91 hệ thống đang sử dụng bộ tăng tốc hoặc bộ đồng xử lý, bao gồm 74 với GPU Nvidia và 17 với Xeon Phi (với ba hệ thống khác sử dụng cả hai); một với GPU AMD Radeon làm máy gia tốc và hai sử dụng bộ xử lý nhiều lõi từ PEZY Computing, nhà cung cấp của Nhật Bản. Thêm 13 hệ thống hiện sử dụng Xeon Phi (Hiệp sĩ hạ cánh) làm đơn vị xử lý chính.

Nhưng nhiều thay đổi lớn hơn đối với siêu máy tính vẫn còn đang diễn ra, khi chúng ta bắt đầu thấy các hệ thống lớn hơn được thiết kế với các khái niệm này. Một ví dụ là MareNostrum 4 mới tại Trung tâm siêu máy tính Barcelona, đã lọt vào danh sách Top 500 ở vị trí số 13. Như đã cài đặt cho đến nay, đây là hệ thống của Lenovo dựa trên phiên bản Xeon Skylake-SP sắp tới (chính thức là Xeon Platinum 8160 24 bộ xử lý lõi). Điều thú vị ở đây là ba cụm "công nghệ mới nổi" được lên kế hoạch trong vài năm tới, bao gồm một cụm với bộ xử lý IBM Power 9 và GPU Nvidia, được thiết kế để có khả năng xử lý cao nhất trên 1, 5 Petaflops; thứ hai dựa trên phiên bản Xeon Phi của Hill Hill; và thứ ba dựa trên bộ xử lý ARMv8 64 bit được thiết kế bởi Fujitsu.

Những khái niệm này đang được sử dụng trong một số dự án siêu máy tính lớn khác, đáng chú ý là một số dự án được Bộ Năng lượng Hoa Kỳ tài trợ như một phần của Hợp tác CORAL tại Oak Ridge, Argonne và Phòng thí nghiệm quốc gia Lawrence Livermore. Đầu tiên phải là Hội nghị thượng đỉnh tại Oak Ridge, nơi sẽ sử dụng bộ xử lý IBM Power 9 và GPU Nvidia Volta và dự kiến sẽ cung cấp hơn 150 đến 300 petaflop đỉnh; tiếp theo là Sierra tại Lawrence Livermore, dự kiến sẽ cung cấp hơn 100 petaflop đỉnh.

Sau đó, chúng ta sẽ thấy siêu máy tính Aurora tại Phòng thí nghiệm quốc gia Argonne, dựa trên phiên bản Xeon Phi của Hill và được chế tạo bởi Cray, dự kiến sẽ cung cấp 180 petaflop đỉnh. Các hệ thống CORAL nên được lên và đang chạy năm sau.

Trong khi đó, các nhóm Trung Quốc và Nhật Bản cũng đã lên kế hoạch nâng cấp, chủ yếu sử dụng các kiến trúc độc đáo. Nó nên được thú vị để xem.

Một sự thay đổi thậm chí còn lớn hơn dường như chỉ là một chút xa hơn: sự thay đổi về học máy, thường là trên các đơn vị xử lý song song ồ ạt trong chính bộ xử lý. Trong khi số Linpack đề cập đến hiệu suất chính xác 64 bit hoặc gấp đôi, có các lớp ứng dụng, bao gồm nhiều ứng dụng dựa trên mạng thần kinh sâu, hoạt động tốt hơn với các phép tính chính xác một hoặc thậm chí một nửa. Các bộ xử lý mới đang tận dụng lợi thế này, chẳng hạn như thông báo Volta V100 gần đây của Nvidia và phiên bản Xeon Phi sắp ra mắt của Hiệp sĩ. Tại triển lãm, Intel cho biết phiên bản dự kiến sẽ được sản xuất trong quý IV, sẽ có các bộ hướng dẫn mới cho "điện toán có độ chính xác thấp" được gọi là Quad Fuse Multiply Add (QFMA) và Quad Virtual Neural Network (QVNNI) .

Tôi giả định rằng những khái niệm này cũng có thể được áp dụng cho các kiến trúc khác, chẳng hạn như TPU của Google hoặc chip Intel và chip Nervana của Intel.

Ngay cả khi chúng ta không thấy những thay đổi lớn trong năm nay, năm tới chúng ta vẫn sẽ thấy nhiều hơn nữa. Khái niệm về một máy exascale (1000 teraflop) vẫn còn trong tầm nhìn, mặc dù nó có thể sẽ liên quan đến một số thay đổi thậm chí còn lớn hơn.