Trang Chủ Suy nghĩ tiến tới Xếp hạng siêu máy tính không thay đổi nhiều, nhưng ngồi kín

Xếp hạng siêu máy tính không thay đổi nhiều, nhưng ngồi kín

2024

Video: giữa chúng ta có KHÁC BIỆT TO LỚN | TRỊNH THĂNG BÌNH x LIZ KIM CƯƠNG | OFFICIAL MUSIC VIDEO (Tháng mười một 2024)

Danh sách gần đây nhất về siêu máy tính nhanh nhất thế giới không thay đổi nhiều, nhưng chương trình Siêu máy tính hàng năm (SC14) có rất nhiều cuộc thảo luận về các hệ thống mới trong danh sách, cũng như một số thông báo tính toán hiệu năng cao, như máy gia tốc mới của Intel và Nvidia.

Siêu máy tính Tianhe-2 của Trung Quốc, sử dụng CPU Intel Xeon và máy gia tốc Xeon Phi, vẫn ở vị trí đầu tiên trong danh sách Top500 với hiệu suất cao nhất là 54, 9 petaflop (bốn triệu thao tác điểm nổi mỗi giây). Trên thực tế, năm nay, chín hệ thống hàng đầu giống hệt với bổ sung mới hàng đầu ở vị trí thứ 10, một máy hệ thống của chính phủ Hoa Kỳ không xác định, đó là Cray CS-Storm được cung cấp bởi CPU Intel Xeon E5-2660 v2 và GPU Nvidia K40, được kết nối qua Infiniband.

Xa hơn trong danh sách, có 78 hệ thống mới, mặc dù đây là mức thấp kỷ lục mới. Và nhìn chung, có vẻ như chúng ta đang chứng kiến sự giảm tốc độ tăng trưởng sức mạnh tổng hợp của 500 hệ thống.

Bảng xếp hạng của các hệ thống này dựa trên điểm chuẩn LINPACK, mặc dù hiện tại có một số nỗ lực xoay quanh việc tạo ra các điểm chuẩn mới nhắm vào các loại máy tính khác nhau. Tôi thấy thú vị rằng trong một bài phát biểu tại triển lãm, Horst Simon, biên tập viên của danh sách Top500, nói rằng mặc dù mục tiêu đạt được một máy tính exascale là 1 exaflop mỗi giây (khoảng 1.000 petaflop), năm 2020, anh tin rằng nó sẽ có khả năng đưa chúng tôi đến hết năm 2024. Một phần là vì chúng tôi sẽ cần nhiều kỹ thuật tiết kiệm năng lượng hơn, chẳng hạn như quang tử silicon và tích hợp 3D và đóng gói, để giữ năng lượng cần thiết cho một hệ thống exascale xuống tới 20 megawatt. Đây là những hệ thống lớn.

Mặc dù thiếu những thay đổi lớn ở phía trên, chúng tôi đã nghe thấy một vài thông báo mới, đáng chú ý là những người đến từ Intel và Nvidia, có thể chỉ đường cho các máy nhanh hơn.

Nvidia, người có GPU và ngôn ngữ lập trình CUDA thực sự bắt đầu phong trào hướng tới các bộ tăng tốc và bộ đồng xử lý trong điện toán hiệu năng cao, đã xuất hiện khắp nơi với rất nhiều hệ thống. Hiện tại, họ cung cấp bộ tăng tốc K40 và tại triển lãm đã công bố phiên bản tiếp theo, Tesla K80, sử dụng phương pháp GPU kép để cung cấp những gì hãng cho biết có hiệu suất cao hơn gần hai lần và gấp đôi băng thông bộ nhớ của người tiền nhiệm.

Nvidia cho biết K80 cung cấp 4.992 lõi CUDA và 24 megabyte RAM và có công suất tối đa 2, 91 teraflop mỗi bo mạch. Thật thú vị khi K80 đã có sẵn và nhiều nhà sản xuất hệ thống đã cung cấp các hệ thống với bảng. Chẳng hạn, Dell đã trình diễn các máy chủ PowerEdge C4130 mới của mình, cho phép bạn lắp tối đa bốn bo mạch tăng tốc Nvidia (hoặc máy gia tốc Intel Xeon Phi) trong máy chủ 1U, với phiên bản K80 cung cấp tới 7, 2 teraflop trong mỗi hộp. Đó chỉ là một sức mạnh tính toán điên rồ trong một giá đỡ (mặc dù một thứ sẽ sử dụng nhiều năng lượng và cần nhiều sự làm mát).

Trong khi đó, Intel tuyên bố rằng phiên bản tiếp theo của chip Xeon Phi, một phiên bản được gọi là Knight's Landing mà các hệ thống thương mại đầu tiên sẽ bắt đầu giao hàng vào năm tới, hiện có hơn 50 khách hàng dự định sử dụng phiên bản bộ xử lý mới của bộ phận (trong đó Xeon Phi đóng vai trò là bộ xử lý hệ thống) trong các siêu máy tính mới. Nhiều hệ thống khác đang sử dụng phiên bản thẻ PCIe đồng xử lý của sản phẩm.

Trong số các khách hàng của Hiệp sĩ hạ cánh là siêu máy tính Trinity, một nỗ lực chung giữa Phòng thí nghiệm quốc gia Los Alamos và Sandia và siêu máy tính Cori, được công bố bởi Trung tâm nghiên cứu khoa học năng lượng quốc gia (DOE) của Bộ Năng lượng Hoa Kỳ (NERSC). Knight's Landing được cho là cung cấp khoảng 3 teraflop hiệu suất và sẽ tích hợp công nghệ Omni-Path Fabric dựa trên photon silicon của Intel, công ty cho biết sẽ cung cấp tốc độ đường truyền 100 Gbps và độ trễ chuyển đổi thấp hơn tới 56% so với các lựa chọn thay thế của InfiniBand. (Lưu ý rằng các nhà cung cấp InfiniBand hiện cũng đang nói về các phiên bản mới.)

Intel cho biết phần tiếp theo, được gọi là Knight's Hill, sẽ được xây dựng bằng công nghệ xử lý 10nm của Intel và sử dụng thế hệ tiếp theo của vải Omni-Path. Nó sẽ theo Knight's Landing, nhưng thời gian chính xác không được tiết lộ.

Không thể rời khỏi phương trình là AMD, hãng đã công bố và đang trình diễn thẻ CPU đơn FirePro S9150, mà hãng cho biết có thể cung cấp 2, 53 teraflop hiệu năng. Hệ thống này, được lập trình bằng OpenCL, đã được vận chuyển.

Trên thực tế, một siêu máy tính mới có tên L-CSC từ Trung tâm Helmholtz của GSI, dựa trên GPU S9150 và CPU 10 nhân Intel Xeon 2690v2 đứng đầu phiên bản mới của danh sách Green500, liệt kê các siêu máy tính theo thứ tự công suất trên mỗi watt. Điều này đánh dấu lần đầu tiên một hệ thống có thể vượt qua 5 gigaflop / watt (hàng tỷ hoạt động mỗi giây mỗi watt). Lưu ý trong danh sách đó, hệ thống vị trí thứ hai là Suiren, được cung cấp bởi bộ tăng tốc nhiều lõi PEZY-SC và CPU Xeon; trong khi phần còn lại của top 10 sử dụng GPU Nvidia Tesla, cho thấy phạm vi của các hệ thống như vậy.

Có những lựa chọn khác, khác thường hơn là tốt. Micron đang hiển thị chip Automata của mình, về cơ bản là một chip mục đích đặc biệt được thiết kế để khớp mẫu, để sử dụng trong những việc như bảo mật mạng và tìm kiếm gen. Điều này đang được phát triển thành một bo mạch PCIe 3 với 32 chip và dự kiến sẽ ra mắt trong quý đầu tiên của năm 2015, ban đầu với khối lượng thấp. (Công ty cũng đứng sau Hybrid Memory Cube cho bộ nhớ thế hệ tiếp theo cho các hệ thống như vậy.) IBM có bộ xử lý TrueNorth, công ty hy vọng sẽ chỉ ra con đường "tính toán giống như não" hơn. NEC đang làm việc trên thế hệ tiếp theo của bộ xử lý vector SX-ACE, mà theo họ thì dễ lập trình hơn GPU. Và, tất nhiên, ARM đang cố gắng thâm nhập vào thị trường máy chủ cũng như X-Gene1 của Application Micro được sử dụng làm bộ xử lý kết nối với các thẻ tăng tốc khác nhau.

Một số nhà cung cấp đã hiển thị các hệ thống mới. Ngoài hệ thống Dell mà tôi đã đề cập trước đó, Lenovo đã cho thấy một hệ thống xử lý kép làm mát bằng nước dựa trên bộ xử lý Intel Xeon E5-2798A tùy chỉnh (với 16 lõi chạy lên tới 3, 2 GHz), được cho là cung cấp 1.083 teraflop. Và họ nói rằng bộ xử lý Knights Landing Xeon Phi vào năm tới sẽ cho phép hệ thống "peta-cube" cung cấp nhiều hơn một petaflop chỉ trong hai giá đỡ 42U tiêu chuẩn.

One Stop Servers cho thấy Máy gia tốc tính toán mật độ cao, sử dụng PCIe Gen3 để hỗ trợ tới 16 bảng tăng tốc cao cấp từ một hoặc nhiều máy chủ, với công ty cho biết họ cung cấp tới 89, 6 teraflop sử dụng bảng Tesla K80. Điều này có thể hoạt động với bộ xử lý Power8 của IBM. Huawei đã cho thấy sự sẵn có của Hoa Kỳ đối với Máy chủ Trung tâm Dữ liệu X6800 và phiên bản làm mát bằng chất lỏng của máy chủ phiến FusionServer 9000.

Để liên kết các hệ thống với nhau, Obsidian Technologies đã đưa ra sáng kiến InfiniCortex của mình, được thiết kế để có kết nối 100 Gigabit InfiniBand trong khoảng cách xa. Công ty đã công bố hỗ trợ từ Cơ quan Khoa học, Công nghệ và Nghiên cứu của Singapore (A * STAR). Và Mellanox cho thấy 100 Gigabit Infiniband hoạt động trên 100 mét qua sợi quang và 8 mét qua đồng.

Để tạo ra các siêu máy tính lớn nhất, các tổ chức thường chuyển sang các công ty như IBM và Cray để đặt các hệ thống lại với nhau, mặc dù chúng thường mất nhiều năm để xây dựng. Thông báo lớn nhất của Cray về loại hình tại triển lãm là một hệ thống trị giá 80 triệu đô la được gọi là Shaheen II tại Đại học Khoa học và Công nghệ King Abdullah ở Ả Rập Saudi cho một chiếc Cray XC40, bao gồm một thiết bị phân tích đồ thị Urika-GD.

Và, tất nhiên, ngay trước buổi triển lãm, DOE đã trao cho IBM (và các nhà cung cấp linh kiện Nvidia và Mellanox) một hợp đồng lớn cho hai siêu máy tính lớn nhất trong cả nước, mỗi siêu máy tính có hơn 100 petaflop.

Lưu ý của biên tập viên: Bài đăng này đã được cập nhật vào ngày 26/11. Tianhe-2 có hiệu suất cao nhất là 54, 9 petaflop, không phải teraflop.