Trang Chủ Suy nghĩ tiến tới Kiến trúc thay thế sẽ cai trị siêu máy tính?

Kiến trúc thay thế sẽ cai trị siêu máy tính?

2024

Video: Xúc Xắc Xúc Xẻ - Bé Tú Anh [MV Official] (Tháng mười một 2024)

Trong những năm gần đây, chúng tôi đã thấy một số cách tiếp cận mới thú vị đối với điện toán hiệu năng cao, đặc biệt là thay đổi bộ xử lý lớn truyền thống và hướng tới cụm CPU x86 có bộ tăng tốc hoặc bộ đồng xử lý để tăng tốc các loại tính toán cụ thể. Ra khỏi chương trình Siêu máy tính tuần trước, chúng tôi đã thấy Intel thúc đẩy tích hợp bộ đồng xử lý Xeon Phi với bộ xử lý máy chủ Xeon truyền thống của mình để giúp lập trình dễ dàng hơn; Nvidia giới thiệu phiên bản mới của bộ tăng tốc GPU Tesla; và Micron ủng hộ một loại bộ xử lý rất khác cho máy tính chuyên dụng hơn. Và tất cả những điều này đã xảy ra vào thời điểm các máy gia tốc và bộ đồng xử lý đang thống trị danh sách Top 500 máy tính nhanh nhất thế giới, một số chuyên gia cho rằng các điểm chuẩn hiện tại mang lại quá nhiều trọng lượng cho các bộ xử lý này.

Nvidia đã chào mời những thành công của mình với các bo mạch tăng tốc Tesla, các cụm GPU lớn được kết nối với các bộ xử lý chính của Intel hoặc AMD. Những con chip như vậy được sử dụng trong rất nhiều hệ thống, bao gồm hệ thống Titan tại Phòng thí nghiệm quốc gia Oak Ridge và hệ thống Piz Daint mới tại Trung tâm điện toán siêu máy tính quốc gia Thụy Sĩ. Thú vị hơn, công ty cho biết các bảng mạch Tesla nằm trong tất cả 10 hệ thống hàng đầu trong danh sách Green 500 mới nhất của siêu máy tính tiết kiệm năng lượng nhất thế giới. Tất cả các hệ thống này cũng sử dụng Intel Xeons ngoại trừ Titan dựa trên AMD Opteron, đây là hệ thống nhanh thứ hai trên thế giới trong Top 500 nhưng xếp hạng thấp hơn nhiều trong danh sách Green 500.

Ngoài ra, Nvidia tuyên bố hợp tác với IBM để cung cấp máy gia tốc Tesla của mình trong các hệ thống dựa trên kiến trúc IBM Power. IBM từ lâu đã quảng cáo hiệu suất nối tiếp của nó và hệ thống BlueGene / Q dựa trên bộ xử lý Power chạy hệ thống Sequoia tại Phòng thí nghiệm quốc gia Lawrence Livermore và hệ thống Mira tại Phòng thí nghiệm quốc gia Argonne cùng với các hệ thống khác. Có IBM và Nvidia làm việc cùng nhau sẽ dẫn đến một số hệ thống thú vị trong tương lai.

Tại triển lãm, công ty đã công bố Tesla K40, thế hệ tiếp theo của bảng tăng tốc GPU. Công ty cho biết họ sẽ cung cấp 1, 4 teraflop hiệu năng chính xác kép, bộ nhớ 12 GB (băng thông 288 GB) và tính năng GPU Boost, cho phép nó chạy ở tốc độ xung nhịp nhanh hơn trong một số trường hợp. Đây là bản nâng cấp từ dòng Tesla K20 hiện có, sử dụng cùng thiết kế GPU cơ bản được sản xuất trên công nghệ 28nm.

Các sáng kiến khác bao gồm các cách giúp lập trình GPU dễ dàng hơn, bao gồm CUDA 6, hiện hỗ trợ bộ nhớ hợp nhất, cho phép các nhà phát triển tiếp cận bộ nhớ dưới dạng một nhóm duy nhất, mặc dù bộ nhớ CPU và GPU vẫn tách biệt. Công ty cũng đang hỗ trợ OpenACC, một tập hợp các chỉ thị biên dịch tiêu chuẩn cho hệ thống biết phần nào của chương trình (được viết bằng C / C ++ và Fortran) có thể được giảm tải từ CPU sang máy gia tốc để tăng hiệu suất.

Cách tiếp cận của Intel, được gọi là kiến trúc Nhiều lõi tích hợp (MIC), rất khác nhau. Nó kết hợp nhiều lõi x86 nhỏ thành một chip duy nhất gọi là Xeon Phi. Trong nhiều năm qua, Intel đã quảng cáo thực tế rằng tất cả các x86 đều giúp việc lập trình dễ dàng hơn, mặc dù các nhà phát triển rõ ràng vẫn phải nhắm mục tiêu trực tiếp vào kiến trúc. Phiên bản hiện tại của Xeon Phi, được gọi là Hiệp sĩ Góc, được thiết kế để sử dụng làm máy gia tốc cùng với chip máy chủ Xeon E truyền thống hơn và được sử dụng bởi nhiều hệ thống hàng đầu, bao gồm cả Tianhe-2 của Trung Quốc (hiện là hệ thống nhanh nhất trên thế giới) và hệ thống Stampede tại Trung tâm điện toán nâng cao tại Đại học Texas.

Tại triển lãm, Intel đã công bố một phiên bản mới có tên mã là Knight Landing, cũng sẽ hoạt động như một CPU độc lập có thể phù hợp với kiến trúc rack tiêu chuẩn và chạy trực tiếp hệ điều hành, mà không cần CPU chủ (như Xeon E). Điều này có thể khá quan trọng trong việc mở rộng sức hấp dẫn của Xeon Phi, đặc biệt là trong thị trường máy trạm. Một lần nữa, điều này được thiết kế để giúp các nhà phát triển phần mềm dễ dàng xem nó như một CPU. Các hiệp sĩ hạ cánh sẽ có sẵn cả dưới dạng CPU độc lập và dưới dạng bảng PCI Express phù hợp với các hệ thống hiện có dưới dạng nâng cấp từ Hiệp sĩ Góc.

Cũng có những thay đổi đáng kể khác đối với Hiệp sĩ hạ cánh, bao gồm thêm "bộ nhớ gần", DRAM hiệu quả được cung cấp trên gói với CPU và do đó có thể cung cấp băng thông cao hơn nhiều so với bộ nhớ DDR truyền thống, bị giới hạn bởi tốc độ xe buýt. (Điều đó cũng trở nên nhanh hơn, nhưng gần như không nhiều.) Đây không phải là bước đi đầu tiên theo hướng này; IBM đã quảng cáo DRAM nhúng trong kiến trúc Power của mình trong nhiều năm và chính Intel đang đưa DRAM nhúng cho đồ họa trong các phiên bản Iris Pro của gia đình Haswell Core. Tuy nhiên, tôi đoán là chúng ta sẽ thấy nhiều nỗ lực hơn theo hướng này trong những năm tới.

Trong khi đó, một trong những cách tiếp cận mới thú vị nhất đến từ Micron, công bố máy gia tốc mới có tên Bộ xử lý Automata được thiết kế chủ yếu để giải quyết các vấn đề dữ liệu phi cấu trúc phức tạp.

Micron mô tả điều này khi cung cấp một loại vải bao gồm hàng chục nghìn đến hàng triệu yếu tố xử lý được kết nối để giải quyết các nhiệm vụ cụ thể. Công ty, một trong những nhà sản xuất bộ nhớ DRAM và NAND lớn nhất, cho biết điều này sẽ sử dụng xử lý dựa trên bộ nhớ để giải quyết các thách thức điện toán phức tạp trong các lĩnh vực như an ninh mạng, tin sinh học, xử lý hình ảnh và phân tích. Micron ban đầu sẽ phân phối Bộ xử lý Automata trên bo mạch PCI-Express để giúp các nhà phát triển làm việc với nó, nhưng công ty có kế hoạch bán bộ xử lý trên các mô-đun bộ nhớ tiêu chuẩn, được gọi là DIMM hoặc làm chip riêng cho các hệ thống nhúng. Trong một số cách, âm thanh này tương tự như mảng cổng lập trình trường (FPGA), được điều chỉnh để giải quyết các ứng dụng cụ thể liên quan đến khớp mẫu.

Công ty cho biết họ đang hợp tác với Georgia Tech, Đại học Missouri và Đại học Virginia để phát triển các ứng dụng mới cho Automata. Mặc dù công ty chưa công bố ngày cho các sản phẩm cuối cùng, một bộ công cụ phát triển phần mềm dự kiến sẽ ra mắt vào năm tới, cùng với các công cụ mô phỏng.

Automata nghe có vẻ như là một công việc đang tiến triển và có lẽ còn quá sớm để biết các ứng dụng rộng đến mức nào, nhưng đó là một cách tiếp cận thú vị.

Nhìn chung, chúng ta đang chứng kiến sự phát triển của điện toán hiệu năng cao. Không quá nhiều năm trước, các máy tính nhanh nhất chủ yếu chỉ là số lượng lớn bộ xử lý máy chủ tiêu chuẩn. Thật vậy, các hệ thống IBM Blue Gene và các hệ thống dựa trên Sparc (như máy tính K tại Viện Khoa học tính toán tiên tiến RIKEN ở Nhật Bản, sử dụng bộ xử lý Fujitsu Sparc) vẫn chiếm một phần lớn trên thị trường, bao gồm năm trong số 10 nhanh nhất các hệ thống trên thế giới. Nhưng trong những năm gần đây, động lực đã chuyển sang bộ đồng xử lý, với các hệ thống sử dụng Tesla và gần đây là máy gia tốc Xeon Phi chiếm nhiều hơn các hệ thống mới hơn. Với những cải tiến trong các hệ thống đó, quan hệ đối tác mới, phần mềm tốt hơn và một số cách tiếp cận mới, thị trường siêu máy tính có thể sẽ rất khác trong tương lai.