Sự Cân Bằng: HDD Và SSD Trong Các Trung Tâm Dữ Liệu Hiện Đại
Sự Cân Bằng: HDD Và SSD Trong Các Trung Tâm Dữ Liệu Hiện Đại
Đúng là lưu trữ flash đang trở nên nhanh hơn và giá cả phải chăng hơn, nhưng ổ cứng (HDD) vẫn tiếp tục đóng vai trò quan trọng trong doanh nghiệp. Không nơi nào điều này rõ ràng hơn là ở các trung tâm dữ liệu ngày nay, nơi lượng dữ liệu được tạo ra tiếp tục tăng theo cấp số nhân, được thúc đẩy hơn nữa bởi AI Data Cycle.
Trong khi người tiêu dùng có xu hướng chỉ sử dụng ổ đĩa thể rắn (SSD) và bộ nhớ flash trong máy tính xách tay, máy tính bảng và điện thoại thông minh của họ, ổ cứng là thiết bị lưu trữ lớn bận rộn hoạt động đằng sau hậu trường. Chúng cung cấp chi phí thấp hơn trên mỗi terabyte (TB) và có hiệu quả cao đối với khối lượng dữ liệu lớn.
"Hầu hết dữ liệu chúng ta tương tác hàng ngày đều nằm trên ổ cứng trong một trung tâm dữ liệu ở đâu đó", Brad Warbiany, giám đốc tiếp thị kỹ thuật HDD tại Western Digital, cho biết. "Cho dù đó là ảnh, video hay bài đăng trên mạng xã hội, chúng ta không nhìn thấy ổ cứng nhưng đó là nơi lưu trữ hầu hết dữ liệu".
Theo báo cáo IDC Global StorageSphere 2024 , ổ cứng HDD sẽ tiếp tục chiếm gần 80% dung lượng lưu trữ được sử dụng trong các trung tâm dữ liệu đám mây và siêu quy mô đến năm 2028.
Trong các trung tâm dữ liệu siêu quy mô như vậy, dữ liệu "nóng" thường xuyên được truy cập hoặc quan trọng về hiệu suất được lưu trữ trên các ổ SSD cấp doanh nghiệp để truy xuất nhanh trong khi dữ liệu "ấm" hoặc "lạnh" ít được truy cập hơn nằm trên phương tiện HDD cấp doanh nghiệp tiết kiệm chi phí hơn. Phương pháp tiếp cận theo tầng này giúp tối ưu hóa chi phí lưu trữ và truy cập dữ liệu và có thể được tinh chỉnh dựa trên dung lượng, hiệu suất, tính khả dụng và nhu cầu phục hồi của dữ liệu hệ thống hoặc ứng dụng.
“Giống như giao hàng vậy. Đối với vận chuyển hàng rời đường dài, bạn sẽ sử dụng xe đầu kéo 18 bánh mạnh mẽ, nhưng đối với giao hàng chặng cuối trong thành phố, bạn sẽ cần một chiếc xe điện nhỏ gọn”, Darragh O'Toole, giám đốc tiếp thị sản phẩm SSD tại Western Digital, cho biết. “Cả hai đều sẽ đưa hàng đến đó nhưng với tốc độ, công suất và chi phí cho mỗi hàng hóa khác nhau dựa trên yêu cầu về khối lượng công việc”.
TCO ở quy mô lớn
Kinh tế là yếu tố then chốt ở quy mô. Trong khi chi phí lưu trữ flash trên mỗi terabyte đã được cải thiện đáng kể, SSD doanh nghiệp vẫn có giá cao hơn tới tám lần trên mỗi terabyte so với HDD doanh nghiệp và sẽ duy trì ở mức trên năm lần trong năm năm tới, theo công ty phân tích IDC trong Bảng trục: Dự báo IDC Global StorageSphere, 2024 - 2028.
Các khách hàng trung tâm dữ liệu lớn nhất thường tính toán TCO theo dung lượng terabyte trên mỗi watt. Một cách để tối ưu hóa dung lượng và hiệu quả năng lượng trong trung tâm dữ liệu là nén nhiều dữ liệu hơn vào từng ổ cứng riêng lẻ thông qua các công nghệ như OptiNAND ™ và UltraSMR.
Những công nghệ này, cùng với kiến trúc dữ liệu thông minh, đang giúp các trung tâm dữ liệu có ý thức hơn về khí hậu bằng cách tối ưu hóa nhu cầu điện năng. Các công ty điện toán đám mây siêu quy mô đã chuyển sang công nghệ ghi từ tính dạng tấm lợp ( SMR ). SMR hiện chiếm 50% exabyte trung tâm dữ liệu được Western Digital vận chuyển.
Các trường hợp sử dụng ổ cứng HDD bao gồm sao lưu, lưu trữ và lưu trữ lạnh và sẽ tiếp tục đóng vai trò quan trọng trong cơ sở hạ tầng doanh nghiệp trong tương lai gần.
“Ngoài tài chính hoặc cơ sở hạ tầng, khách hàng không đủ khả năng chi trả cho tất cả các loại flash”, Warbiany cho biết. “Vấn đề là phải cân bằng và kết hợp cả hai. SSD tỏa sáng ở những nơi cần truy cập nhanh, chẳng hạn như giao dịch chứng khoán trong mili giây hoặc đặt vé máy bay. Nhưng khi đến lúc mở rộng quy mô, nhiều kiến trúc sư trung tâm dữ liệu chuyển sang HDD vì dung lượng và quy mô của chúng”.
Chu kỳ dữ liệu AI cung cấp dữ liệu cho ổ cứng HDD và ổ cứng SSD
Các ứng dụng và trường hợp sử dụng dữ liệu mới đang thúc đẩy sự tăng trưởng dữ liệu bùng nổ. AI và học máy (ML) đặc biệt cần nhiều dữ liệu, dựa vào các tập dữ liệu khổng lồ cần được thu thập và xử lý trước khi đưa vào các thuật toán. Các sáng kiến dữ liệu lớn này thu thập và xử lý dữ liệu theo nhiều cách khác nhau - cần có nhiều giải pháp lưu trữ dữ liệu khác nhau để đáp ứng các nhu cầu đa dạng này.
CEO của Western Digital, David Goeckeler, đã được yêu cầu đưa ra quan điểm của mình về vấn đề này trong một cuộc gọi phân tích gần đây, như được ghi lại trong một bài báo trên Block & Files. “Rõ ràng, HDD đóng vai trò lớn trong vòng đời lưu trữ AI cũng như toàn bộ giai đoạn thu thập, vì tất cả các hồ dữ liệu lớn và tất cả các tập dữ liệu thô; tất cả những thứ đó sẽ được lưu trữ trên HDD”, ông nói. “Đó chỉ là vấn đề kinh tế về nơi bạn lưu trữ dữ liệu đó và cách bạn truy cập dữ liệu đó”.
Các mô hình AI hoạt động theo một vòng lặp liên tục, tự duy trì về việc tiêu thụ và tạo dữ liệu - xử lý văn bản, hình ảnh, âm thanh và video cùng với các loại dữ liệu khác đồng thời tạo ra dữ liệu mới độc đáo.
Western Digital đã trình bày chi tiết về chu kỳ dữ liệu AI qua sáu giai đoạn khác nhau. Khi các mô hình AI phát triển, chúng tạo ra nhiều dữ liệu hơn, có yêu cầu lưu trữ cụ thể ở mỗi giai đoạn của quy trình.
HDD đóng vai trò quan trọng vì khối lượng lớn dữ liệu thô được thu thập và lưu trữ từ nhiều nguồn khác nhau. Sau đó, dữ liệu được xử lý, làm sạch và chuyển đổi bằng SSD nhanh để hỗ trợ đào tạo và suy luận AI. SSD doanh nghiệp dung lượng cao loại bỏ dữ liệu từ các hồ dữ liệu nhanh. Các mô hình được đào tạo sẽ phân tích dữ liệu mới và tạo nội dung mới. Ví dụ, các mô hình ngôn ngữ lớn (LLM) sẽ hấp thụ khối lượng dữ liệu khổng lồ và sau đó trích xuất những gì quan trọng để xử lý các mô hình GPU nhanh. Cuối cùng, nội dung mới được tạo ra từ những hiểu biết do các mô hình AI tạo ra, yêu cầu các HDD doanh nghiệp phải lưu trữ dữ liệu mới cho các mô hình trong tương lai.
Vòng lặp liên tục của quá trình tạo và sử dụng dữ liệu này thúc đẩy nhu cầu về các giải pháp lưu trữ dữ liệu có khả năng mở rộng để tối ưu hóa việc triển khai AI.
"Vì GPU là khoản đầu tư tốn kém nên các công ty muốn chúng luôn bận rộn", O'Toole cho biết. "Ổ SSD doanh nghiệp PCIe Gen 5.0 tập trung vào tính toán rất quan trọng đối với tốc độ và băng thông đó".
Ổ cứng HDD và ổ cứng SSD thiết yếu cho doanh nghiệp
Lưu trữ là yếu tố thiết yếu đối với nền kinh tế dữ liệu. Sự kết hợp giữa HDD và SSD không chỉ cung cấp năng lượng cho những gì có thể mà còn cho phép các công ty đạt được nhiều hơn và phù hợp với giải pháp cho nhu cầu của họ. Với sự phát triển của AI, cả hai công nghệ sẽ trở nên quan trọng hơn nữa để mở ra các cơ hội. Hiểu cách sử dụng chúng tốt nhất sẽ cho phép các công ty thành công hơn với các nỗ lực dựa trên dữ liệu của họ.
Warbiany cho biết: "Các trung tâm dữ liệu sẽ tiếp tục sử dụng HDD khi có thể, nhưng SSD khi cần thiết". "Mỗi loại đều có vị trí riêng về mặt kinh tế và tốc độ".
Với dữ liệu tăng với tốc độ chưa từng có, cả HDD và SSD sẽ tiếp tục là xương sống lưu trữ cho các doanh nghiệp ngày nay.
Như Goeckeler đã nói trong một cuộc gọi phân tích gần đây, "Đó là về tăng trưởng chứ không phải thay thế. Nó thực sự giống như một con sóng dâng cao nâng tất cả các con thuyền." AI chỉ là một ví dụ cho thấy càng tạo ra nhiều dữ liệu, thì càng cần lưu trữ nhiều dữ liệu.
Xem thêm