Dell Enterprise Hub tại Dell Tech World 2026- các mô hình mới, nền tảng mới, triển khai sản xuất nhanh hơn

Giới thiệu Dell Enterprise Hub tại Dell Tech World 2026 với các mô hình và nền tảng mới giúp tăng tốc quá trình đưa vào sản xuất

  • 7 min read
Dell Enterprise Hub tại Dell Tech World 2026- các mô hình mới, nền tảng mới, triển khai sản xuất nhanh hơn
Giới thiệu Dell Enterprise Hub tại Dell Tech World 2026 với các mô hình và nền tảng mới giúp tăng tốc quá trình đưa vào sản xuất

Dell Enterprise Hub tại Dell Tech World 2026: mô hình mới, nền tảng mới, triển khai nhanh hơn

Michael Dell tại Dell Tech World

Tuần trước tại sự kiện Dell Technologies World, ông Michael Dell đã công bố làn sóng mô hình tiếp theo trong Dell Enterprise Hub (DEH). Đây là “ngôi nhà” cho AI mã nguồn mở triển khai tại chỗ (on-premises) do Dell và Hugging Face hợp tác xây dựng, sẵn sàng triển khai trên cơ sở hạ tầng của Dell ngay từ ngày đầu tiên. Bản phát hành này tập trung vào hai câu chuyện chính:

1. Biên giới mã nguồn mở không ngừng mở rộng, và DEH luôn chuyển động cùng nó trên mọi nền tảng của Dell. Trong những tháng gần đây, khoảng 20 cấu hình mô hình mới đã xuất hiện (bao gồm DeepSeek V4, Kimi K2.6, GLM 5.1, MiniMax M2.7, dòng mô hình suy luận Nemotron 3, Gemma 4, Qwen 3.5 và nhiều mô hình khác). Tất cả đều được tối ưu hóa cho Máy chủ AI và AI PC của Dell, với các container đã được kiểm tra và bảo mật, sẵn sàng triển khai chỉ trong vài giờ sau khi được phát hành công khai.

2. Việc chuyển từ chọn mô hình sang triển khai thực tế (production) giờ đây dễ dàng hơn bao giờ hết với DEH. Bản phát hành này thu hẹp khoảng cách triển khai thông qua ba cải tiến: các cấu hình triển khai đã được đo chuẩn cho từng nền tảng của Dell (Goodput Scenarios, hiện đã mở rộng cho NVIDIA B300 và GB10), các hình ảnh container được ký xác nhận và quét bảo mật để bạn có thể truy xuất và xác minh, và các tiện ích mới từ SDK dell-ai giúp kiểm tra cấu hình nền tảng trước khi tải bất kỳ container nào.

Hãy trải nghiệm ngay tại: dell.huggingface.co

Các mô hình mã nguồn mở mới nhất, sẵn sàng trên mọi nền tảng Dell

Dell Enterprise Hub là một danh mục mô hình đa nền tảng, luôn cập nhật theo những tiến bộ mới nhất của thế giới mã nguồn mở. DEH cung cấp các bản triển khai tối ưu, sẵn sàng sử dụng trên toàn bộ dải phần cứng AI doanh nghiệp, từ trung tâm dữ liệu đến máy trạm. Dưới đây là chi tiết những cập nhật tại Dell Tech World: những mô hình mới trong danh mục, các cấu hình nền tảng Dell tương ứng và các trường hợp có kịch bản Goodput đã được tinh chỉnh (được đánh dấu ★).

Mô hình Cấu hình nền tảng Dell PowerEdge
deepseek-ai/DeepSeek-V4-Pro XE9680-H200 ★, XE9785-B300 ★
deepseek-ai/DeepSeek-V4-Flash XE9680-H100 ★, XE9680-H200 ★
zai-org/GLM-5.1 XE9785-B300 ★
zai-org/GLM-5.1-FP8 XE9680-H200, XE9680-MI300X, XE9785-MI355X
moonshotai/Kimi-K2.6 XE9680-H200, XE9680-MI300X, XE9785-MI355X, XE9785-B300 ★
nvidia/Kimi-K2.6-NVFP4 XE9680-H200, XE9785-B300
MiniMaxAI/MiniMax-M2.7 XE9680-H100, XE9680-H200, MI300X, XE9785-MI355X
nvidia/MiniMax-M2.7-NVFP4 XE9680-H100 ★, XE9680-H200 ★, XE9785-B300
nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-FP8 Dell Pro Max với GB10 ★
google/gemma-4-31B-it Dell Pro Max với GB10
Qwen/Qwen3.5-27B Dell Pro Max với GB10

Bên cạnh các mô hình MoE (Mixture of Experts) chủ đạo, danh mục còn bổ sung Arcee Trinity Large Thinking (một mô hình MoE thưa khoảng 398B với khả năng chuỗi suy nghĩ - chain-of-thought dài tự nhiên), các phiên bản còn lại của gia đình Google Gemma 4 (bao gồm các phiên bản hỗ trợ giải mã suy đoán MTP), Mistral Small 4 119B (và phiên bản NVFP4), Qwen3 Coder Next, và Cohere Transcribe 03-2026 cho nhu cầu nhận dạng giọng nói (ASR) chất lượng cao tại chỗ. Phiên bản GLM 5.1 NVFP4 sẽ sớm ra mắt.

Goodput Scenarios: Từ “đã triển khai” đến “triển khai đạt chuẩn SLO”

Một mô hình “chạy được” không đồng nghĩa với việc nó “chạy tốt”. Vậy Goodput là gì? Đó là số lượng yêu cầu trên mỗi giây mà một hệ thống triển khai có thể duy trì trong khi vẫn đáp ứng được các mục tiêu mức độ dịch vụ (SLO - Service Level Objectives) cho một khối lượng công việc thực tế (như chat, RAG, agent, ngữ cảnh dài), chứ không chỉ là con số đỉnh điểm trên biểu đồ đo chuẩn (benchmark).

Goodput Scenarios là cách DEH hiện thực hóa điều này. Thay vì mất cả tuần để thử nghiệm các cờ (flags) của vLLM, bạn bắt đầu với một cấu hình đã được Dell và Hugging Face cùng đo chuẩn để đạt được SLO mục tiêu trên nền tảng bạn chọn. Mỗi kịch bản sẽ cố định SLO (ngữ cảnh tối đa của mô hình, số người dùng ảo, phạm vi token đầu vào và đầu ra) và cung cấp các tham số vLLM đã được tối ưu.

Trên H100, H200, B300 và L40s, bạn có thể chọn một trong ba kịch bản:

  • Balanced (Cân bằng): Dành cho các khối lượng công việc chat và nội dung điển hình, ngữ cảnh và mức độ đồng thời trung bình.
  • High concurrency (Đồng thời cao): Khối lượng yêu cầu lớn, ngữ cảnh nhỏ hơn, tối ưu hóa cho thông lượng (throughput).
  • Long context (Ngữ cảnh dài): Dành cho các tài liệu dài, agent, hoặc khối lượng công việc nặng về RAG với cửa sổ ngữ cảnh mở rộng.

Điểm mới tại Dell Tech World: Goodput Scenarios hiện đã được công bố cho NVIDIA B300 và GB10, cùng với các hỗ trợ hiện có cho H100, H200 và L40s. B300 cung cấp đầy đủ ba kịch bản; GB10 hiện cung cấp một kịch bản duy nhất là “Performance”.

SDK dell-ai: Xác minh ngày triển khai, không chỉ là một API client

Dell Enterprise Hub là một cổng thông tin, nhưng các doanh nghiệp cần kịch bản hóa (script), tự động hóa và xác minh. Đó là lý do SDK dell-ai ra đời. Đây là một thư viện Python và giao diện dòng lệnh (CLI) mã nguồn mở do Dell và Hugging Face cùng phát hành, cho phép khách hàng điều khiển DEH (duyệt danh mục, tạo đoạn mã triển khai, kiểm tra cấu hình nền tảng) từ terminal hoặc pipeline CI thay vì chỉ dùng giao diện web.

Hai khả năng chính đã biến dell-ai từ một API client đơn thuần thành một công cụ sản xuất thực thụ trong năm nay:

1. Xác minh cơ sở hạ tầng. Lệnh dell-ai utils describe-system sẽ xuất thông tin máy chủ hiện tại dưới dạng JSON có cấu trúc: nhân (kernel), CPU, mẫu GPU và driver, CUDA toolkit, NVIDIA Container Toolkit, máy chủ Kubernetes, bố cục lưu trữ. Sau đó, dell-ai utils check-system sẽ so sánh máy chủ của bạn với hồ sơ hệ thống chuẩn mà DEH công bố cho từng SKU nền tảng của Dell. Điều này đảm bảo máy thực tế của khách hàng khớp với máy tham chiếu trước khi tải container.

2. Khám phá mô hình nhanh hơn và có thể lập trình. Lệnh dell-ai models search hiện thực hiện lọc ở phía máy chủ, truy xuất chi tiết song song và lưu bộ nhớ đệm (cache) siêu dữ liệu mô hình trên đĩa trong 24 giờ. Thời gian tìm kiếm lần đầu trên toàn bộ danh mục giảm từ ~16 giây xuống còn ~2 giây, và các tìm kiếm sau đó chỉ mất khoảng 100ms. Các lệnh mới như dell-ai models compatible-platforms <model_id> và cờ --format table giúp kết quả CLI dễ đọc hơn.

Với CLI, trải nghiệm triển khai ngày đầu tiên sẽ như sau:

dell-ai utils check-system                                  # xác minh hạ tầng khớp với tham chiếu của DEH
dell-ai models search --platform-id xe9785-amd-mi355x       # những mô hình nào chạy được trên phần cứng này?
dell-ai models compatible-platforms moonshotai/Kimi-K2.6    # chúng ta có thể chạy mô hình này ở đâu?

# Làm thế nào để chạy mô hình này?
dell-ai models get-snippet -m deepseek-ai/DeepSeek-V4-Pro -p xe9785-nvidia-b300 --gpus 4

Chúng ta chỉ mới bắt đầu

Với các sản phẩm mới như Dell PowerEdge XE9785 (AMD MI355X và NVIDIA B300) và Dell Pro Max với GB10, cùng danh mục mô hình mã nguồn mở tiên phong được cập nhật, các kịch bản Goodput chuyển đổi thông lượng thô thành triển khai nhận biết SLO, và một SDK xác minh hạ tầng trước khi triển khai, Dell Enterprise Hub chính là con đường nhanh nhất để đi từ “mô hình vừa ra mắt hôm qua” đến “mô hình chạy trong trung tâm dữ liệu hoặc máy trạm nội bộ của chúng ta hôm nay”.

Hãy trải nghiệm ngay tại: dell.huggingface.co

Recommended for You

Phân tích hiệu năng CUDA trong PyTorch (Phần 1)- Hướng dẫn cho người mới bắt đầu về torch.profiler

Phân tích hiệu năng CUDA trong PyTorch (Phần 1)- Hướng dẫn cho người mới bắt đầu về torch.profiler

Hướng dẫn cơ bản về cách sử dụng torch.profiler để phân tích hiệu năng CUDA trong PyTorch

Vận chuyển một nghìn tỷ tham số với Hub Bucket- Đồng bộ hóa trọng số delta trong TRL

Vận chuyển một nghìn tỷ tham số với Hub Bucket- Đồng bộ hóa trọng số delta trong TRL

Vận chuyển một nghìn tỷ tham số với Hub Bucket- Đồng bộ hóa trọng số delta trong TRL