🚀 DTS- Một Ứng cử viên cho Khả năng Suy luận Song song Tốt nhất trong LLMs

DTS được giới thiệu là một mô hình tiềm năng cho khả năng suy luận song song trong LLMs.

  • 5 min read
🚀 DTS- Một Ứng cử viên cho Khả năng Suy luận Song song Tốt nhất trong LLMs
DTS được giới thiệu là một mô hình tiềm năng cho khả năng suy luận song song trong LLMs.

🚀 DTS: Một ứng cử viên cho khả năng suy luận song song tốt nhất trong LLMs

Lý luận song song ngày càng trở nên quan trọng đối với các mô hình ngôn ngữ lớn khi các tác vụ trở nên phức tạp và đa bước hơn. Nhưng hầu hết các phương pháp hiện có vẫn dựa vào lấy mẫu mù quáng, lãng phí tài nguyên tính toán và lọc sau khi xử lý.

Decoding Tree Sketching (DTS) định hình lại cách suy luận song song nên được thực hiện. DTS không chỉ nhanh hơn hoặc chính xác hơn. Nó là phương pháp suy luận song song đầu tiên hiểu được nên suy nghĩ sâu hơn ở đâu!

🔥 Vấn đề cốt lõi của suy luận song song hiện có

Thành thật mà nói về các phương pháp “tư duy song song” hiện có:

  • DeepConf/Self-Consistency: lấy mẫu nhiều chuỗi hoàn chỉnh mà phần lớn trong số đó là dư thừa.
  • Beam search: độ phức tạp tăng theo cấp số nhân và phụ thuộc nhiều vào các heuristic cắt tỉa.
  • Bỏ phiếu đa số: hoàn toàn dựa vào sự nhất quán thống kê của các mô hình.

Tất cả chúng đều có một nhược điểm chí mạng: Chúng song song hóa đầu ra, chứ không phải quyết định. Chúng lãng phí tài nguyên tính toán vào các quỹ đạo suy luận tương tự hết lần này đến lần khác, mà không khám phá các quyết định đa dạng về mặt ngữ nghĩa.

💡 DTS: Chỉ song song hóa khi suy luận thực sự phân nhánh

DTS thay đổi hoàn toàn cấu trúc suy luận: Khám phá suy luận dưới dạng tạo cây, chỉ với một vài nút quan trọng.

Thay vì mở rộng từng token một cách mù quáng, DTS:

  • Phát hiện các token quyết định trong quá trình suy luận.
  • Chỉ phân nhánh khi có nhiều phương án tiếp nối khác biệt về mặt ngữ nghĩa.
  • Ưu tiên suy luận ngắn nhưng đáng tin cậy cho các giải pháp cuối cùng.

Điều này tạo ra một cây suy luận được phác thảo: Gọn gàng, Không trùng lặp, Giàu thông tin. Nói tóm lại: DTS song song hóa sự mơ hồ, không phải token. Đó là lý do tại sao nó hoạt động.

⚡ Điều gì làm cho DTS trở thành một cơ chế suy luận tốt hơn?

1️⃣ Khám phá nhận thức về sự không chắc chắn

DTS sử dụng các tín hiệu không chắc chắn của chính mô hình (entropy token và varentropy) để quyết định khi nào nên phân nhánh. Không cần brute force.

Các phương pháp khác hỏi: Chúng ta nên rút ra bao nhiêu mẫu? DTS hỏi: Bước này có đáng để phân nhánh không? Đó là một sự khác biệt cơ bản.

2️⃣ Ưu tiên suy luận ngắn nhưng đáng tin cậy

Về mặt thực nghiệm, các suy luận Chain-of-Thought (CoT) dài dễ mắc lỗi hơn. DTS mang hiểu biết này vào chính quá trình giải mã:

  • Dừng sớm khi một con đường suy luận hợp lệ hoàn thành.
  • Ưu tiên lộ trình thành công ngắn nhất.
  • Tránh suy nghĩ quá nhiều và lặp lại.

Điều này tận dụng hiệu quả suy luận nội tại theo thiết kế, chứ không chỉ là một thủ thuật xử lý sau.

3️⃣ Khám phá song song & có khả năng mở rộng

DTS mang lại cho bạn:

  • Khám phá song song.
  • Độ phức tạp có giới hạn.
  • Chi phí suy luận có thể dự đoán được.

DTS chỉ phát triển khi mô hình yêu cầu. Đó là lý do tại sao DTS có thể mở rộng quy mô.

4️⃣ Cắm vào, không cần đào tạo, không phụ thuộc mô hình

DTS dựa vào Không cần SFT, đào tạo sau, hoặc các LLM khác làm giám khảo.

Nếu mô hình của bạn có thể giải mã token, nó có thể sử dụng DTS. Điều này làm cho DTS có thể sử dụng ngay lập tức trong: Hugging Face Transformers, vLLM / SGLang, các hệ thống suy luận sản xuất.

🧠 DTS so với các phương pháp suy luận song song khác

Phương pháp Song song? Đường đi dư thừa Nhận thức quyết định Hiệu quả tính toán
Self-Consistency Cao
Beam Search ⚠️ Trung bình ⚠️
Tree-of-Thought ⚠️ Cao
DTS Thấp

📈 Bạn nhận được gì trong thực tế

Trên các tiêu chuẩn suy luận, DTS cho thấy:

  • ✅ Độ chính xác cao hơn
    • +20% độ chính xác trên AIME 2024/2025; +5.5% trên GPQ-D; +12% trên Live-Bench (trung bình)
  • 🌀 Ít lặp lại và ảo giác hơn
    • −9% tỷ lệ lặp lại trên AIME 2024/2025; −12% trên Live-Bench
  • Dấu vết suy luận ngắn hơn
    • Tạo ra các dấu vết suy luận ngắn hơn với ít khám phá dư thừa hơn.

Tất cả đều đạt được hoàn toàn thông qua một khung giải mã cắm là chạy mà không cần đào tạo sau/SFT.

🛠 Thử DTS ngay hôm nay

DTS sẵn sàng để tích hợp vào các quy trình giải mã hiện có. Nếu bạn đang xây dựng: Bộ giải toán học hoặc logic, Hệ thống suy luận có tác nhân, Triển khai LLM hiệu quả về chi phí. DTS có thể là chiến lược suy luận song song mặc định của bạn.

Nếu bạn cần, chúng tôi có thể giúp bạn định vị DTS như một mô hình suy luận mới, không chỉ là một thuật toán! Chỉ cần cho chúng tôi biết 🔥

Recommended for You

Kiến trúc thử nghiệm chuyển văn bản thành hình ảnh

Kiến trúc thử nghiệm chuyển văn bản thành hình ảnh

Các thử nghiệm kiến trúc chuyển văn bản thành hình ảnh

Tham gia Cuộc thi Lập trình Robot Mở AMD

Tham gia Cuộc thi Lập trình Robot Mở AMD

Tham gia Cuộc thi Lập trình Robot Mở AMD