Posts

Truy tìm suy nghĩ của một mô hình ngôn ngữ lớn

Nghiên cứu về khả năng diễn giải của các mô hình ngôn ngữ lớn, cố gắng hiểu rõ hơn về 'suy nghĩ' bên trong của chúng.

Tư duy mở rộng của Claude

Tư duy mở rộng của Claude

Nghiên cứu khám phá khái niệm 'tư duy mở rộng' trong Claude, tìm hiểu cách mô hình xử lý và tạo ra các chuỗi suy nghĩ dài hơn.

Từ GRPO đến DAPO và GSPO- Cái gì, Tại sao và Như thế nào

Từ GRPO đến DAPO và GSPO- Cái gì, Tại sao và Như thế nào

Từ GRPO đến DAPO và GSPO- Cái gì, Tại sao và Như thế nào

Vạch ra một con đường dẫn đến Trách nhiệm giải trình về AI

Anthropic thảo luận về tầm quan trọng của trách nhiệm giải trình trong AI, đề xuất các phương pháp để đảm bảo sự phát triển và triển khai có đạo đức.

VaultGemma- LLM riêng tư khác biệt có khả năng nhất thế giới

VaultGemma- LLM riêng tư khác biệt có khả năng nhất thế giới

Mô hình

Về cảnh quan tính toán toàn cầu đang thay đổi

Về cảnh quan tính toán toàn cầu đang thay đổi

Về cảnh quan tính toán toàn cầu đang thay đổi