Giới thiệu Claude Sonnet 4.5
Giới thiệu Claude Sonnet 4.5
- 4 min read
Giới thiệu Claude Sonnet 4.5
Claude Sonnet 4.5 là mô hình mã hóa tốt nhất trên thế giới. Đây là mô hình mạnh nhất để xây dựng các tác nhân phức tạp. Nó là mô hình tốt nhất trong việc sử dụng máy tính. Và nó cho thấy những lợi ích đáng kể trong lý luận và toán học.
Mã có ở khắp mọi nơi. Nó chạy mọi ứng dụng, bảng tính và công cụ phần mềm bạn sử dụng. Có thể sử dụng các công cụ đó và suy luận thông qua các vấn đề khó khăn là cách công việc hiện đại được thực hiện.
Claude Sonnet 4.5 làm cho điều này trở nên khả thi. Chúng tôi đang phát hành nó cùng với một loạt các nâng cấp lớn cho các sản phẩm của mình. Trong Claude Code, chúng tôi đã thêm các điểm kiểm tra—một trong những tính năng được yêu cầu nhiều nhất của chúng tôi—giúp lưu tiến trình của bạn và cho phép bạn quay lại trạng thái trước đó ngay lập tức. Chúng tôi đã làm mới giao diện thiết bị đầu cuối và xuất bản tiện ích mở rộng VS Code gốc. Chúng tôi đã thêm một tính năng chỉnh sửa ngữ cảnh và công cụ bộ nhớ mới vào Claude API cho phép các tác nhân chạy lâu hơn và xử lý độ phức tạp lớn hơn. Trong ứng dụng Claude, chúng tôi đã đưa việc thực thi mã và tạo tệp (bảng tính, trang trình bày và tài liệu) trực tiếp vào cuộc trò chuyện. Và chúng tôi đã cung cấp tiện ích mở rộng Claude for Chrome cho người dùng Max đã tham gia danh sách chờ vào tháng trước.
Chúng tôi cũng đang cung cấp cho các nhà phát triển các khối xây dựng mà chúng tôi sử dụng để tạo Claude Code. Chúng tôi gọi đây là Claude Agent SDK. Cơ sở hạ tầng cung cấp sức mạnh cho các sản phẩm tiên tiến của chúng tôi—và cho phép chúng đạt được tiềm năng tối đa—giờ đây là của bạn để xây dựng.
Đây là mô hình tiên tiến phù hợp nhất mà chúng tôi từng phát hành, cho thấy những cải tiến lớn trên một số lĩnh vực phù hợp so với các mô hình Claude trước đây.
Claude Sonnet 4.5 có sẵn ở mọi nơi ngay hôm nay. Nếu bạn là nhà phát triển, chỉ cần sử dụng claude-sonnet-4-5 thông qua Claude API. Giá vẫn giống như Claude Sonnet 4, ở mức 3 đô la/15 đô la cho mỗi triệu token.
Trí tuệ tiên phong
Claude Sonnet 4.5 là hiện đại trên đánh giá SWE-bench Verified, đánh giá khả năng viết mã phần mềm thực tế. Về mặt thực tế, chúng tôi đã quan sát thấy nó duy trì sự tập trung trong hơn 30 giờ đối với các tác vụ phức tạp, nhiều bước.

Claude Sonnet 4.5 thể hiện một bước tiến đáng kể trong việc sử dụng máy tính. Trên OSWorld, một điểm chuẩn kiểm tra các mô hình AI trên các tác vụ máy tính thực tế, Sonnet 4.5 hiện dẫn đầu với 61,4%. Chỉ bốn tháng trước, Sonnet 4 đã dẫn đầu với 42,2%. Tiện ích mở rộng Claude for Chrome của chúng tôi đưa các khả năng được nâng cấp này vào sử dụng. Trong bản demo bên dưới, chúng tôi hiển thị Claude làm việc trực tiếp trong trình duyệt, điều hướng các trang web, điền bảng tính và hoàn thành các tác vụ.
Mô hình này cũng cho thấy khả năng cải thiện trên một loạt các đánh giá bao gồm lý luận và toán học:

Các chuyên gia trong lĩnh vực tài chính, luật, y học và STEM nhận thấy Sonnet 4.5 cho thấy kiến thức và lý luận cụ thể theo lĩnh vực tốt hơn đáng kể so với các mô hình cũ hơn, bao gồm Opus 4.1.
Khả năng của mô hình cũng được phản ánh trong trải nghiệm của những khách hàng ban đầu: