Claude 2

Anthropic giới thiệu Claude 2, một mô hình ngôn ngữ lớn tiên tiến với khả năng nâng cao và hiệu suất được cải thiện.

November 10, 2025
6 min read

Anthropic giới thiệu Claude 2, một mô hình ngôn ngữ lớn tiên tiến với khả năng nâng cao và hiệu suất được cải thiện.

Claude 2

Ngày 11 tháng 7 năm 2023 - 4 phút đọc

Chúng tôi vui mừng thông báo về Claude 2, mô hình mới của chúng tôi. Claude 2 có hiệu suất được cải thiện, phản hồi dài hơn và có thể truy cập thông qua API cũng như trang web beta mới hướng tới người dùng công cộng, claude.ai. Chúng tôi đã nhận được phản hồi từ người dùng rằng Claude dễ trò chuyện, giải thích rõ ràng suy nghĩ của mình, ít có khả năng tạo ra đầu ra có hại và có bộ nhớ dài hơn. Chúng tôi đã cải thiện các mô hình trước đây của mình về khả năng lập trình, toán học và suy luận.

Ví dụ, mô hình mới nhất của chúng tôi đã đạt 76,5% trong phần câu hỏi trắc nghiệm của kỳ thi luật sư, tăng từ 73,0% với Claude 1.3. Khi so sánh với sinh viên đại học đăng ký học sau đại học, Claude 2 đứng trên phân vị thứ 90 trong các kỳ thi đọc và viết GRE, và tương tự như ứng viên trung bình về lý luận định lượng.

Hãy coi Claude như một đồng nghiệp thân thiện, nhiệt tình hoặc trợ lý cá nhân có thể được hướng dẫn bằng ngôn ngữ tự nhiên để giúp bạn thực hiện nhiều nhiệm vụ. API Claude 2 dành cho doanh nghiệp được cung cấp với cùng mức giá như Claude 1.3. Ngoài ra, bất kỳ ai ở Hoa Kỳ và Vương quốc Anh đều có thể bắt đầu sử dụng trải nghiệm trò chuyện beta của chúng tôi ngay hôm nay.

Khi chúng tôi nỗ lực cải thiện cả hiệu suất và sự an toàn của các mô hình, chúng tôi đã tăng độ dài đầu vào và đầu ra của Claude. Người dùng có thể nhập tối đa 100K token trong mỗi lời nhắc, nghĩa là Claude có thể xử lý hàng trăm trang tài liệu kỹ thuật hoặc thậm chí cả một cuốn sách. Giờ đây, Claude cũng có thể viết các tài liệu dài hơn - từ các bản ghi nhớ đến thư từ hoặc truyện ngắn lên đến vài nghìn token - tất cả trong một lần.

Thêm vào đó, mô hình mới nhất của chúng tôi có kỹ năng lập trình được cải thiện đáng kể. Claude 2 đã đạt 71,2% so với 56,0% trên Codex HumanEval, một bài kiểm tra lập trình Python. Trên GSM8k, một bộ lớn các bài toán cấp tiểu học, Claude 2 đạt 88,0% so với 85,2%. Chúng tôi có một lộ trình thú vị về các cải tiến khả năng được lên kế hoạch cho Claude 2 và sẽ triển khai chúng một cách chậm rãi và lặp đi lặp lại trong những tháng tới.

Chúng tôi đã liên tục lặp lại để cải thiện tính an toàn cơ bản của Claude 2, để nó trở nên vô hại hơn và khó bị tác động để tạo ra đầu ra xúc phạm hoặc nguy hiểm. Chúng tôi có một đánh giá red-teaming nội bộ chấm điểm các mô hình của chúng tôi trên một tập hợp lớn các lời nhắc có hại, sử dụng một bài kiểm tra tự động trong khi chúng tôi cũng thường xuyên kiểm tra kết quả thủ công. Trong đánh giá này, Claude 2 tốt hơn gấp 2 lần trong việc đưa ra phản hồi vô hại so với Claude 1.3. Mặc dù không có mô hình nào miễn nhiễm với các cuộc tấn công jailbreak, chúng tôi đã sử dụng nhiều kỹ thuật an toàn (mà bạn có thể đọc ở đây và ở đây), cũng như red-teaming chuyên sâu, để cải thiện đầu ra của nó.

Claude 2 cung cấp sức mạnh cho trải nghiệm trò chuyện của chúng tôi và có sẵn tại Hoa Kỳ và Vương quốc Anh. Chúng tôi đang làm việc để Claude có sẵn trên toàn cầu trong những tháng tới. Bạn có thể tạo tài khoản ngay bây giờ và bắt đầu trò chuyện với Claude bằng ngôn ngữ tự nhiên, yêu cầu nó giúp bạn với bất kỳ nhiệm vụ nào bạn muốn. Trò chuyện với trợ lý AI có thể cần một chút thử và sai, vì vậy hãy đọc các mẹo của chúng tôi để tận dụng tối đa Claude.

Chúng tôi cũng đang làm việc với hàng nghìn doanh nghiệp hiện đang sử dụng API Claude. Một trong những đối tác của chúng tôi là Jasper, một nền tảng AI tạo sinh cho phép cá nhân và nhóm mở rộng chiến lược nội dung của họ. Họ nhận thấy Claude 2 có thể cạnh tranh ngang bằng với các mô hình tiên tiến khác cho nhiều trường hợp sử dụng, nhưng có thế mạnh đặc biệt cho các trường hợp sử dụng độ trễ thấp dạng dài. Greg Larson, VP Kỹ thuật tại Jasper cho biết: “Chúng tôi rất vui khi là một trong những đơn vị đầu tiên cung cấp Claude 2 cho khách hàng của mình, mang lại ngữ nghĩa nâng cao, đào tạo kiến thức cập nhật, suy luận được cải thiện cho các lời nhắc phức tạp và khả năng phối lại nội dung hiện có một cách dễ dàng với cửa sổ ngữ cảnh lớn gấp 3 lần.” “Chúng tôi tự hào giúp khách hàng của mình đi trước xu hướng thông qua các mối quan hệ đối tác như thế này với Anthropic.”

Sourcegraph là một nền tảng AI mã nguồn, giúp khách hàng viết, sửa lỗi và duy trì mã. Trợ lý mã của họ Cody sử dụng khả năng suy luận được cải thiện của Claude 2 để đưa ra các câu trả lời chính xác hơn cho các truy vấn của người dùng, đồng thời chuyển tiếp nhiều ngữ cảnh mã nguồn hơn với cửa sổ ngữ cảnh lên tới 100K. Ngoài ra, Claude 2 được đào tạo trên dữ liệu gần đây hơn, nghĩa là nó có kiến thức về các framework và thư viện mới hơn để Cody có thể sử dụng. Quinn Slack, CEO & Đồng sáng lập Sourcegraph cho biết: “Khi nói đến mã hóa AI, các nhà phát triển cần truy cập nhanh chóng và đáng tin cậy vào ngữ cảnh về cơ sở mã độc đáo của họ và một LLM mạnh mẽ với cửa sổ ngữ cảnh lớn và khả năng suy luận tổng quát mạnh mẽ.” “Những phần chậm nhất và gây khó chịu nhất trong quy trình làm việc của nhà phát triển đang trở nên nhanh hơn và thú vị hơn. Nhờ Claude 2, Cody đang giúp nhiều nhà phát triển xây dựng nhiều phần mềm hơn để thúc đẩy thế giới tiến lên.”

Chúng tôi hoan nghênh phản hồi của bạn khi chúng tôi làm việc để triển khai sản phẩm của mình một cách có trách nhiệm hơn. Trải nghiệm trò chuyện của chúng tôi là một bản phát hành beta mở và người dùng nên lưu ý rằng Claude – giống như tất cả các mô hình hiện tại – có thể tạo ra các phản hồi không phù hợp. Trợ lý AI hữu ích nhất trong các tình huống hàng ngày, như tóm tắt hoặc tổ chức thông tin, và không nên được sử dụng khi sức khỏe thể chất hoặc tinh thần liên quan. Vui lòng cho chúng tôi biết nếu bạn muốn trò chuyện với Claude trong một khu vực hiện không được hỗ trợ, hoặc nếu bạn là doanh nghiệp muốn bắt đầu làm việc với Claude.

AI Today - SkyAI

Claude 2

Claude 2

Link bài viết gốc