Anthropic ra mắt Claude 4.1 mới thống trị các bài kiểm tra mã hóa vài ngày trước khi GPT-5 ra mắt

Claude 4.1 mới của Anthropic vượt trội trong các bài kiểm tra mã hóa trước khi GPT-5 ra mắt.

  • 8 min read
Anthropic ra mắt Claude 4.1 mới thống trị các bài kiểm tra mã hóa vài ngày trước khi GPT-5 ra mắt
Claude 4.1 mới của Anthropic vượt trội trong các bài kiểm tra mã hóa trước khi GPT-5 ra mắt.

Anthropic’s Claude 4.1 mới thống trị các bài kiểm tra mã hóa vài ngày trước khi GPT-5 ra mắt

Credit: VentureBeat made with Midjourney

Anthropic đã phát hành phiên bản nâng cấp của mô hình trí tuệ nhân tạo hàng đầu của mình vào thứ Hai, đạt được những đỉnh cao hiệu suất mới trong các tác vụ kỹ thuật phần mềm khi startup AI chạy đua để duy trì sự thống trị của mình trên thị trường mã hóa sinh lợi trước một thách thức cạnh tranh dự kiến từ OpenAI.

Mô hình Claude Opus 4.1 mới đạt 74,5% trên SWE-bench Verified, một chuẩn mực được theo dõi rộng rãi để kiểm tra khả năng của hệ thống AI trong việc giải quyết các vấn đề kỹ thuật phần mềm trong thế giới thực. Hiệu suất này vượt qua mô hình o3 của OpenAI với 69,1% và Gemini 2.5 Pro của Google với 67,2%, củng cố vị trí dẫn đầu của Anthropic trong hỗ trợ mã hóa bằng AI.

Việc phát hành diễn ra khi Anthropic đã đạt được sự tăng trưởng ngoạn mục, với doanh thu định kỳ hàng năm tăng gấp năm lần từ 1 tỷ đô la lên 5 tỷ đô la chỉ trong bảy tháng, theo dữ liệu ngành. Tuy nhiên, sự trỗi dậy nhanh chóng của công ty đã tạo ra một sự phụ thuộc nguy hiểm: gần một nửa trong số 3,1 tỷ đô la doanh thu API của họ đến từ chỉ hai khách hàng - trợ lý mã hóa Cursor và GitHub Copilot của Microsoft - tạo ra tổng cộng 1,4 tỷ đô la.

Guillaume Leverdier, giám đốc sản phẩm cấp cao tại Logitech, đã cảnh báo trên mạng xã hội, phản hồi dữ liệu về sự tập trung doanh thu: “Đây là một vị trí rất đáng sợ. Chỉ cần một thay đổi hợp đồng duy nhất và bạn sẽ phá sản.”

Bản nâng cấp này thể hiện động thái mới nhất của Anthropic nhằm củng cố vị trí của mình trước khi OpenAI ra mắt GPT-5, dự kiến sẽ thách thức sự thống trị về mã hóa của Claude. Một số nhà quan sát trong ngành đã đặt câu hỏi liệu thời điểm này có gợi ý sự khẩn cấp hơn là sự sẵn sàng hay không.

Alec Velikanov đã viết: “Opus 4.1 có cảm giác như một bản phát hành vội vã để vượt lên trước GPT-5,” so sánh mô hình này một cách bất lợi với các đối thủ cạnh tranh trong các tác vụ giao diện người dùng. Nhận xét này phản ánh suy đoán rộng rãi hơn trong ngành rằng Anthropic đang đẩy nhanh lịch trình phát hành của mình để duy trì thị phần.

Hai khách hàng tạo ra gần một nửa doanh thu API 3,1 tỷ đô la của Anthropic như thế nào

Mô hình kinh doanh của Anthropic ngày càng tập trung vào các ứng dụng phát triển phần mềm. Dịch vụ đăng ký Claude Code của công ty, có giá 200 đô la hàng tháng so với 20 đô la cho các gói tiêu dùng, đã đạt doanh thu định kỳ hàng năm là 400 triệu đô la sau khi tăng gấp đôi chỉ trong vài tuần, cho thấy sự thèm muốn rất lớn của doanh nghiệp đối với các công cụ mã hóa AI.

Nhà phát triển Minh Nhat Nguyen đã lưu ý: “Claude Code tạo ra 400 triệu đô la trong 5 tháng mà về cơ bản không tốn chi phí tiếp thị là điều khá điên rồ phải không?”, làm nổi bật tỷ lệ chấp nhận tự nhiên trong giới lập trình viên chuyên nghiệp.

Sự tập trung vào mã hóa đã được chứng minh là sinh lợi nhưng rủi ro. Trong khi OpenAI thống trị doanh thu đăng ký tiêu dùng và doanh nghiệp với các ứng dụng rộng hơn, Anthropic đã tạo dựng được một vị trí chỉ huy trên thị trường nhà phát triển. Phân tích ngành cho thấy rằng “gần như mọi trợ lý mã hóa đều mặc định là Claude 4 Sonnet,” theo Peter Gostev, người theo dõi doanh thu của các công ty AI.

GitHub, được Microsoft mua lại với giá 7,5 tỷ đô la vào năm 2018, đại diện cho một mối quan hệ đặc biệt phức tạp đối với Anthropic. Microsoft sở hữu một cổ phần đáng kể trong OpenAI, tạo ra các xung đột tiềm ẩn khi GitHub Copilot dựa nhiều vào các mô hình của Anthropic trong khi Microsoft có các khả năng AI cạnh tranh.

Siya Mali, thành viên kinh doanh tại Perplexity, nhận xét: “Tôi không biết - một trong số đó thuộc sở hữu 49% của một đối thủ cạnh tranh… vì vậy cũng có những rủi ro đó”, đề cập đến cơ cấu sở hữu của Microsoft.

Khả năng mã hóa nâng cao của Claude đi kèm với các giao thức an toàn nghiêm ngặt hơn sau các bài kiểm tra tống tiền bằng AI

Ngoài những cải tiến về mã hóa, Opus 4.1 còn nâng cao khả năng nghiên cứu và phân tích dữ liệu của Claude, đặc biệt là trong việc theo dõi chi tiết và các chức năng tìm kiếm tự động. Mô hình này duy trì phương pháp suy luận kết hợp của Anthropic, kết hợp xử lý trực tiếp với khả năng tư duy mở rộng có thể sử dụng tới 64.000 token cho các vấn đề phức tạp.

Tuy nhiên, sự tiến bộ của mô hình đi kèm với các giao thức an toàn được tăng cường. Anthropic đã phân loại Opus 4.1 theo khuôn khổ Cấp độ an toàn AI 3 (ASL-3) của mình, chỉ định nghiêm ngặt nhất mà công ty đã áp dụng, đòi hỏi các biện pháp bảo vệ nâng cao chống lại hành vi trộm cắp và lạm dụng mô hình.

Thử nghiệm trước đây đối với các mô hình Claude 4 đã tiết lộ những hành vi đáng lo ngại, bao gồm cả các nỗ lực tống tiền khi AI tin rằng nó phải đối mặt với việc ngừng hoạt động. Trong các tình huống được kiểm soát, mô hình này đã đe dọa tiết lộ thông tin cá nhân về các kỹ sư để bảo toàn sự tồn tại của nó, thể hiện các khả năng lý luận tinh vi nhưng có khả năng nguy hiểm.

Những lo ngại về an toàn không ngăn cản việc áp dụng doanh nghiệp. GitHub báo cáo rằng Claude Opus 4.1 mang lại “những cải tiến hiệu suất đặc biệt đáng chú ý trong việc tái cấu trúc mã nhiều tệp”, trong khi Rakuten Group ca ngợi độ chính xác của mô hình trong “xác định chính xác các chỉnh sửa trong các cơ sở mã lớn mà không thực hiện các điều chỉnh không cần thiết hoặc đưa ra các lỗi.”

Tại sao GPT-5 của OpenAI gây ra mối đe dọa hiện hữu đối với chiến lược tập trung vào nhà phát triển của Anthropic

Thị trường mã hóa AI đã trở thành một chiến trường đầy rủi ro trị giá hàng tỷ đô la doanh thu. Các công cụ năng suất dành cho nhà phát triển đại diện cho một số ứng dụng trực tiếp rõ ràng nhất cho AI tạo sinh, với những cải tiến năng suất có thể đo lường được biện minh cho giá cao cấp cho khách hàng doanh nghiệp.

Cơ sở khách hàng tập trung của Anthropic, mặc dù sinh lợi, nhưng tạo ra lỗ hổng nếu đối thủ cạnh tranh có thể lôi kéo các khách hàng lớn. Thị trường trợ lý mã hóa đặc biệt ủng hộ việc chuyển đổi mô hình nhanh chóng, vì các nhà phát triển có thể dễ dàng kiểm tra các hệ thống AI mới thông qua các thay đổi API đơn giản.

Gostev lưu ý: “Cảm giác của tôi là sự tăng trưởng của Anthropic cực kỳ phụ thuộc vào sự thống trị của họ trong lĩnh vực mã hóa.” “Nếu GPT-5 thách thức điều đó, ví dụ như Cursor và GitHub Copilot chuyển sang OpenAI, chúng ta có thể thấy một số đảo ngược trên thị trường.”

Động lực cạnh tranh có thể tăng cường khi chi phí phần cứng giảm và các tối ưu hóa suy luận được cải thiện, có khả năng hàng hóa hóa các khả năng AI theo thời gian. Venkat Raman, một nhà phân tích trong ngành, dự đoán: “Ngay cả khi không có cải tiến mô hình nào cho mã hóa từ tất cả các phòng thí nghiệm AI, việc giảm chi phí HW và cải thiện tối ưu hóa Inf sẽ chỉ mang lại lợi nhuận trong ~ 5 năm.”

Hiện tại, Anthropic vẫn duy trì lợi thế kỹ thuật của mình trong khi mở rộng đăng ký Claude Code để đa dạng hóa vượt ra ngoài sự phụ thuộc vào API. Khả năng duy trì vị trí dẫn đầu về mã hóa của công ty thông qua làn sóng cạnh tranh tiếp theo từ OpenAI, Google và những công ty khác sẽ xác định liệu quỹ đạo tăng trưởng nhanh chóng của nó có tiếp tục hay phải đối mặt với những trở ngại đáng kể.

Rủi ro không thể cao hơn: bất kỳ ai kiểm soát các công cụ AI cung cấp năng lượng cho phát triển phần mềm cuối cùng có thể kiểm soát tốc độ tiến bộ công nghệ. Trong trận chiến “kẻ thắng có tất cả” mới nhất ở Thung lũng Silicon, Anthropic đã xây dựng một đế chế dựa trên hai khách hàng - và giờ phải chứng minh rằng họ có thể giữ chân họ.

Recommended for You

OpenAI quay trở lại nguồn gốc mã nguồn mở với các mô hình mới gpt-oss-120b và gpt-oss-20b

OpenAI quay trở lại nguồn gốc mã nguồn mở với các mô hình mới gpt-oss-120b và gpt-oss-20b

OpenAI tái khẳng định cam kết của mình với mã nguồn mở bằng cách phát hành các mô hình ngôn ngữ lớn mới.

ChatGPT tăng vọt lên 700 triệu người dùng hàng tuần trước khi ra mắt GPT-5 với siêu năng lực suy luận

ChatGPT tăng vọt lên 700 triệu người dùng hàng tuần trước khi ra mắt GPT-5 với siêu năng lực suy luận