OpenAI cập nhật nhanh chóng API phản hồi mới của mình với hỗ trợ MCP, tạo ảnh gốc GPT-4o và nhiều tính năng dành cho doanh nghiệp

OpenAI cập nhật API phản hồi mới của mình với hỗ trợ MCP, tạo ảnh gốc GPT-4o và nhiều tính năng dành cho doanh nghiệp.

May 21, 2025
8 min read

OpenAI cập nhật nhanh chóng API phản hồi mới của mình với hỗ trợ MCP, tạo ảnh gốc GPT-4o và nhiều tính năng dành cho doanh nghiệp — OpenAI cập nhật API phản hồi mới của mình với hỗ trợ MCP, tạo ảnh gốc GPT-4o và nhiều tính năng dành cho doanh nghiệp.

OpenAI Cập Nhật Nhanh Chóng API Phản Hồi Mới Với Hỗ Trợ MCP, Tạo Ảnh Gốc GPT-4o Và Nhiều Tính Năng Doanh Nghiệp Hơn

OpenAI đang triển khai một loạt các cập nhật quan trọng cho API Phản hồi mới, nhằm giúp các nhà phát triển và doanh nghiệp xây dựng các ứng dụng đại diện thông minh, định hướng hành động dễ dàng hơn.

Những cải tiến này bao gồm hỗ trợ cho các máy chủ Giao thức Ngữ cảnh Mô hình (MCP) từ xa, tích hợp các công cụ tạo ảnh và Code Interpreter, và nâng cấp khả năng tìm kiếm tệp — tất cả đều có sẵn kể từ ngày hôm nay, 21 tháng 5.

Lần đầu tiên ra mắt vào tháng 3 năm 2025, API Phản hồi đóng vai trò là hộp công cụ của OpenAI cho các nhà phát triển bên thứ ba để xây dựng các ứng dụng đại diện dựa trên một số chức năng cốt lõi của các dịch vụ nổi tiếng ChatGPT và các đại diện AI bên thứ nhất của nó Deep Research và Operator.

Trong những tháng kể từ khi ra mắt, nó đã xử lý hàng nghìn tỷ token và hỗ trợ một loạt các trường hợp sử dụng rộng rãi, từ nghiên cứu thị trường và giáo dục đến phát triển phần mềm và phân tích tài chính.

Các ứng dụng phổ biến được xây dựng bằng API bao gồm đại diện mã hóa của Zencoder, trợ lý tình báo thị trường của Revi và nền tảng giáo dục của MagicSchool.

Cơ sở và mục đích của API Phản hồi

API Phản hồi ra mắt cùng với SDK Agents mã nguồn mở của OpenAI vào tháng 3 năm 2025, như một phần của sáng kiến cung cấp cho nhà phát triển bên thứ ba quyền truy cập vào cùng một công nghệ cung cấp năng lượng cho các đại diện AI của OpenAI như Deep Research và Operator.

Bằng cách này, các công ty khởi nghiệp và các công ty bên ngoài OpenAI có thể tích hợp cùng một công nghệ mà nó cung cấp thông qua ChatGPT vào các sản phẩm và dịch vụ của riêng họ, có thể là nội bộ cho việc sử dụng của nhân viên hoặc bên ngoài cho khách hàng và đối tác.

Ban đầu, API kết hợp các yếu tố từ Chat Completions và Assistants API — cung cấp các công cụ tích hợp để tìm kiếm trên web và tệp, cũng như sử dụng máy tính — cho phép các nhà phát triển xây dựng quy trình làm việc tự động mà không cần logic điều phối phức tạp. OpenAI cho biết vào thời điểm đó rằng Chat Completions API sẽ bị ngừng sử dụng vào giữa năm 2026.

API Phản hồi cung cấp khả năng hiển thị các quyết định của mô hình, quyền truy cập vào dữ liệu thời gian thực và khả năng tích hợp cho phép các đại diện truy xuất, suy luận và hành động dựa trên thông tin.

Sự ra mắt này đánh dấu một sự thay đổi hướng tới việc cung cấp cho các nhà phát triển một bộ công cụ thống nhất để tạo ra các đại diện AI sẵn sàng sản xuất, dành riêng cho từng miền với mức độ ma sát tối thiểu.

Hỗ trợ máy chủ MCP từ xa mở rộng tiềm năng tích hợp

Một bổ sung quan trọng trong bản cập nhật này là hỗ trợ cho các máy chủ MCP từ xa. Giờ đây, các nhà phát triển có thể kết nối các mô hình của OpenAI với các công cụ và dịch vụ bên ngoài như Stripe, Shopify và Twilio chỉ bằng một vài dòng mã. Khả năng này cho phép tạo ra các đại diện có thể thực hiện hành động và tương tác với các hệ thống mà người dùng đã phụ thuộc vào. Để hỗ trợ hệ sinh thái đang phát triển này, OpenAI đã tham gia ủy ban chỉ đạo MCP.

Truy cập vào các công cụ mới: tạo ảnh gốc và Code Interpreter

Bản cập nhật mang đến các công cụ tích hợp mới cho API Phản hồi, giúp nâng cao những gì các đại diện có thể làm trong một lệnh gọi API duy nhất.

Một biến thể của mô hình tạo ảnh gốc GPT-4o nổi tiếng của OpenAI — đã truyền cảm hứng cho một làn sóng meme anime theo phong cách “Studio Ghibli” trên khắp web và làm nghẽn các máy chủ của OpenAI với mức độ phổ biến của nó, nhưng rõ ràng có thể tạo ra nhiều kiểu hình ảnh khác — hiện có sẵn thông qua API dưới tên mô hình “gpt-image-1.” Nó bao gồm các tính năng mới hữu ích và khá ấn tượng như xem trước phát trực tuyến theo thời gian thực và tinh chỉnh nhiều lượt.

Điều này cho phép các nhà phát triển xây dựng các ứng dụng có thể tạo và chỉnh sửa hình ảnh một cách linh hoạt để đáp ứng đầu vào của người dùng.

Ngoài ra, công cụ Code Interpreter hiện được tích hợp vào API Phản hồi, cho phép các mô hình xử lý phân tích dữ liệu, toán học phức tạp và các tác vụ dựa trên logic trong các quy trình lý luận của chúng.

Công cụ này giúp cải thiện hiệu suất mô hình trên nhiều điểm chuẩn kỹ thuật khác nhau và cho phép hành vi đại diện phức tạp hơn.

Cải thiện khả năng tìm kiếm tệp và xử lý ngữ cảnh

Chức năng tìm kiếm tệp cũng đã được nâng cấp. Giờ đây, các nhà phát triển có thể thực hiện tìm kiếm trên nhiều kho lưu trữ vectơ và áp dụng lọc dựa trên thuộc tính để chỉ truy xuất nội dung phù hợp nhất.

Điều này cải thiện độ chính xác của thông tin mà các đại diện sử dụng, nâng cao khả năng trả lời các câu hỏi phức tạp và hoạt động trong các miền kiến thức lớn.

Các tính năng mới về độ tin cậy và minh bạch cho doanh nghiệp

Một số tính năng được thiết kế đặc biệt để đáp ứng nhu cầu của doanh nghiệp. Chế độ nền cho phép các tác vụ không đồng bộ chạy trong thời gian dài, giải quyết các vấn đề về thời gian chờ hoặc gián đoạn mạng trong quá trình lý luận chuyên sâu.

Tóm tắt lý luận, một bổ sung mới, cung cấp các giải thích bằng ngôn ngữ tự nhiên về quá trình suy nghĩ nội bộ của mô hình, giúp gỡ lỗi và minh bạch.

Các mục lý luận được mã hóa cung cấp thêm một lớp bảo mật cho khách hàng Giữ lại Không Dữ liệu.

Chúng cho phép các mô hình sử dụng lại các bước lý luận trước đó mà không lưu trữ bất kỳ dữ liệu nào trên máy chủ OpenAI, cải thiện cả tính bảo mật và hiệu quả.

Các khả năng mới nhất được hỗ trợ trên dòng GPT-4o, dòng GPT-4.1 và các mô hình o-series của OpenAI, bao gồm o3 và o4-mini. Các mô hình này hiện duy trì trạng thái lý luận trên nhiều lệnh gọi và yêu cầu công cụ, dẫn đến các phản hồi chính xác hơn với chi phí và độ trễ thấp hơn.

Giá hôm qua LÀ giá hôm nay!

Mặc dù bộ tính năng được mở rộng, OpenAI đã xác nhận rằng giá cho các công cụ và khả năng mới trong API Phản hồi sẽ vẫn nhất quán với mức giá hiện tại.

Ví dụ: công cụ Code Interpreter có giá 0,03 đô la cho mỗi phiên và việc sử dụng tìm kiếm tệp được tính phí 2,50 đô la cho mỗi 1.000 lệnh gọi, với chi phí lưu trữ là 0,10 đô la cho mỗi GB mỗi ngày sau gigabyte miễn phí đầu tiên.

Giá tìm kiếm trên web khác nhau tùy thuộc vào mô hình và kích thước ngữ cảnh tìm kiếm, từ 25 đến 50 đô la cho mỗi 1.000 lệnh gọi. Việc tạo ảnh thông qua công cụ gpt-image-1 cũng được tính phí theo độ phân giải và cấp chất lượng, bắt đầu từ 0,011 đô la cho mỗi hình ảnh.

Tất cả việc sử dụng công cụ đều được tính phí theo tỷ lệ mỗi mã thông báo của mô hình đã chọn, không có đánh dấu bổ sung cho các khả năng mới được thêm vào.

Điều gì tiếp theo cho API Phản hồi?

Với những cập nhật này, OpenAI tiếp tục mở rộng những gì có thể với API Phản hồi. Các nhà phát triển có được quyền truy cập vào một bộ công cụ phong phú hơn và các tính năng sẵn sàng cho doanh nghiệp, trong khi các doanh nghiệp giờ đây có thể xây dựng các ứng dụng dựa trên AI có khả năng, tích hợp và an toàn hơn.

Tất cả các tính năng đều hoạt động kể từ ngày 21 tháng 5, với chi tiết về giá cả và triển khai có sẵn thông qua tài liệu của OpenAI.

AI Today - SkyAI