Gartner- GPT-5 đã có mặt, nhưng cơ sở hạ tầng để hỗ trợ AI đại diện thực sự thì chưa (vẫn chưa)
GPT-5 đã có mặt, nhưng cơ sở hạ tầng để hỗ trợ AI đại diện thực sự thì chưa.
- 12 min read
Gartner: GPT-5 đã ra mắt, nhưng cơ sở hạ tầng để hỗ trợ AI đại diện thực sự thì chưa (vẫn chưa)
Bạn muốn có những thông tin chuyên sâu hơn trong hộp thư đến của mình? Đăng ký nhận bản tin hàng tuần của chúng tôi để chỉ nhận những gì quan trọng đối với các nhà lãnh đạo AI, dữ liệu và bảo mật doanh nghiệp. Đăng ký ngay
Đây là một phép tương tự: Đường cao tốc không tồn tại ở Mỹ cho đến sau năm 1956, khi được chính quyền của Tổng thống Dwight D. Eisenhower hình dung — nhưng những chiếc xe siêu nhanh, mạnh mẽ như Porsche, BMW, Jaguar, Ferrari và những hãng khác đã xuất hiện từ nhiều thập kỷ trước.
Bạn có thể nói rằng AI đang ở cùng một thời điểm then chốt: Trong khi các mô hình ngày càng trở nên có khả năng, hiệu suất và tinh vi hơn, thì cơ sở hạ tầng quan trọng mà chúng cần để mang lại sự đổi mới thực sự, trong thế giới thực vẫn chưa được xây dựng đầy đủ.
“Tất cả những gì chúng ta đã làm là tạo ra một số động cơ rất tốt cho một chiếc xe hơi, và chúng ta đang trở nên vô cùng phấn khích, như thể chúng ta có một hệ thống đường cao tốc hoàn toàn chức năng tại chỗ,” Arun Chandrasekaran, VP nhà phân tích nổi tiếng của Gartner, nói với VentureBeat.
Điều này đang dẫn đến một sự chững lại, theo một cách nào đó, trong khả năng của mô hình như GPT-5 của OpenAI: Mặc dù là một bước tiến quan trọng, nhưng nó chỉ có những tia sáng yếu ớt của AI thực sự đại diện.
“Đó là một mô hình rất có khả năng, đó là một mô hình rất linh hoạt, nó đã đạt được một số tiến bộ rất tốt trong các lĩnh vực cụ thể,” Chandrasekaran nói. “Nhưng quan điểm của tôi là nó giống như một tiến bộ gia tăng hơn, chứ không phải là một tiến bộ triệt để hoặc một cải tiến triệt để, với tất cả những kỳ vọng cao mà OpenAI đã đặt ra trong quá khứ.”
GPT-5 cải thiện ở ba lĩnh vực chính
Để rõ ràng, OpenAI đã có những bước tiến với GPT-5, theo Gartner, bao gồm trong các tác vụ mã hóa và khả năng đa phương thức.
Chandrasekaran chỉ ra rằng OpenAI đã xoay trục để làm cho GPT-5 “rất tốt” trong việc viết mã, rõ ràng nhận thấy cơ hội to lớn của gen AI trong kỹ thuật phần mềm doanh nghiệp và nhắm mục tiêu vào vị trí dẫn đầu của đối thủ cạnh tranh Anthropic trong lĩnh vực đó.
Trong khi đó, tiến bộ của GPT-5 trong các phương thức ngoài văn bản, đặc biệt là trong lời nói và hình ảnh, cung cấp các cơ hội tích hợp mới cho các doanh nghiệp, Chandrasekaran lưu ý.
GPT-5 cũng thực hiện, nếu tinh tế, thiết kế đại diện và phối hợp AI nâng cao, nhờ cải thiện việc sử dụng công cụ; mô hình có thể gọi API và công cụ của bên thứ ba và thực hiện gọi công cụ song song (xử lý đồng thời nhiều tác vụ). Tuy nhiên, điều này có nghĩa là các hệ thống doanh nghiệp phải có khả năng xử lý các yêu cầu API đồng thời trong một phiên duy nhất, Chandrasekaran chỉ ra.
Lập kế hoạch nhiều bước trong GPT-5 cho phép nhiều logic nghiệp vụ hơn nằm trong chính mô hình, giảm nhu cầu về các công cụ quy trình làm việc bên ngoài và các cửa sổ ngữ cảnh lớn hơn của nó (8K cho người dùng miễn phí, 32K cho Plus với giá 20 đô la mỗi tháng và 128K cho Pro với giá 200 đô la mỗi tháng) có thể “thay đổi các mẫu kiến trúc AI doanh nghiệp,” ông nói.
Điều này có nghĩa là các ứng dụng trước đây dựa vào các quy trình tạo tăng cường truy xuất (RAG) phức tạp để giải quyết các giới hạn ngữ cảnh giờ đây có thể chuyển trực tiếp các tập dữ liệu lớn hơn nhiều cho các mô hình và đơn giản hóa một số quy trình làm việc. Nhưng điều này không có nghĩa là RAG không còn phù hợp; “chỉ truy xuất dữ liệu phù hợp nhất vẫn nhanh hơn và hiệu quả về chi phí hơn so với việc luôn gửi các đầu vào lớn,” Chandrasekaran chỉ ra.
Gartner thấy một sự thay đổi sang một cách tiếp cận kết hợp với việc truy xuất ít nghiêm ngặt hơn, với các nhà phát triển sử dụng GPT-5 để xử lý “các ngữ cảnh lớn hơn, lộn xộn hơn” đồng thời cải thiện hiệu quả.
Về mặt chi phí, GPT-5 “giảm đáng kể” phí sử dụng API; chi phí cấp cao nhất là 1,25 đô la cho mỗi 1 triệu mã thông báo đầu vào và 10 đô la cho mỗi 1 triệu mã thông báo đầu ra, khiến nó có thể so sánh với các mô hình như Gemini 2.5, nhưng nghiêm túc cắt giảm Claude Opus. Tuy nhiên, tỷ lệ giá đầu vào/đầu ra của GTP-5 cao hơn các mô hình trước đó, điều mà các nhà lãnh đạo AI nên tính đến khi xem xét GTP-5 cho các tình huống sử dụng mã thông báo cao, Chandrasekaran khuyên.
Tạm biệt các phiên bản GPT trước (một chút)
Cuối cùng, GPT-5 được thiết kế để cuối cùng thay thế GPT-4o và dòng o (chúng ban đầu bị ngừng hoạt động, sau đó một số được OpenAI giới thiệu lại do sự bất đồng của người dùng). Ba kích thước mô hình (pro, mini, nano) sẽ cho phép các kiến trúc sư phân cấp các dịch vụ dựa trên nhu cầu về chi phí và độ trễ; các truy vấn đơn giản có thể được xử lý bởi các mô hình nhỏ hơn và các tác vụ phức tạp bởi mô hình đầy đủ, Gartner lưu ý.
Tuy nhiên, sự khác biệt về định dạng đầu ra, bộ nhớ và hành vi gọi hàm có thể yêu cầu xem xét và điều chỉnh mã và vì GPT-5 có thể làm cho một số giải pháp trước đây trở nên lỗi thời, nên các nhà phát triển nên kiểm tra các mẫu lời nhắc và hướng dẫn hệ thống của họ.
Bằng cách cuối cùng ngừng hoạt động các phiên bản trước, “Tôi nghĩ những gì OpenAI đang cố gắng làm là trừu tượng hóa mức độ phức tạp đó khỏi người dùng,” Chandrasekaran nói. “Thông thường chúng ta không phải là những người tốt nhất để đưa ra những quyết định đó, và đôi khi chúng ta thậm chí có thể đưa ra những quyết định sai lầm, tôi sẽ tranh luận.”
Một thực tế khác đằng sau việc loại bỏ dần: “Tất cả chúng ta đều biết rằng OpenAI có một vấn đề về năng lực,” ông nói, và do đó đã hình thành quan hệ đối tác với Microsoft, Oracle (Project Stargate), Google và những người khác để cung cấp năng lực tính toán. Chạy nhiều thế hệ mô hình sẽ yêu cầu nhiều thế hệ cơ sở hạ tầng, tạo ra những tác động chi phí mới và những hạn chế vật lý.
Rủi ro mới, lời khuyên để áp dụng GPT-5
OpenAI tuyên bố đã giảm tỷ lệ ảo giác tới 65% trong GPT-5 so với các mô hình trước đó; điều này có thể giúp giảm rủi ro tuân thủ và làm cho mô hình phù hợp hơn cho các trường hợp sử dụng doanh nghiệp và các giải thích chuỗi suy nghĩ (CoT) của nó hỗ trợ khả năng kiểm toán và tuân thủ quy định, Gartner lưu ý.
Đồng thời, tỷ lệ ảo giác thấp hơn này cũng như khả năng lý luận và xử lý đa phương thức nâng cao của GPT-5 có thể khuếch đại việc sử dụng sai mục đích, chẳng hạn như tạo lừa đảo và lừa đảo nâng cao. Các nhà phân tích khuyên rằng các quy trình làm việc quan trọng vẫn phải được con người xem xét, ngay cả khi lấy mẫu ít hơn.
Công ty cũng khuyên rằng các nhà lãnh đạo doanh nghiệp:
- Thí điểm và đánh giá GPT-5 trong các trường hợp sử dụng quan trọng, chạy các đánh giá song song so với các mô hình khác để xác định sự khác biệt về độ chính xác, tốc độ và trải nghiệm người dùng.
- Theo dõi các hoạt động như mã hóa rung cảm có nguy cơ tiếp xúc dữ liệu (nhưng không gây khó chịu về nó hoặc có nguy cơ lỗi hoặc thất bại của biện pháp bảo vệ).
- Sửa đổi các chính sách và hướng dẫn quản trị để giải quyết các hành vi mô hình mới, mở rộng cửa sổ ngữ cảnh và hoàn thành an toàn và hiệu chỉnh các cơ chế giám sát.
- Thử nghiệm với tích hợp công cụ, các tham số lý luận, bộ nhớ đệm và kích thước mô hình để tối ưu hóa hiệu suất và sử dụng định tuyến động tích hợp để xác định mô hình phù hợp cho đúng tác vụ.
- Kiểm tra và nâng cấp các kế hoạch cho các khả năng mở rộng của GPT-5. Điều này bao gồm xác thực hạn ngạch API, dấu vết kiểm toán và các đường ống dữ liệu đa phương thức để hỗ trợ các tính năng mới và tăng thông lượng. Kiểm tra tích hợp nghiêm ngặt cũng rất quan trọng.
Các đại diện không chỉ cần nhiều tính toán hơn; họ cần cơ sở hạ tầng
Không nghi ngờ gì nữa, AI đại diện là một “chủ đề siêu nóng ngày nay,” Chandrasekaran lưu ý và là một trong những lĩnh vực đầu tư hàng đầu trong Chu kỳ cường điệu năm 2025 của Gartner cho Gen AI. Đồng thời, công nghệ này đã đạt đến “Đỉnh cao của những kỳ vọng thổi phồng” của Gartner, có nghĩa là nó đã trải qua sự công khai rộng rãi do những câu chuyện thành công ban đầu, do đó xây dựng những kỳ vọng không thực tế.
Xu hướng này thường được theo sau bởi cái mà Gartner gọi là “Vực thẳm của sự vỡ mộng,” khi sự quan tâm, phấn khích và đầu tư nguội đi khi các thử nghiệm và triển khai không mang lại kết quả (hãy nhớ rằng: Đã có hai mùa đông AI đáng chú ý kể từ những năm 1980).
“Rất nhiều nhà cung cấp đang thổi phồng các sản phẩm vượt quá khả năng của sản phẩm,” Chandrasekaran nói. “Gần như họ đang định vị chúng là sẵn sàng sản xuất, sẵn sàng cho doanh nghiệp và sẽ mang lại giá trị kinh doanh trong một khoảng thời gian thực sự ngắn.”
Tuy nhiên, trên thực tế, vực thẳm giữa chất lượng sản phẩm so với kỳ vọng là rất lớn, ông lưu ý. Gartner không thấy việc triển khai đại diện trên toàn doanh nghiệp; những gì họ đang thấy là trong “các túi nhỏ, hẹp” và các lĩnh vực cụ thể như kỹ thuật phần mềm hoặc mua sắm.
“Nhưng ngay cả những quy trình làm việc đó cũng không hoàn toàn tự chủ; chúng thường là do con người điều khiển hoặc bán tự chủ về bản chất,” Chandrasekaran giải thích.
Một trong những thủ phạm chính là sự thiếu hụt cơ sở hạ tầng; các đại diện yêu cầu quyền truy cập vào một bộ công cụ doanh nghiệp rộng lớn và phải có khả năng giao tiếp với các kho dữ liệu và ứng dụng SaaS. Đồng thời, phải có các hệ thống quản lý danh tính và truy cập đầy đủ tại chỗ để kiểm soát hành vi và truy cập của đại diện, cũng như giám sát các loại dữ liệu mà chúng có thể truy cập (không phải thông tin nhận dạng cá nhân hoặc nhạy cảm), ông lưu ý.
Cuối cùng, các doanh nghiệp phải tin tưởng rằng thông tin mà các đại diện đang tạo ra là đáng tin cậy, có nghĩa là nó không có thành kiến và không chứa ảo giác hoặc thông tin sai lệch.
Để đạt được điều đó, các nhà cung cấp phải hợp tác và áp dụng các tiêu chuẩn mở hơn cho giao tiếp công cụ từ đại diện đến doanh nghiệp và từ đại diện đến đại diện, ông khuyên.
“Trong khi các đại diện hoặc các công nghệ cơ bản có thể đang tiến bộ, lớp điều phối, quản trị và dữ liệu này vẫn đang chờ được xây dựng để các đại diện phát triển mạnh,” Chandrasekaran nói. “Đó là nơi chúng ta thấy rất nhiều ma sát ngày nay.”
Vâng, ngành công nghiệp đang có những tiến bộ với lý luận AI, nhưng vẫn gặp khó khăn trong việc làm cho AI hiểu cách thế giới vật chất hoạt động. AI chủ yếu hoạt động trong một thế giới kỹ thuật số; nó không có giao diện mạnh mẽ với thế giới vật chất, mặc dù những cải tiến đang được thực hiện trong lĩnh vực robot không gian.
Nhưng, “chúng ta đang ở giai đoạn rất, rất, rất, rất sớm cho những loại môi trường đó,” Chandrasekaran nói.
Để thực sự đạt được những tiến bộ đáng kể đòi hỏi một “cuộc cách mạng” trong kiến trúc hoặc lý luận mô hình. “Bạn không thể ở trên đường cong hiện tại và chỉ mong đợi nhiều dữ liệu hơn, nhiều tính toán hơn và hy vọng đạt được AGI,” bà nói.
Điều đó thể hiện rõ trong việc triển khai GPT-5 được chờ đợi từ lâu: Mục tiêu cuối cùng mà OpenAI tự định nghĩa cho mình là AGI, nhưng “rõ ràng là chúng ta không ở gần điều đó,” Chandrasekaran nói. Cuối cùng, “chúng ta vẫn còn rất, rất xa so với AGI.”