Nội dung hợp tác Tại sao AI đại diện là làn sóng đổi mới tiếp theo
- 10 min read
Tại sao AI tác nhân (Agentic AI) là làn sóng đổi mới tiếp theo
Được trình bày bởi Microsoft Azure và NVIDIA
Hãy tưởng tượng một tương lai, nơi một AI agent không chỉ đặt kỳ nghỉ tiếp theo của bạn mà còn giúp cung cấp danh sách mua sắm dựa trên điểm đến, dự báo thời tiết và các ưu đãi tốt nhất từ khắp nơi trên web. Chỉ với một cú nhấp chuột khác, agent có thể thực hiện những giao dịch mua này thay mặt bạn và đảm bảo chúng đến kịp thời trước khi chuyến bay của bạn khởi hành. Bạn sẽ không bao giờ quên những vật dụng cần thiết như kính bảo hộ hoặc kem chống nắng nữa.
Chỉ trong một năm, AI và máy học đã đạt đến những tầm cao mới với sự xuất hiện của các mô hình ngôn ngữ lớn tiên tiến (LLM) và các mô hình ngôn ngữ nhỏ (SLM) dành riêng cho từng lĩnh vực, có thể được triển khai cả trên đám mây và ở biên (edge). Mặc dù loại trí thông minh này là cơ sở mới cho những gì chúng ta mong đợi ở các ứng dụng của mình, nhưng tương lai của AI doanh nghiệp nằm ở các quy trình làm việc phức tạp, đa tác nhân, kết hợp các mô hình mạnh mẽ, các agent thông minh và quá trình ra quyết định do con người hướng dẫn. Thị trường này đang phát triển nhanh chóng. Theo nghiên cứu của Deloitte gần đây, 50% công ty sử dụng AI tạo sinh (Generative AI) sẽ triển khai các thử nghiệm hoặc chứng minh khái niệm (POC) về AI tác nhân vào năm 2027.
Bối cảnh AI đang không ngừng chuyển đổi, được thúc đẩy bởi những đột phá trong AI agent, các nền tảng tiên tiến như Azure AI Foundry và cơ sở hạ tầng mạnh mẽ của NVIDIA. Khi chúng ta đi qua năm 2025, những đổi mới này đang định hình lại công nghệ và cách mạng hóa các hoạt động và chiến lược kinh doanh.
AI agent: chủ động, cá nhân hóa và thông minh về mặt cảm xúc
AI agent đã trở thành một phần không thể thiếu đối với các doanh nghiệp hiện đại, không chỉ nâng cao năng suất và hiệu quả mà còn mở ra các cấp độ giá trị mới thông qua quá trình ra quyết định thông minh và trải nghiệm cá nhân hóa. Các xu hướng mới nhất chỉ ra một sự thay đổi đáng kể hướng tới các AI agent chủ động, dự đoán nhu cầu của người dùng và hành động một cách tự chủ. Các agent này ngày càng được trang bị các khả năng siêu cá nhân hóa, điều chỉnh các tương tác dựa trên sở thích và hành vi cá nhân.
Các khả năng đa phương thức (Multimodal), cho phép các agent xử lý và phản hồi các hình thức đầu vào khác nhau (văn bản, giọng nói, hình ảnh), cũng đang trở nên tinh vi hơn, cho phép các tương tác liền mạch và tự nhiên. Thậm chí thú vị hơn, trí tuệ cảm xúc trong AI agent đang được chú ý. Bằng cách hiểu và phản ứng với cảm xúc của con người, các agent không chỉ tăng năng suất mà còn cải thiện đáng kể chất lượng dịch vụ - làm cho các tương tác trở nên cá nhân hơn, ngày càng giống con người hơn và cuối cùng là hiệu quả hơn, đặc biệt trong các lĩnh vực như dịch vụ khách hàng và chăm sóc sức khỏe.
Azure AI Foundry: xưởng sản xuất agent, trao quyền cho sự đổi mới AI doanh nghiệp
Microsoft Azure AI Foundry đang đi đầu trong lĩnh vực AI, cung cấp một nền tảng thống nhất để thiết kế, tùy chỉnh, quản lý và hỗ trợ các ứng dụng và agent AI cấp doanh nghiệp ở quy mô lớn. Việc giới thiệu gần đây các mô hình như GPT-4.5 từ Azure OpenAI và Phi-4 từ Microsoft thể hiện những tiến bộ đáng kể trong xử lý ngôn ngữ tự nhiên và máy học. Các mô hình này cung cấp các phản hồi chính xác và đáng tin cậy hơn, giảm tỷ lệ ảo giác và tăng cường sự phù hợp với con người.
Azure AI Foundry cũng đơn giản hóa quy trình tùy chỉnh và tinh chỉnh, cho phép các doanh nghiệp điều chỉnh các giải pháp AI theo nhu cầu cụ thể của họ. Tích hợp nền tảng với các công cụ như GitHub và Visual Studio Code giúp hợp lý hóa quy trình phát triển, giúp các nhà phát triển và chuyên gia CNTT dễ dàng tiếp cận hơn. Ngoài ra, các nâng cấp agent doanh nghiệp tạo điều kiện cho việc tạo ra các AI agent mạnh mẽ và linh hoạt hơn, có khả năng xử lý các tác vụ và quy trình làm việc phức tạp.
Nghiên cứu điển hình: Air India
Air India, hãng hàng không hàng đầu của quốc gia, đã tận dụng Azure AI Foundry để nâng cao hoạt động dịch vụ khách hàng của mình. Bằng cách cập nhật công cụ xử lý ngôn ngữ tự nhiên cốt lõi của trợ lý ảo lên các mô hình GPT mới nhất, Air India đã đạt được mức tự động hóa 97% trong việc xử lý các truy vấn của khách hàng, giảm đáng kể chi phí hỗ trợ và cải thiện sự hài lòng của khách hàng. Sự chuyển đổi này nhấn mạnh tiềm năng của Azure AI Foundry trong việc thúc đẩy hiệu quả hoạt động và đổi mới. Tìm hiểu thêm.
NVIDIA NIM và AgentIQ tăng cường quy trình làm việc AI tác nhân
Tiến xa hơn nữa, Microsoft và NVIDIA đang mang lại những hiệu quả mới cho AI doanh nghiệp với việc tích hợp các vi dịch vụ NVIDIA NIM vào Azure AI Foundry. Các vi dịch vụ được tối ưu hóa trước, không cần cấu hình này giúp dễ dàng triển khai các ứng dụng AI hiệu suất cao trên một loạt các khối lượng công việc—từ LLM đến phân tích nâng cao. Với tích hợp Azure liền mạch và độ tin cậy cấp doanh nghiệp, các tổ chức có thể mở rộng suy luận AI một cách nhanh chóng và hiệu quả về chi phí.
Theo NVIDIA, khi Azure AI Agent Service được ghép nối với NVIDIA AgentIQ, một bộ công cụ nguồn mở, các nhà phát triển giờ đây có thể lập hồ sơ và tối ưu hóa các nhóm AI agent trong thời gian thực để giảm độ trễ, cải thiện độ chính xác và giảm chi phí [tính toán]. AgentIQ cung cấp khả năng đo từ xa phong phú và khả năng điều chỉnh hiệu suất, cho phép các nhà phát triển cải thiện động việc thực thi agent.
“Việc ra mắt các vi dịch vụ NVIDIA NIM trong Azure AI Foundry cung cấp một cách an toàn và hiệu quả để Epic triển khai các mô hình AI tạo sinh nguồn mở, giúp cải thiện việc chăm sóc bệnh nhân, tăng cường hiệu quả hoạt động và cho phép khám phá những hiểu biết mới để thúc đẩy đổi mới y tế,” Drew McCombs, phó chủ tịch phụ trách điện toán đám mây và phân tích tại Epic, cho biết. “Với sự hợp tác của UW Health và UC San Diego Health, chúng tôi cũng đang nghiên cứu các phương pháp đánh giá bản tóm tắt lâm sàng với các mô hình tiên tiến này. Cùng nhau, chúng tôi đang sử dụng công nghệ AI mới nhất theo những cách thực sự cải thiện cuộc sống của các bác sĩ lâm sàng và bệnh nhân.”
Các mô hình Meta Llama được tối ưu hóa với NVIDIA TensorRT-LLM
Hiệu suất và hiệu quả chi phí được khuếch đại hơn nữa nhờ các tối ưu hóa NVIDIA TensorRT-LLM, hiện được áp dụng cho các mô hình Meta Llama phổ biến trên Azure AI Foundry. Chúng bao gồm Llama 3.3 70B, 3.1 70B, 8B và 405B, mang lại những cải tiến về thông lượng và độ trễ ngay lập tức—không cần cấu hình.
Những người chấp nhận sớm như Synopsys báo cáo kết quả chuyển đổi: khối lượng công việc được tăng tốc, chi phí cơ sở hạ tầng giảm và chu kỳ triển khai suôn sẻ hơn. Nâng cấp hiệu suất này được cung cấp bởi các tối ưu hóa sâu ở cấp GPU, cho phép sử dụng GPU tốt hơn và giảm tổng chi phí sở hữu.
“Tại Synopsys, chúng tôi dựa vào các mô hình AI tiên tiến để thúc đẩy đổi mới và các mô hình Meta Llama được tối ưu hóa trên Azure AI Foundry đã mang lại hiệu suất vượt trội,” Arun Venkatachar, phó chủ tịch kỹ thuật, Synopsys Central Engineering cho biết. “Chúng tôi đã thấy những cải tiến đáng kể về cả thông lượng và độ trễ, cho phép chúng tôi [tăng tốc] khối lượng công việc đồng thời tối ưu hóa chi phí. Những tiến bộ này làm cho Azure AI Foundry trở thành một nền tảng lý tưởng để mở rộng quy mô các ứng dụng AI một cách hiệu quả.”
Cho dù bạn đang triển khai API không máy chủ hay quản lý cơ sở hạ tầng của riêng mình bằng máy ảo Azure hoặc Azure Kubernetes Service, các nhà phát triển giờ đây có thể linh hoạt xây dựng bằng ngăn xếp suy luận của NVIDIA—và nhận được hỗ trợ cấp doanh nghiệp thông qua NVIDIA AI Enterprise trên Azure Marketplace.
Cơ sở hạ tầng NVIDIA: tiếp sức cho cuộc cách mạng AI
NVIDIA tiếp tục dẫn đầu về cơ sở hạ tầng AI, với những dự đoán chỉ ra sự chuyển dịch hướng tới điện toán lượng tử và các trung tâm dữ liệu làm mát bằng chất lỏng. Những tiến bộ về điện toán lượng tử, đặc biệt là trong các kỹ thuật sửa lỗi, hứa hẹn sẽ nâng cao sức mạnh và hiệu quả tính toán, giải quyết các vấn đề về tính không ổn định hiện đang giới hạn phần cứng lượng tử.
Việc chuyển đổi sang làm mát bằng chất lỏng trong các trung tâm dữ liệu là một xu hướng quan trọng khác, được thúc đẩy bởi nhu cầu về hiệu suất và hiệu quả năng lượng cao hơn. Sự thay đổi này đi kèm với sự chuyển đổi trong kiến trúc trung tâm dữ liệu, chuyển sang các [tính toán] cấu trúc tích hợp tạo điều kiện giao tiếp giữa hàng nghìn bộ tăng tốc AI. Sự thống trị của NVIDIA trong phần cứng và phần mềm AI, được củng cố bởi các quan hệ đối tác chiến lược với các công ty lớn, định vị nó như một nhân tố quan trọng trong lĩnh vực AI doanh nghiệp.
Tìm hiểu thêm về tăng tốc quy trình làm việc tác nhân với Azure AI Foundry, NVIDIA NIM và NVIDIA AgentIQ.
Mike Hulme là tổng giám đốc, đổi mới ứng dụng và kỹ thuật số, tại Microsoft
Các bài viết được tài trợ là nội dung do một công ty sản xuất, công ty này có thể trả tiền cho bài đăng hoặc có mối quan hệ kinh doanh với VentureBeat và chúng luôn được đánh dấu rõ ràng. Để biết thêm thông tin, hãy liên hệ với sales@venturebeat.com.
Link bài viết gốc
- Tags:
- Ai
- 04 May 2025
- Venturebeat.com