Khả năng Quan sát Agentforce của Salesforce cho phép bạn xem các tác nhân AI của mình suy nghĩ gần như theo thời gian thực
Các khả năng mới, được tích hợp vào Nền tảng Agentforce 360 của Salesforce, cung cấp cho các tổ chức khả năng hiển thị chi tiết về mọi hành động mà các tác nhân AI của họ thực hiện, mọi bước suy luận mà họ tuân theo và mọi biện pháp bảo vệ mà họ kích hoạt.
- 17 min read
Salesforce Agentforce Observability cho phép theo dõi hoạt động của tác tử AI trong thời gian thực
Salesforce ra mắt Agentforce Observability nhằm cung cấp cho doanh nghiệp khả năng hiển thị theo thời gian thực về hành vi của tác tử AI, giải quyết các thách thức về tin cậy và minh bạch trong việc triển khai AI quy mô lớn.
Salesforce Agentforce Observability cho phép theo dõi hoạt động của tác tử AI trong thời gian thực
Salesforce ra mắt Agentforce Observability để mang lại khả năng hiển thị theo thời gian thực cho doanh nghiệp về hành vi của tác tử AI, giải quyết các thách thức về tin cậy và minh bạch trong việc triển khai AI quy mô lớn.
Cre: VentureBeat tạo bằng Midjourney
Salesforce đã cho ra mắt một bộ công cụ giám sát vào thứ Năm, nhằm giải quyết một trong những vấn đề nan giải nhất trong việc ứng dụng trí tuệ nhân tạo (AI) của doanh nghiệp: Khi các công ty triển khai tác tử AI để xử lý các tương tác thực tế với khách hàng, họ thường không biết các tác tử này đưa ra quyết định như thế nào.
Các tính năng mới, được tích hợp vào Nền tảng Agentforce 360 của Salesforce, cung cấp cho các tổ chức khả năng hiển thị chi tiết về mọi hành động mà tác tử AI của họ thực hiện, mọi bước lý luận mà chúng tuân theo và mọi rào cản mà chúng kích hoạt. Động thái này diễn ra trong bối cảnh các doanh nghiệp đang đối mặt với một mâu thuẫn cơ bản trong việc áp dụng AI – công nghệ này hứa hẹn những cải thiện lớn về hiệu quả, nhưng các giám đốc điều hành vẫn cảnh giác với các hệ thống tự động mà họ không thể hiểu hoặc kiểm soát hoàn toàn.
“Bạn không thể mở rộng quy mô những gì bạn không thể nhìn thấy,” Adam Evans, Phó Chủ tịch Điều hành và Tổng Giám đốc Salesforce AI, cho biết trong một tuyên bố thông báo phát hành. Công ty cho biết các doanh nghiệp đã tăng cường triển khai AI lên 282% gần đây, tạo ra nhu cầu cấp thiết về các hệ thống giám sát có thể theo dõi các đội tác tử AI đưa ra các quyết định kinh doanh trong thế giới thực.
Thách thức mà Salesforce hướng tới giải quyết rất đơn giản: Các tác tử AI hoạt động, nhưng không ai biết tại sao. Một bot dịch vụ khách hàng có thể giải quyết thành công một câu hỏi về thuế hoặc lên lịch hẹn, nhưng doanh nghiệp triển khai nó không thể truy xuất con đường lý luận dẫn đến kết quả đó. Khi có điều gì đó sai sót – hoặc khi tác tử gặp trường hợp ngoại lệ – các công ty thiếu các công cụ chẩn đoán để hiểu điều gì đã xảy ra.
“Agentforce Observability hoạt động như một hệ thống điều khiển nhiệm vụ không chỉ để giám sát, mà còn để phân tích và tối ưu hóa hiệu suất của tác tử,” Gary Lerhaupt, Phó Chủ tịch Salesforce AI, người đứng đầu công việc về khả năng quan sát của công ty, chia sẻ trong một cuộc phỏng vấn độc quyền với VentureBeat. Ông nhấn mạnh rằng hệ thống cung cấp các chỉ số kinh doanh cụ thể mà các công cụ giám sát truyền thống không có. “Trong dịch vụ, đây có thể là tỷ lệ tương tác hoặc tỷ lệ chuyển hướng. Trong bán hàng, đó có thể là số lượng khách hàng tiềm năng được gán, được chuyển đổi hoặc tỷ lệ phản hồi.”
Cách các công cụ giám sát AI giúp 1-800Accountant và Reddit theo dõi việc ra quyết định của tác tử tự động
Các vấn đề trở nên rõ ràng trong các lần triển khai khách hàng ban đầu. Ryan Teeples, Giám đốc Công nghệ tại 1-800Accountant, cho biết công ty của ông đã triển khai các tác tử Agentforce để hoạt động như một lực lượng lao động kỹ thuật số 24/7 xử lý các yêu cầu thuế phức tạp và lên lịch hẹn. AI sử dụng dữ liệu tích hợp từ nhật ký kiểm toán, lịch sử hỗ trợ khách hàng và các nguồn như ấn phẩm của IRS để cung cấp phản hồi tức thời – mà không cần sự can thiệp của con người.
Đối với một công ty dịch vụ tài chính xử lý thông tin thuế nhạy cảm trong mùa cao điểm, việc không thể thấy cách AI đưa ra quyết định sẽ là một yếu tố quyết định. “Với mức độ thông tin nhạy cảm này và tốc độ di chuyển nhanh chóng của chúng tôi, đặc biệt là trong mùa thuế, Observability cho phép chúng tôi có đầy đủ lòng tin và sự minh bạch với mọi tương tác của tác tử trong một chế độ xem thống nhất,” Teeples nói.
Các công cụ quan sát đã tiết lộ những hiểu biết mà Teeples không mong đợi. “Tính năng tối ưu hóa là điều làm tôi kinh ngạc nhất – cung cấp khả năng quan sát đầy đủ về lý luận của tác tử, xác định các khoảng trống hiệu suất và tiết lộ cách các tác tử của chúng tôi đưa ra quyết định,” ông nói. “Điều này đã giúp chúng tôi nhanh chóng chẩn đoán các sự cố lẽ ra đã không được phát hiện và cấu hình các rào cản để ứng phó.”
Tác động kinh doanh đã chứng tỏ là rất đáng kể. Agentforce đã giải quyết hơn 1.000 tương tác của khách hàng trong 24 giờ đầu tiên tại 1-800Accountant. Công ty hiện dự kiến có thể hỗ trợ tăng trưởng khách hàng 40% trong năm nay mà không cần tuyển dụng và đào tạo nhân viên thời vụ, đồng thời giải phóng thêm 50% thời gian cho các kế toán viên công chứng (CPA) để tập trung vào công việc tư vấn phức tạp thay vì các nhiệm vụ hành chính.
Reddit đã chứng kiến những kết quả tương tự kể từ khi triển khai công nghệ này. John Thompson, Phó Chủ tịch Chiến lược và Vận hành Bán hàng tại nền tảng mạng xã hội, cho biết công ty đã giảm thiểu 46% các trường hợp hỗ trợ kể từ khi ra mắt Agentforce cho hỗ trợ nhà quảng cáo. “Bằng cách quan sát mọi tương tác của Agentforce, chúng tôi có thể hiểu chính xác cách AI điều hướng các nhà quảng cáo thông qua ngay cả những công cụ phức tạp nhất,” Thompson nói. “Sự hiểu biết này giúp chúng tôi không chỉ hiểu liệu các vấn đề có được giải quyết hay không, mà còn cả cách các quyết định được đưa ra trong quá trình đó.”
Công nghệ truy vết phiên của Salesforce: Ghi lại mọi tương tác và bước lý luận của tác tử AI
Salesforce đã xây dựng hệ thống quan sát dựa trên hai thành phần nền tảng. Mô hình dữ liệu truy vết phiên ghi lại mọi tương tác – đầu vào của người dùng, phản hồi của tác tử, các bước lý luận, các lệnh gọi mô hình ngôn ngữ và kiểm tra rào cản – và lưu trữ chúng một cách an toàn trong Data 360, nền tảng dữ liệu của Salesforce. Điều này tạo ra cái mà công ty gọi là “khả năng hiển thị thống nhất” về hành vi của tác tử ở cấp độ phiên.
Thành phần thứ hai, MuleSoft Agent Fabric, giải quyết một vấn đề sẽ trở nên trầm trọng hơn khi các công ty xây dựng nhiều hệ thống AI hơn: sự lan tràn của tác tử. Công cụ này cung cấp cái mà Lerhaupt mô tả là “một cửa sổ duy nhất trên mọi tác tử,” bao gồm cả những tác tử được xây dựng bên ngoài hệ sinh thái Salesforce. Agent Visualizer của Agent Fabric tạo ra một bản đồ trực quan của toàn bộ mạng lưới tác tử của công ty, mang lại khả năng hiển thị trên tất cả các tương tác của tác tử từ một bảng điều khiển duy nhất.
Các công cụ quan sát được chia thành ba lĩnh vực chức năng. Phân tích tác tử theo dõi các chỉ số hiệu suất, hiển thị xu hướng KPI theo thời gian và làm nổi bật các chủ đề hoặc hành động không hiệu quả. Tối ưu hóa tác tử cung cấp khả năng hiển thị đầu cuối của mọi tương tác, nhóm các yêu cầu tương tự để khám phá các mẫu và xác định các vấn đề cấu hình. Giám sát sức khỏe tác tử, sẽ có sẵn vào mùa xuân năm 2026, theo dõi các chỉ số sức khỏe chính trong thời gian thực gần và gửi cảnh báo về các lỗi nghiêm trọng và các đợt tăng đột biến về độ trễ.
Pierre Matuchet, Phó Chủ tịch Cấp cao về IT và Chuyển đổi Kỹ thuật số tại Adecco, cho biết khả năng hiển thị đã giúp nhóm của ông xây dựng sự tin tưởng ngay cả trước khi triển khai đầy đủ. “Ngay cả trong các bài kiểm tra notebook ban đầu, chúng tôi đã thấy tác tử xử lý các tình huống bất ngờ, chẳng hạn như khi các ứng viên không muốn trả lời các câu hỏi đã có trong CV của họ, một cách phù hợp và theo thiết kế,” Matuchet nói. “Agentforce Observability đã giúp chúng tôi xác định hành vi người dùng không lường trước được và mang lại cho chúng tôi sự tự tin, ngay cả trước khi tác tử hoạt động, rằng nó có thể hành động có trách nhiệm và đáng tin cậy.”
Tại sao Salesforce cho rằng các công cụ quan sát AI của họ vượt trội hơn các giải pháp giám sát của Microsoft, Google và AWS
Thông báo này đặt Salesforce vào cuộc cạnh tranh trực tiếp với Microsoft, Google và Amazon Web Services, tất cả đều cung cấp các khả năng giám sát được tích hợp vào các nền tảng tác tử AI của họ. Lerhaupt lập luận rằng các doanh nghiệp cần nhiều hơn là các công cụ giám sát cơ bản mà các nhà cung cấp đó cung cấp.
“Observability được cung cấp sẵn theo tiêu chuẩn với Agentforce mà không phải trả thêm phí,” Lerhaupt nói, định vị sản phẩm là toàn diện chứ không phải bổ sung. Ông nhấn mạnh rằng các công cụ cung cấp “hiểu biết sâu sắc hơn bao giờ hết” bằng cách thu thập “toàn bộ dữ liệu và lý luận đằng sau mỗi tương tác tác tử” thông qua Mô hình dữ liệu truy vết phiên, sau đó sử dụng dữ liệu đó để “cung cấp phân tích chính và điểm chất lượng phiên để giúp khách hàng tối ưu hóa và cải thiện tác tử của họ.”
Vị thế cạnh tranh này rất quan trọng vì các doanh nghiệp phải đối mặt với một lựa chọn: xây dựng cơ sở hạ tầng AI của họ trên nền tảng của nhà cung cấp đám mây và sử dụng các công cụ giám sát gốc của nó, hoặc áp dụng một lớp quan sát chuyên biệt như của Salesforce. Lerhaupt mô tả quyết định này là sự cân bằng giữa chiều sâu và chiều rộng. “Các doanh nghiệp cần nhiều hơn là giám sát cơ bản để đo lường thành công của việc triển khai AI của họ,” ông nói. “Họ cần khả năng hiển thị đầy đủ vào mọi tương tác và quyết định của tác tử.”
Câu hỏi 1,2 tỷ quy trình làm việc: Các triển khai tác tử AI có đang chuyển từ dự án thử nghiệm sang sản xuất không?
Câu hỏi rộng hơn là liệu Salesforce có đang giải quyết một vấn đề mà hầu hết các doanh nghiệp sẽ đối mặt ngay lập tức hay đang xây dựng cho một tương lai còn nhiều năm nữa. Con số tăng trưởng 282% trong việc triển khai AI của công ty nghe có vẻ ấn tượng, nhưng con số đó không phân biệt giữa các triển khai sản xuất và các dự án thử nghiệm.
Khi được hỏi trực tiếp về điều này, Lerhaupt đã chỉ ra các ví dụ về khách hàng thay vì cung cấp một phân tích chi tiết. Ông mô tả một hành trình ba giai đoạn từ thử nghiệm đến quy mô. “Vào Ngày 0, sự tin cậy là nền tảng,” ông nói, trích dẫn việc 1-800Accountant giải quyết 70% tương tác trò chuyện một cách tự động. “Ngày 1 là nơi các ý tưởng thiết kế trở thành AI thực tế, có thể sử dụng được,” với Williams Sonoma cung cấp hơn 150.000 trải nghiệm AI hàng tháng. “Vào Ngày 2, sau khi sự tin cậy và thiết kế đã được xây dựng, đó là về việc mở rộng các thành công ban đầu thành các kết quả trên toàn doanh nghiệp,” ông chỉ ra Falabella’s với 600.000 quy trình làm việc AI mỗi tháng, đã tăng gấp bốn lần trong ba tháng.
Lerhaupt cho biết Salesforce có hơn 12.000 khách hàng tại 39 quốc gia đang sử dụng Agentforce, hỗ trợ 1,2 tỷ quy trình làm việc tác tử. Những con số đó cho thấy sự chuyển đổi từ thử nghiệm sang sản xuất đã và đang diễn ra ở quy mô lớn, mặc dù công ty không cung cấp phân tích chi tiết về số lượng khách hàng đang chạy khối lượng công việc sản xuất so với các triển khai thử nghiệm.
Kinh tế học của việc triển khai AI có thể thúc đẩy việc áp dụng bất kể sự sẵn sàng. Các công ty đang đối mặt với áp lực ngày càng tăng trong việc giảm chi phí nhân sự trong khi vẫn duy trì hoặc cải thiện mức độ dịch vụ. Các tác tử AI hứa hẹn sẽ giải quyết mâu thuẫn này, nhưng chỉ khi các doanh nghiệp có thể tin tưởng chúng hoạt động đáng tin cậy. Các công cụ quan sát như của Salesforce đại diện cho lớp tin cậy cho phép triển khai quy mô lớn.
Điều gì xảy ra sau khi triển khai tác tử AI: Tại sao giám sát liên tục quan trọng hơn thử nghiệm ban đầu
Câu chuyện sâu sắc hơn là về một sự thay đổi trong cách các doanh nghiệp suy nghĩ về việc triển khai AI. Thông báo chính thức đã nêu rõ điều này: “Vòng đời phát triển tác tử bắt đầu với ba bước cơ bản: xây dựng, thử nghiệm và triển khai. Mặc dù nhiều tổ chức đã vượt qua rào cản ban đầu là tạo ra các tác tử đầu tiên của họ, thách thức thực sự của doanh nghiệp bắt đầu ngay sau khi triển khai.”
Khung đó phản ánh sự hiểu biết trưởng thành hơn về AI trong môi trường sản xuất. Các triển khai AI ban đầu thường coi công nghệ này như một lần triển khai duy nhất – xây dựng nó, thử nghiệm nó, vận chuyển nó. Nhưng các tác tử AI hoạt động khác với phần mềm truyền thống. Chúng học, thích ứng và đưa ra quyết định dựa trên các mô hình xác suất thay vì mã xác định. Điều đó có nghĩa là hành vi của chúng có thể thay đổi theo thời gian, hoặc chúng có thể phát triển các chế độ lỗi bất ngờ chỉ xuất hiện trong các điều kiện thực tế.
“Xây dựng một tác tử chỉ là sự khởi đầu,” Lerhaupt nói. “Sau khi sự tin cậy được xây dựng để các tác tử bắt đầu xử lý công việc thực tế, các công ty có thể bắt đầu bằng cách nhìn thấy kết quả, nhưng có thể không hiểu ’lý do tại sao’ đằng sau chúng hoặc thấy các lĩnh vực cần tối ưu hóa. Khách hàng tương tác với các sản phẩm – bao gồm cả tác tử – theo những cách không mong đợi và để tối ưu hóa trải nghiệm khách hàng, sự minh bạch về hành vi và kết quả của tác tử là rất quan trọng.”
Teeples cũng đưa ra cùng một điểm một cách thẳng thắn hơn khi được hỏi về sự khác biệt nếu không có các công cụ quan sát. “Mức độ hiển thị này đã mang lại sự tin tưởng hoàn toàn để tiếp tục mở rộng việc triển khai tác tử của chúng tôi,” ông nói. Hàm ý rõ ràng: nếu không có khả năng hiển thị, việc triển khai sẽ chậm lại hoặc dừng lại. 1-800Accountant có kế hoạch mở rộng tích hợp Slack cho các quy trình làm việc nội bộ, triển khai Service Cloud Voice để giảm thiểu các trường hợp và sử dụng Tableau cho phân tích hội thoại – tất cả đều phụ thuộc vào sự tự tin mà khả năng quan sát mang lại.
Tại sao các vấn đề về sự tin cậy AI của doanh nghiệp trở thành rào cản lớn nhất đối với việc mở rộng quy mô tác tử tự động
Chủ đề lặp đi lặp lại trong các cuộc phỏng vấn với khách hàng là sự tin cậy, hay đúng hơn là sự thiếu tin cậy. Các tác tử AI hoạt động, đôi khi rất tốt, nhưng các giám đốc điều hành không đủ tin tưởng chúng để triển khai rộng rãi. Các công cụ quan sát nhằm mục đích biến các hệ thống hộp đen thành các hệ thống minh bạch, thay thế niềm tin bằng bằng chứng.
Điều này có ý nghĩa bởi vì sự tin cậy là điểm nghẽn hạn chế việc áp dụng AI, chứ không phải là khả năng công nghệ. Các mô hình đủ mạnh, cơ sở hạ tầng đủ trưởng thành và trường hợp kinh doanh đủ hấp dẫn. Điều còn thiếu là sự tự tin của ban lãnh đạo rằng các tác tử AI sẽ hoạt động một cách có thể dự đoán được và các vấn đề có thể được chẩn đoán và khắc phục nhanh chóng khi chúng phát sinh.
Salesforce đang đặt cược rằng các công cụ quan sát có thể loại bỏ điểm nghẽn đó. Công ty định vị Agentforce Observability không phải là một công cụ giám sát mà là một lớp quản lý – “giống như cách các nhà quản lý làm việc với nhân viên của họ để đảm bảo họ đang hướng tới các mục tiêu đúng đắn và tối ưu hóa hiệu suất,” Lerhaupt nói.
Phép loại suy này rất đáng chú ý. Nếu các tác tử AI đang trở thành nhân viên kỹ thuật số, chúng cần cùng loại giám sát, phản hồi và tối ưu hóa liên tục mà nhân viên con người nhận được. Sự khác biệt là các tác tử AI có thể được giám sát với độ chi tiết cao hơn nhiều so với bất kỳ nhân viên con người nào. Mọi quyết định, mọi bước lý luận, mọi điểm dữ liệu được tham khảo đều có thể được ghi lại, phân tích và chấm điểm.
Điều đó tạo ra cả cơ hội và nghĩa vụ. Cơ hội là cải tiến liên tục với tốc độ không thể đạt được với nhân viên con người. Nghĩa vụ là sử dụng dữ liệu đó để tối ưu hóa hiệu suất của tác tử, không chỉ thu thập nó. Việc các doanh nghiệp có thể xây dựng các quy trình tổ chức để biến dữ liệu quan sát thành cải tiến có hệ thống hay không vẫn là một câu hỏi mở.
Nhưng một điều đã ngày càng rõ ràng trong cuộc đua triển khai AI ở quy mô lớn: Các công ty có thể nhìn thấy những gì tác tử của họ đang làm sẽ di chuyển nhanh hơn những công ty đang bay mù. Trong kỷ nguyên mới nổi của AI tự động, khả năng quan sát không chỉ là một tính năng tốt đẹp. Đó là sự khác biệt giữa thử nghiệm thận trọng và triển khai tự tin – giữa việc coi AI như một canh bạc rủi ro và quản lý nó như một lực lượng lao động đáng tin cậy. Câu hỏi không còn là liệu các tác tử AI có thể hoạt động hay không. Câu hỏi là liệu các doanh nghiệp có thể nhìn đủ rõ để cho phép chúng hoạt động hay không.