Cùng nhau xây dựng hệ sinh thái Open Agent- Giới thiệu OpenEnv

Cùng nhau xây dựng hệ sinh thái Open Agent- Giới thiệu OpenEnv

  • 6 min read
Cùng nhau xây dựng hệ sinh thái Open Agent- Giới thiệu OpenEnv
Cùng nhau xây dựng hệ sinh thái Open Agent- Giới thiệu OpenEnv

Cùng nhau xây dựng Hệ sinh thái Agent mở: Giới thiệu OpenEnv

Với các công cụ như TRL, TorchForgeverl, cộng đồng mã nguồn mở đã cho thấy cách mở rộng quy mô AI trên cơ sở hạ tầng tính toán phức tạp. Nhưng tính toán chỉ là một mặt của vấn đề. Mặt còn lại là cộng đồng nhà phát triển; những người và công cụ làm cho các hệ thống agentic trở nên khả thi. Đó là lý do tại sao Meta và Hugging Face hợp tác để ra mắt OpenEnv Hub: một trung tâm cộng đồng chia sẻ và mở cho các môi trường agentic.

Môi trường Agentic xác định mọi thứ mà một agent cần để thực hiện một tác vụ: các công cụ, API, thông tin xác thực, ngữ cảnh thực thi và không có gì khác. Chúng mang lại sự rõ ràng, an toàn và khả năng kiểm soát trong môi trường sandbox cho hành vi của agent.

Các môi trường này có thể được sử dụng cho cả đào tạo và triển khai, đồng thời đóng vai trò là nền tảng cho sự phát triển agentic có thể mở rộng.

Vấn đề

Các agent AI hiện đại có thể hoạt động tự chủ trên hàng nghìn tác vụ. Tuy nhiên, một mô hình ngôn ngữ lớn là không đủ để các tác vụ đó thực sự chạy — nó cần quyền truy cập vào các công cụ phù hợp. Việc hiển thị hàng triệu công cụ trực tiếp cho một mô hình là không hợp lý (hoặc an toàn). Thay vào đó, chúng ta cần môi trường agentic: các sandbox an toàn, rõ ràng về mặt ngữ nghĩa, xác định chính xác những gì cần thiết cho một tác vụ và không hơn không kém. Các môi trường này xử lý các chi tiết quan trọng:

  • Ngữ nghĩa rõ ràng về những gì một nhiệm vụ cần
  • Đảm bảo an toàn và thực thi trong sandbox
  • Truy cập liền mạch vào các công cụ và API được xác thực

Giải pháp

Để tăng cường làn sóng phát triển agentic tiếp theo này, Meta-PyTorch và Hugging Face đang hợp tác để ra mắt Hub cho Môi trường: một không gian chung nơi các nhà phát triển có thể xây dựng, chia sẻ và khám phá các môi trường tương thích với OpenEnv cho cả đào tạo và triển khai. Hình dưới đây cho thấy cách OpenEnv phù hợp với ngăn xếp sau đào tạo mới đang được phát triển bởi Meta, với tích hợp cho các thư viện khác như TRL, SkyRLUnsloth đang được tiến hành:

Bắt đầu từ tuần tới, các nhà phát triển có thể:

  • Truy cập Environment Hub mới trên Hugging Face, nơi chúng tôi sẽ cung cấp một số môi trường ban đầu
  • Tương tác trực tiếp với môi trường như một Human Agent
  • Nhờ một mô hình giải quyết các nhiệm vụ trong môi trường
  • Kiểm tra những công cụ mà môi trường cung cấp và cách nó xác định các quan sát của mình
  • Mọi môi trường được tải lên Hub tuân theo đặc tả OpenEnv đều tự động có được chức năng này — giúp bạn nhanh chóng và dễ dàng xác thực và lặp lại trước khi chạy đào tạo RL đầy đủ.

Cùng với đó, chúng tôi đang phát hành Đặc tả OpenEnv 0.1 (RFC) để thu thập phản hồi từ cộng đồng và giúp định hình tiêu chuẩn.

Các RFC

Trong trạng thái hiện tại của kho lưu trữ, người tạo môi trường có thể tạo môi trường bằng cách sử dụng các API step(), reset(), close() (một phần của RFC bên dưới). Một vài ví dụ về cách tạo các môi trường như vậy có thể được tìm thấy tại đây. Người dùng môi trường có thể chơi với các môi trường dựa trên Docker cục bộ cho tất cả các môi trường đã có sẵn trong kho lưu trữ. Các RFC sau đang được xem xét:

  • RFC 001: Thiết lập kiến trúc cho cách các thành phần cốt lõi như Môi trường, Agent, Tác vụ, v.v. có liên quan
  • RFC 002: Đề xuất giao diện env cơ bản, đóng gói, cách ly và giao tiếp với môi trường.
  • RFC 003: Đề xuất đóng gói các công cụ MCP thông qua trừu tượng hóa môi trường và ranh giới cách ly
  • RFC 004: Mở rộng hỗ trợ công cụ để bao gồm lược đồ hành động thống nhất bao gồm các agent gọi công cụ cũng như mô hình CodeAct.

Các trường hợp sử dụng

  • Đào tạo lại RL: kéo vào môi trường trên các bộ sưu tập và sử dụng chúng để đào tạo agent RL với TRL, TorchForge+Monarch, VeRL, v.v.
  • Tạo môi trường: xây dựng một môi trường và đảm bảo nó tương tác với các công cụ RL phổ biến trong hệ sinh thái, chia sẻ với cộng tác viên, v.v.
  • Tái tạo các phương pháp SOTA: dễ dàng sao chép các phương pháp như từ Code World Model của FAIR bằng cách tích hợp các môi trường để mã hóa agentic và kỹ thuật phần mềm.
  • Triển khai: người dùng có thể tạo một môi trường, đào tạo trên cùng một môi trường và sau đó sử dụng cùng một môi trường để suy luận (toàn bộ quy trình)

Tiếp theo là gì

Đây chỉ là sự khởi đầu. Chúng tôi đang tích hợp OpenEnv Hub với thư viện TorchForge RL mới của Meta và cộng tác với các dự án RL mã nguồn mở khác như verl, TRLSkyRL để mở rộng khả năng tương thích.

Hãy tham gia cùng chúng tôi tại Hội nghị PyTorch vào ngày 23 tháng 10 để xem bản demo trực tiếp và hướng dẫn về đặc tả, đồng thời theo dõi cuộc gặp gỡ cộng đồng sắp tới của chúng tôi về môi trường, đào tạo lại RL và phát triển agentic.

👉 Khám phá OpenEnv Hub trên Hugging Face và bắt đầu xây dựng các môi trường sẽ cung cấp năng lượng cho thế hệ agent tiếp theo.

👉 Xem đặc tả 0.1 có thể được tìm thấy được triển khai trong dự án OpenEnv → chúng tôi hoan nghênh các ý tưởng và đóng góp để làm cho nó tốt hơn!

👉 Tham gia trên Discord và nói chuyện với cộng đồng về RL, môi trường và phát triển agentic

👉 Hãy tự mình thử - Chúng tôi đã tạo một notebook toàn diện hướng dẫn bạn qua một ví dụ từ đầu đến cuối và tất nhiên bạn có thể dễ dàng pip cài đặt gói thông qua PyPI. Notebook này hướng dẫn bạn các trừu tượng mà chúng tôi đã xây dựng, cùng với một ví dụ về cách sử dụng các tích hợp hiện có và cách thêm các tích hợp của bạn - Hãy dùng thử trong Google Colab!

👉 Kiểm tra các nền tảng hỗ trợ - Unsloth, TRL, Lightning.AI

Hãy cùng nhau xây dựng tương lai của các agent mở, mỗi lần một môi trường 🔥!

Recommended for You

'AI đang xé nát các công ty'- CEO của Writer AI chỉ trích các nhà lãnh đạo Fortune 500 vì quản lý sai công nghệ

Vấn đề, theo Habib, không phải là công nghệ. Vấn đề là các nhà lãnh đạo doanh nghiệp đang mắc một sai lầm về phạm trù, coi việc chuyển đổi AI giống như việc triển khai công nghệ trước đây và giao nó cho các bộ phận CNTT. Cách tiếp cận này, bà cảnh báo, đã dẫn đến 'hàng tỷ đô la chi cho các sáng kiến AI mà không đi đến đâu'.

CTO của Sakana AI nói rằng ông 'hoàn toàn phát ốm' với các bộ chuyển đổi, công nghệ cung cấp năng lượng cho mọi mô hình AI lớn

Trong một hành động tự phê bình đáng chú ý, một trong những kiến trúc sư của công nghệ biến áp cung cấp năng lượng cho ChatGPT, Claude và hầu như mọi hệ thống AI lớn đã nói với khán giả gồm các nhà lãnh đạo ngành trong tuần này rằng nghiên cứu trí tuệ nhân tạo đã trở nên hẹp một cách nguy hiểm - và ông đang từ bỏ sáng tạo của riêng mình.