Phát triển mô hình sử dụng máy tính
Anthropic giới thiệu 'sử dụng máy tính', một mô hình mới giúp hiểu và dự đoán cách AI tương tác và sử dụng tài nguyên máy tính.
- 7 min read
Phát triển mô hình sử dụng máy tính
Anthropic vừa công bố một bước tiến đột phá: Claude 3.5 Sonnet giờ đây có thể sử dụng máy tính. Điều này có nghĩa là Claude có thể điều khiển con trỏ chuột, nhấp vào các vị trí trên màn hình và nhập liệu bằng bàn phím ảo, mô phỏng cách con người tương tác với máy tính. Tính năng này hiện đang trong giai đoạn thử nghiệm công khai và hứa hẹn mở ra nhiều ứng dụng mới.
Tại sao khả năng sử dụng máy tính lại quan trọng?
Phần lớn công việc hiện đại diễn ra trên máy tính. Việc cho phép AI tương tác trực tiếp với phần mềm máy tính giống như con người sẽ mở ra vô số khả năng ứng dụng mà các trợ lý AI hiện tại chưa thể thực hiện được. Đây là một cột mốc quan trọng tiếp theo sau khả năng suy luận phức tạp và hiểu hình ảnh của AI.
Quy trình nghiên cứu
Công việc trước đây về sử dụng công cụ và đa phương thức đã tạo nền tảng cho khả năng sử dụng máy tính mới này. Để hoạt động trên máy tính, AI cần có khả năng nhìn và diễn giải hình ảnh (trong trường hợp này là ảnh chụp màn hình máy tính), đồng thời suy luận về cách thức và thời điểm thực hiện các thao tác cụ thể.
Khi nhận được yêu cầu từ nhà phát triển, Claude sẽ xem ảnh chụp màn hình, tính toán số pixel cần di chuyển con trỏ chuột để nhấp vào đúng vị trí. Việc đào tạo Claude đếm pixel chính xác là rất quan trọng, tương tự như cách các mô hình AI đôi khi gặp khó khăn với các câu hỏi tưởng chừng đơn giản.
Điều đáng ngạc nhiên là Claude đã nhanh chóng khái quát hóa từ việc được đào tạo sử dụng một vài phần mềm đơn giản như máy tính bỏ túi và trình soạn thảo văn bản (do các lý do an toàn, Claude không được phép truy cập internet trong quá trình đào tạo). Kết hợp với các kỹ năng khác, Claude có khả năng biến lệnh văn bản của người dùng thành chuỗi các bước logic và thực hiện hành động trên máy tính. Mô hình thậm chí còn tự sửa lỗi và thử lại các tác vụ khi gặp trở ngại.
Dù có những tiến bộ nhanh chóng sau bước đột phá ban đầu, quá trình phát triển đòi hỏi rất nhiều thử nghiệm và sai sót. Các nhà nghiên cứu đã ghi nhận rằng việc phát triển khả năng sử dụng máy tính gần giống với quy trình nghiên cứu AI lý tưởng mà họ từng hình dung khi mới bắt đầu sự nghiệp: liên tục lặp lại và quay lại bảng vẽ cho đến khi đạt được tiến bộ.
Hiện tại, Claude là mô hình tiên tiến nhất trong việc sử dụng máy tính theo cách giống con người. Trong một bài đánh giá do OSWorld tạo ra để kiểm tra khả năng sử dụng máy tính của các mô hình AI, Claude đạt 14.9%, thấp hơn nhiều so với kỹ năng của con người (thường là 70-75%), nhưng cao hơn đáng kể so với mô hình AI tốt thứ hai cùng loại (7.7%).
Đảm bảo an toàn khi sử dụng máy tính
Mọi tiến bộ trong AI đều đi kèm với những thách thức mới về an toàn. Khả năng sử dụng máy tính chủ yếu là hạ thấp rào cản để AI áp dụng các kỹ năng nhận thức hiện có, chứ không phải là tăng cường đáng kể các kỹ năng đó. Anthropic đã đánh giá rằng Claude 3.5 Sonnet, bao gồm cả kỹ năng sử dụng máy tính mới, vẫn thuộc Mức An toàn AI Cấp 2, không yêu cầu các biện pháp an toàn và bảo mật cao hơn mức hiện tại.
Tuy nhiên, khi các mô hình tương lai yêu cầu các biện pháp bảo vệ Cấp 3 hoặc 4 do tiềm ẩn rủi ro thảm khốc, khả năng sử dụng máy tính có thể làm trầm trọng thêm các rủi ro đó. Do đó, việc giới thiệu khả năng này ngay bây giờ, khi các mô hình vẫn chỉ cần các biện pháp bảo vệ Cấp 2, là một cách tiếp cận tốt để giải quyết các vấn đề an toàn trước khi rủi ro trở nên quá lớn.
Nhóm Trust & Safety của Anthropic đã tiến hành phân tích sâu rộng để xác định các lỗ hổng tiềm ẩn, bao gồm cả “prompt injection” (tiêm lệnh độc hại) – một loại tấn công mạng có thể khiến AI thực hiện các hành động không mong muốn. Vì Claude có thể diễn giải ảnh chụp màn hình từ các máy tính kết nối internet, nó có thể bị phơi nhiễm với nội dung chứa các cuộc tấn công prompt injection.
Những người sử dụng phiên bản Claude sử dụng máy tính trong bản beta công khai nên thực hiện các biện pháp phòng ngừa cần thiết để giảm thiểu rủi ro. Anthropic cũng cung cấp hướng dẫn chi tiết hơn trong tài liệu tham khảo của họ.
Ngoài ra, khả năng người dùng cố tình lạm dụng kỹ năng máy tính của Claude cũng là một mối quan ngại. Anthropic đã phát triển các bộ phân loại và phương pháp khác để phát hiện và giảm thiểu các hành vi lạm dụng này. Đặc biệt, trước các cuộc bầu cử sắp tới tại Hoa Kỳ, Anthropic đang tăng cường giám sát các yêu cầu liên quan đến bầu cử và các hệ thống để hướng Claude tránh các hoạt động như tạo và đăng nội dung trên mạng xã hội, đăng ký tên miền web hoặc tương tác với các trang web của chính phủ. Các biện pháp an toàn sẽ liên tục được đánh giá và điều chỉnh để cân bằng giữa khả năng của Claude và việc sử dụng có trách nhiệm.
Tương lai của việc sử dụng máy tính
Việc sử dụng máy tính đại diện cho một cách tiếp cận hoàn toàn mới trong phát triển AI. Trước đây, các nhà phát triển mô hình ngôn ngữ lớn (LLM) thường “làm cho công cụ phù hợp với mô hình”, tạo ra các môi trường tùy chỉnh. Giờ đây, họ có thể “làm cho mô hình phù hợp với công cụ”, cho phép Claude hoạt động trong các môi trường máy tính hàng ngày. Mục tiêu là để Claude có thể sử dụng các phần mềm máy tính sẵn có như cách con người vẫn làm.
Tuy nhiên, vẫn còn nhiều việc phải làm. Mặc dù là công nghệ tiên tiến, khả năng sử dụng máy tính của Claude vẫn còn chậm và đôi khi mắc lỗi. Nhiều hành động mà con người thường làm với máy tính (như kéo, phóng to) vẫn nằm ngoài khả năng của Claude. Cách Claude “xem” màn hình bằng cách chụp ảnh màn hình và ghép nối chúng thay vì xem luồng video chi tiết hơn có thể khiến nó bỏ lỡ các hành động hoặc thông báo diễn ra trong thời gian ngắn.
Ngay cả trong quá trình ghi lại các bản demo cho lần ra mắt này, đã có những lỗi thú vị. Trong một trường hợp, Claude đã vô tình nhấp để dừng một bản ghi màn hình dài, làm mất toàn bộ cảnh quay. Trong một trường hợp khác, Claude đột nhiên tạm dừng demo lập trình và bắt đầu xem ảnh về Công viên Quốc gia Yellowstone.
Anthropic dự đoán rằng khả năng sử dụng máy tính sẽ nhanh chóng cải thiện, trở nên nhanh hơn, đáng tin cậy hơn và hữu ích hơn cho các tác vụ mà người dùng mong muốn. Việc triển khai cũng sẽ dễ dàng hơn cho những người ít kinh nghiệm phát triển phần mềm. Các nhà nghiên cứu của Anthropic sẽ hợp tác chặt chẽ với đội ngũ an toàn để đảm bảo các khả năng mới của Claude luôn đi kèm với các biện pháp an toàn phù hợp.
Anthropic khuyến khích các nhà phát triển thử nghiệm khả năng sử dụng máy tính trong bản beta công khai và gửi phản hồi của họ thông qua một biểu mẫu cụ thể để các nhà nghiên cứu có thể tiếp tục cải thiện tính hữu ích và an toàn của tính năng mới này.
Link bài viết gốc
- Tags:
- Ai
- Oct 22, 2024
- Www.anthropic.com