Chỉ số kinh tế Anthropic Tác động của AI đối với phát triển phần mềm
Chỉ số kinh tế Anthropic Tác động của AI đối với phát triển phần mềm
- 16 min read
Chỉ số Kinh tế Anthropic: Tác động của AI lên Phát triển Phần mềm
28 tháng 4, 2025
Công việc liên quan đến lập trình máy tính là một lĩnh vực nhỏ nhưng có ảnh hưởng trong nền kinh tế hiện đại. Vài năm qua, lĩnh vực này đã thay đổi đáng kể nhờ sự ra đời của các hệ thống AI có thể hỗ trợ và tự động hóa một lượng lớn công việc viết mã.
Trong nghiên cứu Chỉ số Kinh tế trước đây, chúng tôi nhận thấy việc sử dụng Claude không cân xứng bởi những người làm việc liên quan đến máy tính ở Mỹ: số lượng cuộc trò chuyện với Claude về các tác vụ liên quan đến máy tính nhiều hơn đáng kể so với dự đoán dựa trên số lượng người làm công việc liên quan. Tương tự trong bối cảnh giáo dục: sinh viên ngành Khoa học Máy tính - ngành học liên quan nhiều đến việc viết mã - cho thấy việc sử dụng AI không cân xứng.
Để hiểu rõ hơn về những thay đổi này, chúng tôi đã tiến hành phân tích 500.000 tương tác liên quan đến viết mã trên Claude.ai (cách “mặc định” mà hầu hết mọi người tương tác với Claude) và Claude Code (“agent” viết mã chuyên biệt mới của chúng tôi, có thể tự thực hiện chuỗi các tác vụ phức tạp bằng nhiều công cụ kỹ thuật số).
Chúng tôi đã tìm thấy ba mô hình chính:
- Agent viết mã được sử dụng để tự động hóa nhiều hơn. 79% cuộc trò chuyện trên Claude Code được xác định là “tự động hóa” (AI trực tiếp thực hiện tác vụ) thay vì “tăng cường” (AI cộng tác và nâng cao khả năng của con người) (21%). Ngược lại, chỉ 49% cuộc trò chuyện trên Claude.ai được phân loại là tự động hóa. Điều này có thể ngụ ý rằng khi các agent AI trở nên phổ biến hơn và khi có nhiều sản phẩm AI dạng agent được xây dựng, chúng ta nên kỳ vọng nhiều hơn vào việc tự động hóa các tác vụ.
- Người viết mã thường sử dụng AI để xây dựng các ứng dụng hướng đến người dùng. Các ngôn ngữ phát triển web như JavaScript và HTML là những ngôn ngữ lập trình phổ biến nhất được sử dụng trong tập dữ liệu của chúng tôi, đồng thời giao diện người dùng và các tác vụ trải nghiệm người dùng nằm trong số các mục đích sử dụng mã hàng đầu. Điều này cho thấy rằng công việc tập trung vào tạo các ứng dụng đơn giản và giao diện người dùng có thể phải đối mặt với sự gián đoạn từ các hệ thống AI sớm hơn so với công việc tập trung hoàn toàn vào phần backend.
- Các startup là những người tiên phong áp dụng Claude Code, trong khi các doanh nghiệp tụt lại phía sau. Trong một phân tích sơ bộ, chúng tôi ước tính rằng 33% cuộc trò chuyện trên Claude Code phục vụ công việc liên quan đến startup, so với chỉ 13% được xác định là các ứng dụng liên quan đến doanh nghiệp. Khoảng cách áp dụng cho thấy sự chia rẽ giữa các tổ chức nhanh nhẹn sử dụng các công cụ AI tiên tiến và các doanh nghiệp truyền thống.
Cách chúng tôi phân tích các cuộc trò chuyện trên Claude Code và Claude.ai
Chúng tôi đã phân tích tổng cộng 500.000 tương tác Claude (chia đều giữa Claude Code và Claude.ai) bằng công cụ phân tích bảo vệ quyền riêng tư của chúng tôi, công cụ này chắt lọc các cuộc trò chuyện của người dùng thành thông tin chi tiết ẩn danh, cấp cao hơn. Ở đây, chúng tôi đã sử dụng nó để xác định chủ đề của cuộc trò chuyện (ví dụ: “phát triển thành phần UI/UX”) hoặc - như chúng tôi sẽ giải thích bên dưới - để phân loại cuộc trò chuyện là tập trung vào “tăng cường” so với “tự động hóa”.
Các nhà phát triển tương tác với Claude như thế nào?
Trong các báo cáo Chỉ số Kinh tế trước đây của chúng tôi, chúng tôi đã tách biệt “tự động hóa” (AI trực tiếp thực hiện tác vụ) khỏi “tăng cường” (AI cộng tác với người dùng để thực hiện tác vụ). Ở đây, chúng tôi nhận thấy Claude Code cho thấy tỷ lệ tự động hóa cao hơn đáng kể — 79% cuộc trò chuyện liên quan đến một số hình thức tự động hóa, so với 49% trên Claude.ai.
Chúng tôi cũng chia tự động hóa và tăng cường thành một số loại phụ (như đã thảo luận trong công trình trước đây của chúng tôi). Các mẫu “Vòng lặp phản hồi”, trong đó Claude hoàn thành các tác vụ một cách tự động nhưng có sự trợ giúp của xác thực từ con người (ví dụ: người dùng gửi bất kỳ lỗi nào trở lại cho Claude), phổ biến gần gấp đôi trên Claude Code (35,8% tương tác) so với Claude.ai (21,3%). Các cuộc trò chuyện “Chỉ thị”, trong đó Claude hoàn thành một tác vụ với sự tương tác tối thiểu của người dùng, cũng cao hơn trên Claude Code (43,8%, so với 27,5% trên Claude.ai). Tất cả các mẫu tăng cường - bao gồm cả “Học tập”, trong đó người dùng thu thập kiến thức từ mô hình AI - đều thấp hơn đáng kể trên Claude Code so với trên Claude.ai.
Những kết quả này minh họa sự khác biệt giữa các agent chuyên biệt, tập trung vào viết mã (trong trường hợp này là Claude Code) và cách “tiêu chuẩn” hơn mà người dùng tương tác với các mô hình ngôn ngữ lớn (tức là thông qua giao diện chatbot như Claude.ai). Khi có nhiều sản phẩm dạng agent được phát hành, chúng ta có thể thấy sự khác biệt trong cách AI được tích hợp vào công việc của mọi người. Ít nhất trong trường hợp viết mã, điều này có thể liên quan đến việc tự động hóa nhiều hơn các tác vụ.
Điều này đặt ra câu hỏi về mức độ mà các nhà phát triển vẫn sẽ tham gia khi việc sử dụng AI trở nên phổ biến hơn. Điều quan trọng là kết quả của chúng tôi cho thấy rằng ngay cả trong tự động hóa, con người vẫn rất thường xuyên tham gia: các tương tác “Vòng lặp phản hồi” vẫn yêu cầu đầu vào của người dùng (ngay cả khi đầu vào đó chỉ đơn giản là dán tin nhắn lỗi trở lại Claude). Nhưng hoàn toàn không chắc chắn rằng mô hình này sẽ tồn tại trong tương lai, khi các hệ thống dạng agent có khả năng hơn có khả năng sẽ yêu cầu ít đầu vào của người dùng hơn.
Các nhà phát triển đang xây dựng gì với Claude?
Nhìn chung, chúng tôi nhận thấy rằng các nhà phát triển thường sử dụng Claude để xây dựng giao diện người dùng và các yếu tố tương tác cho các trang web và ứng dụng di động. Mặc dù không có ngôn ngữ đơn lẻ nào chiếm ưu thế, nhưng các ngôn ngữ phát triển tập trung chủ yếu vào web là JavaScript và TypeScript cùng nhau chiếm 31% tổng số truy vấn, còn HTML và CSS (các ngôn ngữ khác cho mã hướng đến người dùng) cùng nhau thêm 28% khác.
Các ngôn ngữ phát triển backend (được sử dụng cho logic, cơ sở dữ liệu và cơ sở hạ tầng “hậu trường”, cũng như phát triển API và AI) cũng được thể hiện: đáng chú ý, Python chiếm 14% truy vấn. Tuy nhiên, Python phục vụ mục đích kép - cả cho phát triển backend và phân tích dữ liệu. Kết hợp với SQL (một ngôn ngữ tập trung vào dữ liệu khác, chiếm 6% truy vấn), các ngôn ngữ này có khả năng bao gồm nhiều ứng dụng khoa học dữ liệu và phân tích hơn là phát triển backend truyền thống.
Các mô hình này còn mở rộng hơn nữa sang các loại tác vụ viết mã phổ biến liên quan đến Claude. Hai trong số năm tác vụ hàng đầu tập trung vào phát triển ứng dụng hướng đến người dùng: “Phát triển thành phần UI/UX” và “Phát triển ứng dụng web và di động” lần lượt chiếm 12% và 8% cuộc trò chuyện. Các tác vụ như vậy ngày càng phù hợp với một hiện tượng được gọi là “viết mã theo cảm hứng” - trong đó các nhà phát triển ở các cấp độ kinh nghiệm khác nhau mô tả các kết quả mong muốn của họ bằng ngôn ngữ tự nhiên và để AI đảm nhận các chi tiết triển khai.
Các cuộc trò chuyện liên quan đến các mục đích sử dụng chung chung hơn, chẳng hạn như “Kiến trúc phần mềm & Thiết kế mã” và “Gỡ lỗi và tối ưu hóa hiệu suất” cũng được thể hiện cao trong cả Claude.ai và Claude Code.
Theo suy đoán, những phát hiện này cho thấy rằng các công việc tập trung vào việc tạo các ứng dụng đơn giản và giao diện người dùng có thể phải đối mặt với sự gián đoạn sớm hơn từ các hệ thống AI nếu khả năng ngày càng tăng khiến “viết mã theo cảm hứng” chuyển nhiều hơn vào quy trình làm việc chính thống. Khi AI ngày càng xử lý việc tạo thành phần và các tác vụ tạo kiểu, các nhà phát triển này có thể chuyển sang công việc thiết kế và trải nghiệm người dùng cấp cao hơn.
Ai đang sử dụng Claude để viết mã?
Chúng tôi cũng phân tích những nhóm nhà phát triển nào có thể đang sử dụng Claude. Chúng tôi đã sử dụng hệ thống phân tích của mình để xác định loại dự án (ví dụ: dự án cá nhân so với dự án được thực hiện cho một startup) mô tả tốt nhất các tương tác liên quan đến viết mã của người dùng. Vì chúng tôi không biết bối cảnh thực tế mà các phản hồi của Claude đang được sử dụng, nên các phân tích này dựa vào các suy luận không chắc chắn từ dữ liệu không đầy đủ. Do đó, chúng tôi coi những phát hiện này là sơ bộ hơn so với những phát hiện được mô tả ở trên.
Các startup dường như là những người tiên phong chính trong việc áp dụng Claude Code và việc áp dụng doanh nghiệp tụt lại phía sau. Công việc của startup chiếm 32,9% cuộc trò chuyện trên Claude Code (gần hơn 20% so với mức sử dụng Claude.ai của họ), trong khi công việc doanh nghiệp chỉ chiếm 23,8% cuộc trò chuyện trên Claude Code (thấp hơn một chút so với 25,9% trên Claude.ai).
Ngoài ra, việc sử dụng liên quan đến sinh viên, học giả, người xây dựng dự án cá nhân và người dùng hướng dẫn/học tập cùng nhau chiếm một nửa số tương tác trên cả hai nền tảng. Nói cách khác, các cá nhân - không chỉ các doanh nghiệp - là những người áp dụng đáng kể các công cụ hỗ trợ viết mã.
Các mô hình áp dụng này phản ánh những thay đổi công nghệ trong quá khứ, khi các startup sử dụng các công cụ mới để có lợi thế cạnh tranh trong khi các tổ chức đã thành lập di chuyển thận trọng hơn và thường có các kiểm tra bảo mật chi tiết tại chỗ trước khi áp dụng các công cụ mới trên toàn công ty. Bản chất mục đích chung của AI có thể đẩy nhanh động lực này: Nếu các agent AI cung cấp những lợi ích đáng kể về năng suất, thì khoảng cách giữa những người áp dụng sớm và muộn có thể chuyển thành lợi thế cạnh tranh đáng kể.
Hạn chế
Phân tích của chúng tôi dựa trên việc sử dụng AI trong thế giới thực - cách các nhà phát triển thực sự đang sử dụng Claude trong quy trình làm việc của họ. Mặc dù cách tiếp cận này mang lại sự liên quan thực tế cho những phát hiện của chúng tôi, nhưng nó cũng mang lại những hạn chế vốn có. Chúng bao gồm:
- Chúng tôi chỉ phân tích dữ liệu từ Claude.ai và Claude Code. Chúng tôi đã loại trừ Team, Enterprise và API sử dụng có thể hiển thị các mô hình khác nhau, đặc biệt là trong môi trường chuyên nghiệp;
- Ranh giới giữa tự động hóa và tăng cường ngày càng mờ đi với các công cụ dạng agent như Claude Code. Ví dụ: mẫu “Vòng lặp phản hồi” khác về chất so với tự động hóa truyền thống, vì nó vẫn yêu cầu sự giám sát và đầu vào của người dùng. Chúng ta có thể cần mở rộng khuôn khổ tự động hóa/tăng cường để tính đến các khả năng dạng agent mới;
- Việc phân loại ai đang sử dụng Claude để viết mã của chúng tôi dựa trên suy luận từ bối cảnh hạn chế. Khi phân loại các cuộc trò chuyện là công việc “startup” so với “doanh nghiệp” hoặc dự án “cá nhân” so với “học thuật”, công cụ phân tích của chúng tôi đã đưa ra các phỏng đoán có căn cứ dựa trên thông tin không đầy đủ. Do đó, một số phân loại có thể không chính xác. Ngoài ra, chúng tôi đã bao gồm một tùy chọn cho ‘Không thể phân loại’, mà Claude đã chọn trong 5% cuộc trò chuyện trên Claude.ai và 2% cuộc trò chuyện trên Claude Code. Chúng tôi đã loại trừ danh mục này khỏi phân tích và chuẩn hóa lại kết quả;
- Tập dữ liệu của chúng tôi có khả năng ghi lại những người áp dụng sớm. Những người dùng này có thể không đại diện cho quần thể nhà phát triển rộng hơn và việc tự lựa chọn này có thể làm sai lệch các mô hình sử dụng hướng tới những người dùng có kinh nghiệm hơn hoặc phiêu lưu về mặt kỹ thuật;
- Do các cân nhắc về quyền riêng tư, chúng tôi chỉ phân tích dữ liệu trong một cửa sổ lưu giữ cụ thể, có khả năng bỏ lỡ các mô hình tuần hoàn trong phát triển phần mềm (chẳng hạn như chu kỳ sprint hoặc lịch phát hành);
- Tính đại diện của việc sử dụng Claude là không rõ ràng, so với việc áp dụng hỗ trợ viết mã AI nói chung. Nhiều nhà phát triển sử dụng nhiều công cụ AI ngoài Claude, có nghĩa là chúng tôi chỉ trình bày một phần cái nhìn về các mô hình tham gia AI của họ;
- Chúng tôi chỉ nghiên cứu những gì các nhà phát triển ủy thác cho AI - không phải cách họ cuối cùng sử dụng đầu ra AI trong cơ sở mã của họ, chất lượng của mã kết quả hoặc liệu những tương tác này có cải thiện hiệu quả năng suất hoặc chất lượng mã hay không.
Nhìn về phía trước
AI đang thay đổi cơ bản cách các nhà phát triển làm việc. Phân tích của chúng tôi ngụ ý rằng điều này đặc biệt đúng khi các hệ thống dạng agent chuyên biệt như Claude Code được sử dụng, đặc biệt mạnh mẽ đối với công việc phát triển ứng dụng hướng đến người dùng và có thể mang lại lợi thế đặc biệt cho các startup so với các doanh nghiệp đã thành lập hơn.
Những phát hiện của chúng tôi đặt ra nhiều câu hỏi. Liệu sự phổ biến của “vòng lặp phản hồi”, trong đó con người vẫn tham gia vào quá trình này, sẽ tồn tại khi khả năng AI tiến bộ, hay chúng ta sẽ thấy sự thay đổi hướng tới tự động hóa hoàn toàn hơn? Khi các hệ thống AI có khả năng xây dựng các phần mềm quy mô lớn hơn, liệu các nhà phát triển sẽ chuyển sang chủ yếu quản lý và hướng dẫn các hệ thống này, thay vì tự viết mã? Những vai trò phát triển phần mềm nào sẽ thay đổi nhiều nhất và những vai trò nào có thể biến mất hoàn toàn?
Kỹ năng viết mã ngày càng tăng của AI cũng có thể đặc biệt quan trọng đối với chính sự phát triển của AI. Vì rất nhiều nghiên cứu và phát triển AI dựa trên phần mềm, nên có thể những tiến bộ trong viết mã được hỗ trợ bởi AI giúp đẩy nhanh các đột phá, tạo ra một chu kỳ củng cố tích cực giúp đẩy nhanh sự tiến bộ của AI hơn nữa.
Trong bối cảnh rộng lớn hơn, các hệ thống AI là cực kỳ mới. Nhưng theo nghĩa tương đối, viết mã là một trong những cách sử dụng AI được phát triển nhất trong nền kinh tế. Điều đó làm cho nó đáng xem. Mặc dù chúng tôi không thể cho rằng những bài học chúng tôi rút ra từ phát triển phần mềm sẽ trực tiếp chuyển sang các loại công việc khác, nhưng phát triển phần mềm có thể là một chỉ báo hàng đầu cung cấp cho chúng tôi thông tin hữu ích về cách các công việc khác có thể thay đổi với việc triển khai các mô hình AI ngày càng có khả năng trong tương lai.
Làm việc với chúng tôi
Nếu bạn quan tâm đến việc làm việc tại Anthropic để nghiên cứu các tác động của AI lên thị trường lao động, chúng tôi khuyến khích bạn đăng ký các vai trò Nhà kinh tế và Nhà khoa học dữ liệu (Chính sách) của chúng tôi.
Phụ lục
Như một phân tích bổ sung, chúng tôi cũng so sánh kết quả của mình cho các mô hình tự động hóa và tăng cường liên quan đến phần mềm với các mô hình trong các tương tác không liên quan đến phần mềm. Chúng tôi đã tiến hành phân tích này độc quyền trên Claude.ai, vì Claude Code chuyên về các ứng dụng phần mềm.
So với các trường hợp sử dụng không liên quan đến phần mềm, phát triển phần mềm mang tính tự động hơn. Sự gia tăng đáng kể về Vòng lặp phản hồi (+18,3%) thúc đẩy điều này và, đáng chú ý, bù đắp sự giảm rõ ràng trong các hành vi Chỉ thị (-11,2%). Nói cách khác, viết mã được hỗ trợ bởi AI hiện yêu cầu rất nhiều đánh giá và lặp lại của con người so với các tác vụ không viết mã, ngay cả khi Claude thực hiện phần lớn công việc.
Link bài viết gốc
- Tags:
- Ai
- 28 April 2025
- Www.anthropic.com