Báo cáo Chỉ số Kinh tế Anthropic- các nguyên tắc kinh tế cơ bản

Một báo cáo chuyên sâu từ Chỉ số Kinh tế Anthropic, tập trung vào các nguyên tắc kinh tế cơ bản, đưa ra một phân tích toàn diện về các yếu tố kinh tế ảnh hưởng đến việc áp dụng và phát triển AI.

  • 87 min read
Báo cáo Chỉ số Kinh tế Anthropic- các nguyên tắc kinh tế cơ bản
Một báo cáo chuyên sâu từ Chỉ số Kinh tế Anthropic, tập trung vào các nguyên tắc kinh tế cơ bản, đưa ra một phân tích toàn diện về các yếu tố kinh tế ảnh hưởng đến việc áp dụng và phát triển AI.

Báo cáo Chỉ số Kinh tế Anthropic: Các nguyên tắc cơ bản về kinh tế

Giới thiệu

Báo cáo này giới thiệu các chỉ số mới về việc sử dụng AI để cung cấp một bức tranh phong phú về các tương tác với Claude vào tháng 11 năm 2025, ngay trước khi phát hành Opus 4.5. Các “nguyên tắc cơ bản” này—các biện pháp đơn giản, nền tảng về cách Claude được sử dụng, mà chúng tôi tạo ra bằng cách hỏi Claude các câu hỏi cụ thể về các bản ghi Claude.ai ẩn danh và bản ghi API của bên thứ nhất (1P)—bao gồm năm khía cạnh liên quan đến tác động kinh tế của AI: kỹ năng của người dùng và AI, mức độ phức tạp của nhiệm vụ, mức độ tự chủ được cấp cho Claude, mức độ thành công của Claude và liệu Claude có được sử dụng cho mục đích cá nhân, giáo dục hay công việc hay không.

Kết quả cho thấy sự khác biệt rõ rệt về địa lý, ước tính thực tế về phạm vi nhiệm vụ của AI và cơ sở để đánh giá lại tác động kinh tế vĩ mô của Claude.

Dữ liệu chúng tôi công bố cùng với báo cáo này là toàn diện nhất cho đến nay, bao gồm năm khía cạnh mới về việc sử dụng AI, việc sử dụng của người tiêu dùng và doanh nghiệp, cũng như các phân tích theo quốc gia và khu vực cho Claude.ai.

Chương 1: Những thay đổi kể từ báo cáo trước

Tổng quan

Vì khả năng của các mô hình AI tiên tiến đang cải thiện nhanh chóng và việc áp dụng đã diễn ra nhanh chóng, điều quan trọng là phải thường xuyên xem xét những thay đổi trong cách mọi người và doanh nghiệp đang sử dụng các hệ thống như vậy—và những gì việc sử dụng này ngụ ý đối với nền kinh tế rộng lớn hơn.

Trong chương này, chúng tôi phân tích cách các mẫu sử dụng và phổ biến Claude đã thay đổi từ tháng 8 năm 2025 đến tháng 11 năm 2025 ngay trước khi phát hành Opus 4.5. Chúng tôi đưa ra bốn quan sát:

  1. Việc sử dụng vẫn tập trung cao vào các nhiệm vụ: Mười nhiệm vụ phổ biến nhất chiếm 24% việc sử dụng được quan sát trên Claude.ai, tăng từ 23% trong báo cáo trước của chúng tôi. Đối với khách hàng doanh nghiệp API (1P), sự tập trung vào nhiệm vụ đã tăng lên đáng kể: mười nhiệm vụ hàng đầu hiện chiếm 32% lưu lượng truy cập, tăng từ 28% trong báo cáo trước.
  2. Tăng cường hóa lại phổ biến hơn tự động hóa trên Claude.ai: Trong báo cáo trước, chúng tôi đã lưu ý rằng việc sử dụng tự động hóa đã tăng lên và vượt qua việc sử dụng tăng cường trên Claude.ai, có thể phản ánh cả khả năng cải thiện và sự quen thuộc ngày càng tăng của người dùng với LLM. Dữ liệu từ tháng 11 năm 2025 chỉ ra sự dịch chuyển trên diện rộng trở lại việc sử dụng tăng cường trên Claude.ai: Tỷ lệ các cuộc trò chuyện được phân loại là tăng cường đã tăng 5 điểm phần trăm lên 52% và tỷ lệ được coi là tự động hóa đã giảm 4 điểm phần trăm xuống 45%. Các thay đổi sản phẩm trong giai đoạn này—bao gồm cả khả năng tạo tệp, bộ nhớ bền vững và Kỹ năng để tùy chỉnh quy trình làm việc—có thể đã chuyển các mẫu sử dụng sang các tương tác hợp tác hơn, có sự tham gia của con người.
  3. Tại Hoa Kỳ, các tiểu bang có mức sử dụng thấp hơn có mức tăng trưởng áp dụng tương đối nhanh hơn: Tại Hoa Kỳ, việc sử dụng bình quân đầu người phần lớn vẫn bị ảnh hưởng bởi mức độ phù hợp của lực lượng lao động với việc sử dụng Claude rộng rãi: Ví dụ, các tiểu bang có tỷ lệ lớn hơn trong các ngành nghề máy tính và toán có xu hướng sử dụng Claude cao hơn. Thật vậy, năm tiểu bang hàng đầu chiếm gần một nửa (50%) tổng số lượt sử dụng mặc dù chỉ chiếm 38% dân số trong độ tuổi lao động. Tuy nhiên, có những dấu hiệu ban đầu về sự hội tụ khu vực nhanh chóng trong việc áp dụng: việc sử dụng đã tăng tương đối nhanh hơn đối với các tiểu bang có mức sử dụng thấp hơn trong báo cáo trước của chúng tôi. Nếu được duy trì, việc sử dụng bình quân đầu người sẽ được bình đẳng hóa trên toàn quốc trong vòng 2-5 năm, một tốc độ phổ biến nhanh hơn khoảng 10 lần so với sự lan rộng của các công nghệ có ảnh hưởng kinh tế trước đó trong thế kỷ 20. Mặc dù điều này phù hợp với việc áp dụng và phổ biến AI nhanh chóng, ước tính này đi kèm với sự không chắc chắn do nó dựa trên một sự thay đổi được quan sát trong khoảng thời gian ba tháng. Việc phổ biến cuối cùng có thể diễn ra chậm hơn trong những tháng và năm tới.
  4. Việc sử dụng toàn cầu cho thấy ít dấu hiệu tăng hoặc giảm sự hội tụ khu vực: Trên toàn cầu, việc sử dụng Claude bình quân đầu người—như được ghi nhận bởi Chỉ số sử dụng AI Anthropic (AUI)—vẫn còn không đồng đều và có mối tương quan mạnh mẽ với GDP. Những khoảng cách này là ổn định: chúng tôi không thấy bằng chứng nào cho thấy các quốc gia có mức sử dụng thấp đang bắt kịp hoặc các quốc gia có mức sử dụng cao đang vượt lên.

Sự thay đổi trong mô hình sử dụng theo nhiệm vụ và các ngành nghề liên quan

Mặc dù các LLM tiên tiến có một loạt các khả năng ấn tượng liên quan đến mọi khía cạnh của nền kinh tế hiện đại, việc sử dụng Claude vẫn rất tập trung vào một số nhiệm vụ nhất định. So với gần một năm trước, việc sử dụng của người tiêu dùng trên Claude.ai có phần tập trung hơn: Tỷ lệ các cuộc trò chuyện được phân công cho mười nhiệm vụ phổ biến nhất của O*NET là 24% vào tháng 11 năm 2025, cao hơn 1 điểm phần trăm so với tháng 8 và tăng từ 21% vào tháng 1 năm 2025. Nhiệm vụ phổ biến nhất vào tháng 11 năm 2025—sửa đổi phần mềm để khắc phục lỗi—chiếm 6% lượt sử dụng.

Trong Báo cáo Chỉ số Kinh tế Anthropic lần trước, chúng tôi bắt đầu theo dõi các mô hình kinh doanh bằng cách nghiên cứu việc sử dụng Claude trong số khách hàng API 1P. Mười nhiệm vụ phổ biến nhất đã tăng từ 28% hồ sơ API vào tháng 8 lên 32% vào tháng 11. Sự gia tăng tập trung vào một số ít nhiệm vụ cho thấy các ứng dụng có giá trị cao nhất tiếp tục tạo ra giá trị kinh tế vượt trội ngay cả khi các mô hình đã trở nên có khả năng hơn đối với một loạt nhiệm vụ rộng hơn. Giống như Claude.ai, nhiệm vụ phổ biến nhất trong số các khách hàng API là sửa đổi phần mềm để khắc phục lỗi, chiếm một phần mười hồ sơ.

Figure 1.1: Usage shares among top 10 tasks over time by platform, Claude.ai and 1P API. Hình 1.1: Tỷ lệ sử dụng trong số 10 nhiệm vụ hàng đầu theo thời gian theo nền tảng, Claude.ai và API 1P. Tỷ lệ cuộc trò chuyện được phân công cho mười nhiệm vụ O*NET phổ biến nhất, theo nền tảng và phiên bản báo cáo.

Thật vậy, các nhiệm vụ máy tính và toán—như sửa đổi phần mềm để khắc phục lỗi—tiếp tục chiếm ưu thế trong việc sử dụng Claude nói chung, chiếm một phần ba các cuộc trò chuyện trên Claude.ai và gần một nửa lưu lượng truy cập API 1P. Sự thống trị này đã giảm bớt trên Claude.ai: tỷ lệ các cuộc trò chuyện trên Claude.ai được phân công cho các nhiệm vụ (chủ yếu) liên quan đến mã hóa đã giảm từ mức cao nhất là 40% vào tháng 3 năm 2025 xuống còn 34% vào tháng 11 năm 2025. Đồng thời, tỷ lệ bản ghi được phân công cho các nhiệm vụ máy tính và toán trong lưu lượng truy cập API 1P đã tăng nhẹ từ 44% vào tháng 8 lên 46% vào tháng 11 năm 2025 (Hình 1.2).

Figure 1.2: Claude.ai and API usage over time. Hình 1.2: Sử dụng Claude.ai và API theo thời gian. Mỗi bảng hiển thị tỷ lệ các cuộc trò chuyện mẫu trên Claude.ai và hồ sơ API 1P liên quan đến các nhiệm vụ từ mỗi nhóm chính của Phân loại Nghề nghiệp Tiêu chuẩn (SOC).

Tỷ lệ sử dụng lớn thứ hai của Claude.ai vào tháng 11 năm 2025 nằm trong danh mục Giảng dạy và Thư viện. Điều này chủ yếu tương ứng với sự trợ giúp cho việc học tập và ôn tập, cũng như phát triển tài liệu giảng dạy. Việc sử dụng như vậy đã tăng đều đặn kể từ báo cáo đầu tiên của chúng tôi, tăng từ 9% các cuộc trò chuyện trên Claude.ai vào tháng 1 năm 2025 lên 15% vào tháng 11.

Tỷ lệ sử dụng trên Claude.ai cho các nhiệm vụ Nghệ thuật, Thiết kế, Giải trí, Thể thao và Truyền thông đã tăng từ tháng 8 đến tháng 11 năm 2025 khi Claude được sử dụng trong tỷ lệ các cuộc trò chuyện ngày càng tăng cho các nhiệm vụ viết, chủ yếu là biên tập và viết, tinh chỉnh các tác phẩm hư cấu. Sự gia tăng này về tần suất của các nhiệm vụ liên quan đến thiết kế và viết đã đảo ngược xu hướng giảm đều đặn trong các báo cáo trước đó. Đối với cả Claude.ai và khách hàng API, đã có sự sụt giảm về tỷ lệ các cuộc trò chuyện/bản ghi mà Claude được sử dụng cho các nhiệm vụ Khoa học Đời sống, Vật lý và Xã hội.

Có lẽ sự phát triển đáng chú ý nhất đối với khách hàng API là sự gia tăng tỷ lệ các bản ghi liên quan đến các nhiệm vụ Hỗ trợ Văn phòng và Hành chính, tăng 3 điểm phần trăm vào tháng 8 lên 13% vào tháng 11 năm 2025. Do việc sử dụng API chủ yếu là tự động hóa, điều này cho thấy các doanh nghiệp ngày càng sử dụng Claude để tự động hóa các quy trình làm việc văn phòng thông thường như quản lý email, xử lý tài liệu, quản lý quan hệ khách hàng và lập lịch.

Tăng cường hóa lại chiếm ưu thế trên Claude.ai

Cách AI ảnh hưởng đến nền kinh tế phụ thuộc không chỉ vào các nhiệm vụ mà Claude được sử dụng mà còn vào cách người dùng truy cập và tham gia vào các khả năng của mô hình cơ bản. Kể từ báo cáo đầu tiên của chúng tôi, chúng tôi đã phân loại các cuộc trò chuyện thành một trong năm loại tương tác, mà chúng tôi nhóm thành hai danh mục rộng hơn: tự động hóa và tăng cường hóa.

Hình 1.3 cho thấy cách sử dụng tự động hóa so với tăng cường đã phát triển theo thời gian kể từ lần đầu tiên chúng tôi bắt đầu thu thập dữ liệu này một năm trước. Vào tháng 1 năm 2025, việc sử dụng Claude tăng cường hóa đã chiếm ưu thế: 56% các cuộc trò chuyện được phân loại là tăng cường so với 41% tự động hóa. Vào tháng 8 năm 2025, nhiều cuộc trò chuyện hơn được phân loại là tự động hóa so với tăng cường.

Đây là một sự phát triển đáng chú ý vì nó cho thấy rằng những cải tiến nhanh chóng về khả năng mô hình và chức năng nền tảng trùng hợp với việc người dùng ngày càng ủy thác nhiệm vụ hoàn toàn cho Claude. Điều này đã được thể hiện rõ trong chế độ hợp tác “chỉ đạo”, được nhóm thêm là tự động hóa. Các cuộc trò chuyện chỉ đạo là những cuộc trò chuyện mà người dùng đưa ra nhiệm vụ cho Claude và nó hoàn thành với ít tương tác qua lại nhất. Từ tháng 1 năm 2025 đến tháng 8 năm 2025, tỷ lệ các cuộc trò chuyện chỉ đạo như vậy đã tăng từ 27% lên 39%.

Ba tháng sau, tỷ lệ các cuộc trò chuyện chỉ đạo đã giảm 7 điểm phần trăm xuống còn 32% vào tháng 11 năm 2025 khi việc tăng cường hóa lại trở nên phổ biến hơn trên Claude.ai so với tự động hóa. Tuy nhiên, tỷ lệ tự động hóa vẫn còn cao hơn so với gần một năm trước khi chúng tôi bắt đầu theo dõi biện pháp này, cho thấy rằng xu hướng cơ bản vẫn hướng tới tự động hóa nhiều hơn ngay cả khi mức tăng đột biến vào tháng 8 đã phóng đại tốc độ mà nó đang hình thành.

Mặc dù chúng tôi thấy một số bằng chứng về sự dịch chuyển sang sử dụng kỹ năng mềm với thiết kế, quản lý và giáo dục hiện tại cao hơn, sự dịch chuyển trở lại sử dụng tăng cường hóa là trên diện rộng vào tháng 11 (Hình 1.4). Sự gia tăng sử dụng tăng cường hóa chủ yếu được thúc đẩy bởi người dùng lặp lại với Claude để hoàn thành nhiệm vụ (“lặp lại nhiệm vụ”) thay vì yêu cầu Claude giải thích các khái niệm (“học hỏi”). Xem Hình 1.5 để biết các từ phổ biến liên quan đến ba chế độ tương tác phổ biến nhất trên các nhiệm vụ O*NET và các nhóm yêu cầu từ dưới lên.

Figure 1.3: Collaboration mode share over time by platform, Claude.ai and 1P API. Hình 1.3: Tỷ lệ chế độ hợp tác theo thời gian theo nền tảng, Claude.ai và API 1P. Tần suất chế độ hợp tác trên các Báo cáo Chỉ số Kinh tế Anthropic.

Figure 1.4: Directive, Task Iteration, and Learning collaboration shares by Standard Occupation Classification (SOC) major group. Hình 1.4: Tỷ lệ hợp tác Chỉ đạo, Lặp lại nhiệm vụ và Học hỏi theo nhóm chính của Phân loại Nghề nghiệp Tiêu chuẩn (SOC). Đối với mỗi nhóm SOC chính, chúng tôi tính tỷ lệ các cuộc trò chuyện trên Claude.ai liên quan đến Chỉ đạo, Lặp lại nhiệm vụ và Học hỏi từ các nhiệm vụ O*NET có ít nhất 100 quan sát trong mẫu của chúng tôi. Chúng tôi có trọng số các quan sát theo số lượng hồ sơ để xây dựng một mẫu đại diện.

Figure 1.5: Prominent words from among O*NET task titles and bottom-up request groupings by key collaboration type. Hình 1.5: Các từ nổi bật từ tiêu đề nhiệm vụ O*NET và các nhóm yêu cầu từ dưới lên theo loại hợp tác chính. Đám mây từ được xây dựng từ nhóm cao nhất trong số các nhiệm vụ O*NET và các nhóm yêu cầu từ dưới lên, được sắp xếp theo tỷ lệ hồ sơ được phân loại là Chỉ đạo, Lặp lại nhiệm vụ và Học hỏi từ các nhiệm vụ/yêu cầu có ít nhất 1.000 quan sát. Các tương tác chỉ đạo nhấn mạnh sản xuất (’tạo ra’, ‘phát triển’, ‘soạn thảo’); Lặp lại nhiệm vụ tập trung vào việc tinh chỉnh và lặp lại (‘chỉnh sửa’, ‘viết lại’, ‘sửa đổi’); Học hỏi tập trung vào giải thích và chuyển giao kiến thức (‘giúp đỡ’, ‘giải thích’, ‘cung cấp’). Các mẫu nhất quán trên cả hai phương pháp phân loại. Phân tích này không dựa trên các từ được sử dụng trong các bản ghi gốc mà dựa trên các nhóm được xây dựng bằng các phương pháp bảo toàn quyền riêng tư.

Sự tập trung khu vực dai dẳng

Trong báo cáo trước, chúng tôi đã giới thiệu Chỉ số sử dụng AI Anthropic (AUI), một thước đo về việc liệu Claude có được đại diện quá mức hay dưới mức tại một khu vực địa lý nhất định so với quy mô dân số trong độ tuổi lao động của nó hay không. AUI được định nghĩa là

$c$: Tỷ lệ Claude được sử dụng của Quốc gia $c$ chia cho tỷ lệ dân số trong độ tuổi lao động của Quốc gia $c$.

Một AUI trên 1 cho thấy một quốc gia sử dụng Claude với cường độ cao hơn so với dự đoán chỉ dựa trên dân số của nó, trong khi AUI dưới 1 cho thấy mức sử dụng thấp hơn mong đợi. Ví dụ, Đan Mạch có AUI là 2.1, có nghĩa là cư dân của họ sử dụng Claude với tốc độ gấp đôi so với tỷ lệ dân số trong độ tuổi lao động toàn cầu của họ.

Một sự thật quan trọng về việc sử dụng Claude trên toàn cầu là nó tập trung về mặt địa lý: một số ít quốc gia chiếm một tỷ lệ lớn trong việc sử dụng. Từ góc độ toàn cầu, ít có sự thay đổi về mặt này giữa tháng 8 và tháng 11 năm 2025. Thật vậy, bảng bên trái của Hình 1.6 cho thấy sự tập trung AUI giữa các quốc gia về cơ bản không thay đổi giữa báo cáo trước và báo cáo này.

Ngược lại, việc sử dụng đã trở nên phân bố đồng đều hơn giữa các tiểu bang Hoa Kỳ từ tháng 8 đến tháng 11 năm 2025: Hệ số Gini, một thước đo tiêu chuẩn về sự bình đẳng, đã giảm từ 0.37 xuống 0.32. Mặc dù điều quan trọng là phải thận trọng khi giải thích các thay đổi ngắn hạn, đây là một thay đổi tương đối lớn về phía bình đẳng hoàn hảo, trong đó AUI bằng 1 cho tất cả các tiểu bang có hệ số Gini là 0. Nếu hệ số Gini cho Hoa Kỳ lại giảm 0,05 mỗi ba tháng, thì sự bình đẳng về sử dụng sẽ đạt được trong khoảng hai năm.

Figure 1.6: AUI concentration around the world and within the US in this and the prior report. Hình 1.6: Sự tập trung AUI trên toàn thế giới và trong Hoa Kỳ trong báo cáo này và báo cáo trước. Các đường Lorenz cho Chỉ số sử dụng AI Anthropic (AUI) trên toàn thế giới và trong Hoa Kỳ, tháng 8 và tháng 11 năm 2025. Một đường cong gần với đường 45 độ cho thấy sự tập trung ít hơn. Ví dụ, biểu đồ bên phải cho thấy 20% tiểu bang hàng đầu của Hoa Kỳ chiếm 40% việc sử dụng đã điều chỉnh theo dân số ở Hoa Kỳ.

Những gì định hình các mô hình sử dụng trong Hoa Kỳ và trên toàn thế giới? Trong báo cáo trước, chúng tôi đã nhấn mạnh vai trò quan trọng của sự khác biệt về thu nhập trên toàn cầu: Sự khác biệt về việc sử dụng Claude giữa các quốc gia phần lớn được giải thích bởi sự khác biệt về GDP bình quân đầu người. Trong Chương 3, chúng tôi xem xét lại tầm quan trọng của thu nhập trong việc định hình không chỉ cường độ sử dụng mà còn cả các mô hình sử dụng trên toàn thế giới.

Tại Hoa Kỳ, thu nhập ít rõ ràng là một yếu tố dự báo việc sử dụng. Thay vào đó, điều dường như quan trọng nhất là thành phần lực lượng lao động của mỗi tiểu bang và mức độ phù hợp của lực lượng lao động với khả năng của Claude như được phản ánh trong việc sử dụng theo nhiệm vụ. Các tiểu bang có tỷ lệ lớn hơn người lao động trong các ngành nghề máy tính và toán—như Washington D.C., Virginia và Washington—có xu hướng sử dụng cao hơn bình quân đầu người. Định lượng, mỗi lần tăng 1% trong tỷ lệ nhân viên công nghệ như vậy trong một tiểu bang tương ứng với mức sử dụng bình quân đầu người cao hơn 0,36% (Hình 1.7). Điều này tự nó đã chiếm gần hai phần ba sự khác biệt giữa các tiểu bang về AUI.

Figure 1.7: AUI and share of workers in Computer & Mathematical occupations in each US State. Hình 1.7: AUI và tỷ lệ người lao động trong các ngành nghề Máy tính & Toán học ở mỗi Tiểu bang Hoa Kỳ. Hình này cho thấy tỷ lệ người lao động trong các ngành nghề Máy tính & Toán học giữa các tiểu bang Hoa Kỳ có mối tương quan cao với Chỉ số sử dụng AI Anthropic (AUI). Điều này phù hợp với quan điểm rằng các mô hình sử dụng Claude tổng thể—và các khả năng liên quan—đang định hình các mô hình áp dụng khu vực trong Hoa Kỳ. Mô hình này giữ nguyên hơn khi tính toán chính thức độ lệch KL giữa phân phối lực lượng lao động của mỗi tiểu bang và tỷ lệ sử dụng Claude.ai toàn cầu theo nhóm chính SOC.

Mặc dù chúng tôi dự kiến ​​sẽ có mức sử dụng Claude cao hơn ở các tiểu bang có nhiều nhân viên công nghệ, mô hình này giữ nguyên hơn: Mức sử dụng bình quân đầu người cao hơn ở các tiểu bang có nhiều nhân viên trong các ngành nghề mà Claude được sử dụng quá mức so với lực lượng lao động Hoa Kỳ (ví dụ: Nghệ thuật, Thiết kế, Giải trí, Thể thao và Truyền thông) hoặc có ít nhân viên hơn trong các ngành nghề mà Claude được sử dụng ít so với nền kinh tế quốc gia (ví dụ: Vận chuyển và Di chuyển Vật liệu). Điều này có thể được thấy bằng cách tính toán độ lệch Kullback–Leibler (KL) giữa thành phần lực lượng lao động của mỗi tiểu bang và thành phần sử dụng Claude toàn cầu. Các tiểu bang có độ lệch KL thấp hơn—và do đó có lực lượng lao động giống với các mô hình sử dụng Claude hơn—có xu hướng sử dụng bình quân đầu người cao hơn.

Dấu hiệu phổ biến Claude nhanh hơn tại Hoa Kỳ trong số các tiểu bang có mức sử dụng thấp

Mặc dù sự khác biệt về thành phần lực lượng lao động dường như đóng một vai trò trong việc định hình việc áp dụng khu vực tại Hoa Kỳ, bằng chứng ban đầu cho thấy Claude đang phổ biến nhanh hơn đáng kể so với dự đoán của tiền lệ lịch sử. Các công nghệ có ảnh hưởng kinh tế trong lịch sử đã mất khoảng nửa thế kỷ để đạt được sự phổ biến đầy đủ trên khắp Hoa Kỳ. Ngược lại, khi so sánh tỷ lệ áp dụng Claude vào tháng 11 năm 2025 với ba tháng trước đó, chúng tôi ước tính rằng sự bình đẳng về việc sử dụng bình quân đầu người giữa các tiểu bang Hoa Kỳ—như được đo bằng AUI—có thể đạt được trong vòng 2–5 năm. Ước tính này đi kèm với mức độ không chắc chắn cao vì độ chính xác của ước tính của chúng tôi không thể loại trừ các tỷ lệ phổ biến chậm hơn nhiều.

Chúng tôi tạo ra ước tính này thông qua lăng kính của một mô hình phổ biến đơn giản, mà chúng tôi mô tả ngắn gọn ở đây. Chúng tôi mô hình hóa sự phổ biến như sự hội tụ tỷ lệ với trạng thái ổn định chung của việc sử dụng bình quân đầu người bình đẳng hóa, trong đó mỗi tiểu bang $s$ có AUI bằng 1:

$AUI_{s,t} = AUI_{s,t-1}^{\beta} \times (1-\beta) + \beta \times 1 + \epsilon_{s,t}$

Theo mô hình này, độ lệch logarit của AUI so với trạng thái ổn định (AUI = 1) giảm đi một yếu tố $\beta$ mỗi ba tháng, ngụ ý thời gian bán hủy là $\frac{ln(.5)}{ln(\beta)}$ quý. Ví dụ, với dữ liệu hàng quý, giá trị $\beta = 0.99$ ngụ ý thời gian bán hủy khoảng 17 năm. Để minh họa, bắt đầu từ AUI ban đầu là 2, điều này có nghĩa là AUI sẽ giảm xuống khoảng 1,4 sau 17 năm và xuống khoảng 1,1 sau 50 năm. Chúng tôi lấy $\beta = 0.99$ làm tiêu chuẩn hợp lý vì nó ngụ ý tốc độ phổ biến tương tự như các công nghệ có ảnh hưởng kinh tế trong thế kỷ 20.

Mô hình hội tụ này thúc đẩy đặc tả hồi quy sau:

$ln(AUI_{s,t}) = \alpha + \beta \times ln(AUI_{s,t-1}) + \epsilon_{s,t}$

Một cách đơn giản để ước tính phương trình này bằng phương pháp bình phương tối thiểu thông thường (OLS) cho kết quả ước tính $\beta \approx 0.77$. Bình phương tối thiểu có trọng số (WLS) trong đó chúng tôi có trọng số theo lực lượng lao động của mỗi tiểu bang cho kết quả ước tính $\beta \approx 0.76$ (Hình 1.8). Cả hai đều khác biệt có ý nghĩa thống kê so với 1 ở các cấp độ thông thường. Nếu được chấp nhận, các ước tính này ngụ ý rằng sẽ mất hơn hai năm để AUI của mỗi tiểu bang đóng hầu hết khoảng cách với 1.

Figure 1.8: Anthropic AI Usage Index (AUI) across the US, August 2025 (V3) and November 2025 (V4). Hình 1.8: Chỉ số sử dụng AI Anthropic (AUI) trên khắp Hoa Kỳ, tháng 8 năm 2025 (V3) và tháng 11 năm 2025 (V4). Bằng cách so sánh AUI vào tháng 11 năm 2025 với giá trị của nó vào tháng 8 năm 2025, chúng tôi có thể ước tính tốc độ phổ biến ngụ ý của việc sử dụng Claude tại Hoa Kỳ. Theo một mô hình hội tụ tỷ lệ về trạng thái ổn định, trong đó AUI = 1 cho tất cả các tiểu bang Hoa Kỳ, hệ số đàn hồi ước tính có thể được sử dụng để tính toán tốc độ phổ biến (xem văn bản để biết thêm chi tiết). Phạm vi ước tính của chúng tôi ngụ ý tốc độ hội tụ khu vực của AUI trong khoảng 2-5 năm.

Một mối quan ngại khi ước tính sự hội tụ theo cách này là ước tính AUI của chúng tôi chịu sai số lấy mẫu và các biến động khác không liên quan đến sự phổ biến. Điều này có thể dẫn đến sai lệch suy giảm cổ điển: ngay cả khi AUI thực sự không thay đổi, ước tính của chúng tôi về $\beta$ có thể thấp hơn đáng kể so với một.

Để giải quyết vấn đề này, chúng tôi ước tính mô hình bằng phương pháp bình phương tối thiểu hai giai đoạn (2SLS), sử dụng logarit AUI vào tháng 8 năm 2025 làm công cụ với thành phần lực lượng lao động của mỗi tiểu bang, được đo bằng sự gần gũi của nó với các mô hình sử dụng Claude tổng thể. Logic đằng sau công cụ này là thành phần lực lượng lao động là một yếu tố dự báo mạnh mẽ về việc sử dụng Claude (sự liên quan) nhưng được đo lường độc lập, được kỳ vọng là không tương quan với sai số lấy mẫu trong các ước tính AUI của chúng tôi (tính hợp lệ). Như đã đề cập ở trên, các tiểu bang có nhiều nhân viên trong các vai trò sử dụng Claude cao có xu hướng có mức sử dụng bình quân đầu người cao hơn.

Tuy nhiên, các ước tính 2SLS ngụ ý sự hội tụ chậm hơn một cách khiêm tốn: $\beta \approx 0.89$ chưa được trọng số và $\beta \approx 0.86$ khi có trọng số theo lực lượng lao động của mỗi tiểu bang. Tuy nhiên, các ước tính này kém chính xác hơn, và chỉ ước tính đầu tiên khác biệt có ý nghĩa thống kê so với 1 ở mức 10%. Mặc dù ngụ ý sự hội tụ chậm hơn so với OLS, các ước tính 2SLS vẫn ngụ ý sự phổ biến nhanh chóng: chỉ bốn đến năm năm để độ lệch logarit của AUI của mỗi tiểu bang thu hẹp 90%.

Tuy nhiên, các ước tính của chúng tôi dựa trên dữ liệu chỉ trong ba tháng. Và mặc dù đặc tả 2SLS có thể giúp giải quyết sai số lấy mẫu, nhưng vẫn còn sự không chắc chắn đáng kể. Chúng tôi sẽ xem xét lại câu hỏi về tốc độ phổ biến này trong các báo cáo tương lai.

Chương 2: Giới thiệu các nguyên tắc kinh tế

Sức mạnh của Chỉ số Kinh tế Anthropic nằm ở việc cho thấy không chỉ mức độ sử dụng AI mà còn cả cách nó được sử dụng. Trong các báo cáo trước, chúng tôi đã chỉ ra Claude được sử dụng cho những nhiệm vụ nào và cách mọi người hợp tác với Claude. Dữ liệu này đã cho phép các nhà nghiên cứu bên ngoài phân tích sự thay đổi thị trường lao động (ví dụ: Brynjolfsson, Chandar & Chen, 2025).

Trong ấn bản này của Chỉ số Kinh tế Anthropic, chúng tôi mở rộng phạm vi dữ liệu có sẵn cho các nhà nghiên cứu bên ngoài bằng cách cung cấp những hiểu biết sâu sắc về năm “nguyên tắc cơ bản” kinh tế, mà qua đó chúng tôi có nghĩa là các biện pháp đơn giản, nền tảng về cách Claude được sử dụng, mà chúng tôi tạo ra bằng cách hỏi Claude để trả lời các câu hỏi cụ thể về các bản ghi ẩn danh trong mẫu của chúng tôi. Một số nguyên tắc cơ bản của chúng tôi bao gồm một số câu hỏi như vậy, và những nguyên tắc khác sử dụng một chỉ báo duy nhất.

Vì khả năng của AI đang tiến triển rất nhanh và tác động kinh tế sẽ được trải nghiệm không đồng đều, chúng tôi cần một loạt tín hiệu để khám phá không chỉ cách Claude được sử dụng mà còn để thông báo về tác động mà công nghệ này sẽ có.

Các chiều của việc sử dụng AI quan trọng đối với tác động kinh tế

Báo cáo này giới thiệu năm nguyên tắc kinh tế mới ngoài nguyên tắc mà chúng tôi đã đo lường, đó là các mẫu hợp tác (liệu người dùng có tự động hóa hay tăng cường nhiệm vụ của họ với Claude hay không). Các nguyên tắc này nắm bắt năm khía cạnh của một cuộc trò chuyện giữa người và AI: 1) độ phức tạp của nhiệm vụ, 2) kỹ năng của con người và AI, 3) trường hợp sử dụng công việc, học tập hoặc cá nhân, 4) mức độ tự chủ của AI và 5) sự thành công của nhiệm vụ (xem Bảng 2.1). Tính tự chủ của AI nắm bắt một điều gì đó khác biệt so với sự phân biệt tự động hóa/tăng cường hóa hiện có của chúng tôi. Ví dụ, “Dịch đoạn văn này sang tiếng Pháp” là tự động hóa cao (chỉ đạo, ít tương tác qua lại) nhưng tính tự chủ của AI thấp (nhiệm vụ đòi hỏi ít quyết định từ Claude).

Bảng 2.1: Các nguyên tắc kinh tế được thêm vào trong báo cáo này. Bảng hiển thị các nguyên tắc kinh tế mới được thêm vào trong báo cáo này, ngoài các mẫu hợp tác (tự động hóa/tăng cường hóa) từ các báo cáo trước. Cột đầu tiên hiển thị danh mục nguyên tắc, cột thứ hai là tên của nguyên tắc và cột thứ ba là hoạt động của các nguyên tắc dưới dạng các lời nhắc được cung cấp cho Claude mà chúng tôi sử dụng một bộ phân loại để ánh xạ các cuộc trò chuyện tới các nguyên tắc. Xem phụ lục trực tuyến tại https://huggingface.co/datasets/Anthropic/EconomicIndex để biết đầy đủ các văn bản lời nhắc.

Độ phức tạp của nhiệm vụ nắm bắt rằng các nhiệm vụ có thể khác nhau về độ phức tạp, bao gồm cả thời gian hoàn thành và mức độ khó khăn của chúng. Một nhiệm vụ “gỡ lỗi” trong O*NET có thể đề cập đến việc Claude sửa một lỗi nhỏ trong một hàm hoặc tái cấu trúc toàn diện một cơ sở mã—với những ý nghĩa rất khác nhau đối với nhu cầu lao động. Chúng tôi đo lường độ phức tạp thông qua thời gian ước tính của con người để hoàn thành nhiệm vụ mà không cần AI, thời gian dành để hoàn thành nhiệm vụ với AI và liệu người dùng có xử lý nhiều nhiệm vụ trong một cuộc trò chuyện hay không.

Kỹ năng của con người và AI giải quyết cách tự động hóa tương tác với các cấp độ kỹ năng. Nếu AI thay thế một cách không cân xứng các nhiệm vụ đòi hỏi ít chuyên môn hơn trong khi bổ sung cho công việc có kỹ năng cao hơn, thì đó có thể là một hình thức thay đổi kỹ thuật thiên vị kỹ năng khác—làm tăng nhu cầu đối với người lao động có kỹ năng cao trong khi thay thế người lao động có kỹ năng thấp hơn. Chúng tôi đo lường liệu người dùng có thể hoàn thành nhiệm vụ mà không cần Claude hay không, và số năm học vấn cần thiết để hiểu cả lời nhắc của người dùng và phản hồi của Claude.

Trường hợp sử dụng phân biệt sử dụng chuyên nghiệp, giáo dục và cá nhân. Tác động thị trường lao động đi trực tiếp từ việc sử dụng tại nơi làm việc, trong khi việc sử dụng giáo dục có thể báo hiệu nơi lực lượng lao động tương lai đang xây dựng các kỹ năng bổ sung cho AI.

Tính tự chủ của AI đo lường mức độ người dùng ủy thác việc ra quyết định cho Claude. Báo cáo mới nhất của chúng tôi đã ghi nhận việc sử dụng “chỉ đạo” ngày càng tăng, nơi người dùng ủy thác nhiệm vụ hoàn toàn. Theo dõi mức độ tự chủ—từ hợp tác tích cực đến ủy thác hoàn toàn—giúp dự báo tốc độ tự động hóa.

Sự thành công của nhiệm vụ đo lường đánh giá của Claude về việc liệu Claude có hoàn thành nhiệm vụ thành công hay không. Sự thành công của nhiệm vụ giúp đánh giá liệu các nhiệm vụ có thể được tự động hóa hiệu quả hay không (liệu một nhiệm vụ có thể được tự động hóa chút nào không?) và hiệu quả (sẽ mất bao nhiêu lần thử để tự động hóa một nhiệm vụ?). Đó là, sự thành công của nhiệm vụ quan trọng đối với cả tính khả thi và chi phí của các nhiệm vụ lao động tự động hóa.

Lựa chọn và xác nhận các biện pháp mới

Các chiều mới của việc sử dụng AI được ghi nhận trong dữ liệu của chúng tôi được định hướng bởi công việc gần đây của chúng tôi về các hiệu quả năng suất của Claude, phản hồi chúng tôi nhận được từ các nhà nghiên cứu bên ngoài, tài liệu gần đây về tác động kinh tế của AI thông qua lăng kính vốn nhân lực và chuyên môn (Vendraminell et al., 2025) và sự thảo luận trong nhóm nghiên cứu kinh tế của chúng tôi. Các tiêu chí lựa chọn chính của chúng tôi là sự liên quan kinh tế dự kiến, tính bổ sung của các chiều và liệu Claude có thể phân loại các cuộc trò chuyện theo chiều đó với độ chính xác định hướng hay không.

Chúng tôi đề xuất rằng nhiều nguyên tắc cơ bản đơn giản, ngay cả khi có phần nhiễu và không hoàn toàn chính xác theo riêng chúng, có thể cùng nhau cung cấp các tín hiệu quan trọng về cách AI đang được sử dụng. Do đó, chúng tôi chủ yếu kiểm tra độ chính xác định hướng.

Để phân loại thời lượng nhiệm vụ có và không có AI, chúng tôi đã sử dụng các phiên bản được sửa đổi tối thiểu của công việc năng suất trước đó của chúng tôi. Đối với các bộ phân loại mới ròng¹, được triển khai thông qua các công cụ bảo toàn quyền riêng tư của chúng tôi², quy trình xác nhận của chúng tôi như sau. Chúng tôi đã thiết kế nhiều biện pháp tiềm năng để nắm bắt các khái niệm như độ phức tạp của nhiệm vụ. Đối với Claude.ai, chúng tôi đã đánh giá hiệu suất bộ phân loại so với một nhà nghiên cứu con người trên một tập hợp nhỏ các bản ghi mà người dùng đã cung cấp phản hồi cho Claude.ai và mà chúng tôi có quyền xem các bản ghi gốc. Đối với dữ liệu API của bên thứ nhất (dữ liệu API 1P), chúng tôi xác thực các bộ phân loại bằng cách sử dụng kết hợp dữ liệu nội bộ và tổng hợp. Cả hai nguồn dữ liệu đều không hoàn toàn đại diện cho lưu lượng truy cập Claude.ai hoặc API 1P, nhưng chúng cho phép chúng tôi kiểm tra xem các bộ phân loại có hoạt động trên dữ liệu giống với dữ liệu sử dụng thực tế hay không, đồng thời đảm bảo quyền riêng tư.

Dựa trên hiệu suất ban đầu, chúng tôi đã sửa đổi các bộ phân loại cần điều chỉnh hoặc loại bỏ các bộ phân loại không hoạt động tốt. Thật thú vị, chúng tôi thấy rằng trong một số trường hợp (ví dụ: để đo lường sự thành công của nhiệm vụ), một bộ phân loại đơn giản hoạt động tốt hơn một bộ phân loại phức tạp, tinh tế khi so sánh với xếp hạng của con người. Sau đó, chúng tôi đã so sánh hiệu suất của các phiên bản bộ phân loại có và không có gợi ý chuỗi suy nghĩ, và quyết định chỉ giữ lại gợi ý chuỗi suy nghĩ cho ba khía cạnh (ước tính thời gian của con người, ước tính thời gian của con người với AI và tính tự chủ của AI) nơi chúng tôi thấy rằng nó cải thiện đáng kể hiệu suất. Chúng tôi đã chọn một bộ cuối cùng gồm chín bộ phân loại mới cho năm nguyên tắc cơ bản, tất cả chúng đều có độ chính xác định hướng ngay cả khi chúng có thể sai lệch đôi chút so với xếp hạng của con người.

Giá trị của các nguyên tắc cơ bản nằm ở khả năng dự đoán của chúng

Mục tiêu của chúng tôi là tạo ra các bộ phân loại dễ triển khai và kết hợp mang lại các tín hiệu kinh tế tiềm năng quan trọng. Mặc dù chúng tôi rất tự tin vào độ chính xác định hướng của các biện pháp mới (ví dụ: các nhiệm vụ đòi hỏi nhiều năm học vấn trung bình hơn để hiểu lời nhắc của con người có khả năng phức tạp hơn), không có biện pháp nào nên được coi là chính xác hoặc cuối cùng (ví dụ: Claude.ai có thể đánh giá thấp một chút số năm học vấn của con người cần thiết cho nhiều nhiệm vụ).

Tuy nhiên, các nguyên tắc cơ bản làm phong phú thêm hiểu biết của chúng tôi về cách mọi người sử dụng AI. Các mối quan hệ có hệ thống xuất hiện trên các nguyên tắc cơ bản, khu vực và nhiệm vụ—các mẫu chúng tôi khám phá sâu trong Chương 3 và 4. Rằng các mối quan hệ này là trực quan và nhất quán cho thấy các nguyên tắc cơ bản nắm bắt các khía cạnh có liên quan về cách mọi người và doanh nghiệp sử dụng Claude.

Các điểm chuẩn bên ngoài củng cố điều này. Trong công việc năng suất của chúng tôi, ước tính thời gian của Claude tương quan với thời gian thực tế dành cho các nhiệm vụ kỹ thuật phần mềm. Hình 2.1 cho thấy rằng biện pháp học vấn của con người của chúng tôi tương quan với các cấp độ học vấn thực tế của người lao động giữa các ngành nghề. Những xác nhận này cho thấy các nguyên tắc cơ bản riêng lẻ là đúng về mặt định hướng—và việc kết hợp chúng có thể mang lại giá trị phân tích bổ sung, chẳng hạn như làm phong phú thêm các ước tính năng suất với tỷ lệ thành công của nhiệm vụ hoặc xây dựng các biện pháp mới về phơi nhiễm nghề nghiệp.

Figure 2.1: Education years needed to understand the human prompt and share of workers with at least a Bachelor’s Degree. Hình 2.1: Số năm học vấn cần thiết để hiểu lời nhắc của con người và tỷ lệ người lao động có ít nhất bằng cử nhân. Dữ liệu giáo dục từ “Trình độ học vấn của người lao động từ 25 tuổi trở lên theo ngành nghề chi tiết” (BLS), dựa trên dữ liệu vi mô từ Khảo sát Cộng đồng Mỹ năm 2022 và 2023². Chúng tôi tính toán số năm học vấn trung bình cho các nhiệm vụ liên quan đến một ngành nghề cụ thể. Sau đó, chúng tôi tính toán tỷ lệ phần trăm người lao động có bằng cử nhân trở lên trong ngành nghề đó.

Cuối cùng, xác nhận mạnh mẽ nhất sẽ đến từ khả năng của các nguyên tắc cơ bản trong việc nắm bắt sự biến động có ý nghĩa trong kết quả thị trường lao động. Dữ liệu chúng tôi công bố cho phép các nhà nghiên cứu bên ngoài phân tích các thay đổi kinh tế theo những cách mới. Công việc ban đầu đã cho thấy những kết quả đáng khích lệ—sự phân biệt tự động hóa/tăng cường hóa từ các báo cáo trước đã được các nhà nghiên cứu bên ngoài sử dụng để phân tích sự thay đổi thị trường lao động (ví dụ: Brynjolfsson, Chandar & Chen, 2025).

Các nguyên tắc cơ bản làm nổi bật sự khác biệt về trường hợp sử dụng

Để minh họa cách các nguyên tắc cơ bản phân biệt giữa các loại sử dụng AI khác nhau, chúng tôi xem xét hai nhóm yêu cầu tương phản: phát triển phần mềm (“Hỗ trợ gỡ lỗi, phát triển và tối ưu hóa phần mềm trên nhiều miền lập trình”) và quản lý cuộc sống cá nhân (“Hỗ trợ quản lý cuộc sống cá nhân và các nhiệm vụ hàng ngày”). Hình 2.2 hiển thị hồ sơ nguyên tắc cơ bản cho mỗi nhóm cùng với mức trung bình toàn cầu.

Figure 2.2: Descriptive statistics of economic primitives overall and for two example request clusters. Hình 2.2: Thống kê mô tả các nguyên tắc kinh tế nói chung và cho hai nhóm yêu cầu ví dụ. Đối với hình này, chúng tôi tập trung vào thống kê mô tả cho các nguyên tắc cơ bản trên toàn bộ mẫu Claude.ai cũng như hai nhóm yêu cầu ở cấp độ chi tiết thấp nhất. N chỉ ra tổng số cuộc trò chuyện hoặc số lượng cuộc trò chuyện thuộc các nhóm yêu cầu.

Độ phức tạp của nhiệm vụ. Claude ước tính rằng các yêu cầu phát triển phần mềm sẽ mất khoảng 3,3 giờ để một chuyên gia có năng lực hoàn thành mà không cần AI—gần với mức trung bình toàn cầu là 3,1 giờ. Các nhiệm vụ quản lý cuộc sống cá nhân được ước tính đơn giản hơn, trung bình 1,8 giờ. Thời gian hợp tác ước tính giữa con người và AI tương tự nhau ở cả hai trường hợp (~15 phút), cho thấy nguyên tắc này thay đổi ít hơn so với các nguyên tắc khác cho hai nhiệm vụ này.

Kỹ năng của con người và AI. Các yêu cầu phát triển phần mềm đòi hỏi kiến thức chuyên môn hơn: cả lời nhắc của con người và phản hồi của AI đều được ước tính là yêu cầu khoảng 13,8 năm học vấn để hiểu, so với 9,1–9,4 năm đối với các yêu cầu quản lý cuộc sống cá nhân. Claude ước tính rằng người dùng có thể tự mình hoàn thành các yêu cầu quản lý cuộc sống cá nhân 96% thời gian, so với 82% đối với các yêu cầu phát triển phần mềm—cho thấy rằng Claude cung cấp sự hỗ trợ thiết yếu hơn cho công việc kỹ thuật.

Trường hợp sử dụng. Claude phân loại 64% yêu cầu phát triển phần mềm là liên quan đến công việc, so với chỉ 17% đối với quản lý cuộc sống cá nhân. Điều này minh họa rằng Claude có thể được sử dụng cho các mục đích rất khác nhau. Tổng cộng, việc sử dụng Claude.ai là 46% công việc, 19% học tập và 35% cá nhân.

Tính tự chủ của AI. Cả hai nhóm đều cho thấy mức độ tự chủ ước tính tương tự (~3,5 trên thang điểm 1 đến 5), gần với mức trung bình toàn cầu. Điều này có nghĩa là cả phát triển phần mềm và quản lý cuộc sống cá nhân, trung bình, đều mang lại cho Claude mức độ tự chủ tương tự để đưa ra quyết định về cách hoàn thành nhiệm vụ.

Sự thành công của nhiệm vụ. Claude đánh giá các nhiệm vụ cá nhân là hoàn thành thành công 78% thời gian, so với 61% đối với phát triển phần mềm. Các nhiệm vụ khó hơn—những nhiệm vụ đòi hỏi kiến thức chuyên môn hơn và nơi người dùng không thể dễ dàng hoàn thành chúng một mình—cho thấy tỷ lệ thành công ước tính thấp hơn.

Nhiệm vụ và nguyên tắc cơ bản khác biệt giữa người dùng Claude.ai và người dùng API

Giống như trong báo cáo trước, chúng tôi nhận thấy sự khác biệt lớn về nhiệm vụ và nguyên tắc cơ bản trong các cuộc trò chuyện Claude.ai so với dữ liệu 1P API. Một phần của điều này phản ánh bản chất của tương tác: các bản ghi Claude.ai có thể bao gồm các cuộc trò chuyện nhiều lượt, trong khi dữ liệu API chúng tôi phân tích bị giới hạn ở các cặp đầu vào-đầu ra đơn lẻ. Điều này là do các yêu cầu API đến độc lập, không có siêu dữ liệu liên kết chúng với các trao đổi trước đó. Điều này có nghĩa là chúng tôi chỉ có thể phân tích chúng như các cặp người dùng-trợ lý riêng biệt thay vì quỹ đạo cuộc trò chuyện đầy đủ.

Tổng cộng, việc sử dụng API chủ yếu liên quan đến công việc (74% so với 46%) và chỉ đạo (64% so với 32%), với ba phần tư các tương tác được phân loại là tự động hóa so với chưa đến một nửa trên Claude.ai (xem Hình 1.3).

Ngược lại, người dùng Claude.ai tham gia vào nhiều tương tác qua lại hơn: các chế độ lặp lại nhiệm vụ và học hỏi phổ biến hơn nhiều, và các nhiệm vụ có xu hướng dài hơn—cả về thời gian của con người với AI (15 phút so với 5 phút) và thời gian ước tính mà con người sẽ cần để hoàn thành nhiệm vụ một mình (3,1 giờ so với 1,7 giờ). Claude.ai cũng cho thấy tỷ lệ thành công nhiệm vụ cao hơn (67% so với 49%), điều này có thể phản ánh lợi ích của cuộc trò chuyện nhiều lượt, nơi người dùng có thể làm rõ, sửa đổi hướng đi và lặp lại để đạt được giải pháp. Người dùng Claude.ai cũng cung cấp cho AI quyền tự chủ cao hơn một cách trung bình và có nhiều khả năng mang theo các nhiệm vụ mà họ không thể hoàn thành một mình.

Những khác biệt này cũng được phản ánh trong phân phối nghề nghiệp của các nhiệm vụ. Việc sử dụng API tập trung cao vào các nhiệm vụ Máy tính & Toán học (52% so với 36%), phù hợp với việc sử dụng cho các quy trình làm việc tự động hóa, có thể lập trình như tạo mã và xử lý dữ liệu. Các nhiệm vụ Văn phòng & Hành chính cũng phổ biến hơn trong API (15% so với 8%), phản ánh các hoạt động kinh doanh thông thường phù hợp để ủy thác. Ngược lại, Claude.ai có tỷ lệ nhiệm vụ Giảng dạy Giáo dục cao hơn đáng kể (16% so với 4%)—hỗ trợ học tập, gia sư và phát triển tài liệu giảng dạy—cũng như các nhiệm vụ Nghệ thuật, Thiết kế và Giải trí nhiều hơn (11% so với 6%). Claude.ai cũng có một phần đuôi dài hơn các danh mục hướng đến con người như Dịch vụ Cộng đồng & Xã hội và Chuyên gia Y tế, nơi người dùng tìm kiếm lời khuyên, tư vấn hoặc thông tin về các vấn đề cá nhân.

Những mô hình này cho thấy rằng việc triển khai API 1P tập trung vào các nhiệm vụ có thể tự động hóa có hệ thống, trong khi Claude.ai phục vụ một loạt các trường hợp sử dụng rộng hơn bao gồm học tập, công việc sáng tạo và hỗ trợ cá nhân.

Chương 4 khám phá sự khác biệt ở cấp độ nhiệm vụ chi tiết hơn.

Chương 3: Cách Claude được sử dụng khác nhau theo địa lý

Tổng quan

Trong chương này, chúng tôi phân tích sự khác biệt về địa lý trong các mô hình sử dụng Claude bằng cách phân tích bảo toàn quyền riêng tư¹ của 1 triệu cuộc trò chuyện Claude.ai². Chúng tôi đưa ra năm quan sát:

  • Claude chủ yếu được sử dụng cho công việc, nhưng các trường hợp sử dụng đa dạng hóa theo mức độ áp dụng: Các trường hợp sử dụng công việc và cá nhân phổ biến hơn ở các quốc gia có thu nhập cao hơn, trong khi các trường hợp sử dụng học tập phổ biến hơn ở các quốc gia có thu nhập thấp hơn. Điều này phản ánh những phát hiện từ báo cáo trước của chúng tôi và phù hợp với công việc gần đây của Microsoft cho thấy việc sử dụng AI cho trường học liên quan đến thu nhập bình quân đầu người thấp hơn, trong khi việc sử dụng AI cho giải trí liên quan đến thu nhập bình quân đầu người cao hơn.
  • GDP và giáo dục con người dự đoán việc áp dụng trên toàn cầu và trong Hoa Kỳ: Tăng 1% GDP bình quân đầu người tương ứng với tăng 0,7% sử dụng Claude bình quân đầu người ở cấp độ quốc gia. Giáo dục con người—ước tính của Claude về số năm học vấn cần thiết để hiểu lời nhắc của con người trong cuộc trò chuyện—tương quan tích cực với Chỉ số sử dụng AI Anthropic ở cả hai cấp độ.
  • Các nguyên tắc cơ bản khác dự đoán việc áp dụng khác nhau ở cấp độ toàn cầu so với cấp độ Hoa Kỳ: Ở cấp độ quốc gia, mức sử dụng cao hơn tương quan với các nhiệm vụ ngắn hơn và ít tự chủ hơn của AI. Ở cấp độ tiểu bang Hoa Kỳ, các mối quan hệ này không có ý nghĩa thống kê, mặc dù việc sử dụng công việc tương quan tích cực với việc áp dụng.
  • Mối quan hệ giữa các nguyên tắc cơ bản phụ thuộc vào ngữ cảnh: Sự thành công của nhiệm vụ có mối tương quan tiêu cực với giáo dục con người giữa các quốc gia, nhưng có mối tương quan tích cực trong các tiểu bang Hoa Kỳ. Tuy nhiên, khi kiểm soát các nguyên tắc cơ bản khác, mối quan hệ của Hoa Kỳ trở nên không đáng kể.
  • Cách con người đưa ra lời nhắc thì Claude phản hồi: Mức độ giáo dục của lời nhắc con người và phản hồi của AI gần như tương quan hoàn hảo (r > 0.92 ở cả hai cấp độ). Các quốc gia có mức sử dụng bình quân đầu người cao hơn cũng cho thấy nhiều sự tăng cường hóa hơn—sử dụng Claude như một cộng tác viên thay vì ủy thác quyết định hoàn toàn.

Claude chủ yếu được sử dụng cho công việc, nhưng các trường hợp sử dụng đa dạng hóa theo mức độ áp dụng

Dữ liệu của chúng tôi, dựa trên phân tích bảo toàn quyền riêng tư¹ của 1 triệu cuộc trò chuyện Claude.ai², cho thấy sự khác biệt rõ rệt về địa lý trong cách Claude được áp dụng. Claude chủ yếu được sử dụng cho công việc, trên toàn cầu và trên khắp Hoa Kỳ. Tuy nhiên, có sự khác biệt về địa lý trong các trường hợp sử dụng. Ở cấp độ toàn cầu, Balkan và Brazil có tỷ lệ sử dụng công việc tương đối cao nhất (xem Hình 3.1), và Indonesia nổi bật với tỷ lệ học tập cao nhất. Ở cấp độ tiểu bang Hoa Kỳ, New York nổi bật là tiểu bang sử dụng Claude tương đối nhiều nhất cho công việc.

Figure 3.1: Share of work use of Claude.ai globally. Hình 3.1: Tỷ lệ sử dụng công việc của Claude.ai trên toàn cầu. Tỷ lệ các cuộc trò chuyện cho một quốc gia nhất định được phân loại là công việc, trái ngược với cá nhân hoặc học tập. Các cấp độ khác nhau phản ánh vị trí của một quốc gia trong phân phối toàn cầu của Chỉ số sử dụng AI Anthropic như được định nghĩa trong chương 1³. Chúng tôi chỉ bao gồm các quốc gia có ít nhất 200 quan sát trong mẫu của chúng tôi cho hình này vì sự không chắc chắn của biện pháp đối với các quốc gia có mức sử dụng thấp trong mẫu ngẫu nhiên của chúng tôi. Dữ liệu gốc bao gồm sử dụng Claude.ai Miễn phí, Pro và Max.

Các khác biệt về trường hợp sử dụng liên quan đến thu nhập bình quân đầu người của một quốc gia, mà đến lượt nó, liên quan đến việc áp dụng AI bình quân đầu người. Chúng tôi quan sát thấy rằng các trường hợp sử dụng công việc và cá nhân của Claude phổ biến hơn ở các quốc gia có thu nhập cao hơn, trong khi các trường hợp sử dụng học tập phổ biến hơn ở các quốc gia có thu nhập thấp hơn (xem Hình 3.2). Thật thú vị, những phát hiện này hội tụ với công việc gần đây của Microsoft cho thấy việc sử dụng AI cho trường học liên quan đến thu nhập bình quân đầu người thấp hơn, trong khi việc sử dụng AI cho giải trí liên quan đến thu nhập bình quân đầu người cao hơn.

Figure 3.2: Per capita income predicts how Claude is used across countries. Hình 3.2: Thu nhập bình quân đầu người dự đoán cách Claude được sử dụng giữa các quốc gia. Mỗi biểu đồ cho thấy mối quan hệ hai biến giữa tỷ lệ trường hợp sử dụng cụ thể (công việc, học tập hoặc cá nhân) cho các cuộc trò chuyện Claude.ai và GDP log bình quân đầu người. Các nhãn cho biết mã quốc gia ISO-3166-1. Chúng tôi chỉ bao gồm các quốc gia có ít nhất 200 quan sát trong mẫu của chúng tôi cho hình này vì sự không chắc chắn của biện pháp đối với các quốc gia có mức sử dụng thấp trong mẫu ngẫu nhiên của chúng tôi. Dữ liệu gốc bao gồm sử dụng Claude.ai Miễn phí, Pro và Max.

Nhiều yếu tố có thể đóng góp vào những mô hình này:

  • Các trường hợp sử dụng cá nhân có thể phổ biến hơn khi việc áp dụng AI tăng lên và nhiều người dùng đa dạng hơn sử dụng AI, hoặc người dùng hiện tại khám phá các ứng dụng rộng hơn của AI. Ngược lại, các quốc gia có mức áp dụng bình quân đầu người thấp hơn (tương quan với thu nhập bình quân đầu người thấp hơn) có thể tập trung vào các trường hợp sử dụng cụ thể như mã hóa hoặc như việc học.
  • Các quốc gia khác nhau về khả năng chi trả cho Claude, và các trường hợp sử dụng học tập có thể phù hợp hơn với việc sử dụng Claude miễn phí so với các trường hợp sử dụng phức tạp trong các lĩnh vực công việc như kỹ thuật phần mềm.
  • Người dùng ở các quốc gia có thu nhập cao hơn có thể có các nguồn lực khác, chẳng hạn như thời gian rảnh và quyền truy cập Internet liên tục, cho phép các trường hợp sử dụng cá nhân không cần thiết.

Việc áp dụng quốc tế và Hoa Kỳ khác nhau giữa các nguyên tắc kinh tế

Các nguyên tắc kinh tế cơ bản được giới thiệu trong báo cáo này cho phép chúng tôi phân tích một số yếu tố có thể thúc đẩy việc áp dụng khác biệt. Khi phân tích mối quan hệ giữa Chỉ số sử dụng AI Anthropic (AUI) và các nguyên tắc kinh tế cốt lõi cũng như GDP, chúng tôi quan sát thấy rằng một số mô hình giữ nguyên cho cả quốc gia và tiểu bang Hoa Kỳ. Ví dụ, chúng tôi lặp lại phát hiện từ báo cáo trước của chúng tôi rằng GDP có mối tương quan mạnh mẽ với AUI (xem Hình 3.3 và 3.4). Ở cấp độ quốc gia, tăng 1% GDP bình quân đầu người tương ứng với tăng 0,7% sử dụng Claude bình quân đầu người. Giáo dục con người (số năm học vấn cần thiết để hiểu lời nhắc do con người viết trong cuộc trò chuyện) có mối tương quan tích cực và có ý nghĩa với Chỉ số sử dụng AI Anthropic ở cả cấp độ quốc gia và cấp độ tiểu bang Hoa Kỳ.

Figure 3.3: Relationship between the Anthropic AI Usage Index and five core economic primitives and GDP per capita at the country level. Hình 3.3: Mối quan hệ giữa Chỉ số sử dụng AI Anthropic và năm nguyên tắc kinh tế cốt lõi và GDP bình quân đầu người ở cấp độ quốc gia. Mỗi biểu đồ cho thấy mối quan hệ hai biến giữa logarit tự nhiên của Chỉ số sử dụng AI Anthropic và một nguyên tắc kinh tế cốt lõi cũng như GDP log bình quân đầu người. Các nhãn cho biết mã quốc gia ISO-3166-1. Chúng tôi chỉ bao gồm các quốc gia có ít nhất 200 quan sát trong mẫu của chúng tôi cho hình này vì sự không chắc chắn của biện pháp đối với các quốc gia có mức sử dụng thấp trong mẫu ngẫu nhiên của chúng tôi. Dữ liệu gốc bao gồm sử dụng Claude.ai Miễn phí, Pro và Max. Xem chương 2 để biết định nghĩa chi tiết về thời gian chỉ con người, giáo dục con người, tính tự chủ của AI, trường hợp sử dụng công việc và sự thành công của nhiệm vụ.

Figure 3.4: Relationship between the Anthropic AI Usage Index and five core economic primitives and GDP per capita at the US state level. Hình 3.4: Mối quan hệ giữa Chỉ số sử dụng AI Anthropic và năm nguyên tắc kinh tế cốt lõi và GDP bình quân đầu người ở cấp độ tiểu bang Hoa Kỳ. Mỗi biểu đồ cho thấy mối quan hệ hai biến giữa logarit tự nhiên của Chỉ số sử dụng AI Anthropic và một nguyên tắc kinh tế cốt lõi cũng như GDP log bình quân đầu người. Các nhãn cho biết mã vùng ISO-3166-2⁶. Chúng tôi chỉ bao gồm các tiểu bang có ít nhất 100 quan sát trong mẫu của chúng tôi cho hình này vì sự không chắc chắn của biện pháp đối với các tiểu bang có mức sử dụng thấp trong mẫu ngẫu nhiên của chúng tôi. Dữ liệu gốc bao gồm sử dụng Claude.ai Miễn phí, Pro và Max. Xem chương 2 để biết định nghĩa chi tiết về thời gian chỉ con người, giáo dục con người, tính tự chủ của AI, trường hợp sử dụng công việc và sự thành công của nhiệm vụ.

Tuy nhiên, mối quan hệ giữa AUI và các nguyên tắc cơ bản thường khác nhau giữa cấp độ quốc gia và cấp độ tiểu bang Hoa Kỳ. Ví dụ, ở cấp độ quốc gia, AUI tương quan tiêu cực với thời gian mà con người cần để hoàn thành nhiệm vụ mà không cần AI, và với mức độ tự chủ ra quyết định được cấp cho Claude. Ở cấp độ tiểu bang Hoa Kỳ, các mối quan hệ này không có ý nghĩa thống kê—có lẽ cũng do kích thước mẫu nhỏ hơn cho các tiểu bang Hoa Kỳ. Ngoài ra, chúng tôi quan sát thấy mối tương quan tích cực giữa AUI và việc sử dụng Claude.ai cho công việc ở cấp độ tiểu bang Hoa Kỳ, nhưng không phải ở cấp độ quốc gia.

Quan trọng hơn, bản thân các nguyên tắc cơ bản không nhất thiết là các yếu tố nhân quả—chúng tôi không biết liệu thu nhập hay giáo dục có thực sự thúc đẩy việc áp dụng hay không, hoặc liệu chúng có phải là các biến đại diện cho các điều kiện cơ bản khác hay không. Nhiều yếu tố này có tương quan mạnh mẽ với nhau. Ví dụ, ở cấp độ tiểu bang Hoa Kỳ, số năm học vấn của con người cho thấy mối liên hệ mạnh mẽ với Chỉ số sử dụng AI Anthropic một cách cô lập, nhưng mối quan hệ này biến mất sau khi chúng tôi kiểm soát GDP và các nguyên tắc cơ bản khác—cho thấy giáo dục có thể nắm bắt sự khác biệt được giải thích tốt hơn bởi sự phát triển kinh tế và các yếu tố khác.

Các yếu tố thể chế định hình mối quan hệ giữa sự thành công của nhiệm vụ và số năm học vấn

Bối cảnh kinh tế và thể chế—chẳng hạn như mức độ giáo dục thay đổi như thế nào trong một khu vực địa lý—liên quan đến cách AI đang được sử dụng. Thú vị thay, chúng tôi quan sát thấy rằng sự thành công của nhiệm vụ có mối tương quan tiêu cực với giáo dục con người ở cấp độ quốc gia, nhưng có mối tương quan tích cực ở cấp độ tiểu bang Hoa Kỳ. Tuy nhiên, mối quan hệ tích cực ở cấp độ tiểu bang trở nên không có ý nghĩa khi kiểm soát các nguyên tắc cơ bản khác (xem Hình 3.5). Điều này có nghĩa là mô hình mối quan hệ ở một cấp độ quan sát (quốc gia) mâu thuẫn với mô hình mối quan hệ ở một cấp độ khác (tiểu bang Hoa Kỳ). Trên các quốc gia, dân số có học vấn có thể cố gắng thực hiện các nhiệm vụ khó hơn và do đó có tỷ lệ thành công thấp hơn. Trong các bối cảnh đồng nhất, giáo dục có thể không cải thiện sự thành công của nhiệm vụ.

Figure 3.5: Relationship between task success and human education. Hình 3.5: Mối quan hệ giữa sự thành công của nhiệm vụ và giáo dục con người. Các biểu đồ bên trái cho thấy mối tương quan hai biến giữa sự thành công của nhiệm vụ và số năm học vấn cần thiết để hiểu lời nhắc của con người trong cuộc trò chuyện. Các biểu đồ bên phải cho thấy hồi quy từng phần nơi chúng tôi kiểm soát thêm GDP bình quân đầu người, tính tự chủ của AI, tỷ lệ tự động hóa, tỷ lệ sử dụng công việc và học tập, thời gian chỉ con người, thời gian con người với AI, đa nhiệm và khả năng của con người (xem chương 2 để biết định nghĩa chi tiết về các biến này). Các nhãn cho biết mã quốc gia ISO-3166-1 và mã vùng ISO-3166-2. Chúng tôi chỉ bao gồm các quốc gia có ít nhất 200 và các tiểu bang có ít nhất 100 quan sát trong mẫu của chúng tôi cho hình này vì sự không chắc chắn của biện pháp đối với các tiểu bang có mức sử dụng thấp trong mẫu ngẫu nhiên của chúng tôi. Dữ liệu gốc bao gồm sử dụng Claude.ai Miễn phí, Pro và Max.

Cách con người đưa ra lời nhắc thì Claude phản hồi

Chúng tôi tìm thấy mối tương quan rất cao giữa giáo dục con người và AI, tức là số năm học vấn cần thiết để hiểu lời nhắc của con người hoặc phản hồi của AI (quốc gia: $r = 0.925, p < 0.001, N = 117$; tiểu bang Hoa Kỳ: $r = 0.928, p < 0.001, N = 50$). Điều này nhấn mạnh tầm quan trọng của các kỹ năng và cho thấy rằng cách người dùng đưa ra lời nhắc cho AI sẽ định hình mức độ hiệu quả của nó. Điều này cũng làm nổi bật tầm quan trọng của thiết kế và đào tạo mô hình. Mặc dù Claude có thể phản hồi một cách tinh vi, nhưng nó thường chỉ làm như vậy khi người dùng đưa ra lời nhắc tinh vi.

Cách các mô hình được đào tạo, tinh chỉnh và hướng dẫn ảnh hưởng đến cách chúng phản hồi người dùng. Ví dụ, một mô hình AI có thể có lời nhắc hệ thống hướng dẫn nó luôn sử dụng ngôn ngữ đơn giản mà học sinh trung học có thể hiểu, trong khi một mô hình AI khác có thể chỉ phản hồi bằng ngôn ngữ phức tạp đòi hỏi trình độ tiến sĩ để hiểu. Đối với Claude, chúng tôi quan sát một mô hình động hơn, trong đó cách người dùng đưa ra lời nhắc cho Claude liên quan đến cách Claude phản hồi.

Thu nhập cao hơn và việc sử dụng cao hơn liên quan đến tăng cường hóa nhiều hơn

Các quốc gia có mức sử dụng bình quân đầu người cao hơn, thường là các quốc gia có thu nhập bình quân đầu người cao hơn, cho thấy mức độ tự động hóa thấp hơn và ít tính tự chủ ra quyết định được ủy thác cho Claude. Đó là, các quốc gia có thu nhập cao hơn sử dụng AI như một trợ lý và cộng tác viên nhiều hơn thay vì để nó hoạt động độc lập. Mối quan hệ này không có ý nghĩa ở cấp độ tiểu bang Hoa Kỳ, có lẽ vì sự khác biệt về thu nhập và sự đa dạng về trường hợp sử dụng bị hạn chế hơn ở Hoa Kỳ so với toàn cầu. Điều này phản ánh một phát hiện từ Báo cáo Kinh tế thứ 3 của chúng tôi, nơi các quốc gia có Chỉ số sử dụng AI Anthropic cao hơn có xu hướng sử dụng Claude theo cách hợp tác hơn (tăng cường hóa), thay vì để nó hoạt động độc lập (tự động hóa).

Kết luận

Sự khác biệt rõ rệt về địa lý trong dữ liệu của chúng tôi cho thấy Claude được sử dụng theo những cách khác nhau trên toàn thế giới. GDP dự đoán Chỉ số sử dụng AI Anthropic ở cả cấp độ quốc gia và tiểu bang Hoa Kỳ, và giáo dục con người—sự tinh tế của lời nhắc người dùng—tương quan với việc áp dụng ở cả hai cấp độ.

Các mối quan hệ khác phụ thuộc vào ngữ cảnh. Ở cấp độ quốc gia, việc sử dụng cao hơn tương quan với các nhiệm vụ ngắn hơn và ít tự chủ hơn của AI; trong Hoa Kỳ, các mô hình này không giữ nguyên. Sự thành công của nhiệm vụ và giáo dục con người cho thấy các mối quan hệ ngược nhau trên toàn cầu so với trong Hoa Kỳ.

Mối tương quan gần như hoàn hảo giữa số năm học vấn của con người và AI nhấn mạnh rằng cách người dùng đưa ra lời nhắc cho Claude sẽ định hình cách nó phản hồi. Kết hợp với phát hiện rằng các quốc gia có mức sử dụng cao hơn tương tác với Claude một cách hợp tác hơn, điều này cho thấy rằng các kỹ năng cần thiết để sử dụng AI tốt có thể không được phân bổ đồng đều.

Bằng cách đo lường đặc điểm của các cuộc trò chuyện với Claude, chúng tôi tìm thấy các mối quan hệ quan trọng với các yếu tố kinh tế rộng lớn hơn như vốn nhân lực. Các mối quan hệ này có thể giúp dự đoán kết quả thị trường lao động và thông báo một quá trình chuyển đổi suôn sẻ sang một nền kinh tế được hỗ trợ bởi AI, đòi hỏi các bộ kỹ năng khác nhau.

Chương 4: Nhiệm vụ và năng suất

Trong chương này, chúng tôi kiểm tra cách tiết kiệm thời gian, tỷ lệ thành công và tính tự chủ khác nhau giữa các loại nhiệm vụ và ý nghĩa của điều đó đối với các tác động tiềm tàng đối với công việc và năng suất.

Các mô hình cho thấy rằng các nhiệm vụ phức tạp hơn mang lại thời gian tiết kiệm lớn hơn, nhưng điều đó đánh đổi với độ tin cậy. Trong một bài tập loại bỏ nhiệm vụ đơn giản lấy cảm hứng từ Autor và Thompson (2025), xu hướng của Claude trong việc bao quát các nhiệm vụ giáo dục cao hơn tạo ra hiệu ứng giảm kỹ năng ròng trên hầu hết các ngành nghề, vì các nhiệm vụ mà AI xử lý thường là các thành phần có kỹ năng cao hơn của một công việc.

Việc sử dụng Claude trải rộng trên một phần đáng kể các nhiệm vụ trong một tỷ lệ ngày càng tăng các ngành nghề. Chúng tôi kết hợp tỷ lệ thành công vào một mô hình bao phủ nhiệm vụ phong phú hơn; một số ngành nghề có phạm vi bao phủ khiêm tốn cho thấy tác động lớn vì AI thành công trong các nhiệm vụ tốn nhiều thời gian nhất của họ. Việc điều chỉnh các ước tính năng suất theo độ tin cậy của nhiệm vụ gần như làm giảm một nửa lợi ích ngụ ý, từ 1,8 xuống khoảng 1,0 điểm phần trăm tăng trưởng năng suất lao động hàng năm trong thập kỷ tới. Tuy nhiên, những ước tính này phản ánh khả năng mô hình hiện tại và mọi dấu hiệu đều cho thấy độ tin cậy đối với các nhiệm vụ ngày càng dài hơn sẽ được cải thiện.

Sự đánh đổi trong việc tăng tốc nhiệm vụ

Các ước tính của chúng tôi cho thấy rằng, nói chung, các nhiệm vụ phức tạp hơn trong dữ liệu của chúng tôi mang lại thời gian tiết kiệm lớn hơn (hoặc “tăng tốc”) từ AI. Chúng tôi rút ra điều này bằng cách yêu cầu Claude ước tính cả thời gian mà một nhiệm vụ sẽ đòi hỏi một người thực hiện một mình và thời gian khi con người và AI làm việc cùng nhau, điều mà chúng tôi đã xác nhận trong công việc trước đó. Do đó, việc giảm một nhiệm vụ 1 giờ xuống còn 10 phút sẽ mang lại mức tăng tốc gấp 6 lần.

Bảng bên trái của Hình 4.1 dưới đây cho thấy mức tăng tốc trung bình so với thước đo chính về độ phức tạp nhiệm vụ của chúng tôi, số năm học vấn của con người cần thiết để hiểu đầu vào, tất cả ở cấp độ nhiệm vụ O*NET¹. Nó cho thấy rằng trong các cuộc trò chuyện Claude.ai, ví dụ, lời nhắc yêu cầu 12 năm học vấn (giáo dục trung học) đạt được mức tăng tốc gấp 9 lần, trong khi những lời nhắc yêu cầu 16 năm học vấn (bằng đại học) đạt được mức tăng tốc gấp 12 lần. Điều này ngụ ý rằng lợi ích về năng suất rõ rệt hơn đối với các trường hợp sử dụng đòi hỏi vốn nhân lực cao hơn, phù hợp với bằng chứng cho thấy những người lao động văn phòng có nhiều khả năng áp dụng AI hơn (ví dụ: Bick et al 2025).

Figure 4.1: Speed up (panel a) and Success rate (panel b) vs. Human years of schooling. Hình 4.1: Tăng tốc (bảng a) và Tỷ lệ thành công (bảng b) so với số năm học vấn của con người. Bảng bên trái cho thấy biểu đồ phân tán theo nhóm về mối quan hệ hai biến giữa tăng tốc và số năm học vấn của con người, tất cả đều được đo ở cấp độ nhiệm vụ O*NET và được chia theo nền tảng. Các đường đứt nét cho thấy sự phù hợp từ hồi quy tuyến tính. Bảng bên phải cho thấy mối quan hệ tương tự với tỷ lệ thành công ở trục y.

Trong phạm vi độ phức tạp của nhiệm vụ, mức tăng tốc cao hơn đối với người dùng API. Điều này có thể phản ánh bản chất của dữ liệu API, vốn bị giới hạn ở các tương tác một lượt và các nhiệm vụ API đã được chọn đặc biệt để tự động hóa.

Tuy nhiên, kết quả cũng nắm bắt một sự đánh đổi. Các nhiệm vụ phức tạp hơn có tỷ lệ thành công nhiệm vụ thấp hơn, như được hiển thị ở bảng bên phải. Ví dụ, trên Claude.ai, các nhiệm vụ yêu cầu ít hơn trình độ trung học (ví dụ: trả lời các câu hỏi cơ bản về sản phẩm) đạt được tỷ lệ thành công 70%, nhưng con số này giảm xuống 66% đối với các cuộc trò chuyện ở cấp độ đại học như phát triển kế hoạch phân tích. Tuy nhiên, việc tính đến sự khác biệt về tỷ lệ thành công—bằng cách loại trừ các nhiệm vụ có tỷ lệ thành công thấp hoặc giảm giá trị tăng tốc theo xác suất thành công—không loại bỏ được gradient giáo dục: các nhiệm vụ phức tạp vẫn cho thấy lợi ích năng suất ròng lớn hơn.

Một cách để xem xét ý nghĩa của gradient giáo dục là xem xét tỷ lệ tự động hóa trên các cấp độ giáo dục cần thiết để hiểu đầu vào. Nếu các nhiệm vụ có trình độ học vấn cao cho thấy mức độ tự động hóa tương đối cao hơn, thì điều đó có thể báo hiệu sự phơi nhiễm nhiều hơn đối với những người lao động văn phòng. Tuy nhiên, ở đây, thông điệp không rõ ràng: tỷ lệ tự động hóa về cơ bản không liên quan đến mức độ học vấn của con người cần thiết để viết lời nhắc (Phụ lục Hình A.1)². Trên cả Claude.ai và API 1P, các nhiệm vụ trên các cấp độ giáo dục đều cho thấy các mô hình tự động hóa với tỷ lệ tương đương.

Người dùng muốn ủy thác nhiều hơn cho Claude trong những bối cảnh nào? Người dùng Claude.ai cấp cho AI quyền tự chủ cao hơn một chút khi làm việc với các nhiệm vụ phức tạp hơn. Ngược lại, việc sử dụng API cho thấy tính tự chủ thấp hơn đồng đều ở mọi cấp độ phức tạp.

Figure 4.2: AI autonomy vs. human education. Hình 4.2: Tính tự chủ của AI so với giáo dục con người. Biểu đồ cho thấy biểu đồ phân tán theo nhóm về mối quan hệ hai biến giữa tính tự chủ của AI và số năm học vấn của con người cần thiết, tất cả đều được đo ở cấp độ nhiệm vụ O*NET. Các đường đứt nét cho thấy sự phù hợp từ hồi quy tuyến tính.

Tuy nhiên, hãy lưu ý rằng các phân phối này không bao gồm cùng một bộ nhiệm vụ. Việc sử dụng API bao phủ một phạm vi nhiệm vụ hẹp hơn trong nền kinh tế, như được thấy trong biểu đồ tập trung ở Chương 1. Các nhiệm vụ có trình độ học vấn cao mà việc sử dụng nặng nề trong dữ liệu API bao gồm phân tích bảo mật, thử nghiệm và đảm bảo chất lượng, và xem xét mã, trong khi người dùng Claude.ai có nhiều khả năng có các phiên học tập, lặp lại.

Phạm vi nhiệm vụ trong sử dụng thực tế

Figure 4.3: Task success vs. human-only time. Hình 4.3: Sự thành công của nhiệm vụ so với thời gian chỉ dành cho con người. Biểu đồ cho thấy biểu đồ phân tán theo nhóm về mối quan hệ hai biến giữa tỷ lệ thành công của nhiệm vụ (%) và thời gian mà nhiệm vụ đó sẽ yêu cầu con người hoàn thành một mình, tất cả đều được đo ở cấp độ nhiệm vụ O*NET và được chia theo nền tảng. Các đường đứt nét cho thấy sự phù hợp từ hồi quy tuyến tính.

Các công việc gần đây về “phạm vi nhiệm vụ” của AI (Kwa et al., 2025) cho thấy rằng tỷ lệ thành công của AI giảm theo thời gian nhiệm vụ: các nhiệm vụ dài hơn khó hoàn thành hơn đối với các mô hình. Tuy nhiên, với mỗi thế hệ mô hình liên tiếp, sự suy giảm này đã trở nên nông hơn khi các mô hình thành công trong các nhiệm vụ ngày càng dài hơn. METR hoạt động hóa phạm vi nhiệm vụ chủ yếu như thời gian tối đa mà tại đó mô hình đạt được ít nhất 50% thành công, và sự tăng trưởng của thước đo này đã trở thành một chỉ số chính về tiến bộ của AI.

Hình 4.3 cho thấy một biện pháp tương tự bằng cách sử dụng các nguyên tắc cơ bản của chúng tôi. Biểu đồ cho thấy tỷ lệ thành công ở cấp độ nhiệm vụ so với thời gian của con người cần thiết, tất cả đều ở cấp độ nhiệm vụ O*NET. Trong dữ liệu API, tỷ lệ thành công giảm từ khoảng 60% đối với các nhiệm vụ dưới một giờ xuống còn khoảng 45% đối với các nhiệm vụ ước tính mất hơn 5 giờ cho con người. Đường phù hợp cắt đường thành công 50% nằm ngang tại 3,5 giờ, cho thấy các lệnh gọi API đạt tỷ lệ thành công 50% đối với các nhiệm vụ kéo dài 3,5 giờ. Ước tính thời gian tương tự trong điểm chuẩn kỹ thuật phần mềm của METR là 2 giờ cho Sonnet 4.5 và khoảng 5 giờ cho Opus 4.5. (Dữ liệu trong báo cáo này có trước khi phát hành Opus 4.5.)

Claude.ai cho một câu chuyện khác. Tỷ lệ thành công giảm chậm hơn nhiều như một hàm của thời gian nhiệm vụ. Ngoại suy bằng cách sử dụng đường phù hợp tuyến tính, Claude.ai sẽ đạt tỷ lệ thành công 50% sau khoảng 19 giờ. Điều này có thể phản ánh cách cuộc trò chuyện nhiều lượt thực sự chia các nhiệm vụ phức tạp thành các bước nhỏ hơn, với mỗi lượt cung cấp một vòng phản hồi cho phép người dùng sửa đổi hướng đi.

Cần lưu ý rằng một sự khác biệt cơ bản so với thiết lập METR là sự lựa chọn. METR xây dựng một điểm chuẩn trong đó một bộ nhiệm vụ cố định được giao cho các mô hình. Trong dữ liệu của chúng tôi, người dùng chọn nhiệm vụ để đưa đến Claude. Điều này có nghĩa là tỷ lệ thành công được quan sát không chỉ phản ánh khả năng mô hình mà còn cả phán đoán của người dùng về những gì sẽ hoạt động, chi phí thiết lập vấn đề cho Claude và thời gian tiết kiệm dự kiến ​​nếu nhiệm vụ thành công.

Nếu người dùng tránh các nhiệm vụ mà họ dự kiến ​​sẽ thất bại, ví dụ, tỷ lệ thành công được quan sát sẽ phóng đại khả năng thực tế trên toàn bộ phân phối các nhiệm vụ tiềm năng. Sự lựa chọn này có khả năng hoạt động trên cả hai nền tảng, nhưng theo những cách khác nhau: khách hàng API chọn các nhiệm vụ có thể tự động hóa, trong khi người dùng Claude.ai chọn các nhiệm vụ có thể hưởng lợi từ việc lặp lại. Cũng do hiệu ứng lựa chọn này, không có gì đảm bảo rằng các mô hình hoạt động hiệu quả hơn sẽ cho thấy sự cải thiện trong biểu đồ này, bởi vì người dùng có thể phản ứng với các mô hình mới bằng cách cung cấp các bài thuyết trình thử thách hơn về các nhiệm vụ O*NET tương tự.

Các điểm chuẩn được kiểm soát như của METR đo lường biên giới của khả năng tự chủ. Dữ liệu thực tế của chúng tôi có thể đo lường phạm vi nhiệm vụ hiệu quả, phản ánh sự kết hợp giữa khả năng mô hình và hành vi người dùng, và vượt ra ngoài các nhiệm vụ mã hóa. Cả hai cách tiếp cận đều cho thấy AI có thể hiệu quả đối với các nhiệm vụ đòi hỏi hàng giờ làm việc của con người.

Xem xét lại mức độ thâm nhập ngành nghề với phạm vi phủ sóng AI hiệu quả

Công việc trước đó của chúng tôi đã phát hiện ra rằng 36% công việc có sử dụng AI cho ít nhất một phần tư nhiệm vụ của họ, với khoảng 4% đạt được phạm vi phủ sóng 75%. Tuy nhiên, biện pháp này chỉ dựa trên sự xuất hiện của một nhiệm vụ trong dữ liệu của chúng tôi. Các nguyên tắc cơ bản được giới thiệu trong báo cáo này có thể giúp đặc tả tốt hơn cách AI đang thay đổi nội dung công việc của các ngành nghề³.

Thứ nhất, chúng tôi nhận thấy rằng phạm vi phủ sóng nhiệm vụ đang tăng lên. Kết hợp các báo cáo, 49% công việc đã chứng kiến ​​việc sử dụng AI cho ít nhất một phần tư nhiệm vụ của họ. Nhưng việc kết hợp tỷ lệ nhiệm vụ đó trong công việc và tỷ lệ thành công trung bình của Claude, cho thấy một bộ ngành nghề bị ảnh hưởng khác.

Chúng tôi xác định phạm vi phủ sóng AI hiệu quả là tỷ lệ thời gian làm việc của người lao động mà Claude có thể thực hiện thành công. Nó được tính bằng tổng trọng số của tỷ lệ thành công nhiệm vụ, trong đó trọng số của mỗi nhiệm vụ là tỷ lệ thời gian của nó được điều chỉnh theo tần suất mà nhiệm vụ đó xảy ra. Tỷ lệ thành công đến từ các nguyên tắc cơ bản của chúng tôi, ước tính thời gian đến từ công việc trước đó của chúng tôi về tác động năng suất và ước tính tần suất đến từ dữ liệu O*NET, nơi những người lao động được khảo sát cho biết họ thực hiện nhiệm vụ thường xuyên như thế nào.

Biểu đồ dưới đây cho thấy phạm vi phủ sóng AI hiệu quả (trục y) khác với phạm vi phủ sóng nhiệm vụ đơn thuần (trục x) như thế nào. Hai biểu đồ có tương quan cao, nhưng với những khác biệt chính. Ở phía bên phải của biểu đồ, các ngành nghề có phạm vi phủ sóng cao—nơi hầu hết các nhiệm vụ xuất hiện với một tần suất nhất định trong dữ liệu Claude—thường nằm dưới đường 45 độ. Điều này cho thấy rằng ngay cả phạm vi phủ sóng 90% nhiệm vụ cũng không nhất thiết chỉ ra tác động công việc lớn, vì Claude có thể thất bại trong các nhiệm vụ chính được bao phủ hoặc bỏ lỡ những nhiệm vụ tốn nhiều thời gian nhất.

Figure 4.4: Effective AI coverage vs. Task coverage Hình 4.4: Phạm vi phủ sóng AI hiệu quả so với phạm vi phủ sóng nhiệm vụ. Biểu đồ cho thấy sự phân tán của mối quan hệ hai biến giữa phạm vi phủ sóng AI hiệu quả của nhiệm vụ (%) và phạm vi phủ sóng nhiệm vụ, được đo ở cấp độ ngành nghề. Phạm vi phủ sóng AI hiệu quả theo dõi tỷ lệ nhiệm vụ của người lao động mà AI có thể thực hiện thành công, dựa trên dữ liệu Claude.ai. Phạm vi phủ sóng nhiệm vụ là tỷ lệ nhiệm vụ xuất hiện trong việc sử dụng Claude.ai. Đường đứt nét cho thấy nơi tỷ lệ phạm vi phủ sóng AI hiệu quả bằng phạm vi phủ sóng nhiệm vụ.

Nói một cách chi tiết, một số ngành nghề cho thấy sự khác biệt lớn về phạm vi phủ sóng AI hiệu quả so với phạm vi phủ sóng nhiệm vụ. Ví dụ, nhân viên nhập liệu có phạm vi phủ sóng AI hiệu quả cao nhất. Điều này là do mặc dù chỉ hai trong số chín nhiệm vụ của họ được bao phủ, nhiệm vụ lớn nhất của họ—đọc và nhập dữ liệu từ các tài liệu nguồn—có tỷ lệ thành công cao với Claude. AI xuất sắc trong những gì họ dành phần lớn thời gian.

Nhân viên ghi chép y tế và bác sĩ X-quang cũng tăng lên vì các nhiệm vụ được bao phủ của họ tình cờ là những nhiệm vụ tốn nhiều thời gian nhất và có tần suất cao nhất của họ. Đối với bác sĩ X-quang, hai nhiệm vụ hàng đầu của họ—diễn giải hình ảnh chẩn đoán và chuẩn bị báo cáo diễn giải—có tỷ lệ thành công cao. Các ngành nghề này có phạm vi phủ sóng nhiệm vụ thấp vì AI không thể thực hiện công việc thực hành hoặc hành chính trong hồ sơ công việc của họ, nhưng nó thành công trong công việc kiến thức cốt lõi chiếm phần lớn ngày làm việc của họ.

Vi sinh học giảm xuống dưới đường 45 độ, cho thấy phạm vi phủ sóng AI hiệu quả thấp hơn so với dự kiến ​​từ phạm vi phủ sóng nhiệm vụ đơn thuần. Claude bao phủ một nửa các nhiệm vụ của họ, nhưng không phải là nhiệm vụ tốn nhiều thời gian nhất của họ: nghiên cứu thực hành sử dụng thiết bị phòng thí nghiệm chuyên dụng.

Biện pháp này có thể cung cấp một bức tranh thực tế hơn về mức độ thâm nhập AI ở cấp độ công việc. Tuy nhiên, ý nghĩa của nó phụ thuộc vào tần suất các cuộc trò chuyện Claude này thực sự thay thế hoặc bổ sung cho công việc lẽ ra phải được thực hiện bởi con người. Đối với nhân viên nhập liệu, AI có thể thay thế các nhiệm vụ trước đây được thực hiện thủ công. Nhưng khi một cuộc trò chuyện Claude tương ứng với một giáo viên thực hiện một bài giảng, thì ít rõ ràng hơn về cách điều này chuyển thành giảm thời gian giảng dạy tại nơi làm việc. Trong công việc tương lai, chúng tôi có thể tận dụng dữ liệu API 1P của mình để hiểu những nhiệm vụ nào đang được tích hợp vào quy trình sản xuất.

Tác động của AI đối với nội dung nhiệm vụ của công việc

Ngoài việc AI có thể thực hiện thành công bao nhiêu phần trong ngày làm việc của người lao động, một câu hỏi riêng biệt là những nhiệm vụ nào được bao phủ, và liệu chúng có xu hướng là các thành phần có kỹ năng cao hay kỹ năng thấp của công việc hay không. Nghiên cứu gần đây đã nghiên cứu những thay đổi trong thành phần nhiệm vụ trong công việc để hiểu tác động của AI đối với tiền lương và việc làm. Một hiểu biết quan trọng là tác động của tự động hóa không chỉ phụ thuộc vào số lượng nhiệm vụ được bao phủ, mà còn vào những nhiệm vụ nào.

Để xem các công việc thay đổi như thế nào khi chúng ta loại bỏ các nhiệm vụ mà AI có thể thực hiện, trước tiên chúng tôi xây dựng một thước đo về mức độ kỹ năng cần thiết cho mỗi nhiệm vụ. O*NET không cung cấp yêu cầu giáo dục ở cấp độ nhiệm vụ, vì vậy chúng tôi huấn luyện một mô hình dự đoán số năm học vấn từ các embedding nhiệm vụ, sử dụng giáo dục ở cấp độ ngành nghề của BLS làm mục tiêu⁴. Bằng cách này, một ngành nghề có trình độ học vấn thấp có thể vẫn có một nhiệm vụ có kỹ năng cao nếu nó giống với những nhiệm vụ thường tồn tại trong các ngành nghề có trình độ học vấn cao. Ví dụ, Thư ký Pháp là một ngành nghề yêu cầu 12 năm học vấn, nhưng nhiệm vụ “Xem xét các ấn phẩm pháp lý và thực hiện tìm kiếm cơ sở dữ liệu để xác định luật và quyết định tòa án có liên quan đến các vụ án đang chờ xử lý” được dự đoán là yêu cầu 17,7 năm vì nó giống với các nhiệm vụ thường được thực hiện bởi luật sư và trợ lý pháp lý.

Dữ liệu cho thấy Claude có xu hướng bao phủ các nhiệm vụ đòi hỏi mức độ học vấn cao hơn. Mức giáo dục dự đoán trung bình cho các nhiệm vụ trong nền kinh tế là 13,2 năm. Đối với các nhiệm vụ mà chúng tôi thấy trong dữ liệu của mình, mức dự đoán trung bình cao hơn khoảng một năm, 14,4 năm (tương ứng với bằng Cao đẳng). Điều này phù hợp với kết quả ở cấp độ ngành nghề từ các báo cáo trước, cho thấy việc sử dụng Claude nhiều hơn trong các ngành nghề văn phòng.

Figure 4.5: Education level of all tasks vs. Claude-covered tasks Hình 4.5: Mức độ giáo dục của tất cả các nhiệm vụ so với các nhiệm vụ được Claude bao phủ. Điều này cho thấy hai biểu đồ tần suất. Các cột màu xanh lam cho thấy phân phối mức độ học vấn dự đoán ở cấp độ nhiệm vụ cho tất cả các nhiệm vụ trong cơ sở dữ liệu O*NET, có trọng số theo việc làm. Các cột màu cam cho thấy điều tương tự, hạn chế đối với các nhiệm vụ xuất hiện trong dữ liệu sử dụng Claude.ai.

Tiếp theo, chúng tôi tính toán việc loại bỏ các nhiệm vụ được Claude bao phủ sẽ thay đổi mức độ học vấn trung bình của những gì còn lại như thế nào. Tổng cộng, tác động bậc nhất ròng là giảm kỹ năng cho các công việc, vì AI loại bỏ các nhiệm vụ đòi hỏi trình độ học vấn tương đối cao hơn. Một công việc trải qua việc giảm kỹ năng như vậy là các nhà văn kỹ thuật, họ mất các nhiệm vụ như “Phân tích các diễn biến trong lĩnh vực cụ thể để xác định nhu cầu sửa đổi” (18,7 năm) và “Xem xét các tài liệu đã xuất bản và đề xuất sửa đổi hoặc thay đổi về phạm vi, định dạng” (16,4 năm), để lại các nhiệm vụ như “Vẽ phác thảo để minh họa các tài liệu được chỉ định” (13,6 năm) và “Quan sát các hoạt động sản xuất, phát triển và thử nghiệm” (13,5 năm). Đại lý du lịch cũng trải qua việc giảm kỹ năng vì AI bao phủ các nhiệm vụ như “Lập kế hoạch, mô tả, sắp xếp và bán các gói tour lịch trình” (13,5 năm) và “Tính toán chi phí đi lại và chỗ ở” (13,4 năm), trong khi các nhiệm vụ như “In hoặc yêu cầu vé của nhà cung cấp vận tải” (12,0 năm) và “Thu tiền thanh toán cho vận tải và chỗ ở” (11,5 năm) vẫn còn. Nhiều nghề giáo viên trải qua việc giảm kỹ năng vì AI giải quyết các nhiệm vụ như chấm điểm, tư vấn sinh viên, viết đề xuất xin tài trợ và tiến hành nghiên cứu mà không thể thực hiện công việc thực hành là giảng bài trực tiếp và quản lý lớp học.

Một số công việc thấy mức độ học vấn trung bình tăng lên. Quản lý bất động sản trải qua việc nâng cao kỹ năng vì AI bao phủ các nhiệm vụ hành chính thông thường—lưu giữ hồ sơ bán hàng (12,8 năm), xem xét tiền thuê nhà so với giá thị trường (12,6 năm)—trong khi các nhiệm vụ đòi hỏi sự phán đoán chuyên môn cấp cao hơn và tương tác trực tiếp vẫn còn, như đảm bảo các khoản vay, đàm phán với các công ty kiến trúc và gặp gỡ ban giám đốc.

Những mô hình này minh họa cách công việc có thể phát triển trong những năm tới khi nội dung nhiệm vụ của chúng điều chỉnh để phản ứng với AI. Nếu mức độ học vấn có thể được giải thích giống như chuyên môn trong phân tích của Autor và Thompson, thì khung làm việc của họ có thể dự đoán rằng tiền lương sẽ giảm và việc làm sẽ tăng đối với các nhà văn kỹ thuật và đại lý du lịch; ngược lại, các nhà quản lý bất động sản sẽ chuyên về đàm phán phức tạp và quản lý các bên liên quan, giảm việc làm trong khi tăng tiền lương.⁵

Tuy nhiên, biện pháp học vấn của chúng tôi khác với khái niệm chuyên môn của Autor và Thompson: khung làm việc của họ sẽ gán nhãn một số nhiệm vụ là chuyên môn cao trong khi của chúng tôi chỉ định mức độ học vấn thấp—ví dụ, nhiệm vụ của Thợ điện “Kết nối dây với bộ ngắt mạch, máy biến áp hoặc các thành phần khác.” Và những dự đoán này dựa trên các mô hình sử dụng Claude hiện tại, vốn sẽ thay đổi khi các mô hình được huấn luyện trên các khả năng mới và người dùng khám phá các ứng dụng mới—có khả năng thay đổi nhiệm vụ nào được bao phủ và liệu tác động ròng có phải là giảm kỹ năng hay nâng cao kỹ năng hay không.

Xem xét lại các hàm ý năng suất tổng thể của việc sử dụng Claude

Trong các công việc trước đó, chúng tôi đã ước tính rằng việc áp dụng AI rộng rãi có thể làm tăng trưởng năng suất lao động của Hoa Kỳ lên 1,8 điểm phần trăm hàng năm trong thập kỷ tới. Ở đây, chúng tôi xem xét lại phân tích đó, kết hợp nguyên tắc cơ bản về sự thành công của nhiệm vụ được giới thiệu trong báo cáo này và cách xử lý phong phú hơn về tính bổ sung của nhiệm vụ.

Dựa trên mức tăng tốc liên quan đến các nhiệm vụ có ít nhất 200 quan sát trong mẫu của chúng tôi gồm 1 triệu cuộc trò chuyện Claude.ai⁶, chúng tôi lặp lại phát hiện trước đó của chúng tôi rằng các mô hình thế hệ hiện tại và các mô hình sử dụng hiện tại ngụ ý tác động năng suất là 1,8 điểm phần trăm mỗi năm trong thập kỷ tới⁷.

Với việc bao gồm dữ liệu API 1P, chúng tôi có thể đánh giá liệu các tác động năng suất lao động ngụ ý có khác biệt dựa trên các mô hình triển khai Claude của doanh nghiệp hay không. Hai lực lượng đối kháng đang hoạt động: việc sử dụng API tập trung hơn vào một tập hợp hẹp hơn các nhiệm vụ và ngành nghề (đặc biệt là công việc liên quan đến mã hóa), điều này có xu hướng giảm các tác động ngụ ý; nhưng mức tăng tốc ở cấp độ nhiệm vụ cao hơn một cách trung bình trong số các nhiệm vụ API, như được ngụ ý bởi Hình 4.1. Những lực lượng này phần lớn bù trừ lẫn nhau: mẫu API cũng ngụ ý mức tăng trưởng năng suất lao động 1,8 điểm phần trăm trong thập kỷ tới.

Một phê bình nổi bật của phân tích này là nó không tính đến độ tin cậy của mô hình. Nếu người lao động phải xác thực đầu ra AI, thì lợi ích năng suất sẽ nhỏ hơn so với những gì được gợi ý bởi mức tăng tốc thô. Để đánh giá mức độ quan trọng về định lượng của kênh này, chúng tôi kết hợp nguyên tắc cơ bản về sự thành công của nhiệm vụ được giới thiệu trong báo cáo này, nhân thời gian tiết kiệm ở cấp độ nhiệm vụ với tỷ lệ thành công cụ thể của nhiệm vụ trước khi tổng hợp⁸.

Việc điều chỉnh này có tác động đáng kể: tăng trưởng năng suất ngụ ý giảm từ 1,8 xuống 1,2 điểm phần trăm mỗi năm cho thập kỷ tới dựa trên việc sử dụng Claude.ai và xuống 1,0 điểm phần trăm cho lưu lượng truy cập API. Tuy nhiên, ngay cả sau khi tính đến độ tin cậy, tác động ngụ ý vẫn có ý nghĩa kinh tế—mức tăng bền vững 1,0 điểm phần trăm mỗi năm trong mười năm tới sẽ đưa tốc độ tăng trưởng năng suất của Hoa Kỳ trở lại các mức đã có vào cuối những năm 1990 và đầu những năm 2000.

Một phê bình thứ hai liên quan đến tính bổ sung của nhiệm vụ. Nếu một số nhiệm vụ là thiết yếu và không thể dễ dàng thay thế, thì tác động năng suất tổng thể sẽ bị hạn chế bất kể mức tăng tốc đối với các nhiệm vụ khác. Giáo viên có thể chuẩn bị kế hoạch bài học hiệu quả hơn với AI trong khi không có tác động đến thời gian dành cho sinh viên trong lớp học.

Để thực hiện ý tưởng này, chúng tôi áp đặt một số cấu trúc lên cách chúng tôi tổng hợp thời gian tiết kiệm nhiệm vụ ở cấp độ nhiệm vụ trong các ngành nghề nhưng nếu không thì cộng các khoản tăng hiệu quả ngành nghề như trong phân tích chính. Cụ thể, chúng tôi giả định rằng trong mỗi ngành nghề, các nhiệm vụ được kết hợp theo bộ chỉ số Hiệu suất Thay thế Không đổi (CES), trong đó mỗi nhiệm vụ được trọng số theo thời gian ước tính dành cho mỗi nhiệm vụ như được tính toán trong phân tích trước đó của chúng tôi về tác động năng suất được ngụ ý bởi việc sử dụng Claude⁹.

Tham số chính là hệ số đàn hồi thay thế giữa các nhiệm vụ, $\sigma$. Khi hệ số đàn hồi thay thế nhỏ hơn một, các nhiệm vụ là bổ sung và những nhiệm vụ không được tăng tốc bởi AI trở thành điểm nghẽn cho lợi ích năng suất rộng lớn hơn. Mặt khác, khi hệ số đàn hồi thay thế lớn hơn một, thì người lao động có thể phân bổ sang các nhiệm vụ hiệu quả hơn—do đó khuếch đại thời gian tiết kiệm tổng thể ở cấp độ ngành nghề. Hệ số đàn hồi thay thế bằng một là một trường hợp đặc biệt, tái tạo phân tích chính ở trên.

Figure 4.6 Implied labor productivity effect from AI as a function of within-occupation task substitutability Hình 4.6 Tác động năng suất lao động ngụ ý từ AI như một hàm của khả năng thay thế nhiệm vụ trong ngành nghề. Hình này cho thấy tăng trưởng năng suất lao động tổng thể ngụ ý trong thập kỷ tới dựa trên lợi ích hiệu quả ước tính cho các nhiệm vụ có ít nhất 200 quan sát trong mẫu của chúng tôi gồm 1 triệu cuộc trò chuyện Claude.ai và 1 triệu hồ sơ từ lưu lượng truy cập API 1P. Hệ số đàn hồi thay thế chi phối mức độ mà các nhiệm vụ không được tăng cường bởi AI hạn chế lợi ích năng suất ngành nghề ngụ ý bởi việc sử dụng Claude theo một mô hình trong đó sản lượng ngành nghề là chỉ số CES trên các nhiệm vụ. Hệ số đàn hồi bằng 1 tái tạo kết quả cơ bản không điều chỉnh của chúng tôi là tăng 1,8 điểm phần trăm năng suất lao động trong thập kỷ tới. Các đường cong đã điều chỉnh theo sự thành công làm giảm giá trị tăng tốc ở cấp độ nhiệm vụ theo độ tin cậy của nhiệm vụ. Xem văn bản để biết thêm chi tiết.

Khi các nhiệm vụ là bổ sung, tuy nhiên, tác động năng suất lao động tổng thể ngụ ý giảm mạnh vì các tác động kinh tế bị giới hạn bởi các nhiệm vụ mà AI tăng tốc ít nhất. Ví dụ, ở $\sigma=0.5$, tác động năng suất lao động tổng thể ngụ ý là 0,7-0,9 điểm phần trăm mỗi năm—khoảng một nửa so với ước tính cơ bản của chúng tôi. Việc điều chỉnh thêm cho sự thành công của nhiệm vụ làm giảm thêm tác động năng suất ngụ ý xuống 0,8 điểm phần trăm cho Claude.ai và 0,6 điểm phần trăm cho API.

Mặt khác, khi hệ số đàn hồi thay thế lớn hơn một, năng suất lao động ngụ ý dựa trên các mô hình sử dụng trước Opus 4.5 cao hơn đáng kể. Ví dụ, ở $\sigma=1.5$, tác động năng suất lao động ngụ ý tăng lên 2,2-2,6 điểm phần trăm mỗi năm, phù hợp với việc chuyên môn hóa nhiều hơn vào các nhiệm vụ mà AI mang lại mức tăng tốc lớn nhất.

Trong cả hai trường hợp, tác động năng suất ngụ ý dựa trên lưu lượng truy cập API phản ứng nhạy hơn với mức độ thay thế nhiệm vụ. Điều này phù hợp với thực tế là có một tỷ lệ lớn hơn lưu lượng truy cập API tập trung vào ít nhiệm vụ hơn và các ngành nghề liên quan so với Claude.ai: Khi các nhiệm vụ là bổ sung, sự tập trung này làm khuếch đại vấn đề điểm nghẽn; khi chúng là các yếu tố thay thế, nó khuếch đại lợi ích năng suất từ ​​chuyên môn hóa nhiệm vụ.

Phân tích này cho thấy rằng tác động năng suất của tự động hóa cuối cùng có thể bị hạn chế bởi các nhiệm vụ điểm nghẽn mà AI chưa thể tự động hóa. Và tác động thị trường lao động của AI ngày càng có năng lực có thể bị ảnh hưởng tương tự bởi các lực lượng như vậy. Ví dụ, Gans và Goldfarb (2026) lập luận rằng sự hiện diện của các nhiệm vụ điểm nghẽn trong công việc có nghĩa là tự động hóa AI một phần có thể dẫn đến sự gia tăng thu nhập lao động vì các nhiệm vụ như vậy tăng giá trị kinh tế của chúng (ít nhất là cho đến khi một công việc được tự động hóa hoàn toàn).

Kết luận

Kết quả của chương này là tác động của AI đối với nền kinh tế có khả năng không đồng đều. Như khuôn khổ phạm vi phủ sóng AI hiệu quả của chúng tôi minh họa, các hàm ý thị trường lao động cho những người lao động khác nhau sẽ phụ thuộc vào mức độ tin cậy của các công cụ AI tiên tiến đối với các nhiệm vụ trung tâm nhất của họ.

Nhưng tác động thị trường lao động cũng có thể phụ thuộc vào yêu cầu kỹ năng của các nhiệm vụ mà AI có thể xử lý thành thạo so với phần còn lại của nền kinh tế. Thật vậy, chúng tôi nhận thấy rằng việc loại bỏ các nhiệm vụ mà Claude đã có thể xử lý khỏi nền kinh tế sẽ tạo ra tác động giảm kỹ năng ròng: các nhiệm vụ còn lại cho con người có yêu cầu giáo dục thấp hơn so với những nhiệm vụ do AI xử lý.

Mặc dù rất gợi ý, điều này có thể bỏ lỡ một chi tiết quan trọng: các nhiệm vụ phức tạp nhất nơi Claude được sử dụng có xu hướng cũng là những nhiệm vụ mà nó gặp khó khăn nhất. Thay vì thay thế các chuyên gia có kỹ năng cao, điều này có thể củng cố giá trị chuyên môn bổ sung của họ trong việc hiểu công việc của AI và đánh giá chất lượng của nó.

Đối trọng với những tác động biến đổi thị trường lao động này là tác động rộng lớn hơn đối với tăng trưởng và năng suất. Một mặt, việc kết hợp độ tin cậy của nhiệm vụ vào phân tích của chúng tôi làm giảm tác động ngụ ý đối với tăng trưởng năng suất lao động dựa trên các mô hình sử dụng Claude hiện tại. Nếu các nhiệm vụ điểm nghẽn bị ràng buộc, tác động ngụ ý sẽ giảm thêm. Mặt khác, sự tăng trưởng liên tục về khả năng mô hình cho thấy cả phạm vi phủ sóng nhiệm vụ và sự thành công của nhiệm vụ đều có thể tăng lên, điều này lần lượt có thể làm tăng tác động năng suất.

Tuyên bố kết luận

Báo cáo Chỉ số Kinh tế Anthropic lần thứ tư này giới thiệu các nguyên tắc kinh tế cơ bản—các đặc điểm nền tảng của việc sử dụng AI—cho thấy cách Claude được sử dụng bởi cả người tiêu dùng và doanh nghiệp. Chúng tôi sử dụng Claude để ước tính mức độ sử dụng thay đổi theo các khía cạnh này; các biện pháp này có độ chính xác định hướng và, khi kết hợp lại, cung cấp các tín hiệu quan trọng ngay cả khi các phân loại riêng lẻ không hoàn hảo.

Phát hiện của chúng tôi mang lại những hàm ý đáng kể cho cách AI sẽ định hình lại nền kinh tế và thị trường lao động. Đáng chú ý, Claude có xu hướng được sử dụng nhiều hơn và dường như mang lại lợi ích năng suất lớn hơn cho các nhiệm vụ đòi hỏi trình độ học vấn cao hơn. Nếu những nhiệm vụ này giảm đối với người lao động Hoa Kỳ, tác động ròng có thể là giảm kỹ năng cho các công việc. Nhưng những tác động này phụ thuộc rất nhiều vào tính bổ sung giữa các nhiệm vụ và liệu năng suất tăng lên trong một nhiệm vụ nhất định có thể làm tăng nhu cầu đối với nó hay không.

Ở cấp độ toàn cầu, mối quan hệ mạnh mẽ giữa thu nhập bình quân đầu người và các mô hình sử dụng—với các quốc gia có thu nhập cao hơn sử dụng Claude một cách hợp tác trong khi các quốc gia có thu nhập thấp hơn tập trung vào việc học và các ứng dụng cụ thể—cho thấy rằng tác động của AI sẽ được trung gian hóa bởi các cấu trúc thể chế hiện có thay vì diễn ra đồng đều. Các mô hình phổ biến về địa lý củng cố bức tranh này. Trong Hoa Kỳ, việc sử dụng bình quân đầu người đã hội tụ một chút; trên toàn cầu, sự phổ biến chậm hơn. Kết hợp với sự khác biệt dựa trên thu nhập về cách AI được sử dụng, điều này đặt ra câu hỏi liệu AI sẽ thu hẹp hay mở rộng khoảng cách kinh tế quốc tế.

Quan trọng không kém những mô hình được ghi nhận ở đây là những thay đổi tiềm năng giữa báo cáo này và các báo cáo tiếp theo. Khi khả năng của AI tiến bộ, tỷ lệ thành công của Claude có thể tăng lên, các mô hình sử dụng có thể cho thấy tính tự chủ cao hơn, người dùng có thể giải quyết các nhiệm vụ mới và phức tạp hơn, và các nhiệm vụ được chứng minh là có thể tự động hóa có thể được nâng cấp từ trò chuyện tương tác lên triển khai API. Chúng tôi sẽ theo dõi các động lực này theo thời gian, cung cấp một cái nhìn dọc về vai trò của AI trong nền kinh tế.

Dựa trên các bản phát hành trước đó, ấn bản này mở rộng đáng kể cả phạm vi và tính minh bạch của dữ liệu sử dụng mà chúng tôi chia sẻ, bao gồm các phân loại ở cấp độ nhiệm vụ theo các khía cạnh mới và các phân tích theo khu vực trên toàn cầu lần đầu tiên. Chúng tôi công bố dữ liệu này để cho phép các nhà nghiên cứu, nhà báo và công chúng điều tra các câu hỏi mới về tác động kinh tế của AI có thể hình thành cơ sở thực nghiệm cho các phản ứng chính sách.

Mức độ sẵn sàng của người dùng thử nghiệm AI và liệu các nhà hoạch định chính sách có tạo ra một bối cảnh pháp lý thúc đẩy cả an toàn và đổi mới hay không sẽ định hình cách AI biến đổi nền kinh tế. Để AI mang lại lợi ích cho người dùng trên toàn cầu, việc mở rộng khả năng tiếp cận là chưa đủ—phát triển vốn nhân lực cho phép sử dụng hiệu quả, đặc biệt là ở các nền kinh tế có thu nhập thấp hơn, là điều cần thiết.

Tác giả & Lời cảm ơn

Khối tác giả đầu tiên*: Ruth Appel, Maxim Massenkoff, Peter McCrory Tác giả chính của báo cáo

Khối tác giả thứ hai: Miles McCain, Ryan Heller, Tyler Neylon, Alex Tamkin

Lời cảm ơn

Xabi Azagirre, Tim Belonax, Keir Bradwell, Andy Braden, Dexter Callender III, Sylvie Carr, Miriam Chaum, Ronan Davy, Evan Frondorf, Deep Ganguli, Kunal Handa, Andrew Ho, Rebecca Jacobs, Owen Kaye-Kauderer, Bianca Lindner, Kelly Loftus, James Ma, Jennifer Martinez, Jared Mueller, Kelsey Nanan, Kim O’Rourke, Dianne Penn, Sarah Pollack, Ankur Rathi, Zoe Richards, Alexandra Sanderford, David Saunders, Michael Sellitto, Thariq Shihipar, Michael Stern, Kim Withee, Mengyi Xu, Tony Zeng, Xiuruo Zhang, Shuyi Zheng, Emily Pastewka, Angeli Jain, Sarah Heck, Jared Kaplan, Jack Clark, Dario Amodei

Trích dẫn

@online{anthropic2026aeiv4,
        author = {Ruth Appel and Maxim Massenkoff and Peter McCrory and Miles McCain and Ryan Heller and Tyler Neylon and Alex Tamkin},
        title = {Anthropic Economic Index report: economic primitives},
        date = {2026-01-15},
        year = {2026},
        url = {https://www.anthropic.com/research/anthropic-economic-index-january-2026-report},
}

Recommended for You

Chỉ số Kinh tế Anthropic- những khối xây dựng mới để hiểu về việc sử dụng AI

Chỉ số Kinh tế Anthropic- những khối xây dựng mới để hiểu về việc sử dụng AI

Giới thiệu về các khối xây dựng mới được trình bày trong Chỉ số Kinh tế Anthropic, cung cấp những hiểu biết sâu sắc hơn về các mẫu và tác động kinh tế của việc triển khai AI.

Các nhà khoa học đang sử dụng Claude để đẩy nhanh nghiên cứu và khám phá

Các nhà khoa học đang sử dụng Claude để đẩy nhanh nghiên cứu và khám phá

Một nghiên cứu điển hình minh họa cách các nhà khoa học đang tận dụng sức mạnh của Claude để hợp lý hóa các quy trình nghiên cứu, tăng tốc độ khám phá và thúc đẩy những tiến bộ trong các lĩnh vực khoa học khác nhau.