Tính toán và Cạnh tranh trong AI- Các FLOP khác nhau cho những người khác nhau
Bài viết thảo luận về các loại FLOP khác nhau và cách chúng được áp dụng trong AI.
- 14 min read
AI và Cạnh tranh về Máy tính: Mỗi Nhu cầu là một Cách tính FLOPs Khác Nhau
Bài đăng trên blog của Sasha Luccioni trên Hugging Face
Giới thiệu
Cuộc thảo luận công khai về chi phí máy tính trong AI thường xoay quanh những ước tính khổng lồ: hàng trăm nghìn GPU, hàng triệu giờ tính toán, hàng tỷ đô la đầu tư. Công trình của các viện nghiên cứu như Epoch AI là minh chứng cho những xu hướng này: phân tích của họ về các mô hình AI lớn nhất cho thấy sự tăng trưởng ổn định gấp 2-3 lần mỗi năm trong 8 năm qua, đưa chi phí lên mức có thể vượt quá một tỷ đô la vào năm 2026.
Mặc dù phân tích về các mô hình “tiên phong” đắt đỏ và “hiệu quả” nhất này chắc chắn quan trọng, nó cũng có thể làm sai lệch nhận thức của công chúng và các quyết định quản trị về AI nói chung. Như chúng ta đã chứng kiến sự gia tăng chóng mặt về chi phí cho các mô hình được quảng cáo là định hình “tiên phong”, những bước nhảy tương tự đã đạt được trong việc “làm được nhiều hơn với ít hơn”, và phần lớn các phương pháp phát triển AI trong các ứng dụng khoa học và thương mại vẫn tuân theo một logic rất khác.
Các loại mô hình AI nào được sử dụng trong thực tế?
Các viện nghiên cứu như Epoch AI định nghĩa “các mô hình đáng chú ý là những mô hình đạt được cải tiến hàng đầu về một chuẩn đánh giá được công nhận, được trích dẫn nhiều (hơn 1000 lần), có ý nghĩa lịch sử và đã cho thấy sự sử dụng đáng kể”. Mặc dù các mô hình này có thể được coi là có ảnh hưởng hoặc dễ nhận biết, chúng không nhất thiết đại diện cho hầu hết các ứng dụng thương mại của AI, vốn thường mang tính đặc thù theo ngữ cảnh và yêu cầu các định dạng dữ liệu có cấu trúc đa dạng như ứng dụng giọng nói, hệ gen học, phân tích hình ảnh hoặc dữ liệu dạng bảng không phù hợp với các mô hình ngôn ngữ.
Trên thực tế, các lĩnh vực từ y tế đến sản xuất và tài chính yêu cầu các mô hình được tùy chỉnh riêng cho các trường hợp sử dụng của họ, không chỉ về kiến thức chuyên ngành mà còn xem xét các vấn đề như quyền riêng tư dữ liệu và các ràng buộc pháp lý, điều này loại trừ việc sử dụng các mô hình, ví dụ, được lưu trữ ở một khu vực khác.
Những đặc điểm này làm cho các mô hình nhỏ hơn, hiệu quả hơn và độc lập trở nên hấp dẫn hơn đối với tất cả các bên tham gia hệ sinh thái AI, ngoại trừ những người chơi lớn nhất. Điều này có nghĩa là mặc dù tiêu chí đáng chú ý được sử dụng bởi các kênh như EpochAI có thể là dấu hiệu của các trường hợp sử dụng AI của các công ty công nghệ lớn cung cấp dịch vụ cho nhiều khách hàng và ứng dụng khác nhau, nhưng chúng còn lâu mới phổ biến.
Chi phí đào tạo một mô hình AI thương mại hiện tại là bao nhiêu?
Các công ty “tiên phong” đào tạo các mô hình lớn nhất đã tỏ ra khá kín tiếng về chi phí của họ. May mắn thay, công việc điều tra của các tác nhân bên ngoài đã cung cấp một số dữ liệu về vấn đề này. Đáng chú ý, theo Epoch AI, chi phí trung bình để đào tạo một “mô hình đáng chú ý” đã liên tục tăng trong khoảng thời gian từ năm 2022 đến năm 2026, với một số hạng mục vượt qua mốc 100 triệu USD trong năm cuối cùng; ngay cả khi không tính đến các chi phí bổ sung phát sinh từ các thử nghiệm và thu thập dữ liệu. Điều này làm cho việc đào tạo các loại mô hình này trở nên tốn kém đến mức không thể thực hiện được không chỉ đối với các doanh nghiệp vừa và nhỏ (SMEs), mà còn đối với hầu hết các nhà đầu tư thương mại lớn trong các ngành.
Ngược lại, chi phí đào tạo các mô hình AI - bao gồm cả những mô hình có giá trị khoa học mạnh mẽ và ứng dụng thương mại - được phát triển bởi phần lớn các nhà hoạt động là đa dạng và nhìn chung thấp hơn đáng kể. Trong một báo cáo gần đây, chúng tôi đã điều tra chi phí đào tạo các mô hình đáng chú ý trên nhiều khía cạnh khác nhau. Ví dụ, một số mô hình tiên phong về hiệu quả đào tạo hoặc kích thước trong khi ngang bằng với hiệu suất của các mô hình thương mại lớn nhất cho các ứng dụng cụ thể, một số khác gần đạt hiệu suất benchmark trên diện rộng trong khi minh bạch và linh hoạt hơn đáng kể, và những mô hình khác lại đẩy giới hạn của các lĩnh vực khoa học hoặc phương thức dữ liệu cụ thể. Chúng tôi thấy rằng việc đào tạo các mô hình này vẫn có thể dao động từ chỉ vài nghìn đô la đến tối đa vài chục triệu đô la, trong một số trường hợp là chi phí được chia sẻ giữa nhiều tổ chức hợp tác có lợi ích chung.
Sự tập trung vào các mô hình “một kích thước phù hợp cho tất cả” (kích thước = rất lớn)
Trong các cuộc thảo luận công khai gần đây, sự trỗi dậy của AI chủ yếu đồng nghĩa với sự nổi lên của một phiên bản công nghệ cụ thể; nơi một mô hình duy nhất được cho là có thể hỗ trợ hàng chục, hàng trăm, hoặc thậm chí theo một số người là một tập hợp “tổng quát” đầy đủ bao gồm mọi ứng dụng có thể của công nghệ.
Sự tập trung này đã được phản ánh qua một số sự phát triển thuật ngữ khác nhau, từ “mô hình nền tảng” được cho là mã hóa kiến thức tổng quát trong quá trình tiền đào tạo để sau này thích ứng với các ứng dụng, đến “AI Mục đích Tổng quát” như một danh mục pháp lý trong Đạo luật AI của EU, cho đến những gì các nhà phát triển AI lớn trong lĩnh vực doanh nghiệp hiện mô tả là các mô hình “tiên phong”.
Để mọi thứ trở nên bớt bối rối hơn, hầu hết người tiêu dùng chủ yếu nhận biết các mô hình này với các hệ thống mà chúng hỗ trợ – ChatGPT, Gemini, Grok, v.v. – thường kết hợp hoặc chuyển đổi giữa các backend tính toán khác nhau và các phiên bản của mô hình cơ bản.
Do các mô hình này được dự định cho mục đích tổng quát nhất có thể, mô hình đánh giá mô hình AI cũng đã chuyển sang các đánh giá chung chung. Các điểm chuẩn như SWE-Bench và GPQA/MMMLU được thiết kế cố tình để càng rộng càng tốt, và được sử dụng để đánh giá các mô hình mới khi chúng được đào tạo và để công bố kết quả trong các báo cáo kỹ thuật và bài báo truyền thông. Do đó, điều này khuyến khích việc phát triển các mô hình càng tổng quát càng tốt để hoạt động tốt trên các điểm chuẩn này, điều này càng góp phần duy trì câu chuyện về AI mục đích tổng quát.
Như chúng tôi đã khám phá trong bài báo gần đây của mình, bài báo nghiên cứu về tác động rộng lớn hơn của mô hình “lớn hơn là tốt hơn” trong AI, sự tập trung vào tính tổng quát và quy mô là có vấn đề vì nhiều lý do – từ sự không bền vững về môi trường (tức là lượng năng lượng cần thiết cho việc đào tạo và triển khai các mô hình ngày càng lớn và phức tạp) đến việc làm thu hẹp lĩnh vực về các vấn đề được giải quyết bằng AI (vì chúng bị giới hạn ở những vấn đề có đủ dữ liệu để đào tạo các mô hình lớn hơn), cũng như việc làm trầm trọng thêm sự tập trung quyền lực trong lĩnh vực này, điều này dường như làm suy yếu những người thiếu khả năng tiếp cận quỹ và tính toán cần thiết để cạnh tranh với các mô hình ngày càng lớn – tức là các nhà nghiên cứu học thuật, chính phủ và các tổ chức phi lợi nhuận. Bài báo, cũng như công việc liên quan của chúng tôi, cũng kêu gọi một cách tiếp cận minh bạch hơn trong việc tính toán và báo cáo chi phí của các mô hình AI, và cân bằng các chi phí này với lợi ích tiềm năng mà các mô hình được dự định có. Tuy nhiên, việc hạch toán các chi phí này phức tạp hơn là thoạt nhìn, đặc biệt là do thiếu minh bạch trong lĩnh vực này – hãy khám phá điều này chi tiết hơn bên dưới.
AI dễ tiếp cận hơn bạn nghĩ!
Mặc dù phần lớn sự chú ý của giới truyền thông và sự thổi phồng tập trung vào tương đương với những chiếc xe đua Công thức 1 có hiệu suất cao nhất cho AI (tức là LLM với hàng nghìn tỷ tham số), điều đó không có nghĩa là mọi người đều cần lái một chiếc để đi lấy đồ tạp hóa. Giống như bất kỳ phương tiện giao thông nào, có rất nhiều lựa chọn cho các tác vụ hàng ngày, và các thành viên trong cộng đồng AI nên xây dựng và tùy chỉnh các mô hình của riêng họ và lựa chọn sự kết hợp phù hợp giữa dữ liệu, tham số và lựa chọn triển khai phù hợp với ngân sách và bối cảnh của họ.
Bất chấp thành công và khả năng hiển thị rõ ràng của các mô hình “tiên phong”, chúng không cần phải là lựa chọn mặc định (và có lẽ không nên là vậy) cho hầu hết các trường hợp sử dụng, vốn có phạm vi, mục đích sử dụng và ngữ cảnh cụ thể.
Thật không may, các chi phí bổ sung của các hệ thống này – dù là tiền bạc, môi trường, xã hội, hay thậm chí là lợi thế cạnh tranh cho các công ty – hiếm khi được tiết lộ cho người dùng (và, khi được tiết lộ, chúng thường tối đa cũng chỉ là không đầy đủ); những người hiểu biết có thể bị cám dỗ bỏ qua lợi thế về kinh tế và bền vững môi trường của các phương pháp thay thế (bao gồm cả AI mở và mã nguồn mở 🤗) để đổi lấy sự tiện lợi khi sử dụng các mô hình thường mang lại kết quả ấn tượng hơn ngay lập tức.
Hãy xem xét các lựa chọn trước khi cam kết với một phương án
Như chúng tôi đã chỉ ra trong công trình gần đây của mình (và cuộc thảo luận ở trên), các mô hình nhỏ hơn, ít tốn kém hơn về mặt tính toán đều có khả năng thương mại và thường cạnh tranh ngang bằng với các đối tác lớn hơn trong các trường hợp sử dụng cụ thể, từ OCR đến giải trình tự bộ gen và thậm chí một số trường hợp sử dụng phổ biến nhất của kỹ thuật phần mềm được hỗ trợ bởi AI. Điều này mạnh mẽ gợi ý rằng chúng ta nên thay đổi cách tiếp cận AI: thay vì bắt đầu với những gì được coi là “mô hình AI tốt nhất tổng thể” và tìm kiếm các ứng dụng mà nó có thể tự động hóa, hãy bắt đầu với câu hỏi về những gì chúng ta muốn làm, và tìm kiếm công cụ AI phù hợp (và hiệu quả nhất) cho nó!
Hugging Face Hub thực hiện cách tiếp cận này bằng cách cho phép người dùng lọc mô hình không chỉ dựa trên tác vụ mà chúng thực hiện (bao gồm cả tác vụ đa phương thức, dự báo chuỗi thời gian và thậm chí cả robot!) mà còn dựa trên số lượng tham số và thậm chí cả kết quả đánh giá được báo cáo của chúng. Loại bộ lọc này có thể được sử dụng làm bước đầu tiên để chọn một mô hình cơ sở để tinh chỉnh, hoặc để kiểm tra các mô hình khác nhau sẵn có để xem độ chính xác mà chúng báo cáo trên các tập dữ liệu benchmark chuyển thành hiệu suất trong thế giới thực như thế nào.
Để hiểu rõ hơn về chi phí môi trường và tài chính của việc triển khai các hệ thống này, các công cụ như dự án AI Energy Score sử dụng thử nghiệm thực nghiệm để đo lường mức tiêu thụ năng lượng của các mô hình trên các tác vụ và phương thức khác nhau, nhằm giúp người dùng chọn mô hình phù hợp nhất cho một ứng dụng nhất định. Điều này cho thấy sự khác biệt gấp 340.000 lần giữa các mô hình có mức sử dụng năng lượng cao nhất và thấp nhất nói chung, và nhóm gần đây nhất của các mô hình được thử nghiệm cho thấy các mô hình suy luận sử dụng năng lượng gấp nhiều lần do số lượng token lớn mà chúng xuất ra. Các sáng kiến khác như Open LLM Leaderboard và MLPerf cung cấp những hiểu biết tương tự, cũng bao gồm các chỉ số hiệu suất trên các tác vụ và mô hình khác nhau. Chúng tôi cung cấp một cái nhìn tổng quan bổ sung về các chi phí này cho một số mô hình được chọn trong nghiên cứu của chúng tôi.
Một trong những ưu điểm và nhược điểm của AI là sự đa dạng đáng kinh ngạc của nó - vô số các phương pháp tồn tại và các cách chúng ta có thể sử dụng chúng để giải quyết các vấn đề thực tế. Điều này có thể làm cho các phương pháp “một kích thước phù hợp cho tất cả” đặc biệt hấp dẫn, vì chúng có thể, ít nhất là về lý thuyết, cho phép giải quyết nhiều tác vụ cùng một lúc và đã cho thấy kết quả cực kỳ hứa hẹn trên nhiều điểm chuẩn. Nhưng cuối cùng, không có tập dữ liệu benchmark hoặc chỉ số hiệu quả năng lượng duy nhất nào có thể thực sự đại diện cho nhiều đặc điểm của việc triển khai trong thế giới thực – vốn đi kèm với các hạn chế về phần cứng, dữ liệu và khả năng sử dụng khác biệt rất lớn giữa các tổ chức.
Dành thời gian tìm kiếm phương pháp tiếp cận tốt nhất cho nhiệm vụ đang thực hiện thay vì mặc định chọn sản phẩm AI mới nhất và sáng bóng nhất do bên ngoài vận hành có thể giúp ích rất nhiều trong việc giảm thiểu các tác động tiêu cực của AI cũng như thúc đẩy các kết quả tích cực cho những người triển khai (và chịu ảnh hưởng) của các hệ thống AI; cho dù điều đó có nghĩa là chọn mô hình hiện có hiệu quả nhất về chi phí để giải quyết một nhiệm vụ cụ thể, thu thập dữ liệu để điều chỉnh một hệ thống hiện có cho ngữ cảnh triển khai, hoặc tự phát triển ngăn xếp AI của riêng mình – một mình hoặc với các tổ chức khác có lợi ích và yêu cầu tương tự. Chúng tôi hy vọng rằng việc cung cấp một cái nhìn đa dạng hơn về chi phí của AI sẽ khuyến khích các tổ chức thấy được họ có thể (và nên!) có một chiến lược AI mà họ thực sự sở hữu; và phụ thuộc vào.
Xem báo cáo đầy đủ trình bày kết quả của chúng tôi tại đây!
Link bài viết gốc
- Tags:
- Ai
- 5 Days Ago
- Huggingface.co