Gemini 2.5 Flash-Lite hiện đã sẵn sàng cho sử dụng sản xuất quy mô lớn

Mô hình

  • 5 min read
Gemini 2.5 Flash-Lite hiện đã sẵn sàng cho sử dụng sản xuất quy mô lớn
Mô hình

Gemini 2.5 Flash-Lite đã ổn định và có sẵn rộng rãi

Hôm nay, chúng tôi xin công bố phiên bản ổn định của Gemini 2.5 Flash-Lite, mô hình nhanh nhất và có chi phí thấp nhất ($0.10 đầu vào mỗi 1 triệu, $0.40 đầu ra mỗi 1 triệu) trong gia đình mô hình Gemini 2.5. Chúng tôi đã phát triển 2.5 Flash-Lite để đẩy ranh giới về trí tuệ trên mỗi đô la, với khả năng suy luận tích hợp có thể được bật tùy chọn cho các trường hợp sử dụng đòi hỏi khắt khe hơn. Tiếp nối đà phát triển của 2.5 Pro và 2.5 Flash, mô hình này hoàn thiện bộ mô hình 2.5 của chúng tôi, sẵn sàng cho việc sản xuất quy mô lớn.

Mô hình 2.5 hiệu quả và nhanh nhất của chúng tôi tính đến nay

Gemini 2.5 Flash-Lite cân bằng giữa hiệu suất và chi phí, mà không làm giảm chất lượng, đặc biệt đối với các tác vụ nhạy cảm về độ trễ như dịch thuật và phân loại.

Đây là những gì làm cho nó nổi bật:

  • Tốc độ hàng đầu: Gemini 2.5 Flash-Lite có độ trễ thấp hơn so với cả 2.0 Flash-Lite và 2.0 Flash trên một tập hợp các câu lệnh đa dạng.
  • Hiệu quả chi phí: Đây là mô hình 2.5 có chi phí thấp nhất của chúng tôi, với giá $0.10 / 1 triệu token đầu vào và $0.40 / 1 triệu token đầu ra, cho phép bạn xử lý khối lượng yêu cầu lớn với chi phí hợp lý. Chúng tôi cũng đã giảm 40% giá đầu vào âm thanh so với bản xem trước.
  • Nhỏ gọn và thông minh: Nó thể hiện chất lượng tổng thể cao hơn so với 2.0 Flash-Lite trên nhiều loại điểm chuẩn, bao gồm lập trình, toán học, khoa học, suy luận và hiểu đa phương thức.
  • Đầy đủ tính năng: Khi bạn xây dựng với 2.5 Flash-Lite, bạn có quyền truy cập vào cửa sổ ngữ cảnh 1 triệu token, ngân sách suy nghĩ có thể kiểm soát và hỗ trợ các công cụ gốc như Grounding với Tìm kiếm Google, Thực thi Mã và Ngữ cảnh URL.

Gemini 2.5 Flash-Lite hoạt động như thế nào

Kể từ khi ra mắt 2.5 Flash-Lite, chúng tôi đã chứng kiến một số triển khai cực kỳ thành công, dưới đây là một số ví dụ yêu thích của chúng tôi:

  • Satlyt đang xây dựng một nền tảng điện toán không gian phi tập trung sẽ biến đổi cách dữ liệu vệ tinh được xử lý và sử dụng để tóm tắt theo thời gian thực về viễn trắc trên quỹ đạo, quản lý tác vụ tự động và phân tích liên lạc vệ tinh với vệ tinh. Tốc độ của 2.5 Flash-Lite đã giúp giảm 45% độ trễ cho chẩn đoán quan trọng trên tàu và giảm 30% mức tiêu thụ điện năng so với các mô hình cơ sở của họ.
  • HeyGen sử dụng AI để tạo avatar cho nội dung video và tận dụng Gemini 2.5 Flash-Lite để tự động hóa lập kế hoạch video, phân tích và tối ưu hóa nội dung, và dịch video sang hơn 180 ngôn ngữ. Điều này cho phép họ cung cấp trải nghiệm toàn cầu, cá nhân hóa cho người dùng của họ.
  • DocsHound biến các bản demo sản phẩm thành tài liệu bằng cách sử dụng Gemini 2.5 Flash-Lite để xử lý các video dài và trích xuất hàng nghìn ảnh chụp màn hình với độ trễ thấp. Điều này biến cảnh quay thành tài liệu toàn diện và dữ liệu đào tạo cho các tác nhân AI nhanh hơn nhiều so với các phương pháp truyền thống.
  • Evertune giúp các thương hiệu hiểu cách họ được thể hiện trên các mô hình AI. Gemini 2.5 Flash-Lite là một yếu tố thay đổi cuộc chơi đối với họ, giúp tăng tốc đáng kể việc phân tích và tạo báo cáo. Hiệu suất nhanh của nó cho phép họ nhanh chóng quét và tổng hợp khối lượng lớn kết quả mô hình để cung cấp cho khách hàng những thông tin chi tiết năng động, kịp thời.

Bạn có thể bắt đầu sử dụng 2.5 Flash-Lite bằng cách chỉ định “gemini-2.5-flash-lite” trong mã của bạn. Nếu bạn đang sử dụng phiên bản xem trước, bạn có thể chuyển sang “gemini-2.5-flash-lite” vì đây là cùng một mô hình cơ bản. Chúng tôi dự định xóa bí danh xem trước của Flash-Lite vào ngày 25 tháng 8.

Sẵn sàng bắt đầu xây dựng? Hãy thử phiên bản ổn định của Gemini 2.5 Flash-Lite ngay bây giờ trong Google AI StudioVertex AI.

Bài viết liên quan

Recommended for You

T5Gemma- Một bộ sưu tập mới các mô hình Gemma mã hóa-giải mã

T5Gemma- Một bộ sưu tập mới các mô hình Gemma mã hóa-giải mã

Mô hình

AlphaEarth Foundations giúp lập bản đồ hành tinh của chúng ta với chi tiết chưa từng có

AlphaEarth Foundations giúp lập bản đồ hành tinh của chúng ta với chi tiết chưa từng có

Khoa học