Featherless AI trên Hugging Face Inference Providers 🔥

Featherless AI hiện đã có trên Hugging Face Inference Providers!

June 12, 2025
5 min read

Featherless AI trên Hugging Face Inference Providers 🔥

Ảnh banner

Chúng tôi rất vui mừng thông báo rằng Featherless AI hiện là một Inference Provider được hỗ trợ trên Hugging Face Hub!

Featherless AI gia nhập hệ sinh thái đang phát triển của chúng tôi, nâng cao phạm vi và khả năng của suy luận không máy chủ trực tiếp trên các trang mô hình của Hub. Inference Providers cũng được tích hợp liền mạch vào SDK máy khách của chúng tôi (cho cả JS và Python), giúp bạn cực kỳ dễ dàng sử dụng nhiều loại mô hình với các nhà cung cấp ưa thích của bạn.

Featherless AI hỗ trợ nhiều loại mô hình văn bản và đàm thoại, bao gồm các mô hình nguồn mở mới nhất từ DeepSeek, Meta, Google, Qwen, v.v.

Featherless AI là nhà cung cấp suy luận AI không máy chủ với khả năng điều phối GPU và tải mô hình độc đáo, giúp người dùng có thể sử dụng một danh mục mô hình cực kỳ lớn. Các nhà cung cấp thường cung cấp chi phí truy cập thấp cho một tập hợp mô hình giới hạn hoặc phạm vi mô hình không giới hạn, trong đó người dùng quản lý máy chủ và chi phí vận hành liên quan. Featherless cung cấp những gì tốt nhất của cả hai thế giới, cung cấp phạm vi và sự đa dạng mô hình vô song nhưng với giá cả không máy chủ. Tìm danh sách đầy đủ các mô hình được hỗ trợ trên trang mô hình.

Chúng tôi rất vui khi thấy những gì bạn sẽ xây dựng với nhà cung cấp mới này!

Đọc thêm về cách sử dụng Featherless làm Inference Provider trong trang tài liệu chuyên dụng của nó.

Cách thức hoạt động

Trong giao diện người dùng trang web

Trong cài đặt tài khoản người dùng của bạn, bạn có thể:
- Đặt khóa API của riêng bạn cho các nhà cung cấp mà bạn đã đăng ký. Nếu không có khóa tùy chỉnh nào được đặt, các yêu cầu của bạn sẽ được định tuyến qua HF. Tìm hiểu thêm về các loại yêu cầu trong tài liệu.
- Sắp xếp các nhà cung cấp theo sở thích. Điều này áp dụng cho tiện ích và đoạn mã trong các trang mô hình.
Như đã đề cập, có hai chế độ khi gọi Inference Providers:
- Khóa tùy chỉnh (các cuộc gọi đi trực tiếp đến nhà cung cấp suy luận, sử dụng khóa API của riêng bạn của nhà cung cấp suy luận tương ứng)
- Được HF định tuyến (trong trường hợp đó, bạn không cần mã thông báo từ nhà cung cấp và các khoản phí được áp dụng trực tiếp vào tài khoản HF của bạn thay vì tài khoản của nhà cung cấp)
Các trang mô hình giới thiệu các nhà cung cấp suy luận của bên thứ ba (những nhà cung cấp tương thích với mô hình hiện tại, được sắp xếp theo sở thích của người dùng)

Từ SDK máy khách

từ Python, sử dụng huggingface_hub

Ví dụ sau đây cho thấy cách sử dụng DeepSeek-R1 bằng Featherless AI làm nhà cung cấp suy luận. Bạn có thể sử dụng mã thông báo Hugging Face để tự động định tuyến qua Hugging Face hoặc khóa API Featherless AI của riêng bạn nếu bạn có.

Cài đặt hoặc nâng cấp huggingface_hub để đảm bảo bạn có phiên bản v0.33.0 trở lên: pip install --upgrade huggingface-hub

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="featherless-ai",
    api_key=os.environ["HF_TOKEN"]
)

messages = [
    {
        "role": "user",
        "content": "What is the capital of France?"
    }
]

completion = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-R1-0528", 
    messages=messages, 
)

print(completion.choices[0].message)

từ JS sử dụng @huggingface/inference

import { InferenceClient } from "@huggingface/inference";

const client = new InferenceClient(process.env.HF_TOKEN);

const chatCompletion = await client.chatCompletion({
    model: "deepseek-ai/DeepSeek-R1-0528",
    messages: [
        {
            role: "user",
            content: "What is the capital of France?"
        }
    ],
    provider: "featherless-ai",
});

console.log(chatCompletion.choices[0].message);

Thanh toán

Đối với các yêu cầu trực tiếp, tức là khi bạn sử dụng khóa từ nhà cung cấp suy luận, bạn sẽ bị tính phí bởi nhà cung cấp tương ứng. Ví dụ: nếu bạn sử dụng khóa API Featherless AI, bạn sẽ bị tính phí trên tài khoản Featherless AI của mình.

Đối với các yêu cầu được định tuyến, tức là khi bạn xác thực thông qua Hugging Face Hub, bạn sẽ chỉ trả mức giá API tiêu chuẩn của nhà cung cấp. Chúng tôi không tính thêm bất kỳ khoản phí nào, chúng tôi chỉ chuyển trực tiếp chi phí của nhà cung cấp. (Trong tương lai, chúng tôi có thể thiết lập các thỏa thuận chia sẻ doanh thu với các đối tác nhà cung cấp của mình.)

Lưu ý quan trọng ‼️ Người dùng PRO nhận được 2 đô la tín dụng Inference mỗi tháng. Bạn có thể sử dụng chúng trên các nhà cung cấp. 🔥

Đăng ký gói Hugging Face PRO để có quyền truy cập vào tín dụng Inference, ZeroGPU, Chế độ Dev Spaces, giới hạn cao hơn 20 lần, v.v.

Chúng tôi cũng cung cấp suy luận miễn phí với một hạn ngạch nhỏ cho người dùng miễn phí đã đăng nhập của chúng tôi, nhưng vui lòng nâng cấp lên PRO nếu bạn có thể!

Phản hồi và các bước tiếp theo

Chúng tôi rất mong nhận được phản hồi của bạn! Chia sẻ suy nghĩ và/hoặc nhận xét của bạn tại đây: https://huggingface.co/spaces/huggingface/HuggingDiscussions/discussions/49

AI Today - SkyAI

Featherless AI trên Hugging Face Inference Providers 🔥

Featherless AI trên Hugging Face Inference Providers 🔥

Cách thức hoạt động

Trong giao diện người dùng trang web

Từ SDK máy khách

từ Python, sử dụng huggingface_hub

từ JS sử dụng @huggingface/inference

Thanh toán

Phản hồi và các bước tiếp theo

Link bài viết gốc