Công ty khởi nghiệp thuế AI Blue J đã hủy bỏ toàn bộ mô hình kinh doanh của mình để lấy ChatGPT — và trở thành một công ty trị giá 300 triệu đô la
Vào mùa đông năm 2022, khi thế giới công nghệ bị cuốn hút bởi sự xuất hiện đột ngột và bùng nổ của ChatGPT của OpenAI, Benjamin Alarie đã đối mặt với một lựa chọn bước ngoặt. Công ty khởi nghiệp công nghệ pháp lý của ông, Blue J, đã có một hoạt động kinh doanh đáng nể được xây dựng dựa trên AI của thời đại đã qua, phục vụ hàng trăm công ty kế toán với các mô hình dự đoán. Nhưng nó đã chạm trần.
- 13 min read
AI tax startup Blue J chuyển mình nhờ ChatGPT, đạt định giá 300 triệu USD
Vào mùa đông năm 2022, khi thế giới công nghệ bị cuốn hút bởi sự xuất hiện đột ngột và bùng nổ của ChatGPT từ OpenAI, Benjamin Alarie, một giáo sư luật thuế kiêm khởi nghiệp công nghệ pháp lý, đã đứng trước một lựa chọn mang tính bước ngoặt. Công ty của ông, Blue J, đã có một nền tảng vững chắc được xây dựng từ AI thế hệ cũ, phục vụ hàng trăm công ty kế toán với các mô hình dự đoán. Tuy nhiên, công ty đã chạm đến giới hạn.
Alarie, giáo sư luật thuế tại Đại học Toronto, nhìn nhận khả năng còn non nớt, nhiều sai sót nhưng vô cùng mạnh mẽ của các mô hình ngôn ngữ lớn không phải là sự tò mò, mà là tương lai. Ông đã đưa ra một quyết định đầy rủi ro: chuyển đổi toàn bộ công ty, vốn được xây dựng cẩn thận trong gần một thập kỷ, và tái thiết nó từ đầu dựa trên công nghệ chưa được chứng minh này.
Quyết định đó đã mang lại thành quả ngọt ngào. Kể từ đó, Blue J đã lặng lẽ huy động được 122 triệu USD vòng gọi vốn Series D do Oak HC/FT và Sapphire Ventures đồng dẫn đầu, đưa định giá công ty lên hơn 300 triệu USD. Bước đi này đã biến Blue J từ một công ty nhỏ bé thành một trong những công ty công nghệ pháp lý phát triển nhanh nhất Canada, tăng doanh thu gấp khoảng 12 lần và thu hút 10 đến 15 khách hàng mới mỗi ngày.
Công ty hiện đang phục vụ hơn 3.500 tổ chức, bao gồm cả tập đoàn kế toán lớn KPMG và nhiều công ty thuộc Fortune 500. Blue J đang giải quyết một nút thắt quan trọng trong ngành dịch vụ chuyên nghiệp: tình trạng thiếu hụt nhân tài nghiêm trọng và ngày càng trầm trọng. Hoa Kỳ hiện có ít kế toán viên hơn 340.000 người so với 5 năm trước, và với 75% CPA hiện tại dự kiến sẽ nghỉ hưu trong thập kỷ tới, các công ty đang tuyệt vọng tìm kiếm các công cụ có thể khuếch đại năng suất của các chuyên gia còn lại.
“Những gì từng khiến các chuyên gia thuế tốn 15 giờ nghiên cứu thủ công, giờ đây có thể hoàn thành chỉ trong khoảng 15 giây với Blue J,” Alarie, CEO của công ty, cho biết trong một cuộc phỏng vấn độc quyền với VentureBeat. “Giá trị đề xuất đó — chúng tôi có thể biến hàng giờ làm việc thành vài giây làm việc — đó là động lực thúc đẩy phần lớn thành công này.”
Khi tiểu sử của hiệu trưởng bị sai: Khoảnh khắc thay đổi tất cả
Alarie nhớ lại tháng 1 năm 2023, khi hiệu trưởng trường luật ghé văn phòng ông để chúc mừng năm mới. Ông hỏi bà về ChatGPT và yêu cầu AI mô tả về bà. ChatGPT đã tự tin tạo ra một tiểu sử. Một số chi tiết chính xác. Một số hoàn toàn bịa đặt.
“Bà ấy nói, ‘Được rồi, điều này thực sự khá đáng sợ. Điều này là sai, và nó có những hệ lụy,’ ” Alarie kể lại. Tuy nhiên, khoảnh khắc thất bại rõ ràng đó không làm ông nao núng. Thay vào đó, nó đã củng cố niềm tin của ông.
Phiên bản đầu tiên của công ty, ra mắt năm 2015, sử dụng học máy có giám sát để xây dựng các mô hình dự đoán có thể dự báo kết quả tư pháp về các vấn đề thuế cụ thể. Mặc dù có tính kỹ thuật cao, nó có một lỗi cơ bản: nó không thể trả lời mọi câu hỏi nghiên cứu thuế.
“Thách thức là nó không thể trả lời mọi câu hỏi nghiên cứu thuế, đó thực sự là mục tiêu tối thượng,” Alarie nói. Khách hàng yêu thích công cụ này khi nó áp dụng cho vấn đề của họ, nhưng sẽ nhanh chóng bỏ rơi nó khi không phù hợp. Doanh thu đã tăng trưởng chậm lại quanh mức 2 triệu USD mỗi năm.
Bất chấp hiện tượng “ảo giác” (hallucinations) nổi tiếng của ChatGPT, Alarie đã thuyết phục hội đồng quản trị thực hiện việc chuyển đổi. “Tôi có niềm tin rằng nếu chúng tôi tiếp tục đi theo con đường đó, chúng tôi sẽ không thể giải quyết hạn chế số một của mình,” ông nói. “Các mô hình ngôn ngữ lớn dường như là một hướng đi rất hứa hẹn.”
Ông đã giao cho nhóm của mình sáu tháng để cho ra mắt một sản phẩm hoạt động.
Từ phản hồi 90 giây đến 3 triệu truy vấn: Blue J đã chế ngự ảo giác AI như thế nào
Đến tháng 8 năm 2023, Blue J đã sẵn sàng ra mắt. Alarie thừa nhận rằng sản phẩm ban đầu “khá tệ”. Hệ thống mất 90 giây để phản hồi. Khoảng một nửa số câu trả lời có vấn đề. Điểm NPS (Net Promoter Score) chỉ đạt 20.
Điều đã biến sản phẩm còn nhiều thiếu sót đó thành nền tảng ngày nay — với thời gian phản hồi tính bằng giây, tỷ lệ không hài lòng chỉ một trên 700 truy vấn và điểm NPS ở mức giữa 80 — là sự tập trung không ngừng vào ba trụ cột chiến lược.
Đầu tiên là nội dung độc quyền ở quy mô lớn. Blue J đã ký hợp đồng cấp phép độc quyền với Tax Analysts (Tax Notes) và IBFD, cơ quan thuế toàn cầu có trụ sở tại Amsterdam, bao phủ hơn 220 khu vực pháp lý. “Chúng tôi là nền tảng duy nhất trên trái đất tiếp nhận thông tin thuế tốt nhất của Hoa Kỳ từ Tax Notes và thông tin thuế toàn cầu tốt nhất từ IBFD,” Alarie cho biết.
Thứ hai là chuyên môn sâu của con người. Blue J có các chuyên gia thuế do Susan Massey, người đã có 13 năm làm việc tại Văn phòng Cố vấn Trưởng của IRS với vai trò Trưởng Nhánh Thuế Doanh nghiệp, dẫn dắt. Đội ngũ của bà liên tục kiểm tra AI và cải thiện hiệu suất của nó.
Thứ ba là vòng lặp phản hồi chưa từng có. Với hơn 3 triệu truy vấn nghiên cứu thuế được xử lý vào năm 2025, Blue J đang tích lũy dữ liệu vô song. Mỗi truy vấn tạo ra phản hồi chảy ngược lại vào hệ thống.
Tỷ lệ người dùng hoạt động hàng tuần dao động từ 75% đến 85%, so với 15% đến 25% đối với các nền tảng truyền thống. “Một tỷ lệ hào phóng là chúng tôi được sử dụng chuyên sâu gấp năm lần,” Alarie lưu ý.
Bên trong mối quan hệ đối tác truy cập sớm của Blue J với OpenAI
Blue J duy trì một mối quan hệ khác thường chặt chẽ với OpenAI, điều này đã chứng tỏ là rất quan trọng đối với thành công của nó. “Chúng tôi có mối quan hệ rất tốt với OpenAI và chúng tôi được tiếp cận sớm với các mô hình của họ,” Alarie nói. “Nó khá hợp tác. Chúng tôi cung cấp cho họ rất nhiều phản hồi chất lượng cao về mức độ hiệu quả của các phiên bản mô hình sắp tới.”
Phản hồi này tỏ ra có giá trị bởi Blue J đã phát triển cái mà Alarie gọi là các câu hỏi kiểm tra “có giá trị sinh thái” — được rút ra từ các truy vấn thực tế của các chuyên gia thuế, với các câu trả lời đúng được xác định bởi đội ngũ chuyên gia của Blue J. Điều này giúp OpenAI cải thiện hiệu suất trên các tác vụ suy luận phức tạp.
Công ty kiểm tra các mô hình từ tất cả các nhà cung cấp lớn — OpenAI, Anthropic, Gemini của Google và các giải pháp mã nguồn mở — liên tục đánh giá mô hình nào hoạt động tốt nhất. “Chúng tôi không nhất thiết phải cam kết 100% với bất kỳ nhà cung cấp cụ thể nào,” ông giải thích. “Chúng tôi luôn kiểm tra.”
Cách tiếp cận này giúp Blue J điều hướng mô hình kinh doanh đầy thách thức: tính phí khoảng 1.500 USD mỗi chỗ ngồi hàng năm cho các truy vấn không giới hạn trong khi vẫn chi trả chi phí tính toán biến đổi. “Chúng tôi đã cam kết trước để mang lại cho họ trải nghiệm người dùng thực sự tốt, nghiên cứu thuế không giới hạn với mức giá cố định,” Alarie nói. “Chúng tôi đang hấp thụ rất nhiều rủi ro đó.”
Sự cạnh tranh giữa các nhà cung cấp mô hình cơ bản tạo áp lực giảm giá API, trong khi mô hình sử dụng thận trọng của Blue J đã chứng tỏ độ chính xác. Tỷ lệ giữ chân doanh thu gộp vượt quá 99%, trong khi tỷ lệ giữ chân doanh thu ròng đạt 130% — được coi là tốt nhất trong phân khúc cho các doanh nghiệp SaaS.
Đối đầu Thomson Reuters và LexisNexis với 75% tương tác hàng tuần
Blue J đối mặt với sự cạnh tranh từ các nhà xuất bản lâu đời như Thomson Reuters, LexisNexis và Bloomberg, tất cả đều đã công bố các khả năng AI trong suốt năm 2023 và 2024. Tuy nhiên, các chỉ số tương tác của Blue J cho thấy công ty đã nắm bắt được động lực đáng kể, phát triển từ chỉ 200 khách hàng vào năm 2021 lên hơn 3.500 tổ chức ngày nay.
Các cập nhật hàng ngày tỏ ra quan trọng. Mặc dù bản thân mã thuế chỉ thay đổi khi Quốc hội hành động, hệ sinh thái liên tục phát triển thông qua các quy định của IRS, các phán quyết mới và các vụ kiện. Tất cả 50 tiểu bang đều sửa đổi mã thuế của họ thường xuyên.
“Mọi thứ thay đổi theo đúng nghĩa đen mỗi ngày,” Alarie nói. “Mỗi ngày chúng tôi đều cập nhật tài liệu, và đó chỉ mới là ở Hoa Kỳ. Chúng tôi bao gồm Canada, chúng tôi bao phủ Vương quốc Anh. Tham vọng thực sự là toàn cầu cho thứ này.”
Tham vọng của Alarie còn vượt ra ngoài việc xây dựng một công ty khởi nghiệp thành công. Với tư cách là tác giả của cuốn sách đoạt giải “The Legal Singularity” và là thành viên liên kết tại Viện Vector về Trí tuệ Nhân tạo, ông đã dành nhiều năm để suy ngẫm về tác động lâu dài của AI đối với luật pháp.
Trong các bài báo học thuật được xuất bản trên Tax Notes trong suốt năm 2023 và 2024, ông đã ghi lại sự trỗi dậy của AI tạo sinh, dự đoán rằng “khách hàng sẽ trở nên tinh vi hơn đáng kể” và AI sẽ đẩy các chuyên gia con người vào các vai trò chiến lược có giá trị cao hơn thay vì nghiên cứu thông thường.
Kế hoạch 122 triệu USD của Blue J: Từ nghiên cứu thuế đến ’nhận thức thuế toàn cầu'
Vòng huy động vốn Series D trị giá 122 triệu USD, đưa tổng số vốn huy động được lên hơn 133 triệu USD, sẽ thúc đẩy việc mở rộng mạnh mẽ về địa lý và sản phẩm. Blue J đã hoạt động tại Hoa Kỳ, Canada và Vương quốc Anh, với kế hoạch cuối cùng bao phủ hơn 220 khu vực pháp lý thông qua quan hệ đối tác IBFD.
Các khả năng trong tương lai có thể bao gồm việc tạo báo cáo tự động, hoàn thành biểu mẫu thuế, soạn thảo tài liệu và duy trì lịch sử hội thoại theo ngữ cảnh qua các phiên — biến Blue J từ một công cụ nghiên cứu thành cái mà Alarie mô tả là “lớp hoạt động cho nhận thức thuế toàn cầu.”
Bất chấp mọi thành công, Blue J hoạt động trong một lĩnh vực mà lỗi sai mang lại hậu quả nghiêm trọng. Vấn đề ảo giác chưa được loại bỏ — nó đã được giảm thiểu thông qua kỹ thuật cẩn thận, tuyển chọn nội dung và giám sát của con người. Blue J đã đào tạo các mô hình của mình để thừa nhận khi chúng không thể trả lời câu hỏi thay vì bịa đặt thông tin.
Doanh nghiệp này cũng đối mặt với rủi ro kinh tế nếu chi phí tính toán tăng vọt hoặc mô hình sử dụng vượt quá dự báo. Và các câu hỏi tinh tế hơn còn tồn tại về đánh giá chuyên môn: khi hệ thống AI trở nên có năng lực hơn, người dùng có sẽ dựa vào kết quả đầu ra mà không cần đánh giá phê bình đầy đủ không?
Từ 15 giờ xuống 15 giây: Bài học từ sự chuyển đổi AI của Blue J cho mọi ngành công nghiệp
Sự chuyển đổi của Blue J mang đến những bài học vượt ra ngoài phần mềm thuế. Sự sẵn lòng từ bỏ tám năm công nghệ độc quyền và xây dựng lại dựa trên nền tảng ban đầu không ổn định của công ty đòi hỏi cả sự can đảm và khả năng chấp nhận rủi ro có tính toán.
Quyết định đã mang lại thành quả không phải vì AI tạo sinh vốn dĩ vượt trội hơn học máy có giám sát trên mọi khía cạnh, mà vì nó giải quyết đúng vấn đề: tính toàn diện thay vì độ chính xác trong các lĩnh vực hẹp. Các chuyên gia thuế không cần độ chính xác 95% trên 5% câu hỏi. Họ cần độ chính xác đủ tốt trên 100% câu hỏi.
Sự cải thiện từ điểm NPS 20 lên 84 chỉ trong hơn hai năm phản ánh sự lặp lại không ngừng nghỉ được cung cấp bởi việc thu thập dữ liệu lớn. Quan hệ đối tác nội dung đã tạo ra sự khác biệt mà công nghệ thuần túy không thể tái tạo. Đội ngũ chuyên gia thuế cung cấp kiến thức chuyên môn cần thiết để đảm bảo độ tin cậy.
Quan trọng nhất, Blue J nhận ra rằng đối thủ cạnh tranh thực sự không phải là các công ty khởi nghiệp AI khác hay thậm chí là các nhà xuất bản đã thành danh. Đó là cách làm cũ — 15 giờ nghiên cứu thủ công, kiến thức thể chế bị khóa trong đầu các chuyên gia sắp nghỉ hưu.
“Mọi người nói, ‘Blue J làm gì? Họ đưa ra câu trả lời thuế tốt hơn. Được rồi, tôi nghĩ chúng ta cần điều đó,’ ” Alarie suy ngẫm.
Khi AI biến đổi hết ngành nghề này sang ngành nghề khác, sự rõ ràng về mục đích đó có thể quan trọng hơn sự tinh vi về công nghệ. Tương lai không thuộc về những người xây dựng AI tiên tiến nhất, mà thuộc về những người khai thác nó một cách hiệu quả nhất để giải quyết các vấn đề mà con người thực sự gặp phải.
Đối với một giáo sư luật thuế vốn bắt đầu với sự thất vọng về phương pháp nghiên cứu kém hiệu quả, việc xây dựng một công ty trị giá 300 triệu USD đánh dấu một điểm cuối táo bạo. Đối với hàng nghìn chuyên gia hiện đang trả lời các câu hỏi phức tạp chỉ trong 15 giây thay vì 15 giờ, nó đại diện cho tương lai của nghề nghiệp của họ, đến nhanh hơn hầu hết mọi người mong đợi.
Lời đặt cược vào ChatGPT khi nó vẫn còn bịa đặt tiểu sử đã trở thành sự xác nhận rằng đôi khi động thái rủi ro nhất là không di chuyển chút nào.