Làm thế nào kỹ thuật ngữ cảnh có thể cứu công ty của bạn khỏi quá tải mã cảm xúc AI- bài học từ Qodo và Monday.com

Khi tổ chức kỹ thuật của monday.com, phần mềm theo dõi dự án đám mây, mở rộng quy mô vượt quá 500 nhà phát triển, nhóm bắt đầu cảm nhận được áp lực từ chính thành công của mình. Các dòng sản phẩm ngày càng nhiều, các microservices ngày càng lan rộng và mã chảy nhanh hơn các nhà phê bình có thể theo kịp. Công ty cần một cách để xem xét hàng nghìn yêu cầu kéo mỗi tháng mà không làm các nhà phát triển chìm đắm trong sự tẻ nhạt — hoặc làm giảm chất lượng.

  • 10 min read
Khi tổ chức kỹ thuật của monday.com, phần mềm theo dõi dự án đám mây, mở rộng quy mô vượt quá 500 nhà phát triển, nhóm bắt đầu cảm nhận được áp lực từ chính thành công của mình. Các dòng sản phẩm ngày càng nhiều, các microservices ngày càng lan rộng và mã chảy nhanh hơn các nhà phê bình có thể theo kịp. Công ty cần một cách để xem xét hàng nghìn yêu cầu kéo mỗi tháng mà không làm các nhà phát triển chìm đắm trong sự tẻ nhạt — hoặc làm giảm chất lượng.

Kỹ thuật kỹ thuật ngữ cảnh có thể cứu công ty bạn khỏi quá tải mã “vibe” AI: Bài học từ Qodo và Monday.com

Khi phần mềm theo dõi dự án đám mây monday.com của monday.com vượt mốc 500 nhà phát triển, đội ngũ đã bắt đầu cảm nhận được áp lực từ chính thành công của mình. Các dòng sản phẩm ngày càng nhân lên, các microservices ngày càng nhiều, và mã nguồn ngày càng được tạo ra nhanh hơn mức mà người đánh giá có thể theo kịp. Công ty cần một cách để xem xét hàng nghìn yêu cầu kéo (pull request) mỗi tháng mà không làm các nhà phát triển chìm trong sự nhàm chán — hoặc để chất lượng bị suy giảm.

Đó là lúc Guy Regev, Phó Chủ tịch R&D và người đứng đầu các đội ngũ Tăng trưởng và monday Dev, bắt đầu thử nghiệm một công cụ AI mới từ Qodo, một startup của Israel tập trung vào các tác nhân phát triển. Những gì ban đầu chỉ là một bài kiểm tra nhẹ nhàng đã sớm trở thành một phần quan trọng trong cơ sở hạ tầng phân phối phần mềm của monday.com, như một nghiên cứu điển hình mới được cả Qodo và monday.com công bố hôm nay tiết lộ.

AI abstract expressionist image of developers working hard in large office under computer code display Ảnh: VentureBeat làm với Midjourney

“Qodo không giống như một công cụ khác — nó giống như thêm một nhà phát triển mới vào đội ngũ, người thực sự học cách chúng ta làm việc,” Regev nói với VentureBeat trong một cuộc phỏng vấn qua video gần đây, thêm rằng nó đã “ngăn chặn hơn 800 vấn đề mỗi tháng tiếp cận sản xuất — một số trong số đó có thể gây ra các lỗ hổng bảo mật nghiêm trọng.”

Không giống như các công cụ tạo mã như GitHub Copilot hoặc Cursor, Qodo không cố gắng viết mã mới. Thay vào đó, nó chuyên xem xét mã — sử dụng cái mà họ gọi là kỹ thuật ngữ cảnh để hiểu không chỉ những gì đã thay đổi trong một pull request, mà còn tại sao, làm thế nào nó phù hợp với logic kinh doanh và liệu nó có tuân theo các phương pháp tốt nhất nội bộ hay không.

“Bạn có thể gọi Claude Code hoặc Cursor và trong 5 phút nhận được 1.000 dòng mã,” Itamar Friedman, đồng sáng lập và Giám đốc điều hành của Qodo, cho biết trong cùng một cuộc gọi video với Regev. “Bạn có 40 phút, và bạn không thể xem xét hết. Vì vậy, bạn cần Qodo để thực sự xem xét nó.”

Đối với monday.com, khả năng này không chỉ hữu ích — nó mang tính biến đổi.

Xem xét mã, ở quy mô lớn

Tại bất kỳ thời điểm nào, các nhà phát triển của monday.com đang triển khai các bản cập nhật trên hàng trăm kho lưu trữ và dịch vụ. Tổ chức kỹ thuật hoạt động theo các nhóm phối hợp chặt chẽ, mỗi nhóm phù hợp với các phần cụ thể của sản phẩm: marketing, CRM, công cụ phát triển, nền tảng nội bộ, v.v.

Đó là lúc Qodo xuất hiện. Nền tảng của công ty sử dụng AI không chỉ để kiểm tra các lỗi rõ ràng hoặc vi phạm kiểu dáng, mà còn để đánh giá liệu một pull request có tuân thủ các quy ước cụ thể của nhóm, hướng dẫn kiến trúc và các mẫu lịch sử hay không.

Nó làm điều này bằng cách học hỏi từ cơ sở mã của bạn — huấn luyện trên các PR, nhận xét, hợp nhất trước đó và thậm chí cả các chuỗi Slack để hiểu cách nhóm của bạn hoạt động.

“Các nhận xét mà Qodo đưa ra không chung chung — chúng phản ánh các giá trị, thư viện, thậm chí cả tiêu chuẩn của chúng tôi về các vấn đề như cờ tính năng và quyền riêng tư,” Regev nói. “Nó nhạy cảm với ngữ cảnh theo cách mà các công cụ truyền thống không làm được.”

“Kỹ thuật ngữ cảnh” Thực sự có nghĩa là gì

Qodo gọi bí quyết của mình là kỹ thuật ngữ cảnh — một cách tiếp cận cấp hệ thống để quản lý mọi thứ mà mô hình nhìn thấy khi đưa ra quyết định.

Điều này bao gồm sự khác biệt mã PR, tất nhiên, nhưng cũng bao gồm các cuộc thảo luận trước đó, tài liệu, các tệp liên quan từ kho lưu trữ, thậm chí cả kết quả kiểm tra và dữ liệu cấu hình.

Ý tưởng là các mô hình ngôn ngữ không thực sự “suy nghĩ” — chúng dự đoán token tiếp theo dựa trên các đầu vào mà chúng nhận được. Vì vậy, chất lượng đầu ra của chúng phụ thuộc gần như hoàn toàn vào chất lượng và cấu trúc của đầu vào.

Như Dana Fine, người quản lý cộng đồng của Qodo, đã nói trong một bài đăng trên blog: “Bạn không chỉ viết lời nhắc; bạn thiết kế đầu vào có cấu trúc dưới giới hạn token cố định. Mỗi token là một quyết định thiết kế.”

Đây không chỉ là lý thuyết. Trong trường hợp của monday.com, điều đó có nghĩa là Qodo có thể phát hiện không chỉ các lỗi rõ ràng, mà còn cả các lỗi tinh tế thường bỏ sót các người xem xét — các biến cứng mã hóa, thiếu cơ chế dự phòng, hoặc vi phạm các quy ước kiến trúc chéo nhóm.

Một ví dụ nổi bật. Trong một PR gần đây, Qodo đã gắn cờ một dòng mã vô tình làm lộ một biến môi trường staging — điều mà không người xem xét nào phát hiện ra. Nếu được hợp nhất, nó có thể gây ra các vấn đề trong sản xuất.

“Những giờ chúng ta sẽ dành để khắc phục lỗ hổng bảo mật này và vấn đề pháp lý mà nó mang lại sẽ nhiều hơn nhiều so với số giờ chúng ta giảm bớt từ một pull request,” Regev nói.

Tích hợp vào quy trình

Ngày nay, Qodo được tích hợp sâu vào quy trình phát triển của monday.com, phân tích các pull request và đưa ra các đề xuất nhạy cảm với ngữ cảnh dựa trên các lượt xem xét mã trước đó của nhóm.

“Nó không giống như chỉ là một công cụ khác… Nó giống như một đồng đội khác đã tham gia hệ thống — một người học cách chúng ta làm việc,” Regev lưu ý.

Các nhà phát triển nhận được các đề xuất trong quá trình xem xét và vẫn kiểm soát các quyết định cuối cùng — một mô hình có con người tham gia vào vòng lặp, điều này rất quan trọng để được chấp nhận.

Vì Qodo tích hợp trực tiếp vào GitHub thông qua các hành động và nhận xét của pull request, đội ngũ cơ sở hạ tầng của Monday.com không phải đối mặt với đường cong học tập dốc.

“Nó chỉ là một hành động GitHub,” Regev nói. “Nó tạo ra một PR với các bài kiểm tra. Nó không giống như một công cụ riêng biệt mà chúng tôi phải học.”

“Mục đích là thực sự giúp nhà phát triển học mã, chịu trách nhiệm, cung cấp phản hồi cho nhau, học hỏi từ đó và thiết lập các tiêu chuẩn,” Friedman nói thêm.

Kết quả: Tiết kiệm thời gian, ngăn chặn lỗi

Kể từ khi triển khai Qodo rộng rãi hơn, monday.com đã thấy những cải tiến có thể đo lường được trên nhiều nhóm.

Phân tích nội bộ cho thấy các nhà phát triển tiết kiệm khoảng một giờ cho mỗi pull request trung bình. Nhân con số đó với hàng nghìn PR mỗi tháng, khoản tiết kiệm nhanh chóng đạt đến hàng nghìn giờ phát triển mỗi năm.

Đây không chỉ là các vấn đề về hình thức — nhiều vấn đề liên quan đến logic kinh doanh, bảo mật hoặc tính ổn định khi chạy. Và bởi vì các đề xuất của Qodo phản ánh các quy ước thực tế của monday.com, các nhà phát triển có nhiều khả năng thực hiện chúng hơn.

Độ chính xác của hệ thống bắt nguồn từ thiết kế ưu tiên dữ liệu của nó. Qodo đào tạo trên cơ sở mã riêng và dữ liệu lịch sử của mỗi công ty, thích ứng với các phong cách và phương pháp làm việc khác nhau của nhóm. Nó không dựa vào các quy tắc chung hoặc tập dữ liệu bên ngoài. Mọi thứ đều được tùy chỉnh.

Từ công cụ nội bộ đến tầm nhìn sản phẩm

Đội ngũ của Regev đã rất ấn tượng với tác động của Qodo đến nỗi họ đã bắt đầu lên kế hoạch tích hợp sâu hơn giữa Qodo và Monday Dev, dòng sản phẩm tập trung vào nhà phát triển mà monday.com đang xây dựng.

Tầm nhìn là tạo ra một quy trình làm việc nơi ngữ cảnh kinh doanh — nhiệm vụ, vé, phản hồi của khách hàng — chảy trực tiếp vào lớp xem xét mã. Bằng cách đó, người xem xét có thể đánh giá không chỉ liệu mã có “hoạt động” hay không, mà còn liệu nó có giải quyết đúng vấn đề hay không.

“Trước đây, chúng tôi có các trình phân tích cú pháp, quy tắc nguy hiểm, phân tích tĩnh… dựa trên quy tắc… bạn cần cấu hình tất cả các quy tắc,” Regev nói. “Nhưng nó không biết những gì bạn không biết… Qodo… cảm thấy như nó đang học hỏi từ các kỹ sư của chúng tôi.”

Điều này phù hợp chặt chẽ với lộ trình của Qodo. Công ty không chỉ xem xét mã. Họ đang xây dựng một nền tảng đầy đủ các tác nhân phát triển — bao gồm Qodo Gen để tạo mã nhạy cảm với ngữ cảnh, Qodo Merge để phân tích PR tự động và Qodo Cover, một tác nhân kiểm thử hồi quy sử dụng xác thực thời gian chạy để đảm bảo phạm vi kiểm thử.

Tất cả những điều này được cung cấp bởi cơ sở hạ tầng của riêng Qodo, bao gồm mô hình nhúng mã nguồn mở mới của họ, Qodo-Embed-1-1.5B, đã vượt trội hơn các sản phẩm của OpenAI và Salesforce trên các tiêu chí truy xuất mã.

Bước tiếp theo là gì?

Qodo hiện đang cung cấp nền tảng của mình theo mô hình freemium — miễn phí cho cá nhân, giảm giá cho các startup thông qua chương trình Ưu đãi của Google Cloud và cấp doanh nghiệp cho các công ty cần SSO, triển khai air-gapped hoặc kiểm soát nâng cao.

Công ty đã làm việc với các đội tại NVIDIA, Intuit và các công ty Fortune 500 khác. Và nhờ quan hệ đối tác gần đây với Google Cloud, các mô hình của Qodo có sẵn trực tiếp trong Model Garden của Vertex AI, giúp tích hợp vào các quy trình doanh nghiệp dễ dàng hơn.

“Các công cụ ngữ cảnh sẽ là câu chuyện lớn của năm 2026,” Friedman nói. “Mọi doanh nghiệp sẽ cần xây dựng bộ não thứ hai của riêng mình nếu họ muốn có AI thực sự hiểu và giúp đỡ họ.”

Khi các hệ thống AI ngày càng được tích hợp vào phát triển phần mềm, các công cụ như Qodo đang cho thấy cách ngữ cảnh phù hợp — được cung cấp vào đúng thời điểm — có thể biến đổi cách các nhóm xây dựng, triển khai và mở rộng quy mô mã trong toàn doanh nghiệp.

Recommended for You

Celosphere 2025- Nơi AI doanh nghiệp chuyển từ thử nghiệm sang thực thi

Được trình bày bởi Celonis

Bên trong bước nhảy vọt AI kép của Zendesk- Từ các tác nhân đáng tin cậy đến trí thông minh thời gian thực với GPT-5 và HyperArc

Được trình bày bởi Zendesk