C-OpenAI ra mắt LLM pháp lý tiếng Việt và bộ chuẩn VLegal-Bench, dẫn đầu về suy luận pháp lý phức tạp
Cập nhật vào: Thứ hai - 29/12/2025 08:03
Cỡ chữ
CMC OpenAI (C-OpenAI), công ty thành viên của Tập đoàn Công nghệ CMC, vừa công bố hai cấu phần nền tảng cho việc phát triển trợ lý ảo pháp lý tiếng Việt: mô hình ngôn ngữ lớn (LLM) chuyên ngành pháp luật CMC-AI-Legal-32B và bộ chuẩn đánh giá pháp lý tiếng Việt VLegal-Bench. Đây được xem là bước đi chiến lược nhằm làm chủ công nghệ AI lõi, phục vụ trực tiếp cho lĩnh vực pháp luật Việt Nam, đồng thời hiện thực hóa định hướng phát triển công nghệ chiến lược theo tinh thần Nghị quyết 57-NQ/TW.

VLegal- Bench, bộ tiêu chuẩn đánh giá AI pháp lý hàng đầu Việt Nam do C-OpenAI phát triển.
Điểm nhấn của công bố lần này là mô hình CMC-AI-Legal-32B – LLM pháp lý tiếng Việt được xây dựng và tinh chỉnh riêng cho bối cảnh pháp luật trong nước. Trên bộ chuẩn đánh giá VLegal-Bench, mô hình này đạt Top 1 về hiệu năng tổng thể, dẫn đầu 6/22 tác vụ và đặc biệt vượt trội ở nhóm bài toán đòi hỏi suy luận, lập luận pháp lý nhiều lớp. Theo nhóm nghiên cứu, đây là những tác vụ mà các mô hình tổng quát thương mại như GPT-4o, Claude hay Gemini thường suy giảm hiệu quả do không được huấn luyện sâu theo cấu trúc, ngữ cảnh và chuẩn viện dẫn của hệ thống pháp luật Việt Nam.
C-OpenAI cho biết, chiến lược “làm chủ LLM song song với làm chủ thước đo đánh giá” là cách tiếp cận then chốt để phát triển AI chuyên ngành bền vững. Thay vì chỉ sử dụng các benchmark quốc tế vốn khó phản ánh đầy đủ đặc thù ngôn ngữ và hệ thống dân luật Việt Nam, nhóm đã tự xây dựng VLegal-Bench như một bộ chuẩn nội sinh, phù hợp với thực tiễn pháp lý trong nước.
VLegal-Bench gồm 10.450 mẫu dữ liệu có đáp án chuẩn, chia thành 22 tác vụ, được thiết kế theo 5 cấp độ suy luận tăng dần. Các cấp độ này trải dài từ nhận diện và truy xuất điều luật; hiểu và cấu trúc hóa quy phạm theo hệ thống mục – chương – điều – khoản – điểm; suy luận đa bước trong tình huống thực tiễn; đến diễn giải, tạo sinh nội dung pháp lý đúng văn phong; và nhóm tác vụ liên quan đến đạo đức, công bằng và thiên lệch của mô hình AI. Mỗi mẫu dữ liệu đều gắn với nguồn văn bản pháp luật chính thức cấp trung ương, bảo đảm khả năng kiểm chứng và tính đúng đắn pháp lý.
Theo ông Nguyễn Tiến Đồng, Giám đốc Kỹ thuật C-OpenAI, việc xây dựng VLegal-Bench là một bài toán khó, đòi hỏi thiết kế lại toàn bộ quy trình từ thu thập, chuẩn hóa văn bản pháp luật, gán nhãn có trích dẫn đến xây dựng các tác vụ phản ánh đồng thời yêu cầu kỹ thuật AI và nghiệp vụ luật. Thách thức lớn nhất là bảo đảm tính chính xác pháp lý, khả năng tái kiểm chứng và sự tương thích với các chuẩn đánh giá LLM quốc tế. Nhờ sự phối hợp chặt chẽ giữa chuyên gia luật và kỹ sư AI, nhóm đã hoàn thiện bộ chuẩn và sử dụng 22 mô hình khác nhau để đối sánh, đóng góp cho cộng đồng một benchmark pháp lý tiếng Việt có chất lượng cao.
VLegal-Bench hiện được sử dụng như một “đấu trường” đánh giá, so sánh các nhóm mô hình mã nguồn mở, mã nguồn đóng và mô hình chuyên biệt theo miền pháp lý. Quy trình đánh giá được tự động hóa nhằm giảm phụ thuộc vào chấm điểm cảm tính, kết quả được công bố công khai dưới dạng bảng xếp hạng để cộng đồng tham chiếu. Báo cáo kỹ thuật của bộ chuẩn đã được đăng tải dưới dạng preprint trên arXiv và có sự tham vấn học thuật từ các đối tác quốc tế, trong đó có nhóm nghiên cứu của GS. Vũ Đức Bình (Đại học SRH Heidelberg, Đức).
Ở góc độ chiến lược, ông Đặng Văn Tú, Tổng Giám đốc C-OpenAI, cho biết doanh nghiệp theo đuổi tầm nhìn xây dựng nền tảng AI mở, an toàn do Việt Nam làm chủ, tập trung phát triển LLM tiếng Việt và các mô hình AI chuyên ngành. Trong thời gian tới, C-OpenAI sẽ công bố mã nguồn, dữ liệu và quy trình đánh giá của VLegal-Bench theo hướng minh bạch, có thể tái sử dụng, đồng thời kêu gọi sự tham gia chuẩn hóa của cộng đồng chuyên gia trong và ngoài nước.
Chủ tịch Tập đoàn Công nghệ CMC Nguyễn Trung Chính nhấn mạnh, thành tựu này là kết quả của hơn 10 năm đầu tư R&D liên tục vào AI lõi. Tập đoàn kiên định mục tiêu làm chủ 25 công nghệ lõi “made by CMC”, tạo nền tảng để phát triển các sản phẩm, dịch vụ chuyển đổi số và chuyển đổi AI quy mô toàn cầu do người Việt làm chủ.
Với việc đồng thời làm chủ mô hình AI chuyên ngành và bộ chuẩn đánh giá pháp lý tiếng Việt, C-OpenAI đang đặt những viên gạch nền đầu tiên cho hệ sinh thái trợ lý ảo pháp lý tại Việt Nam, hướng tới các ứng dụng AI có khả năng suy luận sâu, đáng tin cậy và phù hợp với thực tiễn pháp luật trong nước.
A.T (tổng hợp)
Liên hệ
Tiếng Việt
Tiếng Anh








