Ngăn AI "đoán mò": Appier giúp AI tự đánh giá mức độ chắc chắn trước khi ra quyết định

Ngăn AI "đoán mò": Appier giúp AI tự đánh giá mức độ chắc chắn trước khi ra quyết định

Cấu trúc mới nâng cao độ tin cậy, hiệu quả chi phí và khả năng mở rộng cho AI doanh nghiệp

SINGAPORE, ngày 31 tháng 3 năm 2026 /PRNewswire/ -- Là công ty tiên phong về AI cung cấp Agentic AI-as-a-Service (AaaS), Appier vừa công bố nghiên cứu mới mang tên 'Hiệu chỉnh các mô hình ngôn ngữ lớn: Từ phản hồi đến năng lực', thể hiện cam kết đầu tư dài hạn vào đổi mới AI. Nghiên cứu giới thiệu 'Hiệu chỉnh năng lực[1]' (Capability Calibration) – một phương pháp mới nhằm giải quyết vấn đề AI 'quá tự tin' và tạo thông tin sai lệch (hallucination), bằng cách giúp hệ thống AI tự đánh giá chính xác khả năng hoàn thành một nhiệm vụ trước khi thực hiện.

Nghiên cứu này giúp tác nhân AI có thêm năng lực quan trọng: dự đoán khả năng giải quyết vấn đề trước khi đưa ra câu trả lời. Với cơ chế tự đánh giá có thể đo lường, các hệ thống AI có thể ra quyết định chính xác hơn, đồng thời tối ưu việc sử dụng tài nguyên tính toán — từ đó nâng cao độ tin cậy, giảm chi phí và mở rộng hiệu quả triển khai AI trong doanh nghiệp

Từ độ chính xác của câu trả lời đến năng lực giải quyết vấn đề thực tế
Các phương pháp hiệu chỉnh LLM truyền thống thường tập trung vào độ chính xác của từng câu trả lời riêng lẻ. Tuy nhiên, do kết quả từ LLM mang tính xác suất, cùng một truy vấn có thể tạo ra nhiều câu trả lời khác nhau. Vì vậy, một phản hồi đơn lẻ không phản ánh đúng năng lực thực sự của mô hình.

Trên thực tế, doanh nghiệp không chỉ quan tâm một câu trả lời đúng, mà quan tâm liệu mô hình có thể giải quyết vấn đề một cách ổn định hay không. Phương pháp của Appier chuyển trọng tâm đánh giá từ từng phản hồi riêng lẻ sang xác suất thành công tổng thể của mô hình cho mỗi truy vấn. Điều này giúp đánh giá sát hơn năng lực thực tế và hiệu quả ứng dụng trong môi trường kinh doanh.

Giúp các tác nhân AI 'hiểu giới hạn của chính mình'

'Các tác nhân AI không nên chỉ tạo ra câu trả lời mà còn cần hiểu được giới hạn năng lực của chính mình', Chih-Han Yu, Giám đốc điều hành kiêm Đồng sáng lập Appier cho biết. 'Với hiệu chỉnh năng lực, AI có thể ước tính xác suất thành công trước khi phản hồi và tối ưu phân bổ tài nguyên một cách thông minh. Những tác vụ đơn giản được xử lý nhanh chóng, trong khi các bài toán phức tạp sẽ tự động sử dụng các mô hình mạnh hơn hoặc thêm tài nguyên tính toán. Điều này giúp biến AI từ công cụ thụ động thành hệ thống chủ động tối ưu vận hành, kiểm soát chi phí và nâng cao chất lượng ra quyết định — nền tảng quan trọng để mở rộng AI ở quy mô doanh nghiệp.'.

Kết quả nghiên cứ: Độ chính xác cao với chi phí tối ưu
Nghiên cứu làm rõ mối quan hệ giữa hiệu chỉnh năng lực và hiệu chỉnh truyền thống[2] (Response Calibration), đồng thời đánh giá nhiều cách ước lượng độ tin cậy trên 03 mô hình ngôn ngữ lớn và 07 bộ dữ liệu bao gồm các tác vụ đòi hỏi kiến thức chuyên sâu và suy luận phức tạp. Các phương pháp được thử nghiệm bao gồm: Độ tin cậy được biểu đạt bằng ngôn ngữ[3],  P(True)[4], và Bộ phân loại tuyến tính[5] (Linear Probe). Kết quả cho thấy phương pháp này mang lại hiệu quả tối ưu giữa chi phí và hiệu năng, thậm chí có chi phí tính toán thấp hơn việc tạo một token, trong khi vẫn đảm bảo độ chính xác cao trong việc ước lượng độ tin cậy.

Giới thiệu về Appier
 Appier (TSE: 4180) là công ty AI tiên phong  cung cấp Agentic AI như một dịch vụ (AaaS), giúp doanh nghiệp nâng cao hiệu quả ra quyết định thông qua các giải pháp AdTech và MarTech tiên tiến.. Được thành lập vào năm 2012 với tầm nhìn 'Đơn giản hóa AI bằng phần mềm thông minh', Appier hỗ trợ doanh nghiệp chuyển hóa AI thành ROI thông qua các giải pháp Ad Cloud, Personalization Cloud và Data Cloud. Hiện nay, Appier vận hành 17 văn phòng trên khắp khu vực Châu Á - Thái Bình Dương, Hoa Kỳ và Châu Âu, Trung Đông và Châu Phi, và được niêm yết trên Sàn Giao dịch Chứng khoán Tokyo. Truy cập www.appier.com để biết thêm thông tin về công ty và truy cập ir.appier.com/en/ để biết thêm thông tin về quan hệ nhà đầu tư.

[1] Hiệu chỉnh năng lực (Capability Calibration)– Phương pháp đánh giá khả năng giải quyết vấn đề tổng thể của mô hình AI bằng cách ước tính xác suất mô hình sẽ trả lời thành công một truy vấn nhất định, thay vì đánh giá một phản hồi đơn lẻ.

[2] hiệu chỉnh truyền thống (Response Calibration) -- Phương pháp đánh giá AI truyền thống đo độ tin cậy của mô hình đối với tính đúng đắn của một phản hồi được tạo ra.

[3] Độ tin cậy được biểu đạt bằng ngôn ngữ – Phương pháp trong đó mô hình tự nêu rõ mức độ tin cậy về tính đúng đắn của câu trả lời bằng ngôn ngữ tự nhiên, chẳng hạn như dưới dạng phần trăm hoặc mức độ tin cậ.

[4] P(True) – Kỹ thuật ước tính xác suất một câu trả lời là đúng bằng cách phân tích phân phối xác suất của các token được mô hình tạo ra.

[5] Bộ phân loại tuyến tính (Linear Probe) – Một bộ phân loại tuyến tính nhẹ được huấn luyện trên các biểu diễn nội tại của mô hình nhằm phân tích liệu mô hình đã học được kiến thức hoặc năng lực cụ thể hay chưa, đồng thời ước tính độ tin cậy.

Mọi thắc mắc về truyền thông, vui lòng gửi email đến pr@appier.com

THỦ THUẬT HAY

4 ứng dụng chụp ảnh selfie ưng ý nhất trên di động

Khi chụp ảnh selfie, việc giữ camera tại vị trí hoàn hảo và vươn ngón tay cái để chạm vào nút chụp có thể là điều không hề dễ dàng đối với nhiều người. Với GoCam và Snapi, bạn không cần phải chạm tay vào màn hình mà

Cách tạo, thay đổi màu icon ứng dụng iPhone thú vị theo ý muốn

iOS 14 đã chính thức xuất hiện với rất nhiều sự thay đổi và tính năng mới mẻ. Người dùng có thể dễ dàng đổi màu icon ứng dụng iPhone cực kỳ mới lạ chỉ với một số thao tác đơn giản mà Trang Công Nghệ giới thiệu sau đây.

5 dịch vụ lưu trữ đám mây miễn phí tốt nhất năm 2018

Việc phát triển mạnh mẽ các dịch vụ đám mây mang đến cho người dùng nhiều sự lựa chọn hơn khi lưu trữ dữ liệu trực tuyến. Sau đây, TCN xin chia sẻ danh sách 5 dịch vụ lưu trữ đám mây miễn phí tốt nhất năm 2018 do trang

Hỏi và đáp 360 độ tổng hợp về 4G Viettel

Thời gian gần đây, 4G Viettel trở thành một từ khóa nóng nhất với người dùng yêu thích công nghệ trên toàn quốc. Khắp các tỉnh thành, khách hàng của Viettel nô nức đi đổi sang sim 4G. Vậy đâu là lý do khiến khách hàng

Rủ bạn bè đi chơi bằng ứng dụng tuyệt vời Who's Down

Thật ấn tượng khi google vừa ra mắt một ứng dụng mang tên Who’s Down. Tại sao TCN lại nói đây là một ứng dụng khá ấn tượng của Google vì người dùng có thể dễ dàng biết được bạn bè mình rảnh rỗi không để rủ họ đi chơi

ĐÁNH GIÁ NHANH

So sánh camera Xiaomi Mi 6 và Galaxy S8: Liệu có bất ngờ gì?

Xiaomi Mi 6 là chiếc flagship mới nhất của Xiaomi tung ra trong đầu năm 2017 này, sở hữu thiết kế bóng bẩy cùng cấu hình khủng, camera kép chất...

Đánh giá iPhone X: có rất nhiều sự đột phá được tìm thấy

Steven Levy là người sáng lập và biên tập Backchannel, ông là một trong số ít những người dùng đầu tiên được Apple chọn để trải nghiệm sớm và đánh giá iPhone X. Những cảm nhận của Levy đã được đăng tải trên tạp chí