model safeguards
AssessKỹ thuật
Các cơ chế tích hợp trong mô hình để giảm đầu ra có hại hoặc không an toàn.
Vì sao ở đây
Xếp vào Assess: 1 bài bằng chứng từ 1 nguồn, chủ yếu là cập nhật framework, 0 bài trong 30 ngày qua. Độ tin cậy 24%. Bằng chứng còn ít nên xếp thận trọng, chờ thêm tín hiệu.
Bằng chứng (1)
- 4OpenAI Blog·28/4/2026framework_updateOpenAI nêu các biện pháp bảo đảm an toàn cộng đồng cho ChatGPT
OpenAI cho biết hãng bảo vệ an toàn cộng đồng trong ChatGPT bằng các lớp bảo vệ mô hình, phát hiện lạm dụng, thực thi chính sách và hợp tác với các chuyên gia an toàn. Bài viết nhấn mạnh cách tiếp cận nhiều tầng nhằm giảm nguy cơ sử dụng sai mục đích và cải thiện phản ứng trước hành vi rủi ro.