IH-Challenge
HoldKỹ thuật
Một bài toán huấn luyện nhằm dạy LLM ưu tiên các chỉ dẫn đáng tin cậy theo đúng thứ bậc.
Vì sao ở đây
Xếp vào Hold: 1 bài bằng chứng từ 1 nguồn, chủ yếu là tin nghiên cứu, 0 bài trong 30 ngày qua. Độ tin cậy 24%. Bằng chứng còn ít nên xếp thận trọng, chờ thêm tín hiệu.
Bằng chứng (1)
- 7OpenAI Blog·10/3/2026researchIH-Challenge cải thiện thứ bậc chỉ dẫn trong các LLM tiên tiến
OpenAI giới thiệu IH-Challenge, một phương pháp huấn luyện nhằm giúp mô hình ưu tiên các chỉ dẫn đáng tin cậy hơn những lệnh xung đột hoặc độc hại. Cách tiếp cận này hướng tới việc cải thiện thứ bậc chỉ dẫn, khả năng điều hướng an toàn và khả năng chống tấn công prompt injection.