Trendora

Chain-of-thought monitoring

Assess

Kỹ thuật

Phương pháp quan sát dấu vết suy luận của mô hình để phát hiện hành vi không an toàn hoặc lệch mục tiêu.

Vì sao ở đây

Xếp vào Assess: 2 bài bằng chứng từ 1 nguồn, chủ yếu là tin nghiên cứu, 0 bài trong 30 ngày qua. Độ tin cậy 32%.

Bằng chứng (2)