Speech-to-text
AssessKỹ thuật
Công nghệ chuyển đổi âm thanh lời nói thành văn bản.
Vì sao ở đây
Xếp vào Assess: 2 bài bằng chứng từ 2 nguồn, chủ yếu là hoạt động mã nguồn mở, 1 bài trong 30 ngày qua. Độ tin cậy 41%.
Bằng chứng (2)
- 3Hacker News·12/6/2026open_sourceCông cụ dòng lệnh cục bộ xóa từ đệm khỏi giọng nói
Bài viết giới thiệu một công cụ dòng lệnh chạy cục bộ để loại bỏ các từ đệm như "um", "uh" và "erm" khỏi bản ghi âm. Tác giả cho biết bài toán khó hơn tưởng tượng vì việc chỉnh sửa chính xác phải xử lý nhịp thời gian, căn chỉnh bản ghi và giữ cho đầu ra nghe tự nhiên.
- 7OpenAI Blog·7/5/2026model_releaseOpenAI bổ sung các mô hình giọng nói realtime mới vào API
OpenAI đã giới thiệu các mô hình giọng nói realtime mới trong API, có khả năng suy luận, dịch và chuyển lời nói thành văn bản. Bản cập nhật này nhằm giúp các nhà phát triển xây dựng các ứng dụng thoại tự nhiên và thông minh hơn.