Trợ lý AI hỗ trợ cá nhân, cơ quan, doanh nghiệp chuyển đổi giọng nói thành văn bản từ luồng âm thanh trực tiếp hoặc từ file audio có định dạng khác nhau như .wav, .mp3 với dung lượng file lớn, thời gian giọng nói kéo dài.
Hỗ trợ chuyển đổi sang văn bản từ luồng âm thanh trực tiếp hoặc từ file âm thanh có định dạng khác nhau như pcm, wav, mp3. Bên cạnh đó, VNPT Smart Voice hỗ trợ chuyển đổi file âm thanh có thời lượng lớn lên đến 2 giờ
Hỗ trợ phiên bản gRPC streaming và gRPC offline. Đồng thời, VNPT Smart Voice kết hợp ứng dụng công nghệ NLP giúp hiểu ngữ nghĩa và gia tăng độ chính xác
Ngoài hỗ trợ hình thức sử dụng trực tiếp hoặc gọi dịch vụ qua API, VNPT Smart Voice còn cung cấp giải pháp chuyển đổi giọng nói thành văn bản trên ứng dụng di động
Chuyển đổi giọng nói thành văn bản và thực hiện phân tách giọng điện thoại viên, khách hàng cũng như phân tích cảm xúc của người nói khi hội thoại
Dễ dàng tích hợp với các hệ thống, thiết bị khác trên các nền tảng như mobile, website, tablet, thiết bị IoT, tổng đài, ... thông qua API/SDK. Đồng thời, khách hàng cũng có thể sử dụng dịch vụ trực tiếp trên website sản phẩm hoặc triển khai dịch vụ trên hạ tầng của khách hàng
Tỷ lệ chính xác theo từ WER (Word Error Rate) của Speech to Text là hơn 95% theo tập dữ liệu huấn luyện của khách hàng. Đồng thời, các model AI được tối ưu hiệu năng trên GPU, tối ưu kết nối theo mô hình server-to-server GRPC giúp đáp ứng tải cao, tăng tốc độ xử lý