Dịch vụ

Speech to Text

Text to speech

Voice Verification

Speech to Text

Trợ lý AI hỗ trợ cá nhân, cơ quan, doanh nghiệp chuyển đổi giọng nói thành văn bản từ luồng âm thanh trực tiếp hoặc từ file audio có định dạng khác nhau như .wav, .mp3 với dung lượng file lớn, thời gian giọng nói kéo dài.

Giá trị mang lại

Tăng lợi thế và khả năng cạnh tranh

Mang đến những cơ hội mới, tạo lợi thế cạnh tranh và nâng cao vị thế thương hiệu của doanh nghiệp

Tiết kiệm thời gian, chi phí

Tiết kiệm hơn 80% thời gian chuyển đổi sang text với file audio thời lượng 2 tiếng

Tối ưu hóa sản phẩm/ dịch vụ

Tăng hiệu suất công việc, tối ưu 30-60% chi phí nhân sự, chi phí vận hành

Tối ưu quy trình quản lý, vận hành

Giúp doanh nghiệp cải tiến, tối ưu chức năng, quy trình nghiệp vụ cũng như nâng cao trải nghiệm khách hàng

Tính năng nổi bật

Đáp ứng nhiều định dạng

Hỗ trợ chuyển đổi sang văn bản từ luồng âm thanh trực tiếp hoặc từ file âm thanh có định dạng khác nhau như pcm, wav, mp3. Bên cạnh đó, VNPT Smart Voice hỗ trợ chuyển đổi file âm thanh có thời lượng lớn lên đến 2 giờ

Dùng thử ngay

Kết nối tốc độ cao - Tăng cường độ chính xác

Hỗ trợ phiên bản gRPC streaming và gRPC offline. Đồng thời, VNPT Smart Voice kết hợp ứng dụng công nghệ NLP giúp hiểu ngữ nghĩa và gia tăng độ chính xác

Dùng thử ngay

Meeting Mobile App

Ngoài hỗ trợ hình thức sử dụng trực tiếp hoặc gọi dịch vụ qua API, VNPT Smart Voice còn cung cấp giải pháp chuyển đổi giọng nói thành văn bản trên ứng dụng di động

Dùng thử ngay

Phân tích cảm xúc cuộc gọi

Chuyển đổi giọng nói thành văn bản và thực hiện phân tách giọng điện thoại viên, khách hàng cũng như phân tích cảm xúc của người nói khi hội thoại

Dùng thử ngay

Tích hợp đa nền tảng

Dễ dàng tích hợp với các hệ thống, thiết bị khác trên các nền tảng như mobile, website, tablet, thiết bị IoT, tổng đài, ... thông qua API/SDK. Đồng thời, khách hàng cũng có thể sử dụng dịch vụ trực tiếp trên website sản phẩm hoặc triển khai dịch vụ trên hạ tầng của khách hàng

Dùng thử ngay

Đáp ứng nhanh chóng, chính xác

Tỷ lệ chính xác theo từ WER (Word Error Rate) của Speech to Text là hơn 95% theo tập dữ liệu huấn luyện của khách hàng. Đồng thời, các model AI được tối ưu hiệu năng trên GPU, tối ưu kết nối theo mô hình server-to-server GRPC giúp đáp ứng tải cao, tăng tốc độ xử lý

Dùng thử ngay

Speech to Text

Giải pháp Speech to Text có thể được ứng dụng trong nhiều ngành nghề, lĩnh vực. Một trong số ứng dụng của Speech-to-Text như: Trợ lý ảo, callbot, bóc băng ghi âm,...

Xem ứng dụng