Voice AI Agent lĩnh vực đã xuất hiện những đối thủ cạnh tranh mới. API đại lý AI giọng nói mới nhất thể hiện xuất sắc trong bài kiểm tra chuẩn mực Speech Reasoning, đạt điểm 92.3%, vượt xa trình độ của ChatGPT và Google Gemini. Điều này không chỉ đánh dấu bước đột phá trong khả năng hiểu âm thanh và phản hồi theo thời gian thực của công nghệ này, mà còn mở ra những khả năng mới cho các nhà phát triển.



Quan trọng hơn, các nhà phát triển hiện có thể xây dựng đại lý AI giọng nói đa ngôn ngữ, theo thời gian thực dựa trên cùng một ngăn xếp công nghệ. Điều này có nghĩa là gì? Có nghĩa là việc triển khai các ứng dụng AI đa ngôn ngữ, đa vùng miền trở nên đơn giản hơn, thời gian phát triển được rút ngắn đáng kể. Dù là dịch vụ khách hàng, tạo nội dung hay tương tác thông minh, bộ công cụ này đều có thể cung cấp giải pháp từ đầu đến cuối.

Trong bối cảnh các ứng dụng Web3 và tích hợp AI ngày càng gắn bó chặt chẽ, những đột phá về hạ tầng cơ bản này đang âm thầm thay đổi cục diện của toàn bộ hệ sinh thái phát triển.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 8
  • Đăng lại
  • Retweed
Bình luận
0/400
BlockchainArchaeologistvip
· 9giờ trước
92.3%?Nghe có vẻ ổn nhưng dữ liệu làm sao để xác thực được --- Lại là một người chơi mới, lần này là về âm thanh, chờ bị các ông lớn mua lại thôi --- Đa ngôn ngữ, chi phí thấp, thứ này thực sự có thể giảm rào cản cho ứng dụng Web3 --- Tôi chỉ muốn hỏi, có thực sự nhanh hơn Gemini không, độ trễ thế nào --- Những thứ về hạ tầng cơ sở dễ bị bỏ qua, nhưng đây mới là thứ thực sự thay đổi cuộc chơi --- Thời gian phát triển rút ngắn = nhiều ứng dụng rác hơn được ra mắt, trời đất --- Nếu lần này kết hợp tối ưu hợp đồng, thực sự có chút tiềm năng --- Lại là một dữ liệu 92.3%, có phải trong benchmark ai cũng khoe như vậy không --- Dùng cái này cho dịch vụ khách hàng và tạo nội dung, chi phí giảm được bao nhiêu? --- Các nhà phát triển Web3 bây giờ quá hạnh phúc, công cụ nào cũng xuất sắc hơn cái kia
Xem bản gốcTrả lời0
NonFungibleDegenvip
· 01-17 07:12
ngl điều này có thể là không có gì nhưng 92.3% về lý luận lời nói? thật sự rất ấn tượng... tôi khá lạc quan về các trợ lý giọng nói đấy
Xem bản gốcTrả lời0
WhaleWatchervip
· 01-16 18:52
92.3%?Số liệu này nghe cứ cảm giác có phần ảo ạ
Xem bản gốcTrả lời0
CryptoTherapistvip
· 01-16 18:52
ngl cảm giác chuẩn này 92.3% giống như năng lượng tự an ủi... chúng ta đã từng thấy những tuyên bố này trước đây đúng không? nhớ khi mọi người đều phát điên về "bước đột phá" của gpt-4 chứ? 👀
Xem bản gốcTrả lời0
BearMarketBuyervip
· 01-16 18:50
92.3 con số này cảm giác có chút ảo, thử chạy thực xem thế nào nhé?
Xem bản gốcTrả lời0
PhantomMinervip
· 01-16 18:49
92.3%?Nghe có vẻ ổn, nhưng dữ liệu này được đo như thế nào Phần đa ngôn ngữ thực sự có chút thú vị, chỉ là không rõ thực tế sử dụng có bị lag hay không
Xem bản gốcTrả lời0
DAOdreamervip
· 01-16 18:45
92.3%?Dữ liệu này có vẻ hơi phóng đại đấy, thực sự có thể đánh bại các tập đoàn lớn không?
Xem bản gốcTrả lời0
GasFeeVictimvip
· 01-16 18:30
92.3% liệu có thật hay chỉ là một chiêu trò.
Xem bản gốcTrả lời0
  • Ghim