今日,Groq 和 PlayAI 宣布达成合作,双方将通过 Groq 的高速推理平台,把先进的文本转语音模型 Dialog 推向市场。
此次合作融合了 PlayAI 在语音 AI 领域的专业技术以及 Groq 的专用处理基础设施,两家公司称,由此打造出了目前自然度和响应性最为出色的文本转语音系统之一。
Groq 首席营收官伊恩・安德鲁斯(Ian Andrews)在接受 VentureBeat 独家采访时表示:“Groq 提供了一个完整的、低延迟的系统,集自动语音识别(ASR)、生成式人工智能(GenAI)和文本转语音功能于一身。现在 Dialog 在 GroqCloud 上运行,这意味着客户无需为单一应用场景使用多家供应商的服务,Groq 就是一站式解决方案。”
Groq 助力首个阿拉伯语语音 AI 诞生,拓展中东科技版图
Dialog 的一大亮点是同时支持英语和阿拉伯语,其中阿拉伯语版本是首个专为中东地区设计的语音 AI。将阿拉伯语作为首发语言之一,对两家公司而言有着深远的战略意义。
安德鲁斯告诉 VentureBeat:“阿拉伯语是全球使用人数第四多的语言。通过与 PlayAI 合作推出阿拉伯语文本转语音模型,Groq 正在开拓一个关键的全球市场,让更多人能够便捷地使用快速的 AI 推理服务。”
两家公司称,他们的解决方案弥补了现有语音 AI 技术的关键短板,尤其是在自然语音模式和响应速度方面。第三方评估机构 Podonos 进行的基准测试显示,相比 ElevenLabs v2.5 Turbo,用户对 Dialog 的青睐度达到 10 比 1;对比 ElevenLabs Multilingual v2.0,这一比例也超过 3 比 1。
创新的 “自适应语音情境化器” 革新对话式 AI
Dialog 的独特之处在于其先进的情境处理方式。该系统不会把每次发声当作孤立事件,而是能感知整个对话流程。
PlayAI 联合创始人兼首席执行官马哈茂德・费尔费尔(Mahmoud Felfel)在接受 VentureBeat 采访时表示:“我们构建了一种全新的架构,称之为‘自适应语音情境化器’(ASC)。它能让模型利用对话的完整情境和历史信息。这意味着,每一个回复都不是孤立的输出,而是融入了恰当的韵律、语气和情感,与对话的流程相契合。”
对于希望应用对话式 AI 的企业来说,延迟,即请求与响应之间的时间差,一直是个棘手的问题。Groq 的专用语言处理单元(LPUs)在这方面似乎有着显著优势。
安德鲁斯解释道:“根据最初的内部测试,Groq 在 PlayAI 的 Dialog 模型上每秒可处理多达 140 个字符,相比在 GPU 上运行同一模型时每秒 86 个字符的处理速度,有了大幅提升。这意味着 Dialog 生成文本的速度比实时速度快了近 10 倍。”
Groq 获沙特 15 亿美元投资,打造世界级 AI 基础设施
此次合作正值 Groq 大力扩张之际,该公司最近获得了沙特阿拉伯 15 亿美元的投资,用于建设更多基础设施。Groq 已在达曼建立了数据中心,称其为 “该地区最大的推理集群” 。
费尔费尔说:“与 Groq 合作是理所当然的选择,他们是先进 AI 推理基础设施领域的行业领导者。在文本转语音和智能体应用中,低延迟至关重要。我们已经针对这些实时应用对 Dialog 进行了优化,但与 Groq 合作,能让我们推出市场上延迟最低的语音模型。”
随着企业期望在实现客户交互自动化的同时,保持自然、人性化的体验,语音 AI 市场增长迅速。其应用范围广泛,涵盖客户服务、销售自动化、配音,以及为视障人士提供无障碍功能等领域。
企业应用不再局限于传统客户服务场景
安德鲁斯表示:“除了客户服务,企业的其他应用场景还包括销售和预约自动化、入职流程辅助和个人助理服务、为现有内容制作配音、将英语音视频内容翻译成阿拉伯语,以及提升网站和静态内容对视障人士的可访问性等等。”
对于由中东和北非地区企业家创立的 PlayAI 来说,融入阿拉伯语功能意义非凡。
费尔费尔称:“作为中东和北非地区的创业者,我们深知该地区在 AI 技术和基础设施上投入巨大,Groq 获得的投资就是例证,而且该地区对 AI 的应用也处于世界领先水平。阿拉伯语是一门全球商业语言,也是我们自幼使用的语言,所以将其作为核心语言之一是顺理成章的选择。”
目前,两家公司已通过 GroqCloud 的分层服务模式提供 Dialog 技术,该模式包含免费和付费选项。这样一来,开发者可以在大规模应用之前,先行试用这项技术。
安德鲁斯介绍道:“GroqCloud 提供免费和付费套餐。任何人都能免费创建账户并生成 API 代码。我们的付费开发者套餐支持自助服务,只要有信用卡,任何人都可以自行注册。”
随着语音在 AI 系统中的交互作用日益重要,此次合作让两家公司得以顺应市场对更自然、响应更迅速的对话体验的需求。通过攻克延迟和自然语音模式等技术难题,Groq 和 PlayAI 或许已经扫除了语音 AI 在企业中更广泛应用的重大障碍。