摘要:Cohere 认为,像 Embed 4 这样的模型能够优化智能体的应用场景,并宣称它可以成为企业内智能体和人工智能助手的 “最佳搜索引擎”。...

企业检索增强生成(RAG)在当下智能体人工智能热潮中依旧至关重要。趁着人们对智能体持续高涨的兴趣,Cohere 发布了其嵌入模型的最新版本 Embed 4,它拥有更长的上下文窗口,多模态功能也更强大。

Cohere 的 Embed 4 在 Embed 3 多模态更新的基础上进行了升级,围绕非结构化数据增添了更多功能。凭借 12.8 万个令牌的上下文窗口,企业机构能够为长达约 200 页的文档生成嵌入向量。

Cohere 在一篇博文中提到:“现有的嵌入模型无法原生理解复杂的多模态商业材料,这使得企业不得不开发繁琐的数据预处理流程,但即便如此,准确性也只能得到些许提升。Embed 4 解决了这一难题,让企业及其员工能够高效地挖掘隐藏在海量难以检索信息中的深刻见解。”

为了进一步保障数据安全,企业可以在虚拟私有云或本地技术堆栈上部署 Embed 4。

企业可以通过生成嵌入向量,将文档或其他数据转化为数值表示形式,以便用于检索增强生成(RAG)相关的应用场景。之后,智能体可以参考这些嵌入向量来回答各种指令。

特定领域知识

Cohere 表示,Embed 4 在金融、医疗和制造业等 “受监管行业” 表现卓越。Cohere 主要专注于企业人工智能应用场景,其模型充分考虑了受监管行业的安全需求,对各类业务有着深刻的理解。

该公司对 Embed 4 进行了训练,使其能够 “应对嘈杂的真实世界数据”。也就是说,即便面对企业数据中诸如拼写错误和格式问题等 “不完美之处”,它也能保持较高的准确性。

Cohere 还指出:“Embed 4 在搜索扫描文档和手写内容方面也表现出色。这些格式在法律文书、保险发票和费用收据中很常见。这一功能让企业无需进行复杂的数据准备或预处理流程,节省了时间和运营成本。”

企业机构可以将 Embed 4 用于制作投资者演示文稿、尽职调查文件、临床试验报告、维修指南以及产品文档等。

和前一版本的模型一样,Embed 4 支持 100 多种语言。

注重安全行业的检索准确率

Cohere 的客户 Agora 将 Embed 4 应用于其人工智能搜索引擎,结果发现该模型能够精准筛选出相关产品。

Agora 的创始人帕拉姆・贾吉(Param Jaggi)在博文中表示:“电商数据非常复杂,包含图像和多方面的文本描述。能够用统一的嵌入向量来表示我们的产品,这让我们的搜索速度更快,内部工具的使用效率也更高。”

智能体应用场景

Cohere 认为,像 Embed 4 这样的模型能够优化智能体的应用场景,并宣称它可以成为企业内智能体和人工智能助手的 “最佳搜索引擎”。

Cohere 表示:“除了在各类数据类型上都具备高准确率之外,该模型还拥有企业级的高效性能,这使其能够进行扩展,满足大型企业的需求。”

Cohere 补充道,Embed 4 会生成压缩的数据嵌入向量,有助于降低高昂的存储成本。

基于嵌入向量和检索增强生成(RAG)的搜索功能,能让智能体参考特定文档来完成与指令相关的任务。许多人认为,这种方式能提供更准确的结果,确保智能体不会给出错误或凭空编造的答案。

Cohere 的竞争对手推出的其他嵌入模型,还包括 Qodo 的 Qodo - Embed - 1 - 1.5B,以及数据库供应商 MongoDB 近期收购的 Voyage AI 推出的模型。