GPT-4o 系列 AI 模型加持,微软 LlamaParse 文档解析能力全面升级

xxn 阅读:81208 2024-11-28 14:00:40 评论:0

IT之家 11 月 28 日消息,微软于 11 月 26 日发布博文,宣布在其 LlamaParse 中集成 Azure OpenAI 端点,利用 GPT-4o 系列模型,提升非结构化数据提取并解析多模态文档的能力,并与 Azure AI Search 向量数据库无缝连接,实现完整的检索增强生成(RAG)工作流程。

LlamaParse 简介

微软 LlamaParse 是专为生成式人工智能(GenAI)而设计的文档解析器,旨在解析和整理多样文档数据,以确保数据在传送至下游大型语言模型 (LLM) 前具备高质量。

新增 Azure OpenAI 端点(endpoints)

通过微软 LlamaParse 的集成,用户现可调用 Azure OpenAI 的 GPT-4o 系列模型,实现非结构化数据提取和文档转换。这种集成充分发挥了双方优势,LlamaParse负责高效解析,而Azure OpenAI则提供强大的语言模型能力,从而更精确、更智能地处理文档。

据IT之家引述的报道,本次更新内容如下:

  • 直接连接到 Azure OpenAI 的 GPT-4o 和 GPT-4o-mini 等模型

  • 借助 Azure OpenAI 的多模态支持,LlamaParse 实现多模态文档解析

  • 优化的LLM输出,用于增强检索和语义搜索

  • 无缝将解析数据传输至Azure AI Search的向量存储库中

  • 适用于敏感工作负载的企业级安全性和合规性

用户可以结合LlamaCloud、Azure AI Search 和 Azure OpenAI,构建一个完整的RAG工作流程,具体步骤包括:

  • 解析和生成:使用LlamaParse Premium 和 Azure OpenAI 进行高级文档提取,生成Markdown、LaTeX 和 Mermaid 图表等多格式的LLM优化输出

  • 分块和嵌入:使用Azure AI Search作为向量存储,并利用Azure AI模型目录中的嵌入模型,对解析后的内容进行分块、嵌入和索引

  • 搜索和生成:借助Azure AI Search的查询重写和语义重新排序功能,提升检索质量。最终,通过Llamaindex编排Azure AI Search 和 Azure OpenAI,构建生成式AI应用

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容