新的 Amazon Bedrock 功能

Amazon Bedrock 新功能提升数据处理和检索能力

关键要点

  • 数据自动化 :Amazon Bedrock 现提供全新的数据自动化功能,能从文本、图片、音频和视频等多模态内容中快速提取有价值的见解。
  • 知识库增强 :支持多模态数据处理和结构化数据检索,能够处理文本与视觉元素,有助于提高响应的准确性和相关性。
  • GraphRAG 支持 :引入 GraphRAG,以图形化方式提升生成式 AI 应用的响应质量。
  • 自然语言查询 :支持通过自然语言查询数据仓库和数据湖,优化企业数据访问,提高响应准确性。

今天, 发布了四项新功能,以简化使用 进行数据分析的方式:

Amazon Bedrock 数据自动化(预览版)

这是一项全管理的功能,旨在简化从非结构化的多模态内容(如文档、图片、音频和视频)中生成有价值的洞察。通过 Amazon Bedrock数据自动化,您可以快速经济地构建智能文档处理(IDP)、媒体分析和 工作流。所生成的洞察包括关键时刻的视频总结、不当图片内容检测、复杂文档的自动分析等。您还可以根据特定的商业需求自定义输出。Amazon Bedrock数据自动化可以作为独立功能使用,也可以在构建 RAG 工作流的知识库时作为解析器使用。

Amazon Bedrock 知识库现支持多模态数据处理

为了帮助构建既能处理文本又能处理文档和图片中的视觉元素的应用,您可以将知识库配置为使用 Amazon Bedrock 数据自动化或某个

作为解析器。多模态数据处理可以提高知识库响应的准确性和相关性,因为它可以获取嵌入在图片和文本中的信息。

Amazon Bedrock 知识库支持 GraphRAG(预览版)

我们现在提供了一种完全管理的 GraphRAG 功能。GraphRAG 通过结合 RAG 技术和图形,能够为最终用户提供更准确和全面的响应,从而提升生成式 AI 应用的表现。

Amazon Bedrock 知识库支持结构化数据检索

此功能扩展了知识库的能力,支持自然语言查询数据仓库和数据湖,使应用程序能够通过对话接口访问商业智能(BI),并通过包括关键的企业数据来提高响应的准确性。AmazonBedrock 知识库提供了一种首个全管理的即用 RAG 解决方案,可以从数据所在的位置原生查询结构化数据。这项功能帮助打破数据孤岛,加速生成式 AI应用的构建,从超过一个月的时间缩短到几天。

这些新功能使得构建完善的 AI 应用变得更加简单,它们能够处理、理解并从结构化和非结构化数据源中检索信息。例如,某汽车保险公司可以利用 AmazonBedrock 数据自动化来自动化他们的理赔审核工作,从而减少处理汽车索赔所需的时间,提高理赔部门的工作效率。

同样,一家媒体公司可以分析电视节目并提取广告投放所需的智能洞察,例如场景摘要、行业标准广告分类(IAB)和公司标志。一家媒体制作公司可以生成逐场景的摘要并捕捉视频资产中的关键时刻。一家金融服务公司可以处理包含图表和表格的复杂财务文件,并使用 GraphRAG 理解不同金融实体之间的关系。所有这些公司都可以使用结构化数据检索来查询他们的数据仓库,同时从知识库中检索信息。

接下来,我们更详细地看看这些功能。

Amazon Bedrock 数据自动化介绍

Amazon Bedrock 数据自动化简化了从多模态非结构化内容(如文档、图片、视频和音频文件)中提取有价值见解的过程。

此功能提供统一的、基于 API 的体验,开发人员可以通过单一接口处理多模态内容,免去管理和协调多个 AI模型和服务的麻烦。结合内建的保障措施(如视觉定位和置信度评分),Amazon Bedrock数据自动化有助于提高提取见解的准确性和可信度,使其更易于集成到企业工作流中。

Amazon Bedrock 数据自动化支持四种模态(文档、图片、视频和音频)。在应用中使用时,所有模态都通过相同的异步推理 API 进行处理,结果保存到 存储桶中。

针对每种模态,您可以根据处理需求配置输出,并生成两种类型的输出:

  • 标准输出 :通过标准输出,您可以获取与输入数据类型相关的预定义默认见解。例如,文档的语义表示、按场景的视频摘要、音频转录等。您只需几步即可配置要提取的见解。
  • 自定义输出 :通过自定义输出,您可以灵活定义和指定提取需求,使用称为“蓝图”的工件生成满足商业需求的洞察。您还可以将生成的输出转换为与下游系统(如数据库或其他应用程序)兼容的特定格式或模式。

标准输出可用于所有格式(音频、文档、图片和视频)。在预览期间,自定义输出仅可用于文档和图片。

标准输出和自定义输出配置均可保存在项目中,以便在 Amazon Bedrock 数据自动化推理 API中引用。一个项目可以配置为对每个处理的文件生成标准输出和自定义输出。

接下来,我们看一个处理文档以实现标准和自定义输出的例子。

使用 Amazon Bedrock 数据自动化

在 中,我选择导航面板中的 数据自动化 。在这里,我可以查看此功能在一些示例用例中的工作方式。

然后,我在导航面板的 数据自动化 部分选择 演示 。我可以使用提供的示例文档之一或上传我自己的文件进行尝试。例如,假设我正在处理一个需要处理出生证明的应用程序。

我开始上传一份出生证明,以查看标准输出结果。第一次上传文档时,我需要确认创建一个用于存储资产的 S3存储桶。当我查看标准输出时,我可以通过一些快捷设置来调整结果。

我选择 自定义输出 选项卡。该文档通过一个示例蓝图被识别,并从多个字段中提取信息。

应用程序所需的大部分数据已经提取,但我需要一些自定义。例如,出生证明的签发日期(2022年6月10日)的格式与文档中其他日期不同。我还需要发证州以及两个标记,告诉我儿童的姓氏是否与父亲或母亲的姓氏相同。

之前的蓝图中的大部分字段使用 显式 提取类型。这意味着它们直接从文档中提取,如果我需要特定格式的日期,我可以创建一个使用 推断 提取类型的新字段,并添加从文档内容格式化结果的说明。推断提取可用于执行转换,例如日期格式或社会安全号码(SSN)格式,或者进行验证,例如检查某人是否年满 21 岁。

示例蓝图无法编辑。我选择 复制蓝图 创建一个可以编辑的新蓝图,然后从 字段 下拉菜单中选择 添加字段

我添加了四个提取类型为 推断 的字段及这些指令:

  1. 出生证明签发日期的 MM/DD/YYYY 格式
  2. 出生证明发证州
  3. 儿童姓氏是否等于父亲姓氏
  4. 儿童姓氏是否等于母姓

前两个字段是字符串,后两个是布尔值。

创建新字段后,我可以将新蓝图应用于我之前上传的文档。

我选择 获取结果 ,查看结果中的新字段。我看到日期按照我需要的格式呈现,两个标记和州的信息也一并提取。

现在,我已经创建了一个符合我应用需求的自定义蓝图,我可以将其添加到项目中。我可以将多个蓝图与一个项目关联,以处理不同类型的文档,例如护照的蓝图、出生证明的蓝图、发票的蓝图等等。在处理文档时,AmazonBedrock 数据自动化将根据项目内的蓝图匹配每个文档,以提取相关信息。

我也可以从头开始创建一个新的蓝图。在这种情况下,我可以从提示开始,声明我希望在上传文档中找到的所有字段,并执行规范化或验证。

Amazon Bedrock 数据自动化还可以处理音频和视频文件。例如,以下是在上传一段由 的主题演讲视频后的标准输出。

输出需要几分钟,结果包含总体视频的总结、逐场景的摘要以及视频中显示的文本。在这里,我可以切换选项以获得完整的音频转录、内容审核或 分类。

我还可以在创建知识库时使用 Amazon Bedrock数据自动化作为解析器,提取丰富视觉文档和图片中的洞察,以进行检索和响应生成。接下来,我们来看看这一点。

在 Amazon Bedrock 知识库中使用多模态数据处理

多模态数据处理支持使应用能够理解文档中的文本和视觉元素。

借助多模态数据处理,应用程序可以使用知识库:

  • 从视觉元素中检索答案,除了现有的文本支持。
  • 根据文本和视觉数据的上下文生成响应。
  • 提供引用来源,参考原始文档中的视觉元素。

在 Amazon Bedrock 控制台中创建知识库时,我现在可以选择 Amazon Bedrock 数据自动化 作为 解析策略

当我选择 Amazon Bedrock 数据自动化作为解析器 时,该系统将处理从丰富视觉内容中提取、转换和生成见解的所有工作,而 AmazonBedrock 知识库则管理信息的摄取、检索和模型响应的生成以及来源归属。

另外,我也可以继续使用现有的 基础模型作为解析器 选项。使用此选项时,支持将 Anthropic 的 Claude 3.5 Sonnet作为解析器,我可以使用默认提示或针对特定用例进行修改。

在下一步中,我需要指定 多模态存储去向 ,这将由 Amazon Bedrock知识库使用来存储从文档中提取的图像。这些图像可以根据用户查询进行检索,用于生成响应,并在响应中引用。

当使用知识库时,由 Amazon Bedrock 数据自动化 或基础模型作为解析器提取的信息可用于检索视觉元素的信息、理解图表和图示,并提供引用文本与视觉内容的响应。

在 Amazon Bedrock 知识库中使用 GraphRAG

从散乱数据源提取见解给 RAG 应用带来了显著挑战,往往需要跨多个数据源进行多步推理以生成相关响应。例如,客户可能会要求一个由生成式 AI支持的旅行应用识别出家庭友好的海滩目的地,并提供从他们的家出发的直飞航班,同时确保有良好的海鲜餐厅。这需要一个连接的工作流来确定其他家庭所喜欢的合适海滩,将其与航班路线匹配,并选择当地的高评价餐厅。传统的 RAG 系统可能会因为信息分散在不同来源而难以将这些信息合成一个连贯的推荐。

知识图谱可以通过以结构化的方式建模实体之间的复杂关系来应对这一挑战。然而,将图谱构建并集成到应用程序中需要大量的专业知识和精力。

Amazon Bedrock 知识库现在提供了首个完全管理的 GraphRAG 能力,该能力通过使用结合 RAG 技术和图形来增强生成式 AI应用,提供更准确和全面的终端用户响应。

在创建知识库时,我现在可以通过选择 作为数据库,轻松启用 GraphRAG。这将自动生成底层数据、实体和其关系的向量和图形表示,将开发工作从数周缩短为数小时。

我开始创建新知识库。在 向量数据库部分 ,创建新向量存储时,我选择 Amazon Neptune 分析(GraphRAG) 。如果我不想创建新图,我可以提供现有的向量存储,并从列表中选择 Neptune Analytics 图。GraphRAG 使用 自动构建知识库的图谱。

在知识库创建完成后,Amazon Bedrock 会自动构建一个图,链接相关概念和文档。在从知识库检索信息时,GraphRAG将遍历这些关系,以提供更全面和准确的响应。

在 Amazon Bedrock 知识库中使用结构化数据检索

结构化数据检索允许对数据库和数据仓库进行自然语言查询。例如,商业分析师可能会问:“上个季度我们的畅销产品是什么?”系统会自动生成并运行适当的 SQL查询,以访问存储在 数据库中的数据。

在创建知识库时,我现在可以选择使用 结构化数据存储

我输入知识库的名称和描述。在 数据源详情 中,选择 作 查询引擎 。我创建一个新的 服务角色来管理知识库资源,并选择 下一步

我在 连接选项 中选择 Redshift 无服务器架构 和要使用的 工作组 。同样也支持使用 Amazon Redshift预置的集群。我使用之前创建的 IAM 角色进行 身份认证 。存储元数据可以通过 AWS Glue 数据目录 管理,或者直接在 AmazonRedshift 数据库中管理。我从列表中选择一个数据库。

在知识库配置中,我可以定义每个查询的最大持续时间,并选择包含或排除对表或列的访问。为了提高自然语言查询生成的准确性,我还可以选择为表和列添加描述,以及一组精心策划的查询,提供如何将问题翻译成 SQL 查询的实际例子。我选择 下一步 ,检查设置并完成知识库的创建。

几分钟后,知识库准备就绪。一旦同步完毕,Amazon Bedrock知识库处理生成、运行和格式化查询结果,使构建自然语言与结构化数据接口变得简单。当调用知识库以进行结构化数据时,我可以请求只生成 SQL、检索数据或用自然语言总结数据。

需要注意的事项

这些新功能今天在以下 提供:

  • Amazon Bedrock 数据自动化在美国西部(俄勒冈州)提供预览。
  • 使用 Amazon Bedrock 数据自动化 作为解析器的多模态数据处理支持在美国西部(俄勒冈州)处于预览阶段。基础模型作为解析器在所有提供 Amazon Bedrock 知识库的区域可供使用。
  • GraphRAG 在 Amazon Bedrock 知识库中在所有提供 Amazon Bedrock 知识库和 Amazon Neptune 分析的商业区域处于预览。
  • 结构化数据检索在提供 Amazon Bedrock 知识库的所有商业区域中可用。

和往常一样,Amazon Bedrock 的定价基于使用量:

  • Amazon Bedrock 数据自动化按图像、按文档页和按音频或视频分钟收费。
  • Amazon Bedrock 知识库中的多模态数据处理根据使用 Amazon Bedrock 数据自动化 或基础模型作为解析器进行收费。
  • 使用 GraphRAG 在 Amazon Bedrock 知识库中并不收取额外费用,但您需支付 作为向量存储的费用。有关更多信息,请访问 。
  • 在 Amazon Bedrock Knowledge Bases 中使用结构化数据检索时,会产生额外费用。

有关详细的定价信息,请参见 。

每项功能可以独立使用,也可以组合使用。整合这些功能,能更便捷快速地构建使用 AI 处理数据的应用程序。要开始,请访问 。要了解更多,可以访问 ,并向 提交反馈。您还可以在 查找深入的技术内容,了解我们的构建社区如何使用 Amazon Bedrock。期待您使用这些新功能搭建更出色的应用!

Leave a Reply

Required fields are marked *