Gemini in BigQuery

本文档介绍了 BigQuery 中的 Gemini(适用于 Google Cloud 的 Gemini 产品组合中的一款产品)如何提供 AI 赋能的协助来帮助您处理数据。

在 BigQuery 中使用 Gemini 获得 AI 协助

BigQuery 中的 Gemini 通过以下方式提供 AI 协助:

  • 利用数据分析探索和理解您的数据。(预览版)数据洞察提供了一种自动化、直观的方式,通过使用根据表的元数据生成的富有洞察力的查询,来发现模式、评估数据质量以及执行统计分析。此功能特别有助于解决早期数据探索的冷启动挑战。如需了解详情,请参阅在 BigQuery 中生成数据分析
  • 使用 BigQuery 数据画布发现、转换、查询和直观呈现数据。(预览版)使用自然语言,您可以查找、联接和查询表格资源,直观呈现结果,并在整个过程中与他人无缝协作。如需了解详情,请参阅使用数据画布进行分析
  • 获取 SQL 和 Python 辅助数据分析。您可以使用 BigQuery 中的 Gemini 生成或建议 SQL 或 Python 代码,以及解释现有 SQL 查询。您也可以使用自然语言查询来开始数据分析。如需了解如何生成、补全和汇总代码,请参阅以下文档:
  • 通过分区、聚类和具体化视图建议优化数据基础架构。您可以让 BigQuery 监控您的 SQL 工作负载,寻找提高性能和降低费用的机会。如需了解详情,请参阅以下文档:
  • 对无服务器 Apache Spark 工作负载进行自动调优和问题排查。 (预览版)自动调整可以根据最佳实践和对先前工作负载运行的分析,将配置设置应用于周期性 Spark 工作负载,从而自动优化 Spark 作业。Gemini 的高级问题排查功能可以解释和显示作业错误,并提供切实可行的建议来修复运行缓慢或失败的作业。如需了解详情,请参阅自动调整 Spark 工作负载高级问题排查
  • 使用转换规则自定义 SQL 转换。(预览版)创建 Gemini 增强型转换规则,以便在使用交互式 SQL 转换工具时自定义 SQL 转换。您可以使用自然语言提示来描述 SQL 翻译输出的更改,或指定要查找和替换的 SQL 模式。如需了解详情,请参阅创建转换规则
BigQuery 中的 Genmini 使用 Google 开发的大语言模型 (LLM)。LLM 使用数十亿行开源代码、安全数据和 Google Cloud 专有内容(如文档和示例代码)进行微调。

Gemini for Google Cloud 不会将您的提示或其回答作为数据来训练模型。如需了解详情,请参阅适用于 Google Cloud 的 Gemini 如何使用您的数据。 作为一项处于早期阶段的技术,适用于 Google Cloud 的 Gemini 可以生成看似合理但实际不正确的输出。我们建议您在使用 Gemini 之前验证适用于 Google Cloud 的所有输出。如需了解详情,请参阅适用于 Google Cloud 和 Responsible AI 的 Gemini

在哪里与 Gemini 互动

在 BigQuery 中设置 Gemini 后,您可以在 BigQuery 中使用 Gemini 执行以下操作:

  • 如需使用数据分析,请转到表条目的数据分析标签页,您可以在其中确定模式、评估质量以及对 BigQuery 数据运行统计分析。
  • 如需使用数据画布,请从表或查询中创建数据画布或使用数据画布,以使用自然语言探索数据资源并共享画布。
  • 如需获取辅助 SQL 查询,请使用帮助我编写代码工具,该工具可让您迭代查询、指定源数据,然后将查询插入 BigQuery Studio。
  • 如需查看有关分区、聚类具体化视图的建议,请点击 Google Cloud 控制台工具栏中的 建议
  • 如需使用自然语言生成 SQL 或 Python 代码,或在输入时借助自动补全功能接收建议,请使用“帮我编写代码”工具运行 SQL 查询Python 代码。Gemini 也可以用自然语言解释您的 SQL 代码。

对 Spark 作业进行自动调优和问题排查

自动扩缩可以帮助您优化 Spark 工作负载,以提高性能和弹性。您无需手动配置设置,Gemini 可以针对周期性工作负载应用最佳实践,然后帮助您了解和监控自动调节。高级问题排查功能可以用自然语言回答“什么是自动调优的?”“现在发生什么?”和“我该怎么办?”

在 BigQuery 中设置 Gemini

如需了解详细设置步骤,请参阅在 BigQuery 中设置 Gemini

后续步骤