Dataproc on GKE 概览

借助 Dataproc on GKE，您可以使用 Dataproc jobs API 在 GKE 集群上执行大数据应用。使用 Google Cloud 控制台、Google Cloud CLI 或 Dataproc API（HTTP 请求或 Cloud 客户端库）创建 Dataproc on GKE 虚拟集群，然后将 Spark、PySpark、SparkR 或 Spark-SQL 作业提交到 Dataproc 服务。

Dataproc on GKE 支持 Spark 3.5 版。

Dataproc on GKE 的工作原理

Dataproc on GKE 会在 GKE 集群上部署 Dataproc 虚拟集群。与 Dataproc on Compute Engine 集群不同，Dataproc on GKE 虚拟集群不包含单独的主虚拟机和工作器虚拟机。当您创建 Dataproc on GKE 虚拟集群时，Dataproc on GKE 会在 GKE 集群中创建节点池。Dataproc on GKE 作业会在这些节点池上作为 Pod 运行。节点池以及节点池上的 Pod 调度由 GKE 管理。

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2025-04-29。

Dataproc on GKE 概览 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Dataproc on GKE 的工作原理

Dataproc on GKE 概览