Tiempo de ejecución de Serverless for Apache Spark 3.0

Componentes de la versión 3.0 del tiempo de ejecución de Spark

Componente 3.0.0
2025/12/04
3.0.0-RC6
2025/10/16

3.0.0-RC5
2025/10/06
3.0.0-RC4
2025/09/11
3.0.0-RC3
2025/09/08
Apache Spark 4.0.0 4.0.0 4.0.0 4.0.0 4.0.0
Conector de Cloud Storage 3.1.9 3.1.5 3.1.5 3.1.5 3.1.5
Conector de BigQuery 0.43.1-preview 0.42.3 0.42.3 0.42.3 0.42.3
Java 21 21 21 21 21
Python 3.12 3.12 3.12 3.12 3.12
Scala 2.13 2.13 2.13 2.13 2.13

Notas:

  • El entorno de ejecución de 3.0 usa UTF-8 como codificación de caracteres predeterminada.

  • Mejoras y funciones nuevas del entorno de ejecución de 3.0:

    • Las cargas de trabajo regionales y de varias zonas se usan de forma predeterminada para aumentar la disponibilidad de los recursos de procesamiento.
    • Inicio más rápido que los tiempos de ejecución anteriores
    • Limpieza rápida de recursos que permite liberar más rápido las IPs de VPC después de que se completa la carga de trabajo
    • Las credenciales del usuario final se usan para todas las cargas de trabajo de forma predeterminada
    • Nuevo catálogo de bigquery Spark, preconfigurado para interacciones listas para usar con tablas nativas de BigQuery
    • Nuevos roles de IAM específicos de Spark sin servidores
    • Se requiere la habilitación de la nueva API de dataproc-rm.googleapis.com
  • Funcionalidad no compatible y obsoleta del tiempo de ejecución de 3.0:

    • No se admite el servidor de historial persistente (PHS). En su lugar, usa la IU de Spark.
    • No se admiten los lotes de SparkR. En su lugar, usa sparklyr.
    • No se admiten las sesiones de Jupyter. En su lugar, usa sesiones de Spark Connect, el estándar de la industria para el desarrollo interactivo de Spark.

Bibliotecas de Python

Bibliotecas de Python de serverless-spark-3.0-debian-12
Nombre del paquete Versión
acelerar 1.11
bigframes 2.24
cookiecutter 2.6
cuda 12.9
cudnn 9.10
cython 3.1
dask 2025.10
dataproc-spark-connect 1.0.0
dataproc-ml 1.0.0rc1
conjuntos de datos 4.0
deepspeed 0.17
delta-spark 4.0.0
evaluate 0.4
fastavro 1.12
fastparquet 11/2024
gcsfs 2025.3
git 2.51
google-auth-oauthlib 1.2
google-cloud-aiplatform 1.121
google-cloud-bigquery 3.38
google-cloud-bigquery-storage 2.32
google-cloud-bigtable 2.34
google-cloud-container 2.59
google-cloud-datacatalog 3.27
google-cloud-dataproc 5.22
google-cloud-datastore 2.21
google-cloud-dlp 3.32
google-cloud-language 2.17
google-cloud-logging 3.12
google-cloud-monitoring 2.28
google-cloud-pubsub 2.31
google-cloud-redis 2.18
google-cloud-secret-manager 2.25
google-cloud-spanner 3.59
google-cloud-speech 2.33
google-cloud-storage 2.19
google-cloud-texttospeech 2.31
google-cloud-translate 3.21
google-cloud-vision 3.10
httplib2 0.31
huggingface_hub 0.36
ipyparallel 9.0
keyrings.google-artifactregistry-auth 1.1
langchain 1.0
lightgbm 4.6
mamba 2.3
markdown 3.9
nccl 2.27
nltk 3.9
nodejs 24.9
numba 0.61
numpy 2.1
oauth2client 4.1
onnx 1.17
openblas 0.3
opencv 4.11
orc 2.1
pandas 2.3
pyarrow 19.0
pydot 4.0
pyhive 0.7
pyiceberg 0.10
pymongo 4.15
pynvml 13.0
pytables 3.10
python 3.12
pytorch-gpu 2.6
regex 2025.10
solicitudes 2.32
rtree 1.4
scikit-image 0.25
scikit-learn 1.7
scipy 1.15
seaborn 0.13
sentence-transformers 5.1
shap 0.48
spark-tensorflow-distributor 1.0
spacy 3.8
sqlalchemy 2.0
statsforecast 2.0
sympy 1.14
tensorflow-gpu 2.18
torcheval 0.0.7
linterna 2.6
torchvision 0.21
tornado 6.5
transformadores 4.57
uritemplate 4.2
virtualenv 20.35
wordcloud 1.9
xgboost 3.0.4
ydata-profiling 4.17