Sail
未知
Sail 是一个统一流处理、批处理和计算密集型工作负载的框架,提供 Spark SQL 和 DataFrame API 的直接替代方案。
安装
pip install "pysail[spark]"
使用步骤
1. 启动 Sail 服务器
命令行方式:
sail spark server --port 50051
Python API 方式:
from pysail.spark import SparkConnectServer
server = SparkConnectServer(port=50051)
server.start(background=False)
Kubernetes 方式:
kubectl apply -f sail.yaml kubectl -n sail port-forward service/sail-spark-server 50051:50051
2. 连接到 Sail 服务器
from pyspark.sql import SparkSession
spark = SparkSession.builder.remote("sc://localhost:50051").getOrCreate()
spark.sql("SELECT 1 + 1").show()
文档与支持
- 完整文档:docs.lakesail.com/sail/latest/
- 问题报告:GitHub Issues
- 社区讨论:GitHub Discussions
- 企业支持:联系 LakeSail