[PDF下载] RAY分布式机器学习:利用RAY进行大模型的数据处理、训练、推理和部署

2025-10-5 98 10/5

RAY分布式机器学习:利用RAY进行大模型的数据处理、训练、推理和部署

作者:[德]马克斯·普佩拉(Max Pumpe

页数:238

出版社:机械工业出版社

出版日期:2024

ISBN:9787111753384

高清校对版pdf(带目录)

夸克网盘:https://pan.quark.cn/s/1cb5466b140b

百度网盘:https://pan.baidu.com/s/1gtYB19VYwPZiOpBaB5nltg?pwd=9tnb

内容简介

Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。本书展示了如何使用Ray构建机器学习应用程序,介绍了Ray如何融入当前的机器学习工具,以及Ray如何与这些工具紧密集成。本书前3章介绍了Ray作为分布式Python框架的基础知识,并提供了应用示例;第4-10章介绍了Ray高级库(Ray RLlib、Ray Tune、Ray Dataset、Ray Train、Ray Serve、Ray Cluster、Ray AIR),并展示如何使用高级库创建应用程序;第11章对Ray的生态进行了总结,并指导读者继续学习。

作者简介

[德]马克斯·普佩拉(Max Pumperla),是一位现居德国汉堡的数据科学家和软件工程师。作为一名活跃的开源贡献者,他是多个Python包的维护者、机器学习书籍的作者,并多次在 会议上发表演讲。他目前在Anyscale担任软件工程师。在担任Pathmind公司的产品负责人时,他使用Ray RLlib、Serve和Tune开发了用于大规模产业应用的强化学习解决方案。Max曾是Skymind的DL4J核心开发者,他拓展了Keras生态,并且是Hyperopt的维护者。

本书特色

Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。通过本书,Python程序员、数据工程师和数据科学家将学会如何在本地利用Ray并启动计算集群。你将能够使用Ray来大规模构建和运行机器学习程序。
三位作者展示了如何使用Ray构建机器学习应用程序。你将了解Ray如何融入当前的机器学习工具,并了解Ray与这些工具紧密集成的方法。分布式计算很难,但Ray让一切困难迎刃而解。
通过学习本书,你将:? 了解如何使用Ray Core构建分布式应用程序。
? 使用Ray Tune进行超参数优化。
? 使用Ray RLlib库进行强化学习。
? 使用Ray Train库管理分布式训练。
? 使用Ray Datasets进行数据处理。
? 了解如何使用Ray Clusters以及如何使用Ray Serve为模型提供服务。
? 使用Ray AIR创建端到端机器学习应用程序。

目录

目录序1前言3第1章 Ray概述111.1 Ray是什么121.1.1 Ray的渊源121.1.2 Ray的设计原则141.1.3 Ray的三层架构:内核、库、生态151.2 分布式计算框架161.3 数据科学库套件181.3.1 Ray AIR和数据科学工作流191.3.2 处理数据201.3.3 训练模型221.3.4 调优超参数261.3.5 部署模型281.4 Ray的生态301.5 总结31第2章 Ray Core入门322.1 Ray Core简介332.1.1 Ray API的第一个示例342.1.2 Ray Core API概述442.2 理解Ray的系统组件452.2.1 在节点上调度和执行任务452.2.2 主节点482.2.3 分布式调度和执行482.3 利用Ray创建简单的MapReduce示例502.3.1 映射和打乱文档数据522.3.2 利用约简进行单词统计542.4 总结56第3章 创建第一个分布式应用程序573.1 强化学习入门573.2 创建简易的迷宫问题593.3 创建模拟633.4 训练强化
- THE END -

非特殊说明,本博所有文章均为博主原创。