RAY分布式机器学习:利用RAY进行大模型的数据处理、训练、推理和部署

2025-10-5 86 10/5

RAY分布式机器学习:利用RAY进行大模型的数据处理、训练、推理和部署

作者:[德]马克斯·普佩拉(Max Pumpe

页数:238

出版社:机械工业出版社

出版日期:2024

ISBN:9787111753384

高清校对版pdf(带目录)

前往页尾底部查看PDF电子书

内容简介

Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。本书展示了如何使用Ray构建机器学习应用程序,介绍了Ray如何融入当前的机器学习工具,以及Ray如何与这些工具紧密集成。本书前3章介绍了Ray作为分布式Python框架的基础知识,并提供了应用示例;第4-10章介绍了Ray高级库(Ray RLlib、Ray Tune、Ray Dataset、Ray Train、Ray Serve、Ray Cluster、Ray AIR),并展示如何使用高级库创建应用程序;第11章对Ray的生态进行了总结,并指导读者继续学习。

作者简介

[德]马克斯·普佩拉(Max Pumperla),是一位现居德国汉堡的数据科学家和软件工程师。作为一名活跃的开源贡献者,他是多个Python包的维护者、机器学习书籍的作者,并多次在 会议上发表演讲。他目前在Anyscale担任软件工程师。在担任Pathmind公司的产品负责人时,他使用Ray RLlib、Serve和Tune开发了用于大规模产业应用的强化学习解决方案。Max曾是Skymind的DL4J核心开发者,他拓展了Keras生态,并且是Hyperopt的维护者。

本书特色

Ray是开源分布式计算框架,简化了扩展计算密集型Python工作负载的过程。通过本书,Python程序员、数据工程师和数据科学家将学会如何在本地利用Ray并启动计算集群。你将能够使用Ray来大规模构建和运行机器学习程序。
三位作者展示了如何使用Ray构建机器学习应用程序。你将了解Ray如何融入当前的机器学习工具,并了解Ray与这些工具紧密集成的方法。分布式计算很难,但Ray让一切困难迎刃而解。
通过学习本书,你将:? 了解如何使用Ray Core构建分布式应用程序。
? 使用Ray Tune进行超参数优化。
? 使用Ray RLlib库进行强化学习。
? 使用Ray Train库管理分布式训练。
? 使用Ray Datasets进行数据处理。
? 了解如何使用Ray Clusters以及如何使用Ray Serve为模型提供服务。
? 使用Ray AIR创建端到端机器学习应用程序。

目录

目录序1前言3第1章 Ray概述111.1 Ray是什么121.1.1 Ray的渊源121.1.2 Ray的设计原则141.1.3 Ray的三层架构:内核、库、生态151.2 分布式计算框架161.3 数据科学库套件181.3.1 Ray AIR和数据科学工作流191.3.2 处理数据201.3.3 训练模型221.3.4 调优超参数261.3.5 部署模型281.4 Ray的生态301.5 总结31第2章 Ray Core入门322.1 Ray Core简介332.1.1 Ray API的第一个示例342.1.2 Ray Core API概述442.2 理解Ray的系统组件452.2.1 在节点上调度和执行任务452.2.2 主节点482.2.3 分布式调度和执行482.3 利用Ray创建简单的MapReduce示例502.3.1 映射和打乱文档数据522.3.2 利用约简进行单词统计542.4 总结56第3章 创建第一个分布式应用程序573.1 强化学习入门573.2 创建简易的迷宫问题593.3 创建模拟633.4 训练强化
PDF更新中
- THE END -

非特殊说明,本博所有文章均为博主原创。