Pig编程指南

2026-1-2 65 1/2

Pig编程指南

作者:(美)盖茨

页数:191

出版社:人民邮电出版社

出版日期:2013

ISBN:9787115301116

高清校对版pdf(带目录)

前往页尾底部查看PDF电子书

内容简介

  《pig编程指南》不仅为初学者讲解apache
pig的基础知识,同时也向有一定使用经验的高级用户介绍更加综合全面的pig重要特性,如piglatin脚本语言、控制台shell交互命令以及用于对pig进行拓展的用户自定义函数(udf)等。当读者有大数据处理需求时,《pig编程指南》提供了如何更高效地使用pig来完成需求的方法。
  
  《pig编程指南》适合各个层次的pig用户及开发人员阅读使用。

作者简介

  alan gates
是将PIG从雅虎的研究项目转化成一个成功的Apache开源项目的工程师团队中最早的成员。他负责监督Pig的实现、编程接口和总体设计。

本书特色

  apache pig 是一个高级过程语言,适合于使用 hadoop 和 mapreduce
平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 sql 的查询,pig 可以简化 hadoop
的使用。本文不仅为初学者讲授,pig 的基础知识,同时还向有经验的用户更加全面的介绍pig的重点特性。
通过学习本书,你将能够身日了解数据模型,包括基本数据和复杂数据类型。掌握更高效的在hadoop集群中运行脚本的方法和技巧。

目录

第1章 初识pig 
1.1 pig是什么? 
1.1.1 pig是基于hadoop的 
1.1.2 pig latin,一种并行数据流语言 
1.1.3 pig的用途 
1.1.4 pig的设计思想 
1.2 pig发展简史 
 
第2章 安装和运行pig 
2.1 下载和安装pig 
2.1.1 从apache下载pig软件包 
2.1.2 从cloudera下载pig 
2.1.3 使用maven下载pig 
2.1.4 下载pig源码 
2.2 运行pig
百度网盘:https://pan.baidu.com/s/1xFQUzo49znUkQ9-s2ivy9A?pwd=iieh
- THE END -

非特殊说明,本博所有文章均为博主原创。