Apache Pig是一种用于处理大型数据集的开源软件,它可以帮助用户快速、有效地处理大量数据。它是基于Hadoop的,可以在Hadoop集群上运行,并且可以使用MapReduce来处理大量数据。Pig的语法非常类似SQL,因此对于那些熟悉SQL的人来说,学习Pig也很容易。
Pig的主要优势之一是它可以自动将复杂的MapReduce作业分解成一系列小作业,这样就可以减少开发时间。此外,Pig还具有高度可扩展性和易于使用性。它允许用户使用不同的语言来开发MapReduce作业,例如Java、Python、Ruby和Perl。此外,Pig还允许用户使用UDFs(User Defined Functions)来扩展其功能。
A = LOAD 'data' USING PigStorage(',') AS (f1:int, f2:int, f3:chararray); B = FILTER A BY f1 > 5; C = FOREACH B GENERATE f2, f3; DUMP C;
TANH() 函数用于计算给定表达式(角度)的双曲三角正切。
这是 TANH() 函数的语法。
grunt> TANH(expression)
假设在 HDFS 目录 /pig_data/ 中有一个名为 math.txt 的文件。此文件包含整数和浮点值,如下所示。
math.txt
5 16 9 2.5 5.9 3.1
通过使用 math_data 关系将此文件加载到Pig中,如下所示。
grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',') as (data:float);
现在使用 TANH() 函数计算math.txt文件内容的双曲正切值,如下所示。
grunt> tanh_data = foreach math_data generate (data), TANH(data);
上述语句结果将存储在名为 tanh_data 的关系中。使用Dump运算符验证关系的内容,如下所示。
grunt> Dump tanh_data; (5.0,0.9999092042625951) (16.0,0.9999999999999747) (9.0,0.999999969540041) (2.5,0.9866142981514303) (5.9,0.9999849909996685) (3.1,0.9959493584508665)
在“$ HADOOP_HOME/bin/hadoop fs”中还有比这里演示的更多的命令,虽然这些基本操作将让你开始。运行./bin/hadoop dfs而没有其...
analysis.getDailyRetain本接口应在服务器端调用,详细说明参见服务端API。本接口支持云调用。需开发者工具版本 =1.02.1904090(...
logistics.batchGetOrder本接口应在服务器端调用,详细说明参见服务端API。本接口支持云调用。需开发者工具版本 =1.02.1904090(...
小程序运行机制前台/后台状态小程序启动后,界面被展示给用户,此时小程序处于前台状态。当用户点击右上角胶囊按钮关闭小程序,...
后端 API小程序还提供了一系列在后端服务器使用 HTTPS 请求调用的 API,帮助开发者在后台完成各类数据分析、管理和查询等操作。...