Apache Pig提供了各种内置函数,即 eval,load,store,math,string,bag 和 tuple 函数。
下面给出了Apache Pig提供的 eval 函数列表。
S.N. | 函数 & 描述 |
---|---|
1 | AVG() 计算包内数值的平均值。 |
2 | BagToString() 将包的元素连接成字符串。在连接时,我们可以在这些值之间放置分隔符(可选)。 |
3 | CONCAT() 连接两个或多个相同类型的表达式。 |
4 | COUNT() 获取包中元素的数量,同时计算包中元组的数量。 |
5 | COUNT_STAR() 它类似于 COUNT() 函数。 它用于获取包中的元素数量。 |
6 | DIFF() 比较元组中的两个包(字段)。 |
7 | IsEmpty() 检查包或映射是否为空。 |
8 | MAX() 计算单列包中的列(数值或字符)的最大值。 |
9 | MIN() 要获取单列包中特定列的最小(最低)值(数字或字符)。 |
10 | PluckTuple() 使用Pig Latin的 PluckTuple() 函数,可以定义字符串Prefix,并过滤以给定prefix开头的关系中的列。 |
11 | SIZE() 基于任何Pig数据类型计算元素的数量。 |
12 | SUBTRACT() 两个包相减, 它需要两个包作为输入,并返回包含第一个包中不在第二个包中的元组的包。 |
13 | SUM() 要获取单列包中某列的数值总和。 |
14 | TOKENIZE() 要在单个元组中拆分字符串(其中包含一组字),并返回包含拆分操作的输出的包。 |
此函数用于将字符串中的所有字符转换为小写。语法以下是 LOWER()函数的语法。grunt LOWER(expression)例假设在 HDFS 目录 /pig_d...
此函数接受日期时间对象作为参数,并返回给定日期时间对象的当前分钟的秒数。语法这是 GetSecond()函数的语法。grunt GetSecond(...
Pig Latin的 LOG()函数用于计算给定表达式的自然对数(基于e)值。grunt LOG(expression)例假设在 HDFS 目录 /pig_data/ 中有一...
TANH()函数用于计算给定表达式(角度)的双曲三角正切。语法这是 TANH()函数的语法。grunt TANH(expression) 例假设在 HDFS 目录...
在“$ HADOOP_HOME/bin/hadoop fs”中还有比这里演示的更多的命令,虽然这些基本操作将让你开始。运行./bin/hadoop dfs而没有其...