Java流统计词频是一种基于Java语言的文本处理技术,它可以帮助我们快速统计出文本中每个单词出现的次数。它可以帮助我们分析文本中的关键字,并且可以用来分析文章的主题。
Java流统计词频的实现原理是:首先,使用Java流API将文本内容读取到内存中;然后,使用Map集合来存储单词和出现次数之间的映射关系;最后,遍历Map集合来输出所有单词出现的次数。
public static void countWordFrequency(String filePath) { // 创建一个Map集合来存储单词和出现次数之间的映射关系 Mapmap = new HashMap (); // 使用Java流API将文本内容读取到内存中 try (Stream stream = Files.lines(Paths.get(filePath))) { // 遍历Stream流中的所有单词 stream.forEach(word -> { // 如果map集合中包含当前遍历到的单词,就将value+1 if (map.containsKey(word)) { map.put(word, map.get(word) + 1); } else { // 如果map集合中不包含当前遍历到的单词,就将value赋值为1 map.put(word, 1); }}); } catch (IOException e) { e.printStackTrace(); } // 遍历Map集合输出所有单词出现的次数 for (String key : map.keySet()) { System.out.println("单词" + key + "出现了" + map.get(key) + "次"); } }
java.util包包含三个类来收集统计信息:
我们可以使用它们来计算任何数字数据组的摘要统计信息。
以下代码显示如何计算多个双精度值的统计信息。
import java.time.LocalDate; import java.time.Month; import java.util.Arrays; import java.util.DoubleSummaryStatistics; import java.util.List; public class Main { public static void main(String[] args) { DoubleSummaryStatistics stats = new DoubleSummaryStatistics(); stats.accept(100.0); stats.accept(300.0); stats.accept(230.0); stats.accept(532.0); stats.accept(422.0); long count = stats.getCount(); double sum = stats.getSum(); double min = stats.getMin(); double avg = stats.getAverage(); double max = stats.getMax(); System.out.printf( "count=%d, sum=%.2f, min=%.2f, average=%.2f, max=%.2f%n", count, sum, min, max, avg); } }
上面的代码生成以下结果。
count=5,sum=1584.00, min=100.00, average=316.80, max=532.00
摘要统计类设计为与流一起使用。
它们包含组合两个摘要统计信息的combine()方法。
以下代码显示如何计算收入总结统计。
import java.time.LocalDate; import java.time.Month; import java.util.Arrays; import java.util.DoubleSummaryStatistics; import java.util.List; public class Main { public static void main(String[] args) { DoubleSummaryStatistics incomeStats = Employee.persons() .stream() .map(Employee::getIncome) .collect(DoubleSummaryStatistics::new, DoubleSummaryStatistics::accept, DoubleSummaryStatistics::combine); System.out.println(incomeStats); } } class Employee { public static enum Gender { MALE, FEMALE } private long id; private String name; private Gender gender; private LocalDate dob; private double income; public Employee(long id, String name, Gender gender, LocalDate dob, double income) { this.id = id; this.name = name; this.gender = gender; this.dob = dob; this.income = income; } public double getIncome() { return income; } public static List<Employee> persons() { Employee p1 = new Employee(1, "Jake", Gender.MALE, LocalDate.of(1971, Month.JANUARY, 1), 2343.0); Employee p2 = new Employee(2, "Jack", Gender.MALE, LocalDate.of(1972, Month.JULY, 21), 7100.0); Employee p3 = new Employee(3, "Jane", Gender.FEMALE, LocalDate.of(1973, Month.MAY, 29), 5455.0); Employee p4 = new Employee(4, "Jode", Gender.MALE, LocalDate.of(1974, Month.OCTOBER, 16), 1800.0); Employee p5 = new Employee(5, "Jeny", Gender.FEMALE, LocalDate.of(1975, Month.DECEMBER, 13), 1234.0); Employee p6 = new Employee(6, "Jason", Gender.MALE, LocalDate.of(1976, Month.JUNE, 9), 3211.0); List<Employee> persons = Arrays.asList(p1, p2, p3, p4, p5, p6); return persons; } }
上面的代码生成以下结果。
Collectors类包含要计算的方法数字数据的特定类型的摘要统计信息。
Collectors类包含方法,如counting(),summingDouble(),summingInt(),summingLong(),averagingDouble(),averagingLong(),averagingInt(),minBy()和maxBy()返回一个收集器来执行一种特定类型的汇总计算。
以下代码显示如何计算摘要统计信息收入。
import java.time.LocalDate; import java.time.Month; import java.util.Arrays; import java.util.DoubleSummaryStatistics; import java.util.List; import java.util.stream.Collectors; public class Main { public static void main(String[] args) { DoubleSummaryStatistics incomeStats = Employee.persons() .stream() .collect(Collectors.summarizingDouble(Employee::getIncome)); System.out.println(incomeStats); } } class Employee { public static enum Gender { MALE, FEMALE } private long id; private String name; private Gender gender; private LocalDate dob; private double income; public Employee(long id, String name, Gender gender, LocalDate dob, double income) { this.id = id; this.name = name; this.gender = gender; this.dob = dob; this.income = income; } public double getIncome() { return income; } public static List<Employee> persons() { Employee p1 = new Employee(1, "Jake", Gender.MALE, LocalDate.of(1971, Month.JANUARY, 1), 2343.0); Employee p2 = new Employee(2, "Jack", Gender.MALE, LocalDate.of(1972, Month.JULY, 21), 7100.0); Employee p3 = new Employee(3, "Jane", Gender.FEMALE, LocalDate.of(1973, Month.MAY, 29), 5455.0); Employee p4 = new Employee(4, "Jode", Gender.MALE, LocalDate.of(1974, Month.OCTOBER, 16), 1800.0); Employee p5 = new Employee(5, "Jeny", Gender.FEMALE, LocalDate.of(1975, Month.DECEMBER, 13), 1234.0); Employee p6 = new Employee(6, "Jason", Gender.MALE, LocalDate.of(1976, Month.JUNE, 9), 3211.0); List<Employee> persons = Arrays.asList(p1, p2, p3, p4, p5, p6); return persons; } }
上面的代码生成以下结果。
Java valueOf()方法JavaString类valueOf() 方法有以下几种不同形式:valueOf(boolean b): 返回 boolean 参数的字符串表示形式。v...
Java教程 -Java算术运算符在数学表达式中使用算术运算符。所有算术运算符下表列出了算术运算符:运算符结果 + 加法 - 减法* 乘法 ...
在众多语言中,java都以较大优势领先其他语言,跻身最热语言排名前列,学习java的人不计其数。除了学校和培训机构,知识来源的最...
Java数据类型教程 -Java char数据类型char数据类型是16位无符号Java基元数据类型。它表示Unicode字符。请注意,char是无符号数据...
在理解Java的类和对象之前,先简单介绍一下面向对象的程序设计。程序设计是通过对象对程序进行设计,对象代表一个实体,实体可以...