Java Stream（流）基本使用-526互联

JAVA 8 API添加了一个新的抽象称为流Stream，将要处理的元素集合看作一种流，流在管道中传输，能够对每个元素进行一系列并行或串行的流水线操作。

数据源可以是集合，数组，I/O channel，产生器generato…
数据源如：List<T> 的集合转换为 Stream<T> 类型的流，然后进行中间操作如过滤、排序、遍历、类型转换
终端可以选择将 Stream 流转换回一个新类型的集合中，如果中间对每个元素操作后，你的目的已达到，最后转不转回都行
很多中间操作的方法返回类型就是Stream，因此可以直接连起来，如操作List<Person> list

流的操作不会改变原集合，除非用原集合接，即list = list.stream().xxx…
stream() − 为集合创建串行流
parallelStream() − 为集合创建并行流

常用方法

List<String> stringList = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");

public class Person{
    String name;
    Integer age;
}

List<Person> list = new ArrayList<>();
list.add(new Person("Jack",23));
list.add(new Person("Jack",23));
list.add(new Person("Tom",30));

1、filter(element -> boolean表达式)

过滤元素，符合Boolean表达式的留下来

//过滤，只要空字符串
NewList<String> list = stringList.stream().filter(param -> param.isEmpty()).collect(Collectors.toList());

2、distinct()

去除重复元素
这个方法是通过类的 equals 方法来判断两个元素是否相等的

list = list.stream().distinct().collect(Collectors.toList());

这里不重写Person类的equals方法，两个数据不会被处理

3、sorted() / sorted((T, T) -> int)

对流中的元素进行排序
若流中元素的类实现了Comparable接口，即有自己的排序规则，此时可直接sorted()
否则，用sorted((T,T) -> int)说明排序规则

根据年龄大小来比较：
list = list.stream() .sorted((p1, p2) -> p1.getAge() - p2.getAge()).collect(Collectors.toList());

以上可优化为：

list = list.stream().sorted(Comparator.comparingInt(Person::getAge)).collect(Collectors.toList());

4、limit(long n)

返回前n个元素

list = list.stream().limit(1).collect(Collectors.toList());

5、skip(long n)

去除前n个元素
limit(m).skip(n)，先返回前m个元素，再从这m个元素中去除n个
skip(n).limit(m)，先去除n个元素，再返回剩余的前m个

list = list.stream().limit(2).skip(1).collect(Collectors.toList());
//即先拿前两个，再去掉这两个中的第一个

6、`map(T -> R)`

将流中的每一个元素映射为R

List<Integer> list = new ArrayList<>();
        list.add(1);
        list.add(2);
        list.add(3); 
list = list.stream().map(i -> i + 2).collect(Collectors.toList());

list.forEach(System.out::println);
//输出3、4、5

除了处理基本数据类型，也可修改对象，但最后记得return element；

list = list.stream().map(p -> {
　　　　　　　　　　　　　　　　p.setAge(p.getAge() + 1);
　　　　　　　　　　　　　　　　p.setName(p.getName().equals("Tom")? "TomCat" : "Cat");
　　　　　　　　　　　　　　　　return p;
　　　　　　　　　　　　　　　　})
            .collect(Collectors.toList());
//对每个对象的属性进行定制操作

也可映射抽出对象的一部分属性，收集到一个新类型的集合中：

List<String> newlist = list.stream().map(Person::getName).collect(Collectors.toList());

List<Integer> newlist = list.stream().map(p -> p.getAge()).collect(Collectors.toList());

//map方法接受一个lambda表达式，这个表达式是一个函数，输入类型是集合元素的类型, 输出类型是任意类型 , 即你可以选择将元素映射为任意类型, 并对映射后的值做下一步处理.

it -> Integer.toString(it)

7、`faltMap(T -> Stream)`

当处理的是一个List<Person>，此时使用map方法，拿到的元素是一个个Person对象。当处理的是一个List<List<Person>>，此时使用map，拿到的是一个个list集合，此时想对每一个Person对象操作，就得用faltMap，flat，平铺的意思 .

List<Person> list1 = new ArrayList<>();
List<Person> list2 = new ArrayList<>();
list1.add(new Person("A",23));
list1.add(new Person("B",23));
list2.add(new Person("C",23));
list2.add(new Person("D",23));
List<List<Person>> listPlus = new ArrayList<>();
listPlus.add(list1);
listPlus.add(list2);

List<String> nameList = listPlus.stream()
                                .flatMap(t -> t.stream()) //此时流中元素为Person对象
                                .map(t -> t.getName())
                                .distinct()
                                .collect(Collectors.toList());
//A B C D

8、anyMatch(T -> boolean表达式)

流中是否有元素满足这个Boolean表达式

//是否存在一个 person 对象的 age 等于 20：
boolean b = list.stream().anyMatch(person -> person.getAge() == 20);

9、allMatch(T -> boolean)和noneMatch(T -> boolean)

allMatch(T -> boolean)即流中所有元素是否都满足Boolean条件
noneMatch(T -> boolean)即是否流中没有一个元素满足Boolean表达式

10、count()

返回流中元素的个数，返回Long型

11、reduce((T, T) -> T) / reduce(T, (T, T) -> T)

组合流中的元素，进行求数学运算值
价格使用BigDecimal防止精度损失

//计算年龄总和：
int sum = list.stream().map(Person::getAge).reduce(0, (a, b) -> a + b);
//与之相同:
int sum = list.stream().map(Person::getAge).reduce(0, Integer::sum);
 
//BigDecimal计算，将所有商品的价格累加
BigDecimal totalPrice = goodList.stream().map(GoodsCode::getPrice()).reduce(BigDecimal.ZERO, BigDecimal::add);

12、forEach()

普通for循环或者增强for循环，break跳出整个循环，continue跳出本次循环。stream(）的forEach则不同：

处理集合时不能使用break和continue中止循环
可以使用关键字return跳出本次循环，并执行下一次遍历
不能跳出整个流的forEach循环

//打印各个元素
list.stream().forEach(System.out::println);

也可对每个元素进行想要的操作：

list.stream().forEach(element -> {
            　　java语句1；
            　　java语句2；
            }
);

13、Stream.iterate

指定一个常量seed，生成从seed到常量f（由UnaryOperator返回的值得到）的流。

Stream.iterate(0, n -> n + 1).limit(5).forEach(a -> {
    System.out.println(a);
});
//以上：根据起始值seed(0)，每次生成一个指定递增值（n+1）的数，limit(5)用于截断流的长度，即只获取前5个元素。


//输出：
0
1
2
3
4

三、收集方法collect()详解

收集流中元素的方法，传参是一个收集器接口, 常用写法:

collect(Collectors.toList())收集到list集合
collect(Collectors.toMap(x,x,x))收集到map集合
collect(Collectors.groupingBy(xx))分组
collect(Collectors.counting())统计集合总数
collect(joining())连接字符串

1、.collect(Collectors.toMap(x,x,x))

Map<String,Person> newMap = lst.stream().collect(Collectors.toMap(p -> p.getName(), p -> p, (p1,p2) -> p1));

//各个参数的意义:

/**
 * 第一个参数 p -> p.getName()即使用name做为Map集合的key
 * p -> p.getName()可以写成Person::getName
 * 第二个参数 p -> p即将原来的对象做为map的value值，当然也可以Person::getAge继续用属性做value
 * 第三个参数(p1,p2) -> p1即若p1、p2的key相同，则取p1的value
 */

2、.collect(Collectors.groupingBy(xx))

将处理后的元素进行分组,得到一个Map集合

//数据准备
@Data
@AllArgsConstructor
public class Books {

    private Integer id;

    private Integer num;

    private String name;

    private Double price;

    private String category;
}

Books book1 = new Books(1,100,"Java入门",60.0,"互联网类") ;
Books book2 = new Books(2,200,"Linux私房菜",100.0,"互联网类") ;
Books book3 = new Books(3,200,"Docker进阶",70.0,"互联网类") ;
Books book4 = new Books(4,600,"平凡的世界",200.0,"小说类") ;
Books book5 = new Books(5,1000,"白鹿原",190.0,"小说类") ;
List<Books> booksList = Lists.newArrayList(book1,book2,book3,book4,book5);

case1: 按照某个属性分组, 即以该属性为Map集合的key,把这个属性相同的对象放在一个List集合中做为value

//按照category分类
Map<String,List<Books>> map = booksList.stream().collect(Collectors.groupingBy(Books::getCategory));

//run
{
互联网类=[Books(id=1, num=100, name=Java入门, price=60.0, category=互联网类), Books(id=2, num=200, name=Linux私房菜, price=100.0, category=互联网类), Books(id=3, num=200, name=Docker进阶, price=70.0, category=互联网类)],
小说类=[Books(id=4, num=600, name=平凡的世界, price=200.0, category=小说类), Books(id=5, num=1000, name=白鹿原, price=190.0, category=小说类)]
}

case2: 按照某几个属性拼接分组

Map<String,List<Books>> map = booksList.stream().collect(Collectors.groupingBy(t -> t.getCategory() +"_" + t.getName()));

//run
{
互联网类_Linux私房菜=[Books(id=2, num=200, name=Linux私房菜, price=100.0, category=互联网类)],
小说类_平凡的世界=[Books(id=4, num=600, name=平凡的世界, price=200.0, category=小说类)],
互联网类_Docker进阶=[Books(id=3, num=200, name=Docker进阶, price=70.0, category=互联网类)],
互联网类_Java入门=[Books(id=1, num=100, name=Java入门, price=60.0, category=互联网类)],
小说类_白鹿原=[Books(id=5, num=1000, name=白鹿原, price=190.0, category=小说类)]
}

case3: 按照不同的条件分组

//不同条件下,使用不同的key
Map<String,List<Books>> map = booksList.stream()
                                        .collect(Collectors.groupingBy(t -> {
                                            if(t.getNum() > 500){
                                                return "数量充足";
                                            }else{
                                                return "数量较少";
                                            }
                                        }));

//run

{
数量充足=[Books(id=4, num=600, name=平凡的世界, price=200.0, category=小说类), Books(id=5, num=1000, name=白鹿原, price=190.0, category=小说类)],
数量较少=[Books(id=1, num=100, name=Java入门, price=60.0, category=互联网类), Books(id=2, num=200, name=Linux私房菜, price=100.0, category=互联网类), Books(id=3, num=200, name=Docker进阶, price=70.0, category=互联网类)]
}

case4: 实现多级分组, 即由双参数版本的Collectors.groupingBy,对由第一个参数分类后的结果, 再进行分类,此时结果类型

//接case3,想先按照类别分组,再给每个组按照数量再分一次
Map<String,Map<String,List<Books>>> map = booksList.stream()
                                                    .collect(Collectors.groupingBy(t -> t.getCategory(), Collectors.groupingBy( t -> {
                                                        if(t.getNum() > 100){
                                                            return "数量充足";
                                                        }else{
                                                            return "数量较少";
                                                        }
                                                    })));

//run
{
互联网类={数量充足=[Books(id=2, num=200, name=Linux私房菜, price=100.0, category=互联网类), Books(id=3, num=200, name=Docker进阶, price=70.0, category=互联网类)], 数量较少=[Books(id=1, num=100, name=Java入门, price=60.0, category=互联网类)]}, 
小说类={数量充足=[Books(id=4, num=600, name=平凡的世界, price=200.0, category=小说类), Books(id=5, num=1000, name=白鹿原, price=190.0, category=小说类)]}
}

case5: 分组后,统计每个分组中元素的个数, Map集合的value类型为long型

Map<String,Long> map = booksList.stream().collect(Collectors.groupingBy(Books::getCategory,Collectors.counting()));

//run
{互联网类=3, 小说类=2}

case6: 分组后,统计每个分组中元素的某属性的总和

Map<String,Integer> map = booksList.stream().collect(Collectors.groupingBy(Books::getCategory,Collectors.summingInt(Books::getNum)));

//run
{互联网类=500, 小说类=1600}

case7: 加比较器取某属性最值

Map<String,Books> map3 = booksList.stream().collect(Collectors.groupingBy(Books::getCategory, Collectors.collectingAndThen(Collectors.maxBy(Comparator.comparingInt(Books::getNum)), Optional::get)));

//run
{互联网类=Books(id=2, num=200, name=Linux私房菜, price=100.0, category=互联网类), 小说类=Books(id=5, num=1000, name=白鹿原, price=190.0, category=小说类)}

case8:联合其他收集器

Map<String, Set<String>> map2 = booksList.stream().collect(Collectors.groupingBy(Books::getCategory,Collectors.mapping(t->t.getName(),Collectors.toSet())));

//run
{互联网类=[Linux私房菜, Docker进阶, Java入门], 小说类=[平凡的世界, 白鹿原]}

3 、.collect(joining())

拼接收集到的元素
传参为拼接时的连接符

String s = list.stream().map(Person::getName).collect(joining());
 
//结果：jackmiketom

String s = list.stream().map(Person::getName).collect(joining(","));
 
//结果：jack,mike,tom

四、并行流parallelStream

stream是串行的流式计算, parallelStream是并行的流式计算.

使用并行流遍历打印一个集合元素,并输出当前线程,可以看到线程抬头是ForkJoinPool.且遍历输出的元素是无序的

1、ForkJoin框架

ForkJoin框架是java7中提供的并行执行框架
它的策略是分而治之。即将一个大任务拆分为若干互不依赖的子任务，把这些子任务分别放到不同的队列里，并为每个队列创建一个单独的线程来执行队列里的任务

为了最大限度地提高并行处理能力，采用了工作窃取算法来运行任务，也就是说当某个线程处理完自己工作队列中的任务后，尝试当其他线程的工作队列中窃取一个任务来执行，直到所有任务处理完毕。(类比自己的任务做完了, 帮同事分一点任务,以求最早完成总任务)
为了减少线程之间的竞争，通常会使用双端队列，被窃取任务线程永远从双端队列的头部拿任务执行，而窃取任务的线程永远从双端队列的尾部拿任务执行

2、parallelStream

调用ParallelStream() 和 Stream() 方法, 返回的都是一个流, 对forEach
并行流的创建可以xx.parallelStream()或者xx.stream().parallel()
并行流内部使用了默认的ForkJoinPool
parallelStream默认的并发线程数比CPU处理器的数量少1个(最优的策略是每个CPU处理器分配一个线程，然而主线程也算一个线程)

// 获取当前机器CPU处理器的数量
System.out.println(Runtime.getRuntime().availableProcessors());// 输出 6
// parallelStream默认的并发线程数
System.out.println(ForkJoinPool.getCommonPoolParallelism());// 输出 5
// 设置全局并行流并发线程数
//这是全局配置,会影响所有的并行流
System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism", "3");