函数式编程

Mr.Zhang大约 15 分钟

函数式编程

函数接口、Lambda表达式、方法引用、Stream流

在《设计模式之美》中，我们详细讲解了现在主流的三种编程范式：面向过程、面向对象和函数式编程。其中提到，函数式编程并非一个很新的东西，早在50多年前就已经出现了。近几年，函数式编程越来越被人关注，出现了很多新的函数式编程语言，比如Clojure、Scala、Erlang等。一些非函数式编程语言也加入了很多特性、语法、类库来支持函数式编程，比如Java、Python、Ruby、JavaScript等。本节，我们就来讲讲Java语言对函数式编程的支持。

一、函数式编程

不过，在讲解Java语言对函数式编程的支持之前，我们先要了解一下，到底什么是函数式编程？

严格上来讲，函数式编程中的“函数”，并不是指编程语言中的“函数”，而是指数学“函数”或者“表达式”（比如，y=f(x)）。不过，在编程实现时，对于数学“函数”或“表达式”，我们一般习惯性地将它们设计成函数。因此，如果不深究的话，函数式编程中的“函数”也可以理解为编程语言中的“函数”。

每个编程范式都有自己独特的地方，这就是它们会被抽象出来作为一种范式的原因。面向对象编程最大的特点是：以类、对象作为组织代码的单元以及它的四大特性。面向过程编程最大的特点是：以函数作为组织代码的单元，数据与方法相分离。那么函数式编程最独特的地方又在哪里呢？

实际上，函数式编程最独特的地方在于它的编程思想。函数式编程认为，程序可以用一系列数学函数或表达式的组合来表示。函数式编程是程序面向数学的更底层的抽象，将计算过程描述为表达式。不过，这样说你肯定会有疑问，真的可以把任何程序都表示成一组数学表达式吗？

理论上讲是可以的。但是，并不是所有的程序都适合这么做。函数式编程有它自己适合的应用场景，比如科学计算、数据处理、统计分析等。在这些领域，程序往往比较容易用数学表达式来表示，比起非函数式编程，实现同样的功能，函数式编程需要更少的代码。但是，对于强业务相关的大型业务系统开发来说，费劲吧啦地将它抽象成数学表达式，硬要用函数式编程来实现，显然是自讨苦吃。相反，在这种应用场景下，面向对象编程更加合适，写出来的代码更加可读、可维护。因此，我个人觉得，函数式编程并不能完全替代更加通用的面向对象编程范式。但是，作为一种补充，它也有很大存在、发展和学习的意义。

刚刚讲的是函数式编程的编程思想，如果我们再具体到编程实现，函数式编程跟面向过程编程一样，也是以函数作为组织代码的单元。不过，它跟面向过程编程的区别在于，它的函数是无状态的。何为无状态？简单点讲就是，函数内部涉及的变量都是局部变量，不会像面向对象编程那样，共享类成员变量，也不会像面向过程编程那样，共享全局变量。函数的执行结果只与入参有关，跟其他任何外部变量无关。同样的入参，不管怎么执行，得到的结果都是一样的。这实际上就是数学函数或数学表达式的基本要求。我举个例子来简单解释一下。

// 有状态函数: 执行结果依赖b的值是多少，即便入参相同，
// 多次执行函数，函数的返回值有可能不同，因为b值有可能不同。
int b;
int increase(int a) {
  return a + b;
}

// 无状态函数：执行结果不依赖任何外部变量值，只要入参相同
// 不管执行多少次，函数的返回值就相同
int increase(int a, int b) {
  return a + b;
}

这里稍微总结一下，不同的编程范式之间并不是截然不同的，总是有一些相同的编程规则。比如，不管是面向过程、面向对象还是函数式编程，它们都有变量、函数的概念，最顶层都要有main函数执行入口，来组装编程单元（类、函数等）。只不过，面向对象的编程单元是类或对象，面向过程的编程单元是函数，函数式编程的编程单元是无状态函数。

接下来，我们就看下Java这种面向对象编程语言，对函数式编程的支持。我们先来看下面这样一段非常典型的Java函数式编程的代码。这段代码的作用是，先过滤除非空字符串，然后再查找以“wz-”为前缀的字符串，最后统计每个字符串的长度，并打印输出。

public class FPDemo {
  public static void main(String[] args) {
    List<String> strList = Arrays.asList("wz-a.java", "wz-b.txt", "c.java");
    strList.stream()
        .filter(((Predicate<String>) String::isEmpty).negate())
        .filter(s->s.startsWith("wz-"))
        .map(String::length)
        .forEach(l->System.out.println(l));  //输出9、8
  }
}

如果你不了解Java函数式编程的语法，看了上面的代码或许会有些懵，主要的原因是，Java为函数式编程引入了4个新的语法：函数接口（Functional Inteface）、Lambda表达式、方法引用、Stream流。函数接口的作用是让我们可以把函数包裹成接口（interface），来实现把函数当做参数一样来使用（Java不像C一样支持函数指针，可以把函数直接当参数来使用）；引入Lambda表达式的作用是简化函数接口的匿名实现类的代码编写；方法引用的作用是进一步简化Lambda表达式；Stream流用来支持通过“.”级联多个函数操作的代码编写方式。接下来，我们就一一详细讲解一下这4个语法。

二、函数接口

我们知道，C语言支持函数指针，它可以把函数直接当变量来使用。但是，Java没有函数指针这样的语法。所以，它通过函数接口，将函数包裹在接口中，当作变量来使用。比如，我们经常使用的Runnable、Comparator等都是函数接口，代码如下所示。

@FunctionalInterface
public interface Runnable {
    public abstract void run();
}

@FunctionalInterface
public interface Comparator<T> {
    int compare(T o1, T o2);
    
    boolean equals(Object obj);
    
    default Comparator<T> reversed() {
        return Collections.reverseOrder(this);
    }
    
    default Comparator<T> thenComparing(Comparator<? super T> other) {
        Objects.requireNonNull(other);
        return (Comparator<T> & Serializable) (c1, c2) -> {
            int res = compare(c1, c2);
            return (res != 0) ? res : other.compare(c1, c2);
        };
    }
}

实际上，函数接口就是接口。不过，它也有自己特别的地方，那就是要求只包含一个未实现的方法。Java提供了专门的注解@FunctionalInterface来标识某个接口是函数接口。这个注解的作用是检查接口中是否只有一个未实现的方法。如果标记了这个注解的接口有两个及两个以上的未实现的方法，那么代码在编译时就会报错。实际上，即便不使用@FunctionalInterface注解来标记接口，只要接口中只包含一个未实现的方法，那么，在Java眼里就认为它是函数接口，跟标注了@FunctionalInterface注解的接口无差别对待。

如上代码所示，Runnable接口中只有一个未实现的方法run()。Comparator接口中虽然有很多方法，但绝大部分都有默认实现，只有compare()和equals()没有实现。Comparator中有两个未实现方法，那么是不是就不是函数接口了呢？实际上，所有的类都会继承顶级父类Object，而Object中有equals()方法的默认实现。我们在创建Comparator接口的实现类时，只需要强制实现cmopare()方法即可。从这个角度来说，Comparator中相当于只有compare()方法没有实现，因此，符合函数接口只包含一个未实现方法的限制。

除了刚刚提到的Runnable、Comparator之外，Java还预定义了大量的其他函数接口，比如Predicate<T>、Function<T, R>、Comsumer<T>、Supplier<T>等等。我们拿Predicate<T>举例，代码如下所示。对于其他预定义函数接口，你可以自行在java.util.function包下查看。在Predicate<T>内，除了未实现的test()方法之外，还定义了很多具有默认实现的方法，那么，这些具有默认实现的方法又是做什么用的呢？关于这个问题，我们稍后讲解。

@FunctionalInterface
public interface Predicate<T> {
  boolean test(T t); // 只有这一个未实现的方法

  default Predicate<T> and(Predicate<? super T> other) {
    Objects.requireNonNull(other);
    return (t) -> test(t) && other.test(t);
  }

  default Predicate<T> negate() {
    return (t) -> !test(t);
  }

  default Predicate<T> or(Predicate<? super T> other) {
    Objects.requireNonNull(other);
    return (t) -> test(t) || other.test(t);
  }

  static <T> Predicate<T> isEqual(Object targetRef) {
    return (null == targetRef)
        ? Objects::isNull
        : object -> targetRef.equals(object);
  }
}

跟自定义异常、自定义注解一样，我们也可以自定义函数接口。

@FunctionalInterface
public interface Filter<T> {
  boolean accept(T name);
}

当然，只有函数接口的定义是没有意义的，我们还要有代码用到它，函数接口的使用如下示例所示。从作用上，函数接口有点类似《设计模式之美》中讲到的模板模式，从实现上，函数接口有点类似《设计模式之美》中讲到的回调。将某个流程中可变的逻辑抽离出来，设计成函数接口，以此来支持灵活定制可变逻辑。

public class Demo {
  public static void main(String[] args) {
    List<String> files = Arrays.asList("wang.txt", "zheng.java", "xiao.txt", "ge.java");
    List<String> javaFiles = filterFiles(files, new Filter<String>() {
      @Override
      public boolean accept(String name) {
        return name.endsWith(".java");
      }
    });
  }

  // filter过滤策略为可变逻辑
  public static List<String> filterFiles(List<String> files, Filter<String> filter) {
    List<String> res = new ArrayList<>();
    for (String file : files) {
      if (filter.accept(file)) {
        res.add(file);
      }
    }
    return res;
  }
}

看到这里，你可能会说，Runnable、Comparator这种只包含一个未实现方法的接口早就有了，为什么在JDK8引入函数式编程时，将它们重新定义为函数接口呢？它们在函数式编程中有什么特殊作用呢？函数接口为什么只能允许包含一个未实现的接口呢？要回答这些问题，我们就要先了解Lambda表达式。

三、Lambda表达式

我们前面讲到，Java引入Lambda表达式的主要作用是简化代码编写，但凡用到函数接口的地方，我们都可以将函数接口的匿名实现类替换成Lambda表达式。如上示例代码所示，我们将Filter<T>的匿名实现类替换为Lambda表达式，如下所示。

public static void main(String[] args) {
  List<String> files = Arrays.asList("wang.txt", "zheng.java", "xiao.txt", "ge.java");

  // 使用匿名实现类
  List<String> javaFiles = filterFiles(files, new Filter<String>() {
    @Override
    public boolean accept(String name) {
      return name.endsWith(".java");
    }
  });
  
  // 使用Lambda表达式
  List<String> javaFiles2 = filterFiles(files, (String name)->{
    return name.endsWith(".java");
  });
}

Lambda表达式包括三部分：输入、函数体、输出。如下所示。

(类型 a, 类型 b) -> { 语句1； 语句2；...; return 输出; } //a,b是输入参数

实际上，Lambda表达式的写法非常灵活。我们刚刚给出的是标准写法，还有很多简化写法。比如，我们可以将输入参数的类型省略，由编译器自行推测。如果输入参数只有一个，还可以省略()，直接写成a->{...}；如果没有入参，可以直接将输入和箭头都省略掉，只保留函数体；如果函数体只有一个语句，那么还可以将{}和return关键词省略掉。

按照以上省略规则，我们将上述示例代码中的Lamba表达式简化，简化之后的代码如下所示。从这里我们也可以得知，Lambda表达式只是为了简化代码比较简单的匿名实现类。当匿名实现类中只包含一条语句时，简化效果最好。如果匿名实现类中代码逻辑比较复杂，那么使用Lambda表达式的简化效果就不明显了。

List<String> javaFiles = filterFiles(files, name->name.endsWith(".java"));

如果我们把以下Lambda表达式，全部替换为函数接口的实现方式，如下所示。对比来看，代码是不是多了很多？

// 使用Lambda表达式，非常简洁
Optional<Integer> result = Stream.of("f", "ba", "hello")
    .map(s -> s.length())
    .filter(l -> l <= 3)
    .max((o1, o2) -> o1-o2);

// 还原为函数接口的实现方式，代码变长很多
Optional<Integer> result2 = Stream.of("fo", "bar", "hello")
    .map(new Function<String, Integer>() {
      @Override
      public Integer apply(String s) {
        return s.length();
      }
    })
    .filter(new Predicate<Integer>() {
      @Override
      public boolean test(Integer l) {
        return l <= 3;
      }
    })
    .max(new Comparator<Integer>() {
      @Override
      public int compare(Integer o1, Integer o2) {
        return o1 - o2;
      }
    });

了解了Lambda表达式之后，我们就可以回答之前遗留的问题了。函数接口本质上就是接口，没有什么新颖的，在函数式编程出现之前就已经存在并且大量使用。抽象出函数接口这个概念，完全是新瓶装旧酒，目的是希望对能够简写为Lambda表达式的这一类接口有一个统一的称谓，方便沟通。那么，函数接口为什么只能包含一个未实现的方法呢？这里主要有两个原因，其一是：函数接口的目的是为了能把函数（也就是方法）当做参数来传递，在这里，函数是主角，一个函数理应包裹为一个单独的函数接口，一个函数接口内不应该有两个主角。其二是：因为只有包含一个未实现的方法，简化之后的Lambda表达式才能明确知道匹配的是哪个方法。如果函数接口包含两个未实现的方法，并且方法入参、返回值都一样，那么，Java在翻译Lambda表达式时，就无法知道表达式对应哪个方法了。

四、方法引用

当Lambda中的逻辑已经有现成的方法实现时，我们可以直接使用方法引用。需要注意的是，方法引用要求所引用的方法的参数列表和返回值，跟函数接口中未实现方法的参数列表和返回值完全一致。方法引用的语法格式如下所示。

对象::实例方法
类::静态方法
类::实例方法

比如下列示例中就用到了两个方法引用，String::isEmpty和String::length。当然，我们也可以不使用方法引用，如注释中所示。

public class FPDemo {
  public static void main(String[] args) {
    List<String> strList = Arrays.asList("wz-a.java", "wz-b.txt", "c.java");
    strList.stream()
        .filter(((Predicate<String>) String::isEmpty).negate())
        //.filter(s->!s.isEmpty())
        .filter(s->s.startsWith("wz-"))
        .map(String::length)
        //.map(s->s.length())
        .forEach(l->System.out.println(l));  //输出9、8
  }
}

五、Stream流

实际上，上面讲到的函数接口、Lambda表达式，只是函数式编程中的辅助语法，真正体现函数式编程其“函数”本质的应该是Stream流。接下来，我们就来讲一讲Stream流。

假设我们要计算这样一个表达式：(3-1)*2+5。如果按照普通的函数调用的方式写出来，就是下面这个样子的。

add(multiply(subtract(3,1),2),5);

不过，这样编写的代码可读性比较差，我们换个可读性更好的写法，如下所示。

subtract(3,1).multiply(2).add(5);

我们知道，在Java中，“.”表示调用某个对象上的方法。为了支持上面这种级联调用方式，我们让每个函数都返回一个通用的类型：Stream对象。在Stream上的操作有两种：中间操作和终止操作。中间操作返回的仍然是Stream对象，而终止操作返回的是确定的值结果或者没有返回值。

我们再来看之前的例子。我对代码做了注释解释，如下所示。其中，map、filter是中间操作，返回Stream对象，可以继续级联其他操作；forEach()是终止操作，没有返回值，无法再继续往下级联处理了。

public class FPDemo {
  public static void main(String[] args) {
    List<String> strList = Arrays.asList("wz-a.java", "wz-b.txt", "c.java");
    strList.stream()   // 返回Stream<String>对象
        .filter(((Predicate<String>) String::isEmpty).negate()) //filter返回Stream<String>对象
        .filter(s->s.startsWith("wz-")) //filter返回Stream<String>对象
        .map(String::length)  //map返回Stream<Integer>对象
        .forEach(l->System.out.println(l));  //forEach终止操作
  }
}

Stream中的filter()、map()、forEach()等方法的参数为Java预定义的函数接口，如下所示，因此，函数接口的匿名实现类可以通过Lambda表达式来简化，如上示例代码所示。除了filter()、map()、forEach()之外，Stream类中还定义了很多其他操作，你可以自行查看java.util.stream.Stream的源码。

Stream<T> filter(Predicate<? super T> predicate);
<R> Stream<R> map(Function<? super T, ? extends R> mapper);
void forEach(Consumer<? super T> action);

前面提到，在Java预定义的函数接口中，不仅仅包含未实现的方法，还包含一些具有默认实现的方法，比如Predicate<T>函数接口中的and()、or()、negatef()等方法，那么，这些具有默认实现的方法到底是做什么用的呢？实际上，它们一般用来组合操作，我举个例子，你就清楚了。示例代码如下所示，我们希望过滤得到既包含前缀“wz-”，又包含后缀“.java”的字符串，这里我们就可以使用Predicate<T>中的and()操作。

List<String> strList = Arrays.asList("wz-a.java", "wz-b.txt", "c.java");
Predicate<String> p1 = s->s.startsWith("wz-");
Predicate<String> p2 = s->s.endsWith(".java");
List<String> res = strList.stream()
    .filter(p1.and(p2))
    .collect(Collectors.toList());

六、课后思考题

什么情况下适合使用函数式编程？什么时候不适合使用函数式编程？

函数式编程

# 函数式编程

# 一、函数式编程

# 二、函数接口

# 三、Lambda表达式

# 四、方法引用

# 五、Stream流

# 六、课后思考题

函数式编程

一、函数式编程

二、函数接口

三、Lambda表达式

四、方法引用

五、Stream流

六、课后思考题