Java 8 Lambda限制:闭包

leoleo 8年前
   <p>假设我们想创建一个简单的线程,只在控制台上打印一些东西:</p>    <pre>  <code class="language-java">int answer = 42;  Thread t = new Thread(      () -> System.out.println("The answer is: " + answer)  );  </code></pre>    <p>如果我们想在线程里面修改answer的值怎么办?</p>    <p>在本文中,我想回答这个问题,讨论Java lambda表达式的限制和沿途的后果。</p>    <p>简单的答案是Java实现闭包,但是当我们将它们与其他语言进行比较时会有限制。另一方面,这些限制可以被认为是可忽略的。</p>    <p>为了支持这种说法,我将展示闭包在JavaScript这一著名语言中起着至关重要的作用。</p>    <h2>Java 8 Lambda表达式从哪里来?</h2>    <p>在过去,实现上述示例的紧凑方法是创建一个新的Runnable匿名类的实例,如下所示:</p>    <pre>  <code class="language-java">int answer = 42;  Thread t = new Thread(new Runnable() {      public void run() {          System.out.println("The answer is: " + answer);      }  });  </code></pre>    <p>从Java 8开始,上一个例子可以使用lambda表达式编写。</p>    <p>现在,我们都知道Java 8 lambda表达式不仅仅是为了降低代码的冗长性,他们还有很多其他的新功能。此外,在匿名类和lambda表达式的实现之间存在差异。</p>    <p>但是,主要的一点我想在此强调的是,考虑到他们在封闭范围如何交互,我们可以认为它们只是一种创建匿名类接口的紧凑方式,比如  Runnable ,  Callable ,  Function ,  Predicate ,等。实际上,lambda表达式和它的封闭范围之间的相互作用保持完全相同(即this 关键字语义上的差异  )。</p>    <h2>Java 8 Lambda限制</h2>    <p>Java中的lambda表达式(以及匿名类)只能访问封闭范围的最终(或实际上最终)变量。</p>    <p>例如,考虑以下示例:</p>    <pre>  <code class="language-java">void fn() {      int myVar = 42;      SupplierlambdaFun = () -> myVar; // error      myVar++;      System.out.println(lambdaFun.get());  }  </code></pre>    <p>这不会编译,因为增量myVar阻止它是实际上最终变量。</p>    <h2>JavaScript及其功能</h2>    <p>JavaScript中的函数和lambda表达式使用闭包的概念:</p>    <p>“闭包是一种特殊类型的对象,它结合了两个东西:一个函数,以及创建该函数的环境。环境包括在创建闭包时在范围内的任何局部变量” – MDN</p>    <p>事实上,前面的例子在JavaScript中工作得很好。</p>    <pre>  <code class="language-java">function fn() { // the enclosing scope      var myVar = 42;      var lambdaFun = () => myVar;      myVar++;      console.log(lambdaFun()); // it prints 43  }  </code></pre>    <p>此示例中的lambda函数使用的已更改值的myVar。</p>    <p>实际上,在JavaScript中,一个新函数维护一个指向它所定义的封闭范围的指针。这个基本机制允许创建闭包,这保存了自由变量的存储位置 – 这些可以由函数本身以及其他函数修改。</p>    <h2>Java创建闭包?</h2>    <p>Java只保存自由变量的值,让它们在lambda表达式中使用。即使有一个增量myVar,lambda函数仍然会返回42.编译器避免了那些不相干的情况的创建,限制可以在lambda表达式(和匿名类)内部使用的变量的类型只有最终的和实际上最终的。</p>    <p>尽管有这个限制,我们可以使用Java 8实现闭包。事实上,闭包更多的是理论上的理解,只捕获自由变量的价值。在纯函数语言中,这应该是唯一允许的,保持引用透明度属性。</p>    <p>后来,一些功能语言以及诸如Javascript之类的语言引入了捕获自由变量的存储位置的可能性。这允许引入副作用的可能性。</p>    <p>所以,我们可以说,使用JavaScript的闭包,我们可以做更多。但是,这些副作用如何真正帮助JavaScript?他们真的很重要吗?</p>    <h2>副作用和JavaScript</h2>    <p>为了更好地理解闭包的概念,现在考虑下面的JavaScript代码(forgive在JavaScript中,这可以以非常紧凑的方式完成,但我想它看起来像Java并进行比较):</p>    <pre>  <code class="language-java">function createCounter(initValue) { // the enclosing scope      var count = initValue;      var map = new Map();      map.set('val', () => count);      map.set('inc', () => count++);      return map;  }  v = createCounter(42);  v.get('val')(); // returns 42  v.get('inc')(); // returns 42  v.get('val')(); // returns 43  </code></pre>    <p>每次  createCounter 调用时,它都会创建一个具有两个新lambda函数的映射,它们分别返回和递增在封闭范围中定义的变量值。</p>    <p>换句话说,第一个函数具有改变另一个函数的结果的副作用。</p>    <p>这里要注意的一个重要事实是,它createCounter的作用域在它的终止之后仍然存在,并且同时被两个lambda函数使用。</p>    <h2>副作用和Java</h2>    <p>现在让我们尝试在Java中做同样的事情:</p>    <pre>  <code class="language-java">public static Map<String, Supplier> createCounter(int initValue) { // the enclosing scope      int count = initValue;      Map<String, Supplier> map = new HashMap<>();      map.put("val", () -> count);      map.put("inc", () -> count++);      return map;  }  </code></pre>    <p>此代码不会编译,因为第二个lambda函数试图更改变量count。</p>    <p>Java将函数变量(例如count)存储在堆栈中; 那些被删除与终止createCounter。创建的lambdas使用的复制版本count。如果编译器允许第二个lambda改变它的复制版本count ,那将是很混乱。</p>    <h2>Java闭包使用可变对象</h2>    <p>正如我们所看到的,使用的变量的值被复制到lambda表达式(或匿名类)。但是,如果我们使用对象呢?在这种情况下,只有引用将被复制,我们可以看看有点不同的东西。</p>    <p>我们几乎可以用以下方式模拟JavaScript的闭包的行为:</p>    <pre>  <code class="language-java">private static class MyClosure {      public int value;      public MyClosure(int initValue) { this.value = initValue; }  }  public static Map<String, Supplier> createCounter(int initValue) {      MyClosureclosure = new MyClosure(initValue);      Map<String, Supplier> counter = new HashMap<>();      counter.put("val", () -> closure.value);      counter.put("inc", () -> closure.value++);      return counter;  }  Supplier[] v = createCounter(42);  v.get("val").get(); // returns 42  v.get("inc").get(); // returns 42  v.get("val").get(); // returns 43  </code></pre>    <p>事实上,这不是真正有用的东西,它真的是不太优雅。</p>    <h2>闭包作为创建对象的机制</h2>    <p>JavaScript使用闭包作为创建“类”实例:对象的基本机制。这就是为什么在JavaScript中,类似的函数MyCounter称为“构造函数”。</p>    <p>相反,Java已经有类,我们可以以更优雅的方式创建对象。</p>    <p>在前面的例子中,我们不需要一个闭包。“工厂函数”本质上是一个类定义的奇怪的例子。在Java中,我们可以简单地定义一个类,如下所示:</p>    <pre>  <code class="language-java">class MyJavaCounter {      private int value;      public MyJavaCounter(int initValue) { this.value = initValue; }      public int increment() { return value++; }      public int get() { return value; }  }  MyJavaCounter v = new MyJavaCounter(42);  System.out.println(v.get());      // returns 42  System.out.println(v.increment()); // returns 42  System.out.println(v.get());      // returns 43  </code></pre>    <h2>修改自由变量是一个坏习惯</h2>    <p>修改自由变量(即在lambda函数之外定义的任何对象)的Lambda函数可能会产生混淆。其他功能的副作用可能会导致不必要的错误。</p>    <p>这是典型的老年语言的开发人员不明白为什么JavaScript产生随机的莫名其妙的行为。 在功能语言中,它通常是有限的,而当它不是,则不鼓励。</p>    <p>考虑你正在使用并行范例,例如在Spark中:</p>    <pre>  <code class="language-java">int counter = 0;  JavaRDDrdd = sc.parallelize(data);  rdd.foreach(x -> counter += x); // Don't do this!!  </code></pre>    <h2>结论</h2>    <p>我们已经看到了一个非常简要的Java 8 lambda表达式。我们专注于匿名类和lambda表达式之间的区别。之后,我们更好地看到了闭包的概念,看看它们是如何在JavaScript中实现的。此外,我们看到JavaScript的闭包不能直接在Java 8中使用,以及如何通过对象引用来模拟它。</p>    <p>我们还发现,当我们将它们与JavaScript之类的语言进行比较时,Java对闭包的支持有限。</p>    <p>然而,我们看到这些限制并不真正重要。事实上,闭包在JavaScript中被用作定义类和创建对象的基本机制,我们都知道它不是Java问题。</p>    <p> </p>    <p> </p>    <p>来自:https://blog.maxleap.cn/archives/1297</p>    <p> </p>