函数式编程中的 “函数们”

FernandoOPA 7年前
   <p>函数式编程中函数有三种不同的解读方式，分别为纯函数、高阶函数和一等函数。本文分别对这三者的概念、应用和联系进行详解。</p>    <h2><strong>纯函数</strong></h2>    <p>定义：</p>    <p>1. 相同的输入必定产生相同的输出</p>    <p>2. 在计算的过程中，不会产生副作用</p>    <p>满足上述两个条件，我们就说该函数是纯函数。</p>    <p>纯函数也即数学意义上的函数，表达的是数据之间的转换（映射）关系，而非计算步骤的详述。数学函数的定义：</p>    <p>函数通常由定义域 <em>X</em> 、值域 <em>Y，</em> 以及定义域到值域的映射 <em>f</em> （ <em>f: X -> Y</em> ）组成。</p>    <p><img src="https://simg.open-open.com/show/463dff020080a27ab72fca6a8d606463.jpg"></p>    <p>纯函数让我们对写出的函数具有完全的控制能力。纯函数的结果 <strong>必须</strong> 只依赖于输入参数，不受外部环境的影响；同时纯函数在计算结果的过程中，也不会影响（污染）外部环境，即不会产生副作用。</p>    <p><strong>函数组合</strong></p>    <p>纯函数定义中的两个条件保证了它（的计算过程）与外界是完全隔离，这也是函数组合的基础。</p>    <p>只有函数组合中的所有函数都是纯函数，我们组合起来的新函数才会是纯函数。我们可以对使用纯函数组合出来的新函数从数学上证明（推导）其正确性，而无需借助大量的单元测试。</p>    <p>只要在函数组合时引入一个非纯函数，整个组合出来的函数将沦为非纯函数。如果将函数组合比作管道的拼接，只要组成管道的任何一小节有泄露或者外部注入，我们便失去了对整条管道的完全控制。</p>    <p><img src="https://simg.open-open.com/show/782b4776fb7559ab1e2407eed16b0f07.jpg"></p>    <p>要想实现函数组合，还需要满足连续性，描述如下：</p>    <p>因为纯函数可以看作定义域到值域映射，待组合的函数中，上一个函数的值域须等于下一个函数的定义域，也即上一个函数的输出（类型）等于下一个的输入（类型）。</p>    <p>假设有两个函数： <em>f: X -> Y</em> 和 <em>g: Y -> Z</em> ，只有 codomain(f) = domain(g) 时， <em>f</em> 和 <em>g</em> 才可以组合。</p>    <p><img src="https://simg.open-open.com/show/2aff078a8eff0bee9dd5311608035da4.jpg"></p>    <p><strong>引用透明及缓存</strong></p>    <p>在不改变整个程序行为的情况下，如果能将其中的一段代码替换为其执行的结果，我们就说这段代码是引用透明的。</p>    <p>因此，执行一段引用透明的代码（函数），对于相同的参数，总是给出相同的结果。我们也称这样的函数（代码）为纯函数。</p>    <p>引用透明的一个典型应用即函数缓存。我们可以将已经执行过的函数输入值缓存起来，下次调用时，若输入值相同，直接跳过计算过程，用缓存结果代替计算结果返回即可。</p>    <p>函数缓存的实现依赖于闭包，而闭包的实现又依赖于高阶函数，高阶函数的实现又依赖于一等函数。我们按照这条依赖链，从里往外依次对它们进行讲解。</p>    <h2><strong>一等函数（First Class Functions）</strong></h2>    <p>程序语言会对基本元素的使用方式进行限制，带有最少限制的元素被称为一等公民，其拥有的 “权利” 如下：</p>    <ul>     <li>可以使用变量命名；</li>     <li>可以提供给函数作为参数；</li>     <li>可以由函数作为结果返回；</li>     <li>可以包含在数据结构中；</li>    </ul>    <p>乍一看，我们应该首先会想到程序中的基本数据结构（如 number、array、object 等）是一等公民。如果函数也被视为一等公民，我们便可以像使用普通数据一样对其使用变量命名，作为参数或返回值使用，或者将其包含在数据结构中。在这里函数和数据的边界开始变得不再那么分明了。函数被视为一等公民后，其能力和适用范围被大大扩展了。</p>    <p>下面使用 JavaScript 对上面第一条和第四条 “权利” 进行讲解。第二、三条与高阶函数密切相关，将放到下一节的高阶函数中讲解。</p>    <p><strong>使用变量命名</strong></p>    <pre>  <code class="language-javascript">const square = x => x * x</code></pre>    <p>上面代码定义了一个求平方值的函数，并将其赋给了 square 变量。</p>    <p><strong>可以包含在数据结构中</strong></p>    <p>Ramda 中有一个API：evolve ，其接受的首个参数便是一个属性值为函数的对象。evolve 函数会递归地对 “待处理对象” 的属性进行变换，变换的方式由 transformation 内置函数属性值的对象定义。示例如下（示例中的 R.xxx 都是 Ramda 中的API，相关API的功能可以参考Ramda 文档）：</p>    <pre>  <code class="language-javascript">var tomato  = {name: 'Tomato', data: {elapsed: 100, remaining: 1400}, id:123};  var transformations = {    name: R.toUpper,    data: {elapsed: R.add(1), remaining: R.add(-1)}  };    R.evolve(transformations)(tomato);  //=> {name: 'TOMATO', data: {elapsed: 101, remaining: 1399}, id:123}</code></pre>    <h2><strong>高阶函数</strong></h2>    <p>定义：</p>    <p>使用函数作为输入参数，或者返回结果为函数的函数，被称为高阶函数。</p>    <p>作为参数或返回值的函数，是一等函数的应用之一。高阶函数以一等函数作为基础，只有支持一等函数的语言才能进行高阶函数编程。</p>    <p>以熟悉的 filter 函数为例，我们可以用 filter 对列表中的元素进行过滤，筛选出符合条件的元素。filter 的类型签名和示例代码如下：</p>    <pre>  <code class="language-javascript">filter :: (a → Boolean) → [a] → [a]</code></pre>    <pre>  <code class="language-javascript">const isEven = n => n % 2 === 0;    const filterEven = R.filter(isEven);    filterEven([1, 2, 3, 4]); //=> [2, 4]</code></pre>    <p>filter 接受一个判断函数（判断输入值是否为偶数） isEven ，返回一个过滤出偶数的函数 filterEven 。</p>    <h2><strong>闭包</strong></h2>    <p>定义：</p>    <p>闭包是由函数及该函数捕获的其上下文中的自由变量组成的记录</p>    <p>举例讲：</p>    <pre>  <code class="language-javascript">function add(x) {    const xIn = x;    return function addInner(y) {      return xIn + y;    }  }  const inc = add(1);  inc(8); //=> 9;    const plus2 = add(2);  plus2(8); //=> 10;</code></pre>    <p>上述代码中返回的函数 addInner 及由其捕获的在其上下文中定义的自由变量 xIn ，便组成了一个闭包。</p>    <p><img src="https://simg.open-open.com/show/5d66cc7acd858c56f7f02bd436793807.jpg"></p>    <p>上述代码中最外层的 add 函数是一个高阶函数，其返回值为一等函数 addInner 。</p>    <p>其实 add 函数的参数 x 也是 addInner 上下文的一部分，所以 ‘xIn’ 也就没有存在的必要了， add 代码优化如下：</p>    <pre>  <code class="language-javascript">function add(x) {    return function addInner(y) {      return x + y;    }  }</code></pre>    <p>借助于箭头函数，我们可以进一步优化 add 的实现：</p>    <pre>  <code class="language-javascript">const add = x => y => x + y</code></pre>    <p><img src="https://simg.open-open.com/show/364a9faef41a07aaf57de55a8069b10b.jpg"> 是不是非常简洁？由此我们可以一窥函数式编程强大的表达能力。</p>    <p>闭包主要用来做数据缓存，而数据缓存应用非常广泛：包括函数工厂模式、模拟拥有私有变量的对象、函数缓存、还有大名鼎鼎的柯里化。</p>    <p>其实上述代码中 add 函数便是柯里化形式的函数。</p>    <p>上述代码中的 const inc = add(1); 和 const plus2 = add(2); 是一种函数工厂模式，通过向 add 函数传入不同的参数，便会产生功能不同的函数。函数工厂可以提高函数的抽象和复用能力。</p>    <p>例如我们有一个如下形式的 Ajax 请求函数：</p>    <pre>  <code class="language-javascript">const ajax = method => type => query => { ... };    const get = ajax('GET');  const post = ajax('POST');    const getJson = get('json');  const getHtml = ajax('GET')('text/html') = get('text/html');</code></pre>    <p>我们抽象出了最一般的 ajax 请求函数，在具体应用时，我们用能通过函数工厂生产出作用不同的函数。</p>    <p>通过上面几个小节，我们讲解纯函数（数学意义上的函数）、一等函数、高阶函数，还有闭包，下面通过集上述所有概念于一身的 <strong>函数缓存</strong> ，来结束函数式编程中的 ”函数们“ 的论述。</p>    <h2><strong>函数缓存 memoize</strong></h2>    <p>函数实现：</p>    <pre>  <code class="language-javascript">const memoize = pureFunc => {    const cache = {};    return function() {      const argStr = JSON.stringify(arguments);      cache[argStr] = cache[argStr] || pureFunc.apply(pureFunc, arguments);      return cache[argStr];    };  };</code></pre>    <p>memoize 的功能是对传入函数 pureFunc 进行缓存，返回缓存版本的 pureFunc 。当我们使用参数调用缓存的函数时，缓存的函数会到 cache 中查找该参数是否被缓存过，如果有缓存，则不需要再次计算，直接返回已缓存值，否则对本次输入的参数进行计算，缓存计算的结果以备后用，然后将结果返回。</p>    <p>memoize 只有对纯函数的缓存才有意义。因为纯函数是引用透明的，其输出只依赖于输入，并且计算过程不会影响外部环境。</p>    <p>举一个极端的例子，假如我们有一个随机数字生成函数 random() , 如果对其进行了缓存：</p>    <pre>  <code class="language-javascript">const memoizedRandom = memoize(random);</code></pre>    <p>memoizedRandom 除了第一次生成一个随机值外，随后的调用都返回第一次缓存的值，这样就失去了 random 的意义。再假如，我们对终端字符输入函数 getchar() 进行了缓存，每次调用都会是第一次获取的字母。</p>    <p>memoize 内部实现了一个闭包的创建。返回的缓存函数和自由变量 cache 共同构成了一个闭包。自由变量 cached 用于对已经计算过的数据（参数）的缓存。而闭包本身是由高阶函数和一等函数实现的。</p>    <p><img src="https://simg.open-open.com/show/bc19cd4b85db8607435df0ffd587a328.jpg"></p>    <h2><strong>总结</strong></h2>    <p>本文对函数式编程中的 “函数们” 做了详细解释：纯函数、一等函数、高阶函数，并展示了它们的应用。其中纯函数是函数组合的基础；一等函数是高阶函数的实现基础，一等函数和高阶函数又是闭包的实现基础。</p>    <p>最后通过函数缓存函数 memoize 将纯函数、一等函数、高阶函数和闭包联系起来，用函数式编程中的 “函数们” （函数式三镖客）的一次 “联合行动” 结束本文。</p>    <h2><strong>参考文档</strong></h2>    <p>What is a Function? .</p>    <p>Functional Programming .</p>    <p>Referential Transparency .</p>    <p> </p>    <p>来自：http://www.techug.com/post/functions-in-functional-programming.html</p>    <p> </p>
函数式编程中的 “函数们”

相关经验

目录