本文首发于 vivo互联网技术 微信公众号
链接:https://mp.weixin.qq.com/s/ZoXYbjuezOWgNyJKmSQmTw
作者:杨昆
【编写高质量函数系列】,往期精彩内容:
《如何编写高质量的 JS 函数(1) -- 敲山震虎篇》介绍了函数的执行机制,此篇将会从函数的命名、注释和鲁棒性方面,阐述如何通过 JavaScript 编写高质量的函数。
《如何编写高质量的 JS 函数(2)-- 命名/注释/鲁棒篇》从函数的命名、注释和鲁棒性方面,阐述如何通过 JavaScript编写高质量的函数。
《如何 编写高质量的 JS 函数(3)-- 函数式编程[理论篇]》通过背景加提问的方式,对函数式编程的本质、目的、来龙去脉等方面进行一次清晰的阐述。
本文会从如何用函数式编程思想编写高质量的函数、分析源码里面的技巧,以及实际工作中如何编写,来展示如何打通你的任督二脉。话不多说,下面就开始实战吧。
一、如何用函数式编程思想编写高质量的函数
这里我通过简单的 demo 来说明一些技巧。技巧点如下:
1、注意函数中变量的类型和变量的作用域
(1)如果是值类型 -- 组合函数/高阶性
这可能是一个硬编码,不够灵活性,你可能需要进行处理了,如何处理呢?比如通过传参来干掉值类型的变量,下面举一个简单的例子。
代码如下:
document.querySelector('#msg').innerHTML = '<h2>Hello World'</h2>'
我们来欣赏一下上面的代码:
第一:硬编码味道很重,代码都是写死的。
第二:扩展性很差,复用性很低,难道我要在其他地方进行 crtl c ctrl v 然后再手工改?
第三:如果在 document.querySelector('#msg')获取对象后,不想 innerHTML ,我想做一些其他的事情,怎么办?
OK ,下面我就先向大家展示一下,如何完全重构这段代码。这里我只写 JS 部分:
代码如下:// 使用到了组合函数,运用了函数的高阶性等
const compose = (...fns) => value => fns.reverse().reduce((acc, fn) => fn(acc), value)
const documentWrite = document.write.bind(document)
const createNode = function(text) {
return '<h2>' + text + '</h2>'
}
const setText = msg => msg
const printMessage = compose(
documentWrite,
createNode,
setText
)
printMessage('hi~ godkun')
效果如图所示:
完整代码我放在了下面两个地址上,小伙伴可自行查看。
codepen: codepen.io/godkun/pen/…
gist:gist.github.com/godkun/772c…
compose 函数的执行顺序是从右向左,也就是数据流是从右向左流,可以把
const printMessage = compose(
documentWrite,
createNode,
setText
)
看成是下面这种形式:
documentWrite(createNode(setText(value)))
在 linux 世界里,是遵循 pipe (管道) 的思想,也就是数据从左向右流,那怎么把上面的代码变成 pipe 的形式呢?
很简单,只需要把 const compose = (...fns) => value => fns.reverse().reduce((acc, fn) => fn(acc), value) 中的 reverse 去掉就好了,写成:
const compose = (...fns) => value => fns.reduce((acc, fn) => fn(acc), value)
是不是发现通过用函数式编程进行重构后,这个代码变得非常的灵活,好处大致有如下:
-
函数被拆成了一个个具有单一功能的小函数
-
硬编码被干掉了,变得更加灵活
-
使用了组合函数、高阶函数来灵活的组合各个小函数
- 职责越单一,复用性会越好,这些小函数,我们都可以在其他地方,通过组合不同的小函数,来实现更多的功能。
思考题:这里我甩贴一张小伙伴在群里分享的图:
这是我送个大家的礼物,大家可以尝试把上面图片的代码用函数式进行完全重构,加油。
(2)如果是引用类型 -- 等幂性/引用透明性/数据不可变
代码 demo 如下:
let arr = [1,3,2,4,5]
function fun(arr) {
let result = arr.sort()
console.log('result', result)
console.log('arr', arr)
}
fun(arr)
结果如下图所示:
看上面,你会发现数组 arr 被修改了。由于 fun(arr) 函数中的参数 arr 是引用类型,如果函数体内对此引用所指的数据进行直接操作的话,就会有潜在的副作用,比如原数组被修改了,这种情况下,该怎么办呢?
很简单,在函数体内对 arr 这个引用类型进行创建副本。如下面代码:
let arr = [1,3,2,4,5]
function fun(arr) {
let arrNew = arr.slice()
let result = arrNew.sort()
console.log('result', result)
console.log('arr', arr)
}
fun(arr)
通过 slice 来创建一个新的数组,然后对新的数组进行操作,这样就达到了消除副作用的目的。这里只是举一个例子,但是核心思想已经阐述出来了,体现了理论卷中的数据不可变的思想了。
如果函数体内引用变量的变化,会造成超出其作用域的影响,比如上面代码中对 arr 进行操作,影响到了数组 arr 本身 。这时就需要思考一下,要不要采用不可变的思想,对引用类型进行处理。
(3)注意有没有明显的命令式编程 -- 声明式/抽象/封装
注意函数里面有没有大量的 for 循环
为什么说这个呢,因为这个很好判断。如果有的话,就要思考一下需不需要对 for 循环进行处理,下文有对 for 循环的专门介绍。
注意函数里面有没有过多的 if/else
也是一样的思想,过多的 if/else 也要根据情况去做相应的处理。
(4)将代码本身进行参数化 -- 声明式/抽象/封装
标题的意识其实可以这样理解,对函数进行高阶化处理。当把函数当成参数的时候,也就是把代码本身当成参数了。
什么情况下要考虑高阶化呢。
当优化到一定地步后,发现还是不够复用性,这时就要考虑将参数进行函数化,这样将参数变成可以提供更多功能的函数。
函数的高阶化,往往在其他功能上得以体现,比如柯里化,组合。
(5)将大函数变成可组合的小函数
通过上面例子的分析,我也向大家展示了如何将函数最小化。通过将大函数拆成多个具有单一职责的小函数,来提高复用性和灵活性。
2、函数式编程的注意点
函数式编程 不是万能的,大家不要认为它很完美,它也有自己的缺点,如下两点:
(1)注意性能
进行 函数式编程 时, 如果使用不恰当,会造成性能问题。比如递归用的不恰当,比如柯里化嵌套的过多。
(2)注意可读性
在进行函数式编程时,不要过度的抽象,过度的抽象会导致可读性变差。
二、源码中的学习
1、看一下 Ramda.js 的源码
说到函数式编程,那一定要看看 Ramda.js 的源码。Ramda.js 的源码搞懂后,函数式编程的思想也就基本没什么问题了。
关于 Ramda.js 可以看一下阮大的博客:
Ramda 函数库参考教程
看完了,那开始执行:
git clone git@github.com:ramda/ramda.git
然后我们来分析源码,首先按照常规套路,看一下 source/index.js 文件。
如图所示:
继续分析,看一下 add.js。
import _curry2 from './internal/_curry2';
var add = _curry2(function add(a, b) {
return Number(a) + Number(b);
});
export default add;
看上面代码,我们发现,add 函数被包了一个 _curry2 函数。下划线代表这是一个内部方法,不暴露成 API 。这时,再看其他函数,会发现都被包了一个 _curry1/2/3/N 函数。
如下图所示:
从代码中可以知道,1/2/3/N 代表掉参数个数为 1/2/3/N 的函数的柯里化,而且会发现,所有的 ramda 函数都是经过柯里化的。
为什么 ramda.js 要对函数全部柯里化?
我们看一下普通的函数 f(a, b, c) 。如果只在调用的时候,传递 a 。会发现,JS 在运行调用时,会将 b 和 c 设置为 undefined 。
从上面可以知道,JS 语言不能原生支持柯里化。非柯里化函数会导致缺少参数的实参变成 undefined 。ramda.js 对函数全部柯里化的目的,就是为了优化上面的场景。
下面,我们看一下 _curry2 代码,这里为了可读性,我对代码进行了改造,我把 _isPlaceholder 去掉了,假设没有占位符,同时把 _curry1 放在函数内,并且对过程进行了相应注释。
二元参数的柯里化,代码如下:
function _curry2(fn) {
return function f2(a, b) {
switch (arguments.length) {
case 0:
return f2;
case 1:
return _curry1(function (_b) {
// 将参数从右到左依次赋值 1 2
// 第一次执行时,是 fn(a, 1)
return fn(a, _b);
});
default:
// 参数长度是 2 时 直接进行计算
return fn(a, b);
}
};
}
function _curry1(fn) {
return function f1(a) {
// 对参数长度进行判断
if (arguments.length === 0) {
return f1;
} else {
// 通过 apply 来返回函数 fn(a, 1)
return fn.apply(this, arguments);
}
};
}
const add = _curry2(function add(a, b) {
return Number(a) + Number(b);
});
// 第一次调用是 fn(a, 1)
let r1 = add(1)
// 第二次调用是 fn(2,1)
let r2 = r1(2)
console.log('sss', r2)
完整代码地址如下:
gist:gist.github.com/godkun/0d22…
codeopen:codepen.io/godkun/pen/…
看了上面对 ramda.js 源码中柯里化的分析,是不是有点收获,就像上面说的,柯里化的目的是为了优化在 JS 原生下的一些函数场景。好处如下:
-
从上面 add 函数可以知道,通过柯里化,可以让函数在真正需要计算的时候进行计算,起到了延迟的作用,也可以说体现了惰性思想。
- 通过对参数的处理,做到复用性,从上面的 add 函数可以知道,柯里化把多元函数变成了一元函数,通过多次调用,来实现需要的功能,这样的话,我们就可以控制每一个参数,比如提前设置好不变的参数,从而让代码更加灵活和简洁。
柯里化命名的由来
关于 ramda 中的 compose 和 pipe -- 组合函数/管道函数
本文一开始,我就以一个例子向大家展示了组合函数 compose 和 pipe 的用法。
关于 ramda 中,compose 和 pipe 的实现这里就不再分析了,小伙伴自己看着源码分析一下。这里我就简洁说一下组合函数的一些个人看法。
在我看来,组合是函数式编程的核心,函数式编程的思想是要函数尽可能的小,尽可能的保证职责单一。这就直接确定了组合函数在 函数式编程中的地位,玩好了组合函数,函数式编程 也就基本上路了。
和前端的组件进行对比来深刻的理解组合函数
函数的组合思想是面向过程的一种封装,而前端的组件思想是面对对象的一种封装。
三、实际工作中的实践
1、写一个集成错误,警告,以及调试信息的 tap 函数
故事的背景
实际工作中,会遇到下面这种接收和处理数据的场景。
代码如下:
// 伪代码
res => {
// name 是字符串,age 是数字
if (res.data && res.data.name && res.data.age) {
// TODO:
}
}
上面这样写,看起来好像也没什么问题,但是经不起分析。比如 name 是数字,age 返回的不是数字。这样的话, if 中的判断是能通过的,但是实际结果并不是想要的。
那该怎么办呢?问题不大,跟着我一步步的优化就 OK 了。
(1)进行第一次优化
res => {
if (res.data && typeof res.data.name === 'string' && typeof res.data.age === 'number') {
// TODO:
}
}
看起来是够鲁棒了,但是这段代码过于命令式,无法复用到其他地方,在其他的场景中,还要重写一遍这些代码。
(2)进行第二次优化
// is 是一个对象函数 伪代码
res => {
if (is.object(res.data) && is.string(res.data.name) && is.number(res.data.age)) {
// TODO:
}
}
将过程抽象掉的行为也是一种函数式思想。上面代码,提高了复用性,将判断的过程抽象成了 is 的对象函数中,这样在其他地方都可以复用这个 is 。
但是,代码还是有问题,一般来说,各个接口的返回数据都是 res.data 这种类型的。所以如果按照上面的代码,我们会发现,每次都要写 is.object(res.data) 这是不能容忍的一件事。我们能不能做到不写这个判断呢?
当然可以,你完全可以在 is 里面加一层对 data 的判断,当然这个需要你把 data 作为参数 传给 is 。
(3)第三次优化
// is 是一个对象函数 伪代码
res => {
if (is.string(res.data, data.name) && is.number(res.data, data.age)) {
// TODO:
}
}
按照上面的写法,is 系列函数会对第一个参数进行 object 类型判断,会再次提高复用性。
好像已经很不错了,但其实还远远不够。
(4)总结上面三次优化
说完这些问题,那下面我们来解决吧。
(1)进行函数式优化--第一阶段
如果要做到高度抽象和复用的话,首先把需要的功能罗列一下,大致如下:
第一个功能:检查类型
第二个功能:调试功能,可以自定义 console 的输出形式
第三个功能:处理异常的功能(简单版)
看到上面功能后,我们想一下函数式思想中有哪些武器可以被我们使用到。首先怎么把不同的函数组合在一起。
现在,如何将小函数组合成一个完成特定功能的函数呢?
想一下,你会发现,这里需要用到函数的高阶性,要将函数作为参数传入多功能函数中。ok ,现在我们知道实现的大致方向了,下面我们来尝试一下吧。
这里我直接把我的实现过程贴出来了,有相应的注释,代码如下:
/** * 多功能函数 * @param {Mixed} value 传入的数据 * @param {Function} predicate 谓词,用来进行断言 * @param {Mixed} tip 默认值是 value */
function tap(value, predicate, tip = value) {
if(predicate(value)) {
log('log', `{type: ${typeof value}, value: ${value} }`, `额外信息:${tip}`)
}
}
const is = {
undef : v => v === null || v === undefined,
notUndef : v => v !== null && v !== undefined,
noString : f => typeof f !== 'string',
noFunc : f => typeof f !== 'function',
noNumber : n => typeof n !== 'number',
noArray : !Array.isArray,
};
function log(level, message, tip) {
console[level].call(console, message, tip)
}
const res1 = {data: {age: '', name: 'godkun'}}
const res2 = {data: {age: 66, name: 'godkun'}}
// 函数的组合,函数的高阶
tap(res1.data.age, is.noNumber)
tap(res2.data.age, is.noNumber)
结果图如下:
会发现当,age 不是 Number 类型的时候,就会打印对应的提示信息,当是 Number 类型的时候,就不会打印信息。
这样的话,在业务中就可以直接写:
res => {
tap(res.data.age, is.noNumber)
// TODO: 处理 age
}
不用 if 语句,如果有异常,看一下打印信息,会一目了然的。
当然这样写肯定不能放到生产上的,因为 tap 不会阻止后续操作,我这样写的原因是:这个 tap 函数主要是用来开发调试的。
但是,如果需要保证不符合的数据需要直接在 tap 处终止,那可以在 tap 函数里面加下 return false return true 。然后写成下面代码的形式:
res => {
// if 语句中的返回值是布尔值
if (tap(res.data.age, is.noNumber)) {
// TODO: 处理 age
}
}
但是这样写,会有个不好的地方。那就是用到了 if 语句,用 if 语句也没什么不好的。但退一步看 tap 函数,你会发现,还是不够复用,函数内,还存在硬编码的行为。
如下图所示:
存在两点问题:
第一点:把 console 的行为固定死了,导致不能设置 console.error() 等行为。
第二点:不能抛出异常,就算类型不匹配,也阻止不了后续步骤的执行。
怎么解决呢?
进行函数式优化--第二阶段
简单分析一下,这里先采用惰性的思想,让一个函数确定好几个参数,然后再让这个函数去调用其他不固定的参数。这样做的好处是减少了相同参数的多次 coding ,因为相同的参数已经内置了,不用再去传了。
分析到这,你会发现,这样的行为其实就是柯里化,通过将多元函数变成可以一元函数。同时,通过柯里化,可以灵活设置好初始化需要提前确定的参数,大大提高了函数的复用性和灵活性。
对于柯里化,由于源码分析篇,我已经分析了 ramda 的柯里化实现原理,这里我为了节省代码,就直接使用 ramda 了。
代码如下:
const R = require('ramda')
// 其实这里你可以站在一个高层去把它们想象成函数的重载
// 通过传参的不同来实现不同的功能
const tapThrow = R.curry(_tap)('throw', 'log')
const tapLog = R.curry(_tap)(null, 'log')
function _tap(stop, level, value, predicate, error=value) {
if(predicate(value)) {
if (stop === 'throw') {
log(`${level}`, 'uncaught at check', error)
throw new Error(error)
}
log(`${level}`, `{type: ${typeof value}, value: ${value} }`, `额外信息:${error}`)
}
}
const is = {
undef : v => v === null || v === undefined,
notUndef : v => v !== null && v !== undefined,
noString : f => typeof f !== 'string',
noFunc : f => typeof f !== 'function',
noNumber : n => typeof n !== 'number',
noArray : !Array.isArray,
};
function log(level, message, error) {
console[level].call(console, message, error)
}
const res = {data: {age: '66', name: 'godkun'}}
function main() {
// 不开启异常忽略,使用 console.log 的 tapLog 函数
// tapLog(res.data.age, is.noNumber)
// 开启异常忽略,使用 console.log 的 tapThrow 函数
tapThrow(res.data.age, is.noNumber)
console.log('能不能走到这')
}
main()
代码地址如下:
gist: gist.github.com/godkun/d394…
关键注释,我已经在代码中标注了。上面代码在第一次进行函数式优化的时候,在组合和高阶的基础上,加入了柯里化,从而让函数变得更有复用性。
PS: 具有柯里化的函数,在我看来,也是体现了函数的重载性。
执行结果如下图所示:
会发现使用 tapThrow 函数时,当类型不匹配的时候,会阻止后续步骤的执行。
我通过多次优化,向大家展示了,如何一步步的去优化一个函数。从开始的命令式优化,到后面的函数式优化,从开始的普通函数,到后面的逐步使用了高阶、组合、柯里的特性。从开始的有 if/else 语句到后面的逐步干掉它,来获得更高的复用性。通过这个实战,大家可以知道,如何循序渐进的使用函数式编程,让代码变得更加优秀。
2、为什么要干掉 for 循环
之前就有各种干掉 for 循环的文章。各种讨论,这里按照我的看法来解释一下,为什么会存在干掉 for 循环这一说。
代码如下:
let arr = [1,2,3,4]
for (let i = 0; i < arr.length; i++) {
// TODO: ...
}
我们看上面这段代码,我来问一个问题:上面这段代码如何复用到其他的函数中?
稍微想一下,大家肯定可以很快的想出来,那就是封装成函数,然后在其他函数中进行调用。
因为 for 循环是一种命令控制结构,它很难被插入到其他操作中,也发现了 for 循环很难被复用的现实。
当你在封装 for 循环时,就是在抽象 for 循环,把它隐藏掉。就是在告诉用户,你只需要调封装的函数,而不需要关心内部实现。
于是乎,JS 就诞生了诸如 map filter reduce 等这种将循环过程隐藏掉的函数。底层本质上还是用 for 实现的,只不过是把 for 循环隐藏了,如果按照业界内的说话逼格,就是把 for 循环干掉了。这就是声明式编程在前端中的应用之一。
你是如何处理数组变换的
三种方式:
第一种:传统的循环结构 - 比如 for 循环
第二种:链式
第三种:函数式组合
3、如何利用函数的纯洁性来进行缓存
在编写函数时,要考虑缓存是为了避免计算重复值。计算就意味着消耗各种资源,而做重复的计算,就是在浪费各种资源。
纯洁性和缓存有什么关系?我们想一下可以知道,纯函数总是为给定的输入返回相同的输出,那既然如此,我们当然要想到可以缓存函数的输出。
那如何做函数的缓存呢?记住一句话:给计算结果赋予唯一的键值并持久化到缓存中。
大致 demo 代码:
function mian(key) {
let cache = {}
cache.hasOwnProperty(key) ?
main(key) :
cache[key] = main(key)
}
上面代码是一种最简单的利用纯函数来做缓存的例子。下面实现一个非常完美的缓存函数。
给原生 JS 函数加上自动记忆化的缓存机制
代码如下:
Function.prototype.memorized = () => {
let key = JSON.stringify(arguments)
// 缓存实现
this._cache = this._cache || {}
this._cache[key] = this._cache[key] || this.apply(this, arguments)
return this._cache[key]
}
Function.prototype.memorize = () => {
let fn = this
// 只记忆一元函数
if (fn.length === 0 || fn.length > 1) return fn
return () => fn.memorized.apply(fn, arguments)
}
代码地址如下:
gist: gist.github.com/godkun/5251…
通过扩展 Function 对象,我们就可以充分利用函数的记忆化来实现函数的缓存。
上面函数缓存实现的好处有以下两点:
第一:消除了可能存在的全局共享的缓存
第二:将缓存机制抽象到了函数的内部,使其完全与测试无关,只需要关系函数的行为即可
四、备注
实战部分,我没有提到函子知识,不代表我没有实践过,正是因为我实践过,才决定不提它,因为对于前端来说,有时候你要顾及整个团队的技术,组合和柯里还有高阶函数等还是可以很好的满足基本需求的。
小伙伴们看实战篇的时候,一定要结合理论篇一起看,这样才能无缝连接。
五、参考
1、参考链接
2、参考书籍
- JavaScript ES6 函数式编程入门经典
- JavaScript 函数式编程指南
- Haskell 趣学指南
- 其他电子书