本文是后端微服务架构系列的第二篇文章。在微服务架构中服务之间的通信方式常见的有两种:`RPC` 和 ` REST`,关于微服务和 `RPC` 的更多细节,可以参考我上一篇文章[]()
这篇文章主要介绍什么是 `REST` 风格设计以及 `RESTful` 接口。阅读完本文你将收获以下知识点:
- 什么是 `REST` 和 `RESTful`
- `REST` 接口设计规范是什么
- `REST` 为什么要设计成无状态
- 接口无状态真的是没有状态吗
- `RPC` 和 `REST` 适用场景
### REST和RESTful
`REST(Representational State Transfer,表述性状态转移)` 是一种软件架构风格。REST提出了一组架构约束条件和原则,任何满足 `REST` 约束条件和原则的架构,都称为 `RESTful` 架构。
微服务之间需要相互通信以完成特定的业务处理,在典型的客户端-服务端设计模型中,客户端和服务端通通过消息请求-响应的方式交互协作,`REST` 就是这样一套微服务之间交互接口的设计约束和原则规范。
乍一看 `REST`「表述性状态转移」每个字都认得,连起来不知道什么意思。也难怪,这是作者 `Roy Thomas Fielding` 在他的博士论文里提出的概念,论文自然都是学术用语,不过感兴趣的同学可以去看看作者论文原文,地址我贴出来:https://www.ics.uci.edu/~fielding/pubs/dissertation/rest_arch_style.htm
今天 lemon 用大白话帮你透彻理解这个概念,我们把「表述性状态转移」掰开来看,先搞明白什么是「表述性」,什么是「状态转移」。
### 表述性
「表述性」其实是缺少了主语的,主语是「资源」。完整的描述是「资源表述性」,也就是「资源的描述」。在网络通信中用什么描述资源呢?没错就是 `URI(Uniform Resource Identifier,统一资源标识符)`。
这里有几个近义词先给大家先科普一下:
`URI` 是统一资源标识符,用来唯一的标识一个资源。
`URL` 是统一资源定位器,它是一种具体的 `URI`,即 `URL` 可以用来标识一个资源,而且还指明了如何定位这个资源,`URL` 是 `URI` 的子集。
`URN` 统一资源命名,是通过名字来标识资源。`URN `也是 `URI` 的子集。

在 `HTTP` 协议中用 `URL` 标识资源,也就是浏览器地址栏你看到的那一串网址。

#### 资源表述性
为了说明「资源描述性」接口设计的优点,我们来做一个接口设计方法的对比,举个栗子就清楚了。
##### 传统的接口设计
先来看下传统的网络通信模式是怎么样的。假设`lemon`这个人物对象,在服务端的存储形式是一个`c++`的`class`类型存储。
下面的过程展示,客户端发送请求服务端创建一个 `lemon` 对象的过程。
1. 服务端定义存储结构头文件 `lemon.h`
```c++
class lemon{
string name;
string address;
uint64 phone;
}
```
2. 客户端代码引用服务端定义的`lemon.h`,**互相引用头文件,增加了服务耦合性!**
3. 客户端初始化一个 `lemon` 实例并序列化后通过网络接口发送给服务端。
```C++
class lemon lm;
lm.name = "lemon";
lm.address = "Shenzhen";
lm.phone = 18666666666;
```
4. 服务端接收消息,反序列化,存储传输过来的 `lemon` 对象
##### 资源表述性接口设计
`lemon` 这个服务内部的对象,对外表现可以用一张图片来表示,也可以用包含`lemon` 的姓名、地址、电话等信息的 `xml` 或 `json` 格式的数据表示。
```json
{
name : "lemon",
address: "ShenZhen",
phone : 18666666666
}
```
```xml

这样做最显然的好处是,减少了服务之间的耦合。客户端访问服务资源之前不需要知道资源在服务端的具体存储格式,只需描述资源形式即可修改、创建、更新、删除服务端的资源。
### 状态转移
搞懂了「资源描述性」接下来看下什么是「状态转移」?状态转移就是客户端通过一系列请求动作,推动服务端的资源状态发生变化,资源的状态可以在「创建-修改-查看-删除」之间转移。

资源状态的变化在宏观上的反应就是业务流程推进。打个比方,你去银行系统开户、查余额、销户,这个过程你推动了你的银行账户这个「资源」经历了不同的状态转移让你完成了不同的业务操作。
### REST的约束条件
#### 协议选择
`REST` 本身并没有提到底层应该使用什么协议,日常实践案例中最常用的是基于 `HTTP` 的 `RESTful` 实现。
这是因为 `HTTP` 协议自带的动词 `GET/POST/PUT/DELETE` 可以作为推动状态转移的方法,另外`HTTP` 的制定了规范的状态码。还有其他的一些 `HTTP` 特性,这些特性使得在`HTTP` 之上实现 `REST` 要简单得多,而如果使用其他协议的话,就需要自己实现这些特性。
#### 请求规范
` RESTful` 架构中,发生状态转换的是「资源」,所以`URI` 中一般只能包含代表「资源」的名词,并且推荐是复数,而不应该在 `URI` 中包对资源进行操作的动词。
对资源执行的`CURD「增删改查」`动作应该在`HTTP`请求方法的`GET/POST/PUT/DELETE`中体现。
符合REST规范的写法:
```http
POST http://www.test.com/lemon // 创建
Get http://www.test.com/lemon // 查询
PUT http://www.test.com/lemon // 修改
DELETE http://www.test.com/lemon //删除
```
不符合REST规范的写法:
```http
POST http://www.test.com/Createlemon // 创建
POST http://www.test.com/Querylemon // 查询
POST http://www.test.com/Modifylemon // 修改
POST http://www.test.com/Deletelemon //删除
```
#### 状态码
服务端消息响应携带状态码,指示客户端进行下一步处理。符合 `RESTful` 规范的接口返回状态码都是通用的,不需要额外约定,利用`HTTP Status Code 状态码` 表示请求处理结果,降低了微服务间互操作成本。
| 状态码 | 状态码含义 |
| ------ | ---------------------------------------------- |
| 2xx | 成功,操作被成功接收并处理 |
| 3xx | 重定向,需要进一步的操作以完成请求 |
| 4xx | 客户端错误,请求包含语法错误或无法完成请求 |
| 5xx | 服务器错误,服务器在处理请求的过程中发生了错误 |
下面是常见的`HTTP`状态码:
- 200 - 请求成功
- 301 - 资源(网页等)被永久转移到其它URL
- 404 - 请求的资源(网页等)不存在
- 500 - 内部服务器错误
#### 无状态
`RESTful`接口要求是「无状态」。无状态指的是任意一个Web请求必须完全与其他请求隔离,当客户端发起请求时,消息本身包含了服务端识别这一请求上下文所需的全部信息。
##### 无状态不是真的没有状态
接口「无状态」更确切的说是服务端无状态,整个会话还是需要状态维持的。要完成一个业务流程,一般客户端与服务端需要多次的消息交互,我们知道`HTTP` 协议是「无状态协议」,这就需要服务端能够识别几个独立 `HTTP` 请求的「状态信息」,从而将他们关联到一个业务流程中。
还是举例子银行系统取款的例子:
- 用户lemon要登录银行系统,首先需要在登录页面输入用户名和密码,这时候产生一个登录请求
- 服务端收到登录请求,执行登录逻辑并返回操作结果
- lemon登录之后点击取款100万,产生一个取款请求
- 服务端收到取款请求,执行取款逻辑并返回操作结果

这里有个问题,服务端在不同时间点收到登录请求和取款请求,这两个请求都是用户 `lemon` 产生的,如果不在技术层面做对独立的 `HTTP` 请求做关联的话,服务端就无法知道这两个请求其实是都是用户`lemon` 「取款业务」的组成部分。
##### 技术方案
服务端要能识别请求的「状态信息」,有两种技术方案:
1. `Session` 方式。服务端保存会话状态,客户端每次请求携带`session-id`。
服务端维护一个会话状态信息列表,用`session-id`唯一标识一个状态信息,`session-id`一般包含在`HTTP`响应的`Set-Cookie`头部返回给客户端,后续客户端请求携带包含`session-id`信息的`cookie`头部,服务端解析`cookie`取出`session-id`,去维护的状态列表中取回该消息对应的状态信息,这样就把无状态的`HTTP`变成有状态的了。

2. `Token` 方式。服务端不保存会话状态,客户端每次请求都携带完整的会话状态信息(一般是加密的)给服务端。
`Token`也称作是「令牌」或临时证书签名,状态信息都被加密到`token`中,这样每当服务器收到请求后解密`token`就能获取该请求对应的状态信息,也就能把不同的请求消息关联到同一个业务流程中来,和`session`方式有类似的效果,只不过这次的状态信息不保存在服务端。

以上两种实现中,第一种 `Session` 方式是有状态的,第二种 `Token` 方式是无状态的。
如果你要实现 `RESTful` 接口最好按第二种技术方案实现,当然要实现无状态也还有其他方式,思路都是「服务端不保持会话状态」就对了。
##### 为什么要无状态
为了高可用性和负载均衡需求,多个微服务通过负载均衡实现分布式集群化部署,集群中每个服务都是独立和对等的。如果服务器在收到客户端请求之时不可用或者宕机,无状态请求可以由任何其他可用服务器处理并作出应答,这在分布式应用中非常重要。

想象一下如果服务端保存状态,一个事务内的每个请求都必须落到同一台服务器去处理,这就失去了分布式的意义和优势。
所以, `RESTful` 接口要求是无状态的,是为了更好的适应分布式业务场景,发挥微服务集群优势。
### REST 和 RPC
这两个概念经常出现在微服务架构设计中,`REST` 是一种软件架构接口设计风格,`RPC` 是一种计算机通信协议,看起来是两个不同的概念,要把他们放在一起比较的话,我个人倾向于把 `REST` 具体化为一种基于`HTTP` 并按照 `REST` 约束设计的通信协议,两个通信协议之间还是可以比较一下的。
#### 回顾下RPC
`RPC (Remote Procedure Call)`远程过程调用是一个计算机通信协议。我们一般的程序调用是本地程序内部的调用,`RPC`允许你像调用本地函数一样去调用另一个程序的函数,这中间会涉及网络通信和进程间通信,但你无需知道实现细节,`RPC`框架为你屏蔽了底层实现。`RPC` 是一种服务器-客户端`Client/Serv er`模式,经典实现是一个通过发送请求-接受回应进行信息交互的系统。
#### 适用场景
很多 `RPC` 框架提供的消息传输都是基于二进制的,比如`Thrift`、`Protocol buffers`。这样做的好处是消息结构比较紧凑,对于频繁调用或者大流量、低时延要求的应用场景,能够显著减少网络开销;另一个约束是某些 `RPC` 框架有很强的技术耦合性,比如 `Dubbo` 只能用于 `java` 技术栈。综上,`RPC ` **更加适用于系统内部微服务之间的高效通信。**
`RESTful`接口由于提供了统一的基于 `HTTP `的 `REST` 设计标准,只需 `web` 框架支持 `HTTP` 协议,并设计`RESTful` 风格的接口即可,极大的方便了第三方服务接入调用,**适合用于微服务系统对外暴露的接口设计标准。**
### 写在最后
本文是微服务架构设计中接口选型的一个小方面,很多人会觉得现在工作面试,不管是大厂还是小公司,都是面试造飞机,工作拧螺丝。个人认为即使你在入职之后接触不到架构方面的工作,也要有一颗架构的心,高度决定认知,如果只盯着手上的那颗螺丝那和咸鱼有什么区别?
老规矩。感谢各位的阅读,文章的目的是分享对知识的理解,技术类文章我都会反复求证以求最大程度保证准确性,若文中出现明显纰漏也欢迎指出,我们一起在探讨中学习。
好了,今天的技术分享就到这里,本文是后端开发微服务设计系列的第二篇,这个系列应该还会继续更新,我们下期再见。
**原创不易,看到这里,如果在我这有一点点收获,就动动手指「在看」「转发」是对我持续创作的最大支持。**
### Reference
微服务设计 https://book.douban.com/subject/26772677/
Representational State Transfer (REST) https://www.ics.uci.edu/~fielding/pubs/dissertation/rest_arch_style.htm
RPC和RESTful API入门篇 https://juejin.im/post/5c19f94fe51d45069e53c03c
那些年,我们一起误解过的REST https://juejin.im/post/5b92475a5188255c5644819a
理解RESTful架构 http://www.ruanyifeng.com/blog/2011/09/restful.html
彻底弄懂session,cookie,token https://segmentfault.com/a/1190000017831088