add blog linux memory manger

This commit is contained in:
linlongchen
2020-04-19 21:59:17 +08:00
parent db04b232b5
commit 0bd7ba3686
10 changed files with 204 additions and 0 deletions

Binary file not shown.

After

Width:  |  Height:  |  Size: 26 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 51 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 57 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 19 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 37 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 18 KiB

View File

@@ -0,0 +1,204 @@
今天来带大家研究一下` Linux `内存管理。对于精通 `CURD` 的业务同学,内存管理好像离我们很远,但这个知识点虽然冷门(估计很多人学完根本就没机会用上)但绝对是基础中的基础,这就像武侠中的内功修炼,学完之后看不到立竿见影的效果,但对你日后的开发工作是大有裨益的,因为你站的更高了。
再功利点的说,面试的时候不经意间透露你懂这方面知识,并且能说出个一二三来,也许能让面试官对你更有兴趣,离升职加薪,走上人生巅峰又近了一步。
![img](https://i01piccdn.sogoucdn.com/5309215032ab9b82)
前提约定:本文讨论技术内容前提是,操作系统环境都是 `x86`架构的 32 位 ` Linux `系统。
## 虚拟地址
即使是现代操作系统中内存依然是计算机中很宝贵的资源看看你电脑几个T固态硬盘再看看内存大小就知道了。为了充分利用和管理系统内存资源Linux采用虚拟内存管理技术利用虚拟内存技术让每个进程都有`4GB` 互不干涉的虚拟地址空间。
进程初始化分配和操作的都是基于这个「虚拟地址」,只有当进程需要实际访问内存资源的时候才会建立虚拟地址和物理地址的映射,调入物理内存页。
### 虚拟地址的好处
- 避免用户直接访问物理内存地址,防止一些破坏性操作,保护操作系统
- 每个进程都被分配了4GB的虚拟内存用户程序可使用比实际物理内存更大的地址空间
`4GB` 的进程虚拟地址空间被分成两部分:「用户空间」和「内核空间」
![用户空间内核空间](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\用户空间内核空间.png)
## 物理地址
上面章节我们已经知道不管是用户空间还是内核空间,使用的地址都是虚拟地址,当需进程要实际访问内存的时候,会由内核的「请求分页机制」产生「缺页异常」调入物理内存页。
把虚拟地址转换成内存的物理地址,这中间涉及利用`MMU` 内存管理单元Memory Management Unit ) 对虚拟地址分段和分页(段页式)地址转换,关于分段和分页的具体流程,这里不再赘述,可以参考任何一本计算机组成原理教材描述。
![段页式内存管理地址转换](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\段页式内存管理地址转换.png)
`Linux` 内核会将物理内存分为3个管理区分别是
### ZONE_DMA
`DMA`内存区域。包含0MB~16MB之间的内存页框可以由老式基于ISA的设备通过DMA使用直接映射到内核的地址空间。
### ZONE_NORMAL
普通内存区域。包含16MB~896MB之间的内存页框常规页框直接映射到内核的地址空间。
### ZONE_HIGHMEM
高端内存区域。包含896MB以上的内存页框不进行直接映射可以通过永久映射和临时映射进行这部分内存页框的访问。
![物理内存区划分](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\物理内存区划分.png)
## 用户空间
用户进程能访问的是「用户空间」,每个进程都有自己独立的用户空间,虚拟地址范围从从 0x00000000至0xBFFFFFFF 总容量3G 。
用户进程通常只能访问用户空间的虚拟地址,只有在执行内陷操作或系统调用时才能访问内核空间。
### 进程与内存
进程(执行的程序)占用的用户空间按照「 访问属性一致的地址空间存放在一起 」的原则,划分成 `5`个不同的内存区域。 访问属性指的是“可读、可写、可执行等 。
- 代码段
代码段是用来存放可执行文件的操作指令,可执行程序在内存中的镜像。代码段需要防止在运行时被非法修改,所以只准许读取操作,它是不可写的。
- 数据段
数据段用来存放可执行文件中已初始化全局变量,换句话说就是存放程序静态分配的变量和全局变量。
- BSS段
BSS段包含了程序中未初始化的全局变量在内存中 `bss` 段全部置零。
- 堆 heap
堆是用于存放进程运行中被动态分配的内存段它的大小并不固定可动态扩张或缩减。当进程调用malloc等函数分配内存时新分配的内存就被动态添加到堆上堆被扩张当利用free等函数释放内存时被释放的内存从堆中被剔除堆被缩减
- 栈 stack
栈是用户存放程序临时创建的局部变量也就是函数中定义的变量但不包括static声明的变量static意味着在数据段中存放变量。除此以外在函数被调用时其参数也会被压入发起调用的进程栈中并且待到调用结束后函数的返回值也会被存放回栈中。由于栈的先进先出特点所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。
上述几种内存区域中数据段、`BSS` 段、堆通常是被连续存储在内存中,在位置上是连续的,而代码段和栈往往会被独立存放。堆和栈两个区域在 `i386` 体系结构中栈向下扩展、堆向上扩展,相对而生。
![程序内存区域分段](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\程序内存区域分段.png)
你也可以再linux下用`size` 命令查看编译后程序的各个内存区域大小:
```shell
[lemon ~]# size /usr/local/sbin/sshd
text data bss dec hex filename
1924532 12412 426896 2363840 2411c0 /usr/local/sbin/sshd
```
## 内核空间
在x86 32位系统里Linux内核地址空间是指虚拟地址从0xC0000000开始到0xFFFFFFFF为止的高端内存地址空间总计1G的容量 包括了内核镜像、物理页面表、驱动程序等运行在内核空间 。
![内核空间细分区域](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\内核空间细分区域.png)
#### 直接映射区
直接映射区 `Direct Memory Region`:从内核空间起始地址开始,最大`896M`的内核空间地址区间,为直接内存映射区。
直接映射区的896MB的「线性地址」直接与「物理地址」的前`896MB`进行映射,也就是说,内核地址空间的线性地址`0xC0000001`所对应的物理地址为`0x00000001`,它们之间相差一个偏移量`PAGE_OFFSET = 0xC0000000`
该区域的线性地址和物理地址存在线性转换关系:线性地址 = `PAGE_OFFSET` + 物理地址。也可以用 `virt_to_phys() `函数将内核虚拟空间中的线性地址转化为物理地址。
#### 高端内存线性地址空间
内核空间线性地址从896M到1G的区间容量128MB的地址区间是高端内存线性地址空间为什么叫高端内存线性地址空间下面给你解释一下
前面已经说过内核空间的总大小1GB从内核空间起始地址开始的`896MB`的线性地址可以直接映射到物理地址大小为896MB的地址区间。退一万步即使内核空间的1GB线性地址都映射到物理地址那也最多只能寻址1GB大小的物理内存地址范围。
那请问你现在你家的内存条多大都0202年了一般PC的内存都大于1GB吧
所以内核空间拿出了最后的128M地址区间划分成下面3个内存映射区以达到对整个物理地址范围的寻址。而在64位的系统上就不存在这样的问题了因为可用的线性地址空间远大于可安装的内存。
##### 动态内存映射区
`vmalloc Region` 该区域由内核函数`vmalloc`来分配,特点是:线性空间连续,但是对应的物理地址空间不一定连续。 `vmalloc` 分配的线性地址所对应的物理页可能处于低端内存,也可能处于高端内存。
##### 永久内存映射区
`Persistent Kernel Mapping Region` 该区域可访问高端内存。访问方法是使用 `alloc_page (_GFP_HIGHMEM)` 分配高端内存页或者使用` kmap `函数将分配到的高端内存映射到该区域。
##### 固定映射区
`Fixing kernel Mapping Region` 该区域和4G的顶端只有4k的隔离带其每个地址项都服务于特定的用途如ACPI_BASE等。
![内核空间物理内存映射](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\内核空间物理内存映射.png)
## 回顾一下
先别着急,进入下一节之前,我们再来回顾一下上面所讲的内容。如果认真看完上面的章节,现在你的脑海中应该有这样一个内存管理管理图的概览。
![内核空间用户空间全图](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\内核空间用户空间全图.png)
## 内存数据结构
系统中管理虚拟内存,必然要把内存抽象出数据结构,内存单元对应抽象的内存结构体,内存管理基于这些数据结构操作,这里列举两个管理虚拟内存区域的数据结构。
### 用户空间内存数据结构
在前面「进程与内存」章节我们提到Linux进程可以划分为5个不同的内存区域分别是代码段、数据段、BSS、堆、栈内核管理这些区域的方式是将这些内存区域抽象成` vm_area_struct `的内存管理对象。
` vm_area_struct `是描述进程地址空间的基本管理单元,一个进程往往需要多个` vm_area_struct `来描述它的用户空间虚拟地址,需要使用「链表」和「红黑树」来组织各个` vm_area_struct `
链表用于需要遍历全部节点的时候用,而红黑树适用于在地址空间中定位特定内存区域。内核为了内存区域上的各种不同操作都能获得高性能,所以同时使用了这两种数据结构。
用户空间进程的地址管理模型:
![wm_arem_struct](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\wm_arem_struct.png)
### 内核空间动态分配内存数据结构
在内核空间章节我们提到过「动态内存映射区」,该区域由内核函数`vmalloc`来分配,特点是:线性空间连续,但是对应的物理地址空间不一定连续。 `vmalloc` 分配的线性地址所对应的物理页可能处于低端内存,也可能处于高端内存。
`vmalloc` 分配的地址则限于` vmalloc_start `` vmalloc_end `之间。每一块` vmalloc `分配的内核虚拟内存都对应一个` vm_struct `结构体,不同的内核空间虚拟地址之间有` 4k `大小的防越界空闲区间隔区。与用户空间的虚拟地址特性一样,这些虚拟地址与物理内存没有简单的映射关系,必须通过内核页表才可转换为物理地址或物理页,它们有可能尚未被映射,当发生缺页时才真正分配物理页面。
![动态内存映射](F:\github\lemonchann.github.io\_posts\linux\linux工具系列\02\动态内存映射.png)
## 总结一下
` Linux `内存管理是一个非常复杂的系统,光看` Linux` 源码你就知道有多庞大了,这篇文章从宏观角度给你展现内存管理的全貌,但一般来说,这些知识在你和面试官聊天的时候还是够用的,当然我也希望大家能了解更深层次的原理。它可以作为一个索引一样学习指南,当你想深入某一点学习的时候可以在这篇文章里找到切入点,以及这个知识点在内存管理宏观上的位置。
我在总结的时候也画了大量的说明图解,可以作为知识索引,个人感觉看图还是比看文字更清晰明了,你可以在我公众号「后端技术学堂」后台回复「内存管理」获取这些图片的高清原图。
老规矩。感谢各位的阅读,文章的目的是分享对知识的理解,技术类文章我都会反复求证以求最大程度保证准确性,若文中出现明显纰漏也欢迎指出,我们一起在探讨中学习。
今天的技术分享就到这里,我们下期再见。
**原创不易,看到这里,如果在我这有一点点收获,就动动手指「转发」「在看」是对我持续创作的最大支持。**
## Reference
https://cloud.tencent.com/developer/article/1515762
https://cloud.tencent.com/developer/article/1005671
https://www.cnblogs.com/tolimit/p/4551428.html
http://gityuan.com/2015/10/30/kernel-memory/
https://www.jianshu.com/p/95d68389fbd1
https://www.ibm.com/developerworks/cn/linux/l-linux-slab-allocator/index.html#table2
https://zhuanlan.zhihu.com/p/36140017
https://fivezh.github.io/2017/06/25/Linux-slab-info/
http://blog.yufeng.info/archives/2456
https://cloud.tencent.com/developer/article/1515762

Binary file not shown.

After

Width:  |  Height:  |  Size: 12 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 11 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 6.5 KiB