在学习内存管理时,栈和堆是两个非常重要的概念。为了更好地理解它们,我们先来看一个简单的程序示例。
假设我们定义了三个函数:a、b 和 c。其中,函数 a 内部依次调用了函数 b 和函数 c。在 main 函数中,我们调用了函数 a。那么,从底层角度来看,这个调用过程是如何运行的呢?当函数 b 执行完毕后,程序又是如何正确地返回到函数 a 中继续执行的?
要回答这个问题,需要了解一个特殊的寄存器——链接寄存器(LR,Link Register)。LR 用于存放函数调用结束后的返回地址。此外,每个函数运行时都需要一块内存来保存其局部变量。
当我们在 main 函数中调用 a 时,LR 会被设置为 main 函数中调用 a 的下一条指令的地址。这样,当 a 执行完毕后,CPU 就能通过 LR 返回到 main 中继续执行。
那么问题来了:函数 a 内部又调用了函数 b 和 c。当执行到调用 b 时,如果直接把 LR 覆盖为返回到 a 中的某个地址,那么之前保存的返回到 main 的地址岂不是丢失了?同理,再调用 c 时又会覆盖。但实际上,程序并不会丢失这些返回地址。
真相是这样的:当一个函数(例如 a)未执行完又调用了另一个函数(例如 b)时,系统会在内存中重新开辟一段空间,用于存放被调用函数(b)自己的 LR 以及它的局部变量。而之前未执行完的函数(a)的那段内存区域仍然存在,其中的 LR 等信息被妥善保存,不会被覆盖。当 b 执行完毕后,系统会根据 b 的 LR 返回到 a 中继续执行,然后 a 再调用 c,依此类推。当最外层的函数 a 最终执行完时,系统会自动释放所有这些内存空间。
这段由系统自动分配和销毁的内存,就是栈(Stack)。栈的管理是自动的——函数调用时压入栈帧,函数返回时弹出栈帧,无需程序员干预。
与栈相对的,是堆(Heap)。
堆内存需要程序员手动管理:
在 C 语言中使用malloc来申请,在 C++ 中使用new来申请。申请成功后,会返回一块连续内存的起始地址。使用完毕后,必须手动释放:C 中用free,C++ 中用delete(如果是数组则用delete[])。如果不释放,这块内存就会一直占着,直到程序结束——这就是“内存泄漏”。如果释放后继续使用,则会产生“野指针”错误,导致程序崩溃或数据错乱。
堆的生存周期完全由你决定:
栈上的变量在函数返回时自动销毁,而堆上的内存可以跨函数存在。例如,你在函数 A 中用malloc申请一块内存,可以把它的地址返回给调用者,甚至传递给其他线程。只要你不调用free,它就一直有效。这种灵活性是堆最大的优势。
堆的分配原理(简版):
系统并不会每次malloc都直接向操作系统要内存。通常,C 运行时库会预先向操作系统申请一大块内存(称为堆池),然后自己管理这块内存的空闲块。malloc的过程就是从空闲链表中找出一块大小合适的内存返回;free则是把这块内存标记回空闲,并尽可能合并相邻的空闲块以减少碎片。
内存碎片问题:
由于堆内存的申请和释放可以是任意顺序,长时间运行的程序容易产生两种碎片:
外部碎片:总体空闲内存足够,但没有一块连续的大块能满足一次大申请。
内部碎片:你申请了 10 字节,但系统因为对齐或最小块限制给了你 16 字节,那多出来的 6 字节就浪费了。
频繁的malloc/free会加剧碎片,最终可能导致大块分配失败。
堆和栈的对比:
速度:栈极快(仅移动指针),堆较慢(需要查找空闲块,甚至系统调用)。
大小:栈通常较小(1~8 MB),堆可以很大(受物理内存+虚拟内存限制)。
管理方式:栈自动,堆手动。
碎片:栈无碎片,堆有碎片。
适用场景:栈适合小数据、生命周期与函数绑定的变量;堆适合大块数据、需要跨函数或动态增长的数据。
使用堆的几条建议:
每次
malloc后都要检查返回值是否为NULL(申请失败)。配对写
free:申请的时候就想好在哪里释放。释放后将指针置为
NULL,避免野指针误用。尽量用栈代替堆(栈更快、无泄漏风险),只有确实需要时才使用堆。
总结一下:
栈:系统自动分配和回收,用于存储函数的返回地址、局部变量等,遵循后进先出原则。
堆:手动开辟和释放,生存周期灵活,但需要程序员谨慎管理内存。