【C++内存管理】第一课：掌握C++的内存资源分配

发表时间: 2024-05-21 14:41

今天是【重学C++】的第一讲，我们来学习下C++的内存管理。

与java、golang等自带垃圾回收机制的语言不同，C++并不会自动回收内存。我们必须手动管理堆上内存分配和释放，这往往会导致内存泄漏和内存溢出等问题。而且，这些问题可能不会立即出现，而是运行一段时间后，才会暴露出现，排查也很困难。因此，了解和掌握C++中的内存管理技巧和工具是非常重要的，可以提高程序性能、减少错误和增加安全性。

内存分区

在C++中，将操作系统分配给程序的内存空间按照用途划分了代码段、数据段、栈、堆几个不同的区域，每个区域都有其独特的内存管理机制。

代码区

代码区是用于存储程序代码的区域，代码段在程序真正执行前就被加载到内存中，在程序执行期间，代码区内存不会被修改和释放。

由于代码区是只读的，所以会被多个进程共享。在多个进程同时执行同一个程序时，操作系统只需要将代码段加载到内存中一次，然后让多个进程共享这个内存区域即可。

数据段

数据段用于存储静态全局变量、静态局部变量和静态常量等静态数据。在程序运行期间，数据段的大小固定不变，但其内容可以被修改。按照变量是否被初始化。数据段可分为已初始化数据段和未初始化数据段。

栈

C++中函数调用以及函数内的局部变量的使用，都是通过栈这个内存分区实现的。栈分区由操作系统自动分配和释放，是一种"后进先出"的一种内存分区。每个栈的大小是固定的，一般只有几MB，所以如果栈变量太大，或者函数调用嵌套太深，容易发生栈溢出（stack overflow）。

先来一段示例代码，看看C++是如何使用栈进行使用栈来进行函数调用的。

#include <iostream>void inner(int a) {    std::cout << a << std::endl;}void outer(int n) {	int a = n + 1;    inner(a);}int main() {    outer(4);}

上面这段代码运行过程中的栈变化如下图

每当程序调用一个函数时，该函数的参数、局部变量和返回地址等信息会被压入栈中。当函数执行完毕，再将这些信息从栈中弹出。根据之前压入的外层调用者压入栈的返回地址，返回到外层调用者未执行的代码继续执行。

本地变量是直接存储在栈上的，当函数执行完成后，这些变量占用的内存就会被释放掉了。前面例子中的本地变量是简单类型，在C++中称为POD类型。对于带有构造和析构函数的非POD类型变量，栈上的内存分配同样有效。编译器会在合适的时机，插入对构造函数和析构函数的调用。

这里有个问题，当函数执行发生异常时，析构函数还会被调用吗？
答案是会的，C++对于发生异常时对析构函数的调用称为"栈展开"。通过下面这段代码演示栈展开。

#include <iostream>#include <string>class Obj {public:    std::string name_;    Obj(const std::string& name):name_(name){std::cout << "Obj() " << name_ << std::endl;};    ~Obj() {std::cout << "~Obj() " << name_ << std::endl;};};void bar() {    auto o = Obj{"bar"};    throw "bar exception";}int main() {    try {        bar();    } catch (const char* e) {        std::cout << "catch Exception: " << e << std::endl;    }}

执行代码的结果是:

Obj() bar~Obj() barcatch Exception: bar exception

可以发现，发生异常时，bar函数中的本地变量o还是能被正常析构。

栈展开的过程实际上是异常发生时，匹配catch子句的过程。

程序抛出异常，停止当前执行的调用链，开始寻找与异常匹配的catch子句。
如果异常发生在try中，则会首先检查与该try块匹配的catch子句。如果异常所在函数体没有try捕获异常。则会直接进入下一步。
如果第二步未找到匹配的catch，则会在外层的try块中查找，直到找到为止。
如果到了最外层还没有找到匹配的catch，也就是说异常得不到处理，程序会调用标准库函数terminate终止函数的执行。

在这期间，栈上所有的对象都会被自动析构。

堆

堆是C++中用来存储动态分配内存的内存分区，堆内存的分配和释放需要手动管理，可以通过new/delete或malloc/free等函数进行分配和释放。堆内存的大小通常是不固定的，当我们需要动态分配内存时，就可以使用堆内存。

堆内存由程序员手动分配和释放，因此使用堆内存需要注意内存泄漏和内存溢出等问题。当程序员忘记释放已分配的内存时，会导致内存泄漏问题。而当申请的堆内存超过了操作系统所分配给进程的内存限制时，会导致内存溢出问题。

C++程序绝大多数的内存泄露，都是由于忘记调用delete/free来释放堆上的资源。

还是上代码

#include <iostream>#include <string>class Obj {public:    std::string name_;    Obj(const std::string& name):name_(name){std::cout << "Obj() " << name_ << std::endl;};    ~Obj() {std::cout << "~Obj() " << name_ << std::endl;};};Obj* makeObj() {	Obj* obj = nullptr;	try {		obj = new Obj{"makeObj"};		...	} catch(...) {		delete obj;		throw;	}	return obj;}Obj* foo() {	Obj* obj = nullptr;	try {		obj = makeObj();		...	} catch(...) {		delete obj;	}	return obj;}int main() {    Obj* obj = foo();    ...    delete obj;}

可以看到，由makeObj函数创建的堆变量obj, 在每个获取该变量的上层调用中，都需要关心对该变量的处理。这无疑极大得增加了开发者的心智负担。

RAII

想在堆上创建对象，又不想处理这么复杂的内存释放操作。C++没有像java、golang其他语言创建一套垃圾回收机制，而是采用了一种特有的资源管理方式 --- RAII（Resource Acquisition Is Initialization，资源获取即初始化）。

RAII利用栈对象在作用域结束后会自动调用析构函数的特点，通过创建栈对象来管理资源。在栈对象构造函数中获取资源，在栈对象析构函数中负责释放资源，以此保证资源的获取和释放。

下面给出一个通过RAII来自动释放堆内存的例子

#include <iostream>class AutoIntPtr {public:    AutoIntPtr(int* p = nullptr) : ptr(p) {}    ~AutoIntPtr() { delete ptr; }    int& operator*() const { return *ptr; }    int* operator->() const { return ptr; }private:    int* ptr;};void foo() {	AutoIntPtr p(new int(5));    std::cout << *p << std::endl; // 5}int main() {    foo();}

上面例子中，AutoIntPtr类封装了一个动态分配的int类型的指针，它的构造函数用于获取资源(ptr = p)，析构函数用于释放资源(delete ptr)。当AutoIntPtr超出作用域时，自动调用析构函数来释放所包含的资源。

基于RAII，C++11引入了std::unique_ptr和std::shared_ptr等智能指针用于内存管理类，使得内存管理变得更加方便和安全。这些内存管理类可以自动进行内存释放，避免了手动释放内存的繁琐工作。值得一提的是，上面的AutoIntPtr就是一个简化版的智能指针了。

在实际开发中，RAII的应用很广。不仅仅用于自动释放内存。还可以用来关闭文件、释放数据库连接、释放同步锁等。

总结

本文介绍了C++中的内存管理机制，包括内存分区、栈、堆和RAII技术等内容。通过学习本文，我们可以更好地掌握C++的内存管理技巧，避免内存泄漏和内存溢出等问题。

【C++内存管理】第一课：掌握C++的内存资源分配

内存分区

代码区

数据段

栈

堆

RAII

总结

热门阅读

推荐阅读