高性能内存池实现

348次阅读  |  发布于3年以前

对于从事c/c++开发的人来说,malloc/new再也熟悉不过了,对于堆上的内存分配,都是使用标准库提供的函数来进行内存分配,而这些函数最终也会进入到系统调用(brk等),每次的内存申请和释放,都可能会涉及到底层内存数据的调整,所以效率会非常低。如果我们一次申请一块很大的内存块,后续所有的内存申请和分配,都是基于这一块内存来进行,这样效率就会提升很多,本文主要就是实现一个高效的固定大小的内存池。

结构

图一

实现

内存块定义:

typedef struct memory_block {
        unsigned int size;
        unsigned int free_size;
        unsigned int first_free;

        struct memory_block *next;
        char a_data[1];
} s_memory_block;

内存池Header:

typedef struct memory_pool {
        unsigned int unit_size;
        unsigned int init_size;
        unsigned int grow_size;
        s_memory_block *block;
} s_memory_pool;

初始化内存池:

//此函数初始化内存池Header
s_memory_pool *memory_pool_create(unsigned int size) {
        s_memory_pool *mp;
        mp = (s_memory_pool*)malloc(sizeof(s_memory_pool));
        mp->first_block = NULL;
        mp->init_size = 10000;
        mp->grow_size = 10000;
        if(size < sizeof(unsigned int))
                mp->obj_size = sizeof(unsigned int);
        //对齐
        mp->unit_size = (size + (MEMPOOL_ALIGNMENT-1)) & ~(MEMPOOL_ALIGNMENT-1);
        return mp;
}

当初始化之后,内存池结构变成:

图二

从函数实现内容来看,是初始化了内存池的头。

内存分配函数:

1、从mp的first_block开始,如果其为空,则表明该内存池为首次创建,需要分配内存块,并在该内存块内进行链式初始化,返回该块的第一小块地址。

2、从first_block开始,查找一个有内存可分配的block,如果有,则分配,并将first_free指向该块的下一个地址。

3、重新建一个block,进行分配,并将该新块插入到mp的头部

void *memory_alloc(s_memory_pool *mp)  {

        register unsigned int i;
        register char *data;
        //unsigned int length;

        if(mp->first_block == NULL)//memory_pool is NULL
        {

                s_memory_block *mb;
                mb = (s_memory_block *)malloc((mp->init_size)*(mp->obj_size) + sizeof(s_memory_block));//create first memory_block
                if(mb == NULL)
                {
                        perror("memory allocate failed!\n");
                        return NULL;
                }

                /* init the first block */
                mb->next = NULL;
                mb->free_size = mp->init_size - 1;
                mb->first_free = 1;
                mb->size = mp->init_size*mp->obj_size;

                mp->first_block = mb;

                data = mb->a_data;

                /* set the mark */
                for(i=1; i<mp->init_size; ++i)
                {
                       //初始化块,链接方式类似于链表
                }

                return (void *)mb->a_data;
        } //如图三

        s_memory_block *pm_block = mp->first_block;

        while((pm_block!=NULL) && (pm_block->free_size==0))
        {
                pm_block = pm_block->next;
        }

        if(pm_block != NULL)
        {
                char *pfree = pm_block->a_data + pm_block->first_free * mp->obj_size;
                //查找一个可用块返回
                // ......

                return (void *)pfree;
        }
        else
        {
                if(mp->grow_size == 0) 
                    return NULL;
                s_memory_block *new_block = (s_memory_block *)malloc((mp->grow_size)*(mp->obj_size) + sizeof(s_memory_block));

                if(new_block == NULL)
                        return NULL;

                data = new_block->a_data;

                for(i=1; i<mp->grow_size; ++i)
                {
                        //链式
                }

               //将新块插入到链表头首部

                return (void *)(new_block->a_data);
        }
}

释放函数:

1、遍历该内存池,查找所要释放的内存块pfree所在的block

2、将该block的first指向该pfree的偏移

3、该pfree的偏移指向之前block的first

注:2、3处相当于链表的插入

inline void* memory_free(s_memory_pool *mp, void *pfree)
{
  if(mp->first_block == NULL)
    return;

  s_memory_block *pm_block = mp->first_block;
  s_memory_block *pm_pre_block = mp->first_block;

  /* research the memory_block which the pfree in */
  while(pm_block && ((unsigned int)pfree<(unsigned int)pm_block->a_data ||
    (unsigned int)pfree>((unsigned int)pm_block->a_data+pm_block->size)))
  {
    //pm_pre_block = pm_block;
    pm_block = pm_block->next;
    if(pm_block == NULL)
      return NULL;
  }

  //获取偏移地址
  unsigned int offset = pfree -(void*) pm_block->a_data;

  if((offset&(mp->obj_size -1)) > 0)
    return pfree;
  //将释放的内存块返回给内存池对应的Block块
  pm_block->free_size++;
  *((unsigned int *)pfree) = pm_block->first_free;
  pm_block->first_free=(unsigned int)(offset/mp->obj_size);

  return NULL;

}

图三

当内存池为空的时候,也就是首次调用memory_alloc函数时候,会创建一个新的Block,并对这个Block进行初始化,然后返回首块地址 。

当第二次调用memory_alloc之后,如图四所示。

当第三次调用memory_alloc之后,如图五所示。

图四

图五

图六

当释放第二次分配的内存之后,整个内存块链表如图六所示。

图八

当现在所有的Block里面都没有可用内存之后,就重新申请一块Block,并插入到Header的头部,如图八所示。

内存池数据结果:

与库函数malloc相比,性能提升了大概25%左右

注:本文旨在于提供一种设计思路,在本文实现的内存池,仅仅支持单线程,固定大小的,读者可以针对该思路,进行改进

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8