Android应用程序UI硬件加速渲染的Display List渲染过程分析

4262次阅读  |  发布于5年以前

Android应用程序UI硬件加速渲染的Display List渲染过程分析

在硬件加速渲染环境中,Android应用程序窗口的UI渲染是分两步进行的。第一步是构建Display List,发生在应用程序进程的Main Thread中;第二步是渲染Display List,发生在应用程序进程的Render Thread中。Display List的渲染不是简单地执行绘制命令,而是包含了一系列优化操作,例如绘制命令的合并执行。本文就详细分析Display List的渲染过程。

从前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文可以知道,Android应用程序窗口的Root Render Node的Display List,包含了Android应用程序窗口所有的绘制命令,因此我们只要对Root Render Node的Display List进行渲染,就可以得到整个Android应用程序窗口的UI。

Android应用程序窗口的Display List的构建是通过Display List Renderer进行的,而渲染是通过Open GL Renderer进行的,如图1所示:

图1 Android应用程序窗口的Display List的渲染示意图

从图1可以知道,Open GL Renderer只作用在Android应用程序窗口的Root Render Node的Display List上,这是因为Root Render Node的Display List包含了Android应用程序窗口所有的绘制命令。

Android应用程序窗口的Display List的渲染是由Render Thread执行的,不过是由Main Thread通知Render Thread执行的,如图2所示:

图2 Main Thread向Render Thread发起渲染命令

从图2可以知道。Main Thread通过向Render Thread的TaskQueue添加一个drawFrame任务来通知Render Thread渲染Android应用程序窗口的UI。

从前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文还可以知道,Android应用程序窗口的Display List构建完成之后,Main Thread就马上向Render Thread发出渲染命令,如下所示:

public class ThreadedRenderer extends HardwareRenderer {  
        ......  

        @Override  
        void draw(View view, AttachInfo attachInfo, HardwareDrawCallbacks callbacks) {  
            ......  

            updateRootDisplayList(view, callbacks);  
            ......  

            if (attachInfo.mPendingAnimatingRenderNodes != null) {  
                final int count = attachInfo.mPendingAnimatingRenderNodes.size();  
                for (int i = 0; i < count; i++) {  
                    registerAnimatingRenderNode(  
                            attachInfo.mPendingAnimatingRenderNodes.get(i));  
                }  
                attachInfo.mPendingAnimatingRenderNodes.clear();  
                // We don't need this anymore as subsequent calls to  
                // ViewRootImpl#attachRenderNodeAnimator will go directly to us.  
                attachInfo.mPendingAnimatingRenderNodes = null;  
            }  

            int syncResult = nSyncAndDrawFrame(mNativeProxy, frameTimeNanos,  
                    recordDuration, view.getResources().getDisplayMetrics().density);  
            if ((syncResult & SYNC_INVALIDATE_REQUIRED) != 0) {
                attachInfo.mViewRootImpl.invalidate();
            }

        }  

        ......  
    } 

这个函数定义在文件frameworks/base/core/java/android/view/ThreadedRenderer.java中。

ThreadedRenderer类的成员函数draw主要执行三个操作:

1. 调用成员函数updateRootDisplayList构建或者更新应用程序窗口的Root Render Node的Display List。

2. 调用成员函数registerAnimationRenderNode注册应用程序窗口动画相关的Render Node。

3. 调用成员函数nSyncAndDrawFrame渲染应用程序窗口的Root Render Node的Display List。

其中,第一个操作在前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文已经分析,第二个操作在接下来的一篇文章中分析,这篇文章主要关注第三个操作,即应用程序窗口的Root Render Node的Display List的渲染过程,即ThreadedRenderer类的成员函数nSyncAndDrawFrame的实现。

ThreadedRenderer类的成员函数nSyncAndDrawFrame是一个JNI函数,由Native层的函数android_view_ThreadedRenderer_syncAndDrawFrame实现,如下所示:

static int android_view_ThreadedRenderer_syncAndDrawFrame(JNIEnv* env, jobject clazz,
            jlong proxyPtr, jlong frameTimeNanos, jlong recordDuration, jfloat density) {
        RenderProxy* proxy = reinterpret_cast<RenderProxy*>(proxyPtr);
        return proxy->syncAndDrawFrame(frameTimeNanos, recordDuration, density);
    }

这个函数定义在文件frameworks/base/core/jni/android_view_ThreadedRenderer.cpp中。

参数proxyPtr描述的是一个RenderProxy对象,这里调用它的成员函数syncAndDrawFrame渲染应用程序窗口的Display List。

RenderProxy类的成员函数syncAndDrawFrame的实现如下所示:

int RenderProxy::syncAndDrawFrame(nsecs_t frameTimeNanos, nsecs_t recordDurationNanos,
            float density) {
        mDrawFrameTask.setDensity(density);
        return mDrawFrameTask.drawFrame(frameTimeNanos, recordDurationNanos);
    }

这个函数定义在文件frameworks/base/libs/hwui/renderthread/RenderProxy.cpp。

RenderProxy类的成员变量mDrawFrameTask指向的是一个DrawFrameTask对象。在前面Android应用程序UI硬件加速渲染环境初始化过程分析一文提到,这个DrawFrameTask对象描述的是一个用来执行渲染任务的Task,这里调用它的成员函数drawFrame渲染应用程序窗口的下一帧,也就是应用程序窗口的Display List。

DrawFrameTask的成员函数drawFrame的实现如下所示:

int DrawFrameTask::drawFrame(nsecs_t frameTimeNanos, nsecs_t recordDurationNanos) {
        ......

        mSyncResult = kSync_OK;
        ......

        postAndWait();

        ......

        return mSyncResult;
    }

这个函数定义在文件frameworks/base/libs/hwui/renderthread/DrawFrameTask.cpp中。

DrawFrameTask的成员函数drawFrame最主要的操作就是调用另外一个成员函数postAndWait往Render Thread的Task Queue抛一个消息,并且进入睡眠状态,等待Render Thread在合适的时候唤醒。

DrawFrameTask的成员函数postAndWait的实现如下所示:

void DrawFrameTask::postAndWait() {
        AutoMutex _lock(mLock);
        mRenderThread->queue(this);
        mSignal.wait(mLock);
    }

这个函数定义在文件frameworks/base/libs/hwui/renderthread/DrawFrameTask.cpp中。

由于DrawFrameTask类描述的就是一个可以添加到Render Thread的Task Queue的Task,因此DrawFrameTask的成员函数postAndWait就将当前正在处理的DrawFrameTask对象添加到由成员变量mRenderThread描述的Render Thread的Task Queue,并且在另外一个成员变量mSignal描述的一个条件变量上进行等待。

从前面Android应用程序UI硬件加速渲染环境初始化过程分析一文可以知道,添加到Render Thread的Task Queue的Task被处理时,它的成员函数run就会被调用,因此接下来DrawFrameTask类的成员函数run就会被调用,它的实现如下所示:

void DrawFrameTask::run() {
        ......

        bool canUnblockUiThread;
        bool canDrawThisFrame;
        {
            TreeInfo info(TreeInfo::MODE_FULL, mRenderThread->renderState());
            canUnblockUiThread = syncFrameState(info);
            canDrawThisFrame = info.out.canDrawThisFrame;
        }

        // Grab a copy of everything we need
        CanvasContext* context = mContext;

        // From this point on anything in "this" is *UNSAFE TO ACCESS*
        if (canUnblockUiThread) {
            unblockUiThread();
        }

        if (CC_LIKELY(canDrawThisFrame)) {
            context->draw();
        }

        if (!canUnblockUiThread) {
            unblockUiThread();
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/renderthread/DrawFrameTask.cpp中。

要理解这个函数首先要理解应用程序进程的Main Thread和Render Thread是如何协作的。从前面的分析可以知道,Main Thread请求Render Thread执行Draw Frame Task的时候,不能马上返回,而是进入等待状态。等到Render Thread从Main Thread同步完绘制所需要的信息之后,Main Thread才会被唤醒。

那么,Render Thread要从Main Thread同步什么信息呢?原来,Main Thread和Render Thread都各自维护了一份应用程序窗口视图信息。各自维护了一份应用程序窗口视图信息的目的,就是为了可以互不干扰,进而实现最大程度的并行。其中,Render Thread维护的应用程序窗口视图信息是来自于Main Thread的。因此,当Main Thread维护的应用程序窗口信息发生了变化时,就需要同步到Render Thread去。

应用程序窗口的视图信息包含图1所示的各个Render Node的Display List、Property以及Display List引用的Bitmap。在RenderNode类中,有六个成员变量是与Display List和Property相关的,如下所示:

class RenderNode : public VirtualLightRefBase {
    public:
        ......

        ANDROID_API void setStagingDisplayList(DisplayListData* newData);
        ......

        const RenderProperties& stagingProperties() {
            return mStagingProperties;
        }
        ......

    private:
        ......

        uint32_t mDirtyPropertyFields;
        RenderProperties mProperties;
        RenderProperties mStagingProperties;

        bool mNeedsDisplayListDataSync;
        // WARNING: Do not delete this directly, you must go through deleteDisplayListData()!
        DisplayListData* mDisplayListData;
        DisplayListData* mStagingDisplayListData;

        ......
    };

这个类定义在文件frameworks/base/libs/hwui/RenderNode.h中。

其中,成员变量mStagingProperties描述的Render Properties和成员变量mStagingDisplayListData描述的Display List Data由Main Thread维护,而成员变量mProperties描述的Render Properties和成员变量mDisplayListData描述的Display List Data由Render Thread维护。

这一点可以从前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文看出。当Main Thread构建完成应用程序窗口的Display List之后,就会调用RenderNode类的成员函数setStagingDisplayList将其设置到Root Render Node的成员变量mStagingDisplayListData中去。而当应用程序窗口某一个View的Property发生变化时,就会调用RenderNode类的成员函数mutateStagingProperties获得成员变量mStagingProperties描述的Render Properties,进而修改相应的Property。

当Main Thread维护的Render Properties发生变化时,成员变量mDirtyPropertyFields的值就不等于0,其中不等于0的位就表示是哪一个具体的Property发生了变化,而当Main Thread维护的Display List Data发生变化时,成员变量mNeedsDisplayListDataSync的值就等于true,表示要从Main Thread同步到Render Thread。

另外,在前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文分析将一个Bitmap绘制命令转化为一个DrawBitmapOp记录在Display List时,Bitmap会被增加一个引用,如下所示:

status_t DisplayListRenderer::drawBitmap(const SkBitmap* bitmap, const SkPaint* paint) {
        bitmap = refBitmap(bitmap);
        paint = refPaint(paint);

        addDrawOp(new (alloc()) DrawBitmapOp(bitmap, paint));
        return DrawGlInfo::kStatusDone;
    }

这个函数定义在文件frameworks/base/libs/hwui/DisplayListRenderer.cpp中。

参数bitmap描述的SkBitmap通过调用DisplayListRenderer类的成员函数refBitmap进行使用,它的实现如下所示:

class ANDROID_API DisplayListRenderer: public StatefulBaseRenderer {
    public:
        ......

        inline const SkBitmap* refBitmap(const SkBitmap* bitmap) {
            ......
            mDisplayListData->bitmapResources.add(bitmap);
            mCaches.resourceCache.incrementRefcount(bitmap);
            return bitmap;
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DisplayListRenderer.h中。

DisplayListRenderer类的成员函数refBitmap在增加参数bitmap描述的一个SkBitmap的引用计数之前,会将它保存在成员变量mDisplayListData指向的一个DisplayListData对象的成员变量bitmapResources描述的一个Vector中。

上述情况是针对调用GLES20Canvas类的以下成员函数drawBitmap绘制一个Bitmap时发生的情况:

class GLES20Canvas extends HardwareCanvas {
        ......

        @Override
        public void drawBitmap(Bitmap bitmap, float left, float top, Paint paint) {
            throwIfCannotDraw(bitmap);
            final long nativePaint = paint == null ? 0 : paint.mNativePaint;
            nDrawBitmap(mRenderer, bitmap.mNativeBitmap, bitmap.mBuffer, left, top, nativePaint);
        }

        ......
    }

这个函数定义在文件frameworks/base/core/java/android/view/GLES20Canvas.java。

我们还可以调用GLES20Canvas类的另外一个重载版本的成员函数drawBitmap绘制一个Bitmap,如下所示:

class GLES20Canvas extends HardwareCanvas {
        ......

        @Override
        public void drawBitmap(int[] colors, int offset, int stride, float x, float y,
                int width, int height, boolean hasAlpha, Paint paint) {
            ......

            final long nativePaint = paint == null ? 0 : paint.mNativePaint;
            nDrawBitmap(mRenderer, colors, offset, stride, x, y,
                    width, height, hasAlpha, nativePaint);
        }

        ......
    }

这个函数定义在文件frameworks/base/core/java/android/view/GLES20Canvas.java。

GLES20Canvas类这个重载版本的成员函数drawBitmap通过一个int数组来指定要绘制的Bitmap。这个int数组是由应用程序自己管理的,并且会被封装成一个SkBitmap,最终由DisplayListRenderer类的成员函数drawBitmapData将该Bitmap绘制命令封装成一个DrawBitmapDataOp记录在Display List中,如下所示:

status_t DisplayListRenderer::drawBitmapData(const SkBitmap* bitmap, const SkPaint* paint) {
        bitmap = refBitmapData(bitmap);
        paint = refPaint(paint);

        addDrawOp(new (alloc()) DrawBitmapDataOp(bitmap, paint));
        return DrawGlInfo::kStatusDone;
    }

这个函数定义在文件frameworks/base/libs/hwui/DisplayListRenderer.cpp中。

DisplayListRenderer类的成员函数drawBitmapData通过另外一个成员函数refBitmapData来增加参数bitmap描述的SkBitmap的引用,如下所示:

class ANDROID_API DisplayListRenderer: public StatefulBaseRenderer {
    public:
        ......

        inline const SkBitmap* refBitmapData(const SkBitmap* bitmap) {
            mDisplayListData->ownedBitmapResources.add(bitmap);
            mCaches.resourceCache.incrementRefcount(bitmap);
            return bitmap;
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DisplayListRenderer.cpp中。

与前面分析的DisplayListRenderer类的成员函数refBitmap不同,DisplayListRenderer类的成员函数refBitmapData将参数bitmap描述的SkBitmap保存在成员变量mDisplayListData指向的一个DisplayListData对象的成员变量ownedBitmapResources描述的一个Vector中。这是由于前者引用的SkBitmap使用的底层存储是由应用程序提供和管理的,而后者引用的SkBitmap使用的底层存储是在SkBitmap内部创建和管理的。这个区别在接下来分析Bitmap的同步过程时会进一步得到体现。

Display List引用的Bitmap的同步方式与Display List和Render Property的同步方式有所不同。在同步Bitmap的时候,Bitmap将作为一个Open GL纹理上传到GPU去被Render Thread使用。

有了这些背景知识之后 ,再回到DrawFrameTask类的成员函数run中,它的执行逻辑如下所示:

1. 调用成员函数syncFrameState将应用程序窗口的Display List、Render Property以及Display List引用的Bitmap等信息从Main Thread同步到Render Thread中。注意,在这个同步过程中,Main Thread是处于等待状态的。

2. 如果成员函数syncFrameState能顺利地完成信息同步,那么它的返回值canUnblockUiThread就会等于true,表示在Render Thread渲染应用程序窗口的下一帧之前,就可以唤醒Main Thread了。否则的话,就要等到Render Thread渲染应用程序窗口的下一帧之后,才能唤醒Main Thread。唤醒Render Thread是通过调用成员函数unblockUiThread来完成的,如下所示:

void DrawFrameTask::unblockUiThread() {
        AutoMutex _lock(mLock);
        mSignal.signal();
    }

这个函数定义在frameworks/base/libs/hwui/renderthread/DrawFrameTask.cpp中。

前面Main Thread就刚好是等待在DrawFrameTask类的成员变量mSignal描述的一个条件变量之上的,所以现在Render Thread就通过这个条件变量来唤醒它。

3. 调用成员变量mContext描述的一个CanvasContext对象的成员函数draw渲染应用程序窗口的Display List,不过前提是当前帧能够进行绘制。什么时候当前帧不能够进行绘制呢?我们知道,应用程序进程绘制好一个窗口之后,得到的图形缓冲区要交给Surface Flinger进行合成,最后才能显示在屏幕上。Surface Flinger为每一个窗口都维护了一个图形缓冲区队列。当这个队列等待合成的图形缓冲区的个数大于等于2时,就表明Surface Flinger太忙了。因此这时候就最好不再向它提交图形缓冲区,这就意味着应用程序窗口的当前帧不能绘制了,也就是会被丢弃。

注意,Render Thread渲染应用程序窗口的Display List的时候,Main Thread有可能是处于等待状态,也有可能不是处于等待状态。这取决于前面的信息同步结果。信息同步结果是通过一个TreeInfo来描述的。当Main Thread不是处于等待状态时,它就可以马上处理其它事情了,例如构建应用程序窗口下一帧时使用的Display List。这样就可以做到Render Thread在绘制应用程序窗口的当前帧的同时,Main Thread可以并行地去构建应用程序窗口的下一帧的Display List。这一点也是Android 5.0引进Render Thread的好处所在。

接下来,我们就先分析应用程序窗口绘制信息的同步过程,即DrawFrameTask类的成员函数syncFrameState的实现,接着再分析应用程序窗口的Display List的渲染过程,即CanvasContext类的成员函数draw的实现。

DrawFrameTask类的成员函数syncFrameState的实现如下所示:

bool DrawFrameTask::syncFrameState(TreeInfo& info) {
        ......

        Caches::getInstance().textureCache.resetMarkInUse();

        for (size_t i = 0; i < mLayers.size(); i++) {
            mContext->processLayerUpdate(mLayers[i].get());
        }
        ......
        mContext->prepareTree(info);

        if (info.out.hasAnimations) {
            if (info.out.requiresUiRedraw) {
                mSyncResult |= kSync_UIRedrawRequired;
            }
        }
        // If prepareTextures is false, we ran out of texture cache space
        return info.prepareTextures;
    }

这个函数定义在文件frameworks/base/libs/hwui/renderthread/DrawFrameTask.cpp中。

应用程序进程有一个Caches单例。这个Caches单例有一个成员变量textureCache,它指向的是一个TextureCache对象。这个TextureCache对象用来缓存应用程序窗口在渲染过程中用过的Open GL纹理。在同步应用程序窗口绘制信息之前,DrawFrameTask类的成员函数syncFrameState首先调用这个TextureCache对象的成员函数resetMarkInUse将缓存的Open GL纹理标记为未使用状态。

在前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文提到,当TextureView有更新时,Native层会将一个与它关联的DeferredLayerUpdater对象保存在DrawFrameTask类的成员变量mLayers描述的一个vector中。也就是说,保存在这个vector中的DeferredLayerUpdater对象,都是需要进一步处理的。需要做的处理就是从与TextureView关联的SurfaceTexture中读出下一个可用的图形缓冲区,并且将该图形缓冲区封装成一个Open GL纹理。这是通过调用DrawFrameTask类的成员变量mContext指向的一个CanvasContext对象的成员函数processLayerUpdate来实现的。

CanvasContext类的成员函数processLayerUpdate的实现如下所示:

void CanvasContext::processLayerUpdate(DeferredLayerUpdater* layerUpdater) {
        bool success = layerUpdater->apply();
        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/renderthread/CanvasContext.cpp中。

CanvasContext类的成员函数processLayerUpdate主要是调用参数layerUpdater描述的一个DeferredLayerUpdater对象的成员函数apply读出下一个可用的图形缓冲区,并且将该图形缓冲区封装成一个Open GL纹理,以便后面可以对它进行渲染。

DeferredLayerUpdater类的成员函数apply的实现如下所示:

bool DeferredLayerUpdater::apply() {
        bool success = true;
        ......

        if (mSurfaceTexture.get()) {
            ......
            if (mUpdateTexImage) {
                mUpdateTexImage = false;
                doUpdateTexImage();
            }
            ......
        }
        return success;
    }

这个函数定义在文件frameworks/base/libs/hwui/DeferredLayerUpdater.cpp中。

DeferredLayerUpdater类的成员变量mSurfaceTexture指向的一个是GLConsumer对象。这个GLConsumer对象用来描述与当前正在处理的DeferredLayerUpdater对象关联的TextureView对象所使用的一个SurfaceTexture对象的读端。也就是说,通过这个GLConsumer对象可以将关联的TextureView对象的下一个可用的图形缓冲区读取出来。

从前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文可以知道,当一个TextureView有可用的图形缓冲区时,与它关联的DeferredLayerUpdater对象的成员变量mUpdateTexImage值会被设置为true。这时候如果当前正在处理的DeferredLayerUpdater对象的成员变量mSurfaceTexture指向了一个GLConsumer对象,那么现在就是时候去读取可用的图形缓冲区了。这是通过调用DeferredLayerUpdater类的成员函数doUpdateTexImage来实现的。

DeferredLayerUpdater类的成员函数doUpdateTexImage的实现如下所示:

void DeferredLayerUpdater::doUpdateTexImage() {
        if (mSurfaceTexture->updateTexImage() == NO_ERROR) {
            ......

            GLenum renderTarget = mSurfaceTexture->getCurrentTextureTarget();

            LayerRenderer::updateTextureLayer(mLayer, mWidth, mHeight,
                    !mBlend, forceFilter, renderTarget, transform);
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/DeferredLayerUpdater.cpp中。

DeferredLayerUpdater类的成员函数doUpdateTexImage调用成员变量mSurfaceTexture指向的一个GLConsumer对象的成员函数updateTexImage读出可用的图形缓冲区,并且将该图形缓冲区封装成一个Open GL纹理。这个Open GL纹理可以通过调用上述的GLConsumer对象的成员函数getCurrentTextureTarget获得了。

接下来DeferredLayerUpdater类的成员函数doUpdateTexImage调用LayerRenderer类的静态成员函数updateTextureLayer将获得的Open GL纹理关联给成员变量mLayer描述的一个Layer对象。

LayerRenderer类的静态成员函数updateTextureLayer的实现如下所示:

void LayerRenderer::updateTextureLayer(Layer* layer, uint32_t width, uint32_t height,
            bool isOpaque, bool forceFilter, GLenum renderTarget, float* textureTransform) {
        if (layer) {
            ......

            if (renderTarget != layer->getRenderTarget()) {
                layer->setRenderTarget(renderTarget);
                ......
            }
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/LayerRenderer.cpp中。

LayerRenderer类的静态成员函数updateTextureLayer主要就是将参数renderTarget描述的Open GL纹理设置给参数layer描述的Layer对象。这是通过调用Layer类的成员函数setRenderTarget实现的。一个Layer对象关联了Open GL纹理之后,以后就可以进行渲染了。

这一步执行完成之后,如果应用程序窗口存在需要更新的TextureView,那么这些TextureView就更新完毕,也就是这些TextureView下一个可用的图形缓冲区已经被读出,并且封装成了Open GL纹理。回到前面分析的DrawFrameTask类的成员函数syncFrameState中,接下来要做的事情是将Main Thread维护的Display List等信息同步到Render Thread中。这是通过调用DrawFrameTask类的成员变量mContext指向的一个CanvasContext对象的成员函数prepareTree实现的。

CanvasContext对象的成员函数prepareTree执行完毕之后,会通过参数info描述的一个TreeInfo对象返回一些同步结果:

1. 当这个TreeInfo对象的成员变量out指向的一个Out对象的成员变量hasAnimations等于true时,表示应用程序窗口存在未完成的动画。如果这些未完成的动画至少存在一个是非异步动画时,上述Out对象的成员变量requiresUiRedraw的值就会被设置为true。这时候DrawFrameTask类的成员变量mSyncResult的kSync_UIRedrawRequired位就会被设置为1。所谓非异步动画,就是那些在执行过程可以停止的动画。这个停止执行的逻辑是由Main Thread执行的,例如,Main Thread可以响应用户输入停止执行一个非异步动画。从前面分析可以知道,DrawFrameTask类的成员变量mSyncResult的值最后将会返回给Java层的ThreadedRenderer类的成员函数draw。ThreadedRenderer类的成员函数draw一旦发现该值的kSync_UIRedrawRequired位被设置为1,那么就会向Main Thread的消息队列发送一个INVALIDATE消息,以便在处理这个INVALIDATE消息的时候,可以响应停止执行非异步动画的请求。

  1. 当这个TreeInfo对象的成员变量prepareTextures的值等于true时,表示应用程序窗口的Display List引用到的Bitmap均已作为Open GL纹理上传到了GPU。这意味着应用程序窗口的Display List引用到的Bitmap已全部同步完成。在这种情况下,Render Thread在渲染下一帧之前,就可以唤醒Main Thread。另一方面,如果上述TreeInfo对象的成员变量prepareTextures的值等于false,就意味着应用程序窗口的Display List引用到的某些Bitmap不能成功地作为Open GL纹理上传到GPU,这时候Render Thread在渲染下一帧之后,才可以唤醒Main Thread,防止这些未能作为Open GL纹理上传到GPU的Bitmap一边被Render Thread渲染,一边又被Main Thread修改。那么什么时候应用程序窗口的Display List引用到的Bitmap会不能成功地作为Open GL纹理上传到GPU呢?一个应用程序进程可以创建的Open GL纹理是有大小限制的,如果超出这个限制,那么就会导至某些Bitmap不能作为Open GL纹理上传到GPU。

接下来,我们就继续分析CanvasContext类的成员函数prepareTree的实现,以便可以了解应用程序窗口的Display List等信息的同步过程,如下所示:

void CanvasContext::prepareTree(TreeInfo& info) {
        ......

        info.renderer = mCanvas;
        ......

        mRootRenderNode->prepareTree(info);

        ......

        int runningBehind = 0;
        // TODO: This query is moderately expensive, investigate adding some sort
        // of fast-path based off when we last called eglSwapBuffers() as well as
        // last vsync time. Or something.
        mNativeWindow->query(mNativeWindow.get(),
                NATIVE_WINDOW_CONSUMER_RUNNING_BEHIND, &runningBehind);
        info.out.canDrawThisFrame = !runningBehind;

        if (info.out.hasAnimations || !info.out.canDrawThisFrame) {
            if (!info.out.requiresUiRedraw) {
                // If animationsNeedsRedraw is set don't bother posting for an RT anim
                // as we will just end up fighting the UI thread.
                mRenderThread.postFrameCallback(this);
            }
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

CanvasContext类的成员变量mRootRenderNode指向的一个RenderNode对象描述的是应用程序窗口的Root Render Node,这里通过调用它的成员函数prepareTree开始对应用程序窗口的各个View的Display List进行同步。

在这个同步的过程中,如果某些View设置了动画,并且这些动还未执行完成,那么参数info指向的TreeInfo对象的成员变量hasAnimations的值就会等于true。这时候如果应用程序窗口的下一帧不可以渲染,即上述TreeInfo对象的成员变量canDrawThisFrame的值等于false,并且所有View设置的动画都是非异步的,即上述TreeInfo对象的成员变量requiresUiRedraw的值等于false,那么就需要解决一个问题,那些未执行完成的动画如何继续执行下去?因为等到当应用程序窗口的下一帧可以渲染时,这些未完成的动画还是需要继续执行的。

我们知道,当TreeInfo对象的成员变量requiresUiRedraw的值等于true时,Main Thread会自动发起渲染应用程序窗口的Display List的命令。在这个命令的执行过程中,未完成的动画是可以继续执行的。但是当TreeInfo对象的成员变量requiresUiRedraw的值等于false时,Main Thread不会自动发起渲染应用程序窗口的Display List的命令,这时候就需要向Render Thread注册一个IFrameCallback接口,这是通过调用CanvasContext类的成员变量mRenderThread指向的一个RenderThread对象的成员函数postFrameCallback实现的

从前面Android应用程序UI硬件加速渲染环境初始化过程分析一文可以知道,注册到Render Thread的IFrameCallback接口在下一个Vsync信号到来时,它的成员函数doFrame会被调用,这时候就可以执行渲染应用程序窗口的下一帧了。在渲染的过程中,就可以继续执行那些未完成的动画了。

CanvasContext类的成员变量mNativeWindow描述的就是当前绑定的应用程序窗口,通过调用它的成员函数query,并且将第二个参数设置为NATIVE_WINDOW_CONSUMER_RUNNING_BEHIND,可以查询到它提交了多少个图形缓冲区还未被处理。如果这些已提交了但是还没有被处理的图形缓冲区大于等于2,输出参数runningBehind就会等于true,这表明Surface Flinger太忙了,这时候应用程序窗口就应该丢弃当前帧,因此就将参数info指向的TreeInfo对象的成员变量canDrawThisFrame的值设置为false。

接下来我们继续分析RenderNode类的成员函数prepareTree的实现,以便可以了解对应用程序窗口的各个View的Display List的同步过程,如下所示:

void RenderNode::prepareTree(TreeInfo& info) {
        ......

        prepareTreeImpl(info);
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

RenderNode类的成员函数prepareTree调用另外一个成员函数prepareTreeImpl来同步当前正在处理的Render Node的Display List等信息,后者的实现如下所示:

void RenderNode::prepareTreeImpl(TreeInfo& info) {
        ......

        if (info.mode == TreeInfo::MODE_FULL) {
            pushStagingPropertiesChanges(info);
        }
        uint32_t animatorDirtyMask = 0;
        if (CC_LIKELY(info.runAnimations)) {
            animatorDirtyMask = mAnimatorManager.animate(info);
        }
        ......
        if (info.mode == TreeInfo::MODE_FULL) {
            pushStagingDisplayListChanges(info);
        }
        prepareSubTree(info, mDisplayListData);
        pushLayerUpdate(info);

        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

从前面分析的DrawFrameTask类的成员函数run可以知道,参数info指向的TreeInfo对象的成员变量mode的值等于TreeInfo::MODE_FULL,这意味着RenderNode类的成员函数prepareTreeImpl执行在同步模式中,这时候它将会执行以下五个操作:

1. 调用成员函数pushStagingPropertiesChanges同步当前正在处理的Render Node的Property。

2. 在参数info指向的TreeInfo对象的成员变量runAnitmations的值等于true的前提下,调用成员变量mAnimatorManager指向的一个AnimatorManager对象的成员函数animate执行动画相关的操作。

3. 调用成员函数pushStagingDisplayListChanges同步当前正在处理的Render Node的Display List。

4. 调用成员函数prepareSubTree同步当前正在处理的Render Node的Display List引用的Bitmap,以及当前正在处理的Render Node的子Render Node的Display List等信息。

5. 调用成员函数pushLayerUpdate检查当前正在处理的Render Node是否设置了Layer。如果设置了的话,就对这些Layer进行处理。

其中,第2个操作是与动画显示相关的,我们在接下来的一篇文章再详细分析。

与第1个操作相关的函数是RenderNode类的成员函数pushStagingPropertiesChanges,它的实现如下所示:

void RenderNode::pushStagingPropertiesChanges(TreeInfo& info) {
        ......

        if (mDirtyPropertyFields) {
            mDirtyPropertyFields = 0;
            ......
            mProperties = mStagingProperties;
            ......
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

前面提到,当RenderNode类的成员变量mDirtyPropertyFields的值不等于0时,就表明Main Thread维护的Render Node的Property发生了变化,因此就需要将它同步到Render Thread去,也就是将成员变量mStagingProperties描述的RenderProperties对象转移到成员变量mProperties去。

与第3个操作相关的函数是RenderNode类的成员函数pushStagingDisplayListChanges,它的实现如下所示:

void RenderNode::pushStagingDisplayListChanges(TreeInfo& info) {
        if (mNeedsDisplayListDataSync) {
            mNeedsDisplayListDataSync = false;
            ......
            deleteDisplayListData();
            mDisplayListData = mStagingDisplayListData;
            mStagingDisplayListData = NULL;
            if (mDisplayListData) {
                for (size_t i = 0; i < mDisplayListData->functors.size(); i++) {
                    (*mDisplayListData->functors[i])(DrawGlInfo::kModeSync, NULL);
                }
            }
            ......
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

前面提到,当RenderNode类的成员变量mNeedsDisplayListDataSync的值等于true时,就表明Main Thread维护的Render Node的Display List发生了变化,因此就需要将它同步到Render Thread去,也就是将成员变量mStagingDisplayListData描述的DisplayListData对象转移到成员变量mDisplayListData去。

在将成员变量mStagingDisplayListData描述的DisplayListData对象转移到成员变量mDisplayListData去之前,首先会调用成员函数deleteDisplayListData删除成员变量mDisplayListData原先描述的DisplayListData对象。

记录在Display List Data的绘制命令除了是一些普通的DrawOp之外,还可能是一些函数指针,这些函数指针保存在Display List Data的成员变量functors描述的一个Vector中。这些函数指针是做什么用的呢?有些绘制命令很复杂,是不能通过一个简单的DrawOp来描述的,例如它是由一系列简单的绘制命令以复杂方式组合在一起形成的。对于这些复杂的绘制命令,我们就可以通过一个函数指针来描述。当Render Thread渲染应用程序窗口的Display List遇到这些函数指针时,就会调用这些函数指针指向的函数,这样这些函数就可以在其内部实现复杂的绘制命令,或者说是完成自定义的绘制命令。

这些函数指针在应用程序窗口的Display List的渲染过程中,会被调用两次。第一次调用时,第一个参数指定为DrawGlInfo::kModeSync,表示这时候它可以执行一些同步相关的操作。第二次调用时,第二个参数指定为DrawGlInfo::kModeDraw,表示这时候可以执行一些与渲染相关的操作。

此外,我们还可以通过Java层的ThreadedRenderer类的静态成员函数invokeFunctor将一个函数指定在Render Thread执行。例如,我们希望在应用程序进程中执行一些Open GL相关的操作时,就可以将这些操作封装在一个函数中,并且将该函数的地址封装成一个Task发送到Render Thread的Task Queue中。当这个Task被Render Thread处理的时候,封装在这个Task里面的函数就会被执行。这时候传递给这些函数的第一个参数就为DrawGlInfo::kModeProcess或者DrawGlInfo::kModeProcessNoContext。其中,DrawGlInfo::kModeProcess表示Render Thread已经初好了Open GL环境,而DrawGlInfo::kModeProcessNoContext表示Render Thread还没有初始化Open GL环境。

将函数指针记录Display List中交给Main Thread和Render Thread执行以及将函数指针封装成Task交给Render Thread执行的设计主要是为了实现WebView功能的。Android系统从4.4开始,通过Chromium来实现WebView的功能。Chromium有一套非常复杂的网页渲染机制,当它通过WebView嵌入在应用程序进程执行时,就会需要利用Render Thread可以执行Open GL操作的能力来完成它自己的功能。由这些网页渲染操作很复杂,因此就最好是通过函数来描述,这样就产生了能够将函数指定在Render Thread执行的需求。以后如果有机会分析WebView然Chromium版实现,我们就会看到这一套机制是如何运行的。

回到RenderNode类的成员函数prepareTree中,与第4个操作相关的函数是RenderNode类的成员函数prepareSubTree,它的实现如下所示:

void RenderNode::prepareSubTree(TreeInfo& info, DisplayListData* subtree) {
        if (subtree) {
            TextureCache& cache = Caches::getInstance().textureCache;
            ......
            if (subtree->ownedBitmapResources.size()) {
                info.prepareTextures = false;
            }
            for (size_t i = 0; info.prepareTextures && i < subtree->bitmapResources.size(); i++) {
                info.prepareTextures = cache.prefetchAndMarkInUse(subtree->bitmapResources[i]);
            }
            for (size_t i = 0; i < subtree->children().size(); i++) {
                DrawRenderNodeOp* op = subtree->children()[i];
                RenderNode* childNode = op->mRenderNode;
                ......
                childNode->prepareTreeImpl(info);
                .....
            }
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

前面提到,Display List引用的Bitmap保存在它的成员变量ownedBitmapResources和bitmapResources的两个Vector中。其中,保存在Display List的成员变量ownedBitmapResources中的Bitmap的底层储存是由应用程序提供和管理的。这意味着很难维护该底层储存在Main Thread和Render Thread的一致性。例如,有可能应用程序自行修改了该底层储存的内容,但是又没有通知Render Thread进行同步。因此,当存在这样的Bitmap时,就不允许Render Thread在渲染完成应用程序窗口的一帧之前唤醒Main Thread,就是为了防止Main Thread会修改上述Bitmap的底层储存。为了达到这个目的,这时候就需要将参数info指向的一个TreeInfo对象的成员变量prepareTextures的值设置为false。

另一方面,保存在Display List的成员变量bitmapResources中的Bitmap的底层储存不是由应用程序提供和管理的,因此就能够保证它不会被随意修改而又不通知Render Thread进行同步。对于这些Bitmap,就可以将它们作为Open GL纹理上传到GPU去。这就相当于是将Bitmap从Main Thread同步到Render Thread中,因为Render Thread就通过已经上传到GPU的Open GL纹理来使用这些Bitmap。能够执行这样的同步操作的前提是Display List的成员变量ownedBitmapResources描述的Vector为空。因为当Display List的成员变量ownedBitmapResources描述的Vector不为空时,Main Thread和Render Thread在渲染应用程序窗口的一帧时是完全同步的,因此就没有必要将Bitmap从Main Thread同步到Render Thread去。

此外,对于保存在Display List的成员变量bitmapResources中的Bitmap,由于内存大小的限制,因此就不是所有的这些Bitmap都是能够作为Open GL纹理上传到GPU去的。一旦某一个Bitmap不能作为Open GL纹理上传到GPU去,那么也是需要完全同步Main Thread和Render Thread渲染应用程序窗口的一帧的。这时候就需要将参数info指向的一个TreeInfo对象的成员变量prepareTextures的值设置为false。

同步完成当前正在处理的Render Node的Display List引用的Bitmap之后,接下来RenderNode类的成员函数prepareSubTree就调用前面分析过的成员函数prepareTreeImpl来同步当前在处理的Render Node的子Render Node的Display List、Property和Display List引用的Bitmap等信息。这个过程是一直归递执行下去,直到应用程序窗口视图结构中的每一个Render Node的isplay List、Property和Display List引用的Bitmap等信息都从Main Thread同步到Render Thread为止。

上面提到的将Bitmap封装成Open GL纹理上传到GPU是通过调用TextureCache类的成员函数prefetchAndMarkInUse来实现的,如下所示:

bool TextureCache::prefetchAndMarkInUse(const SkBitmap* bitmap) {
        Texture* texture = getCachedTexture(bitmap);
        if (texture) {
            texture->isInUse = true;
        }
        return texture;
    }

这个函数定义在文件frameworks/base/libs/hwui/TextureCache.cpp中。

TextureCache类的成员函数prefetchAndMarkInUse调用另外一个成员函数getCachedTexture将参数bitmap描述的Bitmap封装成Open Gl纹理上传到GPU中。如果能够上传成功,那么就可以获得一个Texture对象。TextureCache类的成员函数prefetchAndMarkInUse在将这个Texture对象返回给调用者之前,需要将它的成员变量isInUse设置为true,表示该Texture对象正在使用当中。

TextureCache类的成员函数getCachedTexture的实现如下所示:

Texture* TextureCache::getCachedTexture(const SkBitmap* bitmap) {
        Texture* texture = mCache.get(bitmap->pixelRef());

        if (!texture) {
            if (!canMakeTextureFromBitmap(bitmap)) {
                return NULL;
            }

            const uint32_t size = bitmap->rowBytes() * bitmap->height();
            bool canCache = size < mMaxSize;
            // Don't even try to cache a bitmap that's bigger than the cache
            while (canCache && mSize + size > mMaxSize) {
                Texture* oldest = mCache.peekOldestValue();
                if (oldest && !oldest->isInUse) {
                    mCache.removeOldest();
                } else {
                    canCache = false;
                }
            }

            if (canCache) {
                texture = new Texture();
                texture->bitmapSize = size;
                generateTexture(bitmap, texture, false);

                mSize += size;
                ......
                mCache.put(bitmap->pixelRef(), texture);
            }
        } else if (!texture->isInUse && bitmap->getGenerationID() != texture->generation) {
            // Texture was in the cache but is dirty, re-upload
            // TODO: Re-adjust the cache size if the bitmap's dimensions have changed
            generateTexture(bitmap, texture, true);
        }

        return texture;
    }

这个函数定义在文件frameworks/base/libs/hwui/TextureCache.cpp中。

每一个Bitmap作为Open GL纹理上传到GPU后,都会为其创建一个Texture对象。这些Texture对象就保存在TextureCache类通过成员变量mCache指向的一个LruCache中。因此,当不能够在该LruCache中找到参数bitmap描述的Bitmap对应的Texture对象时,就说明该Bitmap还未作为Open GL纹理上传到过GPU中,因此接下来就需要将它作为Open GL纹理上传到GPU去。

但是参数bitmap描述的Bitmap却不一定能够成功作为Open GL纹理上传到GPU去,有两个原因:

1. Bitmap太大,超出预先设定的最大Open GL纹理的大小。这种情况通过调用TextureCache类的成员函数canMakeTextureFromBitmap进行判断。

2. 已经作为Open GL纹理上传到GPU的Bitmap太多,超出预先设定的最多可以上传到GPU的大小。

在第2种情况下,这时候TextureCache类的成员函数getCachedTexture会尝试删掉那些最早上传到GPU的现在还不处于使用状态的Open GL纹理,直到能满足将参数bitmap描述的Bitmap作为Open GL纹理上传到GPU为止。

一旦确定能够将参数bitmap描述的Bitmap作为Open GL纹理上传到GPU,那么就会调用TextureCache类的成员函数generateTexture执行具体的操作,并且创建为其创建一个Texture对象保存在成员变量mCache指向的一个LruCache中。

另一方面,如果参数bitmap描述的Bitmap之前已经作为Open GL纹理上传到过GPU中,由于现在它的内容可能已经发生了变化,因此也需要调用TextureCache类的成员函数generateTexture执行重新上传的操作。

回到RenderNode类的成员函数prepareTree中,与第5个操作相关的函数是RenderNode类的成员函数pushLayerUpdate,它的实现如下所示:

void RenderNode::pushLayerUpdate(TreeInfo& info) {
        LayerType layerType = properties().layerProperties().type();
        ......
        if (CC_LIKELY(layerType != kLayerTypeRenderLayer) || CC_UNLIKELY(!isRenderable())) {
            if (CC_UNLIKELY(mLayer)) {
                LayerRenderer::destroyLayer(mLayer);
                mLayer = NULL;
            }
            return;
        }

        ......

        if (!mLayer) {
            mLayer = LayerRenderer::createRenderLayer(info.renderState, getWidth(), getHeight());
            ......
        } else if (mLayer->layer.getWidth() != getWidth() || mLayer->layer.getHeight() != getHeight()) {
            if (!LayerRenderer::resizeLayer(mLayer, getWidth(), getHeight())) {
                ......
            }
            ......
        }

        SkRect dirty;
        info.damageAccumulator->peekAtDirty(&dirty);

        ......

        if (dirty.intersect(0, 0, getWidth(), getHeight())) {
            ......
            mLayer->updateDeferred(this, dirty.fLeft, dirty.fTop, dirty.fRight, dirty.fBottom);
        }

        ......

        if (info.renderer && mLayer->deferredUpdateScheduled) {
            info.renderer->pushLayerUpdate(mLayer);
        }

        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

在分析RenderNode类的成员函数pushLayerUpdate的实现之前,我们首先要理解什么情况下一个Render Node会被设置为一个Layer。

当一个View的类型被设置为LAYER_TYPE_HARDWARE时,如果它的成员函数buildLayer被调用,那么与它关联的Render Node就会被设置为一个Layer。这意味着该View将会作为一个FBO(Frame Buffer Object)进行渲染。这样做主要是为了更流畅地显示一个View的动画。这一点我们在前面Android应用程序UI硬件加速渲染技术简要介绍和学习计划一文中曾经提到。

有了这个背景知识之后,我们就可以分析RenderNode类的成员函数pushLayerUpdate的实现了。

RenderNode类的成员函数pushLayerUpdate首先是判断当前正在处理的Render Node的Layer Type是否为kLayerTypeRenderLayer,也就是判断与它关联的View的类型是否设置为LAYER_TYPE_HARDWARE。如果不是,那么就不用往下执行了,因为这种情况当前正在处理的Render Node不可能设置为一个Layer。

另一方面,如果当前正在处理的Render Node的Display List还没有创建或者是空的,那么RenderNode类的成员函数pushLayerUpdate也不用往下执行了,因为这种情况当前正在处理的Render Node是无需要渲染的。判断当前正在处理的Render Node的Display List有没有创建或者是不是空的,可以通过调用RenderNode类的成员函数isRenderable来实现。

在上述两种情况下,RenderNode类的成员函数pushLayerUpdate在返回之前,会判断一下之前是否已经为当前正在处理的Render Node创建过Layer。如果创建过,那么就会调用LayerRenderer类的静态成员函数destroyLayer来销毁该Layer。

接下来就是当前正在处理的Render Node需要设置为一个Layer的情况了。如果当前正在处理的Render Node还没有设置过Layer,也就是它的成员变量mLayer的值等于NULL,那么就调用LayerRenderer类的静态成员函数createRenderLayer为它设置一个,也就是创建一个Layer对象,并且保存在它的成员变量mLayer中。

另一方面,如果当前正在处理的Render Node之前已经设置过Layer,但是该Layer的大小与当前正在处理的Render Node的大小不一致,那么就需要调用LayerRenderer类的静态成员函数resizeLayer调整廖Layer的大小。

再接下来是计算当前正在处理的Render Node是否在应用程序窗口当前要更新的脏区域中。如果在的话,那么就需要调用与它关联的Layer对象的成员函数updateDeferred来标记与它关联的Layer对象是需要进行更新处理的。

Layer类的成员函数updateDeferred的实现如下所示:

void Layer::updateDeferred(RenderNode* renderNode, int left, int top, int right, int bottom) {
        requireRenderer();
        this->renderNode = renderNode;
        const Rect r(left, top, right, bottom);
        dirtyRect.unionWith(r);
        deferredUpdateScheduled = true;
    }

这个函数定义在文件frameworks/base/libs/hwui/Layer.cpp中。

Layer类的成员函数updateDeferred首先是调用另外一个成员函数requireRenderer检查当前正在处理的Layer对象是否已经创建有一个LayerRenderer对象了。这个LayerRenderer对象就是负责渲染当前正在处理的Layer对象的。如果还没有创建,那么就需要创建。如下所示:

void Layer::requireRenderer() {
        if (!renderer) {
            renderer = new LayerRenderer(renderState, this);
            ......
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/Layer.cpp中。

Layer类的成员函数updateDeferred接下来再记录当前正在处理的Layer对象关联的Render Node,并且更新它的脏区域,最后将成员变量deferredUpdateScheduled设置为true,表示当前正在处理的Layer对象后面还需要执行真正的更新操作,而这里只是记录了相关的更新状态信息而已。

这一步执行完成后,回到RenderNode类的成员函数pushLayerUpdate中,这时候成员变量mLayer指向的Layer对象的成员变量deferredUpdateScheduled的值是等于true的,并且参数info指向的一个TreeInfo对象的成员变量renderer的值不为空,它指向了一个OpenGLRenderer对象,因此接下来就会调用该OpenGLRenderer对象的成员函数pushLayerUpdate来将成员变量mLayer指向的Layer对象记录在内部的一个待更新的Layer列表中,如下所示:

void OpenGLRenderer::pushLayerUpdate(Layer* layer) {
        if (layer) {
            ......
            for (int i = mLayerUpdates.size() - 1; i >= 0; i--) {
                if (mLayerUpdates.itemAt(i) == layer) {
                    return;
                }
            }
            mLayerUpdates.push_back(layer);
            ......
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp中。

OpenGLRenderer类将需要进行更新处理的Layer对象保存在成员变量mLayerUpdates描述的一个Vector中,保存在这个Vector中的Layer对象在渲染应用程序窗口的Display List的时候,就是需要进行更新处理的。

这一步执行完成之后,应用程序窗口的Display List等信息就从Main Thread同步到Render Thread了,回到DrawFrameTask类的成员函数run中,接下来就可以调用CanvasContext类的成员函数draw渲染应用程序窗口的Display List了。

CanvasContext类的成员函数draw的实现如下所示:

void CanvasContext::draw() {
        ......

        SkRect dirty;
        mDamageAccumulator.finish(&dirty);

        ......

        status_t status;
        if (!dirty.isEmpty()) {
            status = mCanvas->prepareDirty(dirty.fLeft, dirty.fTop,
                    dirty.fRight, dirty.fBottom, mOpaque);
        } else {
            status = mCanvas->prepare(mOpaque);
        }

        Rect outBounds;
        status |= mCanvas->drawRenderNode(mRootRenderNode.get(), outBounds);

        ......

        mCanvas->finish();

        ......

        if (status & DrawGlInfo::kStatusDrew) {
            swapBuffers();
        }

        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp中。

CanvasContext类的成员函数draw的执行过程如下所示:

1. 获得应用程序窗口要更新的脏区域之后,调用成员变量mCanvas指向的一个OpenGLRenderer对象的成员函数prepareDirty或者prepare执行一些初始化工作,取决于脏区域是不是空的。

2, 调用成员变量mCanvas指向的一个OpenGLRenderer对象的成员函数drawRenderNode渲染成员变量mRootRenderNode描述的应用程序窗口的Root Render Node的Display List。

  1. 调用成员变量mCanvas指向的一个OpenGLRenderer对象的成员函数finish执行一些清理工作。在这一步中,如果开启了OverDraw,那么还会在应用程序窗口的上面绘制一些描述OverDraw的颜色块。

4. 调用另外一个成员函数swapBuffers将前面已经绘制好的图形缓冲区提交给Surface Flinger合成和显示。

在上述四个步骤中,最重要的是第1步和第2步,因此接下来我们就分别对它们进行分析。

我们假设第1步得到的应用程序窗口要更新的脏区域不为空,因此这一步执行的就是OpenGLRenderer类的成员函数prepareDirty,它的实现如下所示:

status_t OpenGLRenderer::prepareDirty(float left, float top,
            float right, float bottom, bool opaque) {

        setupFrameState(left, top, right, bottom, opaque);

        ......
        if (currentSnapshot()->fbo == 0) {
            ......
            updateLayers();
        } else {
            return startFrame();
        }

        return DrawGlInfo::kStatusDone;
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp中。

OpenGLRenderer类的成员函数prepareDirty首先是调用另外一个成员函数setupFrameState设置帧状态,它的实现如下所示:

void OpenGLRenderer::setupFrameState(float left, float top,
            float right, float bottom, bool opaque) {
        ......
        initializeSaveStack(left, top, right, bottom, mLightCenter);
        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp中。

OpenGLRenderer类的成员函数setupFrameState最主要的操作是调用另外一个成员函数initializeSaveStack初始化一个Save Stack。

OpenGLRenderer类的成员函数initializeSaveStack是从父类StatefulBaseRenderer继承下来的,它的实现如下所示:

void StatefulBaseRenderer::initializeSaveStack(float clipLeft, float clipTop,
            float clipRight, float clipBottom, const Vector3& lightCenter) {
        mSnapshot = new Snapshot(mFirstSnapshot,
                SkCanvas::kMatrix_SaveFlag | SkCanvas::kClip_SaveFlag);
        mSnapshot->setClip(clipLeft, clipTop, clipRight, clipBottom);
        mSnapshot->fbo = getTargetFbo();
        mSnapshot->setRelativeLightCenter(lightCenter);
        mSaveCount = 1;
    }

这个函数定义在文件frameworks/base/libs/hwui/StatefulBaseRenderer.cpp中。

StatefulBaseRenderer类内部维护有一个Save Stack。这个Save Stack由一系列的Snapshot组成,其中最顶端的Snapshot,也就是当前使用的Snapshot,保存成员变量mSnapshot中。每一个Snapshot都是用来描述当前的一个渲染状态,例如偏移位置、裁剪区间、灯光位置等。

Snapshot有一个重要的成员变量fbo。当它的值大于0的时候,就表示要将UI渲染在一个FBO上。涉及到渲染UI的Renderer有两个,一个是LayerRenderer,另外一个是OpenGLRenderer。从前面的分析可以知道,LayerRenderer主要负责用来渲染类型为LAYER_TYPE_HARDWARE的View。这些View将会渲染在一个FBO上。OpenGLRenderer负责渲染应用程序窗口的Display List。这个Display List是直接渲染在Frame Buffer上的,也就是直接渲染在从Surface Flinger请求回来的图形缓冲区上。

LayerRenderer类继承于OpenGLRenderer类,OpenGLRenderer类又继承于StatefulBaseRenderer类。StatefulBaseRenderer类的成员函数getTargetFbo是一个虚函数,LayerRenderer类和OpenGLRenderer类都重写了它。

其中,OpenGLRenderer类的成员函数getTargetFbo的实现如下所示:

class OpenGLRenderer : public StatefulBaseRenderer {
        ......

        virtual GLuint getTargetFbo() const {
            return 0;
        }

        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.h。

从这里就可以看到,OpenGLRenderer类的成员函数getTargetFbo的返回值总是0,也就是说,OpenGLRenderer类总是直接将UI渲染在Frame Buffer上。

LayerRenderer类的成员函数getTargetFbo的实现如下所示:

GLuint LayerRenderer::getTargetFbo() const {
        return mLayer->getFbo();
    }

这个函数定义在文件frameworks/base/libs/hwui/LayerRenderer.cpp。

LayerRenderer类的成员变量mLayer描述的是一个Layer对象。这个Layer对象关联有一个FBO对象,可以通过调用它的成员函数getFbo获得。获得FBO被LayerRenderer类的成员函数getTargetFbo返回给调用者。

回到前面分析的StatefulBaseRenderer类的成员函数initializeSaveStack中,从前面的调用过程可以知道,当前正在处理的是一个OpenGLRenderer对象,因此,成员变量mSnapshot指向的一个Snapshot对象的成员变量fbo的值等于0。

StatefulBaseRenderer类的成员函数initializeSaveStack执行完成后,回到OpenGLRenderer类的成员函数prepareDirty中,它调用另外一个成员函数currentSnapshot获得的就是父类StatefulBaseRenderer的成员变量mSnapshot描述的Snapshot对象。这个Snapshot对象的成员变量fbo的值是等于0的,因此接下来就会继续调用OpenGLRenderer类的成员函数updateLayers更新那些待更析的Layer对象。

另一方面,如果当前正在处理的是一个LayerRenderer对象,那么OpenGLRenderer类的成员函数prepareDirty调用的是另外一个成员函数startFrame执行一些Open GL初始化工作,例如设置View Port等基本操作。

由于当前正在处理的是一个OpenGLRenderer对象,因此我们接下来继续分析OpenGLRenderer类的成员函数updateLayers的实现,如下所示:

void OpenGLRenderer::updateLayers() {
        ......
        int count = mLayerUpdates.size();
        if (count > 0) {
            ......

            for (int i = 0; i < count; i++) {
                Layer* layer = mLayerUpdates.itemAt(i);
                updateLayer(layer, false);
                ......
            }

            ......
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp中。

前面提到,OpenGLRenderer类的成员变量mLayerUpdates描述的一个Vector保存的都是那些需要更新的Layer对象。每一个Layer对象的更新是通过调用OpenGLRenderer类的另外一个成员函数updateLayer实现的。

OpenGLRenderer类的成员函数updateLayer的实现如下所示:

bool OpenGLRenderer::updateLayer(Layer* layer, bool inFrame) {
        if (layer->deferredUpdateScheduled && layer->renderer
                && layer->renderNode.get() && layer->renderNode->isRenderable()) {
            ......

            if (CC_UNLIKELY(inFrame || mCaches.drawDeferDisabled)) {
                layer->render(*this);
            } else {
                layer->defer(*this);
            }

            ......

            return true;
        }

        return false;
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp中。

从前面的分析可以知道,保存在OpenGLRenderer类的成员变量mLayerUpdates描述的一个Vector中的Layer对象,它的成员变量deferredUpdateScheduled的值是等于true的。当这些Layer对象设置有自己的Renderer,以及关联有Render Node,并且这个Render Node是可渲染的时候,就会调用它们的成员函数render进行直接更新,或者调用它们的成员函数defer进行延迟更新。

当参数inFrame的值等于true,或者OpenGLRenderer类的成员变量mCaches指向的一个Caches对象的成员变量drawDeferDisabled的值等于true时,就会调用Layer类的成员函数render进行直接更新。其中,Caches类的成员变量drawDeferDisabled用来描述是否要对Open GL操作进行合并。当它的值等于true时,就表示不要合并;否则就表示需要合并。关于Open GL操作的合并,我们在前面Android应用程序UI硬件加速渲染的预加载资源地图集服务(Asset Atlas Service)分析一文中有提到。

我们假设Open GL操作需要进行合并,即OpenGLRenderer类的成员变量mCaches指向的一个Caches对象的成员变量drawDeferDisabled等于false。从前面的调用过程可以知道,参数inFrame的值也是等于false,因此接下来OpenGLRenderer类的成员函数updateLayer就会调用Layer类的成员函数defer对参数layer描述的一个Layer对象进行更新。

Layer类的成员函数defer的实现如下所示:

void Layer::defer(const OpenGLRenderer& rootRenderer) {
        ......

        delete deferredList;
        deferredList = new DeferredDisplayList(dirtyRect);

        DeferStateStruct deferredState(*deferredList, *renderer,
                RenderNode::kReplayFlag_ClipChildren);

        ......

        renderNode->computeOrdering();
        renderNode->defer(deferredState, 0);

        deferredUpdateScheduled = false;
    }

这个函数定义在文件frameworks/base/libs/hwui/Layer.cpp中。

Layer类的成员函数defer的主要工作是创建一个DeferredDisplayList对象,保存在成员变量deferredList中,然后再将该DeferredDisplayList对象封装成一个DeferStateStruct对象中。同时被封装成这个DeferStateStruct对象还有Layer类的成员变量renderer描述的一个LayerRenderer对象。

Layer类的成员变量renderNode描述的是当前正在处理的Layer对象所关联的Render Node。Layer类的成员函数defer接下来就分别调用这个Render Node的成员函数computeOrdering和defer。其中,调用Render Node的成员函数defer的时候,会将前面创建的DeferStateStruct对象作为参数传递进去。

调用一个Render Node的成员函数computeOrdering,是为了找出那些需要投影到它的Background进行渲染的子Render Node。这些子Render Node称为Projected Node,如下所示:

图3 Projection Nodes

Projection Node的解释可以参考前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文,RenderNode类的成员函数computeOrdering的实现我们也留给读者自己去分析。最终如果一个Rende Node具有Projected Node,那么这些Projected Node就会保存在它的成员变量mProjectedNodes中。

回到前面分析的Layer类的成员函数defer中,接下来它要调用的是RenderNode类的成员函数defer,它的实现如下所示:

void RenderNode::defer(DeferStateStruct& deferStruct, const int level) {
        DeferOperationHandler handler(deferStruct, level);
        issueOperations<DeferOperationHandler>(deferStruct.mRenderer, handler);
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

RenderNode类的成员函数defer调用另外一个成员函数issueOperations对当前正在处理的Render Node的Display List的绘制命令进行处理,具体的处理是由第二个参数指定的一个DeferOperationHandler对象的操作符重载函数()执行的,如下所示:

class DeferOperationHandler {
    public:
        DeferOperationHandler(DeferStateStruct& deferStruct, int level)
            : mDeferStruct(deferStruct), mLevel(level) {}
        inline void operator()(DisplayListOp* operation, int saveCount, bool clipToBounds) {
            operation->defer(mDeferStruct, saveCount, mLevel, clipToBounds);
        }
        ......
    private:
        DeferStateStruct& mDeferStruct;
        const int mLevel;
    };

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

参数operation指向的就是当前正在处理的Render Node的Display List的一个绘制命令,这里调用它的成员函数defer执行我们在前面Android应用程序UI硬件加速渲染的预加载资源地图集服务(Asset Atlas Service)分析一文提到的绘制命令合并操作。

接下来,我们首先分析RenderNode类的成员函数issueOperations,然后再分析一个典型的DisplayListOp的成员函数defer的实现。

RenderNode类的成员函数issueOperations的实现如下所示:

template <class T>
    void RenderNode::issueOperations(OpenGLRenderer& renderer, T& handler) {
        ......

        const bool drawLayer = (mLayer && (&renderer != mLayer->renderer));
        ......

        bool quickRejected = properties().getClipToBounds()
                && renderer.quickRejectConservative(0, 0, properties().getWidth(), properties().getHeight());
        if (!quickRejected) {
            ......

            if (drawLayer) {
                handler(new (alloc) DrawLayerOp(mLayer, 0, 0),
                        renderer.getSaveCount() - 1, properties().getClipToBounds());
            } else {
                ......
                for (size_t chunkIndex = 0; chunkIndex < mDisplayListData->getChunks().size(); chunkIndex++) {
                    const DisplayListData::Chunk& chunk = mDisplayListData->getChunks()[chunkIndex];

                    Vector<ZDrawRenderNodeOpPair> zTranslatedNodes;
                    buildZSortedChildList(chunk, zTranslatedNodes);

                    issueOperationsOf3dChildren(kNegativeZChildren,
                            initialTransform, zTranslatedNodes, renderer, handler);


                    for (int opIndex = chunk.beginOpIndex; opIndex < chunk.endOpIndex; opIndex++) {
                        DisplayListOp *op = mDisplayListData->displayListOps[opIndex];
                        ......
                        handler(op, saveCountOffset, properties().getClipToBounds());

                        if (CC_UNLIKELY(!mProjectedNodes.isEmpty() && opIndex == projectionReceiveIndex)) {
                            issueOperationsOfProjectedChildren(renderer, handler);
                        }
                    }

                    issueOperationsOf3dChildren(kPositiveZChildren,
                            initialTransform, zTranslatedNodes, renderer, handler);
                }
            }
        }

        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

RenderNode类的成员函数issueOperations执行的操作就是对当前正在处理的Render Node的Display List的绘制命令进行重排。为什么需要重排呢?在前面Android应用程序UI硬件加速渲染的Display List构建过程分析一文中,我们分析Display List的结构,如图4所示:

图4 Display List

Display List的绘制命令以Chunk为单位进行保存。每一个Chunk通过begin op index和end op index描述的一系列Display List Op对应的就是一个Render Node包含绘制命令。此外,每一个Chunk还通过begin child index和end child index描述的一系列Draw Render Node Op对应的就是一个Render Node的子Render Node相关的绘制命令。这些子Render Node的Z轴位置相对父Render Node有可能是负的,也有可能是正的。对于Z轴位置为负的子Render Node的绘制命令,它们应该先于父Render Node的绘制命令执行。而对于Z轴位置为正的子Render Node的绘制命令,它们应该后于父Render Node的绘制命令执行。因此,每一个Chunk描述的绘制命令的排列顺序就如下所示:

  1. Z轴位置为负的子Render Node的绘制命令。

  2. 父Render Node的绘制命令。

  3. Z轴位置为正的子Render Node的绘制命令。

此外,如果一个Render Node的的某一个Display List Op恰好是一个图3所示的Projection Receiver,那么还需要Render Node的所有Projected Node的绘制命令排列在该Projection Receiver的后面。

如果一个Render Node设置了Layer,那么就意味着这个Render Node的所有绘制命令都是作为一个整体进行执行的。也就是说,对于设置了Layer的Render Node,我们首先需要将它的Display List的所有绘制命令合成一个整体的绘制命令,目的就是为了得到一个FBO,然后渲染这个FBO就可以得一个Render Node的UI。

对于设置了Layer的Render Node来说,它的成员函数defer会被调用两次。第一次调用的时候,就是为了将它的Display List的所有绘制命令合成一个FBO。第二次调用的时候,就是为了将合成后的FBO渲染到应用程序窗口的UI上。

这时候RenderNode类的成员函数defer属于第一次执行。那么RenderNode类的成员函数issueOperations是如何区分它是被第一次调用的成员函数defer调用,还是第二次调用的成员函数defer调用呢?主要是通过比较参数renderer描述的OpenGLRender对象和成员变量mLayer指向的一个Layer对象的成员变量renderer描述折一个OpenGLRender对象来区分。如果这两个OpenGLRenderer对象是同一个,就意味着是被第一次调用的成员函数defer调用;否则的话,就是被第二次调用的成员函数defer调用。

当RenderNode类的成员函数issueOperations是被第二次调用的成员函数defer调用的时候,该Render Node的Display List的所有绘制命令已经被合成在一个FBO里面,并且这个FBO是由它所关联的Layer对象维护的,因此这时候只需要将该Layer对象封装成一个DrawLayerOp交给参数handler描述的一个DeferOperationHandler对象处理即可。

我们再确认一下现在RenderNode类的成员函数issueOperations是被第一次调用的成员函数defer调用。它的参数renderer指向的一个OpenGLRenderer对象是从Layer类的成员函数defer传递进行的,而Layer类的成员函数defer传递进行的这个OpenGLRenderer对象就正好是与Render Node关联的Layer对象的成员变量renderer描述折一个OpenGLRender对象,因此它们就是相同的。从前面的分析可以知道,这个OpenGLRenderer对象的实际类型是LayerRenderer。

后面我们会看到,当Render Node的成员函数issueOperations是被第二次调用的成员函数defer调用的时候,它的参数renderer指向的一个OpenGLRenderer对象的实际类型就是OpenGLRenderer,它与当前正在处理的Render Node关联的Layer对象的成员变量描述折一个OpenGLRender对象不可能是相同的,因为后者的实际类型是LayerRenderer。

接下来我们就继续分析RenderNode类的成员函数issueOperations是被第一次调用的成员函数defer调用时的执行情况,这时候得到的本地变量drawLayer的值为false。

RenderNode类的成员函数issueOperations首先是判断当前正在处理的Render Node的占据的屏幕位置在应用程序窗口的当前帧中是否是可见的。如果不可见,那么得到的本地变量quickRejected的值就等于true。在这种情况下就不用做任何事情。

当本地变量quickRejected的值就等于false,并且本地变量drawLayer的值也等于false的时候,RenderNode类的成员函数issueOperations就对当前正在处理的Render Node的Display List的所有绘制命令按照我们上面描述的规则进行排序。

RenderNode类的成员函数issueOperations通过一个for循环对当前正在处理的Render Node的Display List的绘制命令按Chunk进行处理。对于每一个Chunk:

1. 调用成员函数buildZSortedChildList对其子Render Node相关的Draw Render Node Op按照Z轴位置从小到大的顺序排列在本地变量zTranslatedNodes描述的一个Vector中。

2. 调用成员函数issueOperationsOf3dChildren将Z轴位置为负的子Render Node相关的Draw Render Node Op交给参数handler描述的一个DeferOperationHandler对象处理。

3. 通过一个for循环依次将当前正在处理的Render Node相关的Display List Op交给参数handler描述的一个DeferOperationHandler对象处理。如果其中的某一个Display List Op是一个Projection Receiver,那么就继续调用成员函数issueOperationsOfProjectedChildren将当前正在处理的Render Node的Projected Node交给参数handler描述的一个DeferOperationHandler对象处理。

  1. 调用成员函数issueOperationsOf3dChildren将Z轴位置为正的子Render Node相关的Draw Render Node Op交给参数handler描述的一个DeferOperationHandler对象处理。

接下来我们继续分析RenderNode类的成员函数issueOperationsOf3dChildren和issueOperationsOfProjectedChildren的实现。

RenderNode类的成员函数issueOperationsOf3dChildren的实现如下所示:

template <class T>
    void RenderNode::issueOperationsOf3dChildren(ChildrenSelectMode mode,
            const Matrix4& initialTransform, const Vector<ZDrawRenderNodeOpPair>& zTranslatedNodes,
            OpenGLRenderer& renderer, T& handler) {
        const int size = zTranslatedNodes.size();
        ......

        const size_t nonNegativeIndex = findNonNegativeIndex(zTranslatedNodes);
        size_t drawIndex, shadowIndex, endIndex;
        if (mode == kNegativeZChildren) {
            drawIndex = 0;
            endIndex = nonNegativeIndex;
            shadowIndex = endIndex; // draw no shadows
        } else {
            drawIndex = nonNegativeIndex;
            endIndex = size;
            shadowIndex = drawIndex; // potentially draw shadow for each pos Z child
        }

        ......

        while (shadowIndex < endIndex || drawIndex < endIndex) {
           ......

            DrawRenderNodeOp* childOp = zTranslatedNodes[drawIndex].value;
            ......
            childOp->mSkipInOrderDraw = false; // this is horrible, I'm so sorry everyone
            handler(childOp, renderer.getSaveCount() - 1, properties().getClipToBounds());
            childOp->mSkipInOrderDraw = true;
            ......
            drawIndex++;
        }

        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

RenderNode类的成员函数issueOperationsOf3dChildren既用来处理Z轴位置为负的子Render Node相关的Draw Render Node Op,也用来处理Z轴位置为正的子Render Node相关的Draw Render Node Op,因此它就需要根据参数mode以及参数zTranslatedNodes描述的一个Vector中Z轴位置为非负的子Render Node相关的Draw Render Node Op的索引nonNegativeIndex来确定当前需要处理的子Render Node相关的Draw Render Node Op。

由于参数zTranslatedNodes描述的一个Vector中的Draw Render Node Op是按照它们对应的子Render Node的Z轴位置由小到大的顺序排列的,因此如果参数mode的值等于kNegativeZChildren,那么当前需要处理的Draw Render Node Op在参数zTranslatedNodes描述的一个Vector中的索引范围就为[0, nonNegativeIndex)。另一方面,如果参数mode的值等于kPositiveZChildren,,那么当前需要处理的Draw Render Node Op在参数zTranslatedNodes描述的一个Vector中的索引范围就为[nonNegativeIndex, size),其中,size为参数zTranslatedNodes描述的一个Vector的大小。

确定了要处理的Draw Render Node Op在参数zTranslatedNodes描述的一个Vector的范围之后,就可以通过一个while循环对它们进行处理了,处理的方式就将它们交给参数handler描述的一个DeferOperationHandler对象。

在将要处理的Draw Render Node Op交给参数handler描述的一个DeferOperationHandler对象处理之前,有一个小Hack,这些Draw Render Node Op的成员变量mSkipInOrderDraw的值设置为false,处理完成之后再恢复为true。这样做的目的是为了当前正在处理的Render Node以相同的方式递归处理其子Render Node的Display List的绘制命令。我们在后面将会看到这一点。

我们再来看RenderNode类的成员函数issueOperationsOfProjectedChildren的实现,如下所示:

template <class T>
    void RenderNode::issueOperationsOfProjectedChildren(OpenGLRenderer& renderer, T& handler) {
        ......

        // draw projected nodes
        for (size_t i = 0; i < mProjectedNodes.size(); i++) {
            DrawRenderNodeOp* childOp = mProjectedNodes[i];
            ......
            childOp->mSkipInOrderDraw = false; // this is horrible, I'm so sorry everyone
            handler(childOp, renderer.getSaveCount() - 1, properties().getClipToBounds());
            childOp->mSkipInOrderDraw = true; 
            ......
        }

        ......
    }

这个函数定义在文件frameworks/base/libs/hwui/RenderNode.cpp中。

RenderNode类的成员函数issueOperationsOfProjectedChildren主要就是将成员变量mProjectedNodes描述的一个Vector中的所有Draw Render Node Op都交给参数handler描述的一个DeferOperationHandler对象处理。其中,RenderNode类的成员变量mProjectedNodes描述的一个Vector应该包含哪些Projected Node就是在Layer类的成员函数defer中调用当前正在处理的Render Node的成员函数computeOrdering来计算得到的。

同样,在将要处理的Draw Render Node Op交给参数handler描述的一个DeferOperationHandler对象处理之前,这些Draw Render Node Op的成员变量mSkipInOrderDraw的值设置为false,处理完成之后再恢复为true。这样做的目的是为了当前正在处理的Render Node以相同的方式递归处理它的Projected Node的Display List的绘制命令。我们在后面将会看到这一点。

这一步执行完成之后,回到RenderNode类的成员函数issueOperations中,现在当前正在处理的Render Node的Display List的所有绘制命令都按照我们前面描述的顺序交给参数handler描述的一个DeferOperationHandler对象处理了,也就是调用该DeferOperationHandler对象的操作符重载函数()进行处理。以一个类型为DrawOp的Display List Op为例,DeferOperationHandler对象的操作符重载函数()会调用它的成员函数defer进行处理。

DrawOp类的成员函数defer的实现如下所示:

class DrawOp : public DisplayListOp {
        ......

        virtual void defer(DeferStateStruct& deferStruct, int saveCount, int level,
                bool useQuickReject) {
            ......

            deferStruct.mDeferredList.addDrawOp(deferStruct.mRenderer, this);
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DisplayListOp.h中。

DrawOp类的成员函数defer调用了参数deferStruct描述的一个DeferStateStruct对象的成员变量mDeferredList指向的一个DeferredDisplayList对象的成员函数addDrawOp检查当前正在处理的一个DrawOp是否可以与其它DrawOp进行合并,它的实现如下所示:

void DeferredDisplayList::addDrawOp(OpenGLRenderer& renderer, DrawOp* op) {
        /* 1: op calculates local bounds */
        DeferredDisplayState* const state = createState();
        if (op->getLocalBounds(state->mBounds)) {
            if (state->mBounds.isEmpty()) {
                .......
                return;
            }
        } else {
            state->mBounds.setEmpty();
        }

        /* 2: renderer calculates global bounds + stores state */
        if (renderer.storeDisplayState(*state, getDrawOpDeferFlags())) {
            ......
            return; // quick rejected
        }

        /* 3: ask op for defer info, given renderer state */
        DeferInfo deferInfo;
        op->onDefer(renderer, deferInfo, *state);

        // complex clip has a complex set of expectations on the renderer state - for now, avoid taking
        // the merge path in those cases
        deferInfo.mergeable &= !recordingComplexClip();
        deferInfo.opaqueOverBounds &= !recordingComplexClip() && mSaveStack.isEmpty();

        if (CC_LIKELY(mAvoidOverdraw) && mBatches.size() &&
                state->mClipSideFlags != kClipSide_ConservativeFull &&
                deferInfo.opaqueOverBounds && state->mBounds.contains(mBounds)) {
            // avoid overdraw by resetting drawing state + discarding drawing ops
            discardDrawingBatches(mBatches.size() - 1);
            ......
        }

        if (CC_UNLIKELY(renderer.getCaches().drawReorderDisabled)) {
            // TODO: elegant way to reuse batches?
            DrawBatch* b = new DrawBatch(deferInfo);
            b->add(op, state, deferInfo.opaqueOverBounds);
            mBatches.add(b);
            return;
        }

        // find the latest batch of the new op's type, and try to merge the new op into it
        DrawBatch* targetBatch = NULL;

        // insertion point of a new batch, will hopefully be immediately after similar batch
        // (eventually, should be similar shader)
        int insertBatchIndex = mBatches.size();
        if (!mBatches.isEmpty()) {
            if (state->mBounds.isEmpty()) {
                // don't know the bounds for op, so add to last batch and start from scratch on next op
                DrawBatch* b = new DrawBatch(deferInfo);
                b->add(op, state, deferInfo.opaqueOverBounds);
                mBatches.add(b);
                ......
                return;
            }

            if (deferInfo.mergeable) {
                // Try to merge with any existing batch with same mergeId.
                if (mMergingBatches[deferInfo.batchId].get(deferInfo.mergeId, targetBatch)) {
                    if (!((MergingDrawBatch*) targetBatch)->canMergeWith(op, state)) {
                        targetBatch = NULL;
                    }
                }
            } else {
                // join with similar, non-merging batch
                targetBatch = (DrawBatch*)mBatchLookup[deferInfo.batchId];
            }

            if (targetBatch || deferInfo.mergeable) {
                // iterate back toward target to see if anything drawn since should overlap the new op
                // if no target, merging ops still interate to find similar batch to insert after
                for (int i = mBatches.size() - 1; i >= mEarliestBatchIndex; i--) {
                    DrawBatch* overBatch = (DrawBatch*)mBatches[i];

                    if (overBatch == targetBatch) break;

                    // TODO: also consider shader shared between batch types
                    if (deferInfo.batchId == overBatch->getBatchId()) {
                        insertBatchIndex = i + 1;
                        if (!targetBatch) break; // found insert position, quit
                    }

                    if (overBatch->intersects(state->mBounds)) {
                        // NOTE: it may be possible to optimize for special cases where two operations
                        // of the same batch/paint could swap order, such as with a non-mergeable
                        // (clipped) and a mergeable text operation
                        targetBatch = NULL;
                        ......
                        break;
                    }
                }
            }
        }

        if (!targetBatch) {
            if (deferInfo.mergeable) {
                targetBatch = new MergingDrawBatch(deferInfo,
                        renderer.getViewportWidth(), renderer.getViewportHeight());
                mMergingBatches[deferInfo.batchId].put(deferInfo.mergeId, targetBatch);
            } else {
                targetBatch = new DrawBatch(deferInfo);
                mBatchLookup[deferInfo.batchId] = targetBatch;
            }

            ......
            mBatches.insertAt(targetBatch, insertBatchIndex);
        }

        targetBatch->add(op, state, deferInfo.opaqueOverBounds);
    }

这个函数定义在文件frameworks/base/libs/hwui/DeferredDisplayList.cpp中。

在分析DeferredDisplayList类的成员函数addDrawOp的实现之前,我们首先要了解它的三个成员变量mBatches、mBatchLookup和mMergingBatches,如下所示:

class DeferredDisplayList {
        friend class DeferStateStruct; // used to give access to allocator
    public:
        ......

        enum OpBatchId {
            kOpBatch_None = 0, // Don't batch
            kOpBatch_Bitmap,
            kOpBatch_Patch,
            kOpBatch_AlphaVertices,
            kOpBatch_Vertices,
            kOpBatch_AlphaMaskTexture,
            kOpBatch_Text,
            kOpBatch_ColorText,

            kOpBatch_Count, // Add other batch ids before this
        };

        ......
    private:
        ......

        Vector<Batch*> mBatches;

        // Maps batch ids to the most recent *non-merging* batch of that id
        Batch* mBatchLookup[kOpBatch_Count];
        ......

        /**
         * Maps the mergeid_t returned by an op's getMergeId() to the most recently seen
         * MergingDrawBatch of that id. These ids are unique per draw type and guaranteed to not
         * collide, which avoids the need to resolve mergeid collisions.
         */
        TinyHashMap<mergeid_t, DrawBatch*> mMergingBatches[kOpBatch_Count];

        ......
    };

这三个成员变量定义在文件frameworks/base/libs/hwui/DeferredDisplayList.h中。

可以批量进行处理的绘制命令,也就是DrawOp,放在同一个Batch中,这些Batch按照绘制先后顺序保存在DeferredDisplayList类的成员变量mBatches描述的一个Vector中。注意,这里说的批量处理,有两种含义。第一种含义是在同一个Batch中的每一个DrawOp都是单独执行的,不过它们是按顺序执行的。第二种含义是在在同一个Batch中的所有DrawOp都是一次性执行的。其中,第二种含义才称为合并执行。

两个DrawOp可以合并执行的必要条件是它们具有相同的Batch ID和Merge ID。注意,这不是充分条件。也就是说,具有相同Batch ID和Merge ID的两个Draw Op不一定能够合并执行。例如,当它们重叠,或者在它们之间存在另外的DrawOp与它们重叠。这些都会造成两个具有相同Batch ID和Merge ID的Draw Op不能合并执行。

对于具有相同Batch ID但是不同的Merge ID的两个Draw Op,我们希望它们将放在相邻的位置,因为Batch ID描述的是一种绘制类型。这些绘制类型由枚举类型OpBatchId定义。这样GPU在执行这些Draw Op时,在内部就不需要进行状态切换,这样可以提高效率。当然,也并不是所有具有相同Batch ID的DrawOp都能够放在相邻的位置,因为它们之间可能存在其它的Draw Op与它们重叠。

基于以上的分析,当给出一个DrawOp时,我们希望:

1. 在DeferredDisplayList类的成员变量mBatches描述的一个Vector中快速找可以与它进行合并执行的DrawOp所在的Batch。这时候就需要用到DeferredDisplayList类的成员变量mMergingBatches描述的是一个TinyHashMap数组了。这个数组的大小为kOpBatch_Count,这意味着每一个Batch ID在这个数组中都有一个TinyHashMap。因此,给出一个DrawOp,我们根据它的Batch ID就可以快速得到一个TinyHashMap。有了这个TinyHashMap,我们再以给出的Draw Op的Merge ID作为键值,快速找到一个Batch。接着再根据其它条件判断给出的DrawOp与在找到的Batch中已经存在的DrawOp是否能够合并。如果能够合并,就将给出的DrawOp添加到找到的Batch去就行了。

2. 如果不能在DeferredDisplayList类的成员变量mBatches描述的一个Vector中可以让它合并的Batch时,我们希望可以快速找到另外一个Batch,这个Batch的所有DrawOp都是依次地单独执行。这时候就需要用到DeferredDisplayList类的成员变量mBatchLookup描述的一个Batch数组了。这个数组的大小同样为kOpBatch_Count,这也意味着每一个Batch ID在这个数组中都有一个Batch。因此,给出一个DrawOp,我们根据它的Batch ID就可以快速得到一个Batch。接着再根据其它条件判断给出的DrawOp与在找到的Batch中已经存在的DrawOp是否能够合并。如果能够合并,就将给出的DrawOp添加到找到的Batch去就行了。

3. 如果通过上面的两个方法还是不能找到一个Batch,那么就需要创建一个新的Batch来存放给出的Draw Op。但是我们希望可以将这个新创建的Batch放在与它具有相同Batch ID的Batch相邻的位置上。

了解了DeferredDisplayList类的三个成员变量mBatches、mBatchLookup和mMergingBatches的作用之后,我们再来看另外一个结构体DeferInfo,如下所示:

struct DeferInfo {
    public:
        DeferInfo() :
                batchId(DeferredDisplayList::kOpBatch_None),
                mergeId((mergeid_t) -1),
                mergeable(false),
                opaqueOverBounds(false) {
        };

        int batchId;
        mergeid_t mergeId;
        bool mergeable;
        bool opaqueOverBounds; // opaque over bounds in DeferredDisplayState - can skip ops below
    };

这个结构体定义在文件frameworks/base/libs/hwui/DeferredDisplayList.h中。

结构体DeferInfo有四个成员变量,分别是:

1. batchId:描述一个DrawOp的Batch ID。

2. mergeId:描述一个DrawOp的Merge ID。

3. mergeable:描述一个DrawOp是否具有与其它DrawOp进行合并的条件,最终能不能合并还要取决于其它条件。

4. opaqueOverBounds:描述的一个DrawOp是不是不透明绘制。如果是的话,就会可能覆盖在它前面的DrawOp,但是最终能不能覆盖同样还要取决于其它条件。

每一个DrawOp都定义有一个成员函数onDefer,用来设置一个DeferInfo结构体的各个成员变量,以便调用者可以知道它的Batch ID和Merge ID,以及它的合并和覆盖绘制信息。具体的例子可以参考前面Android应用程序UI硬件加速渲染的预加载资源地图集服务(Asset Atlas Service)分析一文。

有了上面这些知识之后,我们就开始分析上面列出的DrawOp类的成员函数defer的代码。为了描述分便,我们分段来阅读:

    /* 1: op calculates local bounds */
        DeferredDisplayState* const state = createState();
        if (op->getLocalBounds(state->mBounds)) {
            if (state->mBounds.isEmpty()) {
                .......
                return;
            }
        } else {
            state->mBounds.setEmpty();
        }

这段代码是获得参数op描述的DrawOp的绘制区域,保存在本地变量state指向的一个DeferDisplayState结构体的成员变量mBounds中。通过调用这个DrawOp的成员函数getLocalBounds可以获得它的绘制区域。

如果这个DrawOp设置了一个空区域,那么就不会对它进行处理了。另一方面,如果这个DrawOp没有设置绘制区载,调用它的成员函数getLocalBounds得到的返回值为false,这时候会将本地变量const_state指向的一个DeferDisplayState结构体的成员变量mBounds描述的区域设置为空,但是其实想表达的意思是未设置绘制区域。

    /* 2: renderer calculates global bounds + stores state */
        if (renderer.storeDisplayState(*state, getDrawOpDeferFlags())) {
            ......
            return; // quick rejected
        }

这段代码调用参数renderer描述的一个OpenGLRender对象的成员函数storeDisplayState设置参数op描述的DrawOp的裁剪区域。如果参数op描述的DrawOp描述的绘制区域与当前的裁剪区域没有交集,那么就说明该DrawOp是不可见的,因此就不用对它进行绘制了,于是就不用往下处理了。

    /* 3: ask op for defer info, given renderer state */
        DeferInfo deferInfo;
        op->onDefer(renderer, deferInfo, *state);

        // complex clip has a complex set of expectations on the renderer state - for now, avoid taking
        // the merge path in those cases
        deferInfo.mergeable &= !recordingComplexClip();
        deferInfo.opaqueOverBounds &= !recordingComplexClip() && mSaveStack.isEmpty();

这段代码调用参数op描述的DrawOp获得一个初始好的DeferInfo结构体,也就是获得参数op描述的DrawOp的Batch ID和Merge ID,以及合并和覆盖绘制信息。

如果参数op描述的DrawOp表明自己可以与其它具有相同Batch ID和Merge ID的DrawOp合并,但是如果当前的裁剪区域是一个复杂的裁剪区域,也就是由一系列正则的矩形组合形成的复杂区域,那么就会禁止op描述的DrawOp与其它具有相同Batch ID和Merge ID的DrawOp合并。

同样,如果参数op描述的DrawOp表明自己的绘制会覆盖前面的DrawOp,但是如果当前的裁剪区域是一个复杂的裁剪区域,或者当前是绘制在一个Layer上,那么就会禁止op描述的DrawOp覆盖前面的DrawOp。

复杂的裁剪区域会导致具有相同Batch ID和Merge ID的DrawOp不能正确地合并,同时也会导致不透明的DrawOp不能正确地覆盖前面的DrawOp。另外,如果参数op描述的DrawOp是绘制在一个Layer之上,也就是在它之前有一个saveLayer操作,该操作会创建一个Layer,那么后面会有一个对应的restore/restoreToCount操作。当执行restore/restoreToCount操作的时候,前面绘制出来的Layer会被合并在前一个Layer或者Frame Buffer之上。这个合并的操作导致参数op描述的DrawOp不能直接就覆盖前面的DrawOp,也就是丢弃前面的DrawOp。

    if (CC_LIKELY(mAvoidOverdraw) && mBatches.size() &&
                state->mClipSideFlags != kClipSide_ConservativeFull &&
                deferInfo.opaqueOverBounds && state->mBounds.contains(mBounds)) {
            // avoid overdraw by resetting drawing state + discarding drawing ops
            discardDrawingBatches(mBatches.size() - 1);
            ......
        }

这段代码综合判断参数op描述的DrawOp是否能够覆盖排在前面的DrawOp。如果以下条件都能满足,那么参数op描述的DrawOp是否能够覆盖排在前面的DrawOp:

1. 当前设置了禁止过度绘制,即DeferredDisplayList类的成员变量mAvoidOverdraw的值等于true。在启用过度绘制的情况下,即使是被覆盖的区域,也要进行绘制。这样才能将看到过度绘制。

2. 在参数op描述的DrawOp之前,已经存在其它的DrawOp,也就是DeferredDisplayList类的成员变量mBatches描述的一个Vector不为空,这样才有DrawOp被覆盖。

3. 参数op描述的DrawOp明确设置有绘制区域。如果参数op描述的DrawOp没有设置绘制区域,那么本地变量state指向的一个state指向的一个DeferDisplayState结构体的成员变量mClipSideFlags的值会被设置为kClipSide_ConservativeFull。未设置绘制区域的DrawOp,我们就不能明确地知道它会不会覆盖之前的DrawOp。

  1. 参数op描述的DrawOp表明自己是不透明绘制,即本地变量deferInfo描述的一个DeferInfo结构体的成员变量opaqueOverBounds的值等于ture。

  2. 参数op描述的DrawOp的绘制区域包含了之前的DrawOp合并起来的绘制区域。

这些排在前面的DrawOp就保存在DeferredDisplayList类的成员变量mBatches描述的一个Vector中。如果能够覆盖,那么就可以丢弃它们,实际上就是调用DeferredDisplayList类的成员函数discardDrawingBatches清空上述Vector。

    if (CC_UNLIKELY(renderer.getCaches().drawReorderDisabled)) {
            // TODO: elegant way to reuse batches?
            DrawBatch* b = new DrawBatch(deferInfo);
            b->add(op, state, deferInfo.opaqueOverBounds);
            mBatches.add(b);
            return;
        }

如果参数renderer描述的一个OpenGLRenderer表明自己禁止重新排序它的DrawOp,也就是禁止执行DrawOp的合并操作,这时候就会直接为参数op描述的DrawOp创建一个Batch,并且保存在DeferredDisplayList类的成员变量mBatches描述的一个Vector中。这意味着每一个DrawOp都会有独立保存一个Batch中,这样就可以避免出现合并操作。

    // find the latest batch of the new op's type, and try to merge the new op into it
        DrawBatch* targetBatch = NULL;

        // insertion point of a new batch, will hopefully be immediately after similar batch
        // (eventually, should be similar shader)
        int insertBatchIndex = mBatches.size();
        if (!mBatches.isEmpty()) {
            if (state->mBounds.isEmpty()) {
                // don't know the bounds for op, so add to last batch and start from scratch on next op
                DrawBatch* b = new DrawBatch(deferInfo);
                b->add(op, state, deferInfo.opaqueOverBounds);
                mBatches.add(b);
                ......
                return;
            }

这段代码判断在参籹op描述的DrawOp之前,是否已经存在其它的DrawOp。如果存在,但是参籹op描述的DrawOp又没有设置绘制区域,那么即使前面的DrawOp能够与它进行合并,那么也是禁止的。这时候就单独为它创建一个Batch,并且保存在DeferredDisplayList类的成员变量mBatches描述的一个Vector中。

        if (deferInfo.mergeable) {
                // Try to merge with any existing batch with same mergeId.
                if (mMergingBatches[deferInfo.batchId].get(deferInfo.mergeId, targetBatch)) {
                    if (!((MergingDrawBatch*) targetBatch)->canMergeWith(op, state)) {
                        targetBatch = NULL;
                    }
                }
            } else {
                // join with similar, non-merging batch
                targetBatch = (DrawBatch*)mBatchLookup[deferInfo.batchId];
            }

如果参数op描述的DrawOp表明自己可以与其它具有相同Batch ID和Merge ID的DrawOp进行合并,那么这段代码就按照我们前面描述的,通过DeferredDisplayList类的成员变量mMergingBatches描述的一个TinyHashMap数组,快速找到一个具有相同Batch ID和Merge ID的Batch。如果能找到这样的Batch,还需要调用这个Batch的成员函数canMergeWith判断已经存在该Batch的DrawOp是否能够真的与参数op描述的DrawOp进行合并。例如,对于Batch ID等于kOpBatch_Text的两个文字绘制DrawOp,如果文字的颜色不一样,那么这两个DrawOp合并。

如果参数op描述的DrawOp表明自己不可以与其它DrawOp进行合并,那么这段代码也是按照我们前面描述的,通过DeferredDisplayList类的成员变量mBatchLookup描述的一个Batch数组,找到一个与它具有相同的Batch ID的Batch,以便将参数op描述的DrawOp加入到这个Batch去进行依次的独立绘制。

        if (targetBatch || deferInfo.mergeable) {
                // iterate back toward target to see if anything drawn since should overlap the new op
                // if no target, merging ops still interate to find similar batch to insert after
                for (int i = mBatches.size() - 1; i >= mEarliestBatchIndex; i--) {
                    DrawBatch* overBatch = (DrawBatch*)mBatches[i];

                    if (overBatch == targetBatch) break;

                    // TODO: also consider shader shared between batch types
                    if (deferInfo.batchId == overBatch->getBatchId()) {
                        insertBatchIndex = i + 1;
                        if (!targetBatch) break; // found insert position, quit
                    }

                    if (overBatch->intersects(state->mBounds)) {
                        // NOTE: it may be possible to optimize for special cases where two operations
                        // of the same batch/paint could swap order, such as with a non-mergeable
                        // (clipped) and a mergeable text operation
                        targetBatch = NULL;
                        ......
                        break;
                    }
                }
            }
        }

这段代码判断参数op描述的DrawOp是否真的能加入到前面找到的Batch去,主要就是判断参数op描述的DrawOp与找到的Batch里面的DrawOp之间,是否存在其它的DrawOp与它重叠。如果存在,那么就不能够将参数op描述的DrawOp是否真的能加入到前面找到的Batch去了。这意味着要为参数op描述的DrawOp创建一个独立的Batch。这个Batch也是按照我们前面描述的,尽可能放在前面与它具有相同Batch ID的Batch的相邻位置。这个位置就通过设置本地变量insertBatchIndex的值得到。

    if (!targetBatch) {
            if (deferInfo.mergeable) {
                targetBatch = new MergingDrawBatch(deferInfo,
                        renderer.getViewportWidth(), renderer.getViewportHeight());
                mMergingBatches[deferInfo.batchId].put(deferInfo.mergeId, targetBatch);
            } else {
                targetBatch = new DrawBatch(deferInfo);
                mBatchLookup[deferInfo.batchId] = targetBatch;
            }

            ......
            mBatches.insertAt(targetBatch, insertBatchIndex);
        }

        targetBatch->add(op, state, deferInfo.opaqueOverBounds);

这段代码判断本地变量targetBatch的值。如果等于NULL,那么就表明前面不能在DeferredDisplayList类的成员变量mBatches描述的一个Vector中找到一个能够用来保存参数op描述的DrawOp的Batch。这时候就需要为参数op描述的DrawOp创建一个Batch了。这个Batch的具体类型要么是MergingDrawBatch,要么是DrawBatch,取决于参数op描述的DrawOp是否表明自己是可合并的,即本地变量deferInfo描述的一个DeferInfo结构体的成员变量mergeable的值是否为true。

如果参数op描述的DrawOp表明自己是可合并的,那么就为它创建一个MergingDrawBatch,并且保存在DeferredDisplayList类的成员变量mMergingBatches描述的一个TinyHashMap数组中,使得它后面的与它具有相同Batch ID和Merge ID的DrawOp能够快速找到它。

如果参数op描述的DrawOp表明自己是不可以合并的,那么就为它创建一个DrawBatch,并且保存在DeferredDisplayList类的成员变量mBatchLookup描述的一个Batch数组中,以便它后面的与它具有相同Batch ID的DrawOp能够快速找到它。

这意味着保存在同一个MergingDrawBatch的DrawOp,在渲染的时候是可以进合并绘制的,而保存在同一个rawBatch的DrawOp,在渲染的时候是可以连续地进行独立绘制的。

最后,新创建的Batch就根据前面得到的本地变量insertBatchIndex的值保存在DeferredDisplayList类的成员变量mBatches描述的一个Vector中,使得该Batch尽可能地与它具有同的Batch ID的Batch放在一起。

另一方面,如果本地变量targetBatch的值不等于NULL,那么就表明前面找到了一个Batch,这个Batch可以用来保存参数op描述的DrawOp。

这样,当DeferredDisplayList类的成员addDrawOp执行完成之后,当前正在处理的所有DrawOp都经过合并等处理了,并且处理后得到的DrawOp以Batch为单位保存在DeferredDisplayList类的成员变量mBatches描述的一个Vector中。

上面描述的是一个普通的DrawOp的成员函数defer被调用时所执行的绘制命令重排和合并操作。还有另外一种特殊的Display List Op,即DrawRenderNodeOp。从前面的分析可以知道,当一个Render Node包含有子Render Node时,它的Display List包含有一个对应的DrawRenderNodeOp。此外,当一个Render Node具有Projected Node时,每一个Projected Node都有一个对应的DrawRenderNodeOp保存该Render Node的成员变量mProjectedNodes描述的一个Vector。所有的这些DrawRenderNodeOp也像DrawOp一样,会被DeferOperationHandler类的操作符重载函数()调用它们的成员函数defer。

DrawRenderNodeOp类的成员函数defer的实现如下所示:

class DrawRenderNodeOp : public DrawBoundedOp {
        ......

        virtual void defer(DeferStateStruct& deferStruct, int saveCount, int level,
                bool useQuickReject) {
            if (mRenderNode->isRenderable() && !mSkipInOrderDraw) {
                mRenderNode->defer(deferStruct, level + 1);
            }
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DisplayListOp.h中。

DrawRenderNodeOp类的成员变量mRenderNode描述的是当前正在处理的DrawRenderNodeOp所关联的一个Render Node。当这个Render Node的Display List不为空时,就表示这个Render Node的Display List的绘制命令需要执行重排和合并操作。

此外,DrawRenderNodeOp类还有另外一个成员变量mSkipInOrderDraw。当它的值等于true时,就表示当前正在处理的DrawRenderNodeOp所关联的Render Node要跳过顺序绘制。这是什么意思呢?其实这是针对我们前面提到的Ripple Drawable的。我们知道,Ripple Drawable有可能不是按照它们在视图结构的顺序绘制的,因为它们有可能会被投影到最近一个父Render Node的Backround去绘制。这样当它们对应的Render Node在顺序绘制中就应该跳过处理。

在我们这个情景中,这里的DrawRenderNodeOp类的成员函数defer并不是在顺序绘制过程中被调用的,而是在重排和合并一个Render Node的Display List的绘制命令的过程中调用的,也就是在前面分析的RenderNode类的成员函数issueOperationsOf3dChildren和issueOperationsOfProjectedChildren中调用的。这两个成员函数需要强制DrawRenderNodeOp类的成员函数defer重排和合并当前正在处理的DrawRenderNodeOp所关联的一个Render Node的Display List的绘制命令,因此就会强制当前正在处理的DrawRenderNodeOp的成员变量mSkipInOrderDraw设置为false。

这样,当一个DrawRenderNodeOp的成员变量mSkipInOrderDraw的值为false,并且它关联的Render Node的Display List不为空,这个Render Node的成员函数defer就会被调用。这意味着通过DrawRenderNodeOp类的成员函数defer,一个Render Node及其所有的子Render Node和Projected Node的Display List的绘制命令都会得到归递重排和合并处理。

这一步执行完成之后,回到CanvasContext类的成员函数draw中,这时候所有设置了Layer的Render Node的Display List包含的Display List Op都已经得到了重排和合并等处理,接下来要做的事情就是调用OpenGLRenderer类的成员函数drawRenderNode渲染应用程序窗口的Root Render Node的Display List。

OpenGLRenderer类的成员函数drawRenderNode的实现如下所示:

status_t OpenGLRenderer::drawRenderNode(RenderNode* renderNode, Rect& dirty, int32_t replayFlags) {
        status_t status;
        // All the usual checks and setup operations (quickReject, setupDraw, etc.)
        // will be performed by the display list itself
        if (renderNode && renderNode->isRenderable()) {
            // compute 3d ordering
            renderNode->computeOrdering();
            if (CC_UNLIKELY(mCaches.drawDeferDisabled)) {
                status = startFrame();
                ReplayStateStruct replayStruct(*this, dirty, replayFlags);
                renderNode->replay(replayStruct, 0);
                return status | replayStruct.mDrawGlStatus;
            }

            bool avoidOverdraw = !mCaches.debugOverdraw && !mCountOverdraw; // shh, don't tell devs!
            DeferredDisplayList deferredList(*currentClipRect(), avoidOverdraw);
            DeferStateStruct deferStruct(deferredList, *this, replayFlags);
            renderNode->defer(deferStruct, 0);

            flushLayers();
            status = startFrame();

            return deferredList.flush(*this, dirty) | status;
        }

        // Even if there is no drawing command(Ex: invisible),
        // it still needs startFrame to clear buffer and start tiling.
        return startFrame();
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp。

参数renderNode描述的是应用程序窗口的Root Render Node,如果它的值不等于NULL,并且它是可渲染的,即调用它的成员函数isRenderable的返回值为true,那么接下来就开始渲染的它的Display List。

在渲染应用程序窗口的Root Render Node之前,OpenGLRenderer类的成员函数drawRenderNode首先调用它的成员函数computeOrdering计算它的Projected Node。这一步与前面LayerRenderer类渲染设置了Layer的Render Node的Display List的过程是一样的,都是为重排那些Projected Node,使得它们的渲染顺序位于要投影到的Render Node的后面。

OpenGLRenderer类的成员函数drawRenderNode接下来判断当前是否禁止重排应用程序窗口的Root Render Node的Display List的绘制命令,也就是不允许对这些绘制命令进行合并。如果是禁止的话,那么OpenGLRenderer类的成员变量mCaches指向的一个Caches对象的成员变量drawDeferDisabled的值就会等于true。在这种情况下,就会跳过应用程序窗口的Root Render Node的Display List的绘制命令的重排阶段,而直接对它们进行执行。这是通过调用RenderNode类的成员函数replay实现的。

如果当前不禁止重排应用程序窗口的Root Render Node的Display List的绘制命令,那么OpenGLRenderer类的成员函数drawRenderNode接下来做的事情就是调用前面分析过的RenderNode类的成员函数defer对应用程序窗口的Root Render Node及其子Render Node和Projected Node的的Display List的绘制命令进行合并操作。合并后得到的绘制命令,也就是DrawOp,就以Batch为单位保存在本地变量deferredList描述的一个DeferredDisplayList对象的成员变量mBatches描述的一个Vector中。

这里有一点需要注意的是,在调用RenderNode类的成员函数defer合并应用程序窗口的Root Render Node的Display List的绘制命令的时候,传递进去的DeferStateStruct结构体封装的Renderer是一个OpenGLRenderer。这意味着如果应用程序窗口的Root Render Node包含了一个设置了Layer的子RenderNode,那么当调用到RenderNode类的成员函数issueOperations递归处理该子RenderNode时候,这个子RenderNode就直接以一个DrawLayerOp进行绘制。这是由于这时候这个子RenderNode的成员变量renderer指向的OpenGLRenderer对象的实际类型是LayerRenderer,而参数renderer指向OpenGLRenderer对象的实际类型就是OpenGLRenderer。这两个OpenGLRenderer对象的不相等,就使得本地变量drawLayer的值等于true,于是该子RenderNode的绘制命令就被封装为一个DrawLayerOp。这样做是合理的,因为这个子RenderNode的Display List的绘制命令之前已经被重排和合并过了。

重排和合并完成应用程序窗口的Root Render Node及其子Render Node和Projected Node的Display List的绘制命令之后,本来就可以执行它们了。但是在执行它们之前,还有一件事情需要做,就是先执行那些设置了Layer的子Render Node的绘制命令,以便得到一个对应的FBO。这些FBO就代表了那些设置了Layer的子Render Node的UI。这一步是通过调用OpenGLRenderer类的成员函数flush来完成的。

OpenGLRenderer类的成员函数flush的实现如下所示:

void OpenGLRenderer::flushLayers() {
        int count = mLayerUpdates.size();
        if (count > 0) {
            ......

            // Note: it is very important to update the layers in order
            for (int i = 0; i < count; i++) {
                ......
                Layer* layer = mLayerUpdates.itemAt(i);
                layer->flush();
                ......
            }

            ......

            mRenderState.bindFramebuffer(getTargetFbo());

            ......
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/OpenGLRenderer.cpp。

从前面的分析可以知道,OpenGLRenderer类的成员变量mLayerUpdates描述的一个Vector里面存放的都是设置了Layer的Render Node关联的Layer,并且这些Render Noder的Display List的绘制命令都是已经经过了重排和合并等操作的。

对于保存在上述Vector中的每一个Layer,OpenGLRenderer类的成员函数flushLayers都会调用它的成员函数flush,目的就是执行这些Layer关联的Render Node的Display List经过重排和合并后的绘制命令。

Layer类的成员函数flush的实现如下所示:

void Layer::flush() {
        // renderer is checked as layer may be destroyed/put in layer cache with flush scheduled
        if (deferredList && renderer) {
            ......
            renderer->prepareDirty(dirtyRect.left, dirtyRect.top, dirtyRect.right, dirtyRect.bottom,
                    !isBlend());

            deferredList->flush(*renderer, dirtyRect);

            ......
        }
    }

这个函数定义在文件frameworks/base/libs/hwui/Layer.cpp中。

从前面的分析可以知道,这时候正在处理的Layer对象的成员变量renderer和deferredList的值均不等于NULL,它们分别指向了一个LayerRenderer对象和一个DeferredDisplayList对象,因此Layer类的成员函数flush接下来就分别调用了这两个对象的成员函数prepareDirty和flush。

LayerRenderer类的成员函数prepareDirty的实现如下所示:

status_t LayerRenderer::prepareDirty(float left, float top, float right, float bottom,
            bool opaque) {
        ......

        renderState().bindFramebuffer(mLayer->getFbo());

        ......

        return OpenGLRenderer::prepareDirty(dirty.left, dirty.top, dirty.right, dirty.bottom, opaque);
    }

这个函数定义在文件frameworks/base/libs/hwui/LayerRenderer.cpp中。

LayerRenderer类的成员函数prepareDirty做了一件很重要的事情,就是在从成员变量mLayer指向的一个Layer对象获得一个FBO,并且将该FBO设置当前Open GL环境的渲染对象,这意味着后续的Open GL绘制命令都是将UI渲染在该FBO上。

LayerRenderer类的成员函数prepareDirty最后还调用了父类OpenGLRenderer的成员函数prepareDirty。前面我们在分析OpenGLRenderer类的成员函数prepareDirty的时候提到,如果当前正在处理的一个LayerRenderer对象,那么它所做的事情是调用OpenGLRenderer类的另外一个成员函数startFrame。OpenGLRenderer类的成员函数startFrame仅仅是负责执行一些诸如清理颜色绘冲区等基本操作。当然,这里清理的是从成员变量mLayer指向的一个Layer对象获得一个FBO的颜色绘冲区。

这一步执行完成之后,回到Layer类的成员函数flush中,它接下来调用DeferredDisplayList类的成员函数flush,目的是为了将当前正在处理的Layer关联的Render Node的Display List渲染在上述的FBO上。

DeferredDisplayList类的成员函数flush的实现如下所示:

status_t DeferredDisplayList::flush(OpenGLRenderer& renderer, Rect& dirty) {
        ......

        status |= replayBatchList(mBatches, renderer, dirty);

        ......

        return status;
    }

这个函数定义在文件frameworks/base/libs/hwui/DeferredDisplayList.cpp中。

前面提到,DeferredDisplayList类的成员变量mBatches描述的一个Vector存放的就是一个设置了Layer的Render Node的Display List经过重排和合并后的绘制命令,这些绘制命令通过DeferredDisplayList类的另外一个成员函数replayBatchList执行。

DeferredDisplayList类的成员函数replayBatchList的实现如下所示:

static status_t replayBatchList(const Vector<Batch*>& batchList,
            OpenGLRenderer& renderer, Rect& dirty) {
        status_t status = DrawGlInfo::kStatusDone;

        for (unsigned int i = 0; i < batchList.size(); i++) {
            if (batchList[i]) {
                status |= batchList[i]->replay(renderer, dirty, i);
            }
        }
        ......
        return status;
    }

这个函数定义在文件frameworks/base/libs/hwui/DeferredDisplayList.cpp中。

DeferredDisplayList类的成员函数replayBatchList依次调用参数batchList描述的一个Vector中的每一个Batch对象的成员函数replay。从前面分析的DeferredDisplayList类的成员函数addDrawOp可以知道,参数batchList描述的一个Vector中的每一个Batch对象的实际类型要么是DrawBatch,要么是MergingDrawBatch,因此我们接下来就继续分析DrawBatch类和MergingDrawBatch类的成员函数replay的实现。

DrawBatch类的成员函数replay的实现如下所示:

class DrawBatch : public Batch {
    public:
        ......

        virtual status_t replay(OpenGLRenderer& renderer, Rect& dirty, int index) {
            ......

            status_t status = DrawGlInfo::kStatusDone;
            ......
            for (unsigned int i = 0; i < mOps.size(); i++) {
                DrawOp* op = mOps[i].op;
                ......

                status |= op->applyDraw(renderer, dirty);

                .....
            }
            return status;
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DeferredDisplayList.cpp中。

DrawBatch类的成员函数replay依次调用存放在成员变量mOps描述的一个Vector中的每一个DrawOp的成员函数applyDraw,以便这些DrawOp可以转化为Open GL绘制命令进行执行。

以一个具体的DrawRectOp为例,它的成员函数applyDraw的实现如下所示:

class DrawRectOp : public DrawStrokableOp {
    public:
        ......

        virtual status_t applyDraw(OpenGLRenderer& renderer, Rect& dirty) {
            return renderer.drawRect(mLocalBounds.left, mLocalBounds.top,
                    mLocalBounds.right, mLocalBounds.bottom, getPaint(renderer));
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DisplayListOp.h中。

DrawRectOp类的成员函数applyDraw调用了参数renderer描述的一个OpenGLRenderer对象的成员函数drawRect来渲染当前正在处理的一个DrawRectOp。参数renderer描述的一个OpenGLRenderer对象的实际类型为LayerRenderer,不过LayerRenderer类的成员函数drawRect是从父类OpenGLRenderer继承下来的。因此,当前正在处理的一个DrawRectOp最终是通过OpenGLRenderer类的成员函数drawRect转化Open GL绘制命令进行执行的。这一点我们就留给读者自己去分析了。

还有一种特殊的DrawOp,即DrawRenderNodeOp,当它们的成员函数applyDraw被调用时,它所做的工作实际上递归地将它的子Render Node或者Projected Node的Display List包含的DrawOp转化为Open GL命令来执行,它的实现如下所示:

class DrawRenderNodeOp : public DrawBoundedOp {
        ......

        virtual void replay(ReplayStateStruct& replayStruct, int saveCount, int level,
                bool useQuickReject) {
            if (mRenderNode->isRenderable() && !mSkipInOrderDraw) {
                mRenderNode->replay(replayStruct, level + 1);
            }
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DisplayListOp.h中。

这一点与前面我们分析的DrawRenderNodeOp类的成员函数applyDraw的逻辑是类似的,因此我们就不再详述。

接下来我们再来看MergingDrawBatch类的成员函数replay的实现,如下所示:

class MergingDrawBatch : public DrawBatch {
    public:
        ......

        virtual status_t replay(OpenGLRenderer& renderer, Rect& dirty, int index) {
            ......

            DrawOp* op = mOps[0].op;
            ......

            status_t status = op->multiDraw(renderer, dirty, mOps, mBounds);
            ......

            return status;
        }

        ......
    };

这个函数定义在文件frameworks/base/libs/hwui/DeferredDisplayList.cpp中。

MergingDrawBatch类的成员函数replay只调用了保存在成员变量mOps描述的一个Vector中的第一个DrawOp的成员函数multiDraw,但是会将其余的DrawOp作为参数传递给它。

以一个具体的DrawPatchOp为例,它的成员函数multiDraw的实现如下所示:

class DrawPatchOp : public DrawBoundedOp {  
    public:
        ......  

        virtual status_t multiDraw(OpenGLRenderer& renderer, Rect& dirty,  
                const Vector<OpStatePair>& ops, const Rect& bounds) {  
            const DeferredDisplayState& firstState = *(ops[0].state);  
            renderer.restoreDisplayState(firstState, true); // restore all but the clip  

            // Batches will usually contain a small number of items so it's  
            // worth performing a first iteration to count the exact number  
            // of vertices we need in the new mesh  
            uint32_t totalVertices = 0;  
            for (unsigned int i = 0; i < ops.size(); i++) {  
                totalVertices += ((DrawPatchOp*) ops[i].op)->getMesh(renderer)->verticesCount;  
            }  

            const bool hasLayer = renderer.hasLayer();  

            uint32_t indexCount = 0;  

            TextureVertex vertices[totalVertices];  
            TextureVertex* vertex = &vertices[0];  

            // Create a mesh that contains the transformed vertices for all the  
            // 9-patch objects that are part of the batch. Note that onDefer()  
            // enforces ops drawn by this function to have a pure translate or  
            // identity matrix  
            for (unsigned int i = 0; i < ops.size(); i++) {  
                DrawPatchOp* patchOp = (DrawPatchOp*) ops[i].op;  
                const DeferredDisplayState* state = ops[i].state;  
                const Patch* opMesh = patchOp->getMesh(renderer);  
                uint32_t vertexCount = opMesh->verticesCount;  
                if (vertexCount == 0) continue;  

                // We use the bounds to know where to translate our vertices  
                // Using patchOp->state.mBounds wouldn't work because these  
                // bounds are clipped  
                const float tx = (int) floorf(state->mMatrix.getTranslateX() +  
                        patchOp->mLocalBounds.left + 0.5f);  
                const float ty = (int) floorf(state->mMatrix.getTranslateY() +  
                        patchOp->mLocalBounds.top + 0.5f);  

                // Copy & transform all the vertices for the current operation  
                TextureVertex* opVertices = opMesh->vertices;  
                for (uint32_t j = 0; j < vertexCount; j++, opVertices++) {  
                    TextureVertex::set(vertex++,  
                            opVertices->x + tx, opVertices->y + ty,  
                            opVertices->u, opVertices->v);  
                }  

                // Dirty the current layer if possible. When the 9-patch does not  
                // contain empty quads we can take a shortcut and simply set the  
                // dirty rect to the object's bounds.  
                if (hasLayer) {  
                    if (!opMesh->hasEmptyQuads) {  
                        renderer.dirtyLayer(tx, ty,  
                                tx + patchOp->mLocalBounds.getWidth(),  
                                ty + patchOp->mLocalBounds.getHeight());  
                    } else {  
                        const size_t count = opMesh->quads.size();  
                        for (size_t i = 0; i < count; i++) {  
                            const Rect& quadBounds = opMesh->quads[i];  
                            const float x = tx + quadBounds.left;  
                            const float y = ty + quadBounds.top;  
                            renderer.dirtyLayer(x, y,  
                                    x + quadBounds.getWidth(), y + quadBounds.getHeight());  
                        }  
                    }  
                }  

                indexCount += opMesh->indexCount;  
            }  

            return renderer.drawPatches(mBitmap, getAtlasEntry(),  
                    &vertices[0], indexCount, getPaint(renderer));  
        }  

        ......  
    };  

这个函数定义在文件frameworks/base/libs/hwui/DisplayListOp.h中。

在前面Android应用程序UI硬件加速渲染的预加载资源地图集服务(Asset Atlas Service)分析一文中,我们有分析过DrawPatchOp类的成员函数multiDraw的实现,它所做的事情就是首先计算出当前正在处理的DrawPatchOp和参数ops描述的DrawPatchOp的纹理坐标,并且将这些纹理坐标保存一个数组中传递给参数renderer描述的一个OpenGLRenderer对象的成员函数drawPatches,使得后者可以一次性地将N个DrawPatchOp合并在一起转化为Open GL绘制命令执行。这之所以是可行的,是因为这些DrawPatchOp是以纹理方式进行渲染的,它们使用的是同一个纹理。

这一步执行完成之后,回到OpenGLRenderer类的成员函数flushLayers中,这时候所有设置了Layer的Render Noder及其子Render Node和Projected Node的Display List均已渲染到了自己的FBO之上,接下来就要将这些FBO以及其它没有设置Layer的Render Node的Display List渲染在Frame Buffer上,也就是渲染在从Surface Flinger请求回来的一个图形缓冲区之上。由于前面每调用一个Layer对象的成员函数flush的时候,都会将一个FBO设置为当前的渲染对象,而接下来的渲染对象是Frame Buffer,因此就需要调用成员变量mRenderState描述的一个RenderState对象的成员函数bindFramebuffer将Frame Buffer设置为当前的渲染对象。前面提到,OpenGLRenderer类的成员函数getTargetFbo的返回值等于0,当我们将一个值为0的FBO设置为当前的渲染对象时,起到的效果实际上解除前面设置的值为非0的FBO作为当前的渲染对象,并且将当前的渲染对象还原回Frame Buffer的效果。

OpenGLRenderer类的成员函数flushLayers执行完成后,回到OpenGLRenderer类的成员函数drawRenderNode中,这时候可以渲染应用程序窗口的Root Render Node的Display List了。在渲染之前,同样是先调用OpenGLRenderer类的成员函数startFrame执行一些诸如清理颜色绘冲区等基本操作。注意,这里清理的是Frame Buffer的颜色绘冲区。这时候应用程序窗口的Root Render Node及其子Render Node和Projected Node的Display List经过重排和合并后的绘制命令就存放在本地变量deferredList描述的一个DeferredDisplayList的成员变量mBatches描述的一个Vector中,因此OpenGLRenderer类的成员函数drawRenderNode就可以调用前面已经分析过的DeferredDisplayList类的成员函数flush来执行它们。这里同样是需要注意,这些绘制命令的执行是作用在Frame Buffer之上的。

至此,应用程序窗口的Display List的渲染过程就分析完成了。整个过程比较复杂,但是总结来说,核心逻辑就是:

1. 将Main Thread维护的Display List同步到Render Thread维护的Display List去。这个同步过程由Render Thread执行,但是Main Thread会被阻塞住。

2. 如果能够完全地将Main Thread维护的Display List同步到Render Thread维护的Display List去,那么Main Thread就会被唤醒,此后Main Thread和Render Thread就互不干扰,各自操作各自内部维护的Display List;否则的话,Main Thread就会继续阻塞,直到Render Thread完成应用程序窗口当前帧的渲染为止。

  1. Render Thread在渲染应用程序窗口的Root Render Node的Display List之前,首先将那些设置了Layer的子Render Node的Display List渲染在各自的一个FBO上,接下来再一起将这些FBO以及那些没有设置Layer的子Render Node的Display List一起渲染在Frame Buffer之上,也就是渲染在从Surface Flinger请求回来的一个图形缓冲区上。这个图形缓冲区最终会被提交给Surface Flinger合并以及显示在屏幕上。

第2步能够完全将Main Thread维护的Display List同步到Render Thread维护的Display List去很关键,它使得Main Thread和Render Thread可以并行执行,这意味着Render Thread在渲染应用程序窗口当前帧的Display List的同时,Main Thread可以去准备应用程序窗口下一帧的Display List,这样就使得应用程序窗口的UI更流畅。

Android 5.0引入Render Thread的作用除了可以获得上面描述的效果之外,还可以使得应用程序窗口动画显示更加流畅。在接下来的一篇文章中,我们就继续分析在硬件加速渲染的环境下,应用程序窗口的动画显示框架,敬请关注!更多的信息也可以关注老罗的新浪微博:http://weibo.com/shengyangluo

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8