cocos2d-x 渲染流程简要说明_cocos2dx渲染机制-程序员宅基地

技术标签: cocos2d-x  cocos2d  

简介


Cocos2d 3.x之后,渲染从UI树进行了分离,想比较2.x而言,新的设计更优雅,灵活,易于拓展。

特点:

  • 将绘制逻辑分离,也就是从draw中分离出去,添加了绘制命令Command相关
  • 采用应用程序级别的视口裁剪,如果UI元素的坐标在视窗区域外,则不会添加到绘制命令栈中。这样的好处:
    • 减少绘制命令的数量
    • 减少绘制命令的排序时间
    • 减少对GPU的浪费,在OpenGL ES图元组装阶段会将视口之外的图元丢弃或裁剪。
  • 采用了自动批绘制BatchCommand, 主要针对的是使用相同纹理的UI元素
1.UI遍历
2.渲染
Director::mainLoop
Scene::render
Node::visit
Renderer::render
Application::run
Director::drawScene
Label::draw
Sprite::draw
...
Renderer::addCommand
RenderQueue
Renderer::visitRenderQueue
Renderer::processRenderCommand
CustomCommand
BatchCommand
TrianglesCommand
drawBatchedTriangles
GroupCommand
cmd::execute
cmd::execute

简单的理解其流程就是:

  • 通过mainLoop每秒60帧刷新
  • 通过drawScene绘制屏幕
  • 通过visit对UI节点树遍历
  • 每个UI元算通过draw生成绘制命令
  • RenderQueue队列中,绘制命令排序
  • 执行绘制命令,调用OpenGL绘制屏幕

mainLoop


Cocos2d-x 默认的是每秒60帧(fps)对屏幕进行刷新。

Application::run的while循环中, 按照FPS的设定,每帧调用的方法就是mainLoop

void Director::mainLoop() {
    
    if (! _invalid) {
    
        // 绘制场景
        drawScene();
        // 内存管理相关
        PoolManager::getInstance()->getCurrentPool()->clear();
    }
}

它主要做的两件事就是:

  • 渲染
  • 内存释放

关于内存管理相关,可参考:cocos2d-x 内存管理机制


绘制(渲染)


通过drawScene最后会进入到Scene::render中,绘制的流程简要分为两步:

  • UI遍历,主要通过Node::visit执行
  • 添加到绘制命令栈中, 主要通过不同UI元素的draw执行
void Scene::render(Renderer* renderer, const Mat4* eyeTransforms, const Mat4* eyeProjections, unsigned int multiViewCount) {
    
    auto director = Director::getInstance();
    Camera* defaultCamera = nullptr;
    // 转换坐标系,将ui元素相对坐标转换为世界坐标
    const auto& transform = getNodeToParentTransform();
    for (const auto& camera : getCameras()) {
    
        if (!camera->isVisible())
            continue;

        Camera::_visitingCamera = camera;
        if (Camera::_visitingCamera->getCameraFlag() == CameraFlag::DEFAULT) {
    
            defaultCamera = Camera::_visitingCamera;
        }
        // 遍历场景中UI树,会进入到Node::visit中,进行UI树遍历
        visit(renderer, transform, 0);
        // 绘制,会进入到Renderer::render中,执行绘制
        renderer->render();
        camera->restore();
        for (unsigned int i = 0; i < multiViewCount; ++i)
            director->popProjectionMatrix(i);
    }
    Camera::_visitingCamera = nullptr;
}

从渲染的角度来说,如上代码做的两件主要事情:

  1. 调用visit 执行节点的UI树遍历
  2. 调用render 调用绘制命令相关开始渲染流程

UI树遍历


UI树节点的遍历,其规则采用的是中序(in-order)深度优先算法,也就是:

  • 遍历左边的子节点(localZOrder < 0)
  • 遍历根节点(localZOrder = 0)
  • 遍历右边的字节点(localZOrder > 0)
void Node::visit(Renderer* renderer, const Mat4 &parentTransform, uint32_t parentFlags) {
    
    // 如果不可见,则不再绘制
    if (!_visible)
        return;

    uint32_t flags = processParentFlags(parentTransform, parentFlags);
    _director->pushMatrix(MATRIX_STACK_TYPE::MATRIX_STACK_MODELVIEW);
    _director->loadMatrix(MATRIX_STACK_TYPE::MATRIX_STACK_MODELVIEW, _modelViewTransform);
    // 
    bool visibleByCamera = isVisitableByVisitingCamera();
    int i = 0;
    if(!_children.empty()) {
    
        // 该接口会根据节点的localZOrder进行排序
        sortAllChildren();
        // 遍历localZOrder < 0
        for(auto size = _children.size(); i < size; ++i) {
    
            auto node = _children.at(i);
            if (node && node->_localZOrder < 0)
                node->visit(renderer, _modelViewTransform, flags);
            else
                break;
        }
        // 绘制自身
        if (visibleByCamera)
            this->draw(renderer, _modelViewTransform, flags);
		// 遍历localZOrder > 0
        for(auto it=_children.cbegin()+i, itCend = _children.cend(); it != itCend; ++it)
            (*it)->visit(renderer, _modelViewTransform, flags);
    } else if (visibleByCamera) {
    
        // 添加到绘制命令中
        this->draw(renderer, _modelViewTransform, flags);
    }
    _director->popMatrix(MATRIX_STACK_TYPE::MATRIX_STACK_MODELVIEW);
}

而针对于于UI树的遍历,主要接口为:

void Node::sortAllChildren() {
    
    if (_reorderChildDirty) {
    
        sortNodes(_children);
        _reorderChildDirty = false;
        _eventDispatcher->setDirtyForNode(this);
    }
}

// 以localZOrder进行遍历
static void sortNodes(cocos2d::Vector<_T*>& nodes) {
    
    std::sort(std::begin(nodes), std::end(nodes), [](_T* n1, _T* n2) {
    
        return (n1->_localZOrder < n2->_localZOrder);
    });
}

UI树的遍历,有助于对项目功能的性能优化,比如:

  • 如果某些UI不需要显示,可以设置为隐藏
  • 减少下节点的嵌套复杂度,有助于提升节点的遍历速度

生成绘制命令


draw在3.x之后不再执行绘制,而是生成绘制命令,以Sprite::draw为例:

void Sprite::draw(Renderer *renderer, const Mat4 &transform, uint32_t flags) {
    
    // 检测纹理是否合法
    if (_texture == nullptr) {
    
        return;
    }

#if CC_USE_CULLING
    // Don't calculate the culling if the transform was not updated
    auto visitingCamera = Camera::getVisitingCamera();
    auto defaultCamera = Camera::getDefaultCamera();
    if (visitingCamera == nullptr) {
    
        _insideBounds = true;
    }
    else if (visitingCamera == defaultCamera) {
    
        _insideBounds = ((flags & FLAGS_TRANSFORM_DIRTY) || visitingCamera->isViewProjectionUpdated()) ? renderer->checkVisibility(transform, _contentSize) : _insideBounds;
    }
    else {
    
        // XXX: this always return true since
        _insideBounds = renderer->checkVisibility(transform, _contentSize);
    }

  	// 检测渲染的纹理是否在视窗区域内
    if(_insideBounds)
#endif
    {
    
       	// 添加绘制命令
        _trianglesCommand.init(_globalZOrder,
                               _texture,
                               getGLProgramState(),
                               _blendFunc,
                               _polyInfo.triangles,
                               transform,
                               flags);
        renderer->addCommand(&_trianglesCommand);
    }
}

通过addCommand添加的绘制命令队列RenderQueue中。

void Renderer::addCommand(RenderCommand* command) {
    
    int renderQueueID =_commandGroupStack.top();
    addCommand(command, renderQueueID);
}

void Renderer::addCommand(RenderCommand* command, int renderQueueID) {
    
    // std::vector<RenderQueue> _renderGroups;    绘制命令栈
    _renderGroups[renderQueueID].push_back(command);
}

绘制命令排序


等UI元素遍历结束后,会开始执行绘制命令相关

void Renderer::render() {
    
    _isRendering = true;
    
    if (_glViewAssigned) {
    
        for (auto &renderqueue : _renderGroups) {
    
            // 绘制命令遍历,主要针对的是globalZOrder
            renderqueue.sort();
        }
        visitRenderQueue(_renderGroups[0]);
    }
    clean();
    _isRendering = false;
}

绘制前,会对绘制栈中的命令进行遍历

void RenderQueue::sort()
{
    
    // 遍历globalZOrder小于0的
    std::stable_sort(std::begin(_commands[QUEUE_GROUP::GLOBALZ_NEG]), std::end(_commands[QUEUE_GROUP::GLOBALZ_NEG]), compareRenderCommand);
    // 遍历globalZOrder大于0的
    std::stable_sort(std::begin(_commands[QUEUE_GROUP::GLOBALZ_POS]), std::end(_commands[QUEUE_GROUP::GLOBALZ_POS]), compareRenderCommand);
}

static bool compareRenderCommand(RenderCommand* a, RenderCommand* b)
{
    
    return a->getGlobalOrder() < b->getGlobalOrder();
}

针对于globalZOrder的遍历没有等于0的原因在于:

前面的visit遍历中,已经对localZOrder执行了排序, 而在没有设定globalZorder的情况下,它默认就是0.

因此RenderQueue仅需要关注globalZOrder不为0的排序即可。

另外,关于RenderQueue的排序,让我们可以认识到globalZOrder的优劣:

  • 可以更灵活的改变层级的显示
  • 会影响绘制命令的排序,简单的说,UI元素的绘制不是根据localZOrder进行排序的

执行绘制命令


在遍历完成后,会通过visitRenderQueue进入到processRenderCommand

void Renderer::processRenderCommand(RenderCommand* command) {
    
    auto commandType = command->getType();
    if( RenderCommand::Type::TRIANGLES_COMMAND == commandType) {
    
        flush3D();
        auto cmd = static_cast<TrianglesCommand*>(command);
        if(_filledVertex + cmd->getVertexCount() > VBO_SIZE || _filledIndex + cmd->getIndexCount() > INDEX_VBO_SIZE) {
    
            drawBatchedTriangles();
        }
    }
    else if(RenderCommand::Type::GROUP_COMMAND == commandType) {
    
        flush();
        int renderQueueID = ((GroupCommand*) command)->getRenderQueueID();
        CCGL_DEBUG_PUSH_GROUP_MARKER("RENDERER_GROUP_COMMAND");
        visitRenderQueue(_renderGroups[renderQueueID]);
        CCGL_DEBUG_POP_GROUP_MARKER();
    }
    else if(RenderCommand::Type::CUSTOM_COMMAND == commandType) {
    
        flush();
        auto cmd = static_cast<CustomCommand*>(command);
        CCGL_DEBUG_INSERT_EVENT_MARKER("RENDERER_CUSTOM_COMMAND");
        cmd->execute();
    }
    else if(RenderCommand::Type::BATCH_COMMAND == commandType) {
    
        flush();
        auto cmd = static_cast<BatchCommand*>(command);
        CCGL_DEBUG_INSERT_EVENT_MARKER("RENDERER_BATCH_COMMAND");
        cmd->execute();
    }
}

不同的UI元素会选择对应的命令执行执行OpenGL ES的渲染,最后将效果绘制到屏幕中。

结语

cocos2d-x 的渲染流程步骤说明下:

  1. 在游戏每帧刷新的情况下调用Director::mainLoop
  2. 通过Director::drawScene绘制当前场景
  3. 对场景下的所有节点采用的方式是: 先遍历后渲染
  4. 遍历通过Node::visit 按照LocalZOrder进行排序遍历,并生成不同类型的绘制命令
  5. 在遍历结束后,对绘制命令按照GlobalZorder进行排序遍历
  6. 然后对绘制命令会进行合批处理等,然后调用OpenGL开始渲染。

这个就是它大概的流程。从项目优化的角度来说,需要我们以后可以明白:

  • 如果UI不需要显示,可以直接进行隐藏
  • 减少节点的嵌套复杂度,有助于提升节点的遍历速度
  • 减少全局层级的设置,有助于提升绘制命令的遍历
  • 尤其针对于ClipingNode的使用,它使用的是自定义绘制命令,它会影响渲染合批

关于绘制命令相关,可以参考博客: cocos2d-x 绘制命令

最后,祝大家学习生活愉快!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_24726043/article/details/122224974

智能推荐

职场生存法则:一个外企女白领的日记...-程序员宅基地

文章浏览阅读4.5k次。第11节:人与人的相处(1)   2006-6-7 8∶40∶00  人与人的相处  一、有后台的下属。  我遇见过,也处理得很好。你不能得罪他背后的人,那么就通过他去利用他背后的人。比如说他是老板的亲戚,碰见别的部门有什么搞不定的人,你美言他几句叫他去搞,成功了自然是别人给老板面子,失败了你也可以多多积累他的错误,日后真到不得不踢人的时候也派得上..._外企重视documentation

iOS踩坑App Store Connect Operation Error_sdk version issue. this app was built with the ios-程序员宅基地

文章浏览阅读3.4k次。这个应用程序是用iOS 15.5 SDK构建的。从2023年4月开始,所有提交到应用商店的iOS应用程序都必须使用iOS 16.1 SDK或更高版本构建,包括在Xcode 14.1或更高版本中。目前iOS 开发工具Xcode 版本号是13.4.1 ,系统无法升级,也会导致Xcode无法升级。1、苹果官方提示: 2023年4月开始,开发必须使用 Xcode 14.1 以上的版本,2、目前此电脑无法在升级, 2023年4月开始 ,此电脑就无法正常开发使用,应用程序商店连接操作错误。_sdk version issue. this app was built with the ios 15.5 sdk. all ios and ipa

接单平台汇总_excel接单平台-程序员宅基地

文章浏览阅读335次。接单平台汇总程序员客栈码市开源众包智慧外包实现网猿急送人人开发网开发邦点鸭网快码网英选网外包大师我爱方案网智筹网自由智客接单注意事项:1、没有第三方担保的个人单子,尽量少接2、无需求文档、没有具体要求的不接3、没有预付的不做,尽量用442的分步步骤方式4、没有金刚钻,别揽瓷器活5、急单勿接6、任何不付定金的单子都是耍赖7、不计得失,不怕吃亏..._excel接单平台

CPU如何跑分_cpu跑分教程-程序员宅基地

文章浏览阅读1k次。烤CPU的时候,占用率满了,CPU频率的槽有一些还是空的…… 有没有能跑分的软件?好像有的【聊电Jing】你的CPU性能如何? 来跑个分测试看看吧! | Cinebench R15 & R20 使用教学_哔哩哔哩_bilibili 好像还是免费的Cinebench - Maxon Cinebench - Microsoft Store Apps 频率为什么就是超不过3Ghz? 多核,100度了? 可能频率最高只能这么高,再高可能就烧掉了…… 多核结果.................._cpu跑分教程

最大流问题的Ford-Fulkerson解法_ford capacity 详解-程序员宅基地

文章浏览阅读498次。这是一种方法,而不是算法,因为它包含具有不同运行时间的几种实现。该方法依赖于三种重要思想:残留网络,增广路径和割我们先简单介绍下Ford-Fulkerson方法的基本思想。首先需要了解的是Ford-Fulkerson是一种迭代的方法。开始时,对所有的u,v属于V,f(u,v)=0(这里f(u,v)代表u到v的边当前流量),即初始状态时流的值为0。在每次迭代中,可以通过寻找一个“增广路径”来增加_ford capacity 详解

Windows10下多版本CUDA的安装与切换 超详细教程_cuda版本-程序员宅基地

文章浏览阅读1.9w次,点赞69次,收藏379次。当我们跑深度学习的代码时,有时会遇到上古的代码,环境比较老,是低版本的 CUDA,此时我们就需要多个 CUDA 版本,并能灵活切换。本文是在已有CUDA11.2的环境下安装CUDA9.2。Windows10下多版本CUDA的安装与切换保姆级教学。_cuda版本

随便推点

understand 代码解析工具的使用_understand代码-程序员宅基地

文章浏览阅读8.8k次,点赞15次,收藏80次。understand 常用操作文章目录understand 常用操作简单介绍软件下载常用基本操作新建工程并添加现有文件如何找到自己当前想要去编辑的文件?如何在当前文件中找到你要编辑的函数?如何跳转到定义?查看当前文件的函数列表如何查看函数都被谁调用了?查看函数的调用逻辑如何查找如何找到函数的被调用图除此之外可以分析出代码的各种结构文本的编辑格式设置双屏一边看代码,一遍看代码地图简单介绍understand对分析代码有非常强的能力,完全可以代替sourceinsight,并且可以在linux上mac上使_understand代码

Oracle 闪回(flashback)数据库到指定时间点_数据库 oracle时间戳闪回-程序员宅基地

文章浏览阅读4.1k次。如果是update,delete类误操作且已经commit,优先考虑使用flashback query进行恢复。select * from test1 as of timestamp to_timestamp('2018-01-13 16:59:29','YYYY-MM-DD hh24:mi:ss');如果是drop或truncate table,则不能使用闪回查询,需要使用备库进行整库..._数据库 oracle时间戳闪回

[bigdata-124] docker+django2.0 构建web服务_docker django print-程序员宅基地

文章浏览阅读660次。在本地运行django1.python3.42.安装django,安装特定版本pip3 install django==2.03.测试安装python3import djangoprint(django.get_version())4.django使用创建一个新目录test_djangopython -m django --version_docker django print

话题的发布与订阅_话题订阅频率和发布频率一样-程序员宅基地

文章浏览阅读2.6k次,点赞3次,收藏11次。Ros话题发布与订阅节点的编写(C++)_话题订阅频率和发布频率一样

Qt Creator 安装 VLD_qtcreater vld-程序员宅基地

文章浏览阅读509次。Qt Creator 安装 VLD2015-04-14 16:52:55你好L阅读数 2325更多分类专栏:qt版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/lin_jianbin/article/details/45044459一、环境说明1、VLD内存..._qtcreater vld

Linux 开发环境工具[zt]-程序员宅基地

文章浏览阅读120次。软件集成开发环境(代码编辑、浏览、编译、调试)Emacs http://www.gnu.org/software/emacs/Source-Navigator 5.2b2 http://sourceforge.net/projects/sourcenavAnjuta http://anjuta.sourceforge...._linux上安装flawfinder