《Metal》官方文档翻译004--命令组织和执行模型
在Metal架构中,MTLDevice协议定义了代表单个GPU的接口。该MTLDevice协议支持用于询问设备属性的方法,用于创建其他设备特定对象(如缓冲区和纹理),以及编码和排队渲染和计算命令以提交给GPU执行。
一个命令队列包含一个队列的命令缓冲区,并且一命令队列整理那些命令缓冲区的执行顺序。命令缓冲区包含用于在特定设备上执行的编码命令。一个命令编码器附加渲染,计算,和位图传送命令到命令缓冲器,并且这些命令缓冲器最终被致力于用于在设备上执行。
该MTLCommandQueue协议定义了一个接口,用于命令队列,主要支撑用于创建命令缓冲区对象的方法。该MTLCommandBuffer协议定义了一个接口,用于命令缓冲区并提供用于创建命令编码器,入队命令缓冲区以供执行,检查状态和其他操作的方法。该MTLCommandBuffer协议支持以下命令编码器类型,这些接口用于将不同类型的GPU工作负载编码到命令缓冲区中:
- 该MTLRenderCommandEncoder协议对单个渲染通过的图形(3D)渲染命令进行编码
- 该MTLComputeCommandEncoder协议编码的数据并行计算的工作量。
- 该MTLBlitCommandEncoder协议编码缓冲区和纹理之间的简单复制操作,以及诸如mipmap生成的实用程序操作。
在任何时间点,只有一个命令编码器可以被激活并将命令追加到命令缓冲区中。每个命令编码器必须结束,才能创建另一个命令编码器,以便与同一个命令缓冲区一起使用。“每个命令缓冲区的一个活动命令编码器”规则的一个例外是在
使用多个线程编码单个渲染通过中MTLParallelRenderCommandEncoder讨论的协议。
一旦完成所有编码,您将提交MTLCommandBuffer对象本身,它将命令缓冲区标记为可以由GPU执行。该MTLCommandQueue协议控制MTLCommandBuffer执行提交对象中的命令,相对于MTLCommandBuffer已在命令队列中的其他对象。
图2-1显示了命令队列,命令缓冲区和命令编码器对象如何紧密相关。图表顶部的每一列组件(缓冲区,纹理,采样器,深度和模板状态,流水线状态)表示特定于特定命令编码器的资源和状态。
图2-1 Metal对象关系设备对象表示GPU
一个MTLDevice对象表示一个GPU能够执行的命令。该MTLDevice协议具有创建新的命令队列,从内存分配缓冲区,创建纹理以及查询设备功能的方法。要获取系统上的首选系统设备,请调用该MTLCreateSystemDefaultDevice功能。
Metal的瞬态和非瞬态物体
Metal中的某些物体被设计为瞬态且极其轻便,而其他物体则开销更大,并且可以持续很长时间,也许在该应用的曾哥生命周期中。
命令缓冲区和命令编码器对象是瞬态的,并且设计用于单次使用。它们非常便宜地分配和释放,所以他们的创建方法返回自动释放的对象。
以下对象不是暂时的。在性能敏感代码中重用这些对象,并避免重复创建它们。
- 命令队列
- 数据缓冲区
- 纹理
- 采样器状态
- Libraries
- 计算状态
- 渲染管道状态
- 深度/模板状态
命令队列
命令队列接受GPU执行的命令缓冲区的有序列表。发送到单个队列的所有命令缓冲区都保证以命令缓冲区入队的顺序执行。通常,命令队列是线程安全的,并且允许多个活动命令缓冲器被同时编码。
要创建一个命令队列,请调用对象的newCommandQueue方法或newCommandQueueWithMaxCommandBufferCount:方法MTLDevice。
一般来说,命令队列预计会长期存在,因此不应该重复创建和销毁。
命令缓冲区
命令缓冲区存储编码的命令,直到缓冲区被提交以供GPU执行。单个命令缓冲区可以包含许多不同类型的编码命令,这取决于用于构建它的编码器的数量和类型。在典型的应用程序中,即使呈现该帧涉及多个渲染遍,计算处理函数或blit操作,整个渲染帧也被编码为单个命令缓冲区。
命令缓冲区是暂时的一次性对象,不支持重用。一旦命令缓冲区被提交执行,唯一有效的操作是等待命令缓冲区被调度或完成 - 通过在命令缓冲区执行的注册处理程序块中讨论的同步调用或处理程序块,并检查命令缓冲区执行。
命令缓冲区还表示应用程序唯一可独立追踪的工作单元,并且它们定义了Metal存储器模型建立的一致性边界,如资源对象:缓冲区和纹理中所详述。
创建命令缓冲区
要创建MTLCommandBuffer对象,请调用commandBuffer方法MTLCommandQueue。一个MTLCommandBuffer对象只能提交到MTLCommandQueue创建它的对象。
由该commandBuffer方法创建的命令缓冲区将保留执行所需的数据。对于某些情况,在执行MTLCommandBuffer对象期间,在其他地方持有这些对象的保留,您可以通过调用commandBufferWithUnretainedReferences方法来创建命令缓冲区MTLCommandQueue。使用该commandBufferWithUnretainedReferences方法仅用于极其重要的性能关键型应用程序,这些应用程序可以保证关键对象在命令缓冲区执行完成之前在应用程序的其他位置都有引用 否则,不再具有其他引用的对象可能会被过早释放,并且命令缓冲区执行的结果未定义。
执行命令
该MTLCommandBuffer协议使用以下方法在命令队列中建立命令缓冲区的执行顺序。命令缓冲区在提交之前不会开始执行。一旦提交,命令缓冲区按照它们排队的顺序执行。
-
该enqueue方法在命令队列中为命令缓冲区保留一个位置,但不提交执行命令缓冲区。当此命令缓冲区最终提交时,它将在关联的命令队列中的任何先前入队的命令缓冲区之后执行。
-
该commit方法使命令缓冲区尽快执行,但在同一命令队列中的任何先前入队的命令缓冲区都被提交之后。如果命令缓冲区以前没有排队,commit则进行隐式enqueue调用。
有关使用enqueue多个线程的示例,请参阅多线程,命令缓冲区和命令编码器。
注册处理程序块用于命令缓冲区执行
下面MTLCommandBuffer列出的方法监视命令执行。在未定义的线程上按执行顺序调用计划和完成的处理程序。在这些处理程序中执行的任何代码都应该快速完成; 如果需要花费昂贵或者阻塞的工作,将工作推迟到另一个线程。
-
该addScheduledHandler:方法在调度命令缓冲区时注册要调用的代码块。当系统中其他对象或其他API 提交的工作之间的任何依赖关系得到满足时,命令缓冲区将被视为安排的
MTLCommandBuffer。您可以为命令缓冲区注册多个计划的处理程序。 -
该waitUntilScheduled方法在调度命令缓冲区之后同步等待并返回,并且该addScheduledHandler:方法注册的所有处理程序都完成。
-
该addCompletedHandler:方法在设备完成命令缓冲区的执行后立即注册要立即调用的代码块。您可以为命令缓冲区注册多个完成的处理程序。
-
该waitUntilCompleted方法在设备完成命令缓冲区的执行后同步等待并返回,并且返回了由该addCompletedHandler:方法注册的所有处理程序。
该presentDrawable:方法是完成处理程序的特殊情况。CAMetalDrawable当调度命令缓冲区时,这种方便方法呈现可显示资源(对象)的内容。有关该presentDrawable:方法的详细信息,请参阅与Core Animation集成:CAMetalLayer。
监视命令缓冲区执行状态
只读status属性包含MTLCommandBufferStatus列出的枚举值Command Buffer Status Codes,反映了此命令缓冲区的生命周期中的当前调度阶段。如果执行成功完成,则只读error属性的值为nil。如果执行失败,则status设置为MTLCommandBufferStatusError,并且error属性可能包含列出的值Command Buffer Error Codes,表示失败的原因。
命令编码器
命令编码器是一个瞬态对象,您可以使用一次将命令和状态写入GPU可以执行的格式的单个命令缓冲区。许多命令编码器对象方法将命令附加到命令缓冲区。当命令编码器处于活动状态时,它具有为其命令缓冲区附加命令的专有权限。完成编码命令后,调用该endEncoding方法。要写入其他命令,请创建一个新的命令编码器。
创建命令编码器对象
因为命令编码器将命令附加到特定的命令缓冲区中,所以您可以通过从MTLCommandBuffer要使用它的对象请求一个命令来创建命令编码器。使用以下MTLCommandBuffer方法创建每种类型的命令编码器:
-
该renderCommandEncoderWithDescriptor:方法创建一个MTLRenderCommandEncoder用于图形呈现到一个附件的对象MTLRenderPassDescriptor。
-
该computeCommandEncoder方法创建一个MTLComputeCommandEncoder用于数据并行计算的对象。
-
该blitCommandEncoder方法创建一个MTLBlitCommandEncoder用于内存操作的对象。
-
该parallelRenderCommandEncoderWithDescriptor:方法创建一个MTLParallelRenderCommandEncoder对象,使MTLRenderCommandEncoder对象能够在不同的线程上运行,同时仍然呈现给在共享中指定的附件MTLRenderPassDescriptor。
渲染命令编码器
图形渲染可以在来描述渲染通道。一个MTLRenderCommandEncoder对象表示与单个渲染过程相关联的渲染状态和绘制命令。AMTLRenderCommandEncoder需要包含作为渲染命令的目的地的颜色,深度和模板附件的关联MTLRenderPassDescriptor(描述在创建渲染通过描述符中)。将MTLRenderCommandEncoder有以下方法:
-
指定包含顶点,片段或纹理图像数据的图形资源,如缓冲区和纹理对象
-
指定MTLRenderPipelineState包含编译渲染状态的对象,包括顶点和片段着色器
-
指定固定功能状态,包括视口,三角形填充模式,剪刀矩形,深度和模板测试以及其他值
-
绘制3D图元
有关MTLRenderCommandEncoder协议的详细信息,请参阅图形渲染:渲染命令编码器。
计算命令编码器
对于数据并行计算,该MTLComputeCommandEncoder协议提供了在命令缓冲区中对可以指定计算函数及其参数(例如,纹理,缓冲区和采样器状态)进行编码的命令的方法,并分派计算函数执行。要创建一个计算命令编码器对象,请使用以下computeCommandEncoder方法MTLCommandBuffer。有关MTLComputeCommandEncoder方法和属性的详细信息请参见数据并行计算处理:计算命令编码器。
Blit命令编码器
该MTLBlitCommandEncoder协议具有追加缓冲区(MTLBuffer)和纹理(MTLTexture)之间的内存复制操作的命令的方法。该MTLBlitCommandEncoder协议还提供了一些方法,以填补与纯色纹理和生成的mipmap。要创建blit命令编码器对象,请使用blitCommandEncoder方法MTLCommandBuffer。有关MTLBlitCommandEncoder方法和属性的详细信息,请参阅缓冲区和纹理操作:Blit命令编码器。
多线程,命令缓冲区和命令编码器
大多数应用程序使用单个线程来编码单个命令缓冲区中单个帧的渲染命令。在每一帧结束时,您提交命令缓冲区,这两个调度计划都将执行。
如果要并行化命令缓冲区编码,则可以同时创建多个命令缓冲区,并使用单独的线程对每个缓冲区进行编码。如果您提前知道命令缓冲区应该执行什么顺序,那么该enqueue方法MTLCommandBuffer可以在命令队列中声明执行顺序,而无需等待命令被编码和提交。否则,当提交命令缓冲区时,在任何先前入队的命令缓冲区之后,将在命令队列中分配一个位置。
时间只有一个CPU线程可以访问命令缓冲区。多线程应用程序可以使用每个命令缓冲区中的一个线程并行创建多个命令缓冲区。
图2-2显示了三个线程的示例。每个线程都有自己的命令缓冲区。对于每个线程,一次一个命令编码器可以访问其关联的命令缓冲区。图2-2还显示了每个命令缓冲区从不同的命令编码器接收命令。完成编码后,调用endEncoding命令编码器的方法,然后新的命令编码器对象可以开始将命令编码到命令缓冲区。
图2-2 具有多个线程的Metal命令缓冲区一个MTLParallelRenderCommandEncoder对象允许单个渲染通过在多个命令编码器之间分解并分配给单独的线程。有关详细信息MTLParallelRenderCommandEncoder,请参阅使用多个线程编码单个渲染传递。