SurfaceFlinger模块
SurfaceFlinger是一个系统服务,作用就是接受不同layer的buffer数据进行合成,然后发送到显示设备进行显示。
SurfaceFlinger进程是什么时候起来的?
在之前的Android低版本手机上,SurfaceFlinger进程是在init.rc中启动的,在最新的高版本上SurfaceFlinger进程并不是直接在init.rc文件中启动的,而是通过Android.bp去启动surfaceflinger.rc文件,然后解析文件内容启动SurfaceFlinger进程。
/framework/native/services/surfaceflinger/surfaceflinger.rc
service surfaceflinger /system/bin/surfaceflinger
class core animation
user system
group graphics drmrpc readproc
capabilities SYS_NICE
onrestart restart zygote
task_profiles HighPerformance
socket pdx/system/vr/display/client stream 0666 system graphics u:object_r:pdx_display_client_endpoint_socket:s0
socket pdx/system/vr/display/manager stream 0666 system graphics u:object_r:pdx_display_manager_endpoint_socket:s0
socket pdx/system/vr/display/vsync stream 0666 system graphics u:object_r:pdx_display_vsync_endpoint_socket:s0
关于init.rc文件的解析和Android.bp编译脚本的执行本文不做深入研究,启动SurfaceFlinger进程,就会执行到main函数。
/services/surfaceflinger/Main_surfaceflinger.cpp
关于main函数中,有几个关键的点需要关注。
-
ProcessState::self() 函数的调用,个人理解是同binder驱动建立链接,获取驱动的版本,通知驱动,同时启动线程来处理Client的请求,总结如下:
(1)构建ProcessState全局对象gProcess
(2)打开binder驱动,建立链接
(3)在驱动内部创建该进程的binder_proc,binder_thread结构,保存该进程的进程信息和线程信息,并加入驱动的红黑树队列中。
(4)获取驱动的版本信息
(5)把该进程最多可同时启动的线程告诉驱动,并保存到改进程的binder_proc结构中
(6)把设备文件/dev/binder映射到内存中 -
设置SurfaceFlinger进程的优先级
setpriority(PRIO_PROCESS, 0, PRIORITY_URGENT_DISPLAY); set_sched_policy(0, SP_FOREGROUND); if(cpusets_enabled()){ set_cpuset_policy(0, SP_SYSTEM); }
关于cpuset的使用,有一些简单的命令如下:
查看cpuset的所有分组
adb shell ls -l /dev/cpuset查看system-background的cpuset的cpu
adb shell cat /dev/cpuset/system-background/cpus查看system-background的应用
adb shell cat /dev/cpuset/system-background/tasks查看SurfaceFlinger的cpuset
adb shell 'cat /proc/(pid of surfaceflinger)/cpuset'
可以自定义cpuset,就是可以根据各自的需求,动态配置自定义的cpuset,例如SurfaceFlinger的线程默认跑到4个小核上,假如有个需求要把SurfaceFlinger的线程跑到大核上,就可以配置自定义cpuset,在进入某个场景的时候,把SurfaceFlinger进程pid配置到自定义的cpuset的tasks中。
3 初始化SurfaceFlinger
// 实例化 SurfaceFlinger
sp<SurfaceFlinger> flinger = surfaceflinger::createSurfaceFlinger();
// 初始化 SurfaceFlinger
flinger->init();
// 将 SurfaceFlinger添加到 ServiceManager 进程中
sp<IServiceManager> sm(defaultServiceManager());
sm->addService(String16(SurfaceFlinger::getServiceName()), flinger, false, IServiceManager::DUMP_FLAG_PRIORITY_CRITICAL | IServiceManager::DUMP_FLAG_PROTO);
//启动 DisplayService
startDisplayService();
// 启动 SurfaceFlinger
flinger->run();
实例化 SurfaceFlinger
有个SurfaceFlingerFactory.cpp,设计模式中的工厂类,在该头文件中定义了好多创建不同对象的函数。
/frameworks/native/services/surfaceflinger/SurfaceFlingerFactory.cpp
sp<SurfaceFlinger> createSurfaceFlinger() {
static DefaultFactory factory;
return new SurfaceFlinger(factory);
}
通过createSurfaceFlinger()方法创建了一个SurfaceFlinger对象。
/frameworks/native/services/surfaceflinger/SurfaceFlinger.h
class SurfaceFlinger : public BnSurfaceComposer,
public PriorityDumper,
private IBinder::DeathRecipient,
private HWC2::ComposerCallback,
private ISchedulerCallback
SurfaceFlinger继承BnSurfaceComposer,实现ISurfaceComposer接口,实现ComposerCallback,PriorityDumper是一个辅助类,提供了SurfaceFlinger的dump信息。
关于ISurfaceComposer的接口定义和实现,本文不做细节描述。
image-20220506103643934.png- ISurfaceComposer 是Client端对SurfaceFlinger进程的binder接口调用。
- ComposerCallback,这个是HWC模块的回调,这个包含了三个很关键的回调函数,onComposerHotplug函数表示显示屏热插拔事件, onComposerHalRefresh函数表示Refresh事件,onComposerHalVsync表示Vsync信号事件。
接下来分析SurfaceFlinger的构造函数。
在SurfaceFlinger中的构造方法中,初始化了很多全局变量,有一些变量会直接影响整个代码的执行流程,而这些变量都可以在开发者模式中去更改它,SurfaceFlinger作为binder的服务端,设置应用中的开发者模式做为Client端进行binder调用去设置更改,主要是为了调试测试,其中还包含芯片厂商高通的一些辅助功能。
初始化 SurfaceFlinger
实例化SurfaceFlinger对象之后,调用init方法,这个方法有几个比较重要的代码。
- 构造SkiaRenderEngine渲染引擎
mCompositionEngine->setRenderEngine(renderengine::RenderEngine::create(
renderengine::RenderEngineCreationArgs::Builder()
.setPixelFormat(static_cast<int32_t>(defaultCompositionPixelFormat))
.setImageCacheSize(maxFrameBufferAcquiredBuffers)
.setUseColorManagerment(useColorManagement)
.setEnableProtectedContext(enable_protected_contents(false))
.setPrecacheToneMapperShaderOnly(false)
.setSupportsBackgroundBlur(mSupportsBlur)
.setContextPriority(
useContextPriority
? renderengine::RenderEngine::ContextPriority::REALTIME
: renderengine::RenderEngine::ContextPriority::MEDIUM)
.build()));
在Android S版本之前,这块的绘制流程都是OpenGL ES实现的,在Android S版本上这块逻辑已经切换到Skia库进行绘制,mCompositionEngine这个类比较重要,主要负责Layer的Client合成,Client合成就是GPU合成。目前Layer的合成方式有两种,一个是GPU合成,一个是HWC合成,针对Skia库的研究有单独的章节进行讲解。
-
构造Vsync
// Process any initial hotplug and resulting display changes. processDisplayHotplugEventsLocked();
在init方法中,重点看这个函数中调用了initScheduler方法。
// start the EventThread
mScheduler = getFactory().createScheduler(*mRefreshRateConfigs, *this);
const auto configs = mVsyncConfiguration->getCurrentConfigs();
const nsecs_t vsyncPeriod = currRefreshRate.getPeriodNsecs();
mAppConnectionHandle =
mScheduler->createConnection("app", mFrameTimeline->getTokenManager(),
/*workDuration=*/configs.late.appWorkDuration,
/*readyDuration=*/configs.late.sfWorkDuration,
impl::EventThread::InterceptVSyncsCallback());
mSfConnectionHandle =
mScheduler->createConnection("appSf", mFrameTimeline->getTokenManager(),
/*workDuration=*/std::chrono::nanoseconds(vsyncPeriod),
/*readyDuration=*/configs.late.sfWorkDuration,
[this](nsecs_t timestamp) {
mInterceptor->saveVSyncEvent(timestamp);
});
mEventQueue->initVsync(mScheduler->getVsyncDispatch(), *mFrameTimeline->getTokenManager(),
configs.late.sfWorkDuration);
图中是initScheduler方法中几个关键的代码,该代码和Vsync研究密切相关,当分析研究SurfaceFlinger的合成流程,也就最核心的流程,其触发条件就是由Vsync控制的,Vsync很像一个节拍器,SurfaceFlinger中每一帧的合成都需要跟随节拍器,太快或者太慢都会导致屏幕显示异常,一般表现为画面卡顿,不流畅,关于Vsync的研究有独立章节进行讲解。
- 举例讲解一个init函数中高通一个so库的加载
char layerExtProp[PROPERTY_VALUE_MAX];
property_get("vendor.display.use_layer_ext", layerExtProp, "0");
if(atoi(layerExtProp)){
mUseLayerExt = true;
}
当把vendor.display.use_layer_ext中配置成1,就会把mUseLayerExt的变量置为true,这个变量代表SurfaceFlinger使用liblayerext.qti.so。这个so库是判断当前的Layer是不是游戏的Layer,当这个库加载成功之后,BufferLayer在构造函数中初始化mLayerClass的变量。
if(mFlinger->mLayerExt){
mLayerClass = mFlinger -> mLayerExt ->GetLayerClass(mName);
}
当mLayerClass被初始化成功之后,第三方应用可以通过binder调用,查询SurfaceFlinger进程这个应用的Layer是不是游戏的Layer。在最新的Android S版本有个AppClassifierApk应用需要启动,如果被禁止会导致Layer类型判断出现问题,这个应用是高通实现的,也是闭源的,它会监听应用的安装广播,在数据库中记录安装应用的类别信息。鉴于芯片厂商植入的功能很多时候都会造成性能问题,默认都会关闭掉。
- 将SurfaceFlinger添加到 ServiceManager进程中
SurfaceFlinger模块提供很多binder接口,在服务端的onTransact函数会根据Client端传递的code做不同的代码处理,下图是onTransact函数中一处code的处理。
case 1034: {
switch (n = data.readInt32()) {
case 0:
case 1:
enableRefreshRateOverlay(static_cast<bool>(n));
break;
default: {
Mutex::Autolock lock(mStateLock);
reply->writeBool(mRefreshRateOverlay != nullptr);
}
}
return NO_ERROR;
}
这个code是1034的逻辑,是那个Client端调用过来的呢?
是设置应用中的开发者模式页面中的功能,搜索了Settings应用中关于1034的逻辑,找到了一处代码包含这段逻辑。
/Settings/src/com/android/settings/development/ShowRefreshRatePreferenceController.java
private static final String SHOW_REFRESH_RATE_KEY = "show_refresh_rate";
@VisibleForTesting
static final int SURFACE_FLINGER_CODE = 1034;
public ShowRefreshRatePreferenceController(Context context) {
super(context);
mSurfaceFlinger = ServiceManager.getService(SURFACE_FLINGER_SERVICE_KEY);
}
@VisibleForTesting
void updateShowRefreshRateSetting() {
// magic communication with surface flinger.
try {
if (mSurfaceFlinger != null) {
final Parcel data = Parcel.obtain();
final Parcel reply = Parcel.obtain();
data.writeInterfaceToken(SURFACE_COMPOSER_INTERFACE_KEY);
data.writeInt(SETTING_VALUE_QUERY);
mSurfaceFlinger.transact(SURFACE_FLINGER_CODE, data, reply, 0 /* flags */);
final boolean enabled = reply.readBoolean();
((SwitchPreference) mPreference).setChecked(enabled);
reply.recycle();
data.recycle();
}
} catch (RemoteException ex) {
// intentional no-op
}
}
从上面的代码可以看到,App端对SurfaceFlinger进程进行了binder通讯。
- 启动 SurfaceFlinger
void SurfaceFlinger::run() {
while (true) {
mEventQueue->waitMessage();
}
}
void SurfaceFlinger::onFirstRef() {
mEventQueue->init(this);
}
在前面介绍的main函数,SurfaceFlinger对象是一个智能指针,sp强引用指针。该智能指针在第一次引用的时候,会调用onFirstRef方法,进一步实例化内部需要的对象,这个方法调用了mEventQueue的init方法,而这个对象就是线程安全的MessageQueue对象。
SurfaceFlinger中的MessageQueue和Android应用层开发的MessageQueue设计非常相似,只是个别角色做的事情稍微有一点不同。
SurfaceFlinger的MessageQueue机制的角色:
- MessageQueue 同样做为消息队列向外暴露接口,不像应用层的MessageQueue一样作为Message链表的队列缓存,而是提供了相应的发送消息的接口以及等待消息方法。
- native的Looper是整个MessageQueue的核心,以epoll_event为核心,event_fd为辅助构建一套快速的消息回调机制。
- native的Handler则是实现handleMessage方法,当Looper回调的时候,将会调用Handler中的handleMessage方法处理回调函数。
MessageQueue init
/frameworks/native/services/surfaceflinger/Scheduler/MessageQueue.cpp
void MessageQueue::init(const sp<SurfaceFlinger>& flinger) {
mFlinger = flinger;
mLooper = new Looper(true);
mHandler = new Handler(*this);
}
该init方法中实例化了Looper和Handle。
void MessageQueue::Handler::handleMessage(const Message& message) {
switch (message.what) {
case INVALIDATE:
mEventMask.fetch_and(~eventMaskInvalidate);
mQueue.mFlinger->onMessageReceived(message.what, mVsyncId, mExpectedVSyncTime);
break;
case REFRESH:
mEventMask.fetch_and(~eventMaskRefresh);
mQueue.mFlinger->onMessageReceived(message.what, mVsyncId, mExpectedVSyncTime);
break;
}
}
在上面的回调函数,可以看到注册了两种不同的刷新监听,一个是invalidate刷新,一个是refresh刷新。它们最后都会回调到SurfaceFlinger中的onMessageReceived中,换句话说,每当我们需要图元刷新的时候,就会通过mEventQueue的post方法,回调到SurfaceFlinger的主线程进行合成刷新。
以上就是SurfaceFlinger进程初始化的过程,中间提到了一些比较重要的类或者对象,接下来会通过几个章节对SurfaceFlinger进程中比较核心的逻辑进行代码讲解。
- 第1章 Vsync研究
- 第2章 BufferQueue研究
- 第3章 SurfaceFlinger动画研究
- 第4章 SurfaceFlinger主流程研究
- 第5章 HWC研究
- 第6章 Android显示流程研究
- 第7章 Skia库研究
- 第8章 截图/录屏流程研究