一口气看懂 Android 操作系统架构 ——从“高层 App”一路挖到 “内核深处”-开发者社区

文章摘要

本文用通俗易懂的方式解析Android操作系统架构，将其形象比喻为一栋四层大楼：顶层是应用层（各类App）；中间两层是应用框架层（系统服务）和系统库+运行时（基础设施）；底层是Linux内核（地基）。文章重点阐述各层功能及协作关系，如App通过框架层调用系统服务，再经Native库访问内核驱动。同时解答了Android跨硬件兼容性原理，以及从点击图标到界面显示的全流程系统交互，帮助读者建立对Android架构的整体认知，理解其分层设计思想。

先说目标：

这篇文章想做的，不是给你背一遍课本里那张“Android 系统架构四层图”，
而是用尽量接地气的话，把下面几个问题讲清楚：

你手里的安卓手机，看上去就是刷视频、回微信、玩游戏。但背后其实是一个挺复杂的大系统：

要管应用怎么装、怎么跑、怎么互相隔离；
要管电量、内存、网络、摄像头、传感器；
还要防护安全、控制权限、保证不卡太死。

这些东西如果全堆一起写成一坨，那软件早就烂掉了。
所以 Android 一开始就做了一个非常关键的选型：

基于 Linux 内核 + 分层架构 + 组件化服务。

你可以把它想象成一栋大楼：

最地下：Linux 内核，负责最底层“土地”和“地基”（进程、内存、驱动…）
地下一层：C/C++ 系统库 + HAL 硬件抽象层，连通内核和上层世界
中间几层：Android Runtime（ART/Dalvik）、Framework（各种系统服务）
楼上：你看得见的 App（Activity、Service、Broadcast、ContentProvider…）

这篇文章就带你从上到下、从外到内，把这栋楼好好逛一遍：

先整体看：Android 标准架构一张图
App 层：你写的代码到底跑在谁的头上？
Framework 层：系统服务的大管家们怎么协同？
Runtime 层：ART / Dalvik 虚拟机干嘛用？
Native 层：C/C++ 的那些库为啥都长在这？
HAL 层：OEM 厂商怎么在同一套 Android 上玩出不同硬件？
Linux 内核层：Android 为什么选 Linux，当年加了哪些 Android 特性？
整体设计哲学：为什么要这样分层？优缺点在哪？
对应用开发者有什么实在影响？

一、Android 架构概览：先有一整张“大地图”

教科书级的官方图，你可能看过类似这样的（用文字描述一下）：

最底层：
- Linux Kernel（Linux 内核）
往上一层：
- Hardware Abstraction Layer（HAL）硬件抽象层
- 旁边躺着一堆用 C/C++ 写的Native Libraries（比如 libc、OpenGL、WebKit、Media 等）
再上一层：
- Android Runtime（ART / Dalvik + Core Libraries）
再往上：
- Application Framework（Java/Kotlin 的各种系统服务：ActivityManager、PackageManager、WindowManager、Telephony 等）
顶层：
- Applications（系统应用 + 三方应用：电话、短信、浏览器、微信、抖音…）

简单类比一下：

Linux Kernel：地基 + 水电总阀门
HAL：各种“转换器”和“适配器”，让不同硬件都能接上标准接口
Native Libraries：水电设备、锅炉、空调机组（音视频、图形、数据库等底层库）
Runtime：一个房间里统一的“电压标准”和“插座形状”（虚拟机 + 核心库）
Framework：楼里各个管理处（物业、保安、清洁、前台）
Apps：住户（游戏、应用），通过物业提供的服务生活

这就是 Android 的大框架。

二、最上层：应用层（Applications）——你摸得到的世界

这层就是你最熟的地方：

系统应用：电话、通讯录、短信、相机、设置、浏览器…
第三方应用：微信、抖音、微博、淘宝、游戏等等

从架构视角看，应用层有几个特点：

每个 App 是一个独立的 Linux 进程
- 进程名一般为包名，如com.example.app
- 每个进程有自己的 UID（用户 ID），通过 Linux 权限机制隔离
- 进程之间默认不能随便读写对方文件、内存
App 主要用 Java/Kotlin 写（逻辑层），部分会用到 C/C++（Native）
- Java/Kotlin 代码运行在 ART 虚拟机上
- C/C++ 通过 JNI 调用（比如游戏用 C++ 的图形引擎）
App 并不是“想干什么就干什么”，而是要通过 Framework 提供的 API 来做事
- 比如启动 Activity / Service，要找 ActivityManagerService
- 发通知要走 NotificationManager
- 获取定位要走 LocationManager（同时受权限系统控制）

可以这样理解：

App 并不是在直接动“系统地基”，
而是在“楼上租的房间”，所有水电煤、物业服务都必须通过“大楼统一的管理中心”来申请：
这就是下文要讲的 Application Framework。

三、Application Framework：Android 系统服务的大脑

这一层，就是 Android 架构的核心大脑。
所有 App 做“系统级操作”，都要通过这里的 API。

3.1 Framework 主要包括什么？

你在 app 里常用的android.*API，就是这一层暴露出来的“外壳”。
背后对应的是一个个“系统服务”（多运行在system_server进程中）。

常见的服务有：

ActivityManagerService (AMS)
- 管理四大组件（Activity、Service、BroadcastReceiver、ContentProvider）
- 处理生命周期：onCreate/onStart/onResume/onPause/OnStop 等
- 负责任务栈、最近任务列表、多任务切换
PackageManagerService (PMS)
- 管理应用安装、卸载、更新
- 解析 APK 的 AndroidManifest.xml
- 处理权限声明（uses-permission）
WindowManagerService (WMS)
- 管理所有窗口（Activity、对话框、Toast 等）
- 决定谁在上面、谁在下面、如何布局
- 和 SurfaceFlinger 协作完成绘制
LocationManagerService：定位服务
NotificationManagerService：通知栏管理
TelephonyManagerService：电话、短信等
PowerManagerService：电源、休眠、亮屏灭屏
BatteryService / AlarmManagerService / InputManagerService等等

这些服务的共性：

运行在系统进程system_server中
对外通过 Binder 提供 IPC（进程间通信）接口
提供给 App 的 Java API，本质上是这些服务的“代理类”

3.2 Framework 为什么这么设计？

你可以把 Framework 看成：

一座大楼里的“总物业管理中心 + 各职能部门”。

AMS：管理入住/搬家/打扫（Activity 生命周期）
WMS：管你窗户怎么开、谁挡谁
PMS：管你能不能入住（安装应用）、有没有资质（权限）
其他服务：电、网、电话、安保…

这样做有几个明显好处：

集中控制，便于策略统一
- 比如后台进程太多了，AMS 可以统一根据内存情况 kill 一部分
- WMS 可以根据前台应用优先级决定绘制顺序
权限可控，防止 App 为所欲为
- App 想打电话 → TelephonyManagerService 检查权限、运营商状态
- App 想访问通讯录 → 通过 ContentProvider + 权限判断
底层变化，上层 API 尽量保持稳定
- 比如硬件厂商更换底层驱动，只要 HAL 层适配好了，Framework 层不必大改
- App 层使用的 API 尽量保持兼容性

3.3 Framework 和 App 是怎么“说话”的？

通信机制的关键字：Binder

App 里的 Java API 调用 → 通过 Binder 代理 → 跨进程调用 Framework 里的 Service → 再往 Native / HAL / Kernel 层走

大致过程：

App 调用Context.startActivity()
ActivityManager（Java 封装）把请求透给 AMS（ActivityManagerService）
两者不在同一个进程，通过 Binder IPC 进行通信
AMS 决定如何启动目标 Activity（可能在另一个进程）
最终调度新进程、调用应用中的 Activity 对象的生命周期方法

重要点：

Framework 层通过 Binder 实现了一套“远程调用”的机制
对 App 来说，看起来就像本地调用 Java 方法，不需要自己写 socket 或管 IPC。

四、Android Runtime：ART / Dalvik，这个虚拟机干嘛的？

Android Runtime 这一层主要有两部分：

ART/Dalvik 虚拟机：执行字节码
核心 Java 类库：如java.lang,java.util,android.os等基础库

4.1 为什么需要虚拟机？

如果让你直接在 Linux 上写 C/C++ 应用，一样可以跑，但有几个问题：

用 C/C++ 写大规模应用容易出各种内存错误（泄漏、越界、悬垂指针）
各种 CPU 架构（ARM、x86、MIPS…），每个平台都要重新编译
安全隔离更难，容易出现程序把系统搞崩的情况

Java（和后来的 Kotlin）+ 虚拟机的方案好处是：

一份字节码，多平台执行
改善内存安全（GC 垃圾回收）
更容易做沙箱（限制应用哪些 API 可以用）

所以 Android 把 App 的大部分逻辑放在 Java/Kotlin + 虚拟机上跑。

4.2 Dalvik vs ART：简略差别

早期 Android 使用的是Dalvik VM，后来被ART（Android Runtime）取代。

简单对比：

Dalvik：
- 主要用JIT（Just-In-Time）即时编译（或者解释执行）
- 每次运行时把部分字节码编成机器码
ART：
- 加入AOT（Ahead-of-Time）预编译 + JIT 混合模式
- 安装应用时就把大部分字节码预编译为本地机器码（.oat 文件）
- 运行时按需要动态优化

目的：

提升启动速度、运行速度
降低电量消耗
更好控制内存和 GC 的行为

4.3 Runtime 在架构中的位置

App 的 Java/Kotlin 代码 → 编译成 .dex 字节码 → 由 ART 加载并执行
ART 通过 JNI 调用 Native Libraries
ART 自己也依赖 Linux 提供的低层操作（线程、内存、信号等）

你可以把 ART 想象成：

一层“统一电压 + 插口标准”的适配器：
上面所有 App 插上来都能用，底下真正供电的还是 Linux + 硬件。

五、Native Libraries：C/C++ 世界里的“功能机房”

这一层主要是用 C/C++ 写的一堆库，高性能、紧贴硬件。
Android 中很多关键功能其实都在这里实现，只是在上面包了一层 Java 外壳。

常见的 Native 库：

libc（Bionic）：Android 自己的 C 运行库，轻量版的 glibc
libm：数学库
OpenGL ES：图形渲染相关
WebKit / Blink：浏览器渲染引擎（早期 WebKit，现在多 Chromium/Blink）
SQLite：轻量级数据库
libmedia / libaudio / libcamera：音视频、音频输出、摄像头访问等
SSL / Crypto：安全加密库

大部分系统服务和 App，用 Java 调一圈后，最终会落到这些 Native 库来干活。
比如：

你用MediaPlayer播放视频 → Java API → 底下是 C/C++ 实现的解码和渲染
你用Canvas画东西 → Java API → 最终调 OpenGL ES / Skia 之类的底层库

为什么要用 C/C++？

性能需求高：音视频解码、图形渲染调度等
需要直接操作硬件和内核接口
C/C++ 生态里已经有成熟的现成库（比如 SQLite）

Native 层，是 Java 世界和内核世界之间的重要桥梁。

六、HAL（硬件抽象层）：OEM 厂商的“适配器”

Android 要跑在各种硬件上：

不同的 CPU（ARM、x86…）
不同的屏幕、摄像头、传感器、指纹、NFC、音频芯片…

如果直接让 Framework 调内核驱动，那每家的驱动长得一模一样，这不现实。
于是 Android 设计了一个中间层：HAL（Hardware Abstraction Layer）。

6.1 HAL 是干啥的？

一句话：

把“硬件细节”藏起来，给上层提供统一、标准的接口。

Google 定义“一套接口规范”：比如摄像头 HAL 要提供哪些函数、音频 HAL 要提供哪些接口
设备厂商（OEM）按照这个规范，用 C/C++ 实现对应的 HAL 模块
Framework 调 HAL，不管底下用的是哪家的摄像头/音频芯片

好比：

你在厨房想烧水，不需要管楼里到底是电水壶还是燃气热水器，
只要你打开龙头，就有热水 —— HAL 把“热水设备”抽象成统一接口。

6.2 HAL 和内核驱动的关系

通常：

最底下是内核驱动（Kernel Driver）：直接操作硬件寄存器、DMA 等
上面是 HAL 模块：封装驱动操作，提供更高级的接口给 Framework / Native Libraries 调用

示意流程（比如摄像头）：

App → Camera API (Java) → CameraService (Framework) → Camera HAL (C++) → Kernel Driver → 硬件

这样做的好处：

Android 系统升级，Framework API 稳定，底层只要 HAL 适配正确，不需要大改
不同厂商可以用自家的硬件，只要实现相同 HAL 接口就行
安全边界更清晰：内核驱动不直接暴露给 App 层

七、最底层：Linux 内核——Android 的地基

Android 运行在一个定制版本的 Linux 内核之上。

选择 Linux 有几个好处：

多用户、安全机制成熟（UID/GID）
进程管理、内存管理、调度器、电源管理都很成熟
驱动生态丰富，方便硬件厂商开发

7.1 Android 对 Linux 做了哪些强化/定制？

早期（特别是 2.x/3.x 时代），Android 给 Linux 加了一堆 patches（补丁），比如：

Binder IPC 机制
- 高效的进程间通信框架
- 支撑上层所有 Service 的调用
- 有点类似轻量版 RPC，结合了内存映射和引用计数
Ashmem（匿名共享内存）
- 一种特殊的共享内存机制，支持按需释放
- 用于 App 之间共享数据，减轻内存压力
Wakelock 电源管理
- 粒度更细的“唤醒锁”，防止设备在不合适时休眠
- 后来这块逐步上游化或改造
低内存杀手（Low Memory Killer / LMKD）
- Android 自己的内存回收策略，用来根据内存压力自动杀后台进程
- 上层 AMS 会与之协作

后来随着 Android 成熟，很多特性合入主线 Linux 内核或被替换重构。

7.2 Linux 内核在架构里的角色

核心职责：

进程 & 线程调度
内存管理 & 虚拟内存
文件系统
网络协议栈
安全机制（SELinux 等）
各种硬件驱动

你可以认为：

Linux 内核 = 整个系统的“地基 + 水电 + 安保队”
其上所有东西（HAL、Native Libs、Runtime、Framework、Apps）都是住进来的租户。

八、Android 整体架构的设计哲学：为什么要这么分层？

说到这里，可以总结一下这套架构设计背后的三个主要目标：

可移植性 & 硬件抽象
- Android 想跑在各种设备：手机、平板、电视、车机、手表…
- Linux 内核+HAL，让硬件差异被隔离在底层，Framework 和 Apps 尽量重用
安全 & 隔离
- Linux 用户/进程隔离 + SELinux
- App 沙箱 + 权限系统 + Binder 控制
- Framework 集中控制系统资源，App 不能直接摸硬件和内核
可演进 & 可维护
- Framework 提供稳定 API，App 开发者跟着 API 做
- 内部各层可以逐步升级与优化（Dalvik -> ART、Binder 改良、驱动更新）

顺带带来的好处：

厂商可以在不破坏整体架构的前提下定制系统（UI、系统级应用、部分 Framework 扩展）
谷歌可以通过 CTS/兼容性测试套件控制 Android 碎片化程度

当然也有代价：

复杂度高，学习曲线陡
不同版本 Android/不同厂商的系统差异，会造成兼容问题
多层抽象带来一定性能损耗（但通过优化和硬件提升，大多可以接受）

九、对应用开发者来说，到底哪些是“必须理解”的？

很多做 App 的同学会说：

“我又不写驱动、不改内核，架构这么底层的东西知道有什么用？”

其实有几个方面对你非常有帮助：

9.1 理解“为什么很多事只能主线程做”

比如：

UI 更新必须在主线程
很多系统 API 只能在主线程调用

原因：

Framework 的很多 Service 调用，以及与 Window/输入系统的交互，都绑定在特定线程
UI 绘制和事件循环本身是单线程模型

理解这一点，你就会：

知道为什么要用 Handler/Looper 切回主线程
知道做耗时操作要放到子线程，避免阻塞主线程事件循环

9.2 理解“进程/内存管理”有助于优化性能

知道几件事：

每个 App 是独立进程，有自己的虚拟机实例
系统根据内存压力会杀后台进程
Service/Activity 不一定一直在内存，随时可能被回收

这会影响你：

怎样合理使用 Service、BroadcastReceiver、JobScheduler
怎样避免在静态变量/单例中持有大对象（容易内存泄漏）
为什么要注意 onSaveInstanceState、onRestore 等生命周期

9.3 理解“Binder 和系统服务”有助于调试问题

比如：

调用 ContentProvider 其实是在走跨进程调用
频繁调用系统服务（比如频繁的 ContentResolver 查询）会有性能成本
出现 “Binder Transaction Failed” 之类错误时你知道这是 IPC 数据太大 / 事务失败

你可以更有意识地：

减少大对象在 Binder 中传递（比如不用 Intent 传巨大 Bitmap）
分批读取数据，避免单次查询过重

9.4 理解 HAL/内核对“兼容性”的影响

写 App 时：

不同厂商设备，摄像头、传感器表现稍有差异
某些特性（如双摄、特殊屏幕）其实是厂商在 HAL / Framework 做的扩展

你就能理解：

为什么同一个 API 在不同机型上的行为有差异
为什么要多做机型适配、容错处理
为什么 Google 通过 Project Treble 等计划，允许底层和上层分区更新，缓解碎片化

十、最后总结：用一句大白话概括这套架构

我们用一段“故事版”来说 Android 架构：

有一块地基（Linux 内核），
上面一层是地产商预制好的“水电接口 + 设备机房”（Native Libraries + HAL），
再往上是物业总部（Android Runtime + 系统服务 Framework），
最上面一层是一间间你看得见的房间（一个个 App）。
住户（App）不能直接自己挖地搞水电，只能给物业打电话（通过 Framework API + Binder），
物业再去协调底下机房、地基，把水电送上来。
这样一来：
安全：住户别乱搞也不会把整个楼搞塌
可维护：底下换新设备，楼上住户感知不到
可扩展：物业可以加新服务（通知栏、分屏、多用户…）
多样性：不同楼盘（厂商）里可以换不同风格装修、设备，只要水电接口统一，就跑的是同一套 Android。

当你从这个视角再看手机上跑的每一个 App，就不再只是一个图标，而是：

在一个大系统里，按规矩向系统申请资源、使用服务的“租户”。

理解整套 Android 架构，不是为了去写内核，而是：

你写的每一句代码、遇到的每一个系统限制，都能找到“背后真正的原因”。
知道哪些事肯定做不到（架构限制），哪些事只是“暂时不知道怎么做”。
优化和调试时，可以更沿着“正确的层级”定位问题。

这就是 Android 操作系统架构设计背后，那套有点复杂但很有逻辑的世界观。

一口气看懂 Android 操作系统架构 ——从“高层 App”一路挖到 “内核深处”