macOS Universal binaries & Mach-O Format

从零开始学习AWS黑客技术，成为专家 htARTE（HackTricks AWS红队专家）！

支持HackTricks的其他方式：

如果您想在HackTricks中看到您的公司广告或下载PDF格式的HackTricks，请查看订阅计划!
获取官方PEASS & HackTricks周边产品
探索PEASS家族，我们的独家NFT收藏品
加入 💬 Discord群 或 电报群 或在Twitter上关注我们 🐦 @carlospolopm。
通过向HackTricks和HackTricks Cloud github仓库提交PR来分享您的黑客技巧。

基本信息

Mac OS二进制文件通常被编译为通用二进制文件。通用二进制文件可以在同一个文件中支持多种架构。

这些二进制文件遵循Mach-O结构，基本上由以下部分组成：

头部
装载命令
数据

Fat Header

使用以下命令搜索文件：mdfind fat.h | grep -i mach-o | grep -E "fat.h$"

#define FAT_MAGIC	0xcafebabe
#define FAT_CIGAM	0xbebafeca	/* NXSwapLong(FAT_MAGIC) */

struct fat_header {
	uint32_t	magic;		/* FAT_MAGIC or FAT_MAGIC_64 */
	uint32_t	nfat_arch;	/* 后面跟随的结构体数量 */
};

struct fat_arch {
cpu_type_t	cputype;	/* CPU指定器（int） */
cpu_subtype_t	cpusubtype;	/* 机器指定器（int） */
uint32_t	offset;		/* 指向该目标文件的文件偏移量 */
uint32_t	size;		/* 该目标文件的大小 */
uint32_t	align;		/* 作为2的幂的对齐 */
};

头部包含魔数字节，后面是文件包含的架构数（nfat_arch），每个架构都将有一个fat_arch结构体。

使用以下命令检查：

% file /bin/ls
/bin/ls: Mach-O universal binary with 2 architectures: [x86_64:Mach-O 64-bit executable x86_64] [arm64e:Mach-O 64-bit executable arm64e]
/bin/ls (for architecture x86_64):	Mach-O 64-bit executable x86_64
/bin/ls (for architecture arm64e):	Mach-O 64-bit executable arm64e

% otool -f -v /bin/ls
Fat headers
fat_magic FAT_MAGIC
nfat_arch 2
architecture x86_64
    cputype CPU_TYPE_X86_64
cpusubtype CPU_SUBTYPE_X86_64_ALL
capabilities 0x0
    offset 16384
    size 72896
    align 2^14 (16384)
architecture arm64e
    cputype CPU_TYPE_ARM64
cpusubtype CPU_SUBTYPE_ARM64E
capabilities PTR_AUTH_VERSION USERSPACE 0
    offset 98304
    size 88816
    align 2^14 (16384)

或使用Mach-O View工具：

正如您可能想到的，通常为2种架构编译的通用二进制文件会使大小翻倍，而为单个架构编译的二进制文件。

Mach-O头部

头部包含有关文件的基本信息，例如用于识别其为Mach-O文件的魔数字节以及有关目标架构的信息。您可以在以下位置找到它：mdfind loader.h | grep -i mach-o | grep -E "loader.h$"

#define	MH_MAGIC	0xfeedface	/* the mach magic number */
#define MH_CIGAM	0xcefaedfe	/* NXSwapInt(MH_MAGIC) */
struct mach_header {
uint32_t	magic;		/* mach magic number identifier */
cpu_type_t	cputype;	/* cpu specifier (e.g. I386) */
cpu_subtype_t	cpusubtype;	/* machine specifier */
uint32_t	filetype;	/* type of file (usage and alignment for the file) */
uint32_t	ncmds;		/* number of load commands */
uint32_t	sizeofcmds;	/* the size of all the load commands */
uint32_t	flags;		/* flags */
};

#define MH_MAGIC_64 0xfeedfacf /* the 64-bit mach magic number */
#define MH_CIGAM_64 0xcffaedfe /* NXSwapInt(MH_MAGIC_64) */
struct mach_header_64 {
uint32_t	magic;		/* mach magic number identifier */
int32_t		cputype;	/* cpu specifier */
int32_t		cpusubtype;	/* machine specifier */
uint32_t	filetype;	/* type of file */
uint32_t	ncmds;		/* number of load commands */
uint32_t	sizeofcmds;	/* the size of all the load commands */
uint32_t	flags;		/* flags */
uint32_t	reserved;	/* reserved */
};

Mach-O 文件类型

有不同的文件类型，你可以在这里的源代码中找到它们的定义。最重要的类型包括：

MH_OBJECT：可重定位目标文件（编译的中间产品，还不是可执行文件）。
MH_EXECUTE：可执行文件。
MH_FVMLIB：固定虚拟内存库文件。
MH_CORE：代码转储。
MH_PRELOAD：预加载的可执行文件（在 XNU 中不再支持）。
MH_DYLIB：动态库。
MH_DYLINKER：动态链接器。
MH_BUNDLE："插件文件"。使用 -bundle 在 gcc 中生成，并由 NSBundle 或 dlopen 显式加载。
MH_DYSM：配套的 .dSym 文件（带有用于调试的符号的文件）。
MH_KEXT_BUNDLE：内核扩展。

# Checking the mac header of a binary
otool -arch arm64e -hv /bin/ls
Mach header
magic  cputype cpusubtype  caps    filetype ncmds sizeofcmds      flags
MH_MAGIC_64    ARM64          E USR00     EXECUTE    19       1728   NOUNDEFS DYLDLINK TWOLEVEL PIE

或者使用Mach-O View：

Mach-O 标志

源代码还定义了几个对加载库有用的标志：

MH_NOUNDEFS: 没有未定义的引用（完全链接）
MH_DYLDLINK: Dyld 链接
MH_PREBOUND: 动态引用预绑定。
MH_SPLIT_SEGS: 文件分割为只读和读写段。
MH_WEAK_DEFINES: 二进制文件具有弱定义的符号
MH_BINDS_TO_WEAK: 二进制文件使用弱符号
MH_ALLOW_STACK_EXECUTION: 使堆栈可执行
MH_NO_REEXPORTED_DYLIBS: 库没有 LC_REEXPORT 命令
MH_PIE: 位置无关可执行文件
MH_HAS_TLV_DESCRIPTORS: 存在具有线程本地变量的部分
MH_NO_HEAP_EXECUTION: 堆/数据页面不执行
MH_HAS_OBJC: 二进制文件具有 Objective-C 部分
MH_SIM_SUPPORT: 模拟器支持
MH_DYLIB_IN_CACHE: 在共享库缓存中使用的 dylibs/frameworks。

Mach-O 加载命令

在这里指定了文件在内存中的布局，详细说明了符号表的位置，执行开始时主线程的上下文以及所需的共享库。提供了有关二进制文件加载到内存中的动态加载器 (dyld) 的指令。

使用了在上述提到的 loader.h 中定义的 load_command 结构。

struct load_command {
uint32_t cmd;           /* type of load command */
uint32_t cmdsize;       /* total size of command in bytes */
};

有大约50种不同类型的加载命令，系统会以不同方式处理。最常见的是：LC_SEGMENT_64、LC_LOAD_DYLINKER、LC_MAIN、LC_LOAD_DYLIB和LC_CODE_SIGNATURE。

LC_SEGMENT/LC_SEGMENT_64

基本上，这种类型的加载命令定义了在执行二进制文件时，根据数据部分中指示的偏移量，如何加载__TEXT（可执行代码）和__DATA（进程数据）段。

这些命令定义了在执行过程中映射到进程的虚拟内存空间中的段。

有不同类型的段，比如**__TEXT段，保存程序的可执行代码，以及__DATA段，包含进程使用的数据。这些段位于Mach-O文件的数据部分**中。

每个段可以进一步划分为多个区块。加载命令结构包含了关于各自段内的这些区块的信息。

在头部首先找到段头：

struct segment_command_64 { /* for 64-bit architectures */
uint32_t	cmd;		/* LC_SEGMENT_64 */
uint32_t	cmdsize;	/* includes sizeof section_64 structs */
char		segname[16];	/* segment name */
uint64_t	vmaddr;		/* memory address of this segment */
uint64_t	vmsize;		/* memory size of this segment */
uint64_t	fileoff;	/* file offset of this segment */
uint64_t	filesize;	/* amount to map from the file */
int32_t		maxprot;	/* maximum VM protection */
int32_t		initprot;	/* initial VM protection */
	uint32_t	nsects;		/* number of sections in segment */
	uint32_t	flags;		/* flags */
};

段头的示例：

此头部定义了在其后出现的区块头的数量：

struct section_64 { /* for 64-bit architectures */
char		sectname[16];	/* name of this section */
char		segname[16];	/* segment this section goes in */
uint64_t	addr;		/* memory address of this section */
uint64_t	size;		/* size in bytes of this section */
uint32_t	offset;		/* file offset of this section */
uint32_t	align;		/* section alignment (power of 2) */
uint32_t	reloff;		/* file offset of relocation entries */
uint32_t	nreloc;		/* number of relocation entries */
uint32_t	flags;		/* flags (section type and attributes)*/
uint32_t	reserved1;	/* reserved (for offset or index) */
uint32_t	reserved2;	/* reserved (for count or sizeof) */
uint32_t	reserved3;	/* reserved */
};

章节标题示例：

如果您将节偏移量（0x37DC）与arch开始的偏移量相加，在本例中为0x18000 --> 0x37DC + 0x18000 = 0x1B7DC

还可以通过命令行获取头部信息。

otool -lv /bin/ls

这个命令加载的常见段有：

* **`__PAGEZERO`：** 它指示内核**映射**地址**零**，因此它**不能被读取、写入或执行**。结构中的maxprot和minprot变量设置为零，表示该页面上**没有读写执行权限**。
* 这种分配对于**缓解空指针解引用漏洞**很重要。这是因为XNU强制执行一个硬页零，确保内存的第一页（仅限第一页）无法访问（除了i386）。一个二进制文件可以通过创建一个小的\_\_PAGEZERO（使用`-pagezero_size`）来满足这些要求，覆盖前4k，并使其余32位内存在用户模式和内核模式下都可访问。
* **`__TEXT`**：包含具有**读取**和**执行**权限的**可执行代码**（不可写入）。此段的常见部分：
* `__text`：已编译的二进制代码
* `__const`：常量数据（只读）
* `__[c/u/os_log]string`：C、Unicode或os日志字符串常量
* `__stubs`和`__stubs_helper`：在动态库加载过程中涉及
* `__unwind_info`：堆栈展开数据。
* 请注意，所有这些内容都经过签名，但也标记为可执行（为不一定需要此特权的部分的利用提供了更多选项，如专用字符串部分）。
* **`__DATA`**：包含**可读**和**可写**的数据（不可执行）。
* `__got`：全局偏移表
* `__nl_symbol_ptr`：非懒惰（加载时绑定）符号指针
* `__la_symbol_ptr`：懒惰（使用时绑定）符号指针
* `__const`：应为只读数据（实际上不是）
* `__cfstring`：CoreFoundation字符串
* `__data`：已初始化的全局变量
* `__bss`：未初始化的静态变量
* `__objc_*`（\_\_objc\_classlist、\_\_objc\_protolist等）：Objective-C运行时使用的信息
* **`__DATA_CONST`**：\_\_DATA.\_\_const不能保证是常量（写入权限），其他指针和GOT也不是。此部分使用`mprotect`使`__const`、一些初始化程序和GOT表（一旦解析）变为**只读**。
* **`__LINKEDIT`**：包含链接器（dyld）的信息，如符号、字符串和重定位表条目。它是一个通用容器，用于存放既不在`__TEXT`也不在`__DATA`中的内容，其内容在其他加载命令中描述。
* dyld信息：重定位、非懒惰/懒惰/弱绑定操作码和导出信息
* 函数起始：函数的起始地址表
* 代码中的数据：\_\_text中的数据岛
* 符号表：二进制文件中的符号
* 间接符号表：指针/存根符号
* 字符串表
* 代码签名
* **`__OBJC`**：包含Objective-C运行时使用的信息。尽管此信息也可能在\_\_DATA段中找到，在各种\_\_objc\_\*部分中。
* **`__RESTRICT`**：一个没有内容的段，只有一个名为**`__restrict`**的部分（也为空），确保运行二进制文件时将忽略DYLD环境变量。

正如代码中所示，**段也支持标志**（尽管它们并不经常使用）：

* `SG_HIGHVM`：仅核心（未使用）
* `SG_FVMLIB`：未使用
* `SG_NORELOC`：段没有重定位
* `SG_PROTECTED_VERSION_1`：加密。例如，Finder用于加密文本`__TEXT`段。

### **`LC_UNIXTHREAD/LC_MAIN`**

**`LC_MAIN`** 包含**entryoff属性**中的入口点。在加载时，**dyld**只需将此值添加到（内存中的）二进制文件的基址，然后**跳转**到此指令以开始执行二进制文件的代码。

**`LC_UNIXTHREAD`** 包含启动主线程时寄存器必须具有的值。这已经被弃用，但**`dyld`**仍在使用它。可以通过以下方式查看此设置的寄存器的值：

otool -l /usr/lib/dyld
[...]
Load command 13
cmd LC_UNIXTHREAD
cmdsize 288
flavor ARM_THREAD_STATE64
count ARM_THREAD_STATE64_COUNT
x0  0x0000000000000000 x1  0x0000000000000000 x2  0x0000000000000000
x3  0x0000000000000000 x4  0x0000000000000000 x5  0x0000000000000000
x6  0x0000000000000000 x7  0x0000000000000000 x8  0x0000000000000000
x9  0x0000000000000000 x10 0x0000000000000000 x11 0x0000000000000000
x12 0x0000000000000000 x13 0x0000000000000000 x14 0x0000000000000000
x15 0x0000000000000000 x16 0x0000000000000000 x17 0x0000000000000000
x18 0x0000000000000000 x19 0x0000000000000000 x20 0x0000000000000000
x21 0x0000000000000000 x22 0x0000000000000000 x23 0x0000000000000000
x24 0x0000000000000000 x25 0x0000000000000000 x26 0x0000000000000000
x27 0x0000000000000000 x28 0x0000000000000000  fp 0x0000000000000000
lr 0x0000000000000000 sp  0x0000000000000000  pc 0x0000000000004b70
cpsr 0x00000000

[...]

`LC_CODE_SIGNATURE`

包含有关 Mach-O 文件的代码签名的信息。它只包含一个指向签名 blob的偏移量。这通常位于文件的末尾。但是，您可以在此博客文章和这个gists中找到关于此部分的一些信息。

`LC_ENCRYPTION_INFO[_64]`

支持二进制加密。但是，当然，如果攻击者设法 compromise 进程，他将能够以未加密的方式 dump 内存。

`LC_LOAD_DYLINKER`

包含动态链接器可执行文件的路径，将共享库映射到进程地址空间。值始终设置为 /usr/lib/dyld。重要的是要注意，在 macOS 中，dylib 映射发生在用户模式，而不是内核模式。

`LC_IDENT`

已过时，但当配置为在 panic 时生成 dumps 时，将创建一个 Mach-O 核心 dump，并在 LC_IDENT 命令中设置内核版本。

`LC_UUID`

随机 UUID。它本身对任何直接用途都没有用，但 XNU 会将其与进程信息的其余部分一起缓存。它可用于崩溃报告。

`LC_DYLD_ENVIRONMENT`

允许在进程执行之前指定 dyld 的环境变量。这可能非常危险，因为它可以允许在进程内部执行任意代码，因此此加载命令仅在使用 #define SUPPORT_LC_DYLD_ENVIRONMENT 构建的 dyld 中使用，并进一步限制处理仅限于形式为 DYLD_..._PATH 的变量，指定加载路径。

`LC_LOAD_DYLIB`

此加载命令描述了动态库依赖项，指示加载器（dyld）加载和链接该库。Mach-O 二进制文件所需的每个库都有一个 LC_LOAD_DYLIB 加载命令。

此加载命令是**dylib_command**类型的结构（其中包含一个描述实际依赖动态库的 struct dylib）:

struct dylib_command {
uint32_t        cmd;            /* LC_LOAD_{,WEAK_}DYLIB */
uint32_t        cmdsize;        /* includes pathname string */
struct dylib    dylib;          /* the library identification */
};

struct dylib {
union lc_str  name;                 /* library's path name */
uint32_t timestamp;                 /* library's build time stamp */
uint32_t current_version;           /* library's current version number */
uint32_t compatibility_version;     /* library's compatibility vers number*/
};

您也可以通过以下命令行获取此信息：

otool -L /bin/ls
/bin/ls:
/usr/lib/libutil.dylib (compatibility version 1.0.0, current version 1.0.0)
/usr/lib/libncurses.5.4.dylib (compatibility version 5.4.0, current version 5.4.0)
/usr/lib/libSystem.B.dylib (compatibility version 1.0.0, current version 1319.0.0)

一些潜在的与恶意软件相关的库包括：

DiskArbitration：监控 USB 驱动器
AVFoundation：捕获音频和视频
CoreWLAN：Wifi 扫描。

一个 Mach-O 二进制文件可以包含一个或多个构造函数，这些函数将在LC_MAIN 中指定的地址之前执行。任何构造函数的偏移量都保存在**__DATA_CONST** 段的**__mod_init_func** 部分中。

Mach-O 数据

文件的核心是数据区域，由加载命令区域中定义的几个段组成。每个段中可以包含各种数据部分，每个部分包含特定类型的代码或数据。

数据基本上是包含在加载命令LC_SEGMENTS_64中加载的所有信息的部分。

这包括：

函数表：包含有关程序函数的信息。
符号表：包含有关二进制文件使用的外部函数的信息
还可以包含内部函数、变量名称等等。

要检查它，您可以使用Mach-O View工具：

或者从命令行界面：

size -m /bin/ls

从零开始学习AWS黑客技术，成为专家 htARTE（HackTricks AWS Red Team Expert）！

其他支持HackTricks的方式：

如果您想看到您的公司在HackTricks中做广告或下载PDF格式的HackTricks，请查看订阅计划!
获取官方PEASS & HackTricks周边产品
探索PEASS家族，我们的独家NFTs
加入 💬 Discord群组 或 电报群组 或关注我们的Twitter 🐦 @carlospolopm。
通过向HackTricks和HackTricks Cloud github仓库提交PR来分享您的黑客技巧。

上一页macOS Sensitive Locations & Interesting Daemons 下一页macOS Objective-C

最后更新于1年前

hashtag基本信息

hashtagFat Header

hashtagMach-O头部

hashtagMach-O 文件类型

hashtagMach-O 标志

hashtagMach-O 加载命令

hashtagLC_SEGMENT/LC_SEGMENT_64

hashtagLC_CODE_SIGNATURE

hashtagLC_ENCRYPTION_INFO[_64]

hashtagLC_LOAD_DYLINKER

hashtagLC_IDENT

hashtagLC_UUID

hashtagLC_DYLD_ENVIRONMENT

hashtagLC_LOAD_DYLIB

hashtagMach-O 数据

基本信息

Fat Header

Mach-O头部

Mach-O 文件类型

Mach-O 标志

Mach-O 加载命令

LC_SEGMENT/LC_SEGMENT_64

`LC_CODE_SIGNATURE`

`LC_ENCRYPTION_INFO[_64]`

`LC_LOAD_DYLINKER`

`LC_IDENT`

`LC_UUID`

`LC_DYLD_ENVIRONMENT`

`LC_LOAD_DYLIB`

Mach-O 数据