当前位置: 代码网 > it编程>App开发>苹果IOS > iOS之异常与信号使用场景分析

iOS之异常与信号使用场景分析

2024年05月18日 苹果IOS 我要评论
正文crash的主要原因是你的应用收到了未处理的信号。 未处理的信号可能来源于三个地方:kernel(系统内核)、其他进程、以及app本身。 因此,crash异常也分为三种:mach异常:是指底层的内

正文

crash的主要原因是你的应用收到了未处理的信号。 未处理的信号可能来源于三个地方:kernel(系统内核)、其他进程、以及app本身。 因此,crash异常也分为三种:

  • mach异常:是指底层的内核级异常。用户态的开发者可以直接通过mach api设置thread、task、host的异常端口,来捕获mach异常。
  • unix信号:又称bsd信号,如果开发者没有捕获mach异常,则会被host层的方法ux_exception()将异常转换为对应的unix信号,并通过方法threadsignal()将信号投递到出错的线程。可以通过方法singnal(x, signalhandler)来捕获single。
  • nsexception:应用级异常,它是未被捕获的objective-c异常,导致程序向自身发送了sigabrt信号而崩溃,对于未捕获的objective-c异常,是可以通过try catch来捕获的,或者通过nssetuncaughtexceptionhandler()机制来捕获。

异常

exception type:

异常的type固定是sigabrt,其实是crashreporter在捕获exception之后,再调用abort()发出的信号类型。这个机制也决定了如果是exception crash,堆栈就看这里的last exception backtrace:, crash thread 里面固定是handleexception的堆栈,没有查看的意义。

exception codes:

一般就是 0 at 0x18ac2378,后面这个地址就是发生异常的对象的地址

特殊的 exception code

  • 0xdead10cc - deaklock

我们在挂起之前持有文件锁或 sqlite 数据库锁。我们应该在挂起之前释放锁

  • 0xbaaaaaad - bad

通过侧面和两个音量按钮对整个系统进行了 stackshot。

  • 0xbad22222 - bad too (two) many times

可能是 voip 应用被频繁唤起导致的崩溃。也可以注意一下我们的后台调用网络的代码。 如果我们的tcp连接被唤醒太多次(例如 300 秒内唤醒 15 次),就会导致此崩溃。

  • 0x8badf00d - ate (eight) bad food

我们的应用程序执行状态更改(启动、关闭、处理系统消息等)花费了太长时间。与看门狗的时间策略发生冲突(超时)并导致终止。最常见的罪魁祸首是在主线程上进行同步的网络连接。

  • 0xc00010ff - cool off

系统检测的设备发烫而终止了我们的 app。如果只在少量设备上(几个)发生,那就可能是由于硬件的问题,而不是我们 app 问题。但是如果发生在其他设备上,我们应该使用 instruments 去检查我们 app 的耗电量问题。

  • 0x2bad45ec - too bad for security

发生安全冲突。 如果 termination description 显示为 process detected doing insecure drawing while in secure mode,则意味着我们的应用尝试在不允许的情况下进行绘制,例如在锁定屏幕的情况下。

triggered by thread:

发生crash的线程

application specific infomation:

exception的信息,这个是定位异常的关键信息

last exception backtrace:

抛出异常的代码堆栈,如果是异常,就看这个堆栈

主要信号

主要信号有 sigterm、sigabrt、sigsegv、sigbus、sigill、sigfpt、sigkill、sigtrap

程序结束(terminate)信号,与sigkill不同的是该信号可以被阻塞和处理。通常用来要求程序自己正常退出。ios中一般不会处理到这个信号

sigabrt原因

  • double free指针,void *ptr = malloc(256); free(ptr);free(ptr);// 重复释放会导致sigabrt错误
  • free没有初始化的地址或者错误的地址,void ptr - (void)0x0000100; free(ptr);//释放未初始化的地址导致sigabrt错误
  • 内存越界,char str2[10]; char *str1 = "askldfjadslfjsalkjfsalkfdj"; strcpy(str2, str1);
  • 直接调用abort()
  • 直接调用assert()

场景

全局变量赋值的代码段,被多线程调用同时赋值,上一次赋的值就可能被多个线程释放

解决方案

删掉类似的赋值操作或者加锁

sigsegv原因:

  • invalid memory access(segmentation fault)
  • 无效的内存地址引用信号(常见的野指针访问,访问了没有权限的内存地址,系统内存地址等)
  • 非arc模式下,ios中经常会出现在delegate对象野指针访问
  • arc模式下,ios经常会出现在block代码块内强持有可能释放的对象

场景:

sdwebimagedownloaderoperation 生命周期的管理和错误回调是在2个queue, 有可能 self 已经进入释放逻辑,再访问 self.completeblock, 再访问就是无效的。

原因:

多线程访问或者操作对象、栈溢出。

sibbus原因:

  • mmap 内存映射访问超出了⼤⼩
char *p, tmp;
nsstring *path = [[nsbundle mainbundle] pathforresource:@"test" oftype:@"txt"];
int fd = open(path.utf8string, o_rdwr);
p = (char*)mmap(null,filesize, prot_read|prot_write,map_shared, fd, 0); signal(sigbus, handle_sigbus);
getchar();
for(int i=0;i<filesize;i++){
	tmp = p[i];
}
printf("ok\n");
  • 访问未对⻬的内存地址, int pi = (int)(0x00001111); *pi = 17;

场景:

mmap 映射了⼀个⽂件的内存,写入时越界。

对比:

sigsgv 访问的是⽆效的内存,就是该内存不属于我们的进程,或者没有权限,sigbus指的是 cpu ⽆法操作该地址,⼤部分是没有对⻬导致的。

sigill原因:

  • 执⾏⾮法指令
  • 堆栈溢出

典型场景:

ios 上该问题有可能会随机产⽣在任何动态库、静态库的⽅法中,⼀旦出现之后,应⽤会⼀直崩溃

解决方案:

app级别的代码没有修改可执⾏段的权限,⽆法污染代码段,判断是苹果增量的问题,用户重启⼿机

定义:

程序结束接收中⽌信号,⼀般exit()会发⽣这个信号,当前应用不能捕获,也无法忽略,oom,watchdog最终都是这个异常信号。

  • ⻓时间占⽤太多 cpu 资源,被系统杀掉
  • 应⽤启动的时候,在主线程做⻓时间操作,或者卡死,导致被 watchdog 杀死
  • 线程切换过于频繁,被系统杀掉
  • 应⽤占⽤过多内存,被 jetsam 杀掉

sigtrap原因:

很多系统库例如 webkit,libdispatch 等使⽤了__builtin_trap() ⽅法去触发断点异常,在debug 模式下,会触发调试器断点,这样开发可以实时查看问题,在 release 模式下,应⽤就会崩溃,然后产⽣ sigtrap 信号。

典型场景:

dispatch_group_enter 和 dispatch_group_leave 调⽤不匹配,如果dispatch_group_leave 多调⽤了,会触发 dispatch_client_crash,在dispatch_client_crash 内部会调⽤__builtin_trap() 触发调式陷阱 。

mach 异常

mach异常的好处就是可以捕获更多的crash,⽐如循环递归导致的堆栈溢出crash。原本信号的⽅式回调会在崩溃的线程⾥⾯,但是因为循环递归已经堆栈溢出了,已经没有环境来执⾏crash捕获的逻辑了,但是mach异常捕获可以定义单独的线程来处理mach异常逻辑。 如何区分我们看到的⽇志是mach异常的呢? exception type: 是exc_打头的话,就是mach异常了,后⾯的exception subtype:其实是根据exception type:转了⼀下

exception type:

  • exc_bad_access:内存不能访问,对应sigbus和sigsegv
  • exc_bad_instruction:⾮法的指令,对应捕获到的sigill问题
  • exc_arithmetic:算术运算出错,对应sigfpe
  • exc_emulation:对应sigemt
  • exc_software:软件出错,对应sigsys,sigpipe,sigabrt,sigkill
  • exc_breakpoint:对应sigtrap
  • exc_syscall:不常⽤
  • exc_mach_syscall:不常⽤
  • exc_rpc_alert:不常⽤
  • exc_crash:对应sigbart
  • exc_guard:⼀般是⽂件句柄防护,⽐如close到了⼀个内核的fd.
  • exc_resource:遇到了⼀些系统资源的限制,⼀般是cpu过载,线程调度太频繁,⽐如ios中每秒⼦线程唤醒次数不能超过150

abort

abort 包含哪些场景?

  • 内存使⽤量过⾼、短时间内申请⼤量内存,系统发送signal9(signal9⽆法通过信号捕获)强制杀死进程(类似于android端上的oom),就是⼤家常说的jetsam事件
  • 主线程发⽣卡死超过⼀定时间watchdog强制杀死进程(不同系统版本卡死时间不同)
  • 启动超时、后台切前台resume超时
  • 部分死循环、递归等造成的栈溢出

abort目标

  • 现场及上下⽂捕获
  • 定位 abort 的业务场景、发⽣原因
  • 基于现场及上下⽂捕获数据、abort发⽣原因的⽅法形成⾼效的⼯具链,⽤于快速定位线上崩溃率发⽣的主因

abort推导规则

需要根据可能导致客户端崩溃的原因设计推导规则,并基于线上⽤户的 abort 数据快速聚合,从而发现并解决影响线上稳定性的问题

以上就是ios之异常与信号使用场景分析的详细内容,更多关于ios 异常信号的资料请关注代码网其它相关文章!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com