FIT失效率(一)

2018-09-12  本文已影响0人  落雁无声

  事情的经过是这样的,前两天在回复完客户的需求后,在督促供应商给出关于他们产品的可靠性报告和FIT报告的时候,供应商回复我不知道FIT报告是什么,甚至都不知道FIT是什么。。。我解释了半天(这家供应商是国外公司的代理公司,并非业内人士,后来才知道),发现自己也好像说不出一个一二三来(我果然是个水货),想了想还是得把这个东西理一理。

在一切的一切开始之前,我们先来谈一下FIT是什么鬼~FIT(failures in time/有的地方也叫failures instance time)直译过来就是时基失效。与此同时这货也是有定义的,它主要是用来定义产品的可靠性,同时它还是它本身参数的单位,1 FIT(失效率)指的是1个(单位)的产品在1*10^9小时内出现1次失效(或故障)的情况。好,说人话,有个产品呢在使用1亿小时之内,只发生了1次失效,那我们就称这个产品在该时间段内的失效率是1fit。记住,既然是时基失效,那一切抛开时间谈失效率的行为都是耍流氓,毕竟可靠也要有个限度是吧?好,搞清这个的定义以后呢,我们来看看跟它对应的一个很重要的可靠性概念MTBF(Mean Time Between Failure),也就是它的倒数(这个倒数的情况是要在产品的寿命服从指数分布的情况下)。

MTBF(平均故障间隔时间)时表示可修复产品可靠性的一个基本参数,它的定义是在规定条件下和规定的时间内产品的寿命单位总数与故障次数之比。

简单理解一下,好比我们做个实验,我们同时使用100个灯泡做老化实验(我纯粹举例的),然后做了一年也就是365天,发现有20个不亮了(失效数是20个)最后MTBF怎么算呢?算不出来。。。因为MTBF是针对可维修产品的一种可靠性参数,灯泡这玩意儿坏了没法修,所以不适用这个,灯泡你应该用MTTF(平均失效时间)来衡量,这个后面有机会再讲。好,咱们重新举例,我们使用一台手机,使用了10000小时,共发生了4次故障,那我们根据定义就可以算一下这个手机的MTBF,就是10000/4=2500小时。算了这个有什么用?MTBF越长,说明在相同的使用时间内发生失效的次数就越小,也就是这个产品在单位时间内发生故障的概率越小,也就是说这个产品在对应时间内的FIT值越小,这是好事,也是可靠性工程师一直追求的目标。

MTBF讲清楚了,我们再回到最开始的FIT报告,FIT报告一般都会要求说写明条件,什么条件下(这个条件一般指的是环境条件,如温度,湿度等等),什么置信度的情况下,使用多长时间的得出的一个值。而这个值就是我们需要的在产品的可靠性设计中需要考虑到的,是否能够满足我们对产品的使用要求,而这个值在正常使用中有三种算法。

第一种,通过经验或者国际上的通用标准参考文件,考虑复杂产品属于并联系统还是串联系统,如果是串联系统的话呢,此时我们就要针对各个部分结构件的失效率参考值,将他们加起来(串联系统的失效率是累加的,因为不存在冗余),此刻我们得到的这个FIT值会非常的大,此时的FIT值我们仅作为产品研发设计阶段的一个参考值,实际不会以这个来衡量我们产品的真实失效情况。

第二种,在经过一系列的设计实验后,产品已经定型并且在供给客户市场使用(也就是性能稳定的正常使用时期),通过监控产品的可靠性失效数量,在已知总的出货数量的情况下,能够计算出总的使用时长,基于这些数据就可以算出我们产品的FIT值,这个FIT值是产品的真实情况反应出来的失效率,我们一般认为这个数据是比较准确的,也是最有参考价值的数据。


补充一下置信度的概念,在我们FIT报告里面,经常看到什么90%置信度,60%置信度的,很多人往往不明确这个是什么,为啥要这样来写?这是因为可靠度本身就是一门基于数理统计学的学科,它是通过已有的产品数据来估计对应产品的规律,以此来衡量产品的特性,既然涉及到估计,这里就引入置信度的概念——统计学中针对一个概率样本的区间估计,体现的是参数的真实值有多大的概率落在测试值的周围,90%置信度也就是说有90%的可能会接近于我们的测试值。


第三种,在我们产品使用了相当一段时间之后,由于产品本身老化的原因或者是对应结构的耗损引起的失效,此时的失效率将会比较大,此时我们一般会根据供应商或者我们自己的实验结果来(此项数据一般需要有足够的数据支持)衡量产品的失效率,这个也是经常找供应商要的数据部分

产品故障率浴盆曲线

以上三种方式并不是使用与所有的产品的,有些质量很棒的产品在寿命周期内就是一条直线(现在知道为啥我说第二种方式经常用到了吧,因为我们公司产品质量好啊,嘿嘿)三种方式其实分别与我们产品的故障率曲线是紧密相关的,在产品研发设计阶段更容易出现因为设计不完善,材料选用,结构问题等等问题引起的早期失效,此时就是我们的第一种情况,早期故障期,发生故障的概率会随着研发的深入,产品的成熟而降低,在初期的可靠性设计中应该将FIT值算出来作为产品可靠性的一个衡量基准(可惜目前绝大数的公司都没有这一步);那在产品真正成熟后,故障率会降到一个比较低的基准,此时发生的失效我们称之为随机失效(也就是我们经常要的random-life的FIT),这个也即时和第二种FIT计算方式对应起来,此时的失效率即是反应成熟产品可靠性的一个重要参数。而到了最后的耗损故障期(也就是我们常说的wear-out life)的失效率又会突然增大,主要的原因在于老化,疲劳,腐蚀等等耗损原因引起的失效,此时的意义在于我们可以监控耗损阶段的起始位置,我们可以在快到那个地方的时候经进行预防性修复,这样就可以延长产品的使用时间啦。三个阶段都有自己独特的失效率特点,我们还是需要根据实际情况来选用分析数据,这些都可以为我们的产品可靠性提供服务,甚至与我们可以人为地去干涉这个浴盆曲线。

好了,本篇关于FIT的就先说到这里了,很多是我自己的理解,如果有不对的地方还请帮忙指出,下次将谈谈FIT详细的计算方法。

上一篇 下一篇

猜你喜欢

热点阅读