贝叶斯的工作流程可以分为三个阶段进行,分别是准备阶段、分类器训练阶段和应用阶段。
1、准备阶段:
这个阶段的任务是为朴素贝叶斯分类做必要的准备,主要工作是根据具体情况确定特征属性,并对每个特征属性进行适当划分,去除高度相关性的属性,然后由人工对一部分待分类项进行分类,形成训练样本集合。
这一阶段的输入是所有待分类数据,输出是特征属性和训练样本。(相当于上述例子中那8个客户的信息,这个步骤是需要人工进行整合的)
2、分类器训练阶段:
这个阶段的任务就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计,并将结果记录。其输入是特征属性和训练样本,输出是分类器。
这一阶段是机械性阶段,根据前面讨论的公式可以由程序自动计算完成。
3、应用阶段:这个阶段的任务是使用分类器对待分类项进行分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。
这一阶段也是机械性阶段,由程序完成。
贝叶斯模型的优点有4个,分别是:
贝叶斯模型的缺点有3个,分别是:
通过以上案例大家对贝叶斯定律肯定都有了一定的了解,贝叶斯在运营工作中有什么应用呢?说实话,本来我对贝叶斯在运营工作中能有多大的作用,并没有概念,直到我在日常一活动复盘中发下了下面的案例。
我们经常会举办一些训练营活动,活动分为招募期、课程期两个时段。在招募过程我们会投放很多渠道,在结束后我们都会做复盘报告。
在复盘的过程中我们发现了一个有趣的数据,参与我们训练营的用户画像调研中,工作经验为1-3年的开发者居多,占比在70%以上。因此,我们每一期活动复盘报告中,都会如下分析:
参与活动的开发者以1-3年工作经验者居多,说明我们的课程内容对此类开发者更具有吸引力,可以针对此类开发者,做课程设计上的优化。
那么大家有没有发现关于这个数据的复盘分析有没有什么问题?
我们的训练营报名用户的工作年限是1-3年居多,这是一个结果,我们只针对这个结果进行了分析。那么按照贝叶斯定律,很明显我们忽略了导致这个结果的前提条件。这个前提条件的忽略最终可能影响了我们对整件事情的判断。这个前提条件就是:我们的投放渠道。
我们投放渠道所覆盖的用户的工作年限是多少?如果该活动投放的渠道所覆盖的用户就是1-3年工作经验开发者居多,自然报名训练营的用户也会是这个群体,那我们的复盘就是错误的,并不能说明我们的课程对工作1-3年的开发者更具有吸引力。
如果我们的投放渠道用户分布平均,而活动报名用户出现了如上的分布,那我们的复盘总结便是有意义的。
在意识到以上因素后,我们在后续活动的数据模型中,增加了投放渠道用户画像的收集,用以完善数据完整度,避免出现原先错误的分析结论。
所以,以上便是贝叶斯定律在日常运营活动中的应用,掌握贝叶斯理论,在运营活动中可以避免我们做出错误的数据分析,以免被错误数据误导而对运营策略产生影响。
转载自网络 不用于商业宣传 版权归原作者所有,侵权删。