Engagement Index-3:计算方法和案例初探

题记:该哭,该笑,还是该睡觉?

建议先阅读系列的第-1篇:参与度指数的含义和第-2篇:构成参与度指数的参数选择,分类和数据收集办法

1. Peterson给出的Engagement Index的计算方法

提高Engagement Index(EI)的计算方法,就不能不提 Eric Peterson 最初的贡献,后来他整理成了白皮书,发布在这里:Measuring the Immeasurable-Visitor Engagement(备选下载链接),这是关于参与度指数计算方法的第一次正式讨论;我们最终提到的参与度指数的计算方法也受了他的很大的影响。不过Petersson提出的是一个非常普遍化的一个公式,具体到一个项目中,需要根据所研究对象的属性寻找合适的参数和权重。

Petersson给出的公式很简单,只是一个简单的加权求和的公式,其中使用到的参数也是网站分析中非常常见的:

Σ(Ci + Di + Ri + Li + Bi + Fi + Ii)

其中,

• C=Click Depth Index,指用户的访问深度,由PV和Event组成

• D=Duration Index, 指用户在网站的停留时间

• R=Recency Index,指用户最近一次访问网站的时间+用户的访问频率

• B=Brand Index,指用户对网站和产品的认知程度(awareness)

• F=Feedback Index, 指用户对网站做的有价值的反馈信息

• I=Interaction Index,指用户和网站内容/功能的一个互动的过程,在这个过程中用户会对网站和产品给予更多的关注。

• L=Loyalty Index:,指用户在较长时间段内和网站/产品互动的情况

(更详细的解释请参考白皮书)

2. 在IIPIC基础上的EI的维度和计算方法

我们在最初论证参与度指数的时候(可以推到2008年),因为从一开始便考虑到了一个网站(主网站)所处的生态系统,包括第三方网站,竞争网站,卫星网站,社交网络应用和widget,所以最终得出结果是建立在Forrester最初提出来的参与度构成的4I (见 1参与度指数的含义)的基础上的,和人群分组相结合,按照参与度的组成部分来计算,可以在时间轴上横向比较的一个参数。所以我们设想中的参与度指数是至少分为三维的:

参与度指数-engagement index

ei=f(s,i,to), EI=F(S,I,to)

其中S=Σs,人群分组,segement;I=Σi, 构成参与度指数的元素,4i (或者IIPIC),to为所选时间点或者时间区间

也就是说,

  • 参与度指数首先可以在时间轴上(T)进行横向比较,以此来跟踪网站用户的参与度情况,尤其是在网站发展变化较快较大的时候,在网站吸引流量的阶段,长期跟踪这个指数的变化情况能让我们对网站表现情况(包括流量来源)有一个整体的了解。
  • 其次,参与度指数可以纵向在不同的人群分组之间(S)进行比较,反过来,参与度指数对于网站人群分组提供参考。
  • 然后,我们还可以深入挖掘到细节,看每个阶段(I)的参与度情况
  • 最后,参与度指数适用于任何一个(s, t, to)组合,并且ei之间具有可比性。

比如,一个随便举的例子,其中所有数据都为假设:

ei s1=10K s2=14K s3=4K S=Σns/N
Involvement 42 86 56 66
Interaction 35 49 44 43
Proximity 20 32 34 28
Influence 13 20 23 18
Cocreation 5 3 13 5
EI 34 57 34 53

在这里,每个阶段的总EI可以加权求平均值,权数就是每个分组的用户数目;但是对于每一个分组的总的EI,和整个研究对象的EI则很难通过一定的公式来求得,比如说,他应该是各个阶段的ei的平均值呢还是各个阶段ei的和?亦或是加权和或者是加权平均值?权数如何确定?这里的主要决定因素是具体计算中,ei=f(s,i,to)的函数是怎么样的,和EI=F(S,I,to)有什么联系。

谈到这里,希望大家对EI的计算方法有了一个大体的印象,主要是理解其中的思维和逻辑吧。至于ei=f(s,i,to)的具体写法,这个是根据项目和需求而定的。我在案例分析中会谈一下我们使用的方法。

3.关于参与度指数的案例初探

案例所要介绍的项目是为一个奢侈品公司的电子商务网站创建一个Engagement Index模型。这是一个Flash网站,若干卫星网站,在社交媒体上有行业中相对领先的布局。项目整体的scoop很大,评估的是整个digital environment。不过我们这次是从网站数据入手,先通过网站分析数据对用户有一个大致的了解。我们使用的数据是从其网站分析工具Omniture Insight中提取出来。样本是随机抽取的2009年的大约900万Visitor的所有访问数据,总共20G 的txt文件,导入SAS之后80G。第一次处理这么多的数据,遇到的困难还是挺多的。

这个网站在6个国家有电子商务模块,销售可观;但是在大部分国家没有。品牌更注重的是这个网站如何能够提升自身的形象,而不是销售。正如模型的名字所说,要做的是“Engagement”,而不是“Sales”。项目的目的是通过研究网站用户的行为特征,通过Engagement Level来评估,进而评价网站内容和相关市场营销活动的效果,同时(我们考虑)后期有条件的话,研究不同程度的Engagement和销售的关系。

点击此处查看原始数据样本

原始数据包含诸如Visitor ID, Session Number, Language, Country, Turnover, Traffic sources,Campaign等29个原始变量。变量的数目虽然少,但是它们已经涵盖了大多数网站分析的基本变量,在这些变量的基础上我们可以计算出其他参数和指标。不过当然,在项目初期我们要求的很多变量还是没有能够提取出来。

通过原始数据样本大家也许可以看到一些端倪。实际上,这些数据的最小记录单元是Page,一条记录(一行)代表一个PV,以及和这个PV相关的28个变量的值。PV可以通过Session Number归类组成一条visit的全部记录(2009年),而Session Number可以通过Visitor ID归类组成一条visitor的全部记录(2009年)。

有了这些数据,下面我们就可以开始干活了。下一篇中我会重点介绍原始数据的数据结构和各种不同层次(Page,Visit和visitor)视图的创建。敬请关注Engagement Index-4:数据准备和参数创建

后记:这是上周写的,竟然忘记发了。最近忙的焦头烂额,恨不得把自己大卸八块,然后每块装上三头六臂,所以这周也没有写,正好拿这篇顶替了。

火上浇油,老板突然又给了一个关于Emerging Platform的东西,要求周四交框架。目前主题集中在SNS和Mobile两块上。自2005年以来,大家都知道哪些Emerging Platform呢(诸如Facebook, Twitter, Foursquare,iAD之类)?在Marketing的层面上,它们都能提供哪些机遇?我们如何评测在这些平台上进行的广告活动的效果呢?谢谢建议!也可以发送到我的email大家一起讨论。hailongxia AT gmail . com

标签:

天岸 天岸
爱Digital,爱Analytics。 我的linkedin: http://www.linkedin.com/in/xiahailong

32 评论 关于文章 “Engagement Index-3:计算方法和案例初探”

  1. 智勇 说:

    有点深奥~SAS~ Spss“很久没碰了. .

    Like or Dislike: Thumb up 0 Thumb down 0

  2. gegao 说:

    PETERSON的这个算法很有意思,思路很简单,但却是有意义。看到这个公式的时候颇有“哦,为啥我想不到?”的感慨。LOL

    计算方法上面,我觉得最可圈可点的是分组这个部分。OUTLIER肯定存在,如到达相当比例(1%比如),分组结果是很可能被干扰的。所以重点还是回到数据量上来,如果数据充分,则可靠性大大提高—当然前提是分组本身足够合理(没有过细或潜在交叠)。

    Like or Dislike: Thumb up 0 Thumb down 0

    • Scyan 说:

      @gegao, 我们是通过统计方法来确定分组的,方法中会自动把极值和关联性非常强的参数去掉。

      Like or Dislike: Thumb up 0 Thumb down 0

      • gegao 说:

        @Scyan,

        如果我没理解错的话,统计方法确定分组的意义就是根据用户在网站上的活动特征来分组,比如轻度,中度,重度用户?按这样分组方法,极值问题本身出现的可能就很小了,去除两端即可。是这样么?

        我原来以为是按照用户的相关背景预分组,然后对比各组参数……

        这样我又有些迷惑:从实践层面出发,应该使用最终获得的参与度指数?我的意思是,有十个用户,我们大概知道他们做了什么,但是我们不知道他们是谁,如何使用参与度来这个营销活动的最终效果?

        Like or Dislike: Thumb up 0 Thumb down 0

        • Scyan 说:

          @gegao, 不是的,第一次分组的方法就是根据和用户所有相关的参量进行分的-不过我们做的首先是visit的分组。比如说和一个visit相关联的有30个变量,我们会首先通过人工选择输入25个变量到系统中,然后根据统计的算法,会生成分组,这些分组会组织在各种Axe周围。分组的根据通过算法,寻找这样的visit:这些visit之间的差别最小,但是各个组之间的差别最大。

          Like or Dislike: Thumb up 0 Thumb down 0

        • Scyan 说:

          @gegao, 参与度指数有很多可能的应用,比如对网站的performance有一个整体的认识,比如可以通过engagement在时间轴上的分布来发现网站各种营销活动的效果,比如可以对一些组群在EI上的演变规律来生产内容,引到用户,比如可以对一些本来EI很高的用户进行激活,或者观察他们的行为,避免他们变成inactive;当然还可以建立模型,发现EI和purchase的关系;把EI应用到predictive model中等等。

          Like or Dislike: Thumb up 0 Thumb down 0

        • Gaoge 说:

          @gegao,

          关于VISIT的变量是用户行为本身相关的,还是含有诸如地域,浏览器,甚至年龄一类的背景信息?

          Like or Dislike: Thumb up 0 Thumb down 0

        • Scyan 说:

          @gegao, 算法会选择决定分组的Axe变量,如果浏览器对visit的行为有很大影响,就会被应用进来,否则便会被舍弃。

          Like or Dislike: Thumb up 0 Thumb down 0

        • Gaoge 说:

          @gegao,

          “比如可以对一些组群在EI上的演变规律来生产内容,引到用户”

          算法是以行为为基础选择变量的,分组因此具有高度相关性,也可以跟踪。这部分我已经没有问题了。

          主要是“引到用户”这里不理解。分组和用户之间如何引过去?如果我们可以把一定背景的用户和一定的VISIT行为联系起来,这本身就是很大的成功吧?

          Like or Dislike: Thumb up 0 Thumb down 0

        • Scyan 说:

          @gegao, 对不起,大错了,是“引导用户”。正巧我们今天正在讨论对visitor进行分组的问题,一个焦点就是应该把score d’engagement作为一个分组的根据,还是应该把分组作为研究score d‘engagement的一个根据。我之前说的引导用户,实际上可能和下边一条重复了。我想说的主要意思是通过对一组用户的EI进行长期的观察,可以发现他们EI的演变规律,而通过数据分析,可以把这些演变规律和他们所浏览的网站的内容做一个匹配,如果能够幸运的发现关联性的话,那么对于到达某一阶段的用户,我们便可以根据数据分析所得到的结果,推荐合适的内容,增加这个用户的参与度。不过还是刚开始所说的,这些只是应用的可能性,需要到具体的项目中去验证。

          Like or Dislike: Thumb up 0 Thumb down 0

      • Scyan 说:

        @Scyan, 我看我是不能熬夜了,不然老是错字连篇,是”打错了“。不是”大错了“…;-(

        Like or Dislike: Thumb up 0 Thumb down 0

  3. 优惠券 说:

    头晕

    Like or Dislike: Thumb up 0 Thumb down 0

  4. 购物博客 说:

    有点不知所措啊

    Like or Dislike: Thumb up 0 Thumb down 0

  5. 苏州SEO 说:

    能不能再浅显一些啊,呵呵。

    Like or Dislike: Thumb up 0 Thumb down 0

  6. ali 说:

    很难理解。

    Like or Dislike: Thumb up 0 Thumb down 0

  7. 股票开户 说:

    太深奥了,有点不解

    Like or Dislike: Thumb up 0 Thumb down 0

  8. chablis 说:

    虽然需要考核的用户群组基数较小,但还是有很多可借鉴的地方。结合WA数据的分析参与度,以访问来源来分组评估社会化媒体营销的效果貌似是个不错的选择。计划运用到以后的工作中。

    多谢天岸哥分享整系列高质量内容。

    Like or Dislike: Thumb up 0 Thumb down 0

  9. 开抓 说:

    数学模型 看着很帅

    Like or Dislike: Thumb up 0 Thumb down 0

  10. 一起读 说:

    多谢天岸哥

    Like or Dislike: Thumb up 0 Thumb down 0

  11. 情感专家 说:

    偶像啊 学习了

    Like or Dislike: Thumb up 0 Thumb down 0

  12. 顶一下博主,很喜欢你的文章!!!

    Like or Dislike: Thumb up 0 Thumb down 0

  13. 站长工具 说:

    很不错的文章,多谢博主分享

    Like or Dislike: Thumb up 0 Thumb down 0

  14. 不错,继续关注

    Like or Dislike: Thumb up 0 Thumb down 0

  15. hey33 说:

    hoho 谢谢分享~

    Like or Dislike: Thumb up 0 Thumb down 0

  16. 珂兰钻石 说:

    不错,继续关注。好好研究看看。

    欢迎来我的站看看。珂兰http://www.kela.cn

    Like or Dislike: Thumb up 0 Thumb down 0

  17. 游民星空 说:

    这篇文章适合专业人士看,我不大明白。顶了。

    Like or Dislike: Thumb up 0 Thumb down 0

  18. 看不明白,有点专业

    Like or Dislike: Thumb up 0 Thumb down 0

  19. 闲云 说:

    第一次来这个网站。。很强大啊。。
    确实很专业

    Like or Dislike: Thumb up 0 Thumb down 0

  20. stone crusher 说:

    哈哈 计算是我的强项,不过还是学习了。

    Like or Dislike: Thumb up 0 Thumb down 0

  21. 扎金花 说:

    太复杂了,看来得好好研究了。

    Like or Dislike: Thumb up 0 Thumb down 0

  22. 成都SEO 说:

    收藏一下

    Like or Dislike: Thumb up 0 Thumb down 0

发表评论

Why ask?

© 2010 SEM WATCH 搜索引擎营销观察. All rights reserved.

无觅相关文章插件,快速提升流量