精华内容
下载资源
问答
  • 在一个响应率模型中,使用传统的机器学习rf做二分类。通过特征入模后发现召回率和精确率较低该如何提升呢
  • 产品用户流失为什么这么高? 该如何有效地预防用户的流失? 对于留存的用户又该如何促进转化? 以上种种难题往往都困扰着产品运营人员。 根据相关统计数据显示,获得一个新用户的费用是留存一个旧用户的5-10倍,且...

    产品用户流失率为什么这么高?

    该如何有效地预防用户的流失?

    对于留存的用户又该如何促进转化? 以上种种难题往往都困扰着产品运营人员。

    根据相关统计数据显示,获得一个新用户的费用是留存一个旧用户的5-10倍,且当用户留存提高5%时,最高增加收益达95%,因此留住用户并深度挖掘存量用户的价值一直是产品运营工作的重点。

    “如何及时发现用户流失风险并针对性制定用户运营策略?”随着获客成本的日益增长,越来越多的企业开始调整运营策略,由粗放式获取流量向精细化运营转变。那么,怎样才能破解用户流失难题和付费转化瓶颈?华为预测服务应运而生!

    在这里插入图片描述

    什么是华为预测服务?
    华为预测服务(Prediction)基于华为分析服务(Analytics Kit)上报的用户行为数据和属性,结合机器学习技术,帮助您实现特定目标人群的精准预测。比如可预测潜在流失人群、潜在付费人群和潜在复购人群等。

    在这里插入图片描述

    针对细分受众群体,开展和优化相关运营举措,如通过A/B测试评估运营活动效果、远程配置特定受众群体的专属套餐等,有效帮助产品提高用户留存,增加转化。

    预测服务聚焦的场景是什么?

    (一) 流失用户预测
    很多企业的用户运营在重复着这样的工作:将一段时间内未登陆或购买的用户定义为流失用户;策划召回活动并用push或短信去触达用户。用户流失的原因不清楚,想通过一张券或促销活动文案将用户召回,用户在看到这样的召回短信时往往选择了主动屏蔽。

    怎样才能提高已流失用户的召回率?

    已流失的召回其实意义不大,但提前预测流失预警可大大减少用户流失。例如,如果一个用户在近一周内均处于活跃状态,但是在未来一周内始终未活跃或者已卸载应用,那么该用户将被我们定义为将流失用户。未来将流失的用户在机型分布、位置分布等属性上有没有什么共性特点?他们最近一次的使用情况、累计浏览页面的次数是否存在相似?这些特征的挖掘,华为预测服务都可以实现。在深度洞察未来将流失的人群行为特征后,对这部分人群及时调整运营策略,这样有针对性地触达用户会更加有效。

    在这里插入图片描述

    (二) 付费用户预测
    产品的变现能力是产品能否良性发展的重要考量。近几年,送服务、送权益、送优惠券等各种姿势与套路可以说是被各大app玩了个遍,联合会员、线上与线下场景打通更是新辟了另一种模式。当然,各类如此烧钱的运营活动,最终目的都是:让用户付费。

    怎样才能增加用户的付费转化?

    首先,需要圈定未来将产生付费的人群,比如,可以用最近两周内用户的付费数据建模,然后通过该模型来预测近一周的活跃用户在未来一周内购买付费的概率。针对这部分人群开展精细化运营,如优化产品购买体验流程,发放优惠券等运营动作,是不是就可以达到事半功倍的效果?

    华为预测服务正是解决这样的痛点问题。通过用户行为的深度洞察,预测未来将付费用户群组,同时描绘该群体的特征,如机型、地域等,对这部分用户建立受众群体,不仅可帮助您更加合理配置运营资源,而且可让付费转化率显著提高。

    在这里插入图片描述

    (三) 复购用户预测

    拉新成本的高居不下,让企业越来越关注每一个存量用户生命周期的全部价值,引导他们不断复购与持续转化,可帮助产品有效提升盈利能力。一个满意的用户可能会带来8笔潜在生意,复购率越高,也可反映出消费者对品牌的忠诚度越高,用户粘性也就越高。高粘性的用户可帮助产品挖掘更多的潜在用户。

    怎样才能促进用户的持续复购?

    和付费一样,提前预知用户的复购潜力,实现“一对一”而非“一对多”的精细化运营,引导他们持续转化,将会帮助您的产品有效增加收益。那么,该如何圈定未来将产生复购行为的人群?首先付费行为的产生离不开近期的活跃,因此,可以将最近一周活跃的历史付费用户在未来一周内再次产生付费行为的条件作为判定高潜力复购人群的标准。

    通过华为预测服务,可帮助您提前预测上述人群。对这部分用户制定精准营销策略,如推送老客体验问候、配置会员折扣套餐等,将进一步帮助您的产品提高付费转化,增加用户黏性,有助于培养他们的品牌忠诚度。

    在这里插入图片描述

    如何开通华为预测服务?
    预测服务开通非常简单,你只需要在页面点击“立即开通”,就可完成预测服务的开通。

    在这里插入图片描述

    因为预测服务依赖分析服务上报的用户行为数据和属性,因此在开通预测服务之前,您需要先开通华为分析服务并集成Analytics SDK,以确保上报足够的事件以支撑预测任务的执行。

    集成指导可参考说明文档:

    Android:https://developer.huawei.com/consumer/cn/doc/development/HMSCore-Guides/android-integrating-sdk-0000001050161876?ha_source=hms1

    ios:
    https://developer.huawei.com/consumer/cn/doc/development/HMSCore-Guides/ios-integrating-sdk-0000001050168479?ha_source=hms1

    Web:
    https://developer.huawei.com/consumer/cn/doc/development/HMSCore-Guides/javascript-integrating-sdk-0000001051065743?ha_source=hms1

    华为预测服务,提前预知用户潜在行为,助您深度洞察聚焦人群,合理高效配置资源,达到最优运营效果。

    想要了解更多信息并开始使用华为预测服务,点击此处查看文档。


    原文链接:https://developer.huawei.com/consumer/cn/forum/topic/0201417184078790495?fid=18

    原作者:胡椒

    展开全文
  • 简介:简介: 本文通过【虫虫音乐】在阿里...当前搜索服务依赖于传统数据库,存在模糊查询不够灵活,性能一般问题,导致搜索召回效果不好,搜索成功<70%, 用户体验欠佳; 搜索效果的优化,需要专业的算法工程师,
    简介:简介: 本文通过【虫虫音乐】在阿里云开放搜索的最佳实践,和大家介绍影音行业如何快速实现高质量的搜索服务助力业务更好发展!

    公司背景

    虫虫音乐是一家版权乐谱分发平台,致力于专业打造音乐教育和乐谱版权登记发行,拥有强大的年轻用户群体,为不同的音乐爱好者提供学习和出售作品的平台,提供了上传乐谱、版权登记、发行出售等服务。
    image.png

    搜索业务背景

    客户痛点:

    • 当前搜索服务依赖于传统数据库,存在模糊查询不够灵活,性能一般问题,导致搜索召回效果不好,搜索成功率<70%, 用户体验欠佳;
    • 搜索效果的优化,需要专业的算法工程师,自行实现开发成本较高;
    • 重点面向专业的音乐人士,搜索流量占站内流量较高比重,打造高质量的搜索效果对业务至关重要;

    客户需求:

    • 乐谱搜索的形式较为多样,用户可以通过"曲谱名称","歌手名称",“作者”,“调性”,"难易度"等多维度从乐谱库中进行复合搜索,例如: 后来 完整指法 C调 刘若英 初学者优先;
    • 提供query改写功能,如拼写纠错、同义词等;
    • 可对召回的结果更细粒度的打分,并以文档得分对召回结果排序展示;
    • 提高搜索召回点击率,提升业务转化能力;

    开放搜索解决方案:

    搜索服务架构图:
    image.png

    搜索能力解析
    1. 查询语义理解:
    • 开放搜索具备通用行业分词能力,预设好的query改写功能配置简单易上手,无需开发,使用方便,可快速响应搜索优化需求;
    image.png

    • 自定义词权重干预词典,满足同一字段多个分词参与召回的权重高低不同的业务需求,提高用户搜索成功率;
    例如:同一query中曲谱的名字:“后来”,曲谱的调性:“C调”,曲谱的作者:“刘若英”,可以自定义干预分词的term的权重;
    image.png

    2. 排序优化
    无需依赖开发工程师,也可以使用表达式实时调整排序结果;
    • 基础排序(粗排):即是海选,从检索结果中快速找到质量高的文档,取出TOP N个结果再按照精排进行精细算分,基础排序对性能影响比较大;
    • 业务排序(精排):对最终排序效果影响比较大,对粗排的结果做更精细筛选,支持任意复杂的表达式和语法;
    • 相关函数应用
    static_bm25:静态文本相关性,用于衡量query与文档的匹配度
    normalize :归一化函数,根据不同的算分将数值归一化至[0, 1]
    first_phase_score : 获取粗排表达式最终计算分值

    3. 搜索引导功能:
    对业务目标转化起到很好的铺垫作用;   
    下拉提示:搜索中引导功能,在用户输入查询词的过程中,基于用户文档内容的query智能抽取,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
    image.png

    热词:搜索前引导功能,热词处于搜索引擎整个工作流程的最上游,越上游的环节,对于达成业务目标有着越重要的决定作用,结合运营策略对提升业务目标可以有比较大的发挥空间.
    image.png

    热词模型配置流程:内置成熟高级算法功能,无需自行编写定制;
    image.png

    客户心声

    使用开放搜索后,不仅满足了业务的搜索需求,还提升了用户体验,从而实现业务目标的快速转化;

    • 相比之前,搜索成功率从70%提高到了97%,精准命中用户需求;
    • CTR增长超过150%;
    • 从数据库迁移到OpenSearch后,搜索速度得到了1倍以上的提升;
    • 大大提升了数据库的性能,减轻了数据库压力;
    • 团队无需再配置工程架构类开发和系统运维,降低了人力成本,省心省力;

    以上就是影音行业“虫虫音乐”在阿里云开放搜索上的应用实践,如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~

    image.png

    【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用https://free.aliyun.com/product/opensearch-free-trial

    原文链接:https://developer.aliyun.com/article/780040?

    版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
    展开全文
  • 目标检测问题的老大难问题之一就是如何提高召回率(所有标注的真实边界框有多少被预测出来了)。  即recall=正检/(正检+未检) 这就导致最后输出的边界框数量往往远大于实际数量,而这些模型的输出边界框往往...

    基本思路:从待检测目标中先按照分类置信度,找一个最可信的框。然后判断其他框和它的交并比(IoU),如果大于阈值TH,说明相似,抑制掉就好了。

    算法:1.按照置信度排序 2.判断其他框和得分最高的框的IoU,大于阈值则剔除得分较小的建议框 3.从没有处理的框中继续选择一个得分最高的,重复上述过程。 4.遍历所有的建议框,即所有物体种类都做一遍非极大值抑制。

    注意在faster rcnn中有两个阈值0.7,第一次是判断正负样本的时候,大于0.7标为正样本,小于0.3为负样本(背景),中间的样本舍弃。 第二个是在nms中,用来判断和得分最高框的相似度,剔除相似样本。

    1.局部最大搜索

    目标检测问题的老大难问题之一就是如何提高召回率(所有标注的真实边界框有多少被预测出来了)。

             即recall=正检/(正检+未检)

    这就导致最后输出的边界框数量往往远大于实际数量,而这些模型的输出边界框往往是堆叠在一起的。因此,我们需要NMS从堆叠的边框中挑出最好的那个。

      

    2.何时使用NMS? When NMS?

    回顾我在R-CNN中提到的流程:

    1. 提议区域(选择性搜索)
    2. 提取特征
    3. 目标分类
    4. 回归边框

    NMS使用在4. 回归边框之后,即所有的框已经被分类且精修了位置。且所有区域提议的预测结果已经由置信度与阈值初步筛选之后。

    3. 如何非极大值抑制 How NMS?

    一维简单例子

    由于重点是二维(目标检测)的实现,因此一维只放出伪代码便于理解。

    判断一维数组I[W]的元素I[i](2<=i<=W-1)是否为局部极大值,即大于其左邻元素I[i-1]和右邻元素I[i+1]

    算法流程如下图所示:

      

     

    算法流程3-5行判断当前元素是否大于其左邻与右邻元素,如符合条件,该元素即为极大值点。对于极大值点I[i],已知I[i]>I[i+1],故无需对i+1位置元素做进一步处理,直接跳至i+2位置,对应算法流程第12行。

    若元素I[i]不满足算法流程第3行判断条件,将其右邻I[i+1]作为极大值候选,对应算法流程第7行。采用单调递增的方式向右查找,直至找到满足I[i]>I[i+1]的元素,若i<=W-1,该点即为极大值点,对应算法流程第10-11行。

    推广至目标检测

    首先,根据之前分析确认NMS的前提,输入与输出。

    使用前提

    目标检测模型已经完成了整个前向计算,并给出所有可能的边界框(位置已精修)。

    算法输入

    算法对一幅图产生的所有的候选框,每个框有坐标与对应的打分(置信度)。

    如一组5维数组:

    • 每个组表明一个边框,组数是待处理边框数
    • 4个数表示框的坐标:X_max,X_min,Y_max,Y_min
    • 1个数表示对应分类下的置信度

    注意:每次输入的不是一张图所有的边框,而是一张图中属于某个类的所有边框(因此极端情况下,若所有框的都被判断为背景类,则NMS不执行;反之若存在物体类边框,那么有多少类物体则分别执行多少次NMS)。

    除此之外还有一个自行设置的参数:阈值 TH。

    算法输出

    输入的一个子集,同样是一组5维数组,表示筛选后的边界框。

    算法流程

      • 将所有的框按类别划分,并剔除背景类,因为无需NMS。
      • 对每个物体类中的边界框(B_BOX),按照分类置信度降序排列。
      • 在某一类中,选择置信度最高的边界框B_BOX1,将B_BOX1从输入列表中去除,并加入输出列表。
      • 逐个计算B_BOX1与其余B_BOX2的交并比IoU,若IoU(B_BOX1,B_BOX2) > 阈值TH,则在输入去除B_BOX2。
      • 重复步骤3~4,直到输入列表为空,完成一个物体类的遍历。
      • 重复2~5,直到所有物体类的NMS处理完成。
      • 输出列表,算法结束

    代码实现及参考:https://www.zhihu.com/question/39405815/answer/791341975

    展开全文
  • 引入AP or MAP (Mean average precision)的背景 平时大家多用准确率和召回率衡量模型效果。...当我们想提高召回率的时候,肯定会影响准确率,所以可以把准确率看做是召回率的函数,即:P=f(R),也就是随着召回率从

    引入AP or MAP (Mean average precision)的背景

    平时大家多用准确率和召回率衡量模型效果。但是,准确率和召回率都只能衡量检索性能的一个方面,最理想的情况肯定是准确率和召回率都比较高。那么如何找到准确率和召回率的平衡点呢?AP来了。

    AP是什么?AP如何计算?

    首先说下AP、MAP的定义。

    (1)Average precision(AveP):平均准确率

    当我们想提高召回率的时候,肯定会影响准确率,所以可以把准确率看做是召回率的函数,即:P=f(R),也就是随着召回率从0到1,准确率的变化情况。那么就可以对函数P=f(R)在R上进行积分,可以求PP的期望均值。公式如下: 

    其中rel(k)表示第k个文档是否相关,若相关则为1,否则为0,P(k)表示前k个文档的准确率。 AveP的计算方式可以简单的认为是: 

    需要注意的地方:R究竟表示什么?

    R表示相关文档的总个数,position(r)表示,结果列表从前往后看,第r个相关文档在列表中的位置。比如,有三个相关文档,位置分别为1、3、6,那么AveP=1/3×(1/1+2/3+3/6)。在编程的时候需要注意,位置和第i个相关文档,都是从1开始的,不是从0开始的。

    这里举个例子,来理解下这个公式的计算。

     

    AveP意义是在召回率从0到1逐步提高的同时,对每个R位置上的P进行相加,也即要保证准确率比较高,才能使最后的AveP比较大。

    (2)Mean average precision(MAP):多次请求下,AP的均值

     

    • 单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值。
    • 主集合的平均准确率(MAP)是每个主题的平均准确率的平均值。
    •  

      例如:假设有两个主题,主题1有4个相关网页(假设q1有4个相关d),主题2有5个相关网页(假设q2有5个相关d)。某系统对于主题1检索出4个相关网页 ,其rank分别为1, 2, 4, 7;对于主题2检索出3个相关网页,其rank分别为1,3,5 。对于主题1,平均准确率为(1/1+2/2+3/4+4/7)/4=0.83。对于主题2,平均准确率为(1/1+2/3+3/5+0+0)/5=0.45。则MAP= (0.83+0.45)/2=0.64。” 

    •  需要注意:在利用MAP的评估的时候,需要知道:1. 每个q有多少个相关的d; 2. 排序结果中这些d的位置 3. 相关的定义

    MAP的优点

    • 优点:MAP 是反映系统在全部相关文档上性能的单值指标。系统检索出来的相关文档越靠前(rank 越高),MAP就应该越高。如果系统没有返回相关文档,则准确率默认为0。
    • 不足:MAP的衡量标准比较单一,q(query,搜索词)与d(doc,检索到的doc)的关系非0即1,核心是利用q对应的相关的d出现的位置来进行排序算法准确性的评估。

    计算MAP的代码

     

     

    参考:

    1.牛逼的解释和推导:https://medium.com/swlh/rank-aware-recsys-evaluation-metrics-5191bba16832

    展开全文
  • 现在的互联网红利消失殆尽,App想要获取新增用户变得越来越难了,并且多数的App的卸载量都在提高,所以不少的互联网产品把目光放在了如何唤醒那些沉默和已经流失的用户身上。引流、召回用户的方式有很多,而短信召回...
  • 地址抽取是信息采集研究的热点,但是如何保证高准确率与召回率一直是一个具有挑战性的问题。将基于CRF的方法与规则抽取方法相结合来进行地址抽取,并将优化后的结果再用来进行CRF训练;此过程不断循环迭代,直至性能...
  • 结果表明,在最优值λopt时,对于MovieLens系统,准确率与召回率分别提高了228.2%和228.4%;而对于Amazon系统,准确率与召回率分别提高了162.7%和162.8%。该算法提高了推荐的效果,表明流行度在用户作选择的过程中起...
  • Deep Web结果页面大多由网站根据请求从后台数据库读取数据并动态填充到通用模板而生成的。研究如何从一系列同模板生成的页面中生成该...通过在多个领域站点上实验,说明新方法在不降低准确率的情况下能大大提高召回率
  • jieba总结

    2019-04-18 09:05:16
    jieba "结巴"中文分词:做最好的Python中文分词组件 ...搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 支持繁体分词 支持自定义词典(如何上传自己的词典呢,词典...
  • 计算句子相似度时综合考虑基于词频统计的特征向量表示法和关键词之间的关系,减少了相似度对于输入次序和频数的敏感度,有效地提高了计算小文档和简单句子相似度的准确度和文本聚类结果的准确率、召回率
  • 命名实体识别是信息抽取中的一项基础性任务,如何利用丰富的未标注语料来提高实体识别的指标是该领域一个重要的研究方向。...实验表明,该方法在提高实体识别的精确率和召回率的同时,能够显著地降低人工标注的工作量。
  • 如何从大规模服务集合中快速而准确地发现目标服务是应用Web服务技术的关键。...仿真实验表明,其在召回率与准确率上比基于关键字的匹配算法都有不同程度的改善,且该方法能极大地满足服务执行时动态绑定的特性。
  • 文化运营团队任务三

    2019-03-23 21:36:35
    如何使用数据分析激活用户,提高付费转化? 什么是用户激活? 用户激活≠用户召回 让用户更好的留存和转化,远比如何召回流失用户重要。 如果产品不能在用户使用的1~3天内让其满意,基本上就会被抛弃。 要学会分析...
  • 如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页...一系列的仿真实验表明文中方法可行,并具有较高的准确率和召回率.
  • 回环检测之决策模型

    2021-04-25 11:23:30
    合理的决策模型可有效提高闭环检测的准确度和召回率.最简单的建模方法是将闭环检测看作是图像检索问题,而不考虑地图的拓扑信息和度量信息,计算当前图像和地图中所有图像的相似度,找到相似度最大的.如果相似度超过...
  • 目前,中国的城市化水平已超过50%,汽车保有量达到1.4亿辆。 随之而来的交通拥堵问题变得越来越突出。... 对自制数据集的评估表明,与YOLOv2和Faster RCNN相比,准确率提高到91.80%,召回率提高到63.86%。
  • 本文提出了一种自适应语义Web服务匹配方法,可以提高服务发现的准确性和召回率。 该方法将OWL-S的需求文档和服务配置文件本体分别转换为本体树。 通过分类和层次方法计算出树中相应节点的概念相似度,属性相似度和...
  • 内容搜索排序表达式的最佳实践

    千次阅读 2020-12-10 16:35:33
    在内容搜索场景中需要满足业务多样化,个性化的需求,在query改写配置好后,希望在排序阶段进行优化,实现强大的相关性排序效果,提高用户点击。今天会结合几个典型场景该如何来思考和设计排序因子,和大家详解特征性...
  • 在推荐系统中,通过学习联合度量空间进行编码的协作度量学习(CML),与矩阵因子分解技术相比,不仅用户的首选项,而且用户-用户和项-项相似性都取得了卓越的... 大量实验表明,SRCML可以提高建议的准确性和召回率
  • 在推荐系统中,在矩阵分解中利用文本... 实验结果证明,双向正则化策略显着提高了矩阵分解方法的评分预测准确性和前n个推荐的召回率。 而且,作为DRMF的组成部分,新的神经网络模型比单一卷积神经网络模型更好地工作。
  • 机器翻译是当今世界跨语言合作交流中一个必不可少的核心技术,其在文 ...翻译中的领域适应性问题,本文提出了最优翻译质量差和 BLEU 召回率两个指 标来进行开发集合的选择,实验结果表明,翻译质量有了明显的提高
  • 计算预测结果的F值、召回率、准确率、Macro,Micro等指标,并会计算特定阈值、以及指定区间所有阈值下的相应指标。 分词。对文本利用mmseg算法对文本进行分词。 特征选择。对文本进行特征选择,选择最具代表性的词。 ...
  • 1、抛弃Media player内核,加密后的文件自带播放器与解码器,用户播放加密视频无需再安装任何播放器或解码器,易用性显著提高; 2、支持Windows 7; 3、改进了视频水印功能; 4、美化播放界面,数个改进 V10.0 重要...
  • 在ResNeXt 基础、上加入了 SE(Sequeeze-and-Excitation) 模块,提高了识别准确,在 ILSVRC 2017 的分类项目中取得了第一名 ImageNet-2012验证集 81.40%/95.48% ShuffleNetV2 ECCV2018,轻量级 CNN 网络,在速度...
  • 在使用Anchor Boxes之后,虽然mAP下降了0.3%,但是召回率从81%上升到了88%。 并且为了融合目标分类需要的高层语义特征和目标检测需要的低层轮廓特征,YOLOv2还设计了Pass Through层,即取出了最后一个池化层的特整层...
  • 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 paddle模式,利用PaddlePaddle深度学习框架,训练序列标注(双向GRU)网络模型实现分词。同时支持词性标注。paddle模式使用...
  • 搜尋引擎模式,在精確模式的基礎上,對長詞再次切分,提高召回率,適合用於搜尋引擎分詞。 支持繁體斷詞 支持自定義詞典 Usage 自動安裝:使用 composer 安裝後,透過 autoload 引用 代碼示例 composer ...

空空如也

空空如也

1 2
收藏数 31
精华内容 12
关键字:

如何提高召回率