精华内容
下载资源
问答
  • 分享下我常用的客户开发方法及思路
    千次阅读
    2019-11-25 09:55:50

    一、浅谈下什么是客户开发?

    1.What-了解下什么是客户开发?

    客户开发是销售工作的第一步,通常来讲是业务人员通过市场调查初步了解市场和客户情况,对有实力和有意向的客户重点沟通,最终完成目标区域的客户开发计划。但以上只是一个企业客户开发工作中的冰山一角,要成功做好企业的客户开发工作,企业需要从自身资源情况出发,了解竞争对手在客户方面的一些策略性打法,制定适合自身企业的客户开发战略,再落实到销售一线人员客户开发执行,这是一个系统的工程。

    2.Why-为什么要进行客户开发?

    在竞争激烈的市场中,能否通过有效的方法获取客户资源往往是企业成败的关键。况且客户越来越明白如何满足自己的需要和维护自己的利益,客户是很难获得长期保持的。因此加强客户开发对企业的发展起着至关重要的作用。

    3.How-如何进行有效的客户开发?

    客户开发的前提是确定目标市场,研究目标顾客,从而制定客户开发市场营销策略。营销人员的首要任务是开发准客户,通过多种方法寻找准客户并对准客户进行资格鉴定,使企业的营销活动有明确的目标与方向,将潜在客户转化成现有客户。

    二、在开发客户前我们应该准备什么?

    1.充分了解自己所处的行业:是属于机械类,化工类,电子类,还是礼品类等

    2.充分了解公司的产品类型:是属于消费品,工业半成品,还是原材料等

    3.分析了解公司的市场定位:高端(欧美),中低端(东南亚,南美,非洲)等

    4.分析要开发的客户类型:是分销商,零售商,贸易商,代理商,还是制造商等

    5.分析公司的优劣势:市场定位,规模,历史,行业地位等

    6.分析并对比同行产品优劣势:价格优势,质量优势,交期,付款方式等

    7.学会分析调研,了解产品当前市场容量及未来发展的趋势和前景

    8.需要掌握哪些外贸相关业务知识和学习哪些系统业务操作流程

    9.对客户所在国和国家政策,进出口要求和港口等需要有一定的背景了解

    10 .了解个人是否具备吃苦耐劳的精神和超强的抗压能力,好的心态

    三、目前主要的客户开发方式有哪些?

    1.我自己比较常用的搜索引擎方式(Google,Bing,Yahoo)「后两者都不用FQ,Google用不了的情况下可以作补充,也能搜到一些客户信息,但是没有Google万能和全面,请按需使用」

    2.谷歌地图(Google map //t.cn/E9UL09f)目前来说,这种方式还是比较新型的客户开发方式,同行用的还比较少,其实很多国外比较高质量的采购商,在谷歌地图上都是可以找到的,而且可以找到联系方式,最主要的是信息精准,高效,可以结合展会,地图去开发。

    3.SNS社媒平台方式(Linkedin,Instagram,Youtube,Facebook)「建议深耕前面3个,可能是我一直认为facebook太杂太乱的原因吧,也可能是因为官方老是动不动就封你账号,所以有点不爽它哈哈,另外如果要做有质量的内容营销的话,还是Linkedin专业一些,视频营销会是未来的一个趋势,所以Youtube也是需要提前布局了」

    4.即时在线聊天工具(Skype,WhatsApp,Wechat,QQ)「后面2个主流的聊天工具不多做介绍,大家都玩了很多年了。Skype可以用客户Email去搜,搜到有联系人的话,那么恭喜你,赶紧跟他尬聊吧,谈谈不要钱,谈谈不要命,WhatsApp可以在通讯录里先添加客户手机号码,然后看App里面有匹配到联系人的话也可以去尬聊了,方法同上」

    5.B2B平台开发(Alibaba,Globalsources,MIC,Tradekey)「付费的平台,如果公司有的话,前期还是花上一些时间去上传产品和优化吧,虽然说B2B在如今的趋势下效果不是很好,但是也要看产品类型的,有总比没有好,所以要多做尝试,会有不一样的收获,主动开发 被动等客户询盘两者相结合,双管齐下,才是业绩提升的关键」

    6.参展 地推(海外参展/拜访客户,香港行业展,广交会等)「很多公司在这块都会有投入,因为展会来的客户还是比较直接的,除去复杂的邮件和电话沟通,面对面的交流更能与客户建立直接信任感,时间成本也会大大降低,也许你几十上百封邮件没法拿下的客户,见一面他就下单了,这是说不准的,关键还是要看眼缘,客户看中的是你这个人,是否可以让他放心的把订单交给你,所以说你的专业 细心是拿下客户的关键」

    7.付费搜索软件

    8.各国黄页网站

    9.海关数据(米课海关数据,特意海关数据,蓝鸣海关数据,外贸圈海关数据等)

    10.行业协会搜索(维基百科trade association 或谷歌搜索list of xx industry trade)

    11.展会名录(谷歌直接搜索list of 行业 exhibition或搜XX产品 exhibition list)

    四、如何利用Email开发客户?

    写开发信的前提:「5问思路」

    为什么要写给客户?写什么内容?要达成什么目的?希望客户下一步怎么做?客户为什么一定要回复你?

    一、传统式开发:可参照的开发信时间节点

    第1天:第1封邮件 –敲门砖-切入式开发信

    隔天或者第3天:第2/3封邮件-基础的客户跟进

    第5天:第4封邮件-周末祝福或节日祝福

    第2个星期:第5封邮件 – 邮件里提及Call to action,争取得到客户正面回复

    客户不回复继续跟进第6封,第7封-10封等,找不同的切入点跟进客户。

    个人总结:

    「在此期间,如果提前得知客户的其它联系方式的话,可以在邮件发出后给客户跟进一个电话,提醒客户查看邮件,或者在Skype/whatsApp/Linkedin上给客户留言,前期就是为了刷存在感,让客户注意到自己,但是要注意的一点就是在这个过程中跟进不要太频繁,你传递的信息也要是对客户有价值的东西,才不会引起客户反感哦」

    二、冰大式Mail Group开发思路:

    邮件内容&主题:

    1.初次联系客户,简单介绍自己和公司

    2.根据客户市场,推荐热销产品

    3.发产品目录,供客户了解

    4.发产品认证及验厂报告

    5.发参展图片,展会优势

    6.发工厂和样品间图片

    7.已合作的大客户,展示实力

    8.发常规报价单,供客户参考

    9.新品,促销优惠等

    个人总结:

    这是一整套组合拳,每封邮件的时间间隔可以按自己的喜好来设置,可以在一天内完成所有步骤,前提是要确保你的邮件质量,要有针对性,不要模板化,控制好邮件大小;针对性客户开发,我认为这套拳法用在大客户身上非常有效,而且时间有限,要把有限的时间用在刀刃上,大客户做背景调研,然后呢针对性的做Mail Group来突出我方的专业与优势,分分钟秒杀同行几条街,只要邮件写的好,能戳到客户的痛点,回复率很高;而小客户呢,不是不建议用,而是用另外的一种方式,即模板型的Mail Group来开发,你可以在发开发信之前,先按大纲制作出一套Mail Group模板,之后再不断精进和改良,小客户就可以用这套来开发,而大客户就针对性的写新的Mail Group去开发,区分开来,不能一把抓,否则效果就差很多了。

    同样的Mail Group,不一样的配方

    三、BD mail 思路:

    (核心是简洁,一剑封喉,一下子吸引住客户的眼球,引起客户好奇,同时又具备Mail Group的核心思想)

    1.Re:Re:Re:Offer Recap

    Hi Craig,

    Offer sheet attached.

    2.Re:Re:Re:Sample Photos

    Hi Craig,

    FYI.

    3.Re:Re:Re:Project updated

    Hi Craig,

    Please check attachment, Thanks.

    4.Re:Re:Re:About产品名 PI

    Hi Craig,

    Double-Checked.

    个人总结:

    以上模板只是给大家提供的一个思路而已,邮件主题和内容可以根据自己的习惯去设计和调整,大家记住核心思想然后自由发挥就行了,重要的一点是要“出其不意攻其不备”。

    五、如何利用SNS平台开发客户?

    随着社交网络日益壮大,比如LinkedIn,Facebook,不利用起来太可惜了。而且5G时代的到来,预示着视频营销将是未来的一个发展趋势,Youtube也要提前布局起来,这将是一块蓝海市场。

    对于小白,SNS可以怎么用呢?我一般是这样玩的,大家也可以参照下。

    1.Google结合Linkedin找客户公司具体负责人,加好友联系

    2.Linkedin或Facebook直接搜产品或行业关键词找到客户,加好友联系

    3.利用产品关键词搜Group,加入后Post动态并适当添加对口的客户尬聊

    4.前期加好友,后期维护,时不时跟客户互动下,say hello混个脸熟

    5.写文章,做内容营销,向客户传递有价值的信息,建立个人IP,让客户时刻记住你(重点)

    基于文案内容怎么写,大家可以报名颜Sir的社交成单课或者参考3岁小姐姐的文章,这里我就不再强调了。

    个人总结:

    在客户开发方面,我认为对营销比较重要的一点还是基于对产品的了解和产品卖点的打造,任何一个销售,在开发客户前,都必须要对自己的产品有所了解。试想下,一个对自己产品都不懂的业务员,凭什么能够让客户信任他并且下单呢?所以呢开发客户不仅仅是要了解业务、行业以及市场知识外,还要对产品的功能,参数有一定的了解,更要清楚地知道产品的卖点究竟是什么?为什么客户一定要从你这里买,而不是别的供应商?

    基于产品卖点的打造,请参考以下补充:

    六、如何打造吸引客户的卖点?

    一、卖点的3大标准:

    1.区隔竞争对手,即竞争对手做不到,竞争对手不敢承诺,竞争对手还没有宣传出来的,你已经把它做到,并且能够承诺,你就应该率先提出,这样就很容易获取客户信赖。

    2.自身有实力做到,卖点不是忽悠客户的口号,而是强有力的承诺。必须经得起市场和客户的考验。如京东凭借其物流实力推出“当日达”和“次日达”口号,假如没做到,就会砸掉自己的招牌,陷入公关危机当中。

    3.可感知和衡量的价值,即在满足区隔竞争对手和自身有实力做到的卖点,并不一定迎合市场的需求,一个成功的卖点必须是消费者渴望得到的,并且是可感知和可衡量的。

    二、具体点,可以分为这几个角度:

    1.价格(价格是影响消费者决策的重要因素,透明化或者可比性较强的产品以价格作为卖点,在很大程度能够杀出一条血路。例如:瓜子二手车的卖点是“没有中间商赚差价”,这就意味着车主可以花更低的价格买到质量相同的车;沃尔玛的卖点是“天天低价”,吸引家庭主妇每天光顾;无锡市某拉杆箱商家的卖点是“厂家直销,价格便宜40%,比比就知道”。)

    2.服务(顾客不仅仅消费产品,很多时候服务也是消费者购买会考虑的因素。这里的服务包括现场的服务和售后服务。如果能在服务上提出可衡量的标准,不仅可以瞬间吸引客户,还可以形成口碑传播。如海底捞凭借其不可撼动的服务标准让客户折服(上厕所洗手也有服务员递上擦手纸巾);某水果店的卖点是“购满20元,2公里内加1元提供定时送货上门服务”;麻辣烫店的卖点是“用山泉水烫菜,1小时换一锅水”。)

    3.效率(人们都渴望快速获得自己需要的产品价值,尤其是在市场竞争激烈的形式下,高效率地满足客户的需求,是这个快节奏时代客户的要求。比如:快餐店主打“半小时送到,否则半价”;建站网络培训教程主打“零基础1小时学会建站,否则退款”;快递公司主打“隔日送达”;润喉糖主打“金嗓子喉片,入口见效”)

    4.质量(产品质量是客户最关注的一点。假如自己产品质量过硬,请不要吝啬,大胆喊出来。例如:某羊毛衫的卖点“水洗不变形,1年变形免费换”;某牛仔裤的卖点“高弹力牛仔裤,进店给你劈叉做演示!)

    5.稀缺(“物以稀为贵”是对人性的深刻认知,不管是因为原材料的稀缺还是生产数量的稀缺,都会极大提升产品在消费者内心的价值感。比如:某桃花酒的卖点是“采取祖传工艺酿制,每年限供2000坛”;某土鸡餐饮店的卖点是“因为农村土鸡量有限,每天仅为50个客人提供土鸡宴,需提前3天预定”)

    6.方便(客户都喜欢方便,不愿意麻烦,假如你的产品和服务能够让客户方便,以此卖点为宣传,能吸引一大批嫌麻烦的客户。比如:某酒楼卖点是“内设停车场,提供特惠洗车服务”;宾馆的卖点是“只要市内,一个电话,免费派车接送”;礼物说卖点是“一个APP,帮你选【全球好货】的 App,带你逛遍全世界的好东西,送出感动ta的礼物”)

    7.实力(强大的实力能够让客户对你的产品和服务放心,这种实力来源于过往的成绩、技术、产品资质等。英语培训社的卖点是“70%均为美国特聘外籍教师,英语发音最地道”;某音响公司的卖点是“10年的品牌,服务的客户共计12W”;某补习社的卖点是“每年大学升学率高达82%”)

    8.附加值(在提供同样的主营产品,你比竞争对手额外多提供价值,客户会优先选择你。比如:早餐店的卖点是“买任意一款点心,即可免费获得一杯价值5元的豆浆”;某面馆的卖点是“消费任意一款面,均可获得一碗美味浓骨汤”)

    9.选择(为什么客户会出现“货比三家”,因为人们往往喜欢更多的选择进行对比,以挑选出自己最喜欢的东西。利用更多选择作为卖点,能吸引特定客户的关注。比如:自助餐的卖点是“只需要50元,108种菜式任你随便吃”)

    创造出很不错的卖点后,我们还需要一个步骤,叫卖点证明。没有事实和数据证明的卖点都是夸夸其谈,缺乏说服力,客户和消费者只会一笑置之。

    无论是500强大企业,还是中小企业,在新产品推出或者产品竞争白热化的时候,一个强有力的卖点往往能够让产品快速打开局面,在消费者心中占据一席之地。

    本文我主要从以上几个方面去阐述了自己对客户开发的一知片解,总体上来说,就是:

    客户开发=寻找客户 联系客户 卖点打造吸引客户 跟进谈判客户 促进客户成交

    在大体内容上可能有些写的不是很详尽,了解的层面也不够深入,但我会不断地去学习新的知识和继续完善这个开发体系,慢慢打磨,打好基础,希望有质变的那一天,同时呢也希望我这个外贸新人的一点总结能够对还处在迷茫阶段中的你有所帮助,有所启发。

    更多相关内容
  • 关于客户(销售员该如何找客户才好) 1、旧时指以租佃为生的人家。2、旧时指外地迁来的住户。(以上两条详见下文)。3、工厂企业或经纪人称...教你怎样寻找客户源(销售员该如何找客户才好) 刚入行的销售员,首先要

    关于客户(销售员该如何找客户才好)

    1、旧时指以租佃为生的人家。2、旧时指外地迁来的住户。(以上两条详见下文)。3、工厂企业或经纪人称来往的主顾;客商。4、在网络的通信方式中,指服务的请求方。5、在客户关系管理中,客户是对企业产品和服务有特定需求的群体,它是企业经营活动得以维持的根本保证。6、客户是服务请求方。

    教你怎样寻找客户源(销售员该如何找客户才好)

    刚入行的销售员,首先要面对客户在哪里的问题?就是干了多年的销售员遇到新的产品,特别是新出现的产品,有时连行业都分不清楚。比如:我做了十多年的销售,当开始做品牌的客户关系管理系统这个项目时,就拿不准是要去哪里找代理商渠道,后来通过向同行的学习,探讨慢慢的摸索出了方向。还有就是随着科技的发展,一些跨行业,综合性能的产品会越来越多,渠道方向就涉及到好多路径,同时还要考虑到哪方面的渠道更适合等方面因素,这就为销售员提出了新的问题。那么,我们在寻找客户的过程中应注意些什么呢?

    一、普遍寻找法

    这种方法也称逐户寻找法或者地毯式寻找法。其方法的要点是,在业务员特定的市场区域范围内,针对特定的群体,用上门、邮件或者电话、电子邮件等方式对该范围内的组织、家庭或者个人无遗漏地进行寻找与确认的方法。比如,将某市某个居民新村的所有家庭作为普遍寻找对象,将上海地区所有的宾馆、饭店作为地毯式寻找对象等。

    普遍寻找法有以下的优势:

    1、地毯式的铺开不会遗漏任何有价值的客户;

    2、寻找过程中接触面广、信息量大、各种意见和需求、客户反应都可能收集到,是分析市场的一种方法;

    3、让更多的人了解到自己的企业。

    当然其缺点也是很明显的:

    1、成本高、费时费力;

    2、容易导致客户的抵触情绪。

    因此,如果活动可能会对客户的工作、生活造成不良的干扰,一定要谨慎进行。

    普遍寻找法可以采用业务员亲自上门、邮件发送、电话、与其他促销活动结合进行的方式展开。

    二、广告寻找法

    这种方法的基本步骤是:(1)向目标顾客群发送广告;(2)吸引顾客上门展开业务活动或者接受反馈。例如,通过媒体发送某个减肥器具的广告,介绍其功能、购买方式、地点、代理和经销办法等,然后在目标区域展开活动。

    广告寻找法的优点是:

    1、传播信息速度快、覆盖面广、重复性好;

    2、相对普遍寻找法更加省时省力;

    其缺点是需要支付广告费用、针对性和及时反馈性不强。

    三、介绍寻找法

    这种方法是业务员通过他人的直接介绍或者提供的信息进行顾客寻找,可以通过业务员的熟人、朋友等社会关系,也可以通过企业的合作伙伴、客户等由他们进行介绍,主要方式有电话介绍、口头介绍、信函介绍、名片介绍、口碑效应等。

    利用这个方法的关键是业务员必须注意培养和积累各种关系,为现有客户提供的满意的服务和可能的帮助,并且要虚心地请求他人的帮助。口碑好、业务印象好、乐于助人、与客户关系好、被人信任的业务员一般都能取得有效的突破。

    介绍寻找客户法由于有他人的介绍或者成功案例和依据,成功的可能性非常大,同时也可以降低销售费用,减小成交障碍,因此业务员要重视和珍惜。

    四、资料查阅寻找法

    我们一直认为,业务员要有强的信息处理能力,通过资料查阅寻找客户既能保证一定的可靠性,也减小工作量、提高工作效率,同时也可以最大限度减少业务工作的盲目性和客户的抵触情绪,更重要的是,可以展开先期的客户研究,了解客户的特点、状况,提出适当的客户活动针对性策略等。

    需要注意的是资料的时效性和可靠性,此外,注意对资料(行业的或者客户的)日积月累往往更能有效地展开工作。

    业务员经常利用的资料有:有关政府部门提供的资料、有关行业和协会的资料、国家和地区的统计资料、企业黄页、工商企业目录和产品目录、电视、报纸、杂志、互联网等大众媒体、客户发布的消息、产品介绍、企业内刊等等,而互联网信息虽广而多,但是还是要到一些可信专业的网站上进行相关的资料搜集,比如有关政府部门的资料就是去一些当地的政府部门网站,有关行业和协会的资料就去自己行业协会的网站上去,其他的资料以此类推,找最权威的网站,相关性高,找到的资料才会准确。

    一些有经验的业务员,在出发和客户接触之前,往往会通过大量的资料研究对客户做出非常充分的了解和判断。

    五、委托助手寻找法

    这种方法在国外用得比较多,一般是业务员在自己的业务地区或者客户群中,通过有偿的方式委托特定的人为自己收集信息,了解有关客户和市场、地区的情报资料等等,这优点象香港**使用“线民”,在国内的企业,笔者也见过,就是业务员在企业的中间商中间,委托相关人员定期或者不定期提供一些关于产品、销售的信息。

    另一种方式是,老业务员有时可以委托新业务员从事这方面的工作,对新业务员也是一个有效的锻炼。

    六、客户资料整理法

    这种方法本质上属于“资料查阅寻找法”,但是,也有其特殊性,我们强调客户资料管理,因为其重要性十分突出,现有的客户、与企业联系过的单位、企业举办活动(如公关、市场调查)的参与者等等,他们的信息资料都应该得到良好的处理和保存,这些资料积累到一定的程度,就是一笔财富,在市场营销精耕细作的今天,这尤为重要,这同时也要得力于CRM客户关系管理系统,处理、管理繁杂的客户资料为企业,为个人带来了多大的帮助。现在难以想象如果一个企业没有用到CRM客户关系管理系统或者是OA会变得多么糟糕,如果面对你繁多的客户需要管理还没用到类似工具的话,那你是out了。

    举个最简单的例子,某个家庭,第一代洗衣机购买的是“小天鹅双桶洗衣机”、第二代洗衣机是“小天鹅全自动洗衣机”、第三代洗衣机是“小天鹅滚筒式洗衣机”,你如果要做到真正让客户的三代洗衣机都用“小天鹅”,客户的资料和客户的精细服务就是必不可少的。开个玩笑的话,小天鹅可以提出一个营销内部口号:“让小天鹅在顾客家里代代相传”。

    七、交易会寻找法

    国际国内每年都有不少交易会,如广交会、高交会、中小企业博览会等等,这是一个绝好的商机,要充分利用,交易会不仅实现交易,更重要的是寻找客户、联络感情、沟通了解。奥联的一个客户的老总,参加了今年的广交会回来,向全体员工宣布一个惊人的好消息:“我有足够的信心向大家保证:今年我们的销售收入可以增加2个亿!”,其成效明显主要原因之一是因为其产品的特殊性,但是更重要的是企业已经全面学会和掌握了这个有效的途径。

    八、咨询寻找法

    一些组织,特别是行业组织、技术服务组织、咨询单位等,他们手中往往集中了大量的客户资料和资源以及相关行业和市场信息,通过咨询的方式寻找客户不仅是一个有效的途径,有时还能够获得这些组织的服务、帮助和支持,比如在客户联系、介绍、市场进入方案建议等方面。我们就曾经为一个国外企业进入中国市场提出合作建议方案,寻找合作者甚至参与项目论证等方面提供过一揽子服务。

    九、企业各类活动寻找法

    企业通过公共关系活动、市场调研活动、促销活动、技术支持和售后服务活动等,一般都会直接接触客户,这个过程中对客户的观察、了解、深入的沟通都非常有力,也是一个寻找客户的好方法。

    有效地寻找客户方法远远不止这些,应该说,是一个随时随地的过程。一般信息处理过程是:“所有目标对象-接触和信息处理-初选―精选―重点潜在客户―客户活动计划”。

    展开全文
  • 【Python应用】寻找社交网络中的目标用户 这是我们学校的软件工程课程设计的题目,要求自行编写爬虫或者利用开放的API获取新浪微博、知乎等社交网站的用户信息,利用数据挖掘的相关算法进行分析, 从大规模的用户群体...

    【Python应用】寻找社交网络中的目标用户

    日后的更新:由于是很久以前的课程设计项目,完整的源码已经不见了,关键的网页数据获取和解析的部分代码我在文章中已经贴出来了,但写的也不够好,如果想参考爬取知乎的同学,推荐去看慕课网的《python分布式爬虫打造搜索引擎》,其中有对编写知乎爬虫的视频讲解,虽然已经过去了不短的时间,知乎的反爬策略可能有变,但还是有参考价值的。

    对于爬虫动态代理池的构建,推荐qiyeboy/IPProxyPool这个开源项目,安装的时候可能有点麻烦,见到错误提示缺少哪个包手动pip install就好了。

    以下是正文:

    这是我们学校的软件工程课程设计的题目,要求自行编写爬虫或者利用开放的API获取新浪微博、知乎等社交网站的用户信息,利用数据挖掘的相关算法进行分析, 从大规模的用户群体中, 分别找出其中具有海淘或母婴购物意向的用户。

    在具体实现方面我选择了知乎作为目标的社交网站,通过Python编写数据爬虫与进行数据的分析,通过数据建立用户特征向量,将已知具有母婴购物倾向的用户与未知购物倾向的用户的特征向量进行对比,进而寻找出具有母婴购物倾向的用户。

    ###目录

    编程前简单的分析

    ###选择知乎的原因

    知乎的个人详情页与问题详情页不需要登陆也能访问,免除了模拟登陆的步骤。

    在知乎无论是问题描述还是个人信息内,标签的使用频繁,能给后续的文本处理与分析带来极大地方便。

    不足之处:知乎专业化程度较高,其在生活化气息不如新浪微博等社交网站。

    选定需要获取的信息

    从个人信息页面与问题详情页面分析我们的爬虫应该爬取的信息:

    用户详情界面的基本分析

    问题详情界面的基本分析

    来逐项考虑每项信息对我们项目的意义:

    • 用户的基本信息——昵称、居住地、教育程度等,一般考虑并不会对是否具有母婴购物倾向具有决定性的影响。

    • 用户关注的话题、问题、专栏——关注的话题能最直观的展现用户的喜好、关注点所在,专栏与话题有重叠,关注的问题数量不同用户间可能会差距较大。

    • 用户的回答,专栏——可以反映用户的特长,不能反映用户的兴趣点。

    • 用户的提问——可能能反映用户的某种需求。问题tag能对问题进行有效概括。

    综上,我决定对每个用户提取其关注的话题与所提的问题、问题的tag来建立用户特征向量。

    ##爬虫的编写

    爬虫选择了使用Python编写,主要使用了其中的requests, beautifulsoup等库。

    ###一些难点与解决方法

    爬虫实现过程中遇到的一些阻碍与大体解决方法如下

    • 直接爬虫访问知乎遇到了500错误,结合chrome的开发者工具与fiddle网络分析工具,分析对知乎进行访问的网络请求,在爬虫头部加入了伪造的请求头。

    • 前端知识较为缺乏,对HTML的DOM树结构了解不够深入,对beautifulsoup库不能很好的利用,对一些内容的爬取还需结合正则表达式来操作。

    • 在获取母婴用品话题的关注用户的时候无法绕过登陆过程,而且需要对动态的网页内容进行爬取,此时只能通过selenium+chrome的组合自动填入登陆表单信息与下拉滚动条获取用户id,手动点击验证码的方式完成(现在知乎的登陆验证是点击图中的倒立文字,完全自动化的爬虫想必很难处理)。

    • 对于知乎会限制固定ip访问频率的问题,通过在网上批量购买ip代理地址、建立ip代理池解决,但ip代理池的更新还没能做到自动化。

    • 对于单个爬虫爬取效率太低的问题,由于爬虫完整运行一次的时间主要由网络延迟决定,所以使用python的多线程编程爬虫提高爬取效率。

    • 爬取的数据同步存储到mysql数据库中,使用python的pymysql库对数据库进行操作。

    爬虫的大致结构

    爬虫工作分为三个阶段:第一阶段为随机获取一定数量的用户id,第二阶段为获取一定数量已知具有母婴购物倾向的用户id,第三阶段为根据已经获取的用户id去获取用户的个人信息与提问详情。

    • 第一阶段的工作中,以随机的一位用户作为种子用户,获取其关注的20位用户id,对这20位用户再获取其每个人关注的20位用户,如此循环,预计获取8000位用户作为未知购物倾向的用户组,将用户id写入数据库中。

    • 第二阶段的工作中,前往知乎“母婴用品”话题关注者页面,获取页面下1500名关注者,作为已知具有母婴购物倾向的用户的用户组,同样将用户id写入数据库中。

    • 第三阶段的工作中,通过数据库中的用户id,获取其关注的话题列表与已经提问的问题的标签列表。

    其中第三阶段,也是爬虫主要阶段的主要代码如下:

    # -*- coding:utf-8 -*-
    from bs4 import BeautifulSoup
    import requests
    import re
    import pymysql
    import threading
    import queue
    import time
    
    #用于保存用户uid在数据库中序号的队列
    q = queue.Queue(maxsize=3000)
    
    conn_0 = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='root',
                                   db='zhihu', charset='utf8')
    
    cursor_0 = conn_0.cursor()
    #将未读取过的用户入列
    sql_0 = 'SELECT order_number from infant_userid where is_read = 0'
    cursor_0.execute(sql_0)
    conn_0.commit()
    for r in cursor_0:
        r = re.sub("\D", "", str(r))
        print(r)
        q.put(r)
    
    class zhihu():
        def __init__(self):
            # 连接数据库
            self.conn = pymysql.connect(host='127.0.0.1', port=3306, user='', passwd='',
                                   db='zhihu', charset='utf8')
            self.main_url = 'https://www.zhihu.com/people/'
            self.answers_url = '/answers'
            self.topics_url = '/following/topics?page='
            self.asks_url = '/asks?page='
            self.question_url = 'https://www.zhihu.com/question/'
            self.headers = {
                "Host": "www.zhihu.com",
                "Referer": "https://www.zhihu.com/",
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
            }
    
        def get_userinfo(self, user_token, proxies):
            # 获取用户名字
            url1 = self.main_url + user_token
            content = requests.get(url1, headers=self.headers, proxies=proxies).content
            #print(content.text)
            pattern = re.compile(r'<span class="ProfileHeader-name">(.+?)</span>')
            try:
                name_temp = pattern.findall(content.text)
            except:
                #除去僵尸用户,即未登陆无法查看信息的用户
                sql1 = "delete from infant_userid where token_id = '"+user_token+"'"
                self.cursor.execute(sql1)
                self.conn.commit()
                print(user_token+" is a ghost!!")
                pass
            else:
                print(name_temp)
                name = name_temp[0]
                print(name)
                # 获取用户关注的话题
                url2 = self.main_url + user_token + self.topics_url
                # print("fetching userinfo...")
                n = 1  # 话题的页数
                count = 21
                all_topics = []  # 用于存放话题的列表
                while count > 20:
                    content = requests.get(url2 + str(n), headers=self.headers, proxies=proxies)
                    pattern = re.compile(r'&quot;name&quot;:&quot;(.+?)&quot;')
                    topics = pattern.findall(content.text)
                    all_topics = all_topics + topics
                    n = n + 1
                    count = len(topics)
                all_topics = list(set(all_topics))  # 去重
                topics_str = ";".join(all_topics)  # 转字符串
                print(topics_str)
    
                # 链接数据库
                sql2 = "INSERT INTO infant_users (tokenID,username,topics) VALUES ('" + user_token + "','" + name + "','" + topics_str + "')"
                self.cursor.execute(sql2)
                # print(sql)
                self.get_question(user_token, proxies)
    
        def get_question(self, user_token, proxies):
                # 获取用户的提问
                url = self.main_url + user_token + self.asks_url
                #print(url)
                #print("fetching questions...")
                n = 1  # page
                question_count = 20
                while question_count > 19:
                    content = requests.get(url + str(n), headers=self.headers, proxies=proxies)
                    pattern = re.compile(r'&quot;http://www.zhihu.com/api/v4/questions/(.+?)&quot;')
                    question_tokens = pattern.findall(content.text)
                    # print(question_tokens)
                    for question_token in question_tokens:
                        #print(question_token)
                        url2 = self.question_url + question_token
                        content2 = requests.get(url2, headers=self.headers, proxies=proxies).content
                        soup = BeautifulSoup(content2, 'lxml')
                        try:
                            title = soup.find('h1', attrs={'class', 'QuestionHeader-title'})
                        except:
                            #问题未登陆无法访问的情况
                            print('question is empty')
                            pass
                        else:
                            title = title.get_text()
                            print(title)
                            sql_tags = []
                            tags = soup.find_all('span', attrs={'class', 'Tag-content'})
                            for tag in tags:
                                tag = tag.get_text()
                                sql_tags.append(tag)
                            # print(sql_tags)
                            tags_str = ";".join(sql_tags)  # 转字符串
    
                            # 操作mysql
                            sql1 = "INSERT INTO infant_questions (questionsID,question,tags,askerID) VALUES ('" + question_token + "','" + title + "','" + tags_str + "','" + user_token + "')"
                            # print(sql1)
                            self.cursor.execute(sql1)
                            # time.sleep(0.5)
    
                    # 页面计数加一
                    n = n + 1
                    question_count = len(question_tokens)
                    # print(count)
                #print("fetch questions done")
    
        def run(self):
            count = 0
            while count < 100:
                if not (q.empty()):
                    user_num = q.get()
                    print(user_num)
                    self.cursor = self.conn.cursor()
                    sql = "SELECT token_id FROM infant_userid WHERE order_number='" + str(user_num) + "'"
                    self.cursor.execute(sql)
                    self.conn.commit()
                    try:
                        user_token = self.cursor.fetchone()[0]
                    except:
                        print("获取用户名出错,重试中...")
                        pass
                    else:
                        print("feching the no." + str(user_num) + " user: " + user_token + "...")
                        # 代理,还需手动填入
                        proxies_pool = [{'https': 'https://210.43.38.251:8998'}, {'https': 'https://111.155.116.247:8123'}]
                        proxies_num = 1
                        proxies = []
                        #try:
                        self.get_userinfo(user_token, proxies)
                        #except:
                            #print("发生错误,重试中...")
                            #q.put(user_num)
                            #pass
                        #else:
                        sql2 = "UPDATE infant_userid SET is_read=1 where token_id='" + str(user_token) + "'"
                        self.cursor.execute(sql2)
                        self.conn.commit()
                        count += 1
                        print(count)
                    print("fetch done")
    
            self.cursor.close()
    
    if __name__ == "__main__":
        #定时重启的主线程
        for i in range(1, 10):
            #线程列表
            thread = []
            for i in range(0, 1):
                z = zhihu()
                t = threading.Thread(target=z.run, args=())
                #设为守护进程
                t.setDaemon(True)
                thread.append(t)
            for i in range(0, 1):
                thread[i].start()
            for i in range(0, 1):
                thread[i].join()
            time.sleep(1200)
    

    程序运行时间过长爬取的效率会下降,将主线程设置为定时重启也不行,不知道是哪里出了问题。…

    最终爬取的数据在数据库中预览的效果如下:

    问题详情

    用户信息

    数据库与表的结构就不贴出来了,并不是什么复杂的结构。

    ##数据的处理

    ###初步处理

    • 筛选:剔除无法访问的用户后,得到7792位未知购物倾向用户信息,1209位已知具有母婴购物倾向用户信息。母婴用户下有1141条问题记录,未知倾向用户下有16924条问题记录。

    • 分词:对每个用户关注的话题、问题使用结巴分词进行分词处理。分词过程中整合网络上的停用词表,构建更为全面的停用词表。

    • 生成待分析文本:将每个用户分词后信息导出到一个txt文件,以用户的id作为文件名。未知与已知用户分别置于两个不同文件夹内。

    这样每个用户就有了一个描述该用户的txt文件,下一步将基于这个txt文件的内容计算用户的特征向量。

    ###进一步处理

    • 首先计算已知母婴购物倾向用户的特征向量:计算每个词的卡方统计量,挑选出其中CHI>0.1的词语作为特征向量,然后计算每个词语的TF-IDF值作为特征向量的权重,其乘积便为带权重的特征向量。
      CHI值的计算公式:
      CHI值的计算公式
      TF-IDF值的计算公式:
      TF-IDF值的计算公式

    • 建立未知购物倾向用户词表,计算每个词的特征向量值后写入数据库,对每个未知购物倾向用户的分词后文档进行处理,从数据库中查询每个词的特征向量值构成该用户的特征向量。

    • 计算已知具有母婴购物倾向的用户与未知用户的特征向量夹角余弦值,若计算结果大于0.5则认为该未知用户同样具有母婴购物倾向。
      夹角余弦值计算公式

    ##结果

    ###程序运行的结果

    程序运行情况如图:
    程序运行结果

    此时程序运行了25分钟,处理了500+位用户的数据,约占总数的6%,从搜索结果栏可以发现,程序已经寻找出了三位潜在的具有母婴购物倾向的用户。

    如果运行的时间足够长的话,可以从7792位用户中把所有具有母婴购物倾向的用户寻找出来(懒啊…)。

    ###小小的总结
    当然,从运行结果就能看出缺点:程序太慢,效率太低了…建立未知购物倾向用户的特征向量与余弦夹角的计算都需要很多时间。实际上以上分析的方法都只是简单的对包含用户信息的文本进行相似度的比较,其中“计算结果大于0.5则认为该未知用户同样具有母婴购物倾向”也没有任何根据,完全只是为了方便而私人划定的标准,对于获得的“潜在用户”也没有任何校验准确性的方法,整套分析的方法可以说是漏洞百出(这点在课程设计答辩的时候已经被老师指出了),所以这篇文章并不具备任何作为实际参考的意义,仅仅是作为个人python程序练手项目的一次总结与记录。

    这里写图片描述
    期间也想要放弃,虽然掉入了一个又一个的坑,但还是勉勉强强爬了出来…

    在实际编程的工作中遇到的困难比文中提及的要多,例如数据库操作上的困难(去重)、代理设置上的疑问(http与https只差)、手贱删掉已经爬好的用户数据等…虽然其中大多数是低级错误,但一脚一个坑也算是能让我长点记性吧…

    ###参考资料

    展开全文
  • 机器学习7个主要领域

    万次阅读 多人点赞 2019-06-13 08:24:58
    机器学习是识别隐藏在数据中的可能性并将其转化为完全成熟机会的技术。巧合的是,机会是促进业务运营并在竞争对手中脱颖而出的因素。 了解机器学习算法如何应用于各个...现在是时候看看主要的机器学习应用程序...

    https://www.toutiao.com/a6700529940300825099/

     

    机器学习是识别隐藏在数据中的可能性并将其转化为完全成熟机会的技术。巧合的是,机会是促进业务运营并在竞争对手中脱颖而出的因素。

    了解机器学习算法如何应用于各个领域以获得可带来合法业务优势的结果至关重要。

    在我们之前的文章中,我们已经介绍了机器学习技术的不同方面。现在是时候看看主要的机器学习应用程序及其带来的好处。

    主要机器学习应用

    机器学习7个主要领域

    数据分析中的机器学习 - CRM,营销分析,受众研究

    了解大局是任何希望在选定领域取得成功的公司的要求。数据分析是使其成为可能的卓越工具之一。从本质上讲,数据分析是一个三重过程。它涉及:

    • 从不同来源收集数据,
    • 从中提取有价值的见解
    • 以全面的方式呈现它(即可视化)。

    机器学习算法应用于各个阶段,以确保过程的效率和准确性。

    • 聚类算法用于探索数据;
    • 分类算法用于对数据进行分组,对其进行筛选并得到它的要点;
    • 维度降低算法用于可视化数据,即以连贯的形式显示。

    从本质上讲,这些数据分析算法构建了一个强大的质量决策框架。

    因此,数据分析实际上用于业务运营的每个业务方面。

    让我们来看看最常见的。

    • 销售和运营计划工具 - 作为统一的仪表板,您可以从中一般而详细地监控操作。换句话说,它是一个使用全面数据分析的紧凑系统。
    • 产品分析 - 作为产品使用信息的中心;
    • 客户建模和受众细分 - 数据分析用于识别相关细分受众群,以及定义和描述客户的子类别。通过预测分析 - 它还能够在某些情况下为不同类型的用户计算可能的操作过程。
    • 市场研究/内容研究 - 作为一组工具来描述您周围的环境,并更好地了解当前的市场情况以及应采取何种措施来充分利用它。

    预测分析的机器学习 - 股票市场预测,市场研究,欺诈预防

    当谈到通过机器学习获得竞争优势时 - 数据分析是金融的一个方面。金融的另一面是预测分析。这就是机器学习如火如荼的地方。

    你看 - 在一个地方获取来自不同来源的数据是一回事,提取见解并展示它的厚度。这是一个过程自动化与一些花哨的技巧。看待未来的发展并相应地规划您的行动是完全不同的事情。

    这就是预测分析的用途。这是它的工作原理。

    • 数据的先决条件是模式。
    • 如果您有足够的有关模式行为的信息,则可以探索一系列模式。这些信息通常被称为“历史数据”。
    • 基于提取的见解,该算法可以建立对接下来可能发生的事情的假设并确定特定事件转变的概率。

    例如,让我们来看股票价格。由于各种因素,已知特定股票的价格在某些商标附近波动。在计算价格的进一步波动性和计划进一步行动时,会考虑这些因素随时间的这些影响。

    总体而言,预测分析广泛应用于以下领域:

    • 供应链管理 - 用于控制产品的流程。通常用于零售商业和电子商务,以处理产品库存的需求和供应程序完好无损。
    • 股票预测是预测分析的最纯粹用途之一。你有数字,你需要计算一定数字的波动率与各种传入因素的相关性。
    • 推荐引擎和内容聚合器应用预测分析,以基于用户的偏好,意图和行为来做出相关内容的假设。内容建议是消费者级别上最基本的服务个性化类型之一。
    • 欺诈预防 - 机器学习和预测分析赋予了远见的力量,可以帮助揭露欺诈活动。除此之外,它还可以提供完整的犯罪情况。问题是 - 大多数网络欺诈活动都是在自动算法的帮助下完成的。这些算法以模式工作,可以从数据中提取和预测。预测机器学习算法用于暴露垃圾邮件,帐户劫持,欺诈支付,机器人流量和其他类型的数字欺诈。

    服务个性化 - 推荐引擎,用户建模

    当服务提供用户想要的东西时,每个用户都喜欢,然后是一些用户。这是用户参与的基本要素,也是在产品与用户之间建立牢固关系的一步。

    当所述服务根据最终用户的需求和偏好量身定制时,事情会变得更好。这是个性化的行动,并且涉及很多机器学习。

    个性化充分利用可用的用户数据,计算可能性,并将其转化为业务运营的宝贵资产。

    最近,个性化功能被广泛用于不同的服务中

    • 增加用户对服务的参与度;
    • 使整个用户体验更加高效和充实。

    为了实现这一点,应用了回归机器学习算法。

    • 该方法类似于预测算法,但不是建立某些行动方案的假设,个性化机制根据特定用户的“状态”重新排列服务的呈现。

    这是它的工作原理。

    • 在使用该服务时,用户会留下偏好,操作,意图,评论和其他内容的详细历史记录。该信息通过他消费的内容和他消费的方式向用户呈现。
    • 内容具有描述其价值的某些特征 - 主题,类别,类型,颜色,重量,发布时间 。
    • 不同内容的值在不同类型的内容之间创建关系网格。
    • 通过机器学习 - 将用户信息和内容信息进行比较和匹配。
    • 该操作的结果是假设用户可能喜欢的其他内容,以防他喜欢或不喜欢特定内容。这是与内容重叠的另一个关系网格。
    • 结果,用户获得根据他的偏好设计的服务。

    总体而言,个性化用于以下领域:

    • 内容个性化 - 根据用户的偏好和他与内容的交互来安排新闻源或搜索结果。
    • 产品建议 - 基于用户的偏好和行动,结合内容与建议的关系(例如,组合良好的产品 - 如袜子和运动鞋)。
    • 广告个性化 - 这个涉及双内容库存有点棘手。您拥有网站的内容广告资源,并且您拥有广告资源。这样可以在整个会话期间展示相关广告。

    自然语言处理 - 文本生成,文本分析,文本翻译,聊天机器人

    自然语言处理机器学习算法深入了解单词的细节,并从中提取出有价值的东西。而且由于文本是一种原始的数据状态 - 它几乎可以在任何地方以一种形式应用。

    为此,NLP应用了广泛的机器学习算法来实现其操作。

    • 聚类算法用于探索文本
    • 分类算法用于分析其特征
    • 分类和聚类涉及解析,分段和标记以构建用于处理进一步处理的模型。
    • 回归算法用于在文本生成时确定相关的输出序列。

    结果,该算法能够从文本中提取见解并产生原始输出。

    商业方面,自然语言处理机器学习算法用于以下领域:

    • 一般文字分析。NLP适用于各种内容分类,主题发现和建模操作。这包括解析关键术语的文本,研究语义和确定上下文。(这种技术被Google或DuckDuckGo等搜索引擎以及Buzzsumo等内容营销工具使用);
    • 营销内容文案抄袭检测类似于文本分析,除了它专门寻找异常。该文本分解为在其他地方检查匹配的关键部分。机器学习算法对文本进行比较分析。它可以直接与不同的文档或网络爬行多源比较分析进行比较。Copyscape是执行此类操作的工具之一。
    • 新闻摘要,用户配置文件,银行信息和研究摘要的文本摘要。在这种情况下,NLP聚类和分类机器学习算法用于探索文本的语义和上下文并确定文本的关键点。然后,降维ML算法将文本重复为浓缩形式。
    • 用于会话界面,自动报告和内容生成的文本生成。在其核心中,NLP模型以知识库(即其实际库存)为基础,并将其用作创建自定义文本的基础。通过聚类和分类ML算法绘制出知识库。
    • 在对话UI的情况下,该过程涉及输入分析和后续输出生成(或执行所请求的动作)。
    • 在报告生成的情况下,该模型以分析平台为基础,通过降维ML算法以文本形式显示(这种方法可以在Salesforce中看到)。
    • 自动内容生成类似地工作,除了呈现的形式适合于特定媒体。一个很好的例子是自动电子邮件和Twitter转发更新;
    • 法律/医学文本翻译通过分类和聚类算法应用一般文本分析,然后使用不同语言进行比较分析,以建立语言之间的相关性映射。然后通过相应语言中的相应参考基础来分析整个事物。因此,文本的上下文和语义被转换到另一种语言,同时保留其本质。翻译的是词语的意思而不是词语本身。最突出的例子是谷歌翻译 ;
    • 通用和特定于字段的文本更正是文本分析的扩展。就像剽窃检查一样,文本语法修正在引用知识库(即语法)时应用文本的异常分析。然后标记或纠正异常。在特定于字段的文本更正的情况下,还涉及相关术语的附加词汇表。最突出的例子是Grammarly。

    情感分析 - 受众研究,客户服务,处理,建议

    情感分析是数据分析平台发展的下一步。它更直接地处理客户与产品交互的方式并表达对产品的看法。

    情感分析可用于探索与不同类型平台的相互作用的各种反应。为此,系统在基本识别程序之上使用无监督机器学习。

    以下是它的工作原理:

    • 一般而言,这些词语具有特定的名称。从广义上讲,“好”这个词是一个积极的词,而“坏”一词则是否定的。“
    • 然后你有一些描述质量的词

    因此,它是基于产品或服务的公司的主要机器学习工具之一,它严重依赖于品牌的力量和公众的看法。

    情感分析算法旨在得到语言 - 进入情绪,意见,最重要的是意图。这使其成为以下领域的可行工具:

    情绪分析的用例包括:

    • 品牌管理 - 使用情绪分析的最基本方式。涉及一个Web scraper框架和一个探索性算法,用于评估所提到的提及以及提及的上下文。
    • 扩展产品分析 - 情绪分析用于探索和分析产品周围的情绪,包括客户反馈,评论以及一般品牌提及。
    • 基于方面的受众研究情绪分析。由于情感分析挖掘了关于用户对某个产品或主题的态度的额外细节 - 它可以用于扩展受众群体的定义并开发更精确的方法。Salesforce的爱因斯坦平台服务现在尝试了这些功能。
    • 客户支持是情绪分析的另一个重要领域。在这种情况下,情感分析机器学习算法有助于在产品的知识库和客户问题之间进行导航。除此之外,通过情绪分析的客户支持可以提供有关用户反复出现的问题,他们对服务的满意度以及对产品的一般态度的扩展分析;
    • 情感分析是推荐者引擎中个性化框架的一部分。在这种情况下,情绪分析用于带来细微差别并详细阐述内容的建议。这提高了效率和各种建议。这种做法的最好例子是Netflix的“你可能也喜欢”部分和亚马逊的“人们也购买”子类别。

    计算机视觉 - 图像识别,视觉搜索,人脸识别

    计算机视觉是机器学习使用中最激动人心的领域之一。如果文本或多或少是原始数据状态 - 图像需要不同的方法。

    • 计算机视觉算法通过将图像的特征与可用样本的特征相匹配来描述图像内容。图像被分解为用作参考点的密钥凭证。
    • 该过程看起来像这样:自行车的照片被识别为这样,因为训练算法的样本照片的凭证和输入照片的凭证相关联。

    特别是计算机视觉和图像识别广泛用于不同的行业。让我们总结最相关的应用程序:

    1. Visual Search功能广泛应用于Google和Amazon和Ali Express等电子商务市场等搜索引擎。实质上,视觉搜索算法与文本搜索类似地工作。该图像由ML算法细分为与样本库的凭证进行比较的密钥凭证。除此之外,NLP算法处理图像元数据和其他文本输入(例如放置图像的上下文)。
    2. 人脸检测是Facebook和Instagram等社交网络的基石之一。人脸识别背后的方法与视觉搜索类似,不同的是该过程包括两个方面:
    • 首先,您可以对脸部的形状进行一般的图像识别。
    • 然后,分类算法匹配可用用户群的凭证,并找到其外观与特定照片上的那个匹配的人。
    1. 光学字符识别,即OCR,是另一个重要的用例。OCR的主要机制与一般的图像识别相同。不同之处在于,算法通过文本内容进行训练,并通过字体,大小,格式和颜色与文本的视觉呈现相关联。
    2. 手写和指纹识别 - 这种类型的计算机视觉将人脸识别框架与OCR机制相结合。就像每张脸一样,手写(特别是签名)和指纹对每个人来说都是独一无二的。该算法可以识别特定功能,然后将其用于验证目的。该技术广泛用于银行业务,其中签名对于操作的验证是重要的。在指纹的情况下 - 这种类型的识别在安全性中被广泛使用作为极端。

    计算机视觉背后的关键算法是无监督和监督机器学习算法的组合。

    • 第一个聚类算法探索样本数据集的特征,然后对其进行分类。
    • 对象的不同样本为特征的描述提供变量并提高识别的准确性。
    • 然后使用无监督聚类算法来探索输入图像。
    • 在该监督分类算法启动并匹配特征之后,因此执行图像的识别。

    机器学习语音识别 - Ai助手,语音到文本,自动字幕

    如今,语音识别是一个前沿领域。在某种程度上,该技术类似于计算机视觉; 它花了更多的时间来弄清楚如何有效地分析声音。随着会话界面的出现和虚拟助手的大量采用 - 语音识别变成了一个可行的商机。

    应用语音识别的主要领域包括:

    • AI Assistants / Personal Assistant应用程序使用自然语言处理来识别输入查询,执行输入和/或撰写输出消息。除此之外,助手还有一个声音样本数据库来执行消息。一个很好的例子是Google智能助理,Alexa或Siri;
    • 基于声音的诊断与图像识别非常相似。声音被分解为凭证,然后匹配。有一个比较的声音数据库来检测异常并提出可能的原因。该技术用于医疗保健和汽车行业,以检查患者或产品,并更有效地确定问题的根源。
    • 文本到语音/语音到文本的自动字幕 - 这是基本的语音识别应用程序。该技术通常由专门的技术到语音服务(如Transcribe)和虚拟助手(Alexa,Siri,Cortana等)使用。除此之外,这种类型的识别可用于增强视听内容带字幕(例如,YouTube或Facebook自动字幕功能)。

    机器学习是需要清楚地了解其在特定业务操作环境中使用其最大效果的能力的技术之一。

    展开全文
  • 人力资源行业拓客的10个经典方法

    千次阅读 2021-07-27 12:12:02
    人力资源精准拓客、拓客方法、客源线索获取、客源信息抓取、拓客软件、流同行的客户、截取竞争对手客户、渠道裂变方式、如何找到对人力资源服务有需求的精准客源是每个老板每天思考要解决的问题,我教大家如何利用...
  • 关于CDN以及如何绕过CDN寻找真实ip

    千次阅读 2021-05-03 22:55:34
    人们主要通过拨号来访问网络,带宽很低,用户也很少,所以,没有对骨干网以及服务器带来压力。随着互联网的爆炸式发展,用户越来越多,加上宽带接入网的出现,内容源服务器和骨干网络的压力越来越大,无法及时响应...
  • CRM客户管理系统

    千次阅读 2022-02-27 20:47:17
    他的目标是缩减销售周期和销售成本,增加收入,寻找扩展业务所需的新的市场和渠道以及提高客户的价值,满意度,营利性和忠实度。CRM项目的实施可以分为3步,即应用业务集成。业务诗句分析和决策执行。 2.CRM开发环境...
  • 个人感觉一个合格的程序员,必须具备找到问题的方法和解决问题的能力。 这里记录下第一次通过nginx中error.log找到问题并解决问题的过程。 在nginx目录下有一个logs目录,里面有error.lg 这里有3个文件。 ...
  • 航空公司客户流失分析

    千次阅读 2019-07-27 09:47:01
    背景与分析方法 本文是接着航空公司客户价值分析,这是拓展思考的部分,这里简单的将它做了一下。在客户管理中,客户流失也是一个十分重要的问题。客户流失对利润增长造成的负面影响非常大,客户与航空公司之间的...
  • 通过分析银行客户流失的原因,提出了建立客户流失预测模型的方法。利用模型,发现预测流失 群体,预测流失趋势,进而制定有效的控制策略,最大限度地降低客户流失率。为客户流失预测提供了一种新的研究思路和分析...
  • Computer:Todesk(远程控制软件)的简介、安装、使用方法之详细攻略 导读:近些年,ToDesk在远程控制软件领域异军突起,作为国产软件,发展迅猛,的确有“两把刷子”。博主近一段时间,通过下载安装,测试了文件...
  • 航空公司客户价值分析(正版/超详细/附数据)

    万次阅读 多人点赞 2020-09-10 17:57:23
    通过客户分类,对客户群体进行细分,区别出低价值客户、高价值客户,对不同的客户群体开展不同的个性化服务,将有限的资源合理地分配给不同价值的客户,实现效益最大化。 本章将使用航空公司客户数据,结合RFM模型,...
  • 第六章 互联网方法论 附录 周鸿祎批注“遗失的乔布斯访谈” 我的总结 老周的互联网方法论 思维导图 周鸿祎这个人比较有争议,如果不是他,中国互联网的免费文化可能还不会像今天这样,免费,共享等等概念满天...
  • 基于WEB的客户关系管理系统

    千次阅读 2017-11-20 14:29:26
    第一章 客户关系管理绪论 客户关系管理CRM(Customer Relationship Management)最早由美国artner Group提出,自1997年开始,经过几年的发展,全球的CRM市场一直处于爆炸性的快速增长之中。1999年全球的CRM市场...
  • KMeans,分层聚类以及客户分群案例

    千次阅读 2019-04-03 23:29:09
    它是一个计算距离的过程,主要是用欧式距离去解决 什么是分群? 将现有消费者群体按一定规则分为若干个小群组,使得 – 每一组特征描述丰富详细,不同组间特征差异明显 – 组内特征相似 分组的特征可引导营销策略...
  • java项目——CRM客户管理系统(SpringBoot+MyBatis)

    万次阅读 多人点赞 2021-06-01 20:23:31
    目录CRM客户管理系统一.对CRM的项目的简单描述1.什么是CRM2.CRM开发环境和技术<1> 项目业务介绍<2>开发环境<3>开发技术二.项目准备及模块分析1.模块分析总览2.项目前期环境的搭建三.项目的正式...
  • 产品读书《麦肯锡方法

    千次阅读 2018-12-10 21:06:49
    作者简介  埃森・M・拉塞尔,1989年进入麦肯锡公司纽约办事处、工作至 1992年。在公司期间,他的客户包括金融、电信、计算机和消费品部门的大... 《麦肯锡方法主要从思考问题的方法、解决问题的方法、推介方案...
  • 对于个人用户来说,可以在LinkedIn领英创建自己的个人简历,包括教育背景、工作经验和技能,寻找自己的潜在客户,建议往来联系。 对于公司来说,LinkedIn领英是一个能为公司做广告,发布资讯动态的平台,这可以帮助...
  • 在领英上搜索寻找自己产品行业和潜在目标客户行业的国外名人,大V,这些人你可能还无法直接发送添加邀请,或者是对方不一定会通过你,那么你可以先关注他,包括关注一些相关的大公司,这些对自己的领英帐号塑造都会...
  • 数据挖掘之七种常用的方法

    万次阅读 2017-06-24 15:12:14
     利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。  分类  分类是找出数据库中一组数据对象的共同...
  • 我们选取的数据时1994年德国的一家银行在平定客户信用风险好坏的时候用到的一组变量,共有1000组数据。由于年代久远可能和实际有些出入。数据可以在下面的网址下载。
  • 精益创业《精益创业》是一本书,主要讲解创业、创新和产品的理念和方法论,它把创业上升到了理论层面,更加科学化和系统化。精益创业提到的三个主要工具是:“最小可用品”、“客户反馈”、“快速迭代”。最小可用品...
  • 软件测试方法和策略

    万次阅读 多人点赞 2018-07-23 11:26:39
    目前主要的测试用例设计方法是什么? 白盒测试:逻辑覆盖、循环覆盖、基本路径覆盖 黑盒测试:边界值分析法、等价类划分、错误猜测法、因果图法、状态图法、测试大纲法、随机测试、场景法   简述什么是...
  • 9种常用的数据分析方法

    万次阅读 2020-08-17 11:09:23
    对比法就是用两组或两组以上的数据进行比较,是最通用的方法。 我们知道孤立的数据没有意义,有对比才有差异。比如在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等...
  • 渗透测试常用方法总结

    千次阅读 多人点赞 2019-06-19 17:53:14
    可以直接寻找注入、上传、代码执行、文件包含、跨站脚本、等漏洞,来进行攻击。一般可以使用 AWVS 直接扫描常见漏洞。 2.1.2 Web 中间件 Tomcat Tomcat是Apache Jakarta软件组织的一个子项目,Tomcat是一个...
  • 第3章 如何赢得客户

    千次阅读 2015-03-03 16:18:00
    3.1客户的三种角色:购买者、使用者和影响者 客户(或消费者)是一种泛称,可细分为“购买者”、“使用者”和“影响者”三种角色。人们可以通过上下文语义来判断当前所说的客户究竟是什么角色。  如果购买...
  • 各位老板都知道近几年方兴未艾的客户关系营销...交易营销是传统的营销观念,客户关系营销与传统营销观念相比最根本的区别在于∶传统营销观念的核心主要是商品交换,是一种短期概念;而客户关系营销的核心是“关系”,是
  • 缺乏运营效率:寻找减少数据中心存储和电力使用的方法很重要。例如,您可以使用数据中心管理软件来提高运营效率并分析瓶颈,并使用数据中心温度监控工具(例如智能温度控制)通过在达到合适温度时关闭数据中心冷却...
  • 增式集成测试方法 确认测试 确认测试的标准 配置审查的内容 Alpha Beta 测试 系统测试 方法:恢复测试方法 安全测试方法 强度 性能 第八章: 一.软件维护的概念 软件维护是指在软件运行或维护阶段对软件产品所进行...
  • 多因素分析模型解决方法Finally, all data were cleansed and ready to analyze. Andy started overenthusiastically to visualize the data to get a first impression of the data. He had many dimensions and ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 86,619
精华内容 34,647
关键字:

寻找客户的主要方法