精华内容
下载资源
问答
  • 产品定价分析案例
    2022-01-07 10:57:40

    01对比细分

    在互联网的数据分析中, 经常我们去分析比如今天的活跃人数降低了, 我们经常要从多个维度去分析为什么降低。

    同时我们还要跟上周, 昨天, 去年同期等做对比, 分析虽然是降低了, 但对比去年是否有变化。

    那么我们如何做一个有效的细分呢。

    图片

    首先我们有很多可以细分的维度, 比如 从时间上拆分, 一个月的活跃人数我们可以拆分到每一天的人数, 活跃人数可以拆分新的活跃人数, 老的活跃人数。

    同样都是活跃人数, 我们可以拆分不同活跃等级的人数, 这里的活跃人数指的就是比如 一个月活跃 1天 活跃 3天 活跃7天等不同活跃天数, 又可以拆分成一天活跃 1小时, 3小时, 7小时等不同时长的用户。

    我们还可以对地区进行细分, 比如活跃人数降低了, 我们可以细分到是哪个地方降低比较多, 是广东还是广西, 是湖南还是湖北。

    除了以上拆分的维度, 我们还可以有很多拆分的维度, 比如另外一个例子, 我们发送的表情总数量跌了, 我们就可以拆分成发送的小黄脸小表情, 还有很骚气的大表情。

    这些拆分是跟特地业务相关的。

    对于电商类的业务比如总的订单量 我们可以拆分来自不同的店铺, 不同的品类, 不同的商品类型, 不同的价格类型等等。

    对于游戏类型的业务比如总的卖的游戏皮肤 我们可以拆分不同角色的皮肤, 武器也是类似的。

    对于视频类app 比如抖音的关注数, 我们可以拆分不同用大v的粉丝数量。

    单单细分, 没有对比, 就没有洞察, 那么我们细分好了分析维度之后, 怎么对比呢.

    更多相关内容
  • 基于MATLAB的金融数据分析 金融MATLAB-第05章 贷款按揭与保险产品 现金流分析案例(共44页).ppt 基于MATLAB的金融数据分析 金融MATLAB-第06章 随机模拟 概率分布于随机数(共33页).ppt 基于MATLAB的金融数据分析 ...
  • 小米手机定价策略案例分析.pptx
  • 15.1.2 产品设计的需求分析 本章主要内容 金融工程产品设计的一般方法 产品设计的流程和步骤来自其他领域的类比和启示 产品设计的需求分析 产品设计的可行性分析 产品设计的生产工序 产品定价与风险评估 综合和...
  • 所以小米手机1999的价格正好可得到国内的认可 因此小米手机有广阔的市场前景 二定价方法 成本导向定价法 折扣价格策略 小米在双十一购物狂欢节对其旗下产品折扣例如小米4当天价格1799元比原来便宜200元双十一前小米...
  • 主要是对于北京市的二手房信息进行分析和预测,分别对于二手房价格和面积、朝向等锋面展开了叙述,进行数据的挖掘分析和可视化,(本资源包括代码、数据。word实验报告)
  • 价格屠夫格兰仕营销案例分析.pptx
  • 产品组合定价策略分析
  • 定价策略案例分析.doc

    2021-10-11 21:48:08
    定价策略案例分析.doc
  • ze分析案例

    2021-02-21 09:23:15
    Zé交付分析案例 欢迎来到ZéDelivery! 您和朋友一起烧烤时玩得很开心,啤酒用光了! 每个人都已经在喝酒,因此,没有人可以开车到最近的商店,你们在做什么? 借助您可以从智能手机订购啤酒,并在不到一个小时的...
  • 公司组织了专门的技术人员对ERP市场进行了认真的调查研究对国内外ERP产品从技术先进性功能全面性系统的客户化程度客户的成功案例软件供应商的信誉和稳定性性能价格比等方面进行了分析和比较经过认真的筛选祐康选择...
  • 电子商务网络广告案例分析.pptx
  • 产品设计美学案例分析 重点 (Top highlight)In one of my previous jobs, I had really interesting debates with the CEO regarding whether we should spend more time improving the way our app looks and feels...

    产品设计美学案例分析

    重点 (Top highlight)

    In one of my previous jobs, I had really interesting debates with the CEO regarding whether we should spend more time improving the way our app looks and feels. ‘How could he not care that the design is outdated?! It’s used by millions of people and it could easily be improved!’.

    在我以前的工作之一中,我与CEO进行了非常有趣的辩论,涉及我们是否应该花更多的时间来改善应用程序的外观和感觉。 '他怎么能不在乎设计已经过时?! 它已被数百万人使用,并且可以轻松进行改进!

    He didn’t budge, he was positive that the company is prioritizing the real things that move the business, focusing mostly on high growth moves.

    他没有让步,他对公司正在优先考虑推动业务发展的现实事物充满信心,主要集中在高增长方面。

    I was bummed that my design skills didn’t matter much to him. I’m passionate about both UX and visual design and I don’t want to spend my life working for companies who only want to use a small part of my skills.

    我为自己的设计技能对他没有多大帮助而感到难过。 我对用户体验和视觉设计都充满热情,我不想为那些只希望使用我的一小部分技能的公司工作。

    Despite that, I was able to view his points — I couldn’t prove him wrong, the company was growing and while our users complained about many things, none of them said ‘it’s too ugly for me’.

    尽管如此,我还是能够看得出他的观点-我无法证明他的错,公司正在成长,而当我们的用户抱怨很多事情时,他们都没有说“对我来说太丑了”。

    价值>美学 (Value > Aesthetics)

    The CEO had some points right. If the product gives enough value, there is no need for beautiful aesthetics. Companies like Amazon or Reddit are perfect examples of that.

    首席执行官提出了一些正确的观点。 如果产品具有足够的价值,则无需美观。 像Amazon或Reddit这样的公司就是最好的例子。

    Furthermore, If the product is beautiful but doesn’t give enough value, the product will fail. Nobody would use a product that has the aesthetics of the hottest shots on Dribbble if it’s not very functional or missing some key features.

    此外,如果产品漂亮但不能提供足够的价值,则该产品将失败。 如果功能不完善或缺少某些关键功能,则没人会使用具有Dribbble上最热门镜头美感的产品。

    But he wasn’t entirely right. Beautiful products have value points that are hard to recognize when every micro decision is being A/B tested, but are extremely impactful for the organization.

    但是他并不完全正确。 漂亮的产品具有无法在对每个微观决策进行A / B测试时识别的价值点,但对组织而言却极具影响力。

    美学说你是谁 (Aesthetics say who you are)

    Image for post
    Facebook’s recent redesign
    Facebook最近的重新设计

    Aesthetics in product design is similar to the visual appearance in real life. It’s important that we dress nice, take a haircut or wear deodorant for work if we want to impress someone and make them comfortable with us. It doesn’t change the value we can give to other people. It does change how receptive people are when they listen to you, and how they remember you later. It won’t change the things you say, but the way others feel about you before, during, and after you’re saying those things.

    产品设计中的美学与现实生活中的视觉外观相似。 如果我们想给某人留下深刻的印象并使他们对我们感到满意,重要的是我们要着装优美,理发或穿着除臭剂。 它不会改变我们可以给他人的价值。 确实会改变人们在听您时的接受程度,以及他们以后如何记住您。 它不会改变您说的话,但会改变您在说这些话之前,之中和之后他人对您的感觉。

    美学帮助您应对竞争 (Aesthetics help you against your competition)

    While it’s really hard to create an equal competitor to Amazon, it’s not always the case. Often different companies are competing in the same field, all of them giving pretty much the same value for pretty much the same price.

    虽然要与亚马逊建立平等的竞争者确实很困难,但并非总是如此。 通常,不同的公司都在同一领域竞争,它们都以几乎相同的价格提供几乎相同的价值。

    Think about companies that are really successful at what they’re doing — Slack, Medium, and Mailchimp. None of them invented a new market. Team chat, blogging, and email marketing software existed long before them. Still, they somehow managed to become the first name people think about when looking for a solution in that market. All of them also created a unique visual language that is full of personality.

    考虑一下在自己的工作上真正成功的公司-Slack,Medium和Mailchimp。 他们都没有发明新的市场。 团队聊天,博客和电子邮件营销软件早就存在。 尽管如此,他们还是设法成为人们在该市场中寻找解决方案时想到的名字。 他们还创造了一种充满个性的独特视觉语言。

    美学增加数字 (Aesthetics increase numbers)

    Even though value and messaging are usually the most crucial elements for a company to grow, having the right visuals at the right time could convince more people to purchase what you offer. A pricing screen, for example, is the place where people decide on purchasing your product or not. A clean design in a pricing screen helps make the messages clear and readable, and it could result in a very significant increase in conversion.

    尽管价值和消息传递通常是公司成长的最关键要素,但在正确的时间拥有正确的视觉效果仍可以说服更多的人购买您所提供的产品。 例如, 定价屏幕是人们决定是否购买您的产品的地方。 定价屏幕中的整洁设计有助于使消息清晰易读,并且可以大大提高转化率。

    Image for post
    mobbin mobbin

    In the product teams I’ve worked it, the most common thing for people to debate about is the prioritization of development tasks. Many team members (often the ambitious ones) want to promote ideas they think would help the company grow, and it’s not always clear about which path is the right one.

    在我工作过的产品团队中,人们最常争论的是开发任务的优先级。 许多团队成员(通常是雄心勃勃的团队成员)想推广他们认为可以帮助公司发展的想法,但始终不清楚哪种方法是正确的方法。

    Sometimes making things in your product more beautiful is a great idea, but when promoting such an idea, you need to answer ‘Why is it important for us right now?’. Inexperienced designers usually answer something along the lines of ‘because it could look so much better!!’. This would convince nobody but their fellow bad designers.

    有时使产品中的物品更漂亮是一个好主意,但是在推广这样的主意时,您需要回答“为什么现在对我们很重要?”。 经验不足的设计师通常会回答一些问题,“因为看起来好多了!”。 这只会说服他们的坏设计师。

    Try to be mindful of your company’s goals, and think about how great design could lead your company to greatness, and you will succeed. Aesthetics alone can’t build a product, but building a product with bad aesthetics would often be much harder.

    尝试牢记公司的目标,并思考出色的设计如何使您的公司走向卓越,然后您就会成功。 唯有美学无法制造产品,但是要打造美学不佳的产品通常会困难得多。

    Thanks for reading! If you’d like to get more content from me, you can follow me here: Medium, Dribbble, Twitter.

    谢谢阅读! 如果您想从我这里获取更多内容,可以在这里关注我: MediumDribbbleTwitter

    Image for post
    Bay Area Black Designers: a professional development community for Black people who are digital designers and researchers in the San Francisco Bay Area. Being designers from an underestimated group, BABD members know what it feels like to be “the only one” on their design teams. By joining together in community, members share inspiration, connection, peer mentorship, professional development, resources, feedback, support, and resilience. Silence against systemic racism is not an option. Build the design community you believe in. 海湾地区黑人设计师 :一个专业的黑人开发社区,他们是旧金山湾区的数字设计师和研究人员。 作为来自一个被低估的团队的设计师,BABD的成员知道成为设计团队中“唯一的一个”的感觉。 通过在社区中团结起来,成员可以共享灵感,联系,同伴指导,专业发展,资源,反馈,支持和韧性。 对系统性种族主义保持沉默是不可行的。 建立您相信的设计社区。

    翻译自: https://uxdesign.cc/the-importance-of-aesthetics-in-product-design-a617c23a5092

    产品设计美学案例分析

    展开全文
  • 聚类分析案例

    千次阅读 2020-12-20 11:35:21
    一、数据挖掘的常用方法利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。分类。分类是找出数据库中一组数据...

    一、数据挖掘的常用方法

    利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。

    分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而大大增加了商业机会。

    回归分析。回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。它可以应用到市场营销的各个方面,如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。

    聚类。聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。

    关联规则。关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。在客户关系管理中,通过对企业的客户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群,客户寻求、细分与保持,市场营销与推销,营销风险评估和诈骗预测等决策支持提供参考依据。

    特征。特征分析是从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征。如营销人员通过对客户流失因素的特征提取,可以得到导致客户流失的一系列原因和主要特征,利用这些特征可以有效地预防客户的流失。

    变化和偏差分析。偏差包括很大一类潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等,其目的是寻找观察结果与参照量之间有意义的差别。在企业危机管理及其预警中,管理者更感兴趣的是那些意外规则。意外规则的挖掘可以应用到各种异常信息的发现、分析、识别、评价和预警等方面。

    Web页挖掘。随着Internet的迅速发展及Web 的全球普及, 使得Web上的信息量无比丰富,通过对Web的挖掘,可以利用Web 的海量数据进行分析,收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息,集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息,并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机的先兆,对这些信息进行分析和处理,以便识别、分析、评价和管理危机。

    二、数据挖掘的功能

    数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。

    自动预测趋势和行为:数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能做出反应的群体。

    关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。

    聚类:数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。80年代初,Michalski提出了概念聚类技术,其要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。

    概念描述:概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

    偏差检测:数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。

    三、数据挖掘实例 – 聚类分析应用之市场细分

    聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。

    从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。

    从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。

    从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。

    聚类分析的核心思想就是物以类聚,人以群分。在市场细分领域,消费同一种类的商品或服务时,不同的客户有不同的消费特点,通过研究这些特点,企业可以制定出不同的营销组合,从而获取最大的消费者剩余,这就是客户细分的主要目的。在销售片区划分中,只有合理地将企业所拥有的子市场归成几个大的片区,才能有效地制定符合片区特点的市场营销战略和策略。金融领域,对基金或者股票进行分类,以选择分类投资风险。

    下面以一个汽车销售的案例来介绍聚类分析在市场细分中的应用。

    商业目标

    业务理解:数据名称《汽车销售.csv》。该案例所用的数据是一份关于汽车的数据,该数据文件包含销售值、订价以及各种品牌和型号的车辆的物理规格。订价和物理规格可以从 edmunds.com 和制造商处获得。定价为美国本土售价。如下:

    表1:数据视图

    业务目标:对市场进行准确定位,为汽车的设计和市场份额预测提供参考。

    数据挖掘目标:通过聚类的方式对现有的车型进行分类。

    数据准备

    通过数据探索对数据的质量和字段的分布进行了解,并排除有问题的行或者列优化数据质量。

    第一步,我们使用统计节点审核数据的质量,从审核结果中我们发现存在缺失的数据,如下图所示:

    第二步,对缺失的数据进行处理,我们选择使用缺失填充节点删除这些记录。配置如下:

    建模

    我们选择层次聚类进行分析,尝试根据各种汽车的销售量、价格、引擎、马力、轴距、车宽、车长、制动、排量、油耗等指标对其分类。

    因为层次聚类不能自动确定分类数量,因此需要我们以自定义的方式规定最后聚类的类别数。层次聚类节点配置如下(默认配置):

    可以使用交互表或者右击层次聚类节点查看聚类的结果,如下图所示:

    再使用饼图查看每个类的大小,结果如下:

    从图中可见,分成的三个类样本数差异太大,cluster_0和cluster_1包含的样本数都只有1,这样的分类是没有意义的,因此需要重新分类。我们尝试在层次聚类节点的配置中指定新的聚类方法:完全。新的聚类样本数分布如下:

    cluster_0、 cluster_1、cluster_2的样本数分别为:50、9、93。

    执行后输出树状/冰柱图,可以从上往下看,一开始是一大类,往下走就分成了两类,越往下分的类越多,最后细分到每一个记录是一类,如下所示:

    我们可以再使用条形图查看每类的销售量、平均价格,如下图所示:

    每类总销量分布图

    每类平均销量分布图

    每类平均价格分布图

    我们再看一下每类的销售额分布情况。首先,我们需要使用Java代码段节点或者派生节点生成销售额字段,配置如下:

    再使用饼图查看销售额分布情况,cluster_0、 cluster_1、cluster_2的市场份额分别为:32.39%、0.53%和67.08%,如下图所示:

    案例小结

    通过这个案例,大家可以发现聚类分析确实很简单。进行聚类计算后,主要通过图形化探索的方式评估聚类合理性,以及在确定聚类后,分析每类的特征。

    展开全文
  • 多因素房价预测分析案例1 数据来源2 数据加载和基本的ETL2.1 模块导入和数据加载2.2 数据清洗3 数据可视化3.1 地理可视化3.2 关系矩阵和热力图3.3 添加衍生字段3.4 字符串字段的可视化4 机器学习4.1 特征工程4.2 ...


    手动反爬虫,禁止转载: 原博地址 https://blog.csdn.net/lys_828/article/details/121125433(CSDN博主:Be_melting)

     知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息
    

    1 数据来源

    本案例中的项目数据是在https://www.kaggle.com/camnugent/california-housing-prices上,该数据集是进行机器学习算法的极好入门资料,具有基本的数据分析清洗和易于理解的变量列表,并且数据量适中。
    请添加图片描述
    数据包含加州湾区房产信息。所提供的Zillow Zestimate数据集可以帮助我们预测当前的房价,可以用于向学员介绍机器学习的基础知识。

    2 数据加载和基本的ETL

    2.1 模块导入和数据加载

    在jupyter notebook中的第一个cell中导入后续要使用的模块,然后进行数据的导入并查看数据的前五行。
    请添加图片描述

    2.2 数据清洗

    首先对于一些没有实用意义的字段可以进行删除。通过进行数据集的字段名称查看,然后删除不需要的字段信息,可以直接指定删除字段的名称字符串,也可以指定字段对应的索引,默认是从0开始。
    请添加图片描述
    通过info()方法查看各字段的数据类型
    请添加图片描述
    各字段的数据类型查看完毕后,可以对一些我们常见的或者觉得有误的数据类型进行转化,一般是需要进行一些数据处理的工作,比如这里的zindexvalue字段,理应属于数值信息,但是结果输出上面却是object字符串数据,因此需要进行清洗。观察该字段中都存在着逗号,可以进行替换为空,然后再使用转换数值的函数操作,输出结果如下。
    请添加图片描述
    除此之外可以查看一下数据的维度,某字段的取值范围或者数据基本的分布情况,输出结果如下。
    请添加图片描述
    除了describe()方法进行数据分布的查看外,还可以通过绘制直方图进行直观的数据感受,代码输出如下。直接使用sf.hist()方法,结果会自动将数据集中的数值字段信息进行直方图的分布显示。
    请添加图片描述
    (1)对输出的结果为例进行解析,发现bathroom字段的信息每2个取值被划分为4个区域,比如0-2,划分结果为0-0.5,0.5-1,1-1.5,1.5-2,图形输出结果中0.5-1和1.5-2的区域数据分布最多,可以单独把这个字段拿出来进行计数统计,看一下详细的分布,操作及输出结果如下。绘制直方图只是为了让我们对数据的分布有一个粗略的认知,具体的数量,还是要进行value_counts()后才能知道。

    请添加图片描述
    (2)对于bedrooms,也可以采用类似的方式进行分析,最终可知床的数量大多在1-4个之间,甚至还有没有床的房间以及数量超过20个床位的房间。

    (3)对于房屋面积字段绘制的图形,显然图形中大部分的分布是在左侧,有少量的极值数据影响着数据的分布,对比前面的房间数量的分布,超多20个床位的房间,自然房屋的面积也相应很大,超过了25000美刀。

    (4)房屋的价格自然和房屋的面积成正相关,这个是常识性的问题,所以也就可以直接解释两者的图形分布样式基本一致。最便宜的可以是免费的住房,最贵的甚至超过了 1.5 ∗ 1 0 7 1.5*10^7 1.5107 美刀

    (5)对于经纬度数据,单独看各自的分布,就是只能看到一个范围,在数据可视化的过程中这两个字段通常是用来绘制地图的底图,稍后会进行呈现。

    (6)totalrooms这里由于部分房子过大,里面的总共房间有超过1200间的现象,所以导致普遍存在1-5间的房子展示出鹤立鸡群的感觉。

    (7)房屋建造的年代,主要分布在1880-2020年之间。

    (8)zindexvalue字段表示房屋的评估价格,会和房屋的价格或者房屋的面积相关。

    3 数据可视化

    3.1 地理可视化

    对于经纬度数据,可以直接拿过来使用,比如绘制散点图,操作及输出结果如下。图形绘制过程中可以指定多种参数的组合,绘制出想要的样式。其中dpi可以指定图形的分辨率,这个参数赋值越大,图像越高清,保存时候占用的内存空间也就越大。
    请添加图片描述
    直接绘制的散点图可以展现出来不同经纬度下的房间的价格分布,但是还是缺少一个地理信息,因此最终可视化图形是要把数据(散点)放在地图上。绘制的代码及操作输出如下。此时绘制图形的数据就是直接从网上进行爬取,覆盖了整个加州,出来的图形中,散点的分布明显有一个地图样式。
    请添加图片描述
    也可以按照之前的步骤,结合不同的参数使得图形更有层次感,包含更多的信息,输出结果如下。
    请添加图片描述
    最后一步添加数据的地理信息底图,需要自己在网上进行寻找。执行如下代码后,就可以将最终的散点数据投射上地图,完成地理可视化的操作。
    请添加图片描述

    3.2 关系矩阵和热力图

    回归到本地的示例数据,可以直接绘制关系矩阵,输出结果如下。对于要研究的因素,可以进行单独选取后排序输出,可以快速的知道哪些因素与要研究的房价有密切的关系。
    请添加图片描述
    关系矩阵通常配合着热力图一块进行使用,图形的颜色深浅更进一步的展示出各因素与房价之间的关系强弱。
    请添加图片描述
    基于关系矩阵和热力图就可以初步判断与房价相关的因素,进一步可以提取这些因素单独与房价进行绘制图形,绘制散点矩阵图形,代码及输出结果如下。
    请添加图片描述
    如果对于单个字段绘制与房价的关系图形,可以另外进行绘制,直接选取对应的字段进行绘制就可,比如选取的是房屋的面积字段,代码及输出的结果如下。
    请添加图片描述

    3.3 添加衍生字段

    前面的两个案例中都没有涉及到衍生字段的知识,这里的衍生字段就是就是利用已有的字段信息,通过不同字段直接操作产生出一个新的字段信息。比如这里通过房屋的总价和房屋的面积字段,计算得到每平米的房屋价钱字段。
    请添加图片描述
    需要留意的是往往添加的衍生字段的信息是觉得可能和要预测的房价之间存在着相关关系,根据最终的计算结果判断是否真的存在相关关系,通过上面的输出结果可知,添加的平均价格字段并没有达到想象中的目的,但是这个并不影响重要的相关关系的提取。

    3.4 字符串字段的可视化

    数据集中包含了一个neighborhood字段信息,表示房屋所在的社区信息,通过统计,就可以知道社区的数量,并对社区和房间进行分组计算就可以知道每个社区对应的房屋价格信息。

    比如第一步,了解数据中共有多少个社区,然后计算一个每个社区中具有的房屋数量,代码及输出结果如下。
    请添加图片描述
    如果想要查看那个社区的房屋数量最多,可以进行一个排序输出。sort_values()默认是对统计的结果进行正序排列输出,可以通过指定ascending参数为False,改为逆序输出。
    请添加图片描述
    接着就可以探究不同社区房屋的平均价格,并按照价格的高低进行排序输出。最贵的社区房屋是在Lakeside旁边。
    请添加图片描述
    接着直接将输出的结果进行数据可视化,但是需要将上面的结果转化为DataFrame数据类型,然后再进行绘图,代码及输出结果如下。图形中很显然有一个类别的条状图值特别大,然后x轴的标签信息严重重叠,这也说明字符串字段的数据可视化说明的问题(标签踩踏,可以考虑之前词云图的绘制)
    请添加图片描述
    对于异常数据,可以通过指定的范围区间进行筛选去除,然后看一下普通的房屋大概的价格区间,代码及输出结果如下。过滤后的数据输出结果显示,普通房屋的均价是在400-1200美刀之间。
    请添加图片描述

    4 机器学习

    4.1 特征工程

    前面进行了一些基础字段的处理和可视化,接着就是新建三个字段记录社区中的房屋数量和均价以及社区名称
    请添加图片描述
    通过describe()可以快速查看社区中的房源的数量和均价的分布情况,输出结果如下。
    请添加图片描述
    然后按照这个输出的均值创建筛除后的字段,代码及输出结果如下。
    请添加图片描述
    然后利用上述的结果进行不同的社区属性的划分,分别为:低价格房屋、高价格但是低数量房屋、高价格高数量房屋。创建一个函数进行快速处理,代码及操作结果输出如下。
    请添加图片描述
    删除无用字段和字段重排序。并不是所有数据都是相关的数据,因此在进行建模之前需要删除部分不需要的字段,然后为了习惯上数据切分,往往是要把要预测的变量放在最后一个字段。代码操作及输出结果如下。
    请添加图片描述
    接着就是对于X和Y数据集的划分,需要注意这里的group和usecode都是字符串数据类型,需要先转化为独热编码后再传入模型,比如先处理一下group字段,代码及输出结果如下。
    请添加图片描述
    同理再处理usecode字段,最终对于转化前的变量进行删除后得到想要的X数据
    请添加图片描述
    数据标准化。对于数值字段,可以发现不同的字段中具体的数度量范围不一致,可以采用标准化的方法,将其转化为一致。
    请添加图片描述
    数据集划分。按照7:3比例进行训练集和测试集的划分,代码操作如下。
    请添加图片描述

    4.2 模型选择

    4.2.1 线性回归模型

    数据划分好后,模型的创建就很简单,代码操作如下。
    请添加图片描述
    数据预测。直接使用训练好的模型进行预测,首先使用 R 2 R2 R2进行模型拟合情况的判断,输出的结果如下。
    请添加图片描述
    在进行回归模型的评估是 R 2 R2 R2是一个非常重要的指标 同时配合常见的MAE RMSE直接进行同步观察,接着可以输出MAE RMSE等评估指标。
    请添加图片描述
    单独看上述两个的指标评估结果没有任何意义,需要进行不同模型之间的指标评分结果对比。

    4.2.2 随机森林模型

    模型的创建与预测。经过几次模型的创建后,使用scikern进行建模基本步骤都是一致的,只是模型的名称不同,有时候会有不同参数的调整,这里创建的随机森林模型只需要保持随机种子一致即可(默认就是指定42,上述的线性回归模型也是)
    请添加图片描述
    通过对比线性回归模型,可以发现随机森林模型比较好的拟合数据,同时查看MAE RMSE指标得分情况,两指标的输出结果均较小,可以说明随机森林模型适用当前数据较好。
    请添加图片描述

    4.2.3 梯度爆炸模型

    模型的创建与预测,代码及输出结果如下,模型的拟合结果相较于随机森林模型好一点。
    请添加图片描述
    然后结合MAE RMSE指标得分情况,代码及输出结果如下,这里两个指标的得分与随机森林模型训练后的基本一致,但是相对稍微偏大。
    请添加图片描述
    最终结合前面三个模型的得分情况,采用梯度爆炸模型进行多因素的识别,代码及操作输出如下。
    请添加图片描述
    根据结果可以看出房屋面积、网站评估价值、卫生间数量、较低价格的社区、以及单个家庭的字段与房屋的价钱呈现相关性。

    展开全文
  • 去哪儿网案例分析 介绍 去哪儿成立于2005年5月是我国最著名的一个旅游垂直搜索平台他们建立了一个中立智能全面的比较平台帮助消费者进行合理的旅游产品选择和决策 去哪儿搜索的信息来自100多个旅游网站提供超过20家...
  • PSM案例价格敏感度分析

    千次阅读 2020-09-09 20:12:45
    在新产品开发时,企业为了获得消费者对产品价格的接受区间,会进行价格敏感度测试。它不需要预先给定好价格,而是让每位受访者表示他们的可接受价格范围。 针对指定价格区间的每个价格,测试人员通常会有针对的提出...
  • 电商营销案例分析 电商的本质 9 月 5 日发改委和商务部关于 8.15电商大战 调查结果公布 一是促销价高于原价 二是未完全履行价格承诺 三是有的电商拿自己独有的商品参加比价活动 这场以价格 欺骗 的电商大战也将...
  • Python电商数据分析实战案例

    千次阅读 多人点赞 2021-08-02 00:15:11
    导读:今天给大家带来一个电商数据分析案例。我整理了下,以笔记的形式分享给到大家。案例背景大致是某电商连续几年的总体销售额都在上涨,但近年增速放缓,需要寻求有效的增涨点,以提升市场竞争力。...
  • CONTENTS[1]锤子手机降价事件背景 锤子TI锤子手机降价事件 老罗自打脸 老罗曾经说过我特别反感有的手机厂商在新品上市时定一个高价之后很快又会降价的做法我们的这个价格会一直坚持整个产品周期除非下一代产品上市了...
  • 短租房数据案例分析1 前言1.1 数据集1.2 数据分析思路梳理2 数据分析2.1 数据加载2.2 数据查看3 数据可视化3.1 每天房屋入住率3.2 房屋月份价格走势3.3 房屋星期价格特征3.4 不同社区的房源数量3.5 房源评分情况3.6 ...
  • 涉及详细的分析思路及多种分析方法,如多维度拆解、假设检验、相关性分析、回归分析,适用问题场景是:如何把有限的资源投放到有效的地方才能发挥出最好的效果(比如商品价格和满意度对新增用户同时有影响,这时重点...
  • 保本点分析案例.doc

    2020-11-11 21:10:31
    保本点分析案例 篇一保本点分析案例 生产某一产品的固定成本是 86000 元售价为每台 65 元每台的材 料费是 20 元工资为 元求 (1)求该企业盈亏平衡点的产品产量 (2) 由于市场竞争激烈产品必须降价销 售现价格下降 10% ...
  • 数据分析方法就是做数据分析的指导技术,在分析方法的指导下在知道如何使用Excel、SQL、Python、Tableau等软件工具去分析数据,从而解决业务问题。数据分析方法有很多,还有一些统计方法,这些都只是比较常用的数据...
  • 《跨境电子商务客户服务》 跨境电商售前客户服务案例分析 目录 ...一、询问产品价格案例 任务导入 可以降价:告知买家店内促销信息 不可以降价:向买家强调商品品质,或向买家推荐价格较低的类似款 Ho

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 50,760
精华内容 20,304
热门标签
关键字:

产品定价分析案例