精华内容
下载资源
问答
  • 本月初,苹果发布了全新应用数据分析平台,可以让开发者详细了解应用的使用数据。最初,App Analytics 功能仅限于部分在测试。今天,苹果全面开放了 App Analytics,所有开发者都可以使用。 今天,开发者收到...

    本月初,苹果发布了全新应用数据分析平台,可以让开发者详细了解应用的使用数据。最初,App Analytics 功能仅限于部分在测试。今天,苹果全面开放了 App Analytics,所有开发者都可以使用。

    今天,开发者收到邮件,苹果提醒全新的 App Analytics 应用数据分析功能可以免费使用,只要开发者订阅了 iOS 开发者项目,并且不需要编写代码和应用更新即可看到数据。App Analytics 提供了很多数据,让开发者发现促销以及宣传是否有用。新功能还可以让开发者了解,那些网站和播客会为应用带来最多的用户。


    通过为不同的促销创建独立链接,开发者可以确定哪些有效,那些没有。App Analytics 还提供了活跃设备、在线用户以及用户使用时长和频率等信息。在消费者方面,我们不需要担心开发者可以获得个人信息,因为苹果只显示匿名数据,没有任何身份识别信息。如果仍然不想分享自己的数据,我们可以访问设置,并在隐私中关闭该功能。


    来源:MacX 苹果网

    展开全文
  • 今天,开发者收到邮件,苹果提醒全新的 App Analytics 应用数据分析功能可以免费使用,只要开发者订阅了 iOS 开发者项目,并且不需要编写代码和应用更新即可看到数据。App Analytics 提供了很多数据,让开发者发现...


    本月初,苹果发布了全新应用数据分析平台,可以让开发者详细了解应用的使用数据。最初,App Analytics 功能仅限于部分在测试。今天,苹果全面开放了 App Analytics,所有开发者都可以使用。

    今天,开发者收到邮件,苹果提醒全新的 App Analytics 应用数据分析功能可以免费使用,只要开发者订阅了 iOS 开发者项目,并且不需要编写代码和应用更新即可看到数据。App Analytics 提供了很多数据,让开发者发现促销以及宣传是否有用。新功能还可以让开发者了解,那些网站和播客会为应用带来最多的用户。


    通过为不同的促销创建独立链接,开发者可以确定哪些有效,那些没有。App Analytics 还提供了活跃设备、在线用户以及用户使用时长和频率等信息。在消费者方面,我们不需要担心开发者可以获得个人信息,因为苹果只显示匿名数据,没有任何身份识别信息。如果仍然不想分享自己的数据,我们可以访问设置,并在隐私中关闭该功能。

    展开全文
  • APP应用市场数据分析

    千次阅读 2018-04-22 11:30:58
    APP应用市场数据分析项目描述:针对采集的网上购物类APP的数据,分析各类APP的经营现状,探索现今人们生活所需的服务及偏好,抓住市场的发展动向。项目职责:1.网上购物类APP的数据采集、数据集的处理和整合; 2....

    APP应用市场数据分析

    项目描述:针对采集的网上购物类APP的数据,分析各类APP的经营现状,探索现今人们生活所需的服务及偏好,抓住市场的发展动向。

    项目职责:1.网上购物类APP的数据采集、数据集的处理和整合;

                     2.数据的可视化,及对各类APP的分析;

                     3.构建回归模型,确定好评率与各因素的关系并分析;

                     4.分析图表的制作及分析报告的输出。

    第一部分:从网络获取APP相关数据

    #导入第三方包
    import re
    from bs4 import BeautifulSoup 
    import requests
    import pandas
    In [3]:
    #网上购物类app链接
    url = r'http://www.wandoujia.com/category/5017'
    #设置请求头
    headers = {'Accept': '*/*', 
               'Accept-Encoding': 'gzip, deflate',
               'Accept-Language': 'zh-CN,zh;q=0.9',
               'Connection': 'keep-alive',
               'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
    #1-抓取每一个子类的url,发送请求、解析html
    rep = requests.get(url, headers = headers).text
    soup = BeautifulSoup(rep, 'html.parser')
    urls = soup.find_all('h2', {'class': 'app-title-h2'})
    urls.head()
    [<h2 class="app-title-h2">
    <a class="name" href="http://www.wandoujia.com/apps/com.xunmeng.pinduoduo" title="拼多多">拼多多</a>
    </h2>, <h2 class="app-title-h2">
    <a class="name" href="http://www.wandoujia.com/apps/com.achievo.vipshop" title="唯品会">唯品会</a>
    </h2>, <h2 class="app-title-h2">
    <a class="name" href="http://www.wandoujia.com/apps/com.taobao.taobao" title="淘宝">淘宝</a>
    </h2>, <h2 class="app-title-h2">
    <a class="name" href="http://www.wandoujia.com/apps/com.alibaba.wireless" title="阿里巴巴">阿里巴巴</a>
    </h2>, <h2 class="app-title-h2">
    <a class="name" href="http://www.wandoujia.com/apps/com.tmall.wireless" title="天猫">天猫</a>
    
    In [38]:
    #商品类app的名称及链接
    name = [i.text.strip() for i in urls]
    #print(name)
    #pattern = re.compile('href=(.*?)\s')
    #re.findall(pattern, urls)
    
    url_n = [ i.find_all('a')[0]['href'] for i in urls]
    #print(url_new)
    In [ ]:
    #2-获取所有app的url,列出所有页面的url
    url_new = []
    for url in urls:
        res = requests.get(url, headers = headers).text
        soup = BeautifulSoup(res, 'html_parser')
        app_lists = soup.findAll('ul',{'id':'j-tag-list'})[0]
        url_new.extend([i.findAll('a')[0]['href']] for i in app_lists.findAll('h2', {'class':'app-title-h2'}))
    In [51]:
    #抓取以上app的url详细信息
    install_people = []
    comments = []
    comments_ratio = []
    for n, u in zip(name, url_new):
        #print(u)
        url_last = requests.get(u, headers = headers).text
        soup_last = BeautifulSoup(url_last, 'html.parser')
        #contents = soup_last.find_all('div', {'class' :'num-list'})
        #print(contents)
        install_people.append(soup_last.find('span', {'class': 'item install'}).find('i').text)
        #print(install_people)
        comments.append(soup_last.find('span', {'class' : 'item love'}).find('i').text.strip())
        comments_ratio.append(soup_last.find('div', {'class': 'comment-area'}).find('i').text)    
          
    In [52]:
    print(install_people, comments, comments_ratio, url_new, name)
    ['8206.6万', '7515.4万', '5亿', '7221.6万', '9546.4万', '2.1亿', '2亿', '2515.2万', '1102.2万', '8699.4万', '8471万', '566.9万', '2252.1万', '89.7万', '115.9万', '752.6万', '3832万', '1790.9万', '24.8万', '20.1万', '1306.5万', '1181.6万', '56.2万', '36.8万'] ['87.00%', '87.00%', '70.00%', '58.00%', '42.00%', '67.00%', '51.00%', '94.00%', '51.00%', '72.00%', '96.00%', '70.00%', '51.00%', '83.00%', '100.00%', '78.00%', '78.00%', '55.00%', '81.00%', '99.00%', '90.00%', '90.00%', '99.00%', '100.00%'] ['3466', '2478', '11350', '533', '351', '10755', '264', '2316', '107', '476', '2875', '33', '261', '66', '216', '289', '593', '110', '27', '104', '5182', '751', '104', '869'] ['http://www.wandoujia.com/apps/com.xunmeng.pinduoduo', 'http://www.wandoujia.com/apps/com.achievo.vipshop', 'http://www.wandoujia.com/apps/com.taobao.taobao', 'http://www.wandoujia.com/apps/com.alibaba.wireless', 'http://www.wandoujia.com/apps/com.tmall.wireless', 'http://www.wandoujia.com/apps/com.sankuai.meituan', 'http://www.wandoujia.com/apps/com.jingdong.app.mall', 'http://www.wandoujia.com/apps/com.wuba.zhuanzhuan', 'http://www.wandoujia.com/apps/com.kuaibao.kuaidi', 'http://www.wandoujia.com/apps/com.suning.mobile.ebuy', 'http://www.wandoujia.com/apps/com.dianping.v1', 'http://www.wandoujia.com/apps/com.ymt360.app.mass', 'http://www.wandoujia.com/apps/com.cainiao.wireless', 'http://www.wandoujia.com/apps/com.lechuang.quanbaobei', 'http://www.wandoujia.com/apps/com.desire.tonight', 'http://www.wandoujia.com/apps/com.xingin.xhs', 'http://www.wandoujia.com/apps/com.mogujie', 'http://www.wandoujia.com/apps/com.dangdang.buy2', 'http://www.wandoujia.com/apps/com.taobao.litetao', 'http://www.wandoujia.com/apps/com.fanlishengqianlianmengw', 'http://www.wandoujia.com/apps/com.taobao.etao', 'http://www.wandoujia.com/apps/com.jym.mall', 'http://www.wandoujia.com/apps/com.xiaomi.youpin', 'http://www.wandoujia.com/apps/com.chuangnian.shenglala'] ['拼多多', '唯品会', '淘宝', '阿里巴巴', '天猫', '美团', '京东', '转转', '微快递', '苏宁易购', '大众点评', '一亩田', '菜鸟裹裹', '券宝贝', '夜欲两性情趣商城', '小红书', '蘑菇街', '当当', '淘宝特价版', '返利省钱联盟', '一淘', '交易猫', '米家有品', '省啦啦']
    In [60]:
    #3-存储数据、导出数据
    import pandas as pd
    app_data = pd.DataFrame({'app_name':name,
                            'install':install_people,
                            'commments':comments,
                            'goodcomments':comments_ratio})
    app_data.to_csv('apps.csv', index = False, encoding = 'utf-8')
    In [59]:
    app_data.head()
    Out[59]:
    app_name	commments	goodcomments	install
    0	拼多多	87.00%	3466	8206.6万
    1	唯品会	87.00%	2478	7515.4万
    2	淘宝	70.00%	11350	5亿
    3	阿里巴巴	58.00%	533	7221.6万
    4	天猫	42.00%	351	9546.4万

    第二部分:对APP数据,进行数据分析

    1.数据预处理

    根据第一部分所获取的数据,首先对数据进行清洗,包括重复值、异常值、缺失值的处理,数据类型的转换,变量重命名等。

    In [2]:

    #导入模块
    import pandas as pd
    import matplotlib.pyplot as plt
    import numpy as np
    #读取文件app_data = pd.read_excel(r'C:\Users\Administrator\Desktop\apps.xlsx')
    In [3]:
    #1-数据查看
    #数据描述
    app_data.shape
    Out[3]:
    (1204, 10)
    In [4]:
    app_data.head()
    
    Out[4]:
     appcategoryappnamecommentscompanyinstallloveplatformsizeupdateversion
    0网上购物-商城拼多多1921上海寻梦信息技术有限公司3841.9万95.00%Android 4.0.3 以上13.35MB2017年10月11日3.41.0
    1网上购物-商城-优惠寺库奢侈品1964北京寺库商贸有限公司175.4万100.00%Android 4.1.x 以上17.21MB2017年09月30日5.8.7
    2网上购物-商城淘宝14244淘宝(中国)软件有限公司4.6亿68.00%Android 4.0.2 以上73.78MB2017年10月13日7.1.0
    3网上购物-商城国美271国美在线电子商务有限公司1123.1万61.00%Android 4.0.2 以上59.44MB2017年10月11日5.0.5
    4网上购物-商城阿里巴巴(alibaba)1688批发采购带直播的购物软件419阿里巴巴(中国)网络技术有限公司4560.8万50.00%Android 4.0.2 以上31.45MB2017年09月20日6.22.1.0
    In [5]:
    app_data.count()
    
    Out[5]:
    appcategory 1204
    appname 1204
    company 1037
    comments 1204install 1204
    size 1204
    love 1204platform 1204update 1204
    dtype: int64
    version 1204
    In [6]:
    #2-数据清洗,重复值和异常值剔除
    #查找是否存在重复
    any(app_data.duplicated())
    Out[6]:
    True
    In [7]:
    app_data.describe()
    
    Out[7]:
     comments
    count1204.000000
    mean223.665282
    std1015.513950
    min-1.000000
    25%0.000000
    50%1.500000
    75%43.250000
    max14244.000000
    从上面的结果可以看到,数据集中,除了comments数值型的变量,其他变量均为字符型。通过检查,数据集存在重复,需要排重;评论人数的描述性统计来看,最小值为-1,很明显,这就是一个异常数据,需要处理。
    conIn [10]:
    #去除异常值
    app_data.comments.min()
    
    Out[10]:
    -1
    In [11]:
    #去除重复值
    app_data.drop_duplicates(inplace=True)
    app_data.shape
    Out[11]:
    (1112, 10)
    In [16]:
    #app_data = app_data[app_data.comments != -1]
    app_data = app_data.loc[app_data.comments !=-1,]
    In [17]:
    app_data.describe()
    
    Out[17]:
     comments
    count1110.000000
    mean163.337838
    std834.943282
    min0.000000
    25%0.000000
    50%1.000000
    75%25.750000
    max14244.000000
    In [22]:
    app_data.describe(include = ['object'])
    
    Out[22]:
     appcategoryappnamecompanyinstallloveplatformsizeupdateversion
    count11101110946111011101110111011101110
    unique2810888617266817927405572
    top网上购物-快递快递查询来自互联网1.1万暂无Android 4.0.2 以上2.17MB2014年09月02日1.0
    freq210682064226156369
    In [23]:
    app_data.head()
    
    Out[23]:
     appcategoryappnamecommentscompanyinstallloveplatformsizeupdateversion
    0网上购物-商城拼多多1921上海寻梦信息技术有限公司3841.9万95.00%Android 4.0.3 以上13.35MB2017年10月11日3.41.0
    1网上购物-商城-优惠寺库奢侈品1964北京寺库商贸有限公司175.4万100.00%Android 4.1.x 以上17.21MB2017年09月30日5.8.7
    2网上购物-商城淘宝14244淘宝(中国)软件有限公司4.6亿68.00%Android 4.0.2 以上73.78MB2017年10月13日7.1.0
    3网上购物-商城国美271国美在线电子商务有限公司1123.1万61.00%Android 4.0.2 以上59.44MB2017年10月11日5.0.5
    4网上购物-商城阿里巴巴(alibaba)1688批发采购带直播的购物软件419阿里巴巴(中国)网络技术有限公司4560.8万50.00%Android 4.0.2 以上31.45MB2017年09月20日6.22.1.0
    APP的安装人数单位不一致,有的以万为单位,有的以亿为单位,有的没有单位;同样,APP软件大小不一致,有的以MB为单位,有的则以KB为单位,所以在数据类型转换前,一定要处理好量纲
    In [37]:
    #数据类型变化,单位的统一处理
    #app_data.install.str.find('亿')
    def transf(x):
    if x.find('亿') != -1:
    y = float(x[:-1])*10000
    elif x.find('万') != -1:
    y = float(x[:-1])
    else:
    y = float(x[:-1])/10000
    return y
    app_data['install_new'] = app_data.install.apply(transf)
    y = lambda x: float(x[:-2]) if x.find('MB') != -1 else float(x[:-2])/1024
    app_data['size_new'] = app_data['size'].apply(y)
    In [42]:
    y = lambda x: np.nan if x == '暂无' else float(x[:-1])/100
    app_data['love_new'] = app_data['love'].apply(y)
    In [45]:
    #app_data['love_new'] = app_data['love_new'].fillna(app_data.love_new.median())
    app_data['love_new'] = app_data['love_new'].replace(app_data.love_new.median, np.nan)
    In [56]:
    app_data['update_new'] = pd.to_datetime(app_data['update'], format = '%Y年%m月%d日')
    
    In [57]:
    app_data.describe()
    
    Out[57]:
    通过上述数据预处理,获得的数据的描述性统计结果。
     commentsinstall_newsize_newlove_new
    count1110.0000001110.0000001110.0000001110.000000
    mean163.337838198.52572112.9192430.839369
    std834.9432821713.69716113.4290870.169127
    min0.0000000.0004000.0934570.020000
    25%0.0000000.0292004.6075000.890000
    50%1.0000003.1000009.6500000.890000
    75%25.75000026.32500017.4150000.890000
    max14244.00000046000.000000247.0600001.000000
    In [58]:
    #去除不重要的因素
    app = app_data.drop(['install', 'size', 'love', 'update'], axis = 1)
    In [59]:
    app.head()
    
    Out[59]:
    最终,整理获得的数据如下。
     appcategoryappnamecommentscompanyplatformversioninstall_newsize_newlove_newupdate_new
    0网上购物-商城拼多多1921上海寻梦信息技术有限公司Android 4.0.3 以上3.41.03841.913.350.952017-10-11
    1网上购物-商城-优惠寺库奢侈品1964北京寺库商贸有限公司Android 4.1.x 以上5.8.7175.417.211.002017-09-30
    2网上购物-商城淘宝14244淘宝(中国)软件有限公司Android 4.0.2 以上7.1.046000.073.780.682017-10-13
    3网上购物-商城国美271国美在线电子商务有限公司Android 4.0.2 以上5.0.51123.159.440.612017-10-11
    4网上购物-商城阿里巴巴(alibaba)1688批发采购带直播的购物软件419阿里巴巴(中国)网络技术有限公司Android 4.0.2 以上6.22.1.04560.831.450.502017-09-20
    2.数据可视化分析

    结合当今人们的生活需求和喜好,分析了解各类APP的排名和好评,

    In [72]:
    #数据的可视化分析
    list = []
    categories = ['商城', '团购', '优惠', '快递', '全球导购']
    for cate in categories:
    sub = app.loc[app.appcategory.apply(lambda x: x.find(cate) != -1), [ 'appname', 'install_new']]
    sub.sort_values(by = ['install_new'], ascending = False)[:5]
    sub['type'] = cate
    list.append(sub)
    #合并数据集
    app_install = pd.concat(list)
    In [66]:
    #设置绘图
    plt.style.use('ggplot')
    ax1 = plt.subplot2grid((3,2),(0,0))
    ax2 = plt.subplot2grid((3,2),(0,1))
    ax3 = plt.subplot2grid((3,2),(1,0))
    ax4 = plt.subplot2grid((3,2),(1,1))
    ax5 = plt.subplot2grid((3,2),(2,0), colspan=2)
    axes = [ax1, ax2,ax3,ax4,ax5]
    types = app_install.type.unique()
    In [81]:
    #绘制5张图,各类APP下载量前五的应用
    for i in range(5):
    # 准备绘图数据
    data = app_install.loc[app_install.type == types[i]]
    # 绘制条形图
    #axes[i].bar(, data.install_new, color = 'steelblue', alpha = 0.7)
    axes[i].plot(kind = 'bar')
    # 设置图框大小
    gcf = plt.gcf()
    gcf.set_size_inches(8, 6)
    # 添加标题
    axes[i].set_title(types[i]+'类APP下载量前5的应用', size = 9)
    # 设置刻度位置
    axes[i].set_xticks(np.arange(5) + 0.4)
    # 为刻度添加标签值
    axes[i].set_xticklabels(data.appname, fontdict={'fontsize':7}, color = 'red')
    # 删除各子图上、右和下的边界刻度标记
    axes[i].tick_params(top = 'off', bottom = 'off', right = 'off')
    plt.subplots_adjust(hspace = 0.6, wspace = 0.3)
    plt.show()
    由上图可知,在商城类的应用中,淘宝、京东、苏宁、唯品会依次占据排名前几,这也是目前为止,我们在日产生活中常用到的几款购物软件。其中淘宝、天猫都属于一家。单从豌豆荚上的数据来看,阿里巴巴在购物类中占据着领先地位,其下载量是其他几家之和。
    在优惠类和团购类中,美团和大众点评始终占据前两位,且美团所占比例有大众点评两倍之多。美团在此领域中,已然成为领先地位。
    对于快递类菜鸟的下载量还是占绝对优势的,这和商品类中淘宝的地位是直接相关的全球导购类下载量前三的APP并没有太大差异,且下载量并不大,主流商城APP(如天猫,京东,唯品会)都有海淘业务,基本能满足消费者需求。网易和小红书近几年上升较快。
    虽然上诉数据仅来自于一家网站的APP下载量数据,但是也能很大一定程度上反映,在网络购物行业的蓬勃发展,以及整个行业整体业务的分布,以及各个公司所占的体量。
    In [2]:
    #各类APP中好评率最低的五个
    list=[]
    categories = ['商城', '团购', '优惠', '快递', '全球导购']
    for cate in categories:
    sub = app.loc[app.appcategory.apply(lambda x: x.find('cate') != -1), ['appname', 'love_new']]
    sub.sort_values(by = ['love_new'])[:5]
    sub['type'] = cate
    list.append(sub)
    app_love = pd.concat(list)
    ax1 = plt.subplot2grid((3,2),(0,0))
    ax2 = plt.subplot2grid((3,2),(0,1))
    ax3 = plt.subplot2grid((3,2),(1,0))
    ax4 = plt.subplot2grid((3,2),(1,1))
    ax5 = plt.subplot2grid((3,2),(2,0),colspan = 2)
    axes = [ax1, ax2, ax3, ax4, ax5]
    types = app_love.type.unique()
    for i in range(5):
    data = app_love[app_love.type == types[i]]
    axes[i].bar(range(5), data.love_new, color = 'steelblue', alpha = 0.7)
    gcf = plt.gcf()
    gcf.set_size_inches(8,6)
    axes[i].set_title(types[i] + '类APP好评率后5的应用', size = 9)
    axes[i].set_xticks(np.arange(5) + 0.4)
    axes[i].set_xticklabels(data.appname, fontdict={'fontsize':7}, color = 'red')
    # 设置y轴刻度位置
    axes[i].set_yticks(np.arange(0,0.6,0.15))
    # 为y轴刻度添加标签值
    axes[i].set_yticklabels([str(i*100) + '%' for i in np.arange(0,0.6,0.15)])
    # 删除各子图上、右和下的边界刻度标记
    axes[i].tick_params(top = 'off', bottom = 'off', right = 'off')
    # 调整子图之间的水平间距和高度间距
    plt.subplots_adjust(hspace=0.6, wspace=0.3)
    plt.show()
    在各类APP好评率最差的5个应用,如商城类APP中沃尔玛也在里面,具体原因还需通过其他方面分析。现如今,零售业在中国发展迅速,沃尔玛已然不是一家独大的时代了。聚划算、申通快递、中国邮政口碑都在好评率较差的排名中
    在APP差评的排名中,并不能直接判断出准确的信息,但是至少能体现出人们对以上APP的服务,感到不满意。可能主要存在两个方面,第一个就是APP本身制作较水,用户体验差;第二个,就是几家公司,本身实际服务较差,因此会有差评。具体问题需要对用户评论进行分析,有待下一步完成。
    3.构建回归模型,并分析

    从对获取的数据描述看,每种APP的下载量不同,对应的评论也是不同的。所以好评率的基数是不一致的,会受到一定的影响。而好评率对人们的下载安装意识,会产生一定的主观影响,因此有必要分析下好评率与评论数之间的关系。

    In [100]:
    %matplotlib inline
    import matplotlib
    matplotlib.rcParams['font.family'] = 'Microsoft YaHei'
    # 导入第三方模块
    from sklearn.linear_model import LinearRegression
    # 散点图
    plt.scatter(app.comments, # 评价人数
    app.love_new, # 好评率
    s = 30, # 设置点的大小
    c = 'black', # 设置点的颜色
    marker = 'o', # 设置点的形状
    alpha = 0.9, # 设置点的透明度
    linewidths = 0.3, # 设置散点边界的粗细
    label = '观测点'
    )
    # 建模
    reg = LinearRegression().fit(app.comments.reshape(-1,1), app.love_new)
    # 回归预测值
    pred = reg.predict(app.comments.reshape(-1,1))
    # 绘制回归线
    plt.plot(app.comments, pred, linewidth = 2, label = '回归线')
    # 显示图例
    plt.legend(loc = 'lower right')
    # 添加轴标签和标题
    plt.title('评论人数与好评率的关系')
    plt.xlabel('评论人数')
    plt.ylabel('好评率')
    # 去除图边框的顶部刻度和右边刻度
    plt.tick_params(top = 'off', right = 'off')
    # 显示图形
    plt.show()

    从APP的样本散点图和回归预测曲线来看,评论人数与好评率存在正向关系,但一些数据缺失用来中位数来替补的,而且大量的样本的评论数集中在2000条以下。所以可能存在一定的误差。

    其中“评论人数”数据的分布情况:有近7成的APP,其评论人数不超过500人,数据偏态。评论人数不超过500人的app,对其研究“评论人数”与“好评率”的关系,准确率难以估量。后续应该针对用户的具体评论文本,结合分析,才能进一步判断。

    下一步:结合用户具体评论内容,对各类APP的优缺点进一步分析。

    展开全文
  • 互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨...主要介绍下互联网金融行业的相关公司主要应用数据分析有哪些,这个区别于之前介绍的在电商、零售中的

    互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨这个互联网金融的到来,让我们有更多的信息渠道可以来了解金额。

    互联网
    还有像越女读财介绍的高暴利的钱宝网、MMM、百川币这些,如果没有互联网,相信他们也很难发展的起来。

    主要介绍下互联网金融行业的相关公司主要应用的数据分析有哪些,这个区别于之前介绍的在电商、零售中的数据分析应用,零售中得数据分析解决的更多是卖得问题,而金融中更多涉及到得是风险的问题。

    好了,不废话。直接上干货。

    互联网金融中的数据分析主要体现在个人征信、贷款授信、风险控制、洗钱套现识别、保险定价和云计算平台、量化投资这些应用。

    1.个人征信

    目前国内外的个人征信这块的发展如下:

    一、美国的征信业务发展现状

    ··········1)FICO和三大征信机构

    ··········2)ZestFiance

    ··········3)Credit Karma及其他

    二、中国的征信业务发展概况

    ··········1)聚信立

    ··········2)安融征信

    ··········3)快查

    ··········4)闪银奇异

    ··········5)京东金融

    ··········6)腾讯(腾讯信用)——腾讯征信

    ··········7)阿里(蚂蚁金服)——芝麻信用

    ··········8)平安(前海征信)

    美国征信:

    美国征信
    其中的数据应用

    数据应用

    1)FICO和三大征信机构

    最主流的FICO信用评分体系(Fair Isaac公司旗下的产品)现已覆盖了全美90%的借贷机构和85%的人群,三大征信局Experian、Equifax和Trans Union都是采用FICO的模型计算信用分,只是数据来源略有差异。

    模型计算信用分

    2)ZestFiance及它与FICO的区别

    ZestFiance,原名ZestCash,是美国一家新兴的互联网金融公司。在美国,ZestFiannce和FICO是完全对立的另一种信用评分体系,所以不存在“美国FICO信用积分指标从ZestFinance获得用户行为信用数据”的情况,ZestFiannce主要服务对象是FICO评分低于500甚至无信用评分的人群,而且市场很小,只有大约10万用户量。和FICO的区别在于:

    2)ZestFiance及它与FICO的区别
    在其模型中,往往要用到 3500 个数据项,从中提取 70,000 个变量,利用10个预测分析模型,如欺诈模型、身份验证模型、预付能力模型、还款能力模型、还款意愿模型以及稳定性模型,进行集成学习或者多角度学习,并得到最终的消费者信用评分。其次,ZestFinance公司另辟蹊径,充分利用丢失数据之间的关联和正常数据的交叉,探寻数据丢失的原因。另外,每个季度ZestFinance公司都会推出一个新的信用评估模型,目前已覆盖信贷、市场营销、收债、助学贷款收债、法律收债和次级汽车抵押贷款等方面。

    3)Credit Karma及其他

    一个免费查FICO分(TransUnion和Equifax)和简版信用报告的平台(美国政府规定,三大征信局每年为用户提供仅一次免费查询信用记录的机会)。并且用户可以在平台上查看自己的各项财务状况,根据用户的信用信息及个人金融信息推荐合适的信用卡、更优惠的车贷和房贷等信贷产品,当会员购买了金融机构的产品后,机构变付费给Credit Karma。产品运营模式:

    运营模式
    更多的可以参考 征信体系发展简述和特点。

    —————————————————————————————————————

    中国征信:

    国内的个人征信方面,芝麻信用是长的最像FICO的。

    Base FICO范围:300-850(Industry-Specific FICO范围:250-900);芝麻信用分范围:350-950。

    FICO数据维度:偿还历史×35% + 信用账户数×30% + 使用信用的年限×15% + 正在使用的信用种类×10% + 新开立的信用账户×10%;

    蚂蚁信用分:信用历史×35% + 行为偏好×25% + 履约能力×20% + 身份特征×15% + 人脉关系×5%。

    信用等级划分:

    IFCO与芝麻信用

    2.风险控制

    风险控制这块主要包括用户行为识别比如盗卡盗号、洗钱套现等

    风险控制
    风险控制模型

    3.贷款授信

    传统的贷款方式:

    传统贷款方式
    互联网金融的贷款方式:

    1)阿里小贷

    阿里小贷
    2)宜人贷

    宜人贷的数据源包括:

    信用卡数据

    淘宝天猫京东购买数据

    运营商的通话记录

    爬虫数据

    生态伙伴第三方数据

    产品框架
    可能很多人会问我说,因为时间关系,没有办法我只能说做一个非常非常简单的展示,传统的金融机构,大家也做模型,做算法很多诸如此类的数据挖掘,传统的数据模型,比如说,他可能会放几十个变量,或者撑死了放几百个变量,我们的方法不一样,我的有几十万个或者更多的变量,传统的模型里头,非常强调说所有的这些特征,要是可以解释的。所以他需要非常非常强的特征。在我的这个模型里头,在我们这个平台的模型里头,对于我来讲,所有的数据,都是信用数据。当中交易数据,流水数据这些数据大家可以想象到,其他很多的数据,比如你的搜搜数据,网上的很多其他点击数据也是特征。如果这些特征被吸收的话,可能非常弱的特征没有关系,最后我能做出不管是信用,还是反欺诈,我后面有一堆模型在这边,我做的手段跟传统机构不一样的。

    4.保险定价

    保险定价这块主要的场景包括车险的定价、运费险。

    车险:其实根据车主的日常行车路线、里程、行车习惯、出险记录、职业、年龄、性别,可以给出非常不同的定价。比如一个开中级车,每天固定路线往返几公里通勤的熟练女白领车主,和一个开同样车型每天在珠三角或者长三角跑生意的中年暴躁小老板车主,假设后者出险概率是前者的3倍,那么完全可以定3倍于前者的价格(商业部分)。对于保险公司,前者才是优质客户,后者做了生意也是赔钱货,不如赶到竞争对手那里去。

    运费险:

    运险费
    运险费风控框架

    5.云计算

    云计算
    工具

    6.量化投资

    请移步深入浅出量化投资alpha基金操作量化操作

    转自36大数据,作者:数据分析侠

    展开全文
  • 【实例简介】【实例截图】【核心代码】└─37304-Python数据分析应用-习题答案├─第1章│ HelloWorld.html│ 第1章选择题答案.txt│├─第2章│ │ 第2章选择题答案.txt│ ││ └─code│ 第2章操作题.py│├─...
  • 今天我们就来好好聊聊数据分析·大数据分析在电商行业中的应用。 电商行业相对于传统零售业来说,最大的特点就是一切都可以通过数据化来监控和改进。通过数据可以看到用户从哪里来、如何组织产品可以实现很好的...
  • 数据挖掘与数据分析

    万次阅读 多人点赞 2018-05-28 13:58:14
    一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: 1、在应用工具上,数据挖掘一般要通过...
  • 3款移动应用数据统计分析平台对比

    千次阅读 2014-08-18 15:17:07
    3款移动应用数据统计分析平台对比
  • 国内外的这些移动应用数据统计分析平台为移动开发者提供免费的应用统计分析...特别是大数据分析平台。斯诺登事件以后,企业都怕了公有云服务的安全隐患。参考:Flurry、友盟、TalkingData 移动应用数据统计分析平台对比
  • 给大家带来的一篇关于Python数据相关的电子书资源,介绍了关于Python方面的内容,本书是由人民邮电出版社出版,格式为PDF,资源大小281 MB,黄红梅 张良均编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:...
  • 移动平均法是指上是对变量值进行平均的方法而已,即对原时间序列数据进行修正,从而消除季节变动和个别不规则变动对整体数据的影响。根据时序数据的特性不同移动平均法可分为三类: 简单移动平均 直接上例子  ...
  • 数据分析之地理围栏应用

    万次阅读 2019-06-19 19:13:27
    为了让大家对流数据分析中的地理围栏应用有更多的了解,本文将在上一篇文章的基础上详细介绍一下流数据分析的地理围栏应用。 一、 地理围栏简介 地理围栏是基于移动位置服务的一种新应用,即用...
  • 架构大数据分析应用

    万次阅读 2016-05-18 21:19:50
    这些考虑一般都是基于分析应用的日志,例如web访问日志,应用服务器日志,和数据库日志,但是也可以基于各种其他的数据源例如社交网络数据。当面对这些使用场景的时候,如果希望随着商务的增长而弹性扩展,就需要考虑...
  • Hadoop大数据分析应用场景

    万次阅读 2018-06-02 19:58:10
     一、Hadoop的应用业务分析  大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。  目前主流的三大分布式计算系统分别为:Hadoop、Spark...
  • 金融经济数据方面应用Python非常广泛,也可以算是用Python进行数据分析的一个实际应用。 数据规整化方面的应用 时间序列与截面对齐 在处理金融数据时,最费神的一个问题就是所谓的“数据对齐” (data ...
  • 互联网金融数据分析应用

    千次阅读 2016-01-19 22:45:50
    互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨这个互联网金融的到来,让我们有更多的信息渠道可以...主要介绍下互联网金融行业的相关公司主要应用数据
  • python基础教程 python基础系列教程——Python的安装与测试:python解释器、PyDev编辑器、pycharm编译器 python基础系列教程——Python库的安装与卸载 ...python基础系列教程——Python3.x标准模块库目录 ...
  • SQL应用于简单的数据分析工作

    千次阅读 2018-05-03 15:26:17
    从事数据分析工作基本上离不开SQL的使用,如果不知道如何写SQL,很多数据清洗,包括分析都会困难。一、SQL语言在数据分析行业的学习知识框架​在计算机行业,工程师基本的业务也就是对数据的增删查改,在数据分析...
  • 质量数据分析工具软件的应用

    千次阅读 2019-07-26 11:12:14
    时代在发展,社会在进步。...近几年来,正是大数据积累和智能分析软件系统的进步,面向特定需求和应用场景,推动着传统人工智能的发展。以高效能数据处理、数据访问和数据传输为核心问题的大数据处理系统是支撑...
  • 移动应用数据统计分析平台汇总

    千次阅读 2013-09-13 13:35:11
    国内: Talking Data PlayData 百度移动统计,CNZZ移动数据平台 友盟,机锋统计 淘宝无线数读 imofan 国外 Flurry,google analytics mobile,Mixpanel
  • 数据分析

    千次阅读 2020-03-05 16:20:08
    数据分析 广义的数据分析包括狭义数据...数据挖掘则是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,通过应用聚类、分类、回归和关联规则等技术,挖掘潜在价值的过程。 1. 典型的数据分析的流程...
  • 数据分析在石化企业的应用探讨

    千次阅读 2015-02-28 14:36:14
    石化行业对大数据分析解决方案的需求集中体现在:供应链优化、库存管理、资金统一管理、生产和安全监管的分析。需要解决的问题,主要为缺少数据全方位分析方法、ERP软件处理能力差、实时数据分析能力差、海量数据...
  • 本人想要设计一款高校评教系统的安卓手机应用,请问如何对收集到的数据进行数据分析?能否在PC端进行?能否嵌入报表软件实现数据的分析及可视化?如何做到?
  • 数据分析在职业体育应用

    千次阅读 2018-11-25 14:29:44
    数据分析在职业体育应用(NBA) 什么是大数据? 举个例子,都说骑士队依赖詹姆斯,当詹姆斯在场上时,骑士队每100回合净胜对手6.9分;詹姆斯不在场,骑士队净负对手2.9分,两者之间差值为9.8分。而勇士队的库里...
  • 数据分析技术应用领域有哪些

    千次阅读 2020-09-22 16:10:46
     当然,大数据分析为他们提供了优于竞争对手的优势,可以确定他们需要改进服务或产品的哪些领域,销售可能增加或减少以及市场上可能存在漏洞的地方。  这表明了在多个组织中使用大数据分析的重要性。一位研究人员...
  • 应用案例及场景-分析之术,掌握分析方法 [哪些同学适合学习这门课程] 想要转行做数据分析师的,零基础亦可 工作中需要数据分析技能的,例如运营、产品等 对数据分析感兴趣,想要更多了解的 [你的收获] n ...
  • 在商业数据分析过程中,数据地图是很直观的可视化的表达形式,比如利用地图展示各区域销售额、利润等;比如展示全国仓库分布和运输和以优化运输网络;又比如统计商场人流量及分布,用热力地图展示,指导门店分布和...
  • 数据分析应用技术创新平台

    万次阅读 2018-11-15 16:54:48
    数据分析应用技术创新平台   张平文, 鄂维南, 袁晓如, 傅毅明 北京大学数学科学学院,北京 100871  北京大学大数据科学研究中心,北京 100871   北京大学信息科学技术学院,北京 100871   北京...
  • 《Python数据分析应用》读书笔记

    万次阅读 2018-07-18 20:04:00
    数据分析概述 数据分析技能,被认为是数据科学领域中数据从业人员需要具备的技能之一。 插入数据分析概念图 Numpy数值计算的基础 ndarry——存储单一数据类型的多维数组(属性:ndim,sahpe,size,dtype) ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 91,363
精华内容 36,545
关键字:

应用数据分析