精华内容
下载资源
问答
  • Python数据分析实例

    万次阅读 多人点赞 2019-06-14 22:13:37
    Python数据分析 Python爬取网页数据

    Python数据分析

    Python爬取网页数据

    // An highlighted block
    import requests
    if __name__=="__main__":
        response = requests.get("https://book.douban.com/subject/26986954/")
        content = response.content.decode("utf-8")
        print(content)
    
    // An highlighted block
    import requests
    url="https://pro.jd.com/mall/active/4BNKTNkRMHJ48QQ5LrUf6AsydtZ6/index.html"
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        print(r.text[:100])
    except:
        print("爬取失败")
    

    Python生成柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    num_list = [1.5,0.6,7.8,6]  
    plt.bar(range(len(num_list)), num_list,color='rbgy')  
    plt.show()  
    

    在这里插入图片描述
    Python生成堆状柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    name_list = ['Monday','Tuesday','Friday','Sunday']  
    num_list = [1.5,0.6,7.8,6]  
    num_list1 = [1,2,3,1]  
    plt.bar(range(len(num_list)), num_list, label='boy',fc = 'y')  
    plt.bar(range(len(num_list)), num_list1, bottom=num_list, label='girl',tick_label = name_list,fc = 'r')  
    plt.legend()  
    plt.show()  
    

    在这里插入图片描述
    Python生成竖状柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    name_list = ['Monday','Tuesday','Friday','Sunday']  
    num_list = [1.5,0.6,7.8,6]  
    num_list1 = [1,2,3,1]  
    x =list(range(len(num_list)))  
    total_width, n = 0.8, 2  
    width = total_width / n  
      
    plt.bar(x, num_list, width=width, label='boy',fc = 'y')  
    for i in range(len(x)):  
        x[i] = x[i] + width  
    plt.bar(x, num_list1, width=width, label='girl',tick_label = name_list,fc = 'r')  
    plt.legend()  
    plt.show()  
    

    在这里插入图片描述
    Python生成折线图

    // An highlighted block
    import pandas as pd
    import numpy as np
     
    df = pd.DataFrame(np.random.rand(15, 4), columns=['a', 'b', 'c', 'd'])
    df.plot.area() 
    

    在这里插入图片描述
    Python生成柱状图

    // An highlighted block
    import pandas as pd
    import numpy as np
     
    df = pd.DataFrame(3 * np.random.rand(5), index=['a', 'b', 'c', 'd','e'], columns=['x'])
    df.plot.pie(subplots=True)
    

    在这里插入图片描述
    Python生成箱型图

    // An highlighted block
    #首先导入基本的绘图包
    import matplotlib.pyplot as plt
    import numpy as np
    import pandas as pd
    
    #添加成绩表
    plt.style.use("ggplot")
    plt.rcParams['axes.unicode_minus'] = False
    plt.rcParams['font.sans-serif']=['SimHei'] 
    
    #新建一个空的DataFrame
    df=pd.DataFrame()
    
    // An highlighted block
    df["英语"]=[76,90,97,71,70,93,86,83,78,85,81]
    df["经济数学"]=[65,95,51,74,78,63,91,82,75,71,55]
    df["西方经济学"]=[93,81,76,88,66,79,83,92,78,86,78]
    df["计算机应用基础"]=[85,78,81,95,70,67,82,72,80,81,77]
    df
    
    // An highlighted block
    plt.boxplot(x=df.values,labels=df.columns,whis=1.5)
    plt.show()
    

    在这里插入图片描述

    // An highlighted block
    #用pandas自带的画图工具更快
    df.boxplot()
    plt.show()
    

    在这里插入图片描述
    Python生成正态分布图

    // An highlighted block
    # -*- coding:utf-8 -*-
    # Python实现正态分布
    # 绘制正态分布概率密度函数
    import numpy as np
    import matplotlib.pyplot as plt
    import math
    
    u = 0  # 均值μ
    u01 = -2
    sig = math.sqrt(0.2)  # 标准差δ
    
    x = np.linspace(u - 3 * sig, u + 3 * sig, 50)
    y_sig = np.exp(-(x - u) ** 2 / (2 * sig ** 2)) / (math.sqrt(2 * math.pi) * sig)
    print(x)
    print("=" * 20)
    print(y_sig)
    plt.plot(x, y_sig, "r-", linewidth=2)
    plt.grid(True)
    plt.show()
    

    在这里插入图片描述
    喜欢的小伙伴可以尝试一下哦

    这是小编公众号,请动动您可爱的小手手,关注一下💓😘
    在这里插入图片描述

    展开全文
  • 数据分析实例

    2020-07-13 16:30:25
    漏斗模型--数据分析师必备技能(京东APP案例):https://www.bilibili.com/video/BV1hg4y1q7JG/

    漏斗模型--数据分析师必备技能(京东APP案例):https://www.bilibili.com/video/BV1hg4y1q7JG/

     

    展开全文
  • 相信与超市管理职业挂钩的你,可能需要了解一下品类数据分析实例剖解,现在就来下载品类数据分...该文档为品类数据分析实例剖解,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看
  • 数据分析实例】数据领域的兄弟们的数据分析

    数据科学之路~

    • Author:Runsen
    • Wechat:RunsenLiu

    (一)数据领域的兄弟们的自身情况

    • 性别比例
    • 调查问卷国家分布
    • 年龄分布
    • 收入情况
    • 所学专业
    • 从事领域
    • 工作满意度
    • 最常使用工具
    • 常用算法
    • 计算平台选择
    • 面临挑战

    (二)Python和R哪家强

    • 使用人数
    • 常用工具
    • 不同工种偏好
    • 各大领域使用趋势
    • 薪资待遇
    • 用了多少年
    • 重要程度

    (三)数据科学家都在用什么

    • 国家分布
    • 使用Python or R
    • 工资与学历
    • 如何证明自己呢
    • 遇到的问题
    • 对可视化的重要程度
    • 求职的途径
    • 前一份工作和现在的对比

    数据下载:https://www.kaggle.com/kaggle/kaggle-survey-2017

    看看性别的分布吧

    不出所料,男的还是占了大多数,符合猜想

    看看排名人数最多的前15个国家


    中国才第6?估计是咱们看着一堆英文调查问卷都懒得理了!

    各国的收入情况啥样呀在调查问卷中

    去掉这些土豪(逗比)吧,这就是工资的差不多正常分布了

    性别对工资的影响大吗?

    参与调查的都是年轻人吧应该?


    20-35的人数比较多,50以上的也不少啊。。。难道是陪孩子一起来玩数据吗。。。

    来玩数据的人都是啥专业的呀?现在又干啥呢?

    这些个不同工种的工资啥样呢?


    运筹学从业者的平均工资中位数最高,其次是预测建模师和数据科学家。计算机科学家(好歹也是科学家啊)和程序员(好吧,我垫底了)的报酬最低。


    显然,大多数受调查者都从事有监督的学习,而逻辑回归是其中最受欢迎的,但是算法没有高下之分!


    很明显,下一年将会有更多的深度学习者。深入学习和神经网络或短期AI是明年最受欢迎的热门话题。此外,在工具方面,Python比R更受欢迎。

    数据科学的平台,大家喜欢哪一个呀?

    兄弟们的设备怎么样

    数据集哪里找?

    开源的代码哪里找?

    数据科学面临的挑战


    最大的挑战看起来是获得最干净的数据,还有。。。基本所有对我来说都是挑战。。。

    干这行的兄弟们,满意度咋样啊


    数据科学家和机器学习工程师是最满意的人,而程序员的工作满意度最低。
    何去何从。。。掂量着办啊!

    Python vs R or (Batman vs Superman)

    有多大用,大家咋说的呢?


    看来有这么多高手是通杀啊!

    不同工种的偏好


    r在视觉上胜过Python。因此,拥有诸如数据分析师、业务分析师等职位头衔的人在图形和视觉上扮演着非常重要的角色,他们喜欢R而不是Python。同样,几乎90%的统计人员使用R,正如前面所述,Python在机器学习方面更好,因此机器学习工程师、数据科学家和DBA或程序员等其他人更喜欢Python。

    使用语言多少年啦!

    不同的行业用哪门语言呢?

    Python与R分别最常使用的工具是什么呢?


    SQL似乎使用了语言最常见的补充工具。SQL是查询大型数据库的主要语言,因此了解它是一个很大的好处。

    看看数据科学家们做什么都

    他们都在哪些国家呢?

    教育背景以及工作情况

    学历跟工资挂钩吗

    前一份工作和现在的改变

    数据科学家们都用什么

    时间都去哪了。还没好好。。。。

    常用平台

    对可视化的重视程度

    如何证明你的实力呢

    怎么找工作的?

    许多数据科学家通过他们的朋友或亲戚了解工作,或者直接与公司联系。

    在Python和R中最常用什么

    结论:

    1)大多数受访者来自美国.

    2)大多数的受访者在年龄20-35岁,这表明数据科学的年轻人是很著名的。

    3)调查对象不仅限于计算机科学专业,还包括统计学、健康科学等专业,数据科学是一门跨学科的领域。

    4)大多数被调查者都被充分雇用。

    5)Kaggle,在线课程(Coursera,edX,等),项目和博客(kdnuggets,analyticsvidya,等)是学习数据科学的首选资源。

    6)Kaggle数据采集与GitHub的代码共享是大家非常喜欢的

    7)数据科学家的工作满意度最高,相反程序员的工作满意度最低。

    8)数据科学家也从以前的工作中获得的提升大约6~20%。

    1)学习Python、R和SQL,因为它们是数据科学家最常用的语言。Python和R将有助于分析和预测建模,而SQL最适合查询数据库。

    2)学习机器学习技术,如逻辑回归,决策树,支持向量机等,因为它们是最常用的机器学习技术/算法。

    3)深学习和神经网络将是未来最受欢迎的技术,因此,精通它们将是非常有益的。

    4)掌握收集数据和清理数据的技能,因为它们是数据科学家工作流程中最耗时的过程。

    5)可视化是非常重要的数据科学项目以及几乎所有的项目都需要了解数据的可视化。

    6)数学和统计在数据科学中是非常重要的,所以我们应该对它有很好的理解,以便真正理解算法是如何工作的。

    7)根据数据科学家们说,项目是学习数据科学的最佳途径,因此,研究项目将有助于更好地学习数据科学。

    代码下载

    链接:https://pan.baidu.com/s/1ta0geSL-lH4x8V-_Ris04w
    提取码:jlqy
    复制这段内容后打开百度网盘手机App,操作更方便哦

    展开全文
  • 第一章 SPSS概览数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4...
  • 基于echarts的数据分析实例
  • 数据分析实例:MovieLens电影数据分析 数据准备 数据集来源:grouplens.org/datasets/movielens/ 下载 ml-1m.zip,read me 中有电影评分介绍 MovieLens 1M电影分级。 稳定的基准数据集。 6000个用户观看4000部电影...

    数据分析实例:MovieLens电影数据分析

    数据准备

    数据集来源:grouplens.org/datasets/movielens/
    下载 ml-1m.zip,read me 中有电影评分介绍
    在这里插入图片描述
    MovieLens 1M电影分级。 稳定的基准数据集。 6000个用户观看4000部电影时获得100万个评分。 发布2/2003。

    数据读取

    环境:ipython notebook

    • 读取
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    
    user_names=['user_id','gender','age','occupation','zip']
    users=pd.read_table('users.dat',sep='::',header=None,names=user_names,engine='python')
    rating_names=['user_id','movie_id','rating','timestamp']
    ratings=pd.read_table('ratings.dat',sep='::',header=None,names=rating_names,engine='python')
    movie_names=['movie_id','title','genres']
    movies=pd.read_table('movies.dat',sep='::',header=None,names=movie_names,engine='python')
    
    
    users.head(5)
    users.head(5)
    Out[32]:
    use_id	gender	age	occupation	zip
    0	1	F	1	10	48067
    1	2	M	56	16	70072
    2	3	M	25	15	55117
    3	4	M	45	7	02460
    4	5	M	25	20	55455
    In [33]:
    
    ratings.head(5)
    Out[33]:
    user_id	movie_id	rating	timestamp
    0	1	1193	5	978300760
    1	1	661	3	978302109
    2	1	914	3	978301968
    3	1	3408	4	978300275
    4	1	2355	5	978824291
    In [38]:
    
    ​
    movies.head(5)
    Out[38]:
    movie_id	title	genres
    0	1	Toy Story (1995)	Animation|Children's|Comedy
    1	2	Jumanji (1995)	Adventure|Children's|Fantasy
    2	3	Grumpier Old Men (1995)	Comedy|Romance
    3	4	Waiting to Exhale (1995)	Comedy|Drama
    4	5	Father of the Bride Part II (1995)	Comedy
    
    • 合并
    data = pd.merge(pd.merge(ratings, users), movies)
    
    Out[45]:
    user_id	movie_id	rating	timestamp	gender	age	occupation	zip	title	genres
    0	1	1193	5	978300760	F	1	10	48067	One Flew Over the Cuckoo's Nest (1975)	Drama
    1	2	1193	5	978298413	M	56	16	70072	One Flew Over the Cuckoo's Nest (1975)	Drama
    2	12	1193	4	978220179	M	25	12	32793	One Flew Over the Cuckoo's Nest (1975)	Drama
    3	15	1193	4	978199279	M	25	7	22903	One Flew Over the Cuckoo's Nest (1975)	Drama
    4	17	1193	5	978158471	M	50	1	95350	One Flew Over the Cuckoo's Nest (1975)	Drama
    
    data[data.user_id==1]
    Out[46]:
    user_id	movie_id	rating	timestamp	gender	age	occupation	zip	title	genres
    0	1	1193	5	978300760	F	1	10	48067	One Flew Over the Cuckoo's Nest (1975)	Drama
    1725	1	661	3	978302109	F	1	10	48067	James and the Giant Peach (1996)	Animation|Children's|Musical
    2250	1	914	3	978301968	F	1	10	48067	My Fair Lady (1964)	Musical|Romance
    2886	1	3408	4	978300275	F	1	10	48067	Erin Brockovich (2000)	Drama
    4201	1	2355	5	978824291	F	1	10	48067	Bug's Life, A (1998)	Animation|Children's|Comedy
    5904	1	1197	3	978302268	F	1	10	48067	Princess Bride, The (1987)	Action|Adventure|Comedy|Romance
    8222	1	1287	5	978302039	F	1	10	48067	Ben-Hur (1959)	Action|Adventure|Drama
    8926	1	2804	5	978300719	F	1	10	48067	Christmas Story, A (1983)	Comedy|Drama
    10278	1	594	4	978302268	F	1	10	48067	Snow White and the Seven Dwarfs (1937)	Animation|Children's|Musical
    11041	1	919	4	978301368	F	1	10	48067	Wizard of Oz, The (1939)	Adventure|Children's|Drama|Musical
    12759	1	595	5	978824268	F	1	10	48067	Beauty and the Beast (1991)	Animation|Children's|Musical
    13819	1	938	4	978301752	F	1	10	48067	Gigi (1958)	Musical
    14006	1	2398	4	978302281	F	1	10	48067	Miracle on 34th Street (1947)	Drama
    14386	1	2918	4	978302124	F	1	10	48067	Ferris Bueller's Day Off (1986)	Comedy
    15859	1	1035	5	978301753	F	1	10	48067	Sound of Music, The (1965)	Musical
    16741	1	2791	4	978302188	F	1	10	48067	Airplane! (1980)	Comedy
    18472	1	2687	3	978824268	F	1	10	48067	Tarzan (1999)	Animation|Children's
    18914	1	2018	4	978301777	F	1	10	48067	Bambi (1942)	Animation|Children's
    19503	1	3105	5	978301713	F	1	10	48067	Awakenings (1990)	Drama
    20183	1	2797	4	978302039	F	1	10	48067	Big (1988)	Comedy|Fantasy
    21674	1	2321	3	978302205	F	1	10	48067	Pleasantville (1998)	Comedy
    22832	1	720	3	978300760	F	1	10	48067	Wallace & Gromit: The Best of Aardman Animatio...	Animation
    23270	1	1270	5	978300055	F	1	10	48067	Back to the Future (1985)	Comedy|Sci-Fi
    25853	1	527	5	978824195	F	1	10	48067	Schindler's List (1993)	Drama|War
    28157	1	2340	3	978300103	F	1	10	48067	Meet Joe Black (1998)	Romance
    28501	1	48	5	978824351	F	1	10	48067	Pocahontas (1995)	Animation|Children's|Musical|Romance
    28883	1	1097	4	978301953	F	1	10	48067	E.T. the Extra-Terrestrial (1982)	Children's|Drama|Fantasy|Sci-Fi
    31152	1	1721	4	978300055	F	1	10	48067	Titanic (1997)	Drama|Romance
    32698	1	1545	4	978824139	F	1	10	48067	Ponette (1996)	Drama
    32771	1	745	3	978824268	F	1	10	48067	Close Shave, A (1995)	Animation|Comedy|Thriller
    33428	1	2294	4	978824291	F	1	10	48067	Antz (1998)	Animation|Children's
    34073	1	3186	4	978300019	F	1	10	48067	Girl, Interrupted (1999)	Drama
    34504	1	1566	4	978824330	F	1	10	48067	Hercules (1997)	Adventure|Animation|Children's|Comedy|Musical
    34973	1	588	4	978824268	F	1	10	48067	Aladdin (1992)	Animation|Children's|Comedy|Musical
    36324	1	1907	4	978824330	F	1	10	48067	Mulan (1998)	Animation|Children's
    36814	1	783	4	978824291	F	1	10	48067	Hunchback of Notre Dame, The (1996)	Animation|Children's|Musical
    37204	1	1836	5	978300172	F	1	10	48067	Last Days of Disco, The (1998)	Drama
    37339	1	1022	5	978300055	F	1	10	48067	Cinderella (1950)	Animation|Children's|Musical
    37916	1	2762	4	978302091	F	1	10	48067	Sixth Sense, The (1999)	Thriller
    40375	1	150	5	978301777	F	1	10	48067	Apollo 13 (1995)	Drama
    41626	1	1	5	978824268	F	1	10	48067	Toy Story (1995)	Animation|Children's|Comedy
    43703	1	1961	5	978301590	F	1	10	48067	Rain Man (1988)	Drama
    45033	1	1962	4	978301753	F	1	10	48067	Driving Miss Daisy (1989)	Drama
    45685	1	2692	4	978301570	F	1	10	48067	Run Lola Run (Lola rennt) (1998)	Action|Crime|Romance
    46757	1	260	4	978300760	F	1	10	48067	Star Wars: Episode IV - A New Hope (1977)	Action|Adventure|Fantasy|Sci-Fi
    49748	1	1028	5	978301777	F	1	10	48067	Mary Poppins (1964)	Children's|Comedy|Musical
    50759	1	1029	5	978302205	F	1	10	48067	Dumbo (1941)	Animation|Children's|Musical
    51327	1	1207	4	978300719	F	1	10	48067	To Kill a Mockingbird (1962)	Drama
    52255	1	2028	5	978301619	F	1	10	48067	Saving Private Ryan (1998)	Action|Drama|War
    54908	1	531	4	978302149	F	1	10	48067	Secret Garden, The (1993)	Children's|Drama
    55246	1	3114	4	978302174	F	1	10	48067	Toy Story 2 (1999)	Animation|Children's|Comedy
    56831	1	608	4	978301398	F	1	10	48067	Fargo (1996)	Crime|Drama|Thriller
    59344	1	1246	4	978302091	F	1	10	48067	Dead Poets Society (1989)	Drama
    
    女生最喜欢的电影排行榜/男生最喜欢的电影排行榜
    rating_by_gender=data.pivot_table(values='rating',index='title',columns='gender',aggfunc='mean')
    gender	F	M
    title		
    $1,000,000 Duck (1971)	3.375000	2.761905
    'Night Mother (1986)	3.388889	3.352941
    'Til There Was You (1997)	2.675676	2.733333
    'burbs, The (1989)	2.793478	2.962085
    ...And Justice for All (1979)	3.828571	3.689024
    1-900 (1994)	2.000000	3.000000
    10 Things I Hate About You (1999)	3.646552	3.311966
    101 Dalmatians (1961)	3.791444	3.500000
    101 Dalmatians (1996)	3.240000	2.911215
    12 Angry Men (1957)	4.184397	4.328421
    
    评分差
    rating_by_gender['diff']=rating_by_gender.F-rating_by_gender.M
    In [50]:
    
    rating_by_gender.head(10)
    Out[50]:
    gender	F	M	diff
    title			
    $1,000,000 Duck (1971)	3.375000	2.761905	0.613095
    'Night Mother (1986)	3.388889	3.352941	0.035948
    'Til There Was You (1997)	2.675676	2.733333	-0.057658
    'burbs, The (1989)	2.793478	2.962085	-0.168607
    ...And Justice for All (1979)	3.828571	3.689024	0.139547
    1-900 (1994)	2.000000	3.000000	-1.000000
    10 Things I Hate About You (1999)	3.646552	3.311966	0.334586
    101 Dalmatians (1961)	3.791444	3.500000	0.291444
    101 Dalmatians (1996)	3.240000	2.911215	0.328785
    12 Angry Men (1957)	4.184397	4.328421	-0.144024
    
    评分差距最大
    rating_by_gender.sort_values(by='diff',ascending=True).head(10)
    Out[52]:
    gender	F	M	diff
    title			
    Tigrero: A Film That Was Never Made (1994)	1.0	4.333333	-3.333333
    Neon Bible, The (1995)	1.0	4.000000	-3.000000
    Enfer, L' (1994)	1.0	3.750000	-2.750000
    Stalingrad (1993)	1.0	3.593750	-2.593750
    Killer: A Journal of Murder (1995)	1.0	3.428571	-2.428571
    Dangerous Ground (1997)	1.0	3.333333	-2.333333
    In God's Hands (1998)	1.0	3.333333	-2.333333
    Rosie (1998)	1.0	3.333333	-2.333333
    Flying Saucer, The (1950)	1.0	3.300000	-2.300000
    Jamaica Inn (1939)	1.0	3.142857	-2.142857
    
    评分次数
    ratings_by_title=data.groupby('title').size()
    In [55]:
    
    ratings_by_title.sort_values(ascending=False).head(10)
    Out[55]:
    title
    American Beauty (1999)                                   3428
    Star Wars: Episode IV - A New Hope (1977)                2991
    Star Wars: Episode V - The Empire Strikes Back (1980)    2990
    Star Wars: Episode VI - Return of the Jedi (1983)        2883
    Jurassic Park (1993)                                     2672
    Saving Private Ryan (1998)                               2653
    Terminator 2: Judgment Day (1991)                        2649
    Matrix, The (1999)                                       2590
    Back to the Future (1985)                                2583
    Silence of the Lambs, The (1991)                         2578
    dtype: int64
    

    统计电影平均得分

    mean_ratings=data.pivot_table(values='rating',index='title',aggfunc='mean')
    In [57]:
    mean_ratings.head(10)
    Out[57]:
    rating
    title	
    $1,000,000 Duck (1971)	3.027027
    'Night Mother (1986)	3.371429
    'Til There Was You (1997)	2.692308
    'burbs, The (1989)	2.910891
    ...And Justice for All (1979)	3.713568
    1-900 (1994)	2.500000
    10 Things I Hate About You (1999)	3.422857
    101 Dalmatians (1961)	3.596460
    101 Dalmatians (1996)	3.046703
    12 Angry Men (1957)	4.295455
    In [62]:
    mean_ratings.sort_values(by='rating',ascending=False).head(20)
    Out[62]:
    rating
    title	
    Ulysses (Ulisse) (1954)	5.000000
    Lured (1947)	5.000000
    Follow the Bitch (1998)	5.000000
    Bittersweet Motel (2000)	5.000000
    Song of Freedom (1936)	5.000000
    One Little Indian (1973)	5.000000
    Smashing Time (1967)	5.000000
    Schlafes Bruder (Brother of Sleep) (1995)	5.000000
    Gate of Heavenly Peace, The (1995)	5.000000
    Baby, The (1973)	5.000000
    I Am Cuba (Soy Cuba/Ya Kuba) (1964)	4.800000
    Lamerica (1994)	4.750000
    Apple, The (Sib) (1998)	4.666667
    Sanjuro (1962)	4.608696
    Seven Samurai (The Magnificent Seven) (Shichinin no samurai) (1954)	4.560510
    Shawshank Redemption, The (1994)	4.554558
    Godfather, The (1972)	4.524966
    Close Shave, A (1995)	4.520548
    Usual Suspects, The (1995)	4.517106
    Schindler's List (1993)	4.510417
    

    好的电影需要具备两个条件:热度高,评分高

    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • Excel数据分析实例

    2021-03-26 21:04:36
    Excel数据分析实例 Excel数据分析五步走: 明确目的——观察数据——数据清洗——数据分析——数据可视化 数据是从Kaggle上下载的,牛油果的案例 目的 数据分析都是为了企业业务做得更好,这次案例主要针对于牛油果...
  • 数据分析实例小试

    千次阅读 2019-09-18 10:55:52
    数据分析实例测试 准备数据 1.开局先导入python数据分析模块三剑客加上一个后面要用到的卡方检验: from matplotlib import pyplot as plt import numpy as np import pandas as pd from scipy.stats import chi2_...
  • 用Python进行数据分析的好处是,它的数据分析库目前已经很全面了,有NumPy、pandas、SciPy、scikit-learn、StatsModels,还有深度学习、神经网络的各类包。基本上能满足大部分的企业应用。用Python的好处是从数据...
  • 数据分析实例--美国人收入的分析(样本个数32000) 1、导入数据,完成分列 2、处理空值和异常数据,完成数据汇总 3、年龄段与收入情况关系的柱状图 4、学历与收入情况关系的柱状图 5、受教育年限与收入情况关系的...
  • 名师整理 优秀资源 第一章 SPSS 概览数据分析实例详解 医学统计之星 张文彤 最后一次更新时间 1.1 数据的输入和保存 1.1.1 SPSS 的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据...
  • 咨询顾问 | 写作爱好者 | 数据分析 | 互联网创业者 R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/joffy/posts 往期回顾:数据分析项目实战:大型商场销售预测(带你挤进比赛前100名)数据分析实例:...
  • 用Python进行数据分析的好处是,它的数据分析库目前已经很全面了,有NumPy、pandas、SciPy、scikit-learn、StatsModels,还有深度学习、神经网络的各类包。基本上能满足大部分的企业应用。用Python的好处是从数据...
  • SparkR安装部署及数据分析实例

    千次阅读 2016-06-14 15:22:30
    SparkR安装部署及数据分析实例
  • 数据分析实例(股票分析实例)

    千次阅读 2019-04-11 17:05:09
    import numpy as np import pandas as pd import matplotlib.pyplot as ...使用pandas的内建函数DataReader从雅虎财经网站读取股价数据 import tushare as ts pingan = ts.get_k_data('601318',start='2011-01-01'...
  • 数据分析实例之股票市场数据分析

    千次阅读 2018-10-27 22:04:59
    学了一段时间的python数据分析以后,下面来完成一个股票数据分析的实际案例。 1.数据获取: 去雅虎财务上面搜索,具体网址如下: https://finance.yahoo.com/ 安装pandas-datareader pip install pandas-datareader ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 20,713
精华内容 8,285
关键字:

数据分析实例