精华内容
下载资源
问答
  • 适合初学者的 10 大机器学习项目
    2021-12-01 11:34:39

    机器学习听起来很像是:平板电脑、计算机等各种形式的设备根据编程和大量数据来学习一些东西。它看起来像一个未来主义概念,而实际上每天都在我们的现实生活中被广泛应用,语音识别就是一个很好的例子。如同Siri 和 Alexa 这样的虚拟助手就是通过机器学习技术来实现语音提醒、回答问题、执行命令等功能。

    随着机器学习的激增,越来越多的专业人士选择从事机器学习工程师的职业。而成为机器学习工程师最好的入门方法之一就是亲自动手开发一个项目,网上有许多免费资源课程。

    今天我们就来简单聊一聊10个机器学习项目,先睹为快,上列表!

    目录

    1. 使用 Movielens 数据集推荐电影
    2. TensorFlow
    3. 沃尔玛的销售预测
    4. 股价预测
    5. 使用智能手机识别人类活动
    6. 葡萄酒质量预测
    7. 乳腺癌预测
    8. 虹膜分类
    9. Twitter 上特定推文的筛选
    10. 将手写文档数字化

    接下来我们逐一介绍

    1. 使用Movielens 数据集推荐电影

    流媒体时代,几乎每个人都会在媒体平台上观看自己喜欢的电影或电视节目。虽然有时我们自己也会苦于剧荒,不知道一剧终结后下一部何去何从,但是“过分聪明”的平台则通常会根据我们的历史记录和偏好来做出响应推荐。而这一过程就是通过机器学习来完成的。对于初学者来说,这是一个有趣且简单的项目。新程序员可以通过使用Python 或 R语言以及来自Movielens数据集的数据进行编码来练习。Movielens 数据集由 6,000 多个用户生成,目前包含 3,900 部超过百万评级的电影。

    2. TensorFlow

    这个开源人工智能库是帮助初学者提高机器学习技能的神器。借助TensorFlow,学员可以使用这个智能库来创建数据流图、使用 Java 的项目以及一系列应用程序,其中还包括用于 Java 的 API。

    3. 沃尔玛的销售预测

    虽然我们可能无法对未来的销售额做出精准预测,但使用机器学习却能为我们指明销售方向。例如,沃尔玛为45 个网点的 98 种产品提供数据集,然后开发人员可以访问按地点和部门划分的每周销售信息。此范围项目的目的在于通过优化渠道和库存计划从而做出更好的数据驱动决策。

    4. 股价预测

    与销售预测类似,股价预测基于过去价格、波动率指数和基本面指标的数据集。初学者可以从这样的项目开始,然后使用股票市场数据集来创建未来几个月的预测。通过这种方法我们可以更好地熟悉怎样通过大量数据集来创建预测。从 Quantopian 或Quandl下载股票市场数据集,开始练习吧!

    5. 使用智能手机识别人类活动

    如今,移动设备都能自动检测出我们在哪些时间进行了哪些特定活动,比如跑步、骑自行车、散步等。这些都是机器学习在发挥作用。想要练习此类项目,机器学习工程师新手需要引用一个数据集,其中包含通过配备惯性传感器的移动设备收集的少数人(当然越多越好)的健身活动记录。然后,学员可以构建分类模型,以便准确预测未来的活动。这也可以帮助我们了解如何解决多分类问题。

    6. 葡萄酒质量预测

    购买新的或不熟悉的葡萄酒可能有些冒险,万一不对口,也会成为“人生一憾事”。除非你是一位通晓各种判定因素(如年份和价格)的专家,否则不能准确判定出某款葡萄酒是否具有高品质。葡萄酒质量数据集中就包含这样的细节,它可以帮助我们通过机器学习来预测出葡萄酒的质量,这个项目是不是很有趣?此外,通过这个项目,ML 初学者可以获得数据可视化、数据探索、回归模型和 R 编程方面的经验。

    7. 乳腺癌预测

    这个机器学习项目使用的数据集可以帮我们确定乳腺肿瘤可能是恶性还是良性。项目会综合考虑各种因素,包括肿块的厚度、裸核的数量和有丝分裂等。这也是机器学习专业新手士练习R 编程的绝佳机会。

    8. 虹膜分类

    鸢尾花数据集非常有名,也是适合初学者的最古老、最简单的机器学习项目之一。通过这个项目,学习者必须弄清楚处理数值和数据的基础知识。数据点包括按长度和宽度划分的萼片和花瓣的大小。使用机器学习,一个成功的项目将鸢尾花分为三个物种之一。

    9. Twitter 上特定推文的排序

    浏览推文时,能快速筛选出包含特定关键词和信息的文章是一种超级棒的体验。想要实现这种功能,只需要练习一个初学者级别的机器学习项目。程序员创建一种算法,该算法通过自然语言处理器运行抓取的推文来确定哪些更可能匹配特定主题、谈论某些个人等等,是不是so easy?

    10. 将手写文档数字化

    这种类型的项目是练习深度学习和神经网络(机器学习中图像识别的基本要素)的绝佳方法。初学者还可以学习如何将像素数据转换为图像,以及如何使用逻辑回归和 MNIST 数据集。

    获得机器学习认证

    如果你的目标是锁定一门从基础知识到机器学习算法开发和无监督学习等高级技术都包含在内的系统课程,那么建议考虑一下Simplilearn 的机器学习认证培训课程。它为初学者提供了一系列机器学习项目,包括超过 25 个机器学习练习。该课程还包括 44 小时的讲师指导培训和机器学习专家的指导课程。

    发现一门好课程,义无反顾地为自己做一次投资,不久后会庆幸自己此时的决定有多明智。

    更多相关内容
  • 股票买卖最佳时机leetcode +++ 初级交易者的 ...适合初学者的 IEX 证券交易所游戏 作者:Raul Tölp、Õie Renata Siimon 和 Helena Rebane 该程序是由爱沙尼亚塔尔图大学的学生在面向对象编程课程
  • 学习基金投资两本书就能掌握了,投资混合基金总体而言就是几点: 1.基金经理从业年限是否够长 2.基金经理业绩是否够漂亮 3.基金规模是否处于合适位置 4.定性分析,基金经理的投资策略是否符合你对于投资的理解...

    学习基金投资买两本书就能掌握了,投资混合基金总体而言就是几点:

    1.基金经理从业年限是否够长

    2.基金经理业绩是否够漂亮

    3.基金规模是否处于合适位置

    4.定性分析,基金经理的投资策略是否符合你对于投资的理解

    5.行业风格是否合适

    6.风险收益比是否合适你

    投资指数基金,不用看基金经理等乱七八糟的东西,主要看你对行业对大势的把控,选择你看好的指数在低估时加仓在高估时减仓或者直接定投直截了当,但是收益率不会太高。

    在市场中死的N个情况:

    1、首先大多数人根本没意识到你的竞争者是何等的可怕,已经武装牙齿。而你连武器长什么样都见不到。

    2、你见到了武器,但你根本找不到真实的武器图纸。

    3、万幸,你见到真实的图纸,你发现有图纸依然造不出武器,因为你是落后的农业化国家,你要迅速的进行工业化历程。

    4、万幸你度过了各种天灾人祸,活了下来,你会发现工业化路径千差万别。最后需要你一步一步自己走。

    5、实际上就算你千辛万苦完成了工业化,你会发现之后还有选择路径的区别。选错了,还是会死。

    所以看到这里,应该能得出一个结论:对绝大多数人而言,终其一生都无法建立起一个行之有效,符合自己实际的交易体系。

    真正的财富是什么?是体系。一个正确的体系面对没有体系的竞争才是真正的降维打击。

    在股票市场上,交易体系的构建是个异常复杂的工作。它需要一个投资者不断的学习、不断的思考、不断的积累经验。许多人都死在这三个“不断”之中了。因为这个阶段需要不断投入精力、金钱来支撑的。

    更可怕的是,投入了之后还看不到回报,不知道这样的煎熬的尽头在哪里。这个阶段可能需要六年到八年。当然这是指一个有理想有抱负的投资者的成长时间。放眼我们身边,许多股票交易者亏了十几年之后依然是个亏货,因为他根本就意识不到这方面的问题。炒股炒了十几年依然是最打听消息,看股评买股的阶段。这种人不在我们的讨论范围之内。

    期货(Muse3127)与现货完全不同,现货是实实在在可以交易的货(商品),期货主要不是货,而是以某种大众产品如棉花、大豆、石油等及金融资产如股票、债券等为标的标准化可交易合约。因此,这个标的物可以是某种商品(例如黄金、原油、农产品),也可以是金融工具。

    外汇是以汇率为交易对象,例如欧元兑美元。

    这两种投资都是保证金交易,自带杠杆,比如:如果带十倍杠杆就可以用1000钱买到10000块钱的东西,而如果这10000块钱的东西下跌了1000块,那么买涨者亏损1000块而爆仓,这是跟股票投资最大的不同,股票是持有股份,只要不退市,还有涨回来的机会。

    这两者如果从基本面分析的话,会比较复杂,期货中的农产品需要分析成本,天气等情况,工业品需要分析整个供应链上下游,外汇需要研究各国货币政策,经济走向。这两种投资由于分析复杂且风险巨大,不适合初学者。

    总结:做为一个初学者,暂时不要进行期货和外汇这种高风险投资,暂时研究基金与股票即可。

    另:古人教导我们,纸上得来终觉浅,绝知此事要躬行,可以在天天基金网上多研究下各基金买入了些什么股票,等一段时间搞熟悉了就自然懂了。

    展开全文
  • 机器学习初学者 购买的图像由PlargueDoctor设计 作为初学者,进入一个新的机器学习项目可能会很困难。 整个过程从选择一个数据集开始,然后,首先研究数据集,以找出哪种机器学习算法类或类型最适合该数据集。 ...

    机器学习初学者

    购买的图像由PlargueDoctor设计

    作为初学者,进入一个新的机器学习项目可能会很困难。 整个过程从选择一个数据集开始,然后,首先研究数据集,以找出哪种机器学习算法类或类型最适合该数据集。

    以下是专家的一些入门提示:

    • 找到一个相对容易分析的大小适中的数据集。 UCI ML存储库Kaggle是搜索的好地方。
    • 实验数据集。 为了获得对数据集的良好“感觉”,您可以对数据运行几种顶级的机器学习算法,以查看其行为以及每种算法实现的性能。
    • 选择性能最佳的算法并进行相应调整。

    好的,现在我们有了一些开始使用ML项目的一般提示,让我们看一下10个有趣的示例,这些示例将教您如何使用ML算法,对其进行调优以及如何分析给定的数据。

    1.有虹膜花分类的有监督机器学习

    Iris Flowers数据集被视为ML的“ Hello World”,因为它是分类的经典示例。 该数据集提供了很好的介绍,因为它要求您学习如何浏览数据以及如何加载数据。 此数据集的好处是加载到内存(150行)的空间很小,并且只有四个属性:花瓣长度,花瓣宽度,分隔长度和分隔宽度。

    该项目涉及使用四个已知属性识别四种不同的鸢尾花。 数据集允许您在标记数据时使用监督学习算法,而无监督则意味着我们在数据未被标记时正在寻找数据中的隐藏结构。

    分类类型? 我们在这里使用多类分类 。 这意味着我们应该能够准确地预测数据点属于哪个类别。

    目标 :根据花的特性将花分类为三种:花瓣和萼片的尺寸。

    下载: 鸢尾花数据集
    完整指南:有关解决问题的信息,请参见此处

    2.带有GNY的交易预测

    多年来,机器学习一直是一个热门话题,但由于成本原因,大多数开发人员无法使用许多流行的服务。 名为GNY的小组正在通过分散其强大的机器学习平台来解决该问题,该平台可免费下载和安装。 机器学习平台实际上是嵌入在区块链中的,因此可以保护用户数据免受潜在黑客攻击。

    该团队发布了一个演示,演示了该平台如何通过其强大的神经网络预测零售交易组,并在今年夏天推出了完全可下载和可定制的平台版本。 GNY将拥有一个可选的机器学习代码集库,可以根据每个人的需求对其进行选择,并将其应用于其侧链(因为GNY将使用Lisk的侧链技术)。

    为什么这个这么重要? 几乎所有企业都在寻找一种负担得起的方法来释放其数据中的隐藏价值,但如果这样做会使他们面临安全风险,则不会。 区块链的固有结构有助于控制数据的一致性,并允许您始终控制数据。

    由于可以在下一个块仍处于活动状态时为下一个块启动验证,因此性能得以提高。 验证包括检查用户是否有足够的余额。 仅对于错误预测的交易,需要重做这项工作。

    对于想要预测简单数字的人来说,该演示是一个有趣的入门项目,今年夏天启动的完整平台应为开发人员提供更多功能和定制功能。 在MLWave上可以找到一个很好的数据集,用于使用购买历史来预测回头客。

    目标 :根据支出历史预测未来的交易。

    3.带有Twitter的情绪分析

    机器学习的一种有趣的应用是情感分析。 随着加密货币的兴起,情感分析已取得重大突破。 许多人试图构建结合了情绪分析的交易机器人,以做出更好的交易决策。

    图片由AnalyticsVidhya.com提供

    还有许多其他可用于情感分析的平台,例如Reddit,Facebook或LinkedIn,因为它们都提供了易于使用的API来检索数据。 但是,由于Twitter平台上数据的格式一致,因此这是机器学习的首选数据。 由于推文主要由文本,URL和主题标签组成,因此预处理也容易得多。

    Twitter API知道许多可用于集成到您的项目中的API库。 可以使用!pip install python-twitter通过pip安装Python的包装。 但是,使用API​​时请当心,因为过度使用会使您进入黑名单。 因此,Twitter提供指导如何避免速率的限制。 如果您需要实时数据,则Twitter流API可以为您节省时间。

    有几个有趣的例子可以分析:

    • 围绕新发行电影的情绪,并将其与IMDB和其他评级网站上的评论进行比较。
    • 围绕特定选举或其他任何趋势政治话题的情绪。
    • 根据推文的情绪预测前50种加密货币的价格未来方向。

    目标 :情绪分析器学习一段内容背后的各种情绪。 该任务可帮助您考虑设计各种模型以将一条推文标记为肯定或否定。 在以后的阶段中,我们可以以更细微的方式标记推文,例如“中立”,“愤怒”,“乐观”,…

    Github概述:所有与Twitter相关的数据集。

    4.带有电影镜头的推荐系统

    推荐系统是机器学习技术在企业中最成功和最广泛的应用之一。 日常生活中到处都有推荐系统。 例如,在观看Youtube视频时,Youtube算法会根据您的观看习惯向您推荐视频,同时根据他们在运行ML算法时对世界各地人们的观看行为的观看模式所获得的关键见解。

    我们可以找到两种用于推荐系统的算法:

    1. 基于内容:如标签所示,它寻找内容的相似性。
    2. 协作过滤方法:此方法在交互中寻找相似之处。 交互的一个示例可以是查看用户的评分,并将其与其他人进行比较以找到相似的行为/喜好。 下图说明了这一点。
    来源:关于推荐系统的机器学习算法的Recombee

    目前,Movielens提供了电影收视率最受欢迎的数据集之一,这是初学者可以尝试的理想数据集。

    目标 :根据收视率预测用户喜欢的电影。

    网站: Grouplens.org

    教程: Towardsdatascience提供了一个使用Python构建简单的推荐系统的教程。

    5.带有Quandl的股票价格预测

    股价预测器是一个了解公司绩效并预测未来股价的系统。 股票价格预测的棘手之处在于可以使用多种类型和数据源:

    • 波动率指数
    • 历史价格
    • 全球宏观经济指标
    • 基本面分析
    • 使用指标进行技术分析

    分析股市的好处是反馈周期更短,这使您更容易验证您的预测。 如果您不知道市场周期,建议您阅读有关此主题的文章,以了解典型周期的情况。

    资料来源:关于市场周期心理学的第五人

    首先,您可以举一个简单的机器学习示例,在该示例中,我们根据组织的季度报告中的基本指标预测6个月的价格走势。

    目标 :使用基本指标和技术指标预测未来价格。

    下载:来自Quandl.com或Quantoplan.com的股票市场数据集。

    翻译自: https://hackernoon.com/top-5-machine-learning-projects-for-beginners-47b184e7837f

    机器学习初学者

    展开全文
  • python初学者 项目背景 (Project Background) Besides working to earn an income, investing is the best way to reach your financial goals in life, be it saving for a new car, starting a new business, or ...

    python初学者

    项目背景 (Project Background)

    Besides working to earn an income, investing is the best way to reach your financial goals in life, be it saving for a new car, starting a new business, or ensuring a comfortable retirement. The idea of passively increasing the value of my assets over time without doing anything (besides buying stocks and holding it) intrigued me as I pursued financial independence. However, I didn’t know where to start. How do I make a decision on what stocks to buy? How can I understand company’s performance by looking at the stock market? Can I pull historical stock market data to create buy/sell signals and automate alerts or even trades?

    除了赚钱之外,投资是实现人生财务目标的最佳方法,既可以省钱买新车,开始新业务或确保退休后的生活。 在追求财务独立性的同时,不做任何事情(不买股票和持有股票)而被动地增加我的资产价值的想法引起了我的兴趣。 但是,我不知道从哪里开始。 我该如何决定要购买哪些股票? 通过查看股票市场如何了解公司的绩效? 我可以提取历史股票市场数据来创建买/卖信号并自动执行警报甚至交易吗?

    Without getting too deep into the financial background of each tool, I will show you how I use Python to pull historical stock data, visualize growth and decay trends, understand returns, estimate risks using returns standard deviations, and identify undervalued stocks to buy.

    在不深入了解每种工具的财务背景的情况下,我将向您展示如何使用Python提取历史股票数据,可视化增长和衰减趋势,了解收益,使用收益标准偏差估算风险以及确定被低估的股票。

    Specifically, the topics covered in this article are:

    具体来说,本文涵盖的主题是:

    1. Getting Stock Market Data/Data Preparation

      获取股票市场数据/数据准备
    2. Exploratory Data Analysis

      探索性数据分析
    3. Visualizing Prices over Time

      随时间可视化价格
    4. Conducting Risk and Returns Analysis

      进行风险与收益分析
    5. Seeing Trends with Simple Moving Averages

      通过简单的移动平均线查看趋势
    6. Finding Under/Over-value Stocks with Bollinger Band Plots

      使用布林带图查找低/高价值股票

    In other words, this article will show you the skeleton “how the analysis is done” using Python, but the “interpretation” meat of the analysis will be discounted. For the interested reader, I dig deeper into real-world examples and interpretation in another 6-part series. The Python code is the exact same for the 6-part series as covered in this blog, but there is more context given to the analysis there. I highly encourage you to read that series if you have the time. For now, I’ll cover the distilled, Python-focused work in this article. Let’s begin!

    换句话说,这篇文章将告诉你“的分析是怎么做的”使用Python的骨架 ,但分析的“解释” 就会打折扣。 对于感兴趣的读者,我将在另一个由6部分组成的系列文章中深入研究实际示例和解释。 Python代码与本博客中介绍的6部分系列完全相同,但是此处的分析提供了更多上下文。 如果有时间,我强烈建议您阅读该系列。 现在,我将在本文中介绍经过提炼,以Python为重点的工作。 让我们开始!

    获取数据 (Getting the Data)

    There are multiple ways to pull stock market data, each with their own advantages. Here, I will use the pandas-datareader package. Make sure you have this installed if you plan on following along with the coding. Using the pandas-datareader package, we’ll use Yahoo Finance as our source of information. All you need to provide is the start and end dates of your analysis period , as well as a list of ticker symbols of companies that you’re interested in.

    提取股市数据有多种方法,每种方法都有自己的优势。 在这里,我将使用pandas-datareader包。 如果您打算跟随编码一起进行,请确保已安装此程序。 使用pandas-datareader程序包,我们将使用Yahoo Finance作为信息源。 您只需要提供分析期间的开始和结束日期,以及您感兴趣的公司的股票代号即可。

    # Set the start and end dates for your analysis. The end date is set to current day by default
    start_date = '2018-01-01'
    end_date = datetime.date.today().strftime('%Y-%m-%d')# List the ticker symbols you are interested in (as strings)
    tickers = ["SPY", "AAL", "ZM", "NFLX", "FB"]# I want to store each df separately to do Bollinger band plots later on
    each_df = {}
    for ticker in tickers:
    each_df[ticker] = data.DataReader(ticker, 'yahoo', start_date, end_date)# Concatenate dataframes for each ticker together to create a single dataframe called stocks
    stocks = pd.concat(each_df, axis=1, keys = tickers)# Set names for the multi-index
    stocks.columns.names = ['Ticker Symbol','Stock Info']

    The stocks dataframe should look something like this.

    股票数据框应如下所示。

    Image for post
    Figure 1: Dataframe of stock information
    图1:库存信息数据框

    探索性数据分析 (Exploratory Data Analysis)

    In this step, I try to better understand what I am looking at. I try to discover patterns, detect anomalies, and answer questions like How many data points do I have? Does anything look strange? Am I missing any information?

    在这一步中,我试图更好地了解我在看什么。 我尝试发现模式,检测异常并回答诸如“我有多少个数据点”之类的问题? 看起来有些奇怪吗? 我是否缺少任何信息?

    There are a few standard operations I do when looking at any new data set. These include looking at the pandas.DataFrame.shape attribute, the .info() method to see the columns and their datatypes, the .describe() method to understand the descriptive statistics of the numerical data, and the .isnull() method to see missing data.

    查看任何新数据集时,我需要执行一些标准操作。 其中包括查看pandas.DataFrame.shape属性,.info()方法以查看列及其数据类型,.describe()方法以了解数值数据的描述统计信息以及.isnull()方法以查看列及其数据类型。查看丢失的数据。

    Here is the output of stocks.shape:

    这是stocks.shape的输出:

    Image for post
    Figure 2. Testing the .shape attribute
    图2.测试.shape属性

    Here is the output of stocks.info():

    这是stocks.info()的输出:

    Image for post
    Figure 3. Testing the .info() method
    图3.测试.info()方法

    Here is the output of stocks.describe():

    这是stocks.describe()的输出:

    Image for post
    Figure 4. Use the .describe() method to see the statistics
    图4.使用.describe()方法查看统计信息

    Here is the output of stock.isnull() visualized in a heatmap:

    这是在热图中可视化显示的stock.isnull()的输出:

    Image for post
    Figure 5. Heat map visualization of missing data
    图5.缺少数据的热图可视化

    随时间可视化数据 (Visualization of Data over Time)

    First, let’s create a dataframe called ‘closing_prices_df’ with only the adjusted closing prices of each stock. We can do this easily using the cross section method of pandas.DataFrame.xs().

    首先,让我们创建一个名为“ closing_prices_df”的数据框,其中仅包含调整后的每只股票的收盘价。 我们可以使用pandas.DataFrame.xs()的横截面方法轻松地做到这一点。

    # Create a dataframe for the closing_prices of the stocks
    closing_prices_df = stocks.xs(key='Adj Close',axis=1,level=1)

    Then, we can use the plotly package to plot closing prices over time.

    然后,我们可以使用plotly包来绘制一段时间内的收盘价。

    # Create a dataframe for the closing_prices of the stocks
    closing_prices_df = stocks.xs(key='Adj Close',axis=1,level=1)# Using plotly to create line plot of stock closing prices over time.
    # You can double click on the ticker symbols in the legend to isolate each tickerfig = px.line(closing_prices_df, x=closing_prices_df.index, y=closing_prices_df.columns, title=”Adjusted Closing Prices”)
    fig.update_layout(hovermode=’x’,yaxis_title=”Price”)
    fig.show()
    Figure 6: Day to day adjusted close prices for selected stocks
    图6:选定股票的每日调整后收盘价

    Besides looking at closing prices over time, it is helpful to summarize much more information within candlestick plots. Candlestick charts are a commonly used financial visual to show price movements in securities. They are densely packed with information, including single day open, close, high, and low prices.

    除了查看一段时间内的收盘价外,总结烛台图中的更多信息也很有帮助。 烛台图是一种常用的财务图表,用于显示证券的价格走势。 它们充斥着信息,包括单日开盘价,收盘价,最高价和最低价。

    Here, we create our own candlestick chart for our companies of interest using plotly.

    在这里,我们使用plotly为感兴趣的公司创建自己的烛台图。

    import plotly.graph_objects as go# User input ticker of interest
    ticker = "NFLX"fig = go.Figure(data=[go.Candlestick(x=each_df[ticker].index,
    open=each_df[ticker]['Open'],
    high=each_df[ticker]['High'],
    low=each_df[ticker]['Low'],
    close=each_df[ticker]['Close'])])fig.update_layout(
    title='Candlestick Chart for ' + ticker,
    yaxis_title='Price',
    xaxis_title='Date',
    hovermode='x'
    )
    fig.show()

    Here is what an example of what the candlestick plot looks like.

    这是烛台图的示例。

    Image for post
    Figure 7: Netflix candlestick chart
    图7:Netflix烛台图

    Again, candlestick charts are packed dense with information, so there are many traders who build trading strategies around them. I discuss them a little more in my other post here.

    同样,烛台图上挤满了信息,因此有许多交易者围绕它们建立交易策略。 我在这里的其他文章中对它们进行了更多讨论。

    风险与收益分析 (Risk and Returns Analysis)

    To make well-informed trades, it is important to understand the risk and returns of each stock. First, let’s create a new dataframe to store the daily percent changes in closing prices. I call this the ‘returns’ dataframe.

    为了进行明智的交易,了解每只股票的风险和回报很重要。 首先,让我们创建一个新的数据框来存储收盘价的每日百分比变化。 我称其为“返回”数据框。

    # Create a new df called returns that calculates the return after each day.
    returns = pd.DataFrame()# We can use pandas pct_change() method on the 'Adj Close' column to create a column representing this return value.
    for ticker in tickers:
    returns[ticker]=closing_prices_df[ticker].pct_change()*100
    Image for post
    Figure 8: Tail of the returns dataframe to look at daily returns
    图8:返回数据框的尾部以查看每日收益

    Using the dataframe in Figure 8, we can now see how much gain/loss a stock experienced day by day. However, it’s difficult to see the big picture when looking at all these numbers.

    使用图8中的数据框,我们现在可以看到股票每天经历了多少损益。 但是,在查看所有这些数字时很难看到全局。

    Let’s summarize the data and look at the average daily returns. We can do this simply by using the .mean() function.

    让我们汇总数据并查看平均每日收益。 我们可以简单地通过使用.mean()函数来做到这一点。

    Image for post
    Figure 9. Average daily returns for each company
    图9.每个公司的平均每日收益

    In Figure 9, we are looking at the average returns over ~2.5 years. In other words, if you invested in Facebook (FB) 2.5 years ago, you can expect the value of your investments to have grown 0.08% each day.

    在图9中,我们查看了〜2.5年的平均回报。 换句话说,如果您在2.5年前投资了Facebook(FB),则可以预期投资价值每天增长0.08%。

    I encourage you to play with the returns data as it is quite informational. Some examples of things to look at include best and worst single day returns, which I show in this blog.

    我鼓励您使用退货数据,因为它具有参考价值。 我要在此博客中展示的一些例子包括最佳和最差的单日收益。

    Next, let’s take a look at risks. One of the fundamental methods of understanding risk of each stock is through standard deviations on the rate of returns. Let’s calculate the standard deviations of the returns using the code below in Figure 10.

    接下来,让我们看一下风险。 了解每种股票风险的基本方法之一是通过回报率的标准偏差。 让我们使用下面图10中的代码来计算收益率的标准差。

    Image for post
    Figure 10. Standard deviations of returns df
    图10.收益率标准差df

    We can break down the standard deviation information using a distribution plot.

    我们可以使用分布图分解标准差信息。

    # User input ticker of interest
    ticker = “AAL”a = returns[ticker].loc[‘2020–01–03’:’2020–07–01'].dropna()
    b = returns[ticker].loc[‘2019–01–03’:’2019–07–01'].dropna()plt.figure(figsize = (10,7))
    a.plot(kind=’hist’, label=’2020', bins=50, alpha=0.5)
    b.plot(kind=’hist’, label=’2019', bins=12, alpha=0.5)
    plt.title(‘Distribution of ‘ + ticker + ‘ returns’)
    plt.xlabel(‘Daily Returns (%)’)
    plt.legend()
    plt.show()
    Image for post
    Figure 11. American Airline’s (AAL) distributions of the daily returns compared 2019–2020
    图11.美国航空公司(AAL)的2019–2020年日收益率分布

    Now that we’ve looked at both risk and returns, let’s pull them together into one graph.

    既然我们已经研究了风险和回报,那么让我们将它们汇总到一张图中。

    fig = px.scatter(returns, x=returns.mean(), y=returns.std(), text=returns.columns, size_max=60, labels={
    "x": "Daily Expected Returns (%)",
    "y": "Risk",
    },
    title="Stock Risk Vs Returns")
    fig.update_xaxes(zeroline=True, zerolinewidth=2, zerolinecolor='Black')#, range=[-0.005, 0.01])
    fig.update_yaxes(zeroline=True, zerolinewidth=2, zerolinecolor='Black')#, range=[-0.01, 0.1])
    fig.update_traces(textposition='top center')fig.show()
    Image for post
    Figure 12. Risk Versus returns for our companies of interest
    图12.我们感兴趣的公司的风险与回报

    简单移动平均趋势 (Simple Moving Average Trends)

    There are many ways to plot moving averages, but for simplicity, here I use the cufflinks package to do it for me.

    有许多方法可以绘制移动平均线,但为简单起见,在这里,我使用袖扣程序包为我完成此操作。

    # The cufflinks package has useful technical analysis functionality, and we can use .ta_plot(study=’sma’) to create a Simple Moving Averages plot# User input ticker of interest
    ticker = “NFLX”each_df[ticker][‘Adj Close’].ta_plot(study=’sma’,periods=[10])
    Image for post
    Figure 13: A 10-day simple moving average overlaid on NFLX’s closing prices
    图13:NFLX收盘价叠加的10天简单移动平均线

    The moving average smooths out the day-to-day volatility and better displays the underlying trends in a stock price. The higher the time window for the moving average, the clearer the direction of the trend. However, it is also less sensitive to sudden shifts in market dynamics.

    移动平均线可以消除日常波动,并更好地显示股价的潜在趋势。 移动平均线的时间窗口越高,趋势的方向越清晰。 但是,它对市场动态的突然变化也不太敏感。

    You can do a lot with multiple moving averages and comparing them over time. In my other blog, I talk about two trading strategies called the death cross and golden cross.

    您可以对多个移动平均值进行大量处理,并随时间进行比较。 在我的另一个博客中 ,我讨论了两种交易策略,称为死亡交叉和黄金交叉。

    布林带图 (Bollinger Band Plots)

    One of the simplest methods I found to plot Bollinger bands using Python is with the cufflinks package.

    我发现使用Python绘制布林带的最简单方法之一是使用cufflinks软件包。

    # User input ticker of interest
    ticker = "SPY"
    each_df[ticker]['Close'].ta_plot(study='boll', periods=20,boll_std=2)
    Image for post
    Figure 14. Bollinger Band Plot for SPY from 2018–2020
    图14. 2018–2020年SPY的布林带图

    As I write in my other post, “One major use case for Bollinger band plots is to help understand undersold vs. oversold stocks. As a stock’s market price moves closer to the upper band, the stock is perceived to be overbought, and as the price moves closer to the lower band, the stock is more oversold.”

    正如我在另一篇文章中所写的那样,“布林带图的一个主要用例是帮助理解超卖与超卖的股票。 当股票的市场价格接近上限时,该股票被视为超买,而当价格接近下限时,该股票则被超卖。”

    In my opinion, this is the most powerful analytical tool discussed in this article. I would definitely spend time understanding Bollinger bands and how to use them. For an introduction, please refer to this.

    我认为,这是本文讨论的最强大的分析工具。 我一定会花时间了解Bollinger乐队以及如何使用它们。 有关介绍,请参见

    结论 (Conclusion)

    And with those few lines of Python code, you should get a jumpstart in Python financial analysis! This blog was meant to showcase the bare-bones code behind my personal financial analysis project. However, as any data scientist knows, domain knowledge is just as critical to understanding data as the coding behind it. If you have time, I highly encourage you to supplement your understanding of this code with financial fundamentals in my 6-part series.

    使用这几行Python代码,您应该可以快速开始进行Python财务分析! 该博客旨在展示我的个人财务分析项目背后的基本代码。 但是,正如任何数据科学家所知道的那样,领域知识对于理解数据和其背后的编码同样至关重要。 如果您有时间,我强烈建议您在我的6部分系列文章中以财务基础补充您对该代码的理解。

    As I’m learning every day, the power of Python is vast and far-reaching. There are a lot of analyses that we can do in Python due to its ability to process large data quickly. What are some things you would be interested to do or see in Python? Let me know in the comments!

    在我每天学习的过程中,Python的功能是广泛而深远的。 由于Python具有快速处理大数据的能力,因此我们可以进行很多分析。 您可能想在Python中做什么或看到什么? 在评论中让我知道!

    翻译自: https://medium.com/@chan.keith.96/xx-minute-beginners-financial-analysis-in-python-366553b587ae

    python初学者

    展开全文
  • 设计模式初学者系列-观察者模式 摘要 在今天的设计模式系列中我给大家带来了观察者模式,首先我会以一个生动的故事引入观察者模式的应用的场景,然后描述这个场景中出现的问题,最后我们提出观察者模式的...
  • HTML初学者

    2020-11-23 21:23:27
    域名例如http://www.baidu.com(是一种名称 需要用钱 越好记越贵) IP地址xxxxxxxx和域名作用相似 制作网页相关单书名号包裹关键字叫标记,标记分为两类:单标记和双标记(对标记)。re1、charset、src等 在标记...
  • 股票初学笔记

    2021-02-26 16:18:50
    有效市场派 认为市场永远有效,股票价格完全反应公司情况,通过购买几十只几百只股票分 数,管理风险,但对新手并不友好 4.成长投资派 有敏锐的直觉和市场洞察,擅长发现有前景的萌芽状态公司,凭借企业的急剧发 展...
  • 1、股票交易:从建立账户,到查看股指、股价、公司信息、市盈率等,到学着购买,投入了2万块做试验,虽然钱不多,自我感觉还不错。 2、学习了“辉哥奇谭”公号里关于投资理财的所有文章并做了笔记...
  • 购买的音乐甚至可以在区块链本身进行编码,使其成为购买的任何歌曲的云存档。由于收费数额可能很小,订阅和流媒体服务将变得无关紧要。 更进一步,电子书可以安装区块链代码。这些书将以加密的形式流通,而不是...
  • Python物理建模初学者指南

    千次阅读 2017-10-26 02:55:40
    他就是《Python物理建模初学者指南》试读:www.epubit.com.cn/book/detail… 他有多牛,众多世界知名大学教授推荐阅读! 作者更像是耐心的潜水教练,手把手地从零开始教授编程新手,帮助他们克服学习中的障碍,回避...
  • 下面为大家介绍下QR技术分析社区中关于炒股入门初学者基础知识和如何掌握新手炒股入门基础知识。 1、炒股入门初学者基础知识之设目标价位 根据炒股入门初学者基础知识操作周期,有短线中线长线。短线,持有两天三天...
  • 购买的图像由PlargueDoctor设计 作为一个初学者,进入一个新的机器学习项目可能会很困难。 整个过程从选择一个数据集开始,然后,首先研究数据集,以找出哪种机器学习算法类或类型最适合该数据集。 以下是专家入门的...
  • [给初学者的话] IT世界里面,没有一本搞定的「初学者圣经」 http://www.dotblogs.com.tw/mis2000lab/archive/2008/07/14/4490.aspx 这篇文章,是因为我回了太多类似的信件,再也不想重写一次了。 我想:...
  • 对于初学者,尤其是自学者,太多问题可能成为你编程之路上的坎,一不小心就从入门到放弃了。 你需要一个明确的学习目标 很多人会说,我有目标啊,就是要学会编程,然后还要找份高薪的程序员工作。这是一种目标,但...
  • IT初学者在各种系统上安装Python的保姆级指引 Python IDE 安装 PyCharm 的正确姿势以及更新方法 学习基本语法 大致的学习路线是这样的,具体内容可以关注专栏内的其他文章。 我的Python自学之路 4.了解自己的专业...
  • 对于初学者,尤其是自学者,太多问题可能成为你编程之路上的坎,一不小心就从入门到放弃了。 你需要一个明确的学习目标 很多人会说,我有目标啊,就是要学会编程,然后还要找份高薪的程序员工作。这是一种目标,但...
  • 量化交易初学者指南

    2019-02-15 16:28:15
    第一类是试图在基金机构中获得一份作为定量交易工作的个人。第二个是希望尝试建立自己的“零售”算法交易业务的个人。 量化交易是量子金融的一个极其复杂的领域。通过面试或构建自己的交易策略可能需要花费大量...
  • 例如,你可以通过支付澳元来购买欧元,或者你可以通过支付美元购买日元。 货币在外汇交易市场被视为商品。现在你知道什么是外汇交易,但它是不够的,继续下面的了解更多。 外汇交易时间 外汇交易是在周一至周五不...
  • 一、股市的交易规则(在百度百科自行整理的) ...卖出股票时收印花税:成交金额的千分之一。 自2015年8月1日起,深市,沪市股票的买进和卖出都要照成交金额0.02‰收取过户费。 二、名词(名词来自百度百科) 散户:...
  • 在这种情况下,我们可以采用年平均数,但是对于复杂的情况的像预测股票价格,是很难得到一个数字的。所以,我们采取“加权移动平均法”可以对最近的值赋予更高的权重。关于指定权重有很多技巧。指数加权移动平均法是...
  • 苹果三周前发布了Swift。 从那时起,我一直在阅读Swift的官方... 同时,我们正在努力工作,看看我们如何教初学者,帮助社区轻松应对Swift。 两周前,我们介绍了Swift的基础知识。 在接下来的几周内,我们将编写一...
  • 延伸阅读《真实世界的算法:初学者指南》 点击上图了解及购买 转载请联系微信:DoctorData 推荐语:学习算法的启蒙读本,算法尽量简单,避免读者有挫败感,仅需基本数学基础和计算机常识知识。通过真实世界需要解决...
  • app窃取用户隐私Below is a quick rationale of why we need to take these steps, followed by the first 8 steps you can take to take your privacy back for good! 以下是我们为什么需要采取这些步骤的简要说明 ...
  • 因此,了解这些关键术语将有助于初学者驾驭常常令人困惑的区块链世界。 以下是关键术语列表: Alcoins altcoin这个词来源于关键术语“比特币”和“替代品”的融合。因此,它指的是比特币以外的任何数字资产...
  • 然而,分布式技术涉及的方面(存储、计算、框架、中间件等)是如此之多,且迄今为止尚未见到一本书对其进行概括和梳理,要想对分布式技术有全面的了解,特别是对初学者而言,何其难哉! 如今初学者再不用学习分布式...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,993
精华内容 797
关键字:

初学者如何买股票