精华内容
下载资源
问答
  • watson-nao-robot:通过与IBM Watson Assistant服务和IBM Watson Studio集成使用机器人来回答对财务数据的查询
  • 如何利用Watson Analytics进行数据探索

    千次阅读 2016-06-01 15:15:30
    本期主要讲解如何使用Watson Analytics进行数据探索,以及介绍Watson Analytics的具体功能。

    引言

    本文内容正式开始之前,先插播一则新闻。Watson Analytics的新版本v2已经正式发布上线了。大家可以通过本文最后的试用链接进行注册试用。值得注意的是,新版本除了和以前一样提供免费版试用之外,还提供了专业版的30天试用许可。Watson Analytics专业版允许接入更多种类的数据源,处理更大量的数据,使用更大的存储空间,还可以连接社交媒体数据等等。欢迎有兴趣的朋友来尝鲜。

    上期文章《如何使用Watson Analytics获取更优质的数据》告诉大家,Watson Analytics可以自动获取数据,并对数据质量评分,便于用户轻松评估数据质量,并进行数据优化。本期文章我们会介绍,如何利用这些经过优化的数据,更快速、自动化地进行数据探索,以便更敏捷的获取业务价值。

    数据探索到业务洞察

    Watson Analytics是一款基于云平台的自动化智能数据探索工具,它可以快速开启您的数据探索之旅。它的智能自动化分析能力能够助您加速获得您关注的业务问题的答案。它还可以帮您以故事的形式将分析洞察呈献出来。较之业界以往其它的分析工具,都需要通过手工数据加工、处理来获得分析洞察的方法,您现在可以完全将注意力放在业务理解及与同伴有效协作、沟通之上,数据加工、图形展示、可视化呈献的事情完全交给Watson Analytics来做就好。甚至,您只需要以自然语言的方式简单输入您的业务问题,Watson Analytics就会立即以可视化的综合分析结果来阐述业务问题的答案了。当然,您还可以在这些页面上进行交互操作,调整您的分析展现,获得最终的业务问题分析结论。

    • Watson Analytics可以自动分析您的数据,并以提问的方式供用户选择。
    • 您可以使用自然语言提出您关于数据的问题。
    • 您可以基于已有的分析结果进行深入探索,挖掘更多的业务洞察。

    这里给大家提供一个Watson Analytics试用版,有兴趣的朋友可以试试!

    示例体验

    下面我们通过一个实际的例子体会Watson Analytics的数据探索能力。

    1. 登录Watson Analytics(您可以通过本文最后章节的试用链接注册,并得到免费试用版本)。

    2. 加载数据。

    这次我们还是选择上期文章使用的数据集American Time Use Survey data set。这是来自美国劳工部的关于美国劳工时间使用统计的一个数据集。

    如下图所示,红框中的图标即是已经加载的数据。我们可以看到系统对这个数据集的综合评分为62分。

    watson analytics

    3. 创建数据探索。

    单击上图红框中的数据集,可以看到:

    watson analytics

    您可以看到下方的红框内,系统自动分析出一些分析结果供用户参考。比如按年度分析不同种类工时的发展趋势,按年份、工作状态的分析劳工小孩的个数、年龄范围的决定因素等等。这些业务问题在您提问之前就已经由Watson Analytics准备好并放在您眼前了。

    您可以通过点击您关心的业务问题,以全屏方式展现分析结果。例如我们点击第二个业务主题“按年和雇员的雇佣状态分析小孩的个数”。如下图所示。

    watson analytics

    上图红色方框内的条件都是可以修改的,便于分析人员根据自己的分析思路探索问题的答案。从上图我们可以观察到无业人员拥有小孩的个数要多于在职人员。

    现在,我们还可以对这个分析图形进行调整,比如我把统计日期限定在2012年,只需要将下方的数据里的Year字段对2012过滤即可。然后我们将雇员状态修改为年龄段(Age Range),则可以得到下图。

    watson analytics

    显然,我们发现,美国人在20岁之前及30~39之前的小孩子是最多的,特别是20岁之前。看来美国人还真是生小孩比较早。

    同时,Watson Analytics还提供了自然语言输入对话框,以帮助您向数据提问。简单输入一个问题就会生成一系列分析图表供您选择。如下图所示,我首先单击图中的“+”号新建了一个数据探索页面,并在对话输入框内输入:How do the values of Children compare by Age?则可以得到下面的柱状图形。由下图可知,美国人在15、6岁时拥有的小孩数量最多,平均约有2个小孩。看来美国人早婚早育的情况比较常见。

    watson analytics

    为了便于业务人员更加灵活的进行数据探索,Watson Analytics除了提供推荐的可视化图形之外,还提供了多种可视化图形供用户选择,包括比较流行的气泡图、树图、标签云、决策树、刻度盘、热图、地图、网络图、螺旋图等等。

    watson analytics

    并且对每种可视化图形,系统也提供了更为精细的图形选项供用户定制。

    watson analytics

    待分析页面设计完成后,单击页面右上角的分享图标,就可以通过下图中的几种方式将分析页面共享给其它同伴了。您可以通过电子邮件、下载、Tweet、链接等方式进行结果的分享。

    watson analytics

    您也可以将您的分析页面保存到云端,以备下次分析察看使用。

    watson analytics

    看过我们上期文章的朋友,一定记得如何对数据进行优化。其实我们在这个新版本里,在数据探索的同一页面内,也可以进行数据优化操作了。如下图所示。

    watson analytics

    结束语

    心动不如行动!感兴趣的朋友可以体验一下Watson Analytics的魅力吧。

    展开全文
  • IBM正试图让自己的Watson Data Platform的数据访问更容易,以便让那些基于人工智能的应用使用该平台。 IBM表示,Watson中增加新的数据编目和精炼功能,将让开发者和数据科学家更容易为AI应用准备数据和分析数据。新...

    IBM正试图让自己的Watson Data Platform的数据访问更容易,以便让那些基于人工智能的应用使用该平台。

    IBM表示,Watson中增加新的数据编目和精炼功能,将让开发者和数据科学家更容易为AI应用准备数据和分析数据。新功能让用户可以更容易跨公有云和私有云连接和分享数据,这也是IBM扩展其数据治理产品的举措之一。

    IBM Watson Data Platform是一款基于云的服务,集成了各种工具帮助数据科学家和其他人从他们的数据中获得智能,访问AI、分析和机器学习服务。

    这次公布的Data Catalog和Data Refinery工具可以帮助将不同格式、不同位置(例如云或者本地环境中)的数据聚合到一起,用户可以访问到这些数据。此外这些工具还可用于清理这些数据,让基于AI的应用可以使用这些数据。其他特点还包括能够利用元数据标记和执行数据治理策略,确保数据的安全性。

    IBM还宣布提供Analytics Engine,可将数据存储与其中保存的信息分离开,把数据更快速地输送给AI应用。IBM表示,这些新功能将有助于打消AI应用开发者面临的主要障碍之一,也就是让保存在不同位置的复杂数据变得有意义。

    更好的数据治理

    对于那些正在应对数据量快速增长的企业来说,数据治理已经成为一个日益严重的问题。IBM正在通过扩展Unified Governance Platform来解决这个需求,该平台让企业组织能够更容易找到数据和分类数据。InfoSphere Information Server现在提供了对Unified Governance Catalog的单一视图,被用于定义通用数据描述。此外,IBM还更新了用于表和元数据服务的Datastage Designer工具,增加识别和建议使用模式的方法。

    新推出的Analytical_master Data Management工具提供的自助式服务可用于动态可视化、探索和关联数据源。一个名为域“同意管理”主要针对需要符合将在明年5月生效的欧盟“通用数据保护条例”(GDPR)的企业。用户可以查看和管理在GDPR要求中定义的各种许可过程。

    IBM还升级了Industry Data Models,主要是考虑到了GDPR条例。这些预先设计的业务和技术数据模型可用于围绕已经识别的数据加快商业智能应用的开发。这次增加了对GDPR域专有条款的支持,此外还有行业专用词汇索引,以填补监管机构和垂直行业之间在语言上的差距。

    IBM Watson Data Platform总经理Derek Schoettle表示:“人工智能的关键是从强大的数据基础开始的,这将流入数据的量和速度挑战转变为一种资产。对于那些利用人工智能创新和竞争的企业来说,他们需要一种方法来掌握和组织各个来源的数据,将这种复杂数据索引作为每个决策和项目的支柱。”





    本文出处:畅享网
    本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
    展开全文
  • 使用Watson数据平台预测客户流失
  • 机器学习和深度学习是当今数据科学最为前沿的技术,使用开源的人工智能开发框架和成熟的企业级建模工具是现代数据科学家的基本技能。本实战课程通过一个详细的动手实验帮助你使用IBM Watson Studio构建一个银行业中...
  • 该存储库包含可用于我们的各种服务的示例数据。 这些示例演示了不同功能的使用。 服务 Watson Assistant公共云服务功能 您可以将JSON文件作为技能导入。 该技能说明了以下功能: 云功能:了解如何通过对话框节点...
  • 使用Wattson生成数据格式的见解:我们如何处理docx,pdf等不同格式的数据,并生成与数据库中的结构化数据链接的见解?这种模式有助于在结构化和非结构化数据之间建立关系使用Watson NLU和Watson Studio生成建议
  • 本期主要讲解如何使用Watson Analytics获取更优质的数据,以及介绍Watson Analytics的具体功能。

    引言

    上期文章《互联网时代,人人均可开启自助分析之旅》给大家简单介绍了Watson Analytics及其相关特点。接下来几期文章将为大家一一介绍Watson Analytics的具体功能。

    我们知道,Watson Analytics能够提供自动数据获取、数据探索、讲故事及向导式的预测分析功能,它能帮助无IT经验的业务用户不论何时何地,都可以从自己的数据集中找到业务问题的答案。

    Watson Analytics的确是大数据分析领域的一次革命:

    • 它所有操作完全无需IT人员协助就可完成,让业务人员专注于业务问题的解决。
    • 它融合了数据可视化、商业智能、数据挖掘、自然语言交互、数据抽取转换加载等各项先进技术。
    • 它基于云平台为业务用户提供了一站式的、统一的数据分析体验。

    这里给大家提供一个Watson Analytics试用版,有兴趣的朋友可以试试!

    使用Watson Analytics进行数据分析的过程如下图所示。

    Watson Analytics

    获取更优质的数据

    Watson Analytics嵌入式的数据管理服务包括数据访问、数据优化和数据管理。基于云平台的数据管理服务能够自动搜索、获取并优化数据集,完成所有这些工作仅仅需要您点击按钮即可实现。并且,它使用了最新的列式存储、内存计算的技术来轻松应对海量的数据集。Watson Analytics也能够对已加载数据的数据质量进行评分,突出显示那些可能危害分析结果的潜在的数据问题。这些能力对您意味着什么呢?基本上您不再需要担心数据质量问题了。实际上,Watson Analytics就是用来分析那些您认为已经准备好的数据。依靠自动化处理与内置的数据优化服务,您可以得到最佳状态的数据并更好的理解它们。不论您身处市场、销售、IT、运营、人力资源,或者财务等部门,有了高质量可信的数据,接下来的数据分析工作就将得心应手了。

    示例体验

    下面我们通过一个实际的例子体会Watson Analytics的这一能力。

    1. 登录Watson Analytics(您可以通过本文最后章节的试用链接注册,并得到免费试用版本)。

    2. 加载数据。

    单击下图中的“Add”图标添加需要分析的数据。

    Watson Analytics

    在出现的窗口中,有三种方式添加数据。分别是通过拖拽方式、选择上传文件、选择示例数据。如下图所示。如果您使用的是个人版、专业版等其它版本的Watson Analytics,您还可以连接其它数据源获取数据,如:关系型数据库、Cognos报表、Twitter、DropBox、Box、OneDrive等等。

    Watson Analytics

    这里我们选择第3项Sample data,我们选择了American Time Use Survey data set。这是来自美国劳工部的关于美国劳工时间使用统计的一个数据集。单击上传按钮“Upload”。如下图所示。

    Watson Analytics

    接下来,Watson Analytics会选取对应的数据文件加载到云端的数据库,并进行转换、数据质量评分,完成后以图标方式列在主页面上。如下图所示红框中的图标即是已经加载的数据。我们可以看到系统对这个数据集的综合评分为62分。

    Watson Analytics

    3. 优化数据。

    单击上图红框中的数据集,将出现下图中的浮动窗口,单击“Refine”图标。

    Watson Analytics

    您将看到刚刚加载的数据集的详细数据质量情况。如下图所示。

    Watson Analytics

    您可以单击左侧菜单栏里的“Action”图标对数据集中的已有的数据列进行筛选;对某个数据列也可以编辑它的类型,并进行数据过滤,数据清洗,数值类型数据可以修改汇总的方法;也可以通过计算、分组、建立层级的方式创建新的数据列。如下图所示。

    Watson Analytics

    您也可以单击左侧菜单栏里的“Data Metrics”图标来查看数据集中的数据列的数据质量评分。系统将以图形方式显示数据列的评分及该列的数据分布情况。您可以通过点击“Action”按钮来调整优化数据,来提高数据质量。如下图所示。

    Watson Analytics

    最后,您可以单击页面左上方的保存图标保存已经修改的数据。如下图所示。

    Watson Analytics

    可想而知,接下来的数据探索和预测分析结果就将更加准确了。

    结束语

    心动不如行动!感兴趣的朋友可以体验一下Watson Analytics的魅力。


    展开全文
  • Watson, Introduction to Econometrics: data sets 詹姆斯·H·斯托克 马克·W·沃森. 计量经济学. 数据集 学生资源 https://wps.pearsoned.com/aw_stock_ie_3/178/45691/11696965.cw/index.html Third Edition or ...

    James H. Stock and Mark W. Watson, Introduction to Econometrics: data sets
    詹姆斯·H·斯托克 马克·W·沃森. 计量经济学. 数据集

    学生资源

    https://wps.pearsoned.com/aw_stock_ie_3/178/45691/11696965.cw/index.html

    Third Edition or Third Edition Update

    Data for Empirical Exercises and Test Bank

    STATA 数据集

    Each of these data sets is readable by Stata over the Web. You need only copy the line given below each dataset into your Stata command window or Stata do-file. After loading the data into Stata, use save to make a copy of the data on your own machine if you wish. The link from each dataset’s name gives you the codebook of variable names and definitions. Please report any problems accessing these data to baum.

    • CASCHOOL: N=420, panel data on test performance, school characteristics and student demographic backgrounds for California school districts, 1998-1999.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/caschool
    • CIG_CH10: N=96, Panel data, annual per capita cigarette sales for 48 states in packs per fiscal year in 1985 and 1995, only.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/cig_ch10
    • CIG85_95: N=528, Panel data, annual per capita cigarette sales for 48 states in packs per fiscal year from 1985-1995.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/cig85_95
    • CPS_CH3: N=11130, Panel data: the Current Population Survey (CPS) provides data on labor force characteristics of the population, 1992-1998.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/cps_ch3
    • FATALITY: N=336, Panel data, number of state traffic fatalities for 48 states, 1982-1988.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/fatality
    • HMDA_AER: N=2925, Cross-sectional data, mortgage applications made in 1990 in the greater Boston metropolitan area.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/hmda_aer
    • HMDA_SW: N=2380, Cross-sectional data, mortgage applications made in 1990 in the greater Boston metropolitan area using a subset of the original dataset.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/hmda_sw
    • JOURNALS: N=180, Cross-sectional data on 180 economics journals for the year 2000.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/journals
    • OJ: N=642, Time-series data on frozen and finished Florida orange juice prices, 1948-2001.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/oj
    • MACRODAT: N=168, Time-series macroeconomic data.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/macrodat
    • MCAS: N=220, Cross-sectional data, district-wide averages for Mass. public elementary school districts in 1998.
      use http://fmwww.bc.edu/ec-p/data/stockwatson/mcas
      STAR_SW(http://fmwww.bc.edu/ec-p/data/stockwatson/STAR_SW.des): N=11598, Subset of the variables in WEBSTAR.
      use http://fmwww.bc.edu/ec-p/data/stockwwatson/star_sw
    • WEBSTAR: N=11598, Panel data on test scores, treatment groups, and student and teacher characteristics for four years (1985-86 to 1988-89).
      use http://fmwww.bc.edu/ec-p/data/stockwatson/webstar
    展开全文
  • IBM周一宣布推出一款新的、由Watson支持的云服务,这次推出的这项服务计划分析视频元数据。National Association of Broadcasters Show(国家广播电视节目协会)宣布这项服务应该能够帮助内容提供商和广告商找到吸引...
  • 在此代码模式中,您将自己的数据上传到Watson Discovery Service。 然后,您将配置一个Web应用程序,以便它可以查询您创建的数据收集。 该网络应用程序允许您浏览该数据。 完成此代码模式后,您将知道如何: 使用...
  • 现在就让我们来一探Watson的内貌,来看看医疗如何受益于Watson以及在此过程中都会使用什么样的数据。 本周的全球Watson(WoW)活动再次将Watson推至聚光灯下,本次活动的参加者来自110多个国家。如果数字能打动用户...
  • Pearson是这样描述Watson数据处理过程的:"当Watson启动时,其15TB的RAM都会被装载,此后,DeepQA(IBM的智能分析软件)进程从 内存 载入。IBM Research表示,在实际应用的数据总量中(分析和索引数据,知识库等)...
  • IBM Watson Explorer 是 IBM 认知技术最核心的一款产品。认知技术的核心是非结构化数据的处理能力。所以先来讨论一下非结构化数据的相关概念。结构化、半结构化、非结构化数据在我们和计算机打交道的过程中,会遇到...
  • IBM Watson 提供了各种各样的、即时可用、可定制的 AI 服务,旨在从非结构化数据中提取洞察。企业可以利用这些洞察来改进各种业务目标:改善客户服务;理解客户交流中的情感或语气;以及对客户体验进行个性化。今天...
  • Pearson是这样描述Watson数据处理过程的:"当Watson启动时,其15TB的RAM都会被 装载,此后,DeepQA(IBM的智能分析软件)进程从内存载入。IBM Research表示,在实际应用的数据总量中(分析和索引数据,知识库等)...
  • 在该项目中,该项目是Udacity纳米程序的一部分,研究了四种不同的针对IBM Watson Studio平台上的真实数据的推荐系统: 基于排名的推荐。 基于用户-用户的协作过滤。 基于内容的建议。 矩阵分解。 包装 该项目是...
  • 近日,IBM公布了一系列Watson技术,包含机器学习、数据平台、虚拟代理的会话工具,并把Watson更多地同MobileFirst for iOS应用程序以及教育工具进行集成,以促进认知计算生态系统的发展。 目前,IBM在拉斯维加斯...
  • 使用专门的域数据创建自定义的Watson Speech to Text模型 在此代码模式中,我们将创建一个自定义语音到文本模型。 Watson Speech to Text服务在业内是最佳的。 但是,像其他Cloud语音服务一样,它是使用通用会话语音...
  • 数据分析解决方案——适用于各种规模的企业、源自 Watson 的分析解
  • (许野平的 Watson Explorer 笔记)创建集合后,可以看到如下界面:我们可以看到三个面板:1-搜寻与导入;2-解析和索引;3-搜索和内容分析。本练习讨论搜寻器的创建和配置,以及如何导入数据。“搜寻器”的英文是 ...
  • IBM Watson IoT

    2019-04-02 09:02:12
    IBM Watson IoT 原文链接:...Watson IoT Platform 提供对 IoT 设备和数据的强大应用程序访问,可快速编写分析应用程序、可视化仪表板和移动 IoT 应用程序。 Watson Io...
  • IBM Watson OpenScale教程 SDK详细信息: 其他资源: IBM云 教程1:使用Watson Machine Learning引擎 步骤1:使用Watson OpenScale创建信用风险预测模型,将其部署为Web服务并进行监视- 教程2:使用Azure Machine ...
  • IBM将在IBM Cloud Private for Data之上提供这些本地Watson服务, IBM Cloud Private for Data是可在Kubernetes上部署的组合分析和数据治理平台。 IBM Watson的首席技术官兼首席架构师Ruchir Pur...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 491
精华内容 196
关键字:

watson数据