精华内容
下载资源
问答
  • AWS宣布推出AWS Trainium,这是...据MIT的一份报告指出,机器学习的相关研究很可能正在接近计算的极限。OpenAI 花费了1200万美元来训练它的 GPT-3语言模型,谷歌花费了大约6912美元来训练BERT。 AWS可能要提供更高的

    AWS宣布推出AWS Trainium,这是专门用于训练机器学习模型的下一代定制芯片,同时AWS还承诺通过对 TensorFlow、 PyTorch 和 MXNet 的支持,可以提供比任何竞争对手更高的云服务性能。

    一直以来,机器学习都受到大大小小的限制。
    模型的大小、速度以及昂贵的硬件,都是难以突破的瓶颈。
    据MIT的一份报告指出,机器学习的相关研究很可能正在接近计算的极限。OpenAI 花费了1200万美元来训练它的 GPT-3语言模型,谷歌花费了大约6912美元来训练BERT。

    AWS可能要提供更高的性价比。

    在昨日的re:Invent开发者大会上,AWS发布了其设计的第二款定制的机器学习芯片–AWS Trainium。该公司承诺,它可以提供比云端任何竞争对手更高的性能,同时也支持 TensorFlow、PyTorch 和 MXNet等。

    除了提供最具性价比的机器学习训练方案之外,Trainium 还提供了最高性能的计算能力 ,并支持更广泛的机器学习应用。

    新一代定制芯片AWS Trainium,让模型推理成本再降45%

    这款定制芯片的主要优势是速度和成本,AWS 承诺与标准 AWS GPU 实例相比,吞吐量提高30% ,每次推断的成本降低45% 。

    Trainium 这款芯片还专门针对深度学习训练工作负载进行了优化,包括图像分类、语义搜索、翻译、语音识别、自然语言处理和推荐引擎等。它将以EC2(亚马逊弹性计算云)实例的形式出现在亚马逊的机器学习平台 SageMaker 中,基于这些定制芯片的新实例将于明年正式推出。

    随着机器学习领域的加速进展,迫切需要提高性能,降低由推理和训练驱动的基础设施成本。就在去年,AWS 推出了AWS Inferentia,为客户提供低成本高性能的机器学习推理能力。虽然 Inferentia 解决了推理的成本,但许多开发团队还是受到固定的机器学习训练预算的限制。

    这就限制了改进其模型和应用所需的训练的范围和频率。而新发布的 AWS Trainium 通过为云端机器学习训练提供最高的性能和最低的成本来应对这一挑战。

    AWS Trainium 与 AWS Inferentia 有着相同的AWS Neuron SDK,这使得使用 Inferentia 的开发者可以很容易地开始使用 Trainium。

    因为 Neuron SDK 集成了流行的机器学习框架,包括 TensorFlow、 PyTorch 和 MXNet,开发人员可以轻松地从基于GPU的实例迁移到 AWS Trainium,代码更改很少。

    AWS Trainium 将通过 Amazon EC2实例和 AWS 深度学习 AMIs 以及管理服务(包括 Amazon SageMaker、 Amazon ECS、 EKS 和 AWS Batch)提供。

    不过,由于没有基准测试,目前尚不清楚 Trainium 与谷歌的TPU进行比较结果如何。

    谷歌最近也表示,在其即将推出的第四代TPU上,矩阵乘法(矩阵通常被用来表示输入人工智能模型的信息)运算速度将是第三代TPU的两倍以上,同时受益于互连技术的进步,它还提供了一个显著增强的内存带宽。

    此外,AWS 也正与英特尔合作,推出基于 Habana Gaudi 的 EC2实例,用于机器学习训练。

    明年起,这些实例也将有望提供比当前基于GPU的机器学习EC2实例高出40%的性价比,同时这些芯片也将支持 TensorFlow 和 PyTorch。这些都将于2021年上半年在 AWS 云中首次亮相。

    AWS全球首推基于Mac Mini的EC2计算实例,可在云端运行MacOS

    从今天开始,基于 Mac 操作系统的 Mac Amazon EC2 实例已经正式启用!

    通过基于Mac mini,EC2 Mac实例首次使用户能够在 AWS 云中运行macOS,从而将 AWS 的灵活性、可扩展性和成本效益扩展到所有苹果开发人员。

    通过 EC2 Mac 实例,为 iPhone、 iPad、 Mac、 Apple Watch、 Apple TV 和 Safari 开发应用程序的开发人员现在可以在几分钟内访问 macOS 环境,并根据需要动态扩展容量。

    时至今日,已经有数以百万计的苹果开发者依靠 macOS 及其创新的工具、框架和 API 为苹果开发、构建、测试各种应用程序,这些平台在全球范围内服务超过10亿用户。

    通过 EC2 Mac 实例,开发者现在可以利用 AWS 的灵活性、弹性的优势,更多地关注核心创新,比如开发有创意和实用的应用程序,进而减少在基础设施管理上的花费。

    EC2 Mac 实例由 Mac mini 提供支持:采用 Intel 的第8代3.2 GHz (4.6 GHz turbo) Core i7处理器、6个物理/12逻辑核心和32GB内存,以及 AWS Nitro System,通过高速 Thunderbolt 3连接提供高达10gbps 的 VPC 网络带宽和8gbps 的 EBS 存储带宽。

    亚马逊 EC2 Mac 实例由 AWS Nitro System 独一无二地启用,,支持 macOS Mojave 10.14和 macOS Catalina 10.15,不久后将支持 macOS Big Sur 11.0。

    用户还可以通过 SSH 连接到 Mac 实例,通过 SSH 连接到命令行界面,通过 VNC 客户端共享活动远程屏幕,获得图形界面。

    EC2 Mac 实例的可用性也将管理基础设施的重担给了 AWS,这意味着苹果开发人员可以完全专注于开发优秀的应用程序。

    AWS发言人在接受采访时说,这些实例是在裸机上运行的,意味着开发人员将获得Mac的全部功能,而不是由虚拟机提供的功能。

    AWS 还透露,配备苹果基于M1 ARM芯片的Mac Mini实例将于2021年上市。

    EC2 Mac实例现已在美国东部(弗吉尼亚北部)、美国东部(俄亥俄州),美国西部(俄勒冈州)、欧洲(爱尔兰)和亚太(新加坡)等地区提供预览版,很快会覆盖其他地区。

    用户可以选择根据需要为实例付费,如果打算经常使用实例,也可以选择节约资金的方案。

    是不是很期待?

    展开全文
  • 在启动运行在Arm芯片云服务器三天后,AWS宣布,它还设计了自己处理器,用于机器学习应用程序中推理。周三上午,在拉斯维加斯举行云计算巨头AWS年度大会上,AWS首席执行官安迪•雅西(Andy Jassy)在主题...

    在启动运行在Arm芯片上的云服务器的三天后,AWS宣布,它还设计了自己的处理器,用于机器学习应用程序中的推理。周三上午,在拉斯维加斯举行的云计算巨头AWS年度大会上,AWS首席执行官安迪•雅西(Andy Jassy)在主题演讲中宣布了这款名为“AWS Inferentia”的推理芯片。

    AWS的竞争对手谷歌云在2016年发布了其首款定制机器学习芯片张量处理单元。谷歌说,到那时,它已经在数据中心运行TPU大约一年了。

    谷歌目前是第三代TPU,它一直以云服务的形式提供给客户。亚马逊在云计算市场的最大竞争对手微软Azure尚未推出自己的处理器。这三家公司都使用Nvidia GPU作为机器学习工作负载加速服务;AWS和Azure也为机器学习提供FPGA。

    与亚马逊定制的Arm处理器一样,Inferentia也是在安纳普尔纳(Annapurna)工程师的帮助下设计的,这家以色列初创公司于2015年被亚马逊收购。

    AWS计划向客户提供Inferentia,但它将与谷歌提供的产品非常不同。与为训练机器学习模型而设计的TPU不同,推论是为推理而设计的,推理是一个系统在经过训练后所做的决策。这是在模特经过成千上万张带有标签的猫咪照片的训练后,识别图片中猫的部分。

    Jassy称,制造机器学习加速器处理器的公司——最大的是英伟达(Nvidia)——将大部分注意力放在优化处理器以进行培训上。这就是为什么AWS决定专注于设计更好的推理芯片。

    他没有透露任何有关该芯片设计或性能的细节,也没有透露该芯片将于何时上市。该公司在其网站上表示,每个推理芯片“提供了数百个top (tera运算每秒)的推理吞吐量……为了获得更高的性能,多个AWS推理芯片可以一起驱动数千个top的吞吐量。”

    Jassy说:“它可以在所有EC2实例类型上使用,也可以在SageMaker中使用,并且可以通过弹性推理来使用它。”SageMaker是一个AWS管理的服务,用于构建和培训机器学习模型。

    Jassy周三宣布,弹性推理是AWS的一个新特性。它使用户能够根据需要自动伸缩部署在云中的推理处理器容量。

    P3实例是亚马逊云上最流行的机器学习实例。如果没有它,用户必须为峰值需求提供足够的P3容量,在系统不在峰值运行时为未使用的容量付费。

    Jassy说,这导致P3实例上gpu的平均利用率为10%到30%。

    弹性推断可以附加到AWS中的任何EC2实例上,并根据需要进行伸缩,这可能为用户节省很多钱。Jassy说,它可以检测用户使用的机器学习框架,找到最能从硬件加速中获益的部件,并自动将它们转移到加速器上。

    目前,这款加速器将是一款Nvidia GPU。根据Jassy的说法,一旦Amazon添加了Inferentia选项,它希望自己的芯片能够比使用弹性推理的gpu带来额外的“10倍”成本改善。

    展开全文
  • GOOGLE开发自己的加速机器学习的芯片已经不是什么秘密了,最先发布出来的是TPU(Tensor Processing Units),在2016年5月I/O开发大会上发布的,但是没有公布相关的细节情况,只是说T ensorFlow框架在上面运行机器...

    GOOGLE开发自己的加速机器学习的芯片已经不是什么秘密了,最先发布出来的是TPU(Tensor Processing Units),在2016年5月I/O开发大会上发布的,但是没有公布相关的细节情况,只是说T ensorFlow框架在上面运行机器学习算法可以优化运行。今天,GOOGLE第一次把这些项目的细节和评判标准公布出来。

    论文下载地址:

    http://download.csdn.net/detail/caimouse/9804927






    1. TensorFlow API攻略

    2. TensorFlow入门基本教程

    3. C++标准模板库从入门到精通 

    4.跟老菜鸟学C++

    5. 跟老菜鸟学python

    6. 在VC2015里学会使用tinyxml库

    7. 在Windows下SVN的版本管理与实战 

     http://edu.csdn.net/course/detail/2579

    8.Visual Studio 2015开发C++程序的基本使用 

    http://edu.csdn.net/course/detail/2570

    9.在VC2015里使用protobuf协议

    10.在VC2015里学会使用MySQL数据库


    展开全文
  • GOOGLE开发自己的加速机器学习的芯片已经不是什么秘密了,最先发布出来的是TPU(Tensor Processing Units)。在2016年5月I/O开发大会上发布的,可是没有发布相关的细节情况。仅仅是说T ensorFlow框架在上面执行机器...

    GOOGLE开发自己的加速机器学习的芯片已经不是什么秘密了,最先发布出来的是TPU(Tensor Processing Units)。在2016年5月I/O开发大会上发布的,可是没有发布相关的细节情况。仅仅是说T ensorFlow框架在上面执行机器学习算法能够优化执行。今天,GOOGLE第一次把这些项目的细节和评判标准发布出来。

    论文下载地址:

    http://download.csdn.net/detail/caimouse/9804927






    1. TensorFlow API攻略

    2. TensorFlow入门基本教程

    3. C++标准模板库从入门到精通 

    4.跟老菜鸟学C++

    5. 跟老菜鸟学python

    6. 在VC2015里学会使用tinyxml库

    7. 在Windows下SVN的版本号管理与实战 

     http://edu.csdn.net/course/detail/2579

    8.Visual Studio 2015开发C++程序的基本使用 

    http://edu.csdn.net/course/detail/2570

    9.在VC2015里使用protobuf协议

    10.在VC2015里学会使用MySQL数据库


    展开全文
  • 在该操作系统下一个重大更新中,开发者们将能够在他们 Windows 应用中使用预先训练好的机器学习模型。与此同时,英特尔也宣布了面向 Windows ML 平台 Movidius Myriad X VPU 。在处理人工智能相关负载时,它...
  • 基于macOS M1芯片的机器学习环境搭建 1.安装mini-foge https://github.com/conda-forge/miniforge/ 如图下载最新支持M1芯片的版本 下载后应该在Downloads文件夹,打开终端,输入如下命令: cd Downloads bash ...
  • 机器学习/深度学习/人工智能(ML/DL/AI) 需要筛选越来越多数据,通过自动化来识别复杂模式、异常情况以及找到适当位置。来了解设备如何对真实事件和刺激作出反应,以及如何优化未来设备。下面跟朗锐智科...
  • 如何构建未来的机器学习加速芯片? Google大脑负责人Jeff Dean是最有资格回答这个问题人之一。昨天,还是在NIPS大会期间,Jeff Dean详细介绍了Google在AI芯片方面最新研究。 以下是Jeff Dean最新演讲...
  • 这两年,随着机器学习技术火热,人们发现,用 GPU 来进行 ML 模型训练也是一种比较好做法,速度更快,性能更强。然而毕竟 GPU 诞生本意就是用于处理计算机图像,并非「AI」专用,那么有没有专供机器学习.....
  • | 无明编辑 | Debra AI 前线导读:近日谷歌 TensorFlow 团队深度学习工程师 Pete Warden 发表了一篇博文,详细阐述了微型化是机器学习应用未来的发展方向,并且相信机器学习可以在微小的、低功耗的芯片上运行,利用...
  • 会议透露,阿里巴巴正在启动一项代号“NASA”计划,面向未来20年组建强大独立研发部门,建立新机制体制,为服务20亿人新经济体储备核心科技。 阿里巴巴集团董事局主席马云表示,阿里巴巴未来20年愿景是...
  • AI芯片(IC和IP) 编辑 (Linkedin) 欢迎来到我微信博客 最新更新 添加新闻。 添加新闻。 添加。 添加新闻 。 添加新闻。 添加新闻。 添加启动 。 增加新闻 。 添加新闻。 添加消息。 将链接添加到 ...
  • Azeem请我在CogX上做一次演讲,并且希望我集中讨论希望观众领悟一个点。几年前我工作重点就是让人们相信深度学习是一次真正革命,而不是一时热潮,但是不断涌现...
  • Google:机器学习芯片让AI更快更高效

    千次阅读 2017-11-01 17:03:09
    原文:Google Says Machine Learning ...摘要:作者介绍了Google专用机器学习芯片TPU,从TPU诞生,TPU作用,TPU与CPU和GPU比较,以及Google推出TPU目的等方面做了阐述,以下是译文。Google最近对外公布了其专
  • 剑桥科技巨头Arm公司已经推出了Project Trillium——一套Arm IP,包括新高度可扩展处理器,以提供增强的机器学习(ML)和神经网络(NN)功能。 Arm公司是专门从事基于RISC 技术芯片设计开发公司,同时也是全球...
  • 硅谷创业公司Cerebras Systems周一推出了世界上最大的专为AI设计的芯片。Cerebras首席执行官兼联合创始人Andrew Feldman与ZDNet讨论了深度学习网络培训的一些含义。 你可能听说过,周一,硅谷创业公司Cerebras ...
  • 高通公司推出了多项计划以进一步推动智能互联汽车领域发展,包括使用高通Snapdragon 820A为下一代大众信息娱乐系统提供动力,宣布在德国进行Cellular V2X试验,揭示出一种新高端带宽千兆LTE用于车辆,并演示...
  • 选自:forbes 编译:网易智能 参与:nariiy在商业软件中,电脑芯片已被遗忘。对于商业应用程序来说,这是一种商品。由于机器人技术与个人硬件设备联系更为紧密,因而...
  • IBM在博客中一篇文章中指出,通过使用基于相变存储器(Phase-Change Memory,简称PCM)模拟芯片机器学习可以加速一千倍。 相变存储器基于硫化物玻璃材料,这种材料在施加合适电流时会将其相从晶态变为非...
  • 本文来自AI新媒体量子位(QbitAI) 这是一个急速变化但又有很强发展衔接性时代。...这份报告中,德勤预测了增强现实(AR)、智能手机、AI芯片机器学习、互联网、数字传媒等领域在2018年...
  • Elias Fallon是行业领先电子设计自动化...他指出,半导体芯片及其周边系统设计下一个飞跃将来自EDA计算软件工具流程融合,以及更大规模的机器学习/深度学习(DL)技术和多核计算应用。当前人工智能和机器学习
  • 海外行业报告 | 行业动态研究 人工智能芯片行业点评 证券研究报告 2018 年02 月13 日 作者 TPU 能取代GPU 吗谷歌云计算MLaaS 脱颖而出 何翩翩 分析师 差异化 SAC 执业证书编号S1110516080002 hepianpian@ TPU 目前...
  • 在上一篇文章中博主用逻辑回归方法解决了一个考试预测问题,这次我们依然用逻辑回归方法来解决一个芯片质量预测问题,但本次实战和上一次有所不同,本次实战中运用了以函数方式求解边界曲线并且描绘出完整决策...
  • 12月6日,据外媒报道,IBM最新一代Power芯片Power9正在进入市场,以应对越来越强劲人工智能、机器学习领域高强度、高密度信息处理需求。 TechCrunch报道称,IBM打算向第三方制造商,比如包括Google在内云...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 847
精华内容 338
关键字:

机器学习的芯片