精华内容
下载资源
问答
  • 行业分类-物理装置-不良产品的复核方法及装置.zip
  • Lazada产品类目用以产品分类,错选类目将造成买家外流,因而产品类目选择精确是十分关键的。据Lazada汇总,50%的顾客会根据网页页面左侧的类目栏,选择他们有兴趣的类目,点一下访问该类目下的产品;而此外50%的...

    Lazada产品类目用以产品的分类,错选类目将造成买家外流,因而产品类目选择精确是十分关键的。据Lazada汇总,50%的顾客会根据网页页面左侧的类目栏,选择他们有兴趣的类目,点一下访问该类目下的产品;而此外50%的顾客会在Lazada平台顶部的搜索栏输入关键词,搜索产品,而产品也将按类目各自表明。因而,选择恰当的产品归类,可以合理提升产品被检索到的机遇。

    在这里插入图片描述

    在Lazada,现阶段热卖品类包含运动与户外,汽车配件与附近,生活家居类,度假旅游箱包皮具类,小孩玩具与婴儿产品,腕表和太阳镜。这六类产品的销售量和收益大幅度提高,且具有很高的稳步增长潜力。热卖品类的产品会比别的产品有着高些的曝光度和点击量。尽可能选择上传畅销类型的产品能够提升销售量。上传热卖品类代表着更多的访问量和更多的销售机遇。在上传产品时,最先要确立假如选择了错误的产品类型,会有什么不良影响呢?

    1.直接不可以根据产品品质审批。

    2.顾客搜索产品信息的情况下,没法将其表明在恰当类目结果页面。

    3.在申请参与营销活动的情况下,Lazada会审批商家递交的产品,一旦发觉产品选择错误的类型,就不可以根据审批,没法根据营销活动的申请办理。

    4.错误的类型会减少产品排行,乃至使产品无法显示在搜索结果页面,总体目标顾客群便没法查询到产品,直接减少产品曝光度和点击量,进而降低订单转化率。

    在这里插入图片描述

    那么,要怎样选择恰当的产品类目呢?

    在逐一建立产品时,点一下“ManageProducts”>AddNew或是立即点击“AddProducts”进到选择类目页面。请尽量依据产品的作用和特性,一步步选择最适当最精确的类目,直到底层的细分化类目,尽量减少选择“Other”,最终点击“已选择”成功储存选定类目。如果是大批量上传产品,务必在上传模板里填好产品归类序号。先去卖家中心后台管理,下载产品类目树文档。开启产品类目树文档,搜索产品归类序号,在大批量上传CSV模板“PrimaryCategory”一栏填好查看到的产品类目序号。一定要注意,不论是应用逐一建立,或是大批量上传产品,一旦选择错误的类目,商家将没法在卖家中心后台管理逐一改动。

    展开全文
  • 目录 云计算基础(Cloud Essentials): 安全(Security): ...云基础产品体系完整度全球领先,基础产品及功能持续投入建设,源源不断的通过新技术提高企业云上的计算、运维、开发和管理能力。...

    目录

    云计算基础(Cloud Essentials):

    安全(Security):

    大数据(Data Technology):

    人工智能(AI):

    企业应用(Enterprise Applications):

    物联网(IOT):


    云计算基础(Cloud Essentials):

    • 云基础产品体系完整度全球领先,基础产品及功能持续投入建设,源源不断的通过新技术提高企业云上的计算、运维、开发和管理能力。
    • 在云计算基础里又分为以下6种模块:弹性计算/存储服务/CDN与边缘/数据库/云通信/网络
    弹性计算

    云服务器

    • 云服务器ECS - 从安全型到内存型、从进阶型到入门型的云服务器

      云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。
      专业的售前技术支持,协助您选择最合适配置方案,详询:95187-1
    • 弹性裸金属服务器(神龙) - 兼具虚拟机的弹性和物理机的高性能、安全物理隔离、分钟交付、云产品全兼容

      弹性裸金属服务器(ECS Bare Metal Instance)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点,分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。
    • 轻量应用服务器 - 可快速搭建且易于管理的轻量级云服务器

      轻量应用服务器 (Simple Application Server),是可快速搭建且易于管理的轻量级云服务器;提供基于单台服务器的应用部署,安全管理,运维监控等服务,一站式提升您的服务器使用体验和效率。
      新用户限时优惠,基础版(新)包年5折,2年以上仅3.5折!
    • GPU云服务器 - GPU实例、强大的计算性能、弹性按需扩展

      GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习,视频处理,科学计算,图形可视化,等应用场景,型号有AMD S7150, Nvidia M40, Nvidia P100,Nvidia P4,Nvidia V100
      阿里云成为中国首家与NGC GPU加速容器合作的云厂商。
      新实例GN6i公测上线,点此申请。
    • FPGA云服务器 - FPGA实例、低时延可编程硬件加速服务

      是一款提供了现场可编程门阵列(FPGA)的计算实例,基于阿里云弹性计算框架,用户可以几分钟内轻松创建FPGA实例,创建自定义的专用硬件加速器。由于FPGA硬件的可重配特性,用户可以对已创建的FPGA硬件加速应用,进行快速擦写和重配,达到低时延硬件与弹性伸缩最好的结合。

    高性能计算HPC

    • 超级计算集群 - 支持RDMA提供极致并行计算性能实例规格

      超级计算集群(Super Computing Cluster,SCC)使用高速RDMA网络互联的CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算集群服务。
    • 弹性高性能计算E-HPC - 加速深度学习、渲染和科学计算的 GPU 物理机

      弹性高性能计算(E-HPC)基于阿里云基础设施,为用户提供一站式公共云HPC/AI平台服务,面向科研,生产,教育和行业大计算,提供快捷,弹性,安全和与阿里云产品互通的云超算平台。

    容器服务

    • 容器服务 ACS 视频简介 - 支持微服务架构、全生命周期管理的Docker服务

      容器服务提供高性能可伸缩的容器应用管理服务,支持用Docker和Kubernetes进行容器化应用的生命周期管理,提供多种应用发布方式和持续交付能力并支持微服务架构。容器服务简化了容器管理集群的搭建工作,整合了阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器运行环境。
    • 容器服务 ACK 视频简介

      容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级 Kubernetes 容器化应用的全生命周期管理。容器服务 Kubernetes 版简化集群的搭建和扩容等工作,整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳的 Kubernetes 容器化应用运行环境。
    • 容器镜像服务 ACR - 简化了Registry的搭建运维工作,支持多地域的镜像托管

      容器镜像服务(Container Registry)提供安全的镜像托管能力,稳定的国内外镜像构建服务,便捷的镜像授权功能,方便用户进行镜像全生命周期管理。容器镜像服务简化了Registry的搭建运维工作,支持多地域的镜像托管,并联合容器服务等云产品,为用户打造云上使用Docker的一体化体验。

    弹性编排

    • 弹性伸缩 - 自动调整弹性计算资源的管理服务

      弹性伸缩(Auto Scaling),是根据用户的业务需求和策略,经济地自动调整弹性计算资源的管理服务。弹性伸缩不仅适合业务量不断波动的应用程序, 同时也适合业务量稳定的应用程序。
      - 可以监控您的集群,随时自动替换不健康的实例,节省运维成本。
      - 可以管理您的集群,在高峰期自动增加ECS实例,在业务回落时自动减少ECS实例,节省基础设施成本。
      - 与 SLB/RDS 紧密集成,自动管理SLB后端服务器和RDS白名单,节省操作成本。
    • 资源编排ROS - 复杂环境部署利器,提供资源批量复制、创建和配置

      资源编排(Resource Orchestration)是一种简单易用的云计算资源管理和自动化运维服务。用户通过模板描述多个云计算资源的依赖关系、配置等,并自动完成所有资源的创建和配置,以达到自动化部署、运维等目的。编排模板同时也是一种标准化的资源和应用交付方式,并且可以随时编辑修改,使基础设施即代码(Infrastructure as Code)成为可能。

    Serverless

    • 函数计算 - 一个事件驱动的全托管计算服务,通过函数计算,无需管理服务器等基础设施,上传编写代码

      阿里云函数计算(Function Compute)是一个事件驱动的全托管计算服务。通过函数计算,您无需管理服务器等基础设施,只需编写代码并上传。函数计算会为您准备好计算资源,以弹性、可靠的方式运行您的代码。更棒的是,您只需要为代码实际运行消耗的资源付费 - 代码未运行则不产生费用。

    其他

    • 图形工作站 - 提供了远程桌面功能、非线编软件等完整图形图像处理流程,能实现高清桌面实时交互

      阿里云图形工作站(Graphic Workstation,简称GWS)提供了远程桌面功能、非线编软件以及数据存储系统NAS Plus在内的一套完整图形图像处理流程,能实现高清桌面实时交互,提升您的GPU可视化计算服务的使用体验。
    存储服务

    云存储

    • 对象存储 OSS 视频简介 - 比传统存储成本下降25%~75%的强安全企业级存储

      海量、安全、低成本、高可靠的云存储服务,提供99.9999999999%的数据可靠性。使用RESTful API 可以在互联网任何位置存储和访问,容量和处理能力弹性扩展,多种存储类型供选择全面优化存储成本。

      一键挂载OSS到线上/线下服务器 点击查看 云存储网关服务>>
    • 块存储 - 可弹性扩展、高性能、高可靠的块级随机存储

      块存储是为云服务器ECS提供的低时延、持久性、高可靠的数据块级随机存储。块存储支持在可用区内自动复制您的数据,防止意外硬件故障导致的数据不可用,保护您的业务免于组件故障的威胁。就像对待硬盘一样,您可以对挂载到ECS实例上的块存储做分区、创建文件系统等操作,并对数据持久化存储。
      企业上云——数据资产防护之道 暨 基于快照提供云盘数据保护全新升级a href="https://yq.aliyun.com/live/1211"> 立即查看>>
    • 文件存储 NAS 视频简介 - 支持NFS、CIFS协议的可共享文件存储

      阿里云文件存储NAS是一个可共享访问,弹性扩展,高可靠,高性能的分布式文件系统。它基于 POSIX 文件接口,天然适配原生操作系统,提供共享访问,同时保证数据一致性和锁互斥。

    智能存储

    • 智能云相册 - 提供影像文件存储、管理等基础功能以外,还支持对影像内容进行分类打标、面孔识别等智能分析

      智能云相册(Cloud Photos)是阿里云为影像类应用提供的一站式解决方案。智能云相册除了提供影像文件存储、管理等基础功能以外,还支持对影像内容进行分类打标、面孔识别等智能分析,并提供基于自然语言理解的智能搜索服务。
    • 智能媒体管理 - 提供场景化构建的一站式数据应用解决方案,让AI等智能分析功能更加的普惠

      场景化封装数据智能分析管理。为云上的文档、图片数据,提供一站式数据处理、分析、检索等管控体验。针对不同的业务场景,封装整合完整的处理能力,让数据快速流转。 与对象存储OSS打通一键文档预览,数据处理

    混合云存储

    • 云存储网关 Cloud Storage Gateway - 一款可在线下和云上部署的软网关

      云存储网关是一款可在线下和云上部署的软网关,以阿里云上的OSS作为后端存储,可在企业的内部IT环境和基于云的存储基础设施之间提供无缝、安全的集成。支持行业标准的文件和块存储协议,并通过在本地缓存经常访问的数据来提供低延迟性能, 您可以安全地将数据存储在阿里云OSS中。
    • 混合云存储阵列 Hybrid Cloud Storage Array - 集成了阿里云云存储网关的企业级统一存储阵列

      集成了阿里云云存储网关的企业级统一存储阵列,可以像使用本地存储一样使用和管理本地和云端的各种存储资源(块、文件和对象),本地存储通过云缓存、云同步、云分层、云备份等方式无缝连通云存储。混合云存储阵列和云存储服务相结合提供了一种经济高效,易于管理的混合云存储解决方案。
    CDN与边缘
    • CDN - 常用于视频、图片、文件加速的跨域网络分发

      将源站内容分发至最接近用户的节点,使用户可就近取得所需内容,提高用户访问的响应速度和成功率。解决因分布、带宽、服务器性能带来的访问延迟问题,适用于站点加速、点播、直播等场景。

      CDN降价25%
      HTTPS请求数全面降价50%
      阿里云免费试用套餐
    • 安全加速 SCDN - 为网站做加速的同时,防护DDoS,CC,Web应用攻击等危害

      旨在为网站做加速的同时,防护DDoS,CC,Web应用攻击,恶意刷流量,恶意爬虫等危害网站的行为。它构建于阿里云CDN平台之上,在CDN边缘节点中注入了阿里云云盾十年积累的安全能力,形成一张分布式的安全加速网络。适用于所有同时要兼顾内容加速和安全的网站。
      最新动态:SCDN套餐年付8.5折
    • 全站加速 DCDN - 适用于动静混合型、纯动态型站点或应用的内容分发加速服务

      旨在提升动静态资源混合站点的访问体验,支持静态资源边缘缓存,动态内容路由择优回源传输,同时满足整体站点的全网访问速度及稳定性需求。全站加速构建于阿里云CDN平台之上,适用于动静混合型、纯动态型站点或应用的内容分发加速服务
    • PCDN - 适用于视频点播、直播、大文件下载等业务场景

      以P2P技术为基础,通过挖掘利用边缘网络海量碎片化闲置资源而构建的低成本高品质内容分发网络服务。客户通过集成PCDN SDK接入该服务后,能获得等同或高于CDN的分发质量,同时显著降低分发成本。适用于视频点播、直播、大文件下载等业务场景。
    • 边缘节点服务 ENS - 提供基于CDN的边缘弹性基础设施

      边缘节点服务(Edge Node Service, ENS)基于运营商边缘节点和网络构建,一站式提供靠近终端用户的、全域覆盖的、弹性分布式算力资源,通过终端数据就近计算和处理,优化响应时延、中心负荷和整体成本。(答疑钉钉群21740823)
    数据库

    关系型数据库

    NoSQL数据库

    数据仓库

    • 分析型数据库MySQL版 - 千亿级记录、毫秒级查询的OLAP系统

      分析型数据库MySQL版(AnalyticDB for MySQL)是一种高并发低延时的PB级实时数据仓库,全面兼容MySQL协议以及SQL:2003 语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视和业务探索。
      AnalyticDB for MySQL3.0 7.31商业化,15天免费试用(新购),包月85折,半年7折,一年6折 等着你!
    • AnalyticDB for PostgreSQL - 在线MPP大规模并行处理数据仓库服务

      实时、易用、海量扩展的企业级数据仓库服务 AnalyticDB for PostgreSQL (原HybridDB for PostgreSQL) ,基于开源数据库Greenplum构建,由阿里云深度扩展,兼容 ANSI SQL 2003,同时兼容PostgreSQL/Oracle 数据库生态,支持行存储和列存储模式,即提供高性能离线数据处理,也支持高并发在线查询,是各行业有竞争力的PB级实时数据仓库方案。
    • HybridDB for MySQL (原PetaData) - 支持海量数据 OLTP 和 OLAP 的关系型数据库

      云数据库HybridDB for MySQL (原名PetaData)是同时支持海量数据在线事务(OLTP)和在线分析(OLAP)的HTAP(Hybrid Transaction/Analytical Processing)关系型数据库。
    • Data Lake Analytics - 全serverless架构,为海量数据提供普惠的分析能力

      Data Lake Analytics是Serverless化的交互式联邦查询服务。无需ETL,使用标准SQL即可分析与集成对象存储(OSS)、数据库(PostgreSQL/MySQL等)、NoSQL(TableStore等)数据源的数据

    数据库管理

    云通信
    • 短信服务视频简介 - 验证码和短信通知服务,三网合一快速到达

      短信服务(Short Message Service)是阿里云为用户提供的一种通信服务的能力。
      支持国内和国际快速发送验证码、短信通知和推广短信,服务范围覆盖全球200多个国家和地区。
      国内短信支持三网合一专属通道,与工信部携号转网平台实时互联。电信级运维保障,实时监控自动切换,到达率高达99%。完美支撑双11期间20亿短信发送,6亿用户触达。
    • 语音服务 视频简介 - 语音通知和语音验证,支持多方通话

      语音服务(Voice Messaging Service),是阿里云为了方便用户使用语音能力,联合运营商提供稳定可靠、安全可信的云通信服务。包含语音通知、语音验证码等丰富的PaaS/SaaS产品,具备高可用、高并发、高质量、一站式接入的优势。 注:服务开通需要按照运营商要求进行实名登记及话术审核、备案。
    • 流量服务 - 轻松玩转手机流量,物联卡专供物联终端使用

      流量服务(Cellular Data Package)是阿里云为用户提供的一种通信服务的能力,包括流量充值(通用流量)和定向流量。流量充值基于手机流量充值,支持用户开展营销活动;定向流量针对固定APP提供超低资费的定向流量包,用于提高APP用户活跃。
    • 物联网无线连接服务 - 支持所有联网卡形态,贴近行业的灵活资费套餐

      物联网无线连接服务是基于三大运营商(移动、联通、电信)提供物联网专用号段(11位或13位)的移动通信接入业务,该业务支持无线数据通信和物联网场景的配套行业解决方案,用户各种物联网设备的应用场景,如车联网、智能家居、穿戴设备、多媒体网络支撑、环境监测,和智慧农业等。
      邀您参加 物联网无线连接服务 问卷调查,我们将对优质客户提供专属服务。
    • 号码隐私保护 视频简介 - 提供私密专线能力嵌入到合作伙伴的业务流程

      号码隐私保护(Phone Number Protection)是一款基于基础运营商通信网络能力的互联网产品,企业客户可以通过集成号码隐私保护能力,为其平台用户提供隐私通话服务,同时可以通过录音来对其服务质量进行分析,提升产品安全性及平台价值。
    • 号码认证服务 - 支持手机号一键认证,认证体验全新升级

      号码认证服务(Phone Number Verification Service)整合三大运营商特有的网关认证能力,一步验证待校验手机号码和应用所在的手机SIM卡号码的一致性,升级短信验证码体验,并提供仅限本机操作的防控,提升安全等级。
    网络

    云上网络

    • 专有网络VPC - 构建逻辑隔离网络,确保资源安全

      帮助您基于阿里云构建出一个隔离的网络环境,并可以自定义IP 地址范围、网段、路由表和网关等;此外,也可以通过专线/VPN/GRE等连接方式实现云上VPC与传统IDC的互联,构建混合云业务。
    • 云解析 PrivateZone - 基于阿里云专有网络VPC环境的私有域名解析和管理服务

      云解析 PrivateZone,是基于阿里云专有网络VPC(Virtual Private Cloud)环境的私有域名解析和管理服务。可以在自定义的一个或多个专有网络中快速构建DNS系统,实现私有域名映射到IP资源地址。
    • 负载均衡 SLB 视频简介 - 对多台云服务器进行流量分发的负载均衡服务

      对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。
    • NAT网关 视频简介 - 支持NAT转发、共享带宽的VPC网关

      帮助您在VPC环境下构建一个公网流量的出入口,通过自定义SNAT,DNAT规则灵活使用网络资源,支持多IP,支持共享公网带宽。
    • 弹性公网IP 视频简介

      独立的公网IP资源,可以绑定到阿里云专有网络VPC类型的ECS、NAT网关、私网负载均衡SLB上,并可以动态解绑,实现公网IP和ECS、NAT网关、SLB的解耦,满足灵活管理的要求。
    • IPv6转换服务 - 原有IPv4业务可快速面向IPv6网络侧用户提供服务

      IPv6转换服务(IPv6 Translation Service)可实现IPv6与IPv4网络地址转换。通过IPv6转换服务,您原有的IPv4业务可快速为IPv6用户提供访问能力。
    • 共享带宽 视频简介

      提供地域级带宽共享和复用功能,支持同地域下所有弹性公网IP共享带宽,进而让绑定EIP的ECS、NAT网关、负载均衡同时共享带宽,并提供包括按小时、带宽峰值、增强型95、传统95等多种计费模式。
    • 共享流量包 视频简介 - 按流量计费,开通后自动覆盖多个地域的产品并自动抵扣

      共享流量包套餐价格实惠,提供免费试用套餐;产品覆盖面广,可供按流量计费的ECS、EIP、SLB和NAT网关使用;使用简单,流量包开通后自动覆盖多个地域的产品,并自动抵扣流量费用。

    跨地域网络

    • 云企业网 视频简介 - 帮助用户打造具有企业级规模和通信能力的云上网

      阿里云致力于为用户提供优质、高效、稳定的网络传输环境,云企业网(Cloud Enterprise Network)将提供一种能够快速构建混合云和分布式业务系统的全球网络,帮助用户打造一张具有企业级规模和通信能力的云上网络。年中大促进行中,低至5折起

    混合云网络

    • VPN 网关 视频简介 - 安全加密的云上云下数据互通方案

      VPN网关是一款基于Internet,通过加密通道将企业数据中心、企业办公网络、或internet终端和阿里云专有网络(VPC)安全可靠连接起来的服务。阿里云VPN网关在国家相关政策法规下提供服务,不提供访问Internet功能。
    • 高速通道 视频简介 - 高速稳定的 VPC 互联和专线接入服务

      帮助不同网络环境间实现高速、稳定、安全的私网通信,包括云上跨地域/跨用户的VPC内网互通、云下IDC专线接入云上等场景,提高网络拓扑灵活性和跨网通信质量。

    安全(Security):

    • 帮助企业业务进入智能安全时代。
    • 在安全里又分为以下6种模块:云安全/身份管理/数据安全/业务安全/安全服务/安全解决方案
    云安全
    • DDoS高防IP - 300G按天付费,防御超大流量DDoS攻击

      DDoS高防IP是针对互联网服务器(包括非阿里云主机)在遭受大流量DDoS攻击后导致服务不可用的情况下,推出的付费服务,用户可通过配置高防IP,将攻击流量引流到高防IP,确保源站的稳定可靠。详询95187-1
      最新发布新版国际版高防,点击了解>> DDoS高防产品托管服务,点击了解>>
    • Web应用防火墙 视频简介 - 防注入,防CC ,一站式Web安全解决方案

      对网站或者APP的业务流量进行恶意特征识别及防护,将正常、安全的流量回源到服务器。避免网站服务器被恶意入侵,保障业务的核心数据安全,解决因恶意攻击导致的服务器性能异常问题。详询95187-1
    • SSL证书 视频简介 - 实现网站HTTPS化使网站防劫持、防篡改、防监听

      在云上签发各品牌数字证书,实现网站HTTPS化,使网站可信,防劫持、防篡改、防监听、安全加密。
      统一生命周期管理,简化证书部署,一键分发到CDN、负载均衡、OSS等其它云上产品。详询95187-1
    • 云安全中心 - 安全统一告警平台,原始日志检索和安全事件调查

      云安全中心是一个实时识别、分析、预警安全威胁的统一安全管理系统,通过防勒索、防病毒、防篡改、合规检查等安全能力,帮助用户实现威胁检测、响应、溯源的自动化安全运营闭环,保护云上资产和本地主机并满足监管合规要求。详询95187-1
    • 云防火墙 - 基于业务可视的结果、实现业务梳理和业务隔离

      集中管理公网IP的访问策略,内置威胁入侵防御模块(IPS),支持失陷主机检测、主动外联行为的阻断、业务间访问关系可视,留存6个月网络流量日志,等保必备。
    • 堡垒机 - 运维操作记录,满足合规审计要求

      集中管理资产权限,全程记录操作数据,实时还原运维场景,助力企业用户构建云上统一、安全、高效运维通道;保障云端运维工作权限可管控、操作可审计、合规可遵从。
      咨询电话:95187转1
    • 漏洞扫描 - 漏洞、挂马、篡改、垃圾广告、敏感内容扫描

      以企业IT资产为核心,提供全面、快速、精准的漏洞扫描及风险监测服务,帮助企业持续地发现暴露在互联网边界上的常见安全风险。
    • 操作审计 - 详细记录控制台和 API 操作

      操作审计(ActionTrail)会记录您的云账户资源操作,提供操作记录查询,并可以将记录文件保存到您指定的OSS存储空间。利用 ActionTrail保存的所有操作记录,您可以实现安全分析、资源变更追踪以及合规性审计。
    • 安骑士 - 全方位服务器安全检测、响应和防护

      安骑士(服务器安全护卫):一款经受百万级服务器稳定性考验的安全加固产品,拥有自动化实时入侵威胁检测、病毒查杀、漏洞智能修复、基线一键核查、网页防篡改等功能,是构建服务器安全防线的统一管理平台。
      安骑士升级为云安全中心高级版,立刻查看>
    身份管理
    • 访问控制 - 管理多因素认证、子账号与授权、角色与 STS 令牌

      RAM 使您能够安全地集中管理对阿里云服务和资源的访问。您可以使用 RAM 创建和管理用户和组,并使用各种权限来允许或拒绝他们对云资源的访问。
    数据安全
    • 数据库审计 - 符合数据库合规审计要求

      智能解析数据库通信流量,细粒度审计数据库访问行为,帮助企业精准识别、记录云上数据安全威胁,为云端数据库提供全方位的安全、诊断及维护能力。
      咨询电话:95187转1
    • 加密服务 - 加密,符合监管合规的硬件加密服务

      加密服务基于国家密码局认证的硬件加密机,提供了云上数据加解密解决方案,用户能够对密钥进行安全可靠的管理,也能使用多种加密算法来对云上业务的数据进行可靠的加解密运算。
    • 敏感数据保护 - 敏感数据保护产品是支持用户云上数据使用安全的产品。

      敏感数据保护是一款发现,分类和保护敏感数据的阿里云安全服务。该服务从海量数据中自动发现,记录并分析敏感数据的使用情况,及时发现数据使用是否存在安全违规并对其进行风险预警,帮助用户防止数据泄露和满足GDPR等合规要求。
    • 密钥管理服务 - 安全、易用、低成本的密钥管理服务

      密钥管理服务(KeyManagementService)是一款安全易用的管理类服务。您无需花费大量成本来保护密钥的保密性、完整性和可用性,借助密钥管理服务,您可以安全、便捷的使用密钥,专注于开发您需要的加解密功能场景。
    业务安全
    • 游戏盾 GameShield - 解决游戏行业特有的TCP协议的CC攻击问题

      游戏盾是阿里云针对游戏行业所推出的高度可定制的网络安全解决方案,除了能针对大型DDoS攻击(T级别)进行有效防御外,还能彻底解决游戏行业特有的TCP协议的CC攻击问题,防护成本更低,效果更好!
    • 内容安全 - 文本、图像、视频直播的内容安全检测服务

      内容安全基于深度学习技术, 提供图片、视频、语音、文字等多媒体的内容风险智能识别服务,不仅能帮助用户降低色情、暴恐、涉政等违规风险,而且能大幅度降低人工审核成本。
      7-8月内容安全语音违法检测调优服务报名申请如下:链接
    • 实人认证 - 实人可信模型进行自然人真实身份核验服务

      依托活体检测、人脸比对等生物识别技术、证件 OCR 识别技术等进行的自然人真实身份的核验服务。(只针对企业用户开放)
    安全服务
    • 安全管家服务 - 专业、高效的入侵响应、安全护航、安全托管服务

      阿里云安全管家服务是阿里云安全专家基于阿里云多年安全最佳实践经验为云上用户提供的全方位安全技术和咨询服务,为云上用户建立和持续优化云安全防御体系,保障用户业务安全。
    • 渗透测试

      以攻击者思维,模拟黑客对业务系统进行全面深入的安全测试,帮助企业挖掘出正常业务流程中的安全缺陷和漏洞。助力企业先于黑客发现安全风险,防患于未然。
    • 先知(安全众测) - 企业发出安全测试需求,白帽黑客依据「测试需求」给出测试报告,企业依据报告的有效性给予白帽黑客一定现金奖励

      先知平台提供私密的安全众测服务,可帮助企业全面发现业务漏洞及风险,按效果付费。企业加入先知平台后,可自主发布奖励计划,激励先知平台的安全专家来测试和提交企业自身网站或业务系统的漏洞,保证安全风险可以快速进行响应和修复,防止造成更大的业务损失。相比传统渗透测试,先知具有测试效率高、测试人员多、测试效果好、性价比高等优势。
    • 先知 · 等保咨询服务 - 帮助完成安全整改工作,指导客户通过等保测评。

      整合云盾产品的技术优势,联合阿里云的各地等保咨询合作机构,为您提供等保2.0测评的咨询指导,帮助客户更快地完成等保整改工作。
    • 安全应急响应服务 - 提供的黑客入侵事件处理服务,帮助客户快速恢复业务

      安全应急响应服务是由阿里云与授权安全合作伙伴提供的黑客入侵事件处理服务,能够帮助用户正确应对黑客入侵事件,清理木马后门、分析入侵原因,降低安全事件带来的损失,帮助客户快速恢复业务。
    • 安全培训 - 定制个性化的安全培训课程计划

      根据企业具体情况与需求,定制个性化的安全培训课程计划,帮助企业人员了解并掌握相关安全知识。通过培训,帮助企业在研发和运维过程中尽量避免由于安全知识的匮乏而造成信息安全事故。
    • 安全评估服务 - 分析出业务中存在的安全问题,指导加固和修复

      未经安全评估的系统可能存在大量的安全漏洞,对客户的业务带来巨大的损失。企业需要在业务系统上线时进行安全风险排查,免遭黑客入侵。安全评估服务,由阿里云认证的专业安全技术合作伙伴对系统进行全面的安全隐患排查,从技术角度分析出业务中存在的安全问题,并指导客户进行加固和修复。
    • 代码审计 - 检查源代码中的错误及安全漏洞,提供修订措施

      检查源代码中的缺点和错误信息,分析并找到这些问题引发的安全漏洞,并提供代码修订措施和建议。由阿里云认证的合作伙伴提供专业服务。
    • 安全加固 - 对外网或内网主机进行全方位的基线加固和组件升级

      在客户授权委托的情况下,远程登录得到客户的业务系统服务器上,对外网或内网主机进行全方位的基线加固和组件升级,提前修补系统潜在的各种高危漏洞和安全威胁。由阿里云认证的合作伙伴提供专业服务。
    • 安全通告服务

      实时监测、周期性度量风险隐患,您可以根据通告信息,轻松掌握自有IT资产的安全漏洞状态,及时跟踪修补IT资产漏洞,提高企业脆弱性管理能力。
      本服务由阿里云合作伙伴提供
    • PCI DSS服务

      PCI DSS对于所有涉及支付卡行业的安全方面作出标准的要求,其中包括安全管理、策略、过程、网络体系结构、软件设计的要求的列表等,全面保障交易安全。阿里云联合认证的合作伙伴提供专业服务。

    大数据(Data Technology):

    • 完善的大数据产品体系,助力大数据计算和分析。
    • 分为大数据计算/数据可视化/大数据搜索与分析/数据开发/大数据应用
    大数据计算
    • 大数据计算服务 · MaxCompute 视频简介 - 建设数据仓库,钱省一半

      MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速、完全托管的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。欢迎加入钉钉交流群11782920。
      邀您参加 MaxCompute 问卷调研,赠送100元本产品无门槛代金券 >>
    • E-MapReduce - 基于 Hadoop/Spark 的大数据处理分析服务

      E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、Kafka、Storm,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。
    • 实时计算 - 流计算引擎,让数据报表刷新更快

      实时计算(Alibaba Cloud Realtime Compute,Powered by Ververica)是阿里云提供的基于 Apache Flink 构建的企业级大数据计算平台。在 PB 级别的数据集上可以支持亚秒级别的处理延时,赋能用户标准实时数据处理流程和行业解决方案;支持 Datastream API 作业开发,提供了批流统一的 Flink SQL,简化 BI 场景下的开发;可与用户已使用的大数据组件无缝对接,更多增值特性助力企业实时化转型。
    数据可视化
    • DataV数据可视化 - 做出领导惊喜的可视化大屏

      DataV旨让更多的人看到数据可视化的魅力,帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用,满足您会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。
    大数据搜索与分析
    • 开放搜索 - 结构化数据搜索托管服务

      开放搜索(OpenSearch)是阿里巴巴自主研发的大规模分布式搜索引擎平台,其核心引擎HA3(问天3)系统为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。通过集成智能查询语义理解、机器学习排序算法等能力,旨在为企业提供高搜索质量的一站式内容智能搜索服务。
      新功能算法平台公测报名中,一键免费申请!
    • 日志服务 LOG - 一站式解决日志收集、存储、查询和分析

      日志服务(Log Service,简称LOG/原SLS)是针对实时数据一站式服务,在阿里集团经历大量大数据场景锤炼而成。
      提供日志类数据采集、消费、投递及查询分析功能,全面提升海量日志处理/分析能力,服务智能研发/运维/运营/安全等场景。
    • 阿里云 · Elasticsearch - 全新的云上ELK服务,提供商业版X-Pack插件

      提供100%兼容开源Elasticsearch的功能,以及Security、Machine Learning、Graph、APM等商业功能,致力于数据分析、数据搜索等场景服务。与开源社区背后商业公司Elastic战略合作,为客户提供企业级权限管控、安全监控告警、自动报表生成等场景服务。
    • 关系网络分析 - 构建万物互联,追寻业务线索

      I+关系网络分析,以OLP模型为核心,面向业务快速建模,为开发者和终端用户提供大数据关系计算引擎(含API服务)和可视化交互分析能力,在阿里巴巴、蚂蚁金服集团内广泛应用于反欺诈、反作弊、反洗钱等风控业务,面向安防、关税、银行、保险、互联网等提供完整的产品化方案。
    • Quick BI - 30分钟,老板也能上手的BI

      Quick BI 专为云上用户量身打造的新一代智能BI服务平台。
      目前提供QBI标准版和高级版30天免费试用,点此查看试用说明。
    数据开发
    • 数加 · DataWorks - 一站式大数据开发管理平台

      DataWorks是一个提供了大数据OS能力、并以all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。 同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。
      从0到1带您由浅入深,玩转 DataWorks!
    • 智能数据构建与管理 Dataphin 视频简介 - 一站式智能数据构建与管理平台

      面向各行各业大数据建设、管理及应用诉求,一站式提供从数据接入到数据消费全链路的智能数据构建与管理的大数据能力, 包括产品、技术和方法论等,助力打造标准统一、融会贯通、资产化、服务化、闭环自优化的智能数据体系,以驱动创新。Dataphin目前仅支持线下购买。
    • 数加 · 数据集成 - 消除数据孤岛,快速集中数据

      数据集成(Data Integration)是阿里集团对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为400对数据源提供不同网络环境下的全量/增量数据进出通道。
    大数据应用

    人工智能(AI):

    • 从单点智能向集成智能持续演进,推动制造智能,生产智能,数据智能,服务智能的产品。
    • 分为智能语音交互/图像搜索/自然语言处理/印刷文字识别/人脸识别/机器翻译/图像识别/内容安全/机器学习平台/城市大脑开放平台
    智能语音交互
    • 录音文件识别 - 提供的是将语音转写成文字的服务

      对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。
    • 实时语音识别 - 对音频流做实时转写,达到“边说边出文字”的效果

      对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。
    • 一句话识别

      对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电、智能助手等产品中。
    • 语音合成 - 适用于智能客服、语音交互、文学有声阅读、虚拟偶像等场景,支持专属音库的定制

      语音合成服务,通过先进的深度学习技术,将文本转换成自然流畅的语音。目前有多种音色可供选择,并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学有声阅读和无障碍播报等场景。
    • 语音合成声音定制

      为企业提供深度定制TTS声音的能力。通过先进的深度学习技术,用更少的数据量,更快速高效地为客户定制个性化语音合成声音。将自然流畅的TTS声音带到服务或设备上。
    • 语言模型自学习工具

      用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制,未来会推出上传音频数据对声学模型进行定制。
    图像搜索
    • 图像搜索

      以深度学习和机器视觉技术为核心,结合不同行业应用和业务场景,帮助用户在自建图库中实现相同或相似图片搜索的以图搜图服务。
    自然语言处理
    • 多语言分词

      将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列,同时保持对数据、模型的不断迭代更新,目前支持简体中文、英文及泰文。
    • 词性标注

      通过词性标注服务,用户可以快速的为每一个词附上对应的词性,结合分词服务,可以快速进行更深层次的文本挖掘处理,无需担心新词发现、歧义消除等问题。
    • 命名实体

      我们为您提供的命名实体服务,可以帮助您快速识别文本中的实体,进而挖掘各实体间的关系,是进行深度文本挖掘,知识库构建等常用自然语言处理领域里的必备工具。目前主要针对电商领域,识别品牌、产品、型号等,同时也包括一些通用领域实体如人名、地名、机构名、时间日期等。
    • 情感分析

      又称倾向性分析,或意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。利用情感分析能力,可以针对带有主观描述的自然语言文本,自动判断该文本的情感正负倾向并给出相应的结果。
    • 中心词提取

      多语言中心词(目前支持中文及英文)基于海量数据,使用电商标题中心词以及类目进行训练,通过给每个词计算一个相关性分数来衡量每个词与句子的相关性程度,进而识别并提取出句子的中心词。适用于提取电商搜索query、标题及其他类似短文本(一般小于25个词)的中心词。
    • 智能文本分类

      基于强大的机器学习技术和海量数据支撑,实现五层树状类目结构。融合主动学习的迭代算法,可快速实现文本的自动分类,并提取文本中的内容标签,实现内容、类目及标签间的关联。
    • 文本信息抽取

      通过信息抽取服务,可以把文本里包含的信息进行结构化处理,变成表格一样的组织形式,方便进行检查和比较。 信息抽取技术并不试图全面理解整篇文档,只是对文档中包含相关信息的部分进行分析。 当前版本仅提供合同领域的抽取服务,包括抽取合同名称、甲方公司名称、乙方公司名称、收款账户名、收款账号、收款开户行等合同常用字段信息。
    • 商品评价解析

      基于电商行业的大量语料研发,对消费者历史评价和新增评价的商品维度属性自动解析,将文本转化为结构化属性字段,高效甄别正负面评价,同时根据情感强烈程度进行-1分~1分的打分,可统计可分析,大幅度节省客服人工。
    • NLP自学习平台 视频简介

      支持文本实体抽取、文本分类等NLP定制化算法能力,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台快速创建算法模型并使用。
    印刷文字识别
    • 卡证类识别

      可以解决通用卡证类的文字识别及识别信息结构化的问题。本类产品下包含身份证正反面识别、护照识别、银行卡识别、名片识别、户口页识别。
    • 汽车相关证件识别

      快速识别并获取和汽车相关的各种内容且结构化输出:包含驾驶证、行驶证、车牌、vin码。
    • 行业票据类识别

      可结构化输出行业所需的各类票据关键字段内容:包含增值税发票识别、机动车发票识别、火车票识别、出租车发票识别等。
    • 资产类证件识别

      资产类证件识别包各类资产证件的识别。企业资产如营业执照识别,可结构化识别出注册号,公司名称,公司地址,法人代表,营业期限等多个字段; 房产证识别可识别多种商品性质房源,快速准确识别房屋性质,坐落,权利人等10个字段。
    • 通用类图片文字识别

      适用于多场景图片文字识别并返回坐标信息。分别有网络ugc 图片文字识别、电商图片文字识别、社区贴吧图片文字识别、通用文字识别。
    • 行业文档类识别

      高精度识别各行业文档和表单表格,通用于各行业的通用文字识别。包含单字坐标,表格识别,图像旋转等功能,广泛应用于司法、金融、医疗等各行业。
    • 视频、实体标识识别

      视频文字识别可以快速识别视频中的字幕信息以及视频中的特殊位置的文字信息,可应用于各类视频场景中,有效的区分文字内容是否合规;可以智能识别视频中的广告图中的文字信息,过滤广告中的违规文字,降低违规风险;实体标识可应用在物体外包装上的印刷文字识别,也可用于广告牌、路牌、标牌等带有印刷体文字的拍摄视频、图像进行识别。
    • 自定义模版 视频简介

      支持用户通过简单的标注创建专属自己的模板,生成识别规则。模板创建后,用户可通过API接口批量识别同类图片内容信息,获得定义好的输出结果,满足用户的个性化OCR需求。
    人脸识别
    • 人脸识别 Face Recognition 人工智能介绍 - 对图像中的人脸及其五官关键点信息进行检测

      基于图像或视频中的人脸检测、分析和比对技术,提供人脸检测定位、人脸属性识别和人脸比对等独立服务模块。可以为开发者和企业提供高性能的在线API服务,应用于人脸AR、人脸识别和认证、大规模人脸检索、照片管理等各种场景。
    机器翻译
    • 机器翻译 - 支持21种语言,48种语言方向的翻译能力

      阿里翻译依托领先的自然语言处理技术和海量的电商数据优势,研发基于注意力机制的深层神经网络翻译系统(NMT),目前该系统已经广泛应用在电商链路的各项业务中,包括SEO、搜索、商品标题、商品详情、商品评论、实时沟通、风控等各项基础数据领域。 阿里翻译帮助解决面向国际用户网站和软件中的所有语言障碍,现在购买资源包享受梯度优惠的同时,每月还有100万字符免费调用额度。
    图像识别
    • 图像识别 Image Recognition 人工智能介绍 - 对图片的内容进行打标识别,可识别上千种标签

      图像识别服务(Image Recognition)基于大数据和深度学习实现,可精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等,包含图像打标、场景分类、鉴黄等在线API服务模块,应用于智能相册管理、图片分类和检索、图片安全监控等场景。
    内容安全
    • 图片鉴黄

      通过深度学习技术神经网络算法和实时更新的亿级图像样本库,可对图片进行识别以及色情程度量化,能够根据业务场景快速定制算法模型,降低人工审核成本。
    • 图片涉政暴恐识别

      通过深度学习算法结合独有的情报、舆情、预警和分析体系及实时更新的样本图库,能够快速定位暴恐旗帜、血腥、人物和场景以及敏感政治人物。
    • 图片logo检测

      通过目标检测技术,精准识别图片、直播画面和视频中出现的各种logo,如台标,商标,水印,标签等类型,提供logo类型、名称和位置,常用于竞品监控,版权保护等场景。
    • 图片垃圾广告识别

      通过OCR算法结合文本识别算法有效识别广告图片,并且采用独创的牛皮癣算法,能够通过判断图片中文字是否经过后期处理来有效识别广告图片。
    • 图片不良场景识别

      结合行为分析和时间序列对比技术,针对在直播和视频中的需要监管的不良场景,如画面模糊、抽烟、画中画、赌博、斗殴等进行精准识别。
    • 图片风险人物识别

      提供包括政治人物、敏感人物、以及名人明星等人物的面部识别,能够避免业务的违规和侵权风险。
    • 视频风险内容识别 - 视频风险内容识别,降低内容被监管的风险以及人工审核成本

      通过神经网络算法、深度学习算法结合阿里巴巴多年沉淀的的图像、视频、情报、舆情、预警数据,不仅能够快速定位敏感人物、色情、政治敏感、暴力、武器、恐怖、血腥、爆炸、抽烟、吸毒、画中画等内容,还能对台标、商标、二维码、广告等内容进行精确识别,降低内容被监管的风险以及人工审核成本。
    • 文本风险内容识别

      采用NLP自然语言理解算法有效识别色情、暴恐涉政、广告、辱骂、违反广告法、涉及违禁品等文本内容,并且能够结合行为策略有效管控灌水、刷屏等恶意行为。
    • 语音风险内容识别 - 语音风险内容识别,避免内容因违规内容而被监管处罚

      基于深度学习技术与实时语音分析技术精准识别出语音中的垃圾内容,比如色情、低俗、恐怖暴力、涉政、宗教、广告、辱骂等内容,避免内容因违规内容而被监管处罚。
    机器学习平台
    • 机器学习PAI 视频简介 - 从BI到AI,人工智能触手可及

      阿里云机器学习平台PAI(Platform of Artificial Intelligence),为传统机器学习和深度学习提供了从数据处理、模型训练、服务部署到预测的一站式服务。
    城市大脑开放平台
    • 智能出行引擎

      基于ET城市大脑开放平台与阿里云大数据一体化计算平台,智能出行引擎·数据融合、控制优化、实时预警三大模块,通过实现交通行业数据的闭环流转,最终达成对交通系统的控制闭环。 开发者基于ET城市大脑开放平台的服务总线,使用ET城市大脑开放平台的引擎能力,共同繁荣ET城市大脑的生态。

    企业应用(Enterprise Applications):

    • 致力于结合中大型企业实际业务需求,研发能够帮助企业实现数字化转型,从而全方位提升企业效率的PaaS和SaaS类产品,为企业赋能。
    • 分为域名与网站/注册公司/知识产权服务/应用服务/智能设计服务/移动云/视频云/专有云/消息队列MQ/微服务/智能客服
    域名与网站
    • 域名注册 - 蝉联国内市场NO.1,超过2000万域名注册
    • 网站建设 - 全行业建站优选,建站专家为您提供一站式服务
    • 云虚拟主机 - .com域名+普惠版虚机3.5折抢
    • 海外云虚拟主机 - 海外云虚拟主机包年3.3折起
    • 云解析 DNS - 安全、快速、稳定、可靠的权威DNS解析管理服务
    • 弹性Web托管 - 新一代建站主机,具有攻击隔离能力,更稳定、安全
    • 备案 - 一站式备案服务,备制作网站、域名、空间
    注册公司
    • 公司注册 - 申请进度实时掌握,助力创业第一步!
    知识产权服务
    应用服务
    • 机器人流程自动化 RPA 视频简介 - 帮助用户连接不同的系统和服务,实现工作流程自动化

      阿里云RPA历经8年的内部验证,覆盖了阿里巴巴大部分BU,实现了电商客服、新零售等新兴行业的渗透,并且已经完成在保险、金融、医疗保健等领域的场景深耕,联合合作伙伴具备深度定制化能力和稳定交付能力,积累了丰富的行业可行性解决方案。目前阿里云RPA能集成并运行在更高的软件层级,这就决定了它不会侵入、影响已有的软件系统。在帮助企业提升效能的过程中,保持企业已有的IT系统功能平稳、运行可靠。
    • 云桌面(Cloud Desktop)- 安全、便捷易用、高性能的云端桌面服务

      由阿里云所提供的便捷、安全的云上虚拟桌面服务。它支持快速便捷的桌面环境创建、部署、统一管控与运维。无需前期传统硬件投资,帮您快速构建安全、高性能、低成本的桌面办公体系。可广泛应用于具有高数据安全管控、高性能计算等要求的金融、设计、视频、教育等领域。
    • 云AP - 适用于新零售、智能办公两种业务形态的云AP

      云AP是一项云化的WiFi服务,价格低廉,易用可靠。
    • API 网关(API Gateway) - API 托管,安全防护、精准流控,降低开发成本

      提供API托管服务,涵盖API发布、管理、运维、售卖的全生命周期管理。辅助用户简单、快速、低成本、低风险的实现微服务聚合、前后端分离、系统集成,向合作伙伴、开发者开放功能和数据。
    • 企业邮箱 - 安全、稳定的企业邮箱服务
    • 邮件推送(DirectMail)- 事务邮件、通知邮件和批量邮件的快速发送

      一款简单高效的电子邮件发送服务,它构建在可靠稳定的阿里云基础之上,帮助您快速、精准地实现事务邮件、通知邮件和批量邮件的发送。邮件推送历经两年双11考验,在发送速度、系统稳定性和到达率上表现优异;提供丰富的接口和灵活的使用方式,为企业和开发者解决邮件投递的难题,用户无需自建邮件服务器,开通服务即可享受阿里云优质的邮件服务,获得邮件投递的最佳实践。
    • 云投屏

      应用于会议演示场景,它颠覆了传统投屏模式,无需连接任何插线或转接头,只需要连接网络,在电脑桌面端上操作投屏,即可将电脑屏幕完整投放到显示屏幕上。硬件盒子小巧灵活,部署极简。会议室桌面无连接走线,实现员工无感知部署。
    智能设计服务
    • 鹿班 - 通过人工智能技术,快速、批量、自动化的进行图片设计

      鹿班(AI Graphics) 智能设计平台,包括智能生成、创作助手、智能排版、设计拓展等功能模块,可帮助企业快速、批量、自动化的进行图片设计。
    移动云
    • 移动研发平台 - 一站式开发平台快速搭建移动应用

      面向企业服务市场,期望把阿里巴巴近十年在移动互联网行业沉淀的DevOps研发支撑能力、移动App基础中间件能力开放给客户,帮助传统企业快速完成业务移动化的转型升级目标。
    • 移动推送 - 移动应用通知与消息推送服务

      基于大数据技术的移动云服务。帮助App快速集成移动推送的功能,在实现高效、精确、实时的移动推送的同时,极大地降低了开发成本。让开发者最有效地与用户保持连接,从而提高用户活跃度、提高应用的留存率。
    • 移动热修复

      面向移动互联网的APP热修复解决方案。产品基于阿里巴巴首创Hotpatch技术,提供细粒度热修复能力,无需等待,实时修复应用线上问题。Powered By 手机淘宝
    • 移动测试 - 智能、深入、全面、易用的移动测试解决方案

      为广大企业客户和移动开发者提供真机测试服务的云平台,拥有大量热门机型,提供7x24全天候服务,帮助客户发现APP中的各类隐患(应用崩溃、各类兼容性问题、功能性问题、性能问题等),减少用户流失,提高APP质量和市场竞争力。
    • 移动数据分析 - 移动应用数据采集、分析及开放输出服务

      阿里云推出的一款移动App数据统计分析产品,为开发者提供一站式数据化运营服务:通用的多维度用户行为分析、数据开放并支持自定义分析、数据无缝对接其他数据应用产品,助力移动开发者实现基于大数据技术的精细化运营、提升产品质量和体验、增强用户黏性。
    • 移动用户反馈 - 适用于App内部的用户反馈系统的搭建

      App内部的用户反馈系统。无需退出,就可以快速发送文字、图片、语音进行意见反馈和报告Bug。 开发者可以及时和用户保持沟通,提升用户满意度(此外,自动抓取APP在应用市场的评论数据,帮助开发者掌握用户对应用的评论)。
    • HTTPDNS - 防劫持、就近接入、解析快

      面向移动开发者推出的一款域名解析产品,具有域名防劫持、精准调度的特性。
    视频云
    • 视频直播(ApsaraVideo Live)视频简介 - 低延时、高并发、实时多媒体处理的直播服务

      基于领先的内容接入与分发网络和大规模分布式实时视频处理技术(含窄带高清TM)打造的音视频直播平台,提供易接入、低延迟、高并发、高清流畅的音视频直播服务。
    • 视频点播 视频简介 - 上传、转码、存储、加速分发一体的点播服务

      视频点播(ApsaraVideo VoD,简称VoD)是集视频采集、编辑、上传、媒体资源管理、自动化转码处理(窄带高清TM)、视频审核分析、分发加速于一体的一站式音视频点播解决方案。
    • 媒体处理 视频简介

      媒体处理(ApsaraVideo Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。转码时长包,立即购买
    • 音视频通信

      音视频通信 RTC(Real-Time Communication)是阿里云覆盖全球的实时音视频开发平台,依托核心音视频编解码、信道传输、网络调度技术,提供高可用、高品质、超低延时的音视频通信服务,让用户快速搭建多端实时应用,适用于在线教育、视频会议、互动娱乐、音视频社交等场景。
    • 智能视觉 - 解决图像视频定制化难题

      智能视觉(IntelligenceVision)为零算法基础的开发者和企业提供定制化模型训练能力,包括图像分类、图像检测、视频分类、视频识别、直播识别等能力,应用于工业质检、零售物件计数、视频监控等各种场景。
    • 视频DNA - 赋予视频唯一身份,高效实现视频查重与原创识别

      视频DNA可以唯一标记一个视频,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化。
    • 视频审核 - 高效过滤视频违规内容,大大降低人工审核成本

      视频智能审核服务(Video Censor)基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别视频、封面、标题或评论的违禁内容,包括色情、暴恐、政治敏感、广告、视频黑库等多个功能模块,应用于短视频平台、直播平台、传媒审核等场景。
    • 视频多模态内容理解 - 深度理解视频多模态内容,全方位挖掘结构化信息

      视频多模态内容理解,是通过分析视频中视觉、文字、语音、行为等多模态信息,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。基于深度学习的目标检测技术,准确找出给定视频的视频帧中多目标及位置,并给出每个目标的具体类别。目标检测支持多达1000个类目, 包括: 生活用品、 交通工具、 动物、 植物等。
    • 视频智能生产 - 让天下没有难做的视频

      视频智能生产,是将视频AI的多种能力与视频云基础服务打通,赋能视频生产环节,提高视频生产的效率和质量。
    • 智能封面 - 结合画面美学,智能选取不同格式的视频封面

      视频智能封面,是通过对视频内容的理解,结合画面美学和海量用户行为数据,选出最优的关键帧或关键片段作为视频封面,提升视频点击转化及用户体验。
    专有云
    • 阿里云专有云(Alibaba Cloud Apsara Stack) 视频简介 - Apsara Stack Enterprise 面向中大型企业客户的全栈云平台

      基于阿里云分布式架构,针对企业级市场使用特点为客户量身打造的开放、统一、可信的企业级全栈云平台。专有云与阿里云公共云同根同源,客户可在任何环境本地化部署公共云产品,并具备一键扩张至公共云的能力,让客户随时随地尽享混合云服务
    消息队列MQ
    • 消息队列 RocketMQ - 阿里巴巴官方指定消息产品,成熟、稳定、先进的技术体系打造金融级消息服务

      消息队列 RocketMQ 是阿里巴巴自研消息产品,服务于整个集团已超过 13 年,经过阿里巴巴交易核心链路反复打磨与历年双十一购物狂欢节的严苛考验,是一个真正具备低延迟、高并发、高可用、高可靠,可支撑万亿级数据洪峰的分布式消息中间件。
    • 消息队列 AMQP(RabbitMQ)

      消息队列 AMQP 由阿里云基于 AMQP 标准协议研发,完全兼容 RabbitMQ 开源生态以及多语言客户端,打造分布式、高吞吐、低延迟、高可扩展的云消息服务。开箱即用,用户无需部署免运维,轻松实现快速上云,阿里云提供全托管服务,更专业、更可靠、更安全。
    • 微消息队列 MQTT - 移动互联网、物联网、互动直播原生支持,端与云双向通信,万物互联

      微消息队列 MQTT 是专为移动互联网(MI)、物联网(IoT)领域设计的消息产品,覆盖互动直播、金融支付、智能餐饮、即时聊天、移动 Apps、智能设备、车联网等多种应用场景;通过对 MQTT、WebSocket 等协议的全面支持,连接端和云之间的双向通信,实现 C2C、C2B、B2C 等业务场景之间的消息通信,可支撑千万级设备与消息并发,真正做到万物互联。
    • 消息队列 Kafka

      消息队列 Kafka 是一个分布式的、高吞吐量、高可扩展性消息队列服务,广泛用于日志收集、监控数据聚合、流式数据处理、在线和离线分析等,是大数据生态中不可或缺的产品之一,阿里云提供全托管服务,用户无需部署运维,更专业、更可靠、更安全。
    • 消息服务 - 处理应用间海量消息传递的消息队列与通知服务

      阿里云消息服务(Message Service,原 MQS)是阿里云商用的消息中间件服务。与传统的消息中间件不同,消息服务一开始就是基于阿里云自主研发的飞天分布式系统来设计和实现,具有大规模,高可靠、高并发访问和超强消息堆积能力的特点。消息服务API采用HTTP RESTful标准,接入方便,跨网络能力强;已全面接入资源访问控制服务(RAM)、专有网络(VPC),支持各种安全访问控制;接入云监控,提供完善的监控及报警机制。消息服务提供丰富的SDK、解决方案、最佳实践和7x24小时的技术支持,帮助应用开发者在应用组件之间自由地传递数据和构建松耦合、分布式、高可用系统。

      MNS 短信功能将于 2018.02.28 23:59:59 起停止服务,新的短信功能将全部迁移至云通信短信服务,请尽快参照《短信迁移帮助手册》,下载新的 SDK 并参考 API 示例代码进行迁移,以免影响您的业务正常使用,感谢!
    微服务
    • 企业级分布式应用服务 EDAS

      一个应用托管和微服务管理的PaaS平台,提供应用开发、部署、监控、运维等全栈式解决方案,同时支持Dubbo、Spring Cloud等微服务运行环境,助力您的各类应用轻松上云。
    • 应用配置管理 - 极大地减轻配置管理的工作量,并保证配置安全合规

      其前身为淘宝内部配置中心 Diamond,是一款应用配置中心产品。基于该应用配置中心产品,您可以在微服务、DevOps、大数据等场景下极大地减轻配置管理的工作量的同时,保证配置的安全合规。
    • 全局事务服务 GTS - 分布式强一致事务/消息事务/服务链路事务

      用于实现分布式环境下特别是微服务架构下的高性能事务一致性。可以与RDS、MySQL、PostgreSQL、DRDS等数据源,Spring Cloud、Dubbo、EDAS及其他RPC框架,MQ消息队列等中间件产品配合使用,轻松实现分布式数据库事务、多库事务、消息事务、服务链路级事务及各种组合。
    • 云服务总线 CSB

      提供平台化的应用集成能力,帮助企业打通整合内外新旧业务系统,实现跨环境、跨归属应用系统之间的互通集成和管控。
    智能客服
    • 云呼叫中心

      为阿里巴巴集团多年研发积累的内部呼叫中心系统的优化输出。您可以自助开通呼叫中心,轻松设置IVR流程,管理并追踪客服绩效,无需具备专业技能,无需管理任何设备。您将获得基于云端呼叫中心平台的全部优势,实现更大的灵活性,更高的可靠性和更低的成本。
    • 云小蜜

      一款面向开发者的会话机器人,支持在不同的消息端上实现基于自然语言处理(NLP)的智能会话,如网站、APP及实体机器人等。用户可以在云小蜜中配置自己特有的知识库实现智能问答,也可以通过多轮对话与第三方API集成实现自助服务,如:订单查询,物流跟踪,自助退货机器人等。
    • 智能对话分析 视频简介 - 基于智能规则分析对话录音或对话文本

      能实现从对话录音或者对话文本中,基于智能规则,分析对话内容,挖掘对话中可能存在的问题和机会。能帮助企业提升服务质量、监控舆情风险、优化服务策略,典型应用场景有智能客服质检、销售机会分析等。
    • 阿里云客服 - 历经数年双11高峰考验,蚂蚁智能客服能力输出

      云客服依托大数据平台,凭借数据挖掘,搜索,语音转文本,自然语音处理,机器学习等前沿技术,打造一套完整的智能服务体系。蚂蚁智能客服团队提供技术支持和整体解决方案,历经数年双11高峰考验。Powered by 蚂蚁智能客服

    物联网(IOT):

    • 万物互联,为海量数据构建云端全面的计算能力。
    • 分为物联网平台/低功耗广域网/设备服务/物联安全/相关云产品/生态/标准解决方案
    物联网平台
    • 物联网设备接入 - 提供安全可靠的海量设备连接通信能力

      物联网设备接入提供安全可靠的设备连接通信能力,帮助用户将海量设备数据采集上云,并且云端可以通过调用API,下发数据给设备,实现远程控制海量设备的目的。同时提供了与阿里云众多云产品打通的规则引擎,帮助用户将应用快速集成。
    • 物联网设备管理 - 提供方便快捷的海量设备远程管理能力

      物联网设备管理提供方便快捷的设备管理能力,帮助您在海量设备中快速检索到指定设备,您可以定义设备的属性、事件、服务,基于定义的物模型对设备进行远程调试、远程监控、远程维护等操作。
    • 物联网数据分析 - 提供数据可视化、空间可视化、流计算、大数据能力

      物联网数据分析提供丰富的数据可视化组件、常用统计分析方法及大数据分析工具,致力于降低数据分析门槛,助力广大物联网开发者。 欢迎加入钉钉群交流:21939141
    • 物联网应用开发 (IoT Studio) - 物联网一站式端到端开发平台,快速构建物联网应用

      物联网应用开发 (IoT Studio,原 Link Develop),是阿里云针对物联网场景提供的生产力工具,可覆盖各个物联网行业核心应用场景,帮助您高效经济地完成设备、服务及应用开发。物联网开发服务提供了移动可视化开发、Web 可视化开发、服务开发与设备开发等一系列便捷的物联网开发工具,解决物联网开发领域开发链路长、技术栈复杂、协同成本高、方案移植困难的问题,重新定义物联网应用开发。
    • 物联网资源包 - 多种资源包可以满足您更多需求! 加速物理世界的数字化进程!
    低功耗广域网
    设备服务
    • AliOS Things - IoT 领域的高可伸缩物联网操作系统
    物联安全
    • 物联网安全运营中心 - 持续的监控和保护物联网设备安全

      物联网安全运营中心-Link SOC(Security Operations Center),帮助管理员识别和消除IoT系统潜在的安全风险,保障IoT系统运行过程中的安全性。
    • 物联网可信执行环境 - 为物联网终端应用提供可信计算框架

      物联网可信执行环境-Link TEE(Trusted Execution Environment)为物联网设备提供TEE安全框架和安全应用的全生命周期管理,提供符合Global Platform TEE标准接口的安全、可信执行环境。
    • 物联网可信服务管理 - 为安全芯片提供全生命周期远程管理

      物联网可信服务管理-Link TSM(Trusted Service Manager)是一个面向物联网设备的可信服务聚合与分发的管理平台,降低物联网设备使用可信服务的门槛和成本。
    相关云产品
    • 智联车管理云平台 - 面向智联车领域的车辆全生命周期云端管理平台

      智联车管理云平台(IoV Command Center)是阿里云专门为智联车厂商推出的面向智联车的一站式全生命周期云端管理平台。旨在赋能整车厂转型出行服务商,降低厂商自建成本。
    生态
    标准解决方案
    • 魔笔 - 高效自然书写笔迹数字化,所写即所得
    • 云投屏 - 无需连接任何插线或转接头,连接网络即可将电脑屏幕完整投放到显示屏幕

      应用于会议演示场景,它颠覆了传统投屏模式,无需连接任何插线或转接头,只需要连接网络,在电脑桌面端上操作投屏,即可将电脑屏幕完整投放到显示屏幕上。硬件盒子小巧灵活,部署极简。会议室桌面无连接走线,实现员工无感知部署。
    • 24H自助售药机 视频简介 - 24h自助服务,满足夜间购药需求

      随着消费者购买行为的升级换代,大数据、云计算、物联网技术的普及,人工智能的介入,医药新零售应运而生。24小时ATM式自助售药机是阿里旗下阿里云、饿了么,联合多家知名药厂、连锁药商打造的医药新零售项目,具有多项发明专利和创新功能。该项目定名为阿里赋能药店“一店一窗口”项目,该窗口既是外卖平台24h接单后的提货窗口(骑手输入取货码取货),也是消费者24h自助购药窗口。
    • 仓库猫 视频介绍 - 打造智能安全仓库

      为中小微企业解决仓库的科学监测、信息化、网络化管理等问题的针对性解决方案。可以做到防火监测、防盗监测、防水监测、防潮监测、能够帮助企业快速搭建店铺的监测系统,报警系统,云存储系统。只需要在客户端设置好监控阀值后,系统便能够实现无人监测,数据存储、问题报警及时为管理人员提供行动支撑数据,便于快速处理报警事件,最大限度保障店铺、人员的安全及货品的价值。
    展开全文
  • 朴素贝叶斯(社区恶意留言分类,垃圾邮件分类,新浪新闻分类)代码实现 以下代码为本人学习后,修改或补充后的代码实现,数据集和原代码请参考:https://github.com/Jack-Cherish/Machine-Learning 社区恶意留言分类...

    朴素贝叶斯(西瓜数据集分类,社区恶意留言分类,垃圾邮件分类,新浪新闻分类),AODE分类器 代码实现

    以下代码为本人学习后,修改或补充后的代码实现,数据集和原代码请参考:https://github.com/Jack-Cherish/Machine-Learning

    西瓜数据集分类

    在这里插入图片描述

    import numpy as np
    from math import exp, sqrt, pi
    
    
    def getDataSet():
        dataSet = [
            ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, 1],
            ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, 1],
            ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, 1],
            ['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.608, 0.318, 1],
            ['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.556, 0.215, 1],
            ['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.403, 0.237, 1],
            ['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', 0.481, 0.149, 1],
            ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', 0.437, 0.211, 1],
            ['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', 0.666, 0.091, 0],
            ['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', 0.243, 0.267, 0],
            ['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', 0.245, 0.057, 0],
            ['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', 0.343, 0.099, 0],
            ['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', 0.639, 0.161, 0],
            ['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', 0.657, 0.198, 0],
            ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.360, 0.370, 0],
            ['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', 0.593, 0.042, 0],
            ['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', 0.719, 0.103, 0]
        ]
    
        features = ['色泽', '根蒂', '敲声', '纹理', '脐部', '触感', '密度', '含糖量']
    
        featureDic = {}
        for i in range(len(features)):
            featureList = [example[i] for example in dataSet]
            uniqueFeature = list(set(featureList))
            featureDic[features[i]] = uniqueFeature
    
        dataSet = np.array(dataSet)
        return dataSet, features, featureDic              # 返回数据集,特征词,特征元素
    
    
    def countProLap(dataSet, index, value, classLabel, N):        # 拉普拉斯平滑
        extrData = dataSet[dataSet[:, -1] == classLabel]
        count = 0
        for data in extrData:
            if data[index] == value:
                count += 1
        return (count + 1) / (float(len(extrData)) + N)
    
    
    def trainNB0(dataSet, features, featureDic):
        dict = {}                                          # 求类条件概率
        for feature in features:
            index = features.index(feature)
            dict[feature] = {}
            if feature != '密度' and feature != '含糖量':
                featIList = featureDic[feature]
                for value in featIList:
                    PisCond = countProLap(dataSet, index, value, '1', len(featIList))
                    pNoCond = countProLap(dataSet, index, value, '0', len(featIList))
                    dict[feature][value] = {}
                    dict[feature][value]["是"] = PisCond
                    dict[feature][value]["否"] = pNoCond
            else:
                for label in ['1', '0']:
                    dataExtra = dataSet[dataSet[:, -1] == label]
                    extr = dataExtra[:, index].astype("float64")
                    aver = extr.mean()
                    var = extr.var()
    
                    labelStr = ""
                    if label == '1':
                        labelStr = '是'
                    else:
                        labelStr = '否'
    
                    dict[feature][labelStr] = {}
                    dict[feature][labelStr]["平均值"] = aver
                    dict[feature][labelStr]["方差"] = var
    
        length = len(dataSet)                                 # 求类先验概率
        classLabels = dataSet[:, -1].tolist()
        dict["好瓜"] = {}
        dict["好瓜"]['是'] = (classLabels.count('1') + 1) / (float(length) + 2)
        dict["好瓜"]['否'] = (classLabels.count('0') + 1) / (float(length) + 2)
        return dict
    
    
    def NormDist(mean, var, xi):
        return exp(-((float(xi) - mean) ** 2) / (2 * var)) / (sqrt(2 * pi * var))
    
    
    def classifyNB(data, features, bayesDis):
        pGood = bayesDis['好瓜']['是']
        pBad = bayesDis['好瓜']['否']
        for feature in features:
            index = features.index(feature)
            if feature != '密度' and feature != '含糖量':
                pGood *= bayesDis[feature][data[index]]['是']
                pBad *= bayesDis[feature][data[index]]['否']
            else:
                pGood *= NormDist(bayesDis[feature]['是']['平均值'], bayesDis[feature]['是']['方差'], data[index])
                pBad *= NormDist(bayesDis[feature]['否']['平均值'], bayesDis[feature]['否']['方差'], data[index])
        retClass = ""
        if pGood > pBad:
            retClass = "好瓜"
        else:
            retClass = "坏瓜"
    
        return pGood, pBad, retClass
    
    
    def test_accuracy(dataSet, features, bayesDis):          # 精确率
        cnt = 0.0
        for data in dataSet:
            _, _, pre = classifyNB(data, features, bayesDis)
            if (pre == '好瓜' and data[-1] == '1') or (pre == '坏瓜' and data[-1] == '0'):
                cnt += 1
        return cnt / float(len(dataSet))
    
    
    def main():
        dataSet, features, featureDic = getDataSet()
        dic = trainNB0(dataSet, features,featureDic)
        for each in dic.items():
            print(each)
        p1, p0, pre = classifyNB(dataSet[0], features, dic)
        print(f"p1 = {p1}")
        print(f"p0 = {p0}")
        print(f"pre = {pre}")
        print("train data set accuracy = ", test_accuracy(dataSet, features, dic))
    
    
    if __name__ == '__main__':
        main()
    
    ('色泽', {'乌黑': {'是': 0.45454545454545453, '否': 0.25}, '青绿': {'是': 0.36363636363636365, '否': 0.3333333333333333}, '浅白': {'是': 0.18181818181818182, '否': 0.4166666666666667}})
    ('根蒂', {'硬挺': {'是': 0.09090909090909091, '否': 0.25}, '蜷缩': {'是': 0.5454545454545454, '否': 0.3333333333333333}, '稍蜷': {'是': 0.36363636363636365, '否': 0.4166666666666667}})
    ('敲声', {'浊响': {'是': 0.6363636363636364, '否': 0.4166666666666667}, '清脆': {'是': 0.09090909090909091, '否': 0.25}, '沉闷': {'是': 0.2727272727272727, '否': 0.3333333333333333}})
    ('纹理', {'稍糊': {'是': 0.18181818181818182, '否': 0.4166666666666667}, '模糊': {'是': 0.09090909090909091, '否': 0.3333333333333333}, '清晰': {'是': 0.7272727272727273, '否': 0.25}})
    ('脐部', {'稍凹': {'是': 0.36363636363636365, '否': 0.3333333333333333}, '凹陷': {'是': 0.5454545454545454, '否': 0.25}, '平坦': {'是': 0.09090909090909091, '否': 0.4166666666666667}})
    ('触感', {'硬滑': {'是': 0.7, '否': 0.6363636363636364}, '软粘': {'是': 0.3, '否': 0.36363636363636365}})
    ('密度', {'是': {'平均值': 0.57375, '方差': 0.014608437499999998}, '否': {'平均值': 0.49611111111111117, '方差': 0.03370254320987655}})
    ('含糖量', {'是': {'平均值': 0.27875, '方差': 0.008912437500000002}, '否': {'平均值': 0.1542222222222222, '方差': 0.010328617283950618}})
    ('好瓜', {'是': 0.47368421052631576, '否': 0.5263157894736842})
    p1 = 0.02180124640594357
    p0 = 4.915834021416594e-05
    pre = 好瓜
    train data set accuracy =  0.8235294117647058
    

    社区恶意留言分类

    import numpy as np
    
    
    def loadDataSet():                                                                    # 创建实验样本
        postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],          # 切分的词条
                     ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],
                     ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
                     ['stop', 'posting', 'stupid', 'worthless', 'garbage'],
                     ['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'],
                     ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]
        classVec = [0,1,0,1,0,1]                                                          # 类别标签向量,1代表侮辱性词汇,0代表不是
        return postingList,classVec
    
    
    # 将切分的实验样本词条整理成不重复的词条列表,也就是词汇表,用来将词条向量化
    def createVocabList(dataSet):
        vocabSet = set([])                                    # 创建一个空的不重复集合
        for document in dataSet:
            vocabSet = vocabSet | set(document)               # 取并集
        return list(vocabSet)
    
    
    def setOfWords2Vec(vocabList, inputSet):                  # 根据vocabList词汇表,将inputSet向量化,向量的每个元素为1或0
        returnVec = [0] * len(vocabList)                      # 创建一个其中所含元素都为0的向量
        for word in inputSet:                                 # 遍历每个词条
            if word in vocabList:                             # 如果词条存在于词汇表中,则置1
                returnVec[vocabList.index(word)] = 1
            else: print("the word: %s is not in my Vocabulary!" % word)
        return returnVec                                      # 返回文档向量
    
    
    def trainNB0(trainMatrix,trainCategory):                       # 朴素贝叶斯分类器训练函数
        numTrainDocs = len(trainMatrix)                            # 计算训练的文档数目
        numWords = len(trainMatrix[0])                             # 计算每篇文档的词条数
        pAbusive = sum(trainCategory)/float(numTrainDocs)          # 文档属于侮辱类的概率,相当于先验概率(P(侮辱类))
        p0Num = np.ones(numWords); p1Num = np.ones(numWords)     # 创建numpy.ones数组,拉普拉斯平滑(如果设置为zeros,那么其中一个概率为0,那么最后乘积也为0)
        p0Denom = 2.0; p1Denom = 2.0                               # 分母初始化为2
        for i in range(numTrainDocs):
            if trainCategory[i] == 1:                     # 统计属于侮辱类的条件概率所需的数据,即P(w0|1),P(w1|1),P(w2|1)···
                p1Num += trainMatrix[i]
                p1Denom += sum(trainMatrix[i])
            else:                                     # 统计属于非侮辱类的条件概率所需的数据,即P(w0|0),P(w1|0),P(w2|0)···
                p0Num += trainMatrix[i]
                p0Denom += sum(trainMatrix[i])
        p0Vect = np.log(p0Num/p0Denom)              # 条件概率对数化,防止下溢出
        p1Vect = np.log(p1Num/p1Denom)
        return p0Vect,p1Vect,pAbusive                 # 返回属于非侮辱类的条件概率数组,属于侮辱类的条件概率数组,文档属于侮辱类的概率
    
    
    def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1):         # 朴素贝叶斯分类器分类函数
        p1 = sum(vec2Classify * p1Vec) + np.log(pClass1)             # 对应元素相乘 log(A*B)=log(A)+log(B)
        p0 = sum(vec2Classify * p0Vec) + np.log(1-pClass1)
        print('p0:',p0)
        print('p1:',p1)
        if p1 > p0:
            return 1
        else:
            return 0
    
    
    def testingNB():
        listOPosts,listClasses = loadDataSet()									# 创建实验样本
        myVocabList = createVocabList(listOPosts)								# 创建词汇表
        trainMat=[]
        for postinDoc in listOPosts:
            trainMat.append(setOfWords2Vec(myVocabList, postinDoc))				# 将实验样本向量化
    
        p0V,p1V,pAb = trainNB0(np.array(trainMat),np.array(listClasses))		# 训练朴素贝叶斯分类器
    
        testEntry = ['love', 'my', 'him','so']									# 测试样本1
        thisDoc = np.array(setOfWords2Vec(myVocabList, testEntry))				# 测试样本向量化
        if classifyNB(thisDoc,p0V,p1V,pAb):
            print(testEntry,'属于侮辱类')										    # 执行分类并打印分类结果
        else:
            print(testEntry,'属于非侮辱类')										# 执行分类并打印分类结果
    
        testEntry = ['stupid', 'garbage']										# 测试样本2
        thisDoc = np.array(setOfWords2Vec(myVocabList, testEntry))				# 测试样本向量化
        if classifyNB(thisDoc,p0V,p1V,pAb):
            print(testEntry,'属于侮辱类')										    # 执行分类并打印分类结果
        else:
            print(testEntry,'属于非侮辱类')										# 执行分类并打印分类结果
    
        testEntry = ['I','love','him']                              # 测试样本3
        thisDoc = np.array(setOfWords2Vec(myVocabList, testEntry))              # 测试样本向量化
        if classifyNB(thisDoc, p0V, p1V, pAb):
            print(testEntry, '属于侮辱类')                                        # 执行分类并打印分类结果
        else:
            print(testEntry, '属于非侮辱类')                                      # 执行分类并打印分类结果
    
    
    if __name__ == '__main__':
        testingNB()
    
    p0: -9.854332321737983
    p1: -12.178089750893692
    ['love', 'my', 'him', 'so'] 属于非侮辱类
    p0: -7.20934025660291
    p1: -4.702750514326955
    ['stupid', 'garbage'] 属于侮辱类
    p0: -7.982530144836391
    p1: -9.13356731317027
    ['I', 'love', 'him'] 属于非侮辱类
    
    

    垃圾邮件分类

    import numpy as np
    import random
    import re
    
    
    def createVocabList(dataSet):
        vocabSet = set([])  					                         # 创建一个空的不重复集合
        for document in dataSet:
            vocabSet = vocabSet | set(document)                          # 取并集
        return list(vocabSet)
    
    
    def setOfWords2Vec(vocabList, inputSet):
        returnVec = [0] * len(vocabList)									# 创建一个其中所含元素都为0的向量
        for word in inputSet:												# 遍历每个词条
            if word in vocabList:											# 如果词条存在于词汇表中,则置1
                returnVec[vocabList.index(word)] = 1
            else: print("the word: %s is not in my Vocabulary!" % word)
        return returnVec													# 返回文档向量
    
    
    def bagOfWords2VecMN(vocabList, inputSet):
        returnVec = [0]*len(vocabList)										# 创建一个其中所含元素都为0的向量
        for word in inputSet:												# 遍历每个词条
            if word in vocabList:											# 如果词条存在于词汇表中,则计数加一
                returnVec[vocabList.index(word)] += 1
        return returnVec
    
    
    def trainNB0(trainMatrix,trainCategory):
        numTrainDocs = len(trainMatrix)                         # 计算训练集的数目
        numWords = len(trainMatrix[0])							# 计算每封邮件的词条数
        pAbusive = sum(trainCategory)/float(numTrainDocs)		# 属于垃圾邮件的概率
        p0Num = np.ones(numWords); p1Num = np.ones(numWords)	# 创建numpy.ones数组,词条出现数初始化为1,拉普拉斯平滑
        p0Denom = 2.0; p1Denom = 2.0                        	# 分母初始化为2,拉普拉斯平滑
        for i in range(numTrainDocs):
            if trainCategory[i] == 1:							# 统计属于垃圾类的条件概率所需的数据,即P(w0|1),P(w1|1),P(w2|1)···
                p1Num += trainMatrix[i]
                p1Denom += sum(trainMatrix[i])
            else:												# 统计属于非垃圾类的条件概率所需的数据,即P(w0|0),P(w1|0),P(w2|0)···
                p0Num += trainMatrix[i]
                p0Denom += sum(trainMatrix[i])
        p0Vect = np.log(p0Num/p0Denom)
        p1Vect = np.log(p1Num/p1Denom)							# 取对数,防止下溢出
        return p0Vect,p1Vect,pAbusive							# 返回属于非垃圾类的条件概率数组,属于垃圾类的条件概率数组,邮件属于垃圾类的概率
    
    
    def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1):
        p1 = sum(vec2Classify * p1Vec) + np.log(pClass1)    	# 对应元素相乘。logA * B = logA + logB,所以这里加上log(pClass1)
        p0 = sum(vec2Classify * p0Vec) + np.log(1.0 - pClass1)
        if p1 > p0:
            return 1
        else:
            return 0
    
    
    def textParse(bigString):                                                   # 将字符串转换为字符列表
        # 这里使用\W 或者\W+ 都可以将字符数字串分割开,产生的空字符将会在后面的列表推导式中过滤掉
        listOfTokens = re.split(r'\W+', bigString)                              # 将特殊符号作为切分标志进行字符串切分,即非字母、非数字
        return [tok.lower() for tok in listOfTokens if len(tok) > 2]            # 除了单个字母,例如大写的I,其它单词变成小写
    
    
    def spamTest():
        docList = []; classList = []
        for i in range(1, 26):                                                  # 遍历25个txt文件
            wordList = textParse(open('spam/%d.txt' % i, 'r').read())     # 读取每个垃圾邮件,并字符串转换成字符串列表
            docList.append(wordList)
            classList.append(1)                                                 # 标记垃圾邮件,1表示垃圾文件
            wordList = textParse(open('ham/%d.txt' % i, 'r').read())      # 读取每个非垃圾邮件,并字符串转换成字符串列表
            docList.append(wordList)
            classList.append(0)                                                 # 标记非垃圾邮件,0表示非垃圾文件
    
        vocabList = createVocabList(docList)                                 # 创建词汇表,不重复
    
        errorrate = 0
    
        for i in range(10):                                                         # 迭代10次求平均错误率
            trainingSet = list(range(50)); testSet = []                             # 创建存储训练集的索引值的列表和测试集的索引值的列表
            for i in range(10):                                                     # 从50个邮件中,随机挑选出40个作为训练集,10个做测试集
                randIndex = int(random.uniform(0, len(trainingSet)))                # 随机选取索索引值
                testSet.append(trainingSet[randIndex])                              # 添加测试集的索引值
                del(trainingSet[randIndex])                                         # 在训练集列表中删除添加到测试集的索引值
    
            trainMat = []; trainClasses = []                                        # 创建训练集矩阵和训练集类别标签系向量
            for docIndex in trainingSet:                                            # 遍历训练集
                trainMat.append(setOfWords2Vec(vocabList, docList[docIndex]))       # 将生成的词集模型添加到训练矩阵中
                trainClasses.append(classList[docIndex])                            # 将类别添加到训练集类别标签系向量中
    
            p0V, p1V, pSpam = trainNB0(np.array(trainMat), np.array(trainClasses))  # 训练朴素贝叶斯模型
    
            errorCount = 0                                                          # 错误分类计数
            for docIndex in testSet:                                                # 遍历测试集
                wordVector = setOfWords2Vec(vocabList, docList[docIndex])           # 测试集的词集模型
                if classifyNB(np.array(wordVector), p0V, p1V, pSpam) != classList[docIndex]:    # 如果分类错误
                    errorCount += 1                                                 # 错误计数加1
                    print("分类错误的测试集:",docList[docIndex],end=" ")
                    if classList[docIndex]:
                        print(docList[docIndex], '属于正常文件')
                    else:
                        print(docList[docIndex], '属于垃圾文件')
                elif classifyNB(np.array(wordVector), p0V, p1V, pSpam):
                    print(docList[docIndex], '属于垃圾文件')  # 执行分类并打印分类结果
                else:
                    print(docList[docIndex], '属于正常文件')
            print('错误率:%.2f%%' % (float(errorCount) / len(testSet) * 100))
            errorrate += float(errorCount) / len(testSet) * 100
        print('10次总的错误率为:%.2f%%' % errorrate)
        print('平均错误率为:%.2f%%' % (errorrate / 10))
    
    
    if __name__ == '__main__':
        spamTest()
    
    ['yeah', 'ready', 'may', 'not', 'here', 'because', 'jar', 'jar', 'has', 'plane', 'tickets', 'germany', 'for'] 属于正常文件
    ['arvind', 'thirumalai', 'commented', 'your', 'status', 'arvind', 'wrote', 'you', 'know', 'reply', 'this', 'email', 'comment', 'this', 'status'] 属于正常文件
    ['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
    ['this', 'mail', 'was', 'sent', 'from', 'notification', 'only', 'address', 'that', 'cannot', 'accept', 'incoming', 'mail', 'please', 'not', 'reply', 'this', 'message', 'thank', 'you', 'for', 'your', 'online', 'reservation', 'the', 'store', 'you', 'selected', 'has', 'located', 'the', 'item', 'you', 'requested', 'and', 'has', 'placed', 'hold', 'your', 'name', 'please', 'note', 'that', 'all', 'items', 'are', 'held', 'for', 'day', 'please', 'note', 'store', 'prices', 'may', 'differ', 'from', 'those', 'online', 'you', 'have', 'questions', 'need', 'assistance', 'with', 'your', 'reservation', 'please', 'contact', 'the', 'store', 'the', 'phone', 'number', 'listed', 'below', 'you', 'can', 'also', 'access', 'store', 'information', 'such', 'store', 'hours', 'and', 'location', 'the', 'web', 'http', 'www', 'borders', 'com', 'online', 'store', 'storedetailview_98'] 属于正常文件
    ['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
    ['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
    ['hydrocodone', 'vicodin', 'brand', 'watson', 'vicodin', '750', '195', '120', '570', 'brand', 'watson', '750', '195', '120', '570', 'brand', 'watson', '325', '199', '120', '588', 'noprescription', 'required', 'free', 'express', 'fedex', 'days', 'delivery', 'for', 'over', '200', 'order', 'major', 'credit', 'cards', 'check'] 属于垃圾文件
    分类错误的测试集: ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] 属于正常文件
    ['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
    ['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
    错误率:10.00%
    ['will', 'there', 'the', 'latest'] 属于正常文件
    ['yeah', 'ready', 'may', 'not', 'here', 'because', 'jar', 'jar', 'has', 'plane', 'tickets', 'germany', 'for'] 属于正常文件
    ['thanks', 'peter', 'definitely', 'check', 'this', 'how', 'your', 'book', 'going', 'heard', 'chapter', 'came', 'and', 'was', 'good', 'shape', 'hope', 'you', 'are', 'doing', 'well', 'cheers', 'troy'] 属于正常文件
    ['buy', 'ambiem', 'zolpidem', '5mg', '10mg', 'pill', 'pills', '129', 'pills', '199', '180', 'pills', '430', 'pills', '138', '120', 'pills', '322'] 属于垃圾文件
    ['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
    ['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
    ['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
    分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
    ['bargains', 'here', 'buy', 'phentermin', 'buy', 'genuine', 'phentermin', 'low', 'cost', 'visa', 'accepted', '130', '219', '292', '120', '366', '180', '513'] 属于垃圾文件
    错误率:10.00%
    ['saw', 'this', 'the', 'way', 'the', 'coast', 'thought', 'might', 'like', 'hangzhou', 'huge', 'one', 'day', 'wasn', 'enough', 'but', 'got', 'glimpse', 'went', 'inside', 'the', 'china', 'pavilion', 'expo', 'pretty', 'interesting', 'each', 'province', 'has', 'exhibit'] 属于正常文件
    ['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order', 'save', 'off', 'quality', 'watches'] 属于垃圾文件
    ['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
    ['will', 'there', 'the', 'latest'] 属于正常文件
    ['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
    ['peter', 'sure', 'thing', 'sounds', 'good', 'let', 'know', 'what', 'time', 'would', 'good', 'for', 'you', 'will', 'come', 'prepared', 'with', 'some', 'ideas', 'and', 'can', 'from', 'there', 'regards', 'vivek'] 属于正常文件
    ['bargains', 'here', 'buy', 'phentermin', 'buy', 'genuine', 'phentermin', 'low', 'cost', 'visa', 'accepted', '130', '219', '292', '120', '366', '180', '513'] 属于垃圾文件
    ['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
    错误率:0.00%
    ['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
    ['buyviagra', '25mg', '50mg', '100mg', 'brandviagra', 'femaleviagra', 'from', 'per', 'pill', 'viagranoprescription', 'needed', 'from', 'certified', 'canadian', 'pharmacy', 'buy', 'here', 'accept', 'visa', 'amex', 'check', 'worldwide', 'delivery'] 属于垃圾文件
    ['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
    ['ryan', 'whybrew', 'commented', 'your', 'status', 'ryan', 'wrote', 'turd', 'ferguson', 'butt', 'horn'] 属于正常文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
    ['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
    ['hydrocodone', 'vicodin', 'brand', 'watson', 'vicodin', '750', '195', '120', '570', 'brand', 'watson', '750', '195', '120', '570', 'brand', 'watson', '325', '199', '120', '588', 'noprescription', 'required', 'free', 'express', 'fedex', 'days', 'delivery', 'for', 'over', '200', 'order', 'major', 'credit', 'cards', 'check'] 属于垃圾文件
    ['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
    ['that', 'cold', 'there', 'going', 'retirement', 'party', 'are', 'the', 'leaves', 'changing', 'color'] 属于正常文件
    ['codeine', 'the', 'most', 'competitive', 'price', 'net', 'codeine', 'wilson', '30mg', '156', 'codeine', 'wilson', '30mg', '291', 'freeviagra', 'pills', 'codeine', 'wilson', '30mg', '396', 'freeviagra', 'pills', 'codeine', 'wilson', '30mg', '120', '492', 'freeviagra', 'pills'] 属于垃圾文件
    错误率:0.00%
    ['been', 'working', 'running', 'website', 'using', 'jquery', 'and', 'the', 'jqplot', 'plugin', 'not', 'too', 'far', 'away', 'from', 'having', 'prototype', 'launch', 'you', 'used', 'jqplot', 'right', 'not', 'think', 'you', 'would', 'like'] 属于正常文件
    ['yay', 'you', 'both', 'doing', 'fine', 'working', 'mba', 'design', 'strategy', 'cca', 'top', 'art', 'school', 'new', 'program', 'focusing', 'more', 'right', 'brained', 'creative', 'and', 'strategic', 'approach', 'management', 'the', 'way', 'done', 'today'] 属于正常文件
    ['jay', 'stepp', 'commented', 'your', 'status', 'jay', 'wrote', 'the', 'reply', 'this', 'email', 'comment', 'this', 'status', 'see', 'the', 'comment', 'thread', 'follow', 'the', 'link', 'below'] 属于正常文件
    ['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
    ['ordercializviagra', 'online', 'save', '0nline', 'pharmacy', 'noprescription', 'required', 'buy', 'canadian', 'drugs', 'wholesale', 'prices', 'and', 'save', 'fda', 'approved', 'drugs', 'superb', 'quality', 'drugs', 'only', 'accept', 'all', 'major', 'credit', 'cards'] 属于垃圾文件
    ['there', 'was', 'guy', 'the', 'gas', 'station', 'who', 'told', 'that', 'knew', 'mandarin', 'and', 'python', 'could', 'get', 'job', 'with', 'the', 'fbi'] 属于正常文件
    ['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
    ['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
    ['thought', 'about', 'this', 'and', 'think', 'possible', 'should', 'get', 'another', 'lunch', 'have', 'car', 'now', 'and', 'could', 'come', 'pick', 'you', 'this', 'time', 'does', 'this', 'wednesday', 'work', 'can', 'have', 'signed', 'copy', 'you', 'book'] 属于正常文件
    错误率:0.00%
    ['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
    分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
    ['linkedin', 'julius', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'looking', 'forward', 'the', 'book', 'accept', 'view', 'invitation', 'from', 'julius'] 属于正常文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
    ['ordercializviagra', 'online', 'save', '0nline', 'pharmacy', 'noprescription', 'required', 'buy', 'canadian', 'drugs', 'wholesale', 'prices', 'and', 'save', 'fda', 'approved', 'drugs', 'superb', 'quality', 'drugs', 'only', 'accept', 'all', 'major', 'credit', 'cards'] 属于垃圾文件
    ['been', 'working', 'running', 'website', 'using', 'jquery', 'and', 'the', 'jqplot', 'plugin', 'not', 'too', 'far', 'away', 'from', 'having', 'prototype', 'launch', 'you', 'used', 'jqplot', 'right', 'not', 'think', 'you', 'would', 'like'] 属于正常文件
    ['there', 'was', 'guy', 'the', 'gas', 'station', 'who', 'told', 'that', 'knew', 'mandarin', 'and', 'python', 'could', 'get', 'job', 'with', 'the', 'fbi'] 属于正常文件
    ['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
    ['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
    ['peter', 'the', 'hotels', 'are', 'the', 'ones', 'that', 'rent', 'out', 'the', 'tent', 'they', 'are', 'all', 'lined', 'the', 'hotel', 'grounds', 'much', 'for', 'being', 'one', 'with', 'nature', 'more', 'like', 'being', 'one', 'with', 'couple', 'dozen', 'tour', 'groups', 'and', 'nature', 'have', 'about', '100m', 'pictures', 'from', 'that', 'trip', 'can', 'through', 'them', 'and', 'get', 'you', 'jpgs', 'favorite', 'scenic', 'pictures', 'where', 'are', 'you', 'and', 'jocelyn', 'now', 'new', 'york', 'will', 'you', 'come', 'tokyo', 'for', 'chinese', 'new', 'year', 'perhaps', 'see', 'the', 'two', 'you', 'then', 'will', 'thailand', 'for', 'winter', 'holiday', 'see', 'mom', 'take', 'care'] 属于正常文件
    错误率:10.00%
    ['bargains', 'here', 'buy', 'phentermin', 'buy', 'genuine', 'phentermin', 'low', 'cost', 'visa', 'accepted', '130', '219', '292', '120', '366', '180', '513'] 属于垃圾文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe', 'the', 'proven', 'naturalpenisenhancement', 'that', 'works', '100', 'moneyback', 'guaranteeed'] 属于垃圾文件
    ['scifinance', 'now', 'automatically', 'generates', 'gpu', 'enabled', 'pricing', 'risk', 'model', 'source', 'code', 'that', 'runs', '300x', 'faster', 'than', 'serial', 'code', 'using', 'new', 'nvidia', 'fermi', 'class', 'tesla', 'series', 'gpu', 'scifinance', 'derivatives', 'pricing', 'and', 'risk', 'model', 'development', 'tool', 'that', 'automatically', 'generates', 'and', 'gpu', 'enabled', 'source', 'code', 'from', 'concise', 'high', 'level', 'model', 'specifications', 'parallel', 'computing', 'cuda', 'programming', 'expertise', 'required', 'scifinance', 'automatic', 'gpu', 'enabled', 'monte', 'carlo', 'pricing', 'model', 'source', 'code', 'generation', 'capabilities', 'have', 'been', 'significantly', 'extended', 'the', 'latest', 'release', 'this', 'includes'] 属于正常文件
    分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
    ['yay', 'you', 'both', 'doing', 'fine', 'working', 'mba', 'design', 'strategy', 'cca', 'top', 'art', 'school', 'new', 'program', 'focusing', 'more', 'right', 'brained', 'creative', 'and', 'strategic', 'approach', 'management', 'the', 'way', 'done', 'today'] 属于正常文件
    ['what', 'going', 'there', 'talked', 'john', 'email', 'talked', 'about', 'some', 'computer', 'stuff', 'that', 'went', 'bike', 'riding', 'the', 'rain', 'was', 'not', 'that', 'cold', 'went', 'the', 'museum', 'yesterday', 'was', 'get', 'and', 'they', 'had', 'free', 'food', 'the', 'same', 'time', 'was', 'giants', 'game', 'when', 'got', 'done', 'had', 'take', 'the', 'train', 'with', 'all', 'the', 'giants', 'fans', 'they', 'are', 'drunk'] 属于正常文件
    ['benoit', 'mandelbrot', '1924', '2010', 'benoit', 'mandelbrot', '1924', '2010', 'wilmott', 'team', 'benoit', 'mandelbrot', 'the', 'mathematician', 'the', 'father', 'fractal', 'mathematics', 'and', 'advocate', 'more', 'sophisticated', 'modelling', 'quantitative', 'finance', 'died', '14th', 'october', '2010', 'aged', 'wilmott', 'magazine', 'has', 'often', 'featured', 'mandelbrot', 'his', 'ideas', 'and', 'the', 'work', 'others', 'inspired', 'his', 'fundamental', 'insights', 'you', 'must', 'logged', 'view', 'these', 'articles', 'from', 'past', 'issues', 'wilmott', 'magazine'] 属于正常文件
    ['peter', 'sure', 'thing', 'sounds', 'good', 'let', 'know', 'what', 'time', 'would', 'good', 'for', 'you', 'will', 'come', 'prepared', 'with', 'some', 'ideas', 'and', 'can', 'from', 'there', 'regards', 'vivek'] 属于正常文件
    ['that', 'cold', 'there', 'going', 'retirement', 'party', 'are', 'the', 'leaves', 'changing', 'color'] 属于正常文件
    ['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
    错误率:10.00%
    ['peter', 'the', 'hotels', 'are', 'the', 'ones', 'that', 'rent', 'out', 'the', 'tent', 'they', 'are', 'all', 'lined', 'the', 'hotel', 'grounds', 'much', 'for', 'being', 'one', 'with', 'nature', 'more', 'like', 'being', 'one', 'with', 'couple', 'dozen', 'tour', 'groups', 'and', 'nature', 'have', 'about', '100m', 'pictures', 'from', 'that', 'trip', 'can', 'through', 'them', 'and', 'get', 'you', 'jpgs', 'favorite', 'scenic', 'pictures', 'where', 'are', 'you', 'and', 'jocelyn', 'now', 'new', 'york', 'will', 'you', 'come', 'tokyo', 'for', 'chinese', 'new', 'year', 'perhaps', 'see', 'the', 'two', 'you', 'then', 'will', 'thailand', 'for', 'winter', 'holiday', 'see', 'mom', 'take', 'care'] 属于正常文件
    分类错误的测试集: ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] ['oem', 'adobe', 'microsoft', 'softwares', 'fast', 'order', 'and', 'download', 'microsoft', 'office', 'professional', 'plus', '2007', '2010', '129', 'microsoft', 'windows', 'ultimate', '119', 'adobe', 'photoshop', 'cs5', 'extended', 'adobe', 'acrobat', 'pro', 'extended', 'windows', 'professional', 'thousand', 'more', 'titles'] 属于正常文件
    ['linkedin', 'kerry', 'haloney', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'like', 'add', 'you', 'professional', 'network', 'linkedin', 'kerry', 'haloney'] 属于正常文件
    ['will', 'there', 'the', 'latest'] 属于正常文件
    ['hello', 'since', 'you', 'are', 'owner', 'least', 'one', 'google', 'groups', 'group', 'that', 'uses', 'the', 'customized', 'welcome', 'message', 'pages', 'files', 'are', 'writing', 'inform', 'you', 'that', 'will', 'longer', 'supporting', 'these', 'features', 'starting', 'february', '2011', 'made', 'this', 'decision', 'that', 'can', 'focus', 'improving', 'the', 'core', 'functionalities', 'google', 'groups', 'mailing', 'lists', 'and', 'forum', 'discussions', 'instead', 'these', 'features', 'encourage', 'you', 'use', 'products', 'that', 'are', 'designed', 'specifically', 'for', 'file', 'storage', 'and', 'page', 'creation', 'such', 'google', 'docs', 'and', 'google', 'sites', 'for', 'example', 'you', 'can', 'easily', 'create', 'your', 'pages', 'google', 'sites', 'and', 'share', 'the', 'site', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '174623', 'with', 'the', 'members', 'your', 'group', 'you', 'can', 'also', 'store', 'your', 'files', 'the', 'site', 'attaching', 'files', 'pages', 'http', 'www', 'google', 'com', 'support', 'sites', 'bin', 'answer', 'answer', '90563', 'the', 'site', 'you抮e', 'just', 'looking', 'for', 'place', 'upload', 'your', 'files', 'that', 'your', 'group', 'members', 'can', 'download', 'them', 'suggest', 'you', 'try', 'google', 'docs', 'you', 'can', 'upload', 'files', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '50092', 'and', 'share', 'access', 'with', 'either', 'group', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '66343', 'individual', 'http', 'docs', 'google', 'com', 'support', 'bin', 'answer', 'answer', '86152', 'assigning', 'either', 'edit', 'download', 'only', 'access', 'the', 'files', 'you', 'have', 'received', 'this', 'mandatory', 'email', 'service', 'announcement', 'update', 'you', 'about', 'important', 'changes', 'google', 'groups'] 属于正常文件
    ['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
    ['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
    ['yeah', 'ready', 'may', 'not', 'here', 'because', 'jar', 'jar', 'has', 'plane', 'tickets', 'germany', 'for'] 属于正常文件
    ['peter', 'sure', 'thing', 'sounds', 'good', 'let', 'know', 'what', 'time', 'would', 'good', 'for', 'you', 'will', 'come', 'prepared', 'with', 'some', 'ideas', 'and', 'can', 'from', 'there', 'regards', 'vivek'] 属于正常文件
    错误率:10.00%
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
    ['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
    ['that', 'cold', 'there', 'going', 'retirement', 'party', 'are', 'the', 'leaves', 'changing', 'color'] 属于正常文件
    ['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order'] 属于垃圾文件
    ['percocet', '625', 'withoutprescription', 'tabs', '225', 'percocet', 'narcotic', 'analgesic', 'used', 'treat', 'moderate', 'moderately', 'severepain', 'top', 'quality', 'express', 'shipping', '100', 'safe', 'discreet', 'private', 'buy', 'cheap', 'percocet', 'online'] 属于垃圾文件
    ['hydrocodone', 'vicodin', 'brand', 'watson', 'vicodin', '750', '195', '120', '570', 'brand', 'watson', '750', '195', '120', '570', 'brand', 'watson', '325', '199', '120', '588', 'noprescription', 'required', 'free', 'express', 'fedex', 'days', 'delivery', 'for', 'over', '200', 'order', 'major', 'credit', 'cards', 'check'] 属于垃圾文件
    分类错误的测试集: ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] ['home', 'based', 'business', 'opportunity', 'knocking', 'your', 'door', 'don抰', 'rude', 'and', 'let', 'this', 'chance', 'you', 'can', 'earn', 'great', 'income', 'and', 'find', 'your', 'financial', 'life', 'transformed', 'learn', 'more', 'here', 'your', 'success', 'work', 'from', 'home', 'finder', 'experts'] 属于正常文件
    ['peter', 'with', 'jose', 'out', 'town', 'you', 'want', 'meet', 'once', 'while', 'keep', 'things', 'going', 'and', 'some', 'interesting', 'stuff', 'let', 'know', 'eugene'] 属于正常文件
    ['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
    分类错误的测试集: ['benoit', 'mandelbrot', '1924', '2010', 'benoit', 'mandelbrot', '1924', '2010', 'wilmott', 'team', 'benoit', 'mandelbrot', 'the', 'mathematician', 'the', 'father', 'fractal', 'mathematics', 'and', 'advocate', 'more', 'sophisticated', 'modelling', 'quantitative', 'finance', 'died', '14th', 'october', '2010', 'aged', 'wilmott', 'magazine', 'has', 'often', 'featured', 'mandelbrot', 'his', 'ideas', 'and', 'the', 'work', 'others', 'inspired', 'his', 'fundamental', 'insights', 'you', 'must', 'logged', 'view', 'these', 'articles', 'from', 'past', 'issues', 'wilmott', 'magazine'] ['benoit', 'mandelbrot', '1924', '2010', 'benoit', 'mandelbrot', '1924', '2010', 'wilmott', 'team', 'benoit', 'mandelbrot', 'the', 'mathematician', 'the', 'father', 'fractal', 'mathematics', 'and', 'advocate', 'more', 'sophisticated', 'modelling', 'quantitative', 'finance', 'died', '14th', 'october', '2010', 'aged', 'wilmott', 'magazine', 'has', 'often', 'featured', 'mandelbrot', 'his', 'ideas', 'and', 'the', 'work', 'others', 'inspired', 'his', 'fundamental', 'insights', 'you', 'must', 'logged', 'view', 'these', 'articles', 'from', 'past', 'issues', 'wilmott', 'magazine'] 属于垃圾文件
    错误率:20.00%
    ['been', 'working', 'running', 'website', 'using', 'jquery', 'and', 'the', 'jqplot', 'plugin', 'not', 'too', 'far', 'away', 'from', 'having', 'prototype', 'launch', 'you', 'used', 'jqplot', 'right', 'not', 'think', 'you', 'would', 'like'] 属于正常文件
    ['zach', 'hamm', 'commented', 'your', 'status', 'zach', 'wrote', 'doggy', 'style', 'enough', 'said', 'thank', 'you', 'good', 'night'] 属于正常文件
    ['buy', 'ambiem', 'zolpidem', '5mg', '10mg', 'pill', 'pills', '129', 'pills', '199', '180', 'pills', '430', 'pills', '138', '120', 'pills', '322'] 属于垃圾文件
    ['linkedin', 'kerry', 'haloney', 'requested', 'add', 'you', 'connection', 'linkedin', 'peter', 'like', 'add', 'you', 'professional', 'network', 'linkedin', 'kerry', 'haloney'] 属于正常文件
    ['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
    ['buyviagra', '25mg', '50mg', '100mg', 'brandviagra', 'femaleviagra', 'from', 'per', 'pill', 'viagranoprescription', 'needed', 'from', 'certified', 'canadian', 'pharmacy', 'buy', 'here', 'accept', 'visa', 'amex', 'check', 'worldwide', 'delivery'] 属于垃圾文件
    ['codeine', '15mg', 'for', '203', 'visa', 'only', 'codeine', 'methylmorphine', 'narcotic', 'opioid', 'pain', 'reliever', 'have', '15mg', '30mg', 'pills', '15mg', 'for', '203', '15mg', 'for', '385', '15mg', 'for', '562', 'visa', 'only'] 属于垃圾文件
    ['thanks', 'peter', 'definitely', 'check', 'this', 'how', 'your', 'book', 'going', 'heard', 'chapter', 'came', 'and', 'was', 'good', 'shape', 'hope', 'you', 'are', 'doing', 'well', 'cheers', 'troy'] 属于正常文件
    ['get', 'off', 'online', 'watchesstore', 'discount', 'watches', 'for', 'all', 'famous', 'brands', 'watches', 'arolexbvlgari', 'dior', 'hermes', 'oris', 'cartier', 'and', 'more', 'brands', 'louis', 'vuitton', 'bags', 'wallets', 'gucci', 'bags', 'tiffany', 'jewerly', 'enjoy', 'full', 'year', 'warranty', 'shipment', 'via', 'reputable', 'courier', 'fedex', 'ups', 'dhl', 'and', 'ems', 'speedpost', 'you', 'will', '100', 'recieve', 'your', 'order', 'save', 'off', 'quality', 'watches'] 属于垃圾文件
    ['you', 'have', 'everything', 'gain', 'incredib1e', 'gains', 'length', 'inches', 'yourpenis', 'permanantly', 'amazing', 'increase', 'thickness', 'yourpenis', 'betterejacu1ation', 'control', 'experience', 'rock', 'harderecetions', 'explosive', 'intenseorgasns', 'increase', 'volume', 'ofejacu1ate', 'doctor', 'designed', 'and', 'endorsed', '100', 'herbal', '100', 'natural', '100', 'safe'] 属于垃圾文件
    错误率:0.00%
    10次总的错误率为:70.00%
    平均错误率为:7.00%
    

    新浪新闻分类

    from sklearn.naive_bayes import MultinomialNB
    import matplotlib.pyplot as plt
    import os
    import random
    import jieba
    
    
    def TextProcessing(folder_path, test_size=0.2):
        folder_list = os.listdir(folder_path)                  # 查看folder_path下的文件
        data_list = []  # 数据集数据
        class_list = []  # 数据集类别
    
        # 遍历每个子文件夹
        for folder in folder_list:
            new_folder_path = os.path.join(folder_path, folder)    # 根据子文件夹,生成新的路径
            files = os.listdir(new_folder_path)                    # 存放子文件夹下的txt文件的列表
    
            j = 1
            for file in files:   # 遍历每个txt文件
                if j > 100:      # 每类txt样本数最多100个
                    break
                with open(os.path.join(new_folder_path, file), 'r', encoding='utf-8') as f:    # 打开txt文件
                    raw = f.read()
    
                word_cut = jieba.cut(raw, cut_all=False)      # 精简模式,返回一个可迭代的generator
                word_list = list(word_cut)                    # generator转换为list
    
                data_list.append(word_list)             # 添加数据集数据
                class_list.append(folder)               # 添加数据集类别
                j += 1
    
        data_class_list = list(zip(data_list, class_list))   # zip压缩合并,将数据与标签对应压缩
        random.shuffle(data_class_list)                   # 将data_class_list乱序
        index = int(len(data_class_list) * test_size) + 1  # 训练集和测试集切分的索引值
        train_list = data_class_list[index:]        # 训练集
        test_list = data_class_list[:index]           # 测试集
        train_data_list, train_class_list = zip(*train_list)    # 训练集解压缩
        test_data_list, test_class_list = zip(*test_list)     # 测试集解压缩
    
        all_words_dict = {}                # 统计训练集词频,建立一个空字典,键值对
        for word_list in train_data_list:     # 遍历每个列表
            for word in word_list:              # 遍历每个单词
                 if word in all_words_dict.keys():
                    all_words_dict[word] += 1
                 else:
                    all_words_dict[word] = 1
        # 根据键的值倒序排序
        all_words_tuple_list = sorted(all_words_dict.items(), key=lambda f: f[1], reverse=True)   # sorted返回的是一个新的列表
        all_words_list, all_words_nums = zip(*all_words_tuple_list)  # 解压缩
        all_words_list = list(all_words_list)  # 转换成列表
        return all_words_list, train_data_list, test_data_list, train_class_list, test_class_list   # 训练词汇表,训练集,测试集,训练标签,测试标签
    
    
    def MakeWordsSet(words_file):
        words_set = set()      # 创建set集合
        with open(words_file, 'r', encoding='utf-8') as f:  # 打开文件
            for line in f.readlines():  # 一行一行读取
                word = line.strip()  # 去回车
                if len(word) > 0:  # 有文本,则添加到words_set中
                    words_set.add(word)
        return words_set  # 返回处理结果
    
    
    # 根据feature_words将文本向量化
    def TextFeatures(train_data_list, test_data_list, feature_words):
        def text_features(text, feature_words):  # 出现在特征集中,则置1
            text_words = set(text)                     # 首先对text去重,没有重复的值,作为词汇表
            features = [1 if word in text_words else 0 for word in feature_words]
            return features
    
        train_feature_list = [text_features(text, feature_words) for text in train_data_list]
        test_feature_list = [text_features(text, feature_words) for text in test_data_list]
        return train_feature_list, test_feature_list  # 训练集,测试集向量化
    
    
    def words_dict(all_words_list, deleteN, stopwords_set):
        feature_words = []  # 特征列表
        n = 1
        for t in range(deleteN, len(all_words_list), 1):
            if n > 1000:  # feature_words的维度为1000
                break
            # 如果这个词不是数字,并且不是指定的结束语,并且单词长度大于1小于5,那么这个词就可以作为特征词
            if not all_words_list[t].isdigit() and all_words_list[t] not in stopwords_set and 1 < len(all_words_list[t]) < 5:
                feature_words.append(all_words_list[t])
            n += 1
        return feature_words
    
    
    # 新闻分类器
    def TextClassifier(train_feature_list, test_feature_list, train_class_list, test_class_list):
        classifier = MultinomialNB().fit(train_feature_list, train_class_list)
        test_accuracy = classifier.score(test_feature_list, test_class_list)
        return test_accuracy
    
    if __name__ == '__main__':
        # 文本预处理
        folder_path = './SogouC/Sample'  # 训练集存放地址
        all_words_list, train_data_list, test_data_list, train_class_list, test_class_list = TextProcessing(folder_path)
        # 生成stopwords_set
        stopwords_file = './stopwords_cn.txt'
        stopwords_set = MakeWordsSet(stopwords_file)
    
        test_accuracy_list = []
        '''
        deleteNs = range(0, 1000, 20)  # 0 20 40 60 ... 980
        for deleteN in deleteNs:
            feature_words = words_dict(all_words_list, deleteN, stopwords_set)
            train_feature_list, test_feature_list = TextFeatures(train_data_list, test_data_list, feature_words)
            test_accuracy = TextClassifier(train_feature_list, test_feature_list, train_class_list, test_class_list)
            test_accuracy_list.append(test_accuracy)
        '''
        feature_words = words_dict(all_words_list, 450, stopwords_set)
        train_feature_list, test_feature_list = TextFeatures(train_data_list, test_data_list, feature_words)
        test_accuracy = TextClassifier(train_feature_list, test_feature_list, train_class_list, test_class_list)
        test_accuracy_list.append(test_accuracy)
        ave = lambda c: sum(c) / len(c)
        print(ave(test_accuracy_list))
    
        clt = MultinomialNB()
        clt.fit(train_feature_list,train_class_list)
        final_class_list = list(zip(test_data_list, clt.predict(test_feature_list)))     # zip压缩合并,将测试数据与标签对应压缩
        for each in final_class_list:
            print(each)
        '''
        plt.figure()
        plt.plot(deleteNs, test_accuracy_list)
        plt.title('Relationship of deleteNs and test_accuracy')
        plt.xlabel('deleteNs')
        plt.ylabel('test_accuracy')
        plt.show()
        '''
    
    0.5263157894736842
    (['\u3000', '\u3000', '本报讯', ' ', '全球', '最大', '个人电脑', '制造商', '戴尔公司', '8', '日', '说', ',', '由于', '市场竞争', '激烈', ',', '以及', '定价', '策略', '不当', ',', '该', '公司', '今年', '第一季度', '盈利', '预计', '有所', '下降', '。', '消息', '发布', '之后', ',', '戴尔', '股价', '一度', '下跌', '近', '6', '%', ',', '创下', '一年', '来', '的', '新低', '。', '\n', '\u3000', '\u3000', '戴尔公司', '估计', ',', '其', '第一季度', '收入', '约', '为', '1', '4', '2', '亿美元', ',', '每股', '收益', '3', '3', '美分', '。', '此前', '公司', '预测', '当季', '收入', '为', '1', '4', '2', '亿至', '1', '4', '6', '亿美元', ',', '每股', '收益', '3', '6', '至', '3', '8', '美分', ',', '而', '分析师', '平均', '预测', '戴尔', '同期', '收入', '为', '1', '4', '5', '.', '2', '亿美元', ',', '每股', '收益', '3', '8', '美分', '。', '\n', '\u3000', '\u3000', '为', '抢夺', '失去', '的', '市场份额', ',', '戴尔公司', '一些', '产品', '打折', '力度', '很大', '。', '戴尔公司', '首席', '执行', '官凯文', '·', '罗林斯', '在', '一份', '声明', '中说', ',', '公司', '在', '售后服务', '和', '产品质量', '方面', '一直', '在', '投资', ',', '同时', '不断', '下调', '价格', '。', '戴尔公司', '将', '于', '5', '月', '1', '8', '日', '公布', '第一季度', '的', '财报', '。'], 'C000010')
    (['\n', '\u3000', '\u3000', '刚刚', '在', '上', '周六', '以', '0', '比', '2', '惨败', '在', '长春队', '脚下', '的', '沈足', ',', '今天下午', '将', '在', '客场', '挑战', '升班马', '厦门', '蓝狮', ',', '尽管', '在', '此前', ',', '沈足', '曾', '在', '换帅', '之后', '创造', '了', '三连胜', '和', '四轮', '不败', '的', '骄人', '战绩', ',', '但', '随着', '上', '一轮', '主场', '失利', ',', '使得', '沈足', '刚刚', '赢来', '的', '保级', '优势', '顿时', '化为乌有', ',', '对此', ',', '沈足', '俱乐部', '总经理', '何兵', '表示', ':', '“', '过去', '的', '胜利', '已经', '成为', '过去', ',', '我们', '现在', '必须', '要', '冷静', '地', '面对现实', ',', '从', '现在', '开始', ',', '我们', '打', '的', '每', '一场', '比赛', '都', '是', '保级战', ',', '特别', '是', '跟', '厦门', '这样', '的', '保级', '球队', '作战', ',', '我们', '更是', '要', '全力', '争胜', '。', '”', '\n', '\u3000', '\u3000', '为了', '提前', '适应', '厦门', '当地', '的', '天气', '和', '场地', ',', '沈足', '在', '本周一', '就', '抵达', '厦门', ',', '开始', '了', '赛前', '备战', ',', '尽管', '在', '上', '一轮', '遭遇', '惨败', ',', '但', '沈足', '将士', '却', '并', '没有', '因此', '灰心丧气', ',', '相反', ',', '随着', '许博', '、', '普科', '两名', '绝对', '主力', '的', '回归', ',', '全队', '对', '本轮', '挑战', '厦门', '蓝狮', '充满', '了', '必胜', '的', '信心', ',', '场上', '队长', '汪强', '告诉', '记者', ':', '“', '我们', '上', '一轮', '输给', '长春', '其实', '很', '正常', ',', '一方面', '我们', '缺少', '了', '两名', '主力', '队员', ',', '另一方面', '今年', '长春队', '非常', '强', ',', '他们', '现在', '排名', '第二', '就', '足以', '说明', '他们', '非常', '有', '实力', '。', '不过', ',', '本轮', '和', '厦门队', '比赛', ',', '我们', '还是', '非常', '有', '信心', '拿', '下来', ',', '今年', '厦门队', '的', '实力', '并', '不是', '很强', ',', '虽然', '客场', '比赛', '有些', '困难', ',', '但', '我们', '全队', '的', '目标', '非常', '明确', ',', '就是', '全取', '3', '分', ',', '最坏', '也', '要', '带', '着', '1', '分', '回来', '。', '”', '\n', '\u3000', '\u3000', '许博', '和', '普科', '的', '回归', '也', '令', '主教练', '库夫曼', '感到', '非常高兴', ',', '因为', '他', '又', '可以', '派出', '他', '最', '满意', '的', '主力阵容', '出战', '。', '对于', '今天', '的', '比赛', ',', '库夫曼', '表示', ':', '“', '厦门队', '已经', '几轮', '没有', '赢球', '了', ',', '我', '想', '他们', '对', '这场', '比赛', '也', '会', '虎视眈眈', ',', '但', '中国', '有句', '俗话', '是', '狭路相逢', '勇者胜', ',', '到时候', '就', '看', '我们', '谁', '更', '顽强', '吧', '。', '”', '\n', '\u3000', '\u3000', '本报记者', '刘淼', '报道'], 'C000014')
    (['\u3000', '\u3000', '科龙德', '勤案', '又', '有', '新进展', ':', '已有', '多位', '科龙', 'H股', '股东', '到', '律师', '处', '咨询', '、', '登记', ',', '所涉', '股份', '达', '200', '余万股', '。', '而', '这些', '投资者', '正在', '为', '等待', '提起', '民事', '赔偿', '所', '需', '的', '前置条件', '焦急', '等待', '。', '\n', '\u3000', '\u3000', '4', '月', '29', '日', ',', '上海', '新', '望闻达', '律师', '事务所律师', '宋一欣', '、', '秦桢凯', '在', '中国', '证券', '网上', '发表', '了', '《', '向', '境内', '外科', '龙', 'H股', '投资者', '征集', '民事', '赔偿', '诉讼', '代理', '的', '启事', '》', ',', '全面', '接受', '科龙电器', '流通', 'H股', '及', 'A股', '投资者', '的', '诉讼', '及', '仲裁', '委托', '代理', '事项', '。', '宋一欣', '律师', '告诉', '《', '上海', '证券报', '》', '记者', ',', '“', '《', '启事', '》', '刊登', '当天', ',', '就', '有', 'H股', '股东', '前来', '咨询', '登记', ',', '由于', '五一', '长假', ',', '事务所', '休息', ',', '许多', 'H股', '股东', '想方设法', '找到', '我', '的', '电子信箱', '同', '我', '联系', '。', '截至', '今天', ',', '已有', '七八位', 'H股', '股东', '前来', '咨询', '、', '登记', ',', '所', '涉及', '股份', '己', '达', '50', '余万股', ',', '损失', '金额', '有待', '统计', '。', '这些', 'H股', '股东', '中有', '境外', '居民', '。', '他们', '正', '焦急', '等待', '此案', '前置程序', '的', '满足', '。', '”', '\n', '\u3000', '\u3000', '首位', '代表', '科龙', '股东', '状告', '德勤', '的', '上海市', '光明', '律师', '事务所', '南京', '分', '所', '律师', '涂勇则', '向', '记者', '透露', ':', '“', '多位', '科龙', 'H股', '股东', '前来', '向', '我', '咨询', '起诉', '事宜', '。', '其中', '一位', '就', '持有', '150', '万股', '科龙', 'H股', ',', '持股', '成本', '高达', '300', '多万元', '。', '他', '非常', '渴望', '前置程序', '能', '尽快', '满足', ',', '以便', '诉上', '公堂', '。', '”', '\n', '\u3000', '\u3000', '据', '宋一欣', '介绍', ',', '“', '根据', '最高人民法院', '司法解释', '的', '规定', ',', '提起', '虚假', '陈述', '民事', '赔偿', '诉讼', '必须', '满足', '前置条件', ',', '即', '中国证监会', '或', '财政部', '的', '行政处罚', '决定', ',', '或', '有关', '法院', '认定', '有罪', '并', '生效', '的', '刑事', '判决书', ',', '两者', '以先', '出台', '者', '为准', '。', '”', '\n', '\u3000', '\u3000', '“', '在', '科龙案', '中', ',', '中国证监会', '已经', '对', '科龙电器', '与', '德勤', '会计师', '事务所', '进行', '了', '行政处罚', '前', '的', '听证', '程序', ',', '如果', '没有', '意外', ',', '估计', '今年', '上半年', '内', '行政处罚', '决定', '将', '出台', ';', '而', '顾雏军', '编制', '虚假', '财务报告', '罪案', '已经', '被', '广东省', '佛山市', '人民检察院', '立案', '、', '即将', '提起公诉', ',', '刑事', '审判', '在', '即', '。', '因此', ',', '包括', 'H股', '股东', '在内', '的', '科龙电器', '权益', '受损', '的', '投资者', '提起', '民事', '赔偿', '应该', '不成问题', ',', '只是', '需要', '等待', ',', '万事俱备', '、', '只欠东风', '。', '”', '宋一欣', '进一步', '解释', '道', '。', '\n', '\u3000', '\u3000', '谈及', '此案', '的', '被告', ',', '宋一欣', '表示', ',', '“', '科龙电器', '虚假', '陈述', '可', '涉及', '很多', '被告', ',', '如', '科龙电器', '公司', ';', '顾雏军', '等', '原', '董事', '、', '高管', '人员', '及', '直接', '责任人员', ';', '存在', '失职', '的', '原', '监事会', '成员', '和', '独立', '董事', ';', '进行', '审计', '的', '会计师', '事务所', '(', '会计师', '行', ')', '及其', '承担责任', '的', '合伙人', '、', '相关', '注册', '会计师', ';', '由于', '虚假', '陈述', '而', '获益', '的', '关联', '企业', '、', '控股', '股东', '等', '。', '但', '主要', '被告', '有', '三', ',', '即', '科龙电器', '公司', '、', '顾雏军', '、', '德勤华', '永', '会计师', '事务所', '(', 'A股', '股东', ')', '或德勤', '·', '关黄陈', '会计师', '行', '(', 'H股', '股东', ')', '。', '”', '\n', '\u3000', '\u3000', '宋一欣', '称', ',', '“', '证券', '民事', '赔偿', '诉讼', '应当', '采取', '目前', '《', '民事', '诉讼法', '》', '规定', '的', '共同', '诉讼', '方式', ',', '科龙案', '也', '是', '如此', '。', '以', '共同', '诉讼', '提起', '的', '原告', '由于', '合并', '后', '按', '比例', '计算', '诉讼费', ',', '故其', '支出', '的', '诉讼费', '要', '比', '单独', '诉讼', '提起', '的', '原告', '所', '支付', '的', '诉讼费', '要少', '。', '所以', ',', '作为', '代理律师', ',', '从', '投资者', '的', '角度', '考虑', ',', '我', '需要', '筹集', '到', '一定', '数量', '投资者', '委托', '后', '才', '安排', '起诉', '。', '”', '(', '本报记者', ' ', '岳敬飞', ' ', '何军', ')'], 'C000013')
    (['\n', '\u3000', '\u3000', '【', '来源', ':', ' ', '太奇', 'MBA', '】', '\n', '\u3000', '\u3000', '数学', '各门', '课', '的', '特点', '及', '复习', '对策', '\n', '\u3000', '\u3000', '从', '考生', '总结', '一句', '话', ':', '得数', '学者', '得', '天下', '。', '在', '复习', '的', '过程', '中', ',', '要', '针对', '不同', '的', '课程', '复习', '特点', '进行', '复习', '。', '初数', '部分', '知识点', '少', '(', '主要', '就是', '绝对值', ',', '不等式', '和', '方程', ',', '数列', ',', ')', ',', '概念', '简单', '(', '大部分', '都', '是', '在', '高', '中学', '过', '的', ')', ',', '技巧性', '强', '(', '同样', '一种', '题', '可以', '用', '很', '多种', '方法', '去', '分析', ')', ',', '题型', '变换', '性强', '(', '同一个', '知识点', '可以', '引申', '出', '很多', '题型', ')', ',', '所以', '这部分', '考试', '容易', '失分', ',', '做题', '的', '时候', '一定', '要', '细心', '。', '每年', '考试', '往往', '不是', '最难', '的', '部分', '如', '微积分', '失分', '最', '多', ',', '而是', '初等数学', '部分', '失分', '最', '多', ',', '稍微', '一不留神', '就会少', '考虑', '一个', '条件', '。', '初数', '部分', '的', '复习', '对策', '就是', '抓', '重点', ',', '也', '就是', '抓', '必考题', '型', '(', '如', '绝对值', '、', '不等式', '和', '方程', '、', '数列', '每年', '必考', ')', ',', '然后', '以点带面', ',', '复习', '其它', '次', '重点', '的', '部分', '(', '比如', '二项式', '定理', '、', '比', '和', '比例', ')', '。', '在', '平时', '做', '这部分', '练习', '的', '时候', ',', '大家', '一定', '要', '开阔', '自己', '的', '思路', ',', '千万', '不要', '一', '上来', '就', '按', '传统', '的', '方法', '求解', '。', '比如', '有', '一道', '题', '是', '这样', '的', ':', '用', '绳子', '量井深', ',', '把', '绳子', '折于', '三折', ',', '井外', '余绳', ' ', '\n', '4', ' ', '尺', ',', '把', '绳子', '折于', '四折', ',', '井外', '余绳', ' ', '1', ' ', '\n', '尺', ',', '求井深', '?', '很多', '同学', '在', '做', '这道题', '的', '时候', ',', '一', '上来', '就', '设', '两个', '未知', '变量', ',', '列', '方程组', ',', '然后', '费', '了', '很', '长时间', '才', '把', '答案', '解', '出来', '。', '其实', '你', '考虑一下', ',', '当', '三折', '量井', '的', '时候', ',', '相当于', '余绳', ' ', '3', '×', '4', ' ', '=', ' ', '\n', '12', ' ', '尺', ',', '当', '四折', '量井', '的', '时候', ',', '相当于', '余绳', ' ', '4', '×', '1', ' ', '=', ' ', '4', ' ', '尺', ',', '然后', '口', '算', '出井', '深', '为', ' ', '12', ' ', '-', ' ', '4', ' ', '=', ' ', '8', ' ', '\n', '尺', '。', '初数', '中', '类似', '这样', '的', '题', '很多', ',', '常见', '的', '还有', '甲乙', '两人', '围绕', '跑道', '相向', '而行', '的', '相遇', '追及', '问题', '等等', '。', '通过', '这个', '简单', '的', '例子', '说明', ',', '大家', '在', '学', '初数', '的', '时候', ',', '一定', '要', '“', '灵活', '”', ',', '透过', '试题', '表面', '找到', '等量', '关系', '。', '\n', '\u3000', '\u3000', '微积分', '这部分', '知识点', '很多', ',', '占', '整个', '数学', '知识点', '的', '三分之一', '以上', ',', '概念', '抽象', ',', '需要', '很强', '的', '抽象思维', '能力', ',', '并且', '重', '逆向', '思维', '(', '尤其', '体现', '在', '极值', '的', '充分性', '和', '必要性', ')', ',', '技巧性', '较强', ',', '题型', '变幻莫测', ',', '是', '数学', '中', '最难', '的', '一部分', ',', '所以', '容易', '失分', '。', '建议', '大家', '在', '复习', '这', '一部分', '的', '时候', ',', '多', '做', '一些', '充分性', '判断题', ',', '因为', '一定', '要', '训练', '自己', '的', '逆向', '思维能力', ',', '只有', '这样', '才能', '在', '有限', '的', '时间', '内', '分析', '问题', '的', '时候', '做到', '游刃有余', '。', '还', '一点', '是', '要', '注意', '微积分', '知识点', '之间', '的', '相互', '联系', ',', '比如', '连续', '、', '可导', '、', '微分', '之间', '的', '关系', ',', '以及', '驻点', '、', '极值', '点', '、', '最值', '点', '之间', '的', '关系', '等', '。', '关于', '微积分', '的', '复习', ',', '可以', '按照', '我', '总结', '的', '几句话', '为', '方向', '进行', '复习', ',', '这', '就是', ':', '\n', '\u3000', '\u3000', '极限', '是', '基础', ' ', '(', ' ', '是', '建立', '连续', '、', '导数', '的', '基础', ' ', ')', '\n', '\u3000', '\u3000', '连续', '是', '条线', ' ', '(', ' ', '联系', '了', '导数', '与', '积分', ' ', ')', '\n', '\u3000', '\u3000', '导数', '是', '关键', ' ', '(', ' ', '概念', '必考', ',', '导数', '的', '应用', '考', '计算', ' ', ')', '\n', '\u3000', '\u3000', '积分', '考', '计算', ' ', '(', ' ', '广义', '积分', '判', '收敛', '、', '定', '积分', '求', '面积', ' ', ')', '\n', '\u3000', '\u3000', '线性代数', '这门', '课', '知识点', '连贯', '(', '所有', '知识点', '都', '是', '围绕', '着', '向量', '的', '相关性', '展开', '的', ')', ',', '概念', '易', '理解', '(', '因为', '这些', '概念', '都', '可以', '通过', '简单', '的', '例子', '进行', '说明', ')', ',', '技巧性', '差', '(', '不管怎么', '出题', ',', '方法', '都', '是', '固定', '的', ')', ',', '题型', '有', '核心', '(', '我们', '可以', '将', '每个', '知识点', '的', '出题', '形式', '进行', '归纳', '总结', ',', '翻来覆去', '就', '这么', '几种', '题型', ')', ',', '所以', '说', '比较', '容易', '得分', '。', '针对', '线性代数', '的', '特点', ',', '我们', '可以', '这样', '准备', '复习', ':', '首先', '要', '将', '线性代数', '的', '知识点', '进行', '条理化', ',', '可以', '参看', '下面', '列', '的', '方框图', '(', '此处', '省略', ')', ':', '\n', '\u3000', '\u3000', '线性代数', '从', '内容', '上', '看', '纵横交错', ',', '前后', '联系', '紧密', ',', '环环相扣', ',', '相互', '渗透', ',', '因此', '解题', '方法', '灵活', '多变', ',', '复习', '时', '应当', '不断', '地', '归纳', '总结', ',', '努力', '搞清', '内在联系', ',', '使', '所学', '知识', '融会贯通', ',', '接口', '与', '切入点', '多', '了', ',', '熟悉', '了', ',', '思路', '自然', '就', '开阔', '了', '。', '例如', ':', '设', ' ', '\n', 'A', ' ', '是', ' ', 'm', '×', 'n', ' ', '矩阵', ',', ' ', 'B', ' ', '是', ' ', 'n', '×', 's', ' ', '矩阵', ',', '且', ' ', 'AB', ' ', '=', ' ', '0', ' ', ',', '那么', '用', '分块', '矩阵', '可知', ' ', 'B', ' ', '的', '列', '向量', '都', '是', '齐次', '方程组', ' ', 'Ax', ' ', '=', ' ', '0', ' ', '\n', '的', '解', ',', '再', '根据', '基础', '解系', '的', '理论', '以及', '矩阵', '的', '秩', '与', '向量', '组秩', '的', '关系', ',', '可以', '有', ' ', 'r', '(', 'B', ')', '≤', 'n', '-', 'r', '(', 'A', ')', ' ', '即', ' ', 'r', '(', 'A', ')', ' ', '+', ' ', 'r', '(', 'B', ')', '≤', 'n', ' ', '进而', '可', '求', '矩阵', ' ', 'A', ' ', '或', ' ', 'B', ' ', '\n', '中', '的', '某些', '参数', '。', '又', '如', ',', '对于', ' ', 'n', ' ', '阶', '行列式', '我们', '知道', ':', '若', '|', ' ', 'A', ' ', '|', '=', ' ', '0', ' ', ',', '则', ' ', 'Ax', ' ', '=', ' ', '0', ' ', '必有', '非零解', ',', '而', ' ', 'Ax', ' ', '=', ' ', 'b', ' ', '没有', '惟一', '解', ' ', '(', ' ', '可能', '有', '无穷', '多解', ',', '也', '可能', '无', '解', ' ', '\n', ')', ' ', ',', '而', '当', '|', ' ', 'A', ' ', '|', ' ', '≠', '0', ' ', '时', ',', '可用', '克莱姆', '法则', '求', ' ', 'Ax', ' ', '=', ' ', 'b', ' ', '的', '惟一', '解', ';', '对于', ' ', 'n', ' ', '个', ' ', 'n', ' ', '维', '向量', ' ', 'α', ' ', '1', ' ', ',', ' ', 'α', '2', ' ', ',', ' ', '…', 'α', 'n', ' ', '可以', '利用', '行列式', ' ', 'A', ' ', '\n', '的', '数值', '是否', '为', '零', '|', ' ', 'A', ' ', '|', '=', '|', ' ', 'α', '1', ' ', 'α', '2', ' ', '…', 'α', 'n', ' ', '|', '来', '判断', '向量', '组', '的', '线性', '相关性', ';', '矩阵', ' ', 'A', ' ', '的', '秩', ' ', 'r', '(', 'A', ')', ' ', '是', '用', ' ', 'A', ' ', '中非', '零子', '式', '的', '最高', '阶数', '来', '定义', '的', ',', '若', ' ', 'r', '(', 'A', ')', ' ', '<', ' ', '\n', 'r', ' ', ',', '则', ' ', 'A', ' ', '中', ' ', 'r', ' ', '阶子式', '全为', ' ', '0', ' ', '\n', '。', '凡此种种', ',', '正是', '因为', '线性代数', '各', '知识点', '之间', '有着', '千丝万缕', '的', '联系', ',', '代数', '题', '的', '综合性', '与', '灵活性', '就', '较大', ',', '大家', '整理', '归纳', '时要', '注重', '串联', '、', '衔接', '与', '转换', '。', '应当', '搞清', '公式', '、', '定理', '成立', '的', '条件', ',', '不能', '张冠李戴', ',', '同时', '还应', '注重', '逻辑性', '以及', '语言', '的', '叙述', '表达', '应', '准确', '、', '简明', '。', ' ', '\n', '最后', '应', '注意', '几个', '概念', '间', '矩阵', '运算', ',', '比如', '矩阵', '的', '逆', '、', '伴随', '、', '转置', '等', ',', '这些', '关系', '一般', '出现', '在', '计算', '矩阵', '方程', '中', '。', '\n', '\u3000', '\u3000', '对于', '概率', '这门', '课', ',', '知识点', '分散', ',', '知识点', '相互间', '联系', '较', '少', ',', '但', '公式', '多', '(', '可以', '说', ',', '概率', '的', '考试', '就是', '公式', '应用', '的', '考试', ')', ',', '所以', '做', '题', '基本', '无', '技巧', ',', '题型', '相对', '稳定', ',', '这部分', '是', '大家', '最', '容易', '稳拿', '分', '的', '。', '对于', '概率', '的', '复习', ',', '首先', '要', '理解', '公式', ',', '知道', '公式', '什么', '时候', '用', ',', '用', '在', '什么', '地方', ',', '怎么', '用', '。', '在', '随机', '事件', '部分', '重点', '掌握', '条件', '概率', '公式', '与', '乘法', '公式', '、', '全概', '与', '贝叶斯', '公式', ',', '尤其', '对于', '完备', '事件', '组', '的', '概念', '一定', '要', '好好', '把握', '。', '概率', '的', '考试', '重点', '在', '随机变量', ',', '这部分', '在', '考分', '中', '占有', '相当', '大', '的', '比重', '。', '在', '随即', '变量', '中', ',', '一定', '要', '对', '随机变量', '的', '独立性', '要', '着重', '关注', ',', '因为', '它', '是', '很多', '公式', '成立', '的', '前提', '基础', ',', '如', ' ', '\n', 'D', '(', 'X', ' ', '+', ' ', 'Y', ')', ' ', '=', ' ', 'DX', '+', 'DY', ' ', ',', ' ', 'E', '(', 'XY', ')', '=', 'EXEY', ' ', '\n', '等', '。', '还有', '一个', '需要', '注意', '的', '是', '随机变量', '的', '分布', '函数', '和', '密度', '函数', ',', '对于', '这', '两个', '函数', '一般', '不会', '出', '概念', '题', ',', '而会出', '问题', '求', '解题', '。', '所以', '大家', '一定', '要', '掌握', '它们', '最', '重要', '的', '性质', ':', '分布', '函数', '最', '重要', '的', '性质', '是', '极限', '性质', ',', '密度', '函数', '最', '重要', '的', '性质', '是', '归', '一', '性质', ',', '利用', '这些', '性质', '可以', '求得', '题干', '中', '的', '参数', '。', '对于', '考纲', '上', '规定', '的', '要', '掌握', '的', ' ', '\n', '6', ' ', '个', '常见', '随机变量', ',', '为', '方便', '记忆', ',', '可', '列表', '记忆', ':', '\n', '\u3000', '\u3000', '{', '图片', '1', '显示', '}', '\n', '\u3000', '\u3000', '总之', ',', '要', '加强', '综合', '解题', '能力', '的', '训练', ',', '力求', '在', '解题', '思路', '上', '有所突破', '。', ' ', 'MBA', ' ', '\n', '试题', '与', '教科书', '上', '的', '习题', '的', '不同点', '在于', ',', '前者', '是', '在', '对', '基本概念', '、', '基本', '定理', '、', '基本', '方法', '充分', '理解', '的', '基础', '上', '的', '综合', '应用', ',', '有', '较大', '的', '灵活性', ',', '往往', '一个', '命题', '覆盖', '多个', '内容', ',', '涉及', '到', '概念', '、', '直观', '背景', '、', '推理', '和', '计算', '。', '许多', '考生', '往往', '难以', '适应', ',', '其', '突出', '感觉', '是', '没有', '思路', ',', '这', '正是', '考生', '考前', '准备', '应', '解决', '的', '突破口', '。', '考虑', '到', '数学', '学科', '的', '特点', ',', '要求', '考生', '自己', '将', '所有', '的', '解题', '思路', '都', '琢磨', '出来', '是', '十分困难', '的', ',', '这方面', '通常', '可以', '通过', '求教', '有', '经验', '的', '老师', ',', '参加', '有', '较', '好', '信誉', '的', '辅导班', ',', '或者', '阅读', '有关', '的', '辅导书', '解决', '。', '必须', '强调', '的', '是', ',', '辅导班', '或', '辅导书', '只是', '学习', '的', '一种', '手段', ',', '最终', '解决问题', '还要', '靠', '自己', '动手', '动脑', '。', '要', '充分利用', '一切', '学习', '机会', ',', '力求', '对', '常见', '的', '考题', '类型', '、', '题型', '、', '思路', '、', '特点', '有', '一个', '系统', '的', '把握', ',', '并', '在', '此基础', '上', '自己', '动手做', '一定', '数量', '的', '综合性', '练习题', ',', '温故而知新', ',', '不断', '提高', '自己', '的', '分析', '解题', '能力', '。', '\n', '\u3000', '\u3000'], 'C000020')
    (['\n', '\n', '\n', '夜幕', '下', '的', '太和', '门', '广场', '\n', '\u3000', '\u3000', '9', '月', '18', '日晚', ',', '时值', '中国', '传统', '佳节', '农历', '八月', '十五', '中秋节', '之际', ',', '由', '中国', '故宫博物院', '主办', '、', '山东', '潍柴', '动力', '股份', '有限公司', '冠名', '赞助', '的', '“', '太和', '邀月颂', '和平', '—', '—', '潍柴', '动力', '之夜', '”', '中秋', '招待会', '在', '北京故宫', '太和', '门', '广场', '举行', '。', '来自', '国内', '政府', '、', '文化', '演艺界', '及', '企业界', '等', '各界', '精英', '汇聚', '古老', '神秘', '的', '宫内', '广场', ',', '抒发', '当代', '国人', '对', '历史', '的', '追思', '和', '对', '中华民族', '未来', '的', '憧憬', ',', '举杯', '邀月', '共度', '中秋', ',', '把', '纪念', '故宫博物院', '建院', '80', '周年', '、', '中国', '人民', '抗日战争', '胜利', '60', '周年', '两个', '活动', '再次', '推向', '了', '高潮', '。', '本次', '招待会', '由', '著名', '学者', '田青', '和', '凤凰卫视', '当家花旦', '陈鲁豫', '、', '曹', '景行', '主持', '。', '\n', '\u3000', '\u3000', '是', '日', '晚上', ',', '北京', '太和', '门', '广场', '灯光', '璀璨', ',', '高朋满座', ',', '文化氛围', '浓郁', '。', '来自', '戏曲界', '、', '演奏', '界', '、', '表演', '界', '的', '大师', '们', '给', '与会者', '奉献', '上', '了', '《', '思乡曲', '》', '《', '二泉映月', '》', '《', '八月', '十五', '月', '光明', '》', '等', '著名', '的', '传统', '曲目', ',', '著名', '表演家', '濮存昕', '、', '吴俊全', '等', '还', '朗诵', '了', '《', '水调歌头', '》', '《', '雪落', '在', '中国', '土地', '上', '》', '等', '著名', '古今', '诗歌', ',', '表达', '了', '对', '中华民族', '优秀', '传统', '文化', '的', '追思', '和', '对', '民族', '昌盛', '的', '期盼', '。', '此外', ',', '来自', '书画界', '的', '大师', '们', '还', '现场', '泼墨', ',', '鉴赏', '经典', '古画', ',', '并', '留下', '墨宝', '以作', '纪念', '。', '艺术表演', '家们', '在', '舞台', '上', '精彩', '的', '表现', '赢得', '了', '与会', '各界', '嘉宾', '的', '阵阵', '掌声', ',', '人们', '乘着', '朗朗', '月色', ',', '举杯', '邀月', ',', '畅谈', '古今', ',', '抒发', '着', '当代', '中国', '对', '历史', '的', '铭记', '和', '对', '未来', '民族', '复兴', '的', '祈盼', '。', '\n', '独唱', '《', '今夜', '无人', '入睡', '》', '—', '—', '著名', '男高音', '歌唱家', '莫华伦', '\n', '小提琴', '演奏家', '陈曦', '与', '主持人', '陈鲁豫', '交流', '\n', '\u3000', '\u3000', '今年', '是', '北京故宫博物院', '成立', '八十周年', ',', '八十年', '来', ',', '北京故宫', '为', '弘扬', '中华民族', '的', '传统', '文化', ',', '为', '保护', '我国', '珍贵', '的', '历史', '遗产', '作出', '了', '巨大', '的', '贡献', ';', '同时', ',', '今年', '也', '是', '中国', '人民', '抗日', '胜利', '六十周年', ',', '身处', '北京故宫', '的', '太和', '门', '广场', '正是', '当年', '日寇', '华北', '方面军', '向', '中国', '统辖', '华北地区', '的', '第十一', '战区', '投降', '的', '仪式', '举行', '的', '地方', '。', '可以', '说', ',', '身处', '紫禁城', '的', '太和殿', '见证', '了', '我国', '历史', '的', '兴衰', '荣辱', ',', '见证', '了', '中国', '人民', '抗日战争', '的', '伟大胜利', ';', '六十年', '后', ',', '在', '同一', '地点', '举行', '纪念活动', ',', '意义', '非同小可', '。', '它', '告诉', '我们', '要', '铭记', '历史', ',', '继往开来', ',', '要', '为', '中华民族', '的', '伟大', '复兴', ',', '为', '世界', '各族人民', '的', '和平', '而', '不懈', '奋斗', '!', '\n', '濮存昕', '朗诵', '\n', '\u3000', '\u3000', '据悉', ',', '来自', '潍柴', '动力', '股份', '有限公司', '的', '领导', '介绍', ',', '作为', '国内', '知名', '的', '内燃机', '研发', '、', '制造', '、', '销售', '骨干企业', ',', '潍柴', '动力', '一直', '关注', '首都', '文化产业', '的', '发展', ',', '希望', '凭借', '此次', '活动', ',', '给', '中国', '的', '精英', '人士', '提供', '一个', '更好', '的', '交流', '机会', '和', '场所', ',', '拓展', '企业', '发展', '平台', ',', '振奋', '民族', '精神', ',', '为', '繁荣', '国际', '文化交流', ',', '进一步', '开辟', '中国', '文化', '传承', '空间', '贡献', '更', '多', '的', '力量', '!', '\n', '书法', '表演', '\n', '\u3000', '\u3000', '晚会', '在', '著名', '男高音', '歌唱家', '莫华伦', '的', '一曲', '《', '今夜', '无人', '入眠', '》', '中', '结束', ',', '留给', '了', '节日', '的', '京城', '一个', '难忘', '的', '夜晚', '。', '\n', '\u3000', '\u3000', '搜狗', '(', 'www', '.', 'sogou', '.', 'com', ')', '搜索', ':', '“', '太和', '”', ',', '共', '找到', '322', ',', '079', '\n', '个', '相关', '网页', '.', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00', '\x00'], 'C000022')
    (['&', 'nbsp', ';', '中国', '人', '为啥', '没有', '西方人', '高', '?', ' ', '\n', '\u3000', '\u3000', '饮食', '人类学家', '发现', ',', '旧石器时代', '的', '先祖', '们', '茹毛饮血', ',', '食肉', '和', '生食', ',', '身材', '比', '我们', '高大', '30', '%', '左右', '。', '今天', '的', '西方人', ',', '仍然', '喜欢', '吃', '带', '血丝', '的', '肉', '和', '生菜', '色拉', ',', '身材', '也', '仍旧', '比', '吃', '米面', '和', '爱', '烹调', '的', '亚洲', '人', '“', '大', '一号', '”', '。', '特别', '是', '阿尔卑斯山', '以北', '的', '日耳曼', '民族', ',', '分布', '在', '德国', '、', '荷兰', '和', '北欧', '等', '地', ',', '冬天', '长', ',', '睡眠', '久', ',', '喝', '鲜奶', ',', '食', '生肉', ',', '男人', '平均', '身高', '1.8', '米', '以上', '。', '其中', ',', '荷兰人', '又', '酷爱', '鲜奶', '和', '乳制品', ',', '人均', '身高', '为', '世界之最', '。', ' ', '\n', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '营养学家', '发现', ',', '谷物', '和', '薯类', '含', '凝聚', '素', ',', '影响', '蛋白', '的', '吸收', '和', '多胺', '的', '数量', ',', '会', '使', '生长', '缓慢', ',', '身材矮小', '。', '肉食', '比', '素食', '含有', '更', '丰富', '的', '营养', '和', '性激素', '原料', ',', '生食', '比', '熟食', '含有', '更', '多', '的', '生长激素', '原料', '。', '人', '的', '发育', '在', '12', '岁', '前', '主要', '靠', '生长激素', ',', '12', '~', '25', '岁', '主要', '靠', '性激素', '。', '营养', '和', '激素水平', '可以', '影响', '当代人', '身高', ',', '持续', '到', '四代', '以后', '可以', '显著', '改变', '遗传基因', '。', '\n', '\u3000', '\u3000', '在', '百万年', '漫长', '的', '冬夜', '里', ',', '北欧', '人', '世世代代', '长时间', '睡眠', ',', '分泌', '了', '充足', '的', '生长激素', '。', '同时', '大量', '的', '动物性', '生食', '提供', '了', '丰富', '的', '营养', '和', '性激素', '原料', ',', '这', '使得', '他们', '能够', '昂首', '全人类', '。', '在', '动物性', '食品', '中', ',', '牛奶', '含', '大量', '激素', ',', '它', '可以', '使', '小牛', '在', '数月', '里长', '高', ',', '也', '可以', '帮助', '乳糖酶', '充足', '的', '小孩', '在', '数年', '内长', '高', '。', '喝奶', '最多', '、', '乳糖酶', '充足', '的', '荷兰人', ',', '平均', '身高', '成为', '人类', '的', '“', '珠峰', '”', '。', '\n', '\u3000', '\u3000', '以下', '的', '最佳', '营养', '、', '睡眠', '和', '运动', '方式', ',', '会', '使', '你', '的', '孩子', '长得', '高', ':', '\n', '\u3000', '\u3000', '第一', '、', '最佳', '营养', '。', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '多', '吃', '10', '类食品', ',', '包括', '鱼类', '、', '海鲜', '、', '海藻', '、', '肉类', '、', '蛋类', '、', '菌类', '、', '坚果', '、', '种子', '、', '蔬菜', '、', '水果', ',', '有些', '可生', '吃', ';', '多', '吃', '母乳', ',', '多', '喝', '鲜奶', '(', '如果', '乳糖酶', '充足', ')', ',', '不', '加热', ',', '以', '保证', '营养素', '和', '激素', '原料', '的', '摄入', '。', '\n', '\u3000', '\u3000', '早', '、', '晚是', '喝奶', '的', '最佳时机', ',', '早餐', '时', '喝奶', ',', '给', '一天', '的', '活力', '提供', '充分', '的', '营养', '保证', ';', '晚上', '喝牛奶', ',', '不但', '有助于', '睡眠', ',', '而且', '有助于', '人体', '对', '其', '营养', '成份', '的', '吸收', '。', '最佳', '营养', ' ', '\n', '\n', '\n', '\u3000', '\u3000', '据', '美英', '两', '国', '医学专家', '研究', '发现', ',', '牛奶', '中', '含有', '两种', '过去', '人们', '未知', '的', '催眠', '物质', ',', '其中', '一种', '是', '能够', '促进', '睡眠', '的', '以', '血清素', '合成', '的', '色氨酸', ',', '由于', '它', '的', '作用', ',', '往往', '只', '需要', '一杯', '牛奶', '就', '可以', '使人', '入睡', ';', '另外', '一种', '则', '是', '具有', '类似', '麻醉', '镇静', '作用', '的', '天然', '吗啡', '类', '的', '物质', '。', '所以', ',', '如果', '在', '早晨', '饮奶', ',', '就', '必然', '会', '使', '人', '的', '大脑皮层', '受到', '抑制', ',', '影响', '白天', '的', '工作', '和', '学习', '。', '此外', ',', '早晨', '饮奶', '也', '不利于', '消化', '和', '吸收', ',', '这', '是因为', '牛奶', '的', '蛋白质', '要', '经过', '胃', '和', '小肠', '的', '分解', '形成', '氨基酸', '后', '才能', '被', '人体', '吸收', ',', '而', '早晨', '空腹', '状态', '下', ',', '胃', '、', '肠', '的', '排空', '是', '很快', '的', ',', '因此', '牛奶', '还', '来不及', '消化', '就', '被', '排到', '了', '大肠', '。', '再有', ',', '食物', '当中', '被', '吸收', '的', '蛋白质', '只有', '在', '热量', '充足', '的', '基础', '上', '才能', '构成', '人体', '组织', '的', '一部分', ',', '倘若', '热量', '不足', ',', '吸收', '的', '蛋白质', '就', '很快', '变成', '热量', '而', '被', '消耗掉', '了', ',', '这', '无疑', '是', '一种', '大材小用', '的', '浪费', '。', ' ', '\n', '\u3000', '\u3000', '因此', '营养', '专家', '们', '认为', ',', '牛奶', '最好', '在', '傍晚', '或', '临睡', '之前', '半小时', '饮用', '。', '\u3000', '\u3000', '喝牛奶', '应当', '避', '误区', '\u3000', '\u3000', '牛奶', '含有', '丰富', '的', '营养', ',', '其中', '不但', '包括', '必需', '氨基酸', ',', '还有', '含量', '高且', '易', '吸收', '的', '钙', ',', '长期', '饮用', '对', '身体', '非常', '有', '好处', '。', '不过', ',', '饮用', '牛奶', '一定', '要', '讲究', '方式', ',', '以下', '是', '喝牛奶', '常见', '的', '误区', ',', '你', '一定', '要', '注意', '避免', '—', '—', '—', ' ', '\n', '\u3000', '\u3000', '空腹', '喝牛奶', '\u3000', '\u3000', '空腹', '饮用', '牛奶', '会', '使', '肠蠕动', '增加', ',', '牛奶', '在', '胃', '内', '停留时间', '缩短', ',', '使', '内部', '的', '营养素', '不能', '被', '充分', '吸收', '利用', '。', '喝牛奶', '最好', '与', '一些', '淀粉类', '的', '食物', ',', '如', '馒头', '、', '面包', '、', '玉米粥', '、', '豆类', '等同', '食', ',', '有利于', '消化', '和', '吸收', '。', ' ', '\n', '\u3000', '\u3000', '食物', '搭配', '不当', '\u3000', '\u3000', '牛奶', '不宜', '与', '含', '鞣酸', '的', '食物', '同吃', ',', '如', '浓茶', '、', '柿子', '等', ',', '这些', '食物', '易', '与', '牛奶', '反应', '结块', '成团', ',', '影响', '消化', '。', ' ', '\n', '\u3000', '\u3000', '偏爱', '高度', '加工', '的', '牛奶', '\u3000', '\u3000', '高度', '加工', '后', '的', '牛奶', ',', '其', '营养价值', '不', '一定', '比', '鲜牛奶', '好', '。', '这', '是因为', '经过', '多次', '加工', '后', ',', '牛奶', '中', '大多', '加入', '了', '微量元素', '或', '无机盐', ',', '但', '这些', '成分', '并非', '每个', '人', '都', '需要', '补充', ',', '所以', '也', '就', '不', '一定', '适合', '每', '一个', '人', '。', '\n', '\u3000', '\u3000', '第二', '、', '睡眠', '充足', '。', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '12', '岁', '以下', '睡眠', '8', '小时', '以上', ',', '以', '保证', '生长激素', '的', '分泌', '。', '最佳', '睡眠', ' ', '\n', '\n', '\u3000', '\u3000', '睡眠', '或', '觉醒', '是', '正常', '的', '生理', '过程', ',', '但', '它', '不是', '人为', '能', '完全', '自主', '控制', '的', '活动', ',', '而是', '一个', '被动', '过程', '。', '它', '不', '像', '人体', '某些', '活动', '可', '按', '人', '的', '意志', ',', '说来', '就', '来', ',', '要止', '则', '止', '。', '失眠', '的', '人', '常常', '难以', '诱导', '师', '自己', '进入', '睡眠', '而', '苦恼', '。', '其实', '早期', '的', '轻度', '失眠', ',', '经过', '自我', '调理', '的', '办法', '就常', '可', '得益', ',', '具体', '归纳如下', ':', ' ', '\n', '\u3000', '\u3000', '平常', '而', '自然', '的', '心态', '。', '出现', '失眠', '不必', '过分', '担心', ',', '越是', '紧张', ',', '越是', '强行', '入睡', ',', '结果', '适得其反', '。', '有些', '人', '对', '连续', '多天', '出现', '失眠', '更是', '紧张不安', ',', '认为', '这样', '下去', '大脑', '得不到', '休息', ',', '不是', '短寿', ',', '也', '会', '生病', '。', '这', '类', '担心', '所致', '的', '过分', '焦虑', ',', '对', '睡眠', '本身', '及其', '健康', '的', '危害', '更大', '。', ' ', '\n', '\u3000', '\u3000', '寻求', '并', '消除', '失眠', '的', '原因', '。', '造成', '失眠', '的', '因素', '颇', '多', ',', '前', '已', '提及', ',', '只要', '稍加', '注意', ',', '不难', '发现', '。', '原因', '消除', ',', '失眠', '自愈', ',', '对', '因', '疾病', '引起', '的', '失眠', '症状', ',', '要', '及时', '求医', '。', '不能', '认为', ':', '失眠', '不过', '是', '小', '问题', ',', '算不了', '病而', '延误', '治疗', '。', ' ', '\n', '\u3000', '\u3000', '身心', '松驰', ',', '有益', '睡眠', '。', '睡前', '到', '户外', '散步', '一会儿', ',', '放松', '一下', '精神', ',', '上床', '前', '或', '洗个', '沐浴', ',', '或', '热', '水泡', '脚', ',', '然后', '就寝', ',', '对', '顺利', '入眠', '有百利而无一害', '。', '诱导', '人体', '进入', '睡眠', '状态', ',', '有', '许多', '具体方法', ',', '例如', ':', '放松', '功', ',', '已', '在', '民间', '流传', ',', '可以', '借助', '。', '此外', ',', '再', '介绍', '两种', '简而', '易行', '之', '法', ':', ' ', '\n', '\u3000', '\u3000', '闭目', '入静', '法', '。', '上床', '之后', ',', '先合', '上', '双眼', ',', '然后', '把', '眼睛', '微微', '张开', '一条', '缝', ',', '保持', '与', '外界', '有些', '接触', ',', '虽然', ',', '精神', '活动', '仍', '在', '运作', ',', '然而', ',', '交感神经', '活动', '的', '张力', '已', '大大', '下降', ',', '诱导', '人体', '渐渐', '进入', '睡意', '蒙胧', '状态', '。', ' ', '\n', '\u3000', '\u3000', '鸣天', '鼓法', '。', '上床', '后', ',', '仰卧', '闭目', ',', '左掌', '掩', '左耳', ',', '右掌', '掩', '右耳', ',', '用', '指头', '弹击', '后脑勺', ',', '使', '之', '听到', '呼呼', '的', '响声', '。', '弹击', '的', '次数', '到', '自觉', '微累', '为止', '。', '停止', '弹击', '后', ',', '头', '慢慢', '靠近', '睡', '枕', ',', '两后', '自然', '安放', '于身', '之', '两侧', ',', '便会', '很快', '入睡', '了', '。', ' ', '\n', '\u3000', '\u3000', '睡眠', '诱导', '。', '聆听', '平淡', '而', '有', '节律', '的', '音响', ',', '例如', ':', '火车', '运行', '声', '、', '蟋蟀', '叫', '、', '滴水', '声', '以及', '春雨', '淅沥', '淅沥', '声音', '的', '磁带', ',', '或', '音乐', '催眠', '音带', ',', '有助', '睡眠', ',', '还', '可以', '此', '建立', '诱导', '睡眠', '的', '条件反射', '。', ' ', '\n', '\u3000', '\u3000', '饮热', '牛奶', '法', '。', '睡前', '饮', '一杯', '加糖', '的', '热', '牛奶', ',', '据', '研究', '表明', ',', '能', '增加', '人体', '胰岛素', '的', '分泌', ',', '增加', '氨酸', '进入', '脑细胞', ',', '促使', '人脑', '分泌', '睡眠', '的', '血清素', ';', '同时', '牛奶', '中', '含有', '微量', '吗啡', '样式', '物质', ',', '具有', '镇定', '安神', '作用', ',', '从而', '促使', '人体', '安稳', '入睡', '。', ' ', '\n', '\u3000', '\u3000', '合适', '的', '睡姿', '。', '睡眠', '姿势', '当然', '以', '舒适', '为宜', ',', '且', '可', '因人而异', '。', '但', '睡眠', '以', '侧卧', '为佳', ',', '养生', '家', '曹慈山', '在', '《', '睡诀', '》', '中', '指出', ':', '“', '左侧', '卧屈', '左足', ',', '屈', '左臂', ',', '以', '手上', '承头', ',', '伸右足', ',', '以', '右手', '置于', '右', '股间', '。', '右', '侧卧位', '反', '是', '。', '”', '这种', '睡眠', '姿势', '有利于', '全身', '放松', ',', '睡得', '安稳', '。', ' ', '\n', '\u3000', '\u3000', '若', '疲劳', '而', '难以', '入睡', '者', ',', '不妨', '食用', '苹果', '、', '香蕉', '、', '橘', '、', '橙', '、', '梨', '等', '一类', '水果', '。', '因为', ',', '这', '类', '水果', '的', '芳香', '味', ',', '对', '神经系统', '有', '镇静', '作用', ';', '水果', '中', '的', '糖分', ',', '能', '使', '大脑皮质', '抑制', '而易', '进入', '睡眠', '状态', '。', ' ', '\n', '\u3000', '\u3000', '若因', '出差', '在外', ',', '不', '适应环境', '而致', '失眠', '时', ',', '应先', '有', '思想', '准备', ',', '主动', '调适', ',', '有备无患', ',', '不致', '因', '紧张', '担心', '睡', '不好', '。', '同时', '还', '可', '采用', '以上', '助眠', '之法', ',', '则', '可', '避免', '失眠', '。', '最佳', '运动', ' ', '\n', '\n', '\u3000', '\u3000', '第三', '、', '足量', '运动', '。', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '尽量', '在', '户外', ',', '每天', '运动', '几个', '小时', '以上', ',', '以', '增加', '各种', '营养物质', ',', '包括', '维生素', 'D', '、', '钙', '和', '“', '太阳能', '”', '的', '形成', '和', '吸收', ',', '促进', '骨骼', '和', '肌肉', '的', '快速', '生长', '。', '\n', '\u3000', '\u3000', '身高', '能否', '如意', ',', '取决于', '几个', '因素', ',', '首先', '是', '遗传', '因素', ',', '占', '70', '%', ',', '此外', ',', '取决于', '其他', '条件', ',', '包括', '运动', '、', '营养', '、', '环境', '和', '社会', '因素', '等', '。', '为了', '让', '孩子', '长得', '更', '高', '一点', ',', '家长', '应', '注意', '以下几点', ':', '\u3000', '\u3000', '一', '、', '莫错', '过', '生长', '快速', '期', '\u3000', '\u3000', '在', '儿童', '少年', '青春', '发育', '过程', '中', ',', '何时', '身高', '长得', '最快', '呢', '?', '研究', '证实', ',', '绝大多数', '中国', '汉族', '儿童', '的', '身高', '突增', '高峰', '为', '女童', '12', '岁', '左右', '、', '男童', '14', '岁', '左右', ';', '90', '%', '以上', '女童', '身高', '增长', '最快', '的', '年龄', '在', '11', '~', '13', '岁', '之间', ',', '男童', '为', '13', '~', '15', '岁', '之间', '。', '为了', '让', '孩子', '长得', '高', '一些', ',', '家长', '尤其', '应', '注意', '孩子', '在', '生长', '快速', '期', '的', '营养', '、', '运动', '等', '问题', '。', '}', '&', 'nbsp', ';', '\u3000', '\u3000', '二', '、', '应', '注重', '营养', '补充', '\u3000', '\u3000', '营养', '是', '儿童', '体格', '生长', '的', '关键', '。', '体格', '正常', '生长', '所', '需', '的', '能量', '、', '蛋白质', '和', '氨基酸', ',', '必须', '由', '食物', '供给', ',', '主要', '是', '肉', '、', '蛋', '、', '豆及', '豆类', '食物', '。', '骨', '的', '形成', '还', '需要', '足够', '量', '的', '钙', '、', '磷及', '微量', '的', '锰', '和', '铁', '。', '钙', '的', '摄入', '不足', '及', '维生素', 'D', '缺乏', '时', ',', '会', '造成', '骨', '矿化', '不足', ',', '维生素', 'A', '缺乏', '会', '使', '骨', '变短', '变厚', ',', '维生素', 'C', '缺乏', '会', '使', '骨细胞', '间质', '形成', '缺陷', '而', '变脆', ',', '这些', '都', '会', '影响', '骨', '的', '生长', '。', '&', 'nbsp', ';', '\u3000', '\u3000', '目前', '一般', '家庭', '在', '有', '荤', '有素', '的', '饮食', '中', ',', '营养', '应该', '是', '全面', '及', '足量', '的', ',', '家长', '应该', '注意', '不要', '让', '孩子', '养成', '偏食', '的', '习惯', ',', '更', '不要', '让', '孩子', '过多地', '吃零食', '而', '影响', '重要', '营养物质', '的', '摄入', '。', '\u3000', '\u3000', '三', '、', '莫', '忽视', '运动', '锻炼', '\u3000', '\u3000', '体育运动', '可', '加强', '机体', '新陈代谢', '过程', ',', '加速', '血液循环', ',', '促进', '生长激素', '分泌', ',', '加快', '骨组织', '生长', ',', '有益于', '人', '体长', '高', '。', '以下', '几种', '运动', '对', '增高', '有', '一定', '效果', ',', '不妨一试', '。', '\u3000', '\u3000', '1', '.'], 'C000020')
    (['\n', '\u3000', '\u3000', '【', '来源', ':', '你', '来', '我', '网', '】', ' ', '【', '作者', ':', 'kiidy', '】', '\n', '\u3000', '\u3000', '“', '花落', '繁枝', '千万片', ',', '犹自', '多情', ',', '学雪', '随风', '转', '”', ',', '2006', '年', '的', '春天', ',', '这种', '莺', '飞草长', '、', '树绿', '花香', '的', '常景', ',', '在', '我', '眼中', '变得', '特别', '的', '美丽', '。', '一年', '的', '时间', ',', '在', '许多', '人', '的', '生活', '中', '都', '不会', '有', '什么', '特别', '、', '不会', '产生', '多大', '变化', ',', '但', '在', '同样', '的', '时', '空中', ',', '在', '与', '别人', '一样', '的', '收获', '之外', ',', '我', '完成', '了', '考研', '的', '复习', ',', '是', '这种', '成功', '使', '我', '体会', '到', '了', '风景', '与', '心情', '的', '不同', '。', '我', '不是', '聪明人', ',', '也', '不', '太笨', '。', '\n', '\u3000', '\u3000', '做', '每件事', '要', '想成', '的', '都', '挺', '不', '容易', '的', ',', '所以', '我', '干什么', '事情', ',', '只要', '认准', '了', '都', '特', '使劲', '。', '考研', '是', '大事', ',', '从', '一', '开始', '就', '没想', '过', '不考', ',', '原因', '很多', ':', '父母', '的', '期望', ',', '逃避', '工作', '及', '喜欢', '校园生活', '。', '\n', '\u3000', '\u3000', '考研', ',', '真的', '爱', '你', '吗', '?', '\n', '\u3000', '\u3000', '我', '想', '并', '不是', '每个', '同学', '都', '想', '考研', ',', '还有', '许多', '不', '考研', '的', '友', '人们', '对', '我们', '考研', '大军', '不屑一顾', ',', '事实', '是', '考上', '了', '也', '并不一定', '就', '前程似锦', ',', '要', '知道', '两三年', '后', '依然', '是', '面临', '很大', '的', '就业', '压力', ',', '而', '工作', '的', '同学', '已经', '是', '经验丰富', ',', '在职', '场上', '有所作为', '了', '!', '这要', '看', '个人', '的', '追求', '、', '家庭', '经济', '状况', ',', '要', '综合', '来', '衡量', '自己', '是否', '需要', '考研', ',', '是否', '有', '必要', '再', '拼', '一次', '。', '如果', '知道', '了', '自己', '下', '一步', '该', '干什么', ',', '并且', '目标', '明确', ',', '那', '就', '只管', '拼', '了', '。', '早期', '气馁', '的', ',', '中途', '放弃', '的', ',', '上', '了', '考场', '还', '没考', '完', '的', '大有人在', ',', '所以', '下', '了', '决心', '就要', '坚持到底', ',', '俗话说', '“', '坚持到底', '就是', '胜利', '”', '用', '在', '考研', '上', '是', '最', '恰当', '不过', '的', '了', '。', '\n', '\u3000', '\u3000', '跨专业', ',', '做', '我', '想', '做', '的', '\n', '\u3000', '\u3000', '我', '没考', '化学', '类', '的', ',', '而是', '选择', '了', '管理', '类', ',', '原因', '依然', '很多', ',', '主要', '是', '我', '对', '化学', '不来电', ',', '高', '中学', '得', '就', '不好', ',', '大学', '成绩', '也', '不好', ',', '我', '很', '了解', '我', '自己', ',', '考上', '了', '我', '还', '会', '像', '读', '本科', '那样', '痛苦', ',', '混日子', ',', '浪费', '青春', ',', '我', '是', '不会', '在', '这', '一', '领域', '有', '什么', '建树', '的', '。', '活', '了', '这么', '大有', '太多', '的', '迫不得已', ',', '想', '让', '自己', '的', '想法', '和', '意愿', '做', '一次', '主', ',', '于是', '我', '选择', '跨专业', '考研', '。', '大家', '都', '知道', '相对', '来讲', ',', '理', '转文', '易', ',', '文转理', '难', '。', '对于', '理工类', '的', '同学', '来说', ',', '只要', '英语', '比较', '不错', ',', '选择', '文科', '中', '的', '经济', ',', '管理', '类', '的', '考数', '三', '、', '数四', '的', '是', '比较', '有', '优势', '的', ';', '要是', '选择', '心理学', '或是', '法学', '这样', '的', '专业', ',', '就', '要求', '你', '有', '浓厚', '的', '兴趣', '和', '良好', '的', '记忆力', '来', '支撑', ',', '要', '有', '比较', '好', '的', '英语', '基础', ',', '这样', '胜出', '的', '机会', '才', '大', '一些', '。', '\n', '\u3000', '\u3000', '在', '选择', '院校', '方面', '要', '依人', '而定', '了', ',', '跨专业', '的', '同学', '选择', '34', '所', '(', '截至', '笔者', '报名', ',', '全国', '有', '34', '所', '院校', '独立', '招收', '研究生', ',', '划', '分数线', ',', '提前', '复试', ')', '还是', '会', '明智', '一些', ',', '由于', '34', '所', '复试', '比较', '早', ',', '若', '不幸', '被', '刷', '那', '还', '可以', '调剂', ',', '还有', '复试', '的', '机会', '。', '若', '报考', '很强', '学校', '的', '热门', '专业', ',', '风险', '必然', '很大', '。', '我', '经过', '再三', '考虑', '还是', '决定', '考', '旅游', '管理', '专业', '的', '最', '知名', '学校', '之一', '—', '—', '北京第二外国语学院', '(', '中国', '旅游', '学院', ')', ',', '这样', '便', '开始', '了', '我', '快乐', '的', '考研', '日子', '。', '\n', '\u3000', '\u3000', '复习', ',', '持久战', '\n', '\u3000', '\u3000', '当时', '我', '自视', '英语', '还', '行', ',', '数学', '不好', ',', '于是', '上', '了', '两个', '数学', '辅导班', ',', '别的', '班', '没上', '。', '现在', '回头', '看', '我', '有', '许多', '复习', '中', '失误', '的', '地方', ',', '在', '这里', '可以', '说', '一下', ',', '大家', '引以为戒', '。', '我', '是', '题海战术', '型', '选手', ',', '由于', '采纳', '一位', '研友', '的', '建议', ',', '我', '在', '后期', '很少', '做', '模拟题', ',', '只顾', '钻', '历年', '真题', ',', '分析', '出题', '的', '大方向', ',', '而', '去年', '的', '考题', '是', '多', '而', '不难', ',', '要求', '计算能力', '强', ',', '我', '是', '会', '做', '而', '做', '不', '对', ',', '那题', '错', '得', '太', '垃圾', '了', '。', '前期', '的', '努力', '大半', '都', '在', '后期', '折腾', '没', '了', '。', '考完', '后', '有', '许多', '同学', '说', '有', '原题', '啊', ',', '做过', '之类', '的话', ',', '我', '是', '听', '得', '一头雾水', ',', '那题', '我', '可是', '从来', '也', '没见', '过', ',', '还有', ',', '我', '保证', '题', '也', '没见', '过', '我', '。', '数学', '是', '难点', ',', '但', '不是', '不可', '战胜', '的', ',', '我', '总结', ',', '要', '考好', '数学', ',', '基本功', '是', '必不可少', '的', ',', '一味', '钻', '高难度', '的', '题', '是', '得不偿失', '的', '。', '因此', ',', '要', '宏观', '、', '微观', '一起', '抓', ',', '两手', '都', '要', '硬', '!', '\n', '\u3000', '\u3000', '专业课', '我', '是', '下', '了', '很大', '的', '功夫', '的', ',', '书', '看', '了', '十几遍', '吧', ',', '记不清', '了', ',', '还', '做', '了', '读书笔记', ',', '把', '所有', '可能', '考', '的', '全都', '列', '了', '出来', '。', '没', '办法', ',', '谁', '叫', '我', '跨专业', '考', '呢', ',', '于是', '早上', '背', '晚上', '背', ',', '一遍', '一遍', ',', '像', '个', '精神病人', '。', '\n', '\u3000', '\u3000', '英语', '的', '复习', '是', '全程', '的', ',', '每天', '都', '要', '练习', '听力', ',', '背', '背单词', ',', '阅读', '复习资料', '也', '看', '了', '许多', ',', '英语', '关键', '是', '培养', '语感', ',', '黑博士', '的', '120', '篇', ',', '220', '篇', ',', '240', '篇', ',', '我', '连', '着', '都', '做', '完', '了', '。', '历年', '考题', ',', '反反复复', '也', '看', '了', '好多遍', ',', '要', '知道', '我', '所', '报考', '的', '二外', '(', '北京第二外国语学院', ')', '对', '英语', '要求', '可', '都', '不', '低', ',', '对手', '都', '是', '很', '牛', '的', '人', '啊', ',', '英语', '都', '得', '七八', '十分', '。', '现在', '多', '做些', '题', ',', '分析', '几百篇', '阅读', ',', '最起码', '考完', '我', '不', '后悔', '。', '所以', '奉劝', '英语', '过', '了', '六级', '的', '同学', '不要', '大意', '啊', '!', '\n', '\u3000', '\u3000', '坚持', ',', '给', '我', '力量', '\n', '\u3000', '\u3000', '到', '了', '后期', '心里', '想', '的', '就', '这么', '一句', '“', '坚持到底', '就是', '胜利', '”', '。', '那时', '身体', '不是', '很', '疲惫', ',', '但', '心里', '很', '是', '疲惫', '。', '很多', '同志', '到', '后期', '依然', '天天', '坐镇', ',', '但', '究竟', '效率', '如何', ',', '学了', '什么', ',', '也', '只有', '他', '自己', '最', '清楚', '。', '我', '那', '时隔', '一段时间', '就', '放纵', '一下', ',', '打打', '排球', '或是', '和', '研友们', '定期', '侃侃', ',', '总之', '要', '学会', '自我调节', '。', '走出', '考场', '的', '那', '一刹那', '我', '想', '的', '不是', '考得', '怎样', ',', '而是', '以后', '我', '做', '什么', '都', '不怕', '了', '。', '因为', '我', '为了', '自己', '的', '理想', '坚持', '奋斗', '了', '十个月', ',', '那', '可是', '三百多个', '日日夜夜', '啊', ',', '容易', '吗', '我', '!', '\n', '\u3000', '\u3000', '我们', '寝室', '有', '四姐妹', ',', '每天', '相互', '鼓励', ',', '共同', '学习', ',', '有', '哪个', '想', '偷懒', '了', ',', '其他', '三个', '会', '同时', '谴责', '她', '。', '无疑', ',', '这样', '的', '氛围', '是', '考研', '路上', '最', '可贵', '的', ',', '可惜', '的', '是', '最后', '只有', '三', '姐妹', '上', '了', '考场', ',', '还有', '一个月', '就', '考试', '的', '时候', ',', '另', '一个', '美眉', '说', '什么', '也', '不学', '了', ',', '任', '我们', '百般', '劝说', '。', '后来', '我们', '三个', '都', '考上', '了', '(', '她俩', '分别', '被', '北京化工大学', '、', '长春', '理工大学', '录取', '了', ')', ',', '美眉', '把', '肠子', '都悔青', '了', '。', '还是', '那句话', ':', '考研', '路上', '早期', '气馁', '的', ',', '中途', '放弃', '的', ',', '上', '了', '考场', '还', '没考', '完', '的', '大有人在', ',', '所以', '下', '了', '决心', '就要', '坚持到底', '。', '坚持到底', '就是', '胜利', '。', '\n', '\u3000', '\u3000', '调剂', ',', '恨', '你', '然后', '爱', '你', '\n', '\u3000', '\u3000', '成绩', '出来', '了', ',', '335', '分', ',', '差额', '复试', '要排', '在', '48', '名', '左右', ',', '我', '的', '排', '在', '50', '名', '左右', ',', '因为', '我报', '的', '专业', '方向', '太热', '(', '旅游', '企业', '管理', ')', ',', '心想', '是', '没戏', '了', ',', '而且', '二外', '不是', '34', '所', '自主', '招生', '的', '院校', ',', '复试', '比较', '晚', '。', '我', '便', '像', '个', '无头', '苍蝇', '一样', '到处', '搜索', '联系', '调剂', '学校', ',', '很快', '档案', '就', '被', '湘潭', '大学', '调走', '了', '。', '当', '我', '在', '湖南', '复试', '时', ',', '二外', '才', '出', '复试线', ',', '呵呵', '!', '除了', '我报', '的', '方向', '是', '339', '分', '左右', ',', '其他', '的', '方向', '都', '是', '320', '分', '左右', ',', '我', '还', '想', '调剂', '到', '二外', '的', '其他', '方向', ',', '可', '档案', '已经', '调走', '了', ',', '这时', '想', '回', '也', '回不去', '了', '。', '二外', '的', '学长', '和', '我', '说', ':', '“', '你', '丫', '就', '安心', '在', '湖南', '复试', '吧', '!', '其他', '方向', '你', '也', '调', '不了', '啊', '!', '二外', '350', '分', '的', '复试', '都', '不', '一定', '上', '呢', ',', '调剂', '是', '正确', '。', '”', '这样', '也', '给', '我', '了', '很多', '安慰', '。', '幸运', '的', '是', '我', '调剂', '到', '南方', '一所', '比较', '有名', '的', '重点', '大学', ',', '学校', '环境', '很', '好', ',', '让', '我', '欣喜', '。', '更', '幸运', '的', '是', ',', '我', '跟', '了', '一位', '好', '导师', '—', '—', '阎友兵', '教授', ',', '他', '不', '但是', '我', '学术研究', '上', '的', '带头人', ',', '更是', '我', '做人', '处事', '的', '好榜样', '。', '在', '老师', '和', '朋友', '的', '支持', '下', ',', '我', '已经', '下定决心', '考博', ',', '圆', '我', '二外', '的', '梦', '!', '\n', '\u3000', '\u3000', '这', '就是', '我', '的', '考研', '之', '路', ',', '辛酸苦辣', ',', '冷暖自知', '。', '\n', '\u3000', '\u3000'], 'C000020')
    (['\u3000', '\u3000', '话题', '多', '、', '题材', '广', '、', '时间', '紧', '、', '要求', '高', '的', '议论文', '写作', '一直', '是', '雅思', '写作', '中', '的', '难点', ',', '思维', '狭窄', '、', '词汇', '不足', '也', '一直', '是', '中国', '考生', '的', '通病', ',', '如何', '在', '议论文', '写作', '中', '拓宽', '思路', '?', '怎样', '背诵', '8000', '个', '雅思', '词汇', '?', '备考', '雅思', '写作', '的', '误区', '和', '应对', '方法', '又', '是', '什么', '?', '上周末', ',', '启德', '教育', '吴建业', '老师', '在', '广州', '图书馆', '给', '广大', '考生', '上', '了', '一堂', '生动', '的', '雅思', '议论文', '写作', '课', '。', '\n', '\u3000', '\u3000', '开拓', '思维', '的', '十大', '原则', '\n', '\u3000', '\u3000', '据统计', ',', '近年来', '雅思', '议论文', '写作', '共有', '265', '个', '话题', ',', '常考', '的', '涉及', '环保', '、', '经济', '、', '社会', '、', '教育', '、', '犯罪', '等', '题材', ',', '十分', '广泛', '。', '鉴于', '很多', '考生', '写作', '时', '感觉', '无话可说', ',', '吴建业', '提醒', '考生', '从', '经济', '、', '时间', '、', '健康', '、', '情感', '、', '教育', '、', '心理', '、', '权利', '、', '文化', '、', '环保', '和', '道德', '十大', '原则', '来', '思考', '话题', '的', '意义', '。', '他', '以养', '狗', '为例', ':', '经济', '上要', '花', '很多', '钱', ';', '情感', '上', '亲近', '狗', '就', '会', '在', '一定', '程度', '上', '疏远', '家人', ';', '遛狗', '、', '给', '狗', '冲凉', '等', '浪费时间', ';', '狗', '传播', '疾病', '会', '影响', '健康', ';', '养狗会', '影响', '学习', ';', '狗', '很', '忠诚', ',', '养狗会', '让', '人', '从', '心理', '上', '疏远', '狡诈', '的', '人类', ';', '侵犯', '邻居', '的', '权利', ';', '狗', '到处', '排泄', '会', '破坏', '环境', '等', '。', '“', '这样', '大家', '碰到', '任何', '一个', '话题', '都', '不用', '心虚', '了', '。', '”', '但是', '他', '同时', '提醒', '广大', '考生', '不必', '面面俱到', ',', '只要', '挑出', '十大', '原则', '中', '的', '两三点', '来', '自圆其说', '就', '绰绰有余', '了', '。', '\n', '\u3000', '\u3000', '记住', '800', '个', '核心', '词汇', '\n', '\u3000', '\u3000', '“', '垃圾', '怎么', '说', '?', '可回收', '垃圾', '?', '可降解', '的', '垃圾', '?', '…', '…', '”', '课堂', '上', ',', '吴建业', '关于', '垃圾', '的', '几个', '提问', '难倒', '了', '很多', '在场', '的', '英语专业', '的', '学生', '。', '吴建业', '老师', '表示', ',', '中国', '学生', '在', '学校', '学习', '的', '词汇', '在', '很多', '场合', '用不上', ',', '比如', '英语专业', '八级', '侧重于', '文学名著', ',', '商务英语', '则', '侧重', '谈判', '、', '商业', '词汇', '。', '雅思', '需要', '8000', '词汇', ',', '但', '相当', '一部分', '考生', '疯狂', '地', '从', 'A', '背到', 'Z', ',', '还', '存在', '想', '说', '却说', '不', '出来', ',', '即使', '说', '得', '出来', '也', '衔接', '不来', '的', '问题', '。', '怎么办', '?', '\n', '\u3000', '\u3000', '“', '分类', '背诵', ',', '联想', '记忆', '。', '”', '吴建业', '告诉', '广大', '考生', ',', '只要', '掌握', '了', '800', '个', '词汇', ',', '就', '可', '轻松', '应对', '雅思', '写作', '。', '“', '当然', '这些', '词汇', '是', '剔除', '了', 'dog', '、', 'pig', '之类', '的', '核心', '词汇', '。', '”', '那', '什么', '词才', '叫', '核心', '词汇', '呢', '?', '吴建业', '举', '了', '一个', '例子', ',', '如由', '奢侈', '→', '贫穷', '→', '救助', '→', '难民', '→', '…', '…', ',', '就', '这样', '把', '相关联', '的', '词汇', '串通', '起来', '背诵', ',', '既', '掌握', '了', '词汇', ',', '而', '这些', '词汇', '往往', '是', '一篇', '文章', '中', '可能', '涉及', '的', '内容', '。', '\n', '\u3000', '\u3000', '写', '个性化', '的', '八股文', '\n', '\u3000', '\u3000', '吴', '老师', '还', '指出', '了', '考生', '的', '备考', '误区', '和', '应对', '方法', '。', '针对', '很多', '人', '希望', '通过', '学习', '外文', '名著', '来', '提高', '写作水平', '的', '想法', ',', '吴', '老师', '认为', '外国名著', '对', '大多数', '中国', '考生', '而言', '是', '可望而不可及', '的', '。', '“', '外国人', '学', '汉语', '要', '学习', '汉语', '说得好', '的', '大山', '和', '大牛', ',', '而', '不', '可能', '让', '他们', '学习', '鲁迅', '先生', '的', '《', '药', '》', '、', '《', '孔乙己', '》', '等', '名篇', '。', '”', '同样', ',', '中国', '考生', '要', '学习', '英语', '学得', '优秀', '的', '中国', '人', ',', '他', '认为', '真正', '优秀', '的', '教材', '其实', '是', '中国', '考生', '的', '优秀', '范文', '。', '\n', '\u3000', '\u3000', '提到', '一些', '辅导', '老师', '教育', '学生', '写作文', '一定', '要', '真情流露', ',', '想到', '什么', '就', '说', '什么', ',', '吴', '老师', '认为', '这', '是', '不', '现实', '的', ',', '因为', '对', '大多数', '中国', '考生', '来说', ',', '做到', '挥洒自如', '、', '下笔', '自若', '、', '真情流露', '很难', '。', '而', '很多', '人', '争相', '背诵', '名师', '的', '范文', '又', '搞', '得', '千人一面', ',', '味同嚼蜡', '。', '鉴于', '此', ',', '他', '认为', '既', '要', '学习', '范文', '的', '格式', ',', '又', '要', '有所', '改装', ',', '加入', '自己', '的', '东西', ',', '凸显', '个性', ',', '“', '写', '个性化', '的', '八股文', '”', '。', '\n', '\u3000', '\u3000', '讲座', '上', ',', '吴', '老师', '还', '提醒', '考生', '写作', '时', '不要', '想着', '标新立异', '、', '旁征博引', ',', '只要', '能够', '自圆其说', ',', '多用', '权威', '、', '翔实', '的', '数据', '事例', '来', '说明', '观点', '就', '好', ',', '否则', '会', '画蛇添足', '。'], 'C000020')
    (['\u3000', '\u3000', '1', '.', '考生', '填报', '志愿', '采取', '网上', '填报', '方式', ',', '考生', '须', '在', '规定', '时间', '内', '登录', '北京', '教育', '考试院', '网站', '填报', '志愿', ',', '网址', '为', 'www', '.', 'jeea', '.', 'cn', '/', ' ', '或', 'gk', '.', 'bbn', '.', 'com', '.', 'cn', '/', ' ', '。', '同时', '提供', '电话', '填报', '方式', ',', '考生', '可', '通过', '拨打', '声讯', '电话', '1606790', '填报', '志愿', '或', '查询', '志愿', '。', '\n', '\u3000', '\u3000', '2', '.', '考生', '填报', '志愿', ',', '要', '严格', '按照', '《', '2006', '年', '全国', '普通', '高等学校', '在', '京', '招生', '专业', '目录', '》', '填写', '信息', '。', '\n', '\u3000', '\u3000', '3', '.', '考生', '填报', '志愿', '时', ',', '宜先', '草拟', '一份', '志愿', '表', ',', '内容', '包括', '考生', '的', '考生', '号', '和', '要', '填报', '的', '院校', '代码', '及', '名称', '、', '专业', '代码', '及', '名称', ',', '以', '保证', '填报', '志愿', '的', '准确', '和', '填报', '过程', '的', '顺利', '。', '\n', '\u3000', '\u3000', '4', '.', '考生', '在', '网上', '报名', '阶段', '设定', '的', '密码', '作为', '网上', '填报', '志愿', '的', '初始密码', '。', '在', '第一次', '填报', '志愿', '之前', '将', '开通', '系统', '供', '考生', '修改', '密码', ',', '考生', '必须', '修改', '密码', '才能', '进行', '志愿', '填报', ',', '考生', '需', '牢记', '修改', '后', '的', '密码', ',', '凭此', '密码', '进行', '第一次', '志愿', '填报', '、', '第二次', '志愿', '填报', '和', '各', '批次', '志愿', '补报', '。', '如', '考生', '忘记', '密码', ',', '须', '在', '系统', '开通', '的', '日期', '内', '携带', '本人', '身份证', '到', '本报', '名', '单位', '登记', '申请', '恢复', '密码', '。', '\n', '\u3000', '\u3000', '5', '.', '在', '第一次', '志愿', '填报', '时', '同时', '采集', '考生', '特征', ',', '考生', '特征', '的', '主要', '内容', '为', '照顾', '对象', ',', '具备', '相关', '特征', '的', '考生', '须', '参加', '第一次', '填报', '。', '考生', '在', '选中', '相应', '选项', '后', '必须', '向', '报名', '单位', '提供', '相关', '证明', '材料', '方', '为', '有效', '。', '\n', '\u3000', '\u3000', '6', '.', '第一次', '填报', '提前', '批', '、', '本科', '一批', '、', '本科', '二批', '、', '本科', '三批', '的', '志愿', '及', '艺术类', '高职', '录取', '院校', '的', '志愿', ',', '提前', '录取', '院校', '可选报', '两个', '志愿', '学校', ',', '第一批', '、', '第二批', '、', '第三批', '录取', '院校', '可', '在', '本', '批内', '各选报', '三个', '志愿', '学校', ',', '艺术类', '高职', '可选报', '两个', '志愿', '学校', ',', '每个', '志愿', '学校', '可选报', '五个', '专业', '。', '\n', '\u3000', '\u3000', '7', '.', '第二次', '填报', '专科', '录取', '批次', '的', '志愿', ',', '可选报', '四个', '志愿', '学校', ',', ' ', '每个', '志愿', '学校', '可选报', '五个', '专业', '。', '\n', '\u3000', '\u3000', '8', '.', '今年', '继续', '实行', '公布', '批次', '未', '完成', '计划', '重新', '征集', '志愿', '再行', '录取', '的', '方式', '。', '在', '本科', '一批', '、', '本科', '二批', '、', '本科', '三批', '和', '专科', '批次', '的', '正式', '志愿', '录取', '结束', '后', ',', '如', '高等学校', '计划', '未', '完成', ',', '将', '公布', '未', '完成', '计划', ',', '重新', '征集', '考生', '志愿', '再行', '录取', '。', '\n', '\u3000', '\u3000', '在', '每个', '批次', '的', '志愿', '补报', '期间', ',', '达到', '相应', '批次', '录取', '控制', '分数线', '且', '未', '被', '录取', '的', '考生', '可', '补报', '相应', '批次', '未', '完成', '招生', '计划', '的', '院校', '和', '专业', '志愿', '。', '录取', '期间', '各', '批次', '未', '完成', '计划', '的', '院校', '和', '专业', '信息', '请', '参照', '北京', '教育', '考试院', '网站', '或', '媒体', '宣传', '。', '\n', '\u3000', '\u3000', '本科', '各', '批次', '补报', '志愿', '可选报', '三个', '志愿', '学校', ',', ' ', '每个', '志愿', '学校', '可选报', '三个', '专业', '。', '专科', '批次', '补报', '志愿', '可选报', '四个', '志愿', '学校', ',', ' ', '每个', '志愿', '学校', '可选报', '三个', '专业', '。', '\n', '\u3000', '\u3000', '补报', '志愿', '在', '录取', '时', '按照', '“', '分数', '优先', ',', '从', '高分', '到', '低分', ',', '按', '志愿', '顺序', '”', '一次性', '向', '招生', '学校', '投档', ',', '由', '招生', '学校', '审查', '录取', '。', '\n', '\u3000', '\u3000', '9', '.', '电话', '填报', '必须', '使用', '北京市', '固定', '电话', '操作', ',', '且', '务必', '使用', '音频', '电话', '。', '\n', '\u3000', '\u3000', '10', '.', '志愿', '填报', '日程安排', '\n', '\u3000', '\u3000', '5', '月', ' ', '9', '日', ' ', '8', ':', '00', '—', '5', '月', '12', '日', ' ', '8', ':', '00', '\n', '\u3000', '\u3000', '系统', '开通', '供', '考生', '修改', '密码', '\n', '\u3000', '\u3000', '5', '月', '12', '日', '8', ':', '00', '—', '5', '月', '17', '日', '18', ':', '00', '\n', '\u3000', '\u3000', '第一次', '志愿', '填报', '\n', '\u3000', '\u3000', '7', '月', '31', '日', '8', ':', '00', '—', '8', '月', ' ', '2', '日', '18', ':', '00', '\n', '\u3000', '\u3000', '第二次', '志愿', '填报', '\n', '\u3000', '\u3000', '预计', '7', '月', '14', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '本科', '一批', '志愿', '补报', '\n', '\u3000', '\u3000', '预计', '7', '月', '21', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '本科', '二批', '志愿', '补报', '\n', '\u3000', '\u3000', '预计', '7', '月', '27', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '本科', '三批', '志愿', '补报', '\n', '\u3000', '\u3000', '预计', '8', '月', ' ', '7', '日', '(', '以', '录取', '期间', '公布', '的', '为准', ')', '\n', '\u3000', '\u3000', '专科', '批次', '志愿', '补报', '\n', '\u3000', '\u3000', '网上', '填报', '志愿', '步骤', '\n', '\u3000', '\u3000', '通过', '浏览器', '登录', 'www', '.', 'bjeea', '.', 'cn', '/', ' ', ',', '点击', '“', '网上', '报名', '”', ',', '然后', '点击', '“', '2006', '年', '北京市', '普通', '高等学校', '招生', '网上', '志愿', '填报', '”', '进入', '系统', ',', '或者', '直接', '登录', 'gk', '.', 'bbn', '.', 'com', '.', 'cn', '/', ' ', '进入', '系统', ';', '\n', '\u3000', '\u3000', '点击', '“', '修改', '密码', '”', '修改', '自己', '的', '密码', ';', '\n', '\u3000', '\u3000', '点击', '“', '提交', '志愿', '信息', '”', ',', '输入', '考生', '号', '、', '密码', '和', '校验码', ',', '点击', '“', '确定', '”', '进行', '登录', '进入', '志愿', '填报', '页', ';', '\n', '\u3000', '\u3000', '有关', '考生', '填报', '考生', '特征', ';', '\n', '\u3000', '\u3000', '填报', '院校', '志愿', '和', '专业', '志愿', ',', '在', '院校', '框中', '输入', '3', '位', '院校', '代码', ',', '在', '专业', '框中', '输入', '2', '位', '专业', '代码', '(', '输入', '代码', '后', '会', '显示', '相应', '院校', '名称', '和', '专业', '名称', ')', ',', '并', '选报', '是否', '服从', '专业', '调剂', '和', '是否', '愿意', '走读', ';', '\n', '\u3000', '\u3000', '点击', '“', '提交', '”', '完成', '志愿', '填报', '。', '\n', '\u3000', '\u3000', '声讯', '电话', '填报', '流程', '\n', '\n', '\n', '\n', '\n', '\u3000', '\u3000', '编辑', ':', '苏琳'], 'C000010')
    (['\n', '\u3000', '\u3000', '如果', '你', '周围', '的', '不少', '人', '都', '晋升', '了', ',', '那', '就', '该', '好好', '反省', '自己', '了', '。', '看看', '以下', '种种', '晋升', '“', '绝症', '”', ',', '是否', '有', '自己', '的', '身影', '呢', '?', '\n', '\u3000', '\u3000', '职位', '成功', '晋级', ',', '事业', '更上层楼', ',', '这是', '不少', '经理人', '的', '职业', '目标', '。', '然而', ',', '很多', '经理人', '努力', '打拼', '却', '依旧', '还', '在', '原地', '徘徊', '。', '\n', '\u3000', '\u3000', '在', '竞争', '社会', ',', '当', '你', '不能', '升职', '的', '时候', ',', '要', '先', '考虑', '是', '企业', '体制', '的', '问题', ',', '还是', '你', '自己', '的', '问题', '。', '如果', '是', '体制', '问题', ',', '你', '可能', '根本', '就', '没有', '机会', ',', '完全', '可以', '选择', '主动', '离开', '。', '如果', '你', '周围', '的', '不少', '人', '都', '晋升', '了', ',', '那', '就', '该', '好好', '反省', '自己', '了', '。', '看看', '以下', '种种', '晋升', '“', '绝症', '”', ',', '是否', '有', '自己', '的', '身影', '呢', '?', '\n', '\u3000', '\u3000', '失语症', '—', '—', '上司', '换', '了', '8', '个', ',', '我', '还是', '当', '绿叶', '\n', '\u3000', '\u3000', '邓珉', '在', '一家', '知名', '房地产', '物业公司', '做', '行政', '人事主管', ',', '从', '2001', '年', '到', '现在', ',', '公司', '先后', '换', '了', '两任', '老总', ',', '换', '了', '8', '个', '项目经理', ',', '每个', '项目经理', '升职', '调走', '了', ',', '而', '她', '却', '一直', '在', '原地不动', '。', '让', '邓珉', '困惑', '的', '是', ',', '她', '要', '不停', '地', '适应', '新', '领导', '的', '管理', '风格', ',', '而且', '自己', '的', '发展', '空间', '有限', '。', '物业公司', '的', '行政', '人事工作', '并', '不', '复杂', ',', '她', '只要', '用', '30', '%', '的', '精力', '就', '足够', '应付', '得', '了', '。', '公司', '也', '一直', '认为', '邓珉', '是', '个', '老同志', ',', '比较稳定', '塌实', ',', '哪里', '需要', '就让', '邓珉', '过去', '。', '\n', '\u3000', '\u3000', '“', '失语', '”', '诊断', ':', '邓珉', '一直', '在', '做', '默默无闻', '的', '“', '失语', '”', '绿叶', ',', '整整', '陪衬', '了', '8', '位', '上司', '。', '行政', '支持', '工作', '并', '不是', '最', '“', '抢眼', '”', '的', '红花', ',', '企业', '很', '容易', '把', '你', '定性', '。', '虽然', '你', '在', '公司', '给', '大家', '留下', '了', '不错', '的', '印象', ',', '但', '企业', '往往', '是', '哪里', '需要', '你', ',', '就', '把', '你', '往', '哪里', '搬', '。', '\n', '\u3000', '\u3000', '药方', ':', '生意', '就是', '生意', ',', '经理人', '要', '更', '多', '地', '考虑', '自身', '的', '利益', ',', '衡量', '自己', '的', '投入', '和', '产出', ',', '千万别', '做', '赔本', '的', '买卖', '。', '想要', '晋升', ',', '就要', '勇于', '表现', '出来', ',', '要', '捅破', '这层', '窗户纸', '。', '第一', ',', '想要', '。', '第二', ',', '要', '做', '。', '第三', ',', '要', '让', '老板', '知道', '。', '一定', '要', '向', '老板', '提出', '你', '的', '想法', ',', '你', '可以', '结合', '企业', '的', '资源', '和', '现状', '来', '分析', ',', '要', '让', '老板', '意识', '到', ',', '你', '的确', '想要', '承担', '更大', '的', '责任', '。', '另外', ',', '表明', '你', '现有', '工作', '做', '得', '不错', ',', '你', '也', '有', '这样', '的', '能力', '。', '在', '企业', '环境', '相对', '稳定', '时', ',', '企业', '在', '重用', '一个', '人', '的', '时候', ',', '看重', '的', '不是', '能力', ',', '而是', '信任', '。', '这方面', '你', '有', '优势', '。', '\n', '\u3000', '\u3000', '自闭症', '—', '—', '就', '盯', '着', '自己', '的', '一亩', '三分', '地', '\n', '\u3000', '\u3000', '一年', '前', ',', '业绩', '出色', '的', '路平', '被', '破格', '提升', '为', '企划', '经理', ',', '但', '他', '还是', '走', '业务', '路线', ',', '手底下', '没兵', ',', '只有', '一个', '助理', '协助', '他', '。', '他', '一直', '对', '市场', '企划', '总监', '这个', '职位', '心仪已久', ',', '没想到', '最后', '却', '被', '能力', '、', '业绩', '远不如', '自己', '的', '同事', 'PK', '下来', '。', '\n', '\u3000', '\u3000', '原来', ',', '一向', '喜欢', '单打独斗', '的', '路平', '总是', '有点', '各色', ',', '他', '只', '愿意', '盯准', '自己', '那', '一亩', '三分', '地', '。', '例会', '时', ',', '部门', '讨论', '其他', '市场', '活动', '方案', ',', '他', '总是', '一言不发', '。', '等到', '询问', '起', '他', '的', '意见', '时', ',', '他', '便', '说', ',', '“', '不好意思', ',', '我', '没', '来得及', '看', '。', '”', '平日', '的', '团队', '活动', '或是', '聚会', ',', '也', '难见', '他', '的', '身影', '。', '老板', '用人', '所长', ',', '结果', '导向', ',', '对路平', '也', '是', '睁一只眼', '闭一只眼', '。', '但', '同事', '们', '不免', '背后', '嘀咕', ',', '说路平', '小农意识', '。', '\n', '\u3000', '\u3000', '“', '自闭', '”', '诊断', ':', '各色', '的', '路平', '眼里', '只有', '自己', '那', '一摊', '。', '在', '结果', '导向', '、', '业绩', '为', '王', '的', '公司', ',', '这样', '也许', '没错', '。', '但', '在', '晋升', '路上', ',', '过分', '的', '“', '自闭', '”', '会', '让', '上司', '有所', '顾虑', ',', '同事', '的', '反作用力', '也', '会', '断送', '你', '的', '晋升', '良机', '。', '\n', '\u3000', '\u3000', '药方', ':', '职场', '中', '人人', '都', '是', '生意', '伙伴', ',', '上司', '、', '同事', '都', '是', '价值链', '上', '的', '客户', '和', '资源', '。', '只', '盘算着', '自己', '的', '眼前利益', ',', '往往', '会', '失去', '更', '多', '“', '商机', '”', '。', '路平要', '积极', '和', '同事', '们', '主动', '交往', ',', '能者多劳', ',', '既然', '你', '点子', '多', ',', '不妨', '多', '给', '同事', '们', '出', '一些', '好', '创意', ',', '而', '你', '在', '支持', '同事', '的', '同时', ',', '不仅', '获得', '了', '一个', '好', '人缘', ',', '进而', '也', '熟悉', '其他', '业务', '线', ',', '增强', '了', '自身', '的', '实力', '。', '如果', '其他', '业务', '线', '你', '也', '能', '轻松', '玩转', '的话', ',', '上司', '一定', '会', '给', '你', '更', '多', '机会', '的', '。', '\n', '\u3000', '\u3000', '狂妄', '症', '—', '—', '“', '我', '就', '愿意', '让', '别人', '听', '我', '的', '”', '\n', '\u3000', '\u3000', '安妮', '是', '一家', '呼叫', '中心', '项目部', '的', '客服', '经理', ',', '她', '刚', '上任', '不久', ',', '就', '引起', '了', '下属', '的', '极度', '不满', ',', '而且', '被', '投诉', '到', '公司总部', '。', '\n', '\u3000', '\u3000', '原来', ',', '安妮', '个性', '强势', ',', '上任', '后', '就', '进行', '了', '一系列', '改革', ',', '重新', '排班', ',', '规范', '服务', ',', '整顿', '流程', '等等', '。', '改革', '取得', '了', '一定', '成效', ',', '以前', '忙乱', '的', '客服', '工作', '逐渐', '变得', '有序', ',', '但', '安妮', '自己', '却', '引起', '了', '一片', '倒伐之声', '。', '当下', '属', '在', '外面', '忙', '得', '团团转', '时', ',', '她', '却', '在', '自己', '的', '单间', '里', '会客', '聊天', ',', '而且', '经常', '不', '来', '上班', '。', '而', '自由散漫', '的', '安妮', '对', '下属', '却是', '实施', '高压手段', ',', '用', '她', '的话', '来说', ',', '“', '我', '就', '愿意', '管', '人', ',', '让', '别人', '听', '我', '的', '。', '”', '她', '安排', '自己', '的', '亲信', '任职', ',', '监视', '其他', '下属', '言行', ',', '搞', '得', '员工', '怨声载道', '。', '几个', '月', '后', ',', '项目', '高管', '调整', ',', '其他', '几个', '项目', '的', '中层', '都', '获得', '了', '提升', ',', '惟独', '安妮', '没有', '新', '的', '发展', '空间', ',', '最终', '辞职', '而', '去', '。', '\n', '\u3000', '\u3000', '“', '狂妄', '”', '诊断', ':', '安妮', '有着', '强烈', '的', '领导', '欲望', ',', '管理', '风格', '泼辣', '强悍', ',', '但', '她', '却', '忽略', '了', '接受方', '的', '感受', '。', '改革', '虽然', '初见成效', ',', '但', '她', '自己', '却', '难', '为', '表率', ',', '严人', '宽己', '的', '领导', '风格', '必然', '难以', '服众', '。', '\n', '\u3000', '\u3000', '药方', ':', '狂妄', '的', '强权', '不是', '万灵药', ',', '身为', '管理者', ',', '安妮', '既', '是', '规则', '的', '制定者', ',', '也', '是', '规则', '的', '裁判', ',', '如果', '自己', '都', '处处', '破坏', '规则', ',', '一时', '的', '业绩', '也', '只能', '是', '短期', '效应', '。', '而', '下属', '员工', '是', '经理', '的', '供应商', ',', '水能载舟', ',', '也', '能', '覆舟', ',', '业绩', '是', '需要', '大家', '一起', '努力', '做', '出来', '的', '。', '安妮', '如果', '早些', '努力', '调试', '自己', ',', '采取', '一些', '柔性', '管理手段', ',', '避免', '激进', '改革', ',', '以身作则', '让', '员工', '口服心服', ',', '也', '不至于', '在', '项目', '调整', '时', '弄', '得', '丢盔卸甲', '。', '\n', '\u3000', '\u3000', '多动症', '—', '—', '不', '开心', '就', '跳', ',', '越', '跳越', '迷茫', '\n', '\u3000', '\u3000', '30', '出头', '的', '汪力', '已经', '换', '了', '6', '家', '企业', ',', '现在', '一家', 'IT', '企业', '任', '数码产品', '经理', '。', '年轻', '时', '为了', '薪水', '而', '跳', ',', '把', '跳槽', '当成', '涨薪', '的', '跳板', ',', '往往', '是', '这家', '企业', '还', '没', '彻底', '了', '断', ',', '就', '已经', '在', '下家', '开始', '领', '薪水', '。', '近一年来', ',', '汪力', '倒', '还', '算', '得', '上', '稳定', ',', '一直', '没什么', '非分之想', '。', '但', '上个月', ',', '公司', '的', '产品', '总监', '换成', '了', '一个', '台湾', '老板', ',', '对', '汪力', '似乎', '有些', '看不顺眼', ',', '重要', '业务', '会议', '不让', '他', '参加', ',', '一些', '产品', '的', '推广', '预算', '也', '卡得', '很', '紧', '。', '汪力', '感觉', '自己', '不', '被', '信任', ',', '正', '逐渐', '被', '边缘化', ',', '他', '又', '动', '了', '大不了', '走人', '的', '念头', '。', '\n', '\u3000', '\u3000', '汪力', '把', '自己', '的', '简历', '给', '了', '一家', '猎头', ',', '没想到', '猎头', '却', '称', ',', '他', '跳槽', '频率', '过快', ',', '如果', '要', '晋升', '高职', ',', '希望', '并不大', '。', '如果', '平级', '跳', ',', '汪力', '又', '不', '甘心', '。', '\n', '\u3000', '\u3000', '“', '多动', '”', '诊断', ':', '通常', ',', '猎头', '非常', '不', '喜欢', '频繁', '跳槽', '的', '人', ',', '因为', '频繁', '跳槽', '说明', '此人', '目标', '不', '清晰', ',', '对', '公司', '的', '忠诚度', '值得', '怀疑', '。', '汪力', '一直', '对', '自己', '期望', '较', '高', ',', '如果', '现实', '稍', '不如意', ',', '便', '有', '“', '弃暗投明', '”', '的', '念头', '。', '但', '频频', '转换', ',', '跳成', '了', '习惯', ',', '在', '每', '一个', '职位', '上', '都', '不能', '积累', '较', '多', '的', '资本', ',', '更', '谈不上', '为', '晋升', '打下', '坚实', '根基', '了', '。', '\n', '\u3000', '\u3000', '药方', ':', '在', '猎头', '眼中', ',', '在', '一家', '公司', '中高层', '职位', '上', '干满', '3', '年', '的', '候选人', '是', '比较', '理想', '的', '。', '汪力', '如果', '认准', '了', '行业', ',', '就要', '努力', '埋头', '做', '下去', ',', '没有', '完美', '的', '企业', '和', '上司', ',', '你', '在', '这家', '企业', '被', '边缘化', ',', '如果', '不能', '咸鱼', '翻生', '的话', ',', '再换', '一家', '也', '同样', '如此', '。', '只有', '想', '清楚', '自己', '的', '目标', ',', '稳扎稳打', ',', '步步为营', ',', '用', '实在', '的', '业绩', '说话', ',', '下', '一个', '晋升', '机会', '才', '不会', '擦肩而过', '。', '\n', '\u3000', '\u3000', '其他', '非典型', '晋升', '“', '绝症', '”', '\n', '\u3000', '\u3000', '1', '.', '“', '红眼病', '”', ',', '容不得', '他人', '比', '自己', '能干', ',', '喜欢', '背后', '冷嘲热讽', '。', '\n', '\u3000', '\u3000', '2', '.', '“', '营养不良', '”', ',', '知识', '和', '能力', '总是', '跟不上', '企业', '步伐', '。', '\n', '\u3000', '\u3000', '3', '.', '“', '骨质', '疏松', '”', ',', '没有', '主见', ',', '人云亦云', ',', '就', '会', '做', '老好人', '。', '\n', '\u3000', '\u3000', '…', '…', '\n', '\u3000', '\u3000', '第', 'N', '种', ':', '“', '抑郁症', '”', ',', '非黑', '即', '白', ',', '抱怨', '连连', '却', '缺乏', '行动', '力', '。', '\n', '\u3000', '\u3000', '(', '文章', '出自', ':', '前程无忧', '〈', '人力资本', '〉', '杂志', ')'], 'C000014')
    (['\u3000', '\u3000', '9', '日', '在京举行', '的', '世界卫生组织', '慢性病', '全球', '报告', '中文版', '首发式', '上', ',', '卫生部', '公布', '了', '中国', '慢性病', '情况', '。', '其中', '一个', '令人瞠目', '的', '数字', '是', ',', '目前', '全国', '约', '有', '3', '.', '5', '亿', '吸烟者', ',', '2000', '年', '由', '吸烟', '导致', '的', '死亡', '人数', '近', '100', '万人', ',', '超过', '艾滋病', '、', '结核', '、', '交通事故', '以及', '自杀', '死亡', '人数', '的', '总和', ',', '占', '全部', '死亡', '人数', '的', '12', '%', '。', '\n', '\u3000', '\u3000', '卫生部', '警告', '说', ',', '如', '不', '采取', '控制措施', ',', '预计', '到', '2020', '年时', '这个', '比例', '将', '上升', '至', '33', '%', ',', '死亡', '人数', '将', '达到', '200', '万人', ',', '其中', '有', '一半', '人', '将', '在', '35', '-', '64', '岁', '之间', '死亡', '。', '\n', '\u3000', '\u3000', '2002', '年', '我国', '男性', '吸烟率', '为', '66', '.', '0', '%', ',', '女性', '吸烟率', '为', '3', '.', '08', '%', ',', '与', '1996', '年', '比', ',', '尽管', '吸烟率', '略有', '下降', ',', '随着', '总人口', '的', '增加', ',', '吸烟', '人数', '仍然', '增加', '了', '3000', '万人', '。', '\n', '\u3000', '\u3000', '吸烟', '对', '青年', '十分', '有害', ',', '因此', ',', '应', '尽早', '戒烟', '。', '戒烟', '方法', '很多', ',', '下面', '十二种', '戒烟法', ',', '可', '供', '少年', '吸烟者', '试一试', ':', '\u3000', '\u3000', '(', '1', ')', '特意', '在', '一二天', '内', '超量', '吸烟', '(', '每天', '吸', '两包', '左右', ')', ',', '使', '人体', '对', '香烟', '的', '味道', '产生', '反感', ',', '从而', '戒烟', ';', '或', '在', '患', '伤风感冒', '没有', '吸烟', '欲望', '时', '戒烟', '。', '\u3000', '\u3000', '(', '2', ')', '想象', '自己', '在', '吸烟', ',', '同时', '想象', '令人作呕', '的', '事情', '(', '比如', '你', '手中', '烟盒', '或', '香烟', '上', '有', '痰', '渍', '等等', ')', '。', '\u3000', '\u3000', '(', '3', ')', '将', '戒烟', '的', '原因', '写', '在', '纸', '上', ',', '经常', '阅读', ';', '如能', '可能', ',', '尽量', '补充', '新', '内容', '。', '\u3000', '\u3000', '(', '4', ')', '将', '想', '购买', '的', '物品', '写', '下来', ',', '按', '其', '价格', '计算', '可', '购买', '香烟', '的', '包数', '。', '逐日', '将', '用来', '购买', '香烟', '的', '钱', '储存', '在', '“', '聚宝盆', '”', '内', '。', '每', '过', '一个月', ',', '清点', '一次', '钱数', '。', '\u3000', '\u3000', '(', '5', ')', '同', '朋友', '打', '“', '赌', '”', ',', '保证', '戒烟', '。', '当然', '这要', '用', '自己', '的', '烟', '钱', '作为', ' ', '“', '赌注', '”', '。', '\u3000', '\u3000', '(', '6', ')', '不', '整条', '买烟', '。', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '相关', '事件', ':', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '卫生部', ':', '我国', '青少年', '吸烟', '人数', '高达', '5000', '万', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '9', '日', '在京举行', '的', '世界卫生组织', '慢性病', '全球', '报告', '中文版', '首发式', '上', ',', '卫生部', '公布', '的', '中国', '慢性病', '情况', '表明', ',', '目前', '中国', '青少年', '吸烟', '人数', '高达', '5000', '万人', '。', '&', 'gt', ';', '&', 'gt', ';', '&', 'gt', ';', '全文', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '与', '潜意识', '对话', ' ', '临床', '催眠', '治疗', '能', '帮助', '戒烟', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '美国', '科学家', '最近', '经', '研究', '发现', ',', '在', '正规', '的', '临床', '催眠', '师', '帮助', '下', '接受', '催眠', '治疗', ',', '有', '可能', '帮助', '吸烟者', '成功', '戒烟', '且', '长时间', '保持', '戒烟', '状态', '。', '&', 'gt', ';', '&', 'gt', ';', '&', 'gt', ';', '全文', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '生活习惯', '影响', '烟瘾', ' ', '晚睡', '早起', '的', '人', '烟瘾', '更大', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '据', '最新', '一期', '《', '国际', '生物钟', '学', '》', '期刊', '研究', '显示', ',', '德国', '科学家', '发现', ',', '早晨', '起床', '时间', '在', '5', '点', '之前', '、', '晚上', '11', '点', '之后', '睡觉', '的', '人', '更', '容易', '吸烟', '!', '&', 'gt', ';', '&', 'gt', ';', '&', 'gt', ';', '全文'], 'C000013')
    (['\n', '【', '半生', '缘', '】', ' ', '1997', '年', '香港', '东方', '影业公司', '出品', '\n', '半生', '缘', '\n', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '他', '一旦', '想起', '曼桢', ',', '就', '觉得', '他', '从来', '也', '没有', '停止', '想念', '她', '过', '。', '就是', '自己', '以为', '已经', '忘记', '她', '的', '时候', ',', '她', '也', '还是', '在', '那里', '的', ',', '在', '他', '一切', '思想', '的', '背后', '。', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '\n', '原著', ':', '张爱玲', '编剧', ':', '陈健忠', '色彩', ':', '彩色片', '长', ':', '125min', '语言', ':', '普通话', '外文', '别名', ':', 'Eighteen', ' ', 'Springs', '(', '1997', ')', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', 'Half', ' ', 'Life', ' ', 'Fate', '(', '1997', ')', '导演', ':', '许鞍华', '主演', ':', '吴倩莲', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '顾曼桢', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '黎', '&', 'nbsp', ';', ' ', '明', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '沈世均', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '黄', '&', 'nbsp', ';', ' ', '磊', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '许叔惠', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '吴辰君', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '石翠芝', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '梅艳芳', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', ' ', '顾曼璐', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '葛', '&', 'nbsp', ';', ' ', '优', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '祝鸿才', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '王志文', '&', 'nbsp', ';', ' ', '饰', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '张豫槿', '获奖', ':', '1998', '年', '香港', '电影协会', '最佳', '女', '主角奖', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '1998', '年', '香港电影', '金像', '最佳', '女', '配角奖', '\n', '【', '剧情简介', '】', '&', 'nbsp', ';', '&', 'nbsp', ';', '&', 'nbsp', ';', ' ', '30', '年代', '的', '上海', '。', '世钧', '和曼桢', '是', '同一', '工厂', '做工', '的', '恋人', '。', '曼桢', '早年', '丧父', ',', '家庭', '生活', '靠', '姐姐', '曼璐', '当', '舞女', '维持', ',', '后来', '曼璐', '又', '当', '了', '妓女', ',', '最终', '嫁给', '了', '有妇之夫', '祝鸿才', '。', '为了', '保全', '自已', '的', '地位', ',', '不能', '生育', '的', '曼璐以', '一种', '怨毒', '的', '心态', '与其', '夫', '合谋', ',', '令祝', '强奸', '了', '曼桢', '。', '曼桢', '为', '姐姐', '、', '姐夫', '生下', '一子', ',', '葬送', '了', '自已', '的', '恋情', '。', '姐姐', '死后', ',', '她', '也', '嫁给', '了', '祝鸿才', '。', '多年', '后', ',', '曼桢', '与', '世钧', '重逢', ',', '两人', '发现', ',', '前情', '虽', '在', ',', '后缘', '难续', '。', ' ', '上', '一页', '&', 'nbsp', ';', '[', '1', ']', '&', 'nbsp', ';', '[', '2', ']', '&', 'nbsp', ';', '[', '3', ']', '&', 'nbsp', ';', '[', '4', ']', '&', 'nbsp', ';', '[', '5', ']', '&', 'nbsp', ';', '[', '6', ']', '&', 'nbsp', ';', '[', '7', ']', '&', 'nbsp', ';', '[', '8', ']', '&', 'nbsp', ';', '[', '9', ']', '&', 'nbsp', ';', '下', '一页', '&', 'nbsp', ';'], 'C000023')
    (['\n', '\n', '\n', '\n', '\u3000', '\u3000', '“', '猎鹰', '”', '试翼', '—', '—', '我国', '第三代', '高级', '教练机', '开始', '试飞', '\n', '\u3000', '\u3000', 'Chinese', ' ', 'Third', ' ', 'Generation', ' ', 'Training', ' ', 'Plane', ' ', '\n', 'Begins', ' ', 'Flight', ' ', 'Test', '\n', '\u3000', '\u3000', 'L', '-', '15', '总', '设计师', '对', '若干', '问题', '的', '解答', '\n', '\u3000', '\u3000', 'An', ' ', 'Interview', ' ', 'with', ' ', 'the', ' ', 'Chief', '-', 'Designer', ' ', 'of', ' ', 'L', '-', '15', '\n', '\u3000', '\u3000', '崎岖', '的', '“', '太行', '”', '之', '路', '—', '—', '我国', '新型', '大', '推力', '涡扇', '发动机', '的', '研制', '历程', '\n', '\u3000', '\u3000', 'Chinese', ' ', 'Home', ' ', 'Made', ' ', 'New', ' ', 'High', ' ', 'Thrust', ' ', 'Turbofan', ' ', 'Engine', ' ', 'Fielded', '\n', '\u3000', '\u3000', '伊朗', ':', '孤独', '的', '圣战', '\n', '\u3000', '\u3000', 'Iran', ' ', 'Focus', ':', ' ', 'Will', ' ', 'Iran', ' ', 'Be', ' ', 'the', ' ', 'Next', ' ', 'Iraq', '\n', '\u3000', '\u3000', '核', '萌芽', '的', '保护伞', '—', '—', '伊朗', '常规', '武装力量', '评介', '\n', '\u3000', '\u3000', 'An', ' ', 'Assessment', ':', ' ', 'The', ' ', 'Conventional', ' ', 'Armed', ' ', 'Forces', ' ', 'of', ' ', 'Iran', '\n', '\u3000', '\u3000', '专题', ':', '军用', '机器人', '技术', '\n', '\u3000', '\u3000', 'Military', ' ', 'Robots', ' ', 'Technology', '\n', '\u3000', '\u3000', '科学', '而', '非', '幻想', '—', '—', '美国', '军用', '机器人', '走向', '战场', '\n', '\u3000', '\u3000', 'It', "'", 's', ' ', 'Not', ' ', 'Fiction', ':', ' ', 'U', '.', 'S', ' ', 'Military', ' ', 'Robots', ' ', 'Go', ' ', 'To', ' ', 'War', '\n', '\u3000', '\u3000', '机器人', '技术', '及其', '军事', '应用', '—', '—', '访', '北京航空航天大学', 'ITM', '实验室', '\n', '\u3000', '\u3000', 'Robotics', ' ', 'Technology', ' ', 'and', ' ', 'Its', ' ', 'Military', ' ', 'Applications', '\n', '\u3000', '\u3000', '维护', '公众', '安全', '的', '机器人', '卫士', '—', '—', '武警', '装备', '专家', '谈', '反恐', '机器人', '\n', '\u3000', '\u3000', 'On', ' ', 'the', ' ', 'Anti', '-', 'Terror', ' ', 'Robots', ':', ' ', 'An', ' ', 'Interview', ' ', 'with', ' ', 'the', ' ', 'Researcher', ' ', 'from', ' ', 'Chinese', ' ', '\n', 'People', "'", 's', ' ', 'Armed', ' ', 'Police', ' ', 'Force', '\n', '\u3000', '\u3000', '以', '创新性', '思维', '发展', '中国', '的', '拐弯', '枪', '\n', '\u3000', '\u3000', 'An', ' ', 'Innovation', ':', ' ', 'Chinese', '-', 'Made', ' ', 'Corner', ' ', 'Shot', ' ', 'Weapon', ' ', 'System', '\n', '\u3000', '\u3000', '“', '探戈', '杀手', '”', '演绎', '美国', '未来', '潜艇', '技术', '\n', '\u3000', '\u3000', 'Tango', ' ', 'Bravo', ' ', 'Brings', ' ', 'Fundamental', ' ', 'Changes', ' ', 'to', ' ', 'U', '.', 'S', ' ', 'Next', ' ', 'Generation', ' ', 'Submarine', '\n', '\u3000', '\u3000', '展望未来', '的', '军用', '无线', '局域网', '\n', '\u3000', '\u3000', 'Future', ' ', 'Military', ' ', 'Wireless', ' ', 'LAN', ':', ' ', 'Wi', '-', 'Fi', ' ', 'or', ' ', 'WAPI', ',', ' ', 'WiMAX', ' ', 'or', ' ', 'McWILL', '?', '\n', '\u3000', '\u3000', '突破', '生理', '耐受', '极限', '—', '—', '欧美', '飞行员', '生命', '保障系统', '评介', '\n', '\u3000', '\u3000', 'The', ' ', 'Development', ' ', 'of', ' ', 'Pilots', ' ', 'Life', ' ', 'Support', ' ', 'System', ' ', 'in', ' ', 'the', ' ', 'U', '.', 'S', ' ', 'and', ' ', 'Europe', '\n', '\u3000', '\u3000', '不', '走', '别人', '走过', '的', '弯路', '—', '—', '外军', '信息化', '建设', '中', '的', '几点', '教训', '\n', '\u3000', '\u3000', 'Some', ' ', 'Lessons', ' ', 'Taken', ' ', 'from', ' ', 'Informationization', ' ', 'Construction', ' ', 'of', ' ', 'Foreign', ' ', 'Armed', ' ', '\n', 'Forces', '\n', '\u3000', '\u3000', '飞速', '扩展', '的', '美国陆军', '无人机', '训练', '\n', '\u3000', '\u3000', 'The', ' ', 'Training', ' ', 'for', ' ', 'U', '.', 'S', ' ', 'Army', ' ', 'UAV', ' ', 'Rapidly', ' ', 'Expanded', '\n', '\u3000', '\u3000', '美', '空军', '培养', '专职', '无人机', '飞行员', '\n', '\u3000', '\u3000', 'A', ' ', 'Career', ' ', 'Flying', ' ', 'UAVs', '\n', '\u3000', '\u3000', '评析', '美国', '两份', '防务', '评审', '报告', '\n', '\u3000', '\u3000', 'An', ' ', 'Contrast', ':', ' ', 'U', '.', 'S', ' ', 'Government', ' ', '06', "'", 'QDR', ' ', 'Report', ' ', 'and', ' ', 'A', ' ', 'Non', '-', 'Government', ' ', 'One', '\n', '\u3000', '\u3000', '美国', '人', '看', '日本', '国防工业', '发展', '\n', '\u3000', '\u3000', 'An', ' ', 'U', '.', 'S', ' ', 'Point', ' ', 'of', ' ', 'View', ':', ' ', 'The', ' ', 'Development', ' ', 'of', ' ', 'Japanese', ' ', 'Defense', ' ', 'Industry', '\n', '\u3000', '\u3000', '台湾岛', '及', '周边', '海区', '的', '地理', '与', '气候', '\n', '\u3000', '\u3000', 'Geographical', ' ', 'and', ' ', 'Climatic', ' ', 'Survey', ' ', 'of', ' ', 'Taiwan', ' ', 'Island', ' ', 'and', ' ', 'Its', ' ', 'Circumjacent', ' ', 'Sea', ' ', '\n', 'Area', '&', 'nbsp', ';', '&', 'nbsp', ';', ' '], 'C000008')
    (['\u3000', '\u3000', '智威汤逊', '全球', 'CEO', ':', '大众传媒', '依然', '是', '品牌', '传播', '的', '好', '选择', '\n', '\u3000', '\u3000', '本报记者', '康健', '发自', '上海', '\n', '\u3000', '\u3000', '“', '想', '让', '品牌', '更', '快', '、', '更广地', '进入', '消费者', ',', '大众传媒', '仍然', '是', '很', '好', '的', '选择', '。', '”', '智威汤逊', '全球', 'CEO', ' ', 'Michael', ' ', 'Maedel', '近日', '在', '上海', '的', '办公室', '告诉', '《', '第一', '财经', '(', '相关', ':', '理财', ' ', '证券', ')', '日报', '》', '。', '他', '对', '有些', '人', '“', '电视', '、', '平面媒体', '失去', '意义', '”', '的', '观点', '不以为然', '。', '\n', '\u3000', '\u3000', '智威汤逊', '是', '美国', '最大', '的', '广告公司', '之一', ',', '与', '奥美', '广告', '一起', '隶属于', 'WPP', '集团', ',', '3', '月底', '刚刚', '收购', '了', '中国', '本土', '的', '上海', '奥维思', '市场营销', '服务公司', '。', '\n', '\u3000', '\u3000', '大众', '媒体', '和', '互动', '媒体', '对半', '\n', '\u3000', '\u3000', '针对', '新', '的', '媒体', '方式', '日益', '涌现', ',', '企业', '广告主', '投放', '广告', '越来越', '无所适从', '的', '情景', ',', 'Michael', '认为', ',', '广告主', '应该', '进行', '定性', '定量', '的', '分析', ',', '使', '任何', '投放', '都', '有', '清晰', '的', '出发点', ':', '消费者', '。', '要', '让', '媒介', '触及', '消费者', ',', '使', '他们', '更', '愿意', '来', '倾听', '公司', '。', '\n', '\u3000', '\u3000', '当然', ',', '在', '媒介', '越来越', '多', '的', '情形', '下', ',', '意味着', '传播方式', '的', '变化', '。', '过去', '主流', '的', '是', '大众传播', ',', '现在', '互动性', '和', '定制', '性', '带来', '了', '新', '的', '挑战', '—', '—', '如何', '让', '品牌', '与', '消费者', '更加', '互动', '。', '\n', '\u3000', '\u3000', '智威汤逊', '东北亚', '区域', '总监', '兼大', '中国区', 'CEO', '唐锐涛', '则', '认为', ',', '中国', '面临', '两个', '挑战', ':', '品牌', '主张', '明确化', '和', '如何', '深化', '与', '消费者', '的', '关系', '。', '\n', '\u3000', '\u3000', '他', '认为', ',', '大众', '品牌', '并未', '失去', '其', '价值', ',', '借助', '大众', '媒体', '可以', '清楚', '地', '传达', '品牌', '的', '真实', '含义', '。', '而', '在', '此基础', '上', ',', '还', '需要', '更新', '的', '形式', '使', '产品', '和', '消费者', '的', '关系', '进一步', '深化', '。', '通过', '互动', '媒体', ',', '可以', '将', '以往', '被动', '的', '关系', '变成', '主动', '对话', '的', '消费者', '关系', '。', '\n', '\u3000', '\u3000', '唐锐涛', '的', '经验', '法则', '是', ',', '在', '进行', '投放', '的', '时候', ',', '大众', '媒体', '和', '新', '媒体', '“', '对半开', '”', ',', '前者', '致力于', '建立', '品牌', ',', '后者', '用于', '深化', '与', '消费者', '关系', '。', '\n', '\u3000', '\u3000', '同时', ',', '产品', '根据', '消费者', '参与', '的', '程度', '也', '分为', '高', '消费者', '参与度', '产品', '和', '低', '消费者', '参与度', '产品', '。', '使用', '媒介', '取决于', '产品', '本身', '的', '复杂度', '。', '如', '饼干', '等', '不假思索', '就', '购买', '的', '产品', ',', '大众', '媒体', '作用', '比较', '大', '。', '汽车', '等', '奢侈品', '需要', '增加', '对话', '和', '互动', ',', '让', '消费者', '深入', '这个', '品牌', '。', '\n', '\u3000', '\u3000', '全球', '品牌', ',', '本土', '特色', '\n', '\u3000', '\u3000', 'Michael', '特别强调', '品牌', '的', '全球', '定位', '和', '本地', '表述', '。', '他', '提到', ',', '即便', '广告主', '是', '洗衣机', ',', '在', '各个', '市场', ',', '洗衣机', '的', '价格', '跟', '消费者', '的', '工资', '比例', '不', '一样', ',', '有些', '市场', '用', '2', '天', '的', '工资', '就', '可以', '买', '一台', ',', '而', '有些', '市场', ',', '消费者', '需要', '用', '自己', '三个', '月', '的', '工资', '才能', '购买', '到', '。', '这样', '的', '情况', '下', ',', '消费者', '的', '参与度', '就', '完全', '不', '一样', '了', '。', '那些', '用', '三个', '月工资', '才能', '买得起', '洗衣机', '的', '人会花', '更', '多', '时间', '去', '了解', '产品', '的', '性能', '是否', '耐用', ',', '这', '跟', '成熟', '市场', '完全', '不同', '。', '\n', '\u3000', '\u3000', '“', '本地化', '并', '不', '意味着', '把', '全球', '广告', '翻译成', '中文', ',', '这是', '一种', '拙劣', '的', '方式', '。', '”', 'Michael', ' ', '称', '。'], 'C000008')
    (['\u3000', '\u3000', '全国', '治理', '医药', '购销', '领域', '商业', '贿赂', '专项', '工作', '正在', '轰轰烈烈', '地', '展开', ',', '却', '有', '骗子', '趁机', '诈骗', '医务人员', '。', '日前', ',', '广东省', '卫生厅', '向', '全省', '医务人员', '发出', '了', '“', '谨防', '有人', '利用', '打击', '商业', '贿赂', '诈骗', '”', '的', '提示', '。', '\n', '\u3000', '\u3000', '治理', '医药', '购销', '领域', '商业', '贿赂', '专项', '工作', '于', '3', '月底', '在', '全国', '拉开帷幕', '之后', ',', '各地', '卫生', '行政部门', '积极', '贯彻', '中央', '精神', ',', '部署', '专项', '治理', '工作', '。', '近来', ',', '广东省', '许多', '医务人员', '突然', '收到', '手机短信', '或者', '信件', ',', '被', '告知', '希望', '其', '认真', '自查自纠', ',', '将', '收受', '的', '红包', '和', '回扣', '款项', '主动', '上缴', '汇入', '某个', '指定', '账号', ',', '争取', '宽大处理', '。', '然而', '广东省', '卫生', '行政部门', '还', '没有', '设立', '回扣', '款', '上缴', '账户', ',', '更', '没有', '向', '医务人员', '发出', '过', '上缴', '款项', '的', '通知', '。', '为此', ',', '广东省', '卫生厅', '向', '全省', '的', '医疗机构', '和', '医务人员', '下发', '紧急通知', ',', '提醒', '谨防', '受骗上当', '。'], 'C000024')
    (['\u3000', '\u3000', '\u3000', '世界', '的', '旅游业', '越来越', '熟悉', '一个', '新名词', '—', '—', '中国', '的', '黄金周', '。', '每到', '这个', '时候', ',', '中国', '都', '会', '迎来', '一次', '旅游', '高潮', ',', '一直', '席卷', '周边', '甚至', '更为', '遥远', '的', '一些', '国家', '和', '地区', ',', '使', '他们', '也', '跟', '随着', '这种', '固定', '的', '周期', '迎来', '一个个', '旅游', '、', '消费', '旺季', '。', '\n', '\u3000', '\u3000', '尽管', '出入境', '管理', '部门', '尚未', '公布', '具体', '数字', ',', '全国假日办', '负责人', '预测', '说', ',', '今年', '“', '五一', '”', '黄金周', ',', '出境', '旅游', '规模', '很', '可能', '超过', '去年', '“', '五一', '”', '黄金周', '1000', '多万人次', '的', '水平', '。', '\n', '\u3000', '\u3000', '中国', '游客', '涌', '来', '\n', '\u3000', '\u3000', '“', '标志', '”', '泰国', '从', '海啸', '中', '复苏', '\n', '\u3000', '\u3000', '5', '月', '2', '日', ',', '从事', '服装设计', '的', '胡明明', '第四次', '飞往', '泰国', '普吉岛', '度假', '。', '黄金周', '对', '她', '而言', ',', '就是', '躺', '在', '普吉岛', '沙滩', '上', ',', '晒', '一周', '太阳', '。', '作为', '中国', '公民', '最早', '的', '旅游', '目的地', '代表', '景点', ',', '普吉岛', '代表', '了', '东南亚', '国家', '在', '中国', '消费者', '心目', '中', '的', '独特', '地位', ':', '回头客', '越来越', '多', '。', '\n', '\u3000', '\u3000', '泰国', '国家旅游局', '的', '数据', '显示', ',', '2005', '年', '前往', '普吉', '的', '中国', '旅游者', '达', '10', '万人次', '左右', ',', '预计', '2006', '年', '将', '突破', '15', '万', ',', '从而', '成为', '泰国', '南部', '旅游业', '在', '印度洋', '海啸', '后', '全面', '恢复', '的', '“', '重要', '标志', '”', '。', '\n', '\u3000', '\u3000', '目前', '中国', '人', '出境游', '基本', '都', '是', '第一次', '出国', ',', '因此', '更', '看重', '价格', '。', '“', '中国', '人', '喜欢', '出访', '大城市', ',', '且', '往往', '都', '是', '走马观花', ',', '到', '哪里', '都', '要', '先', '照相', '。', '”', '一', '旅行社', '总经理', '助理', '郭明', '告诉', '记者', '。', '出境', '爱', '购物', '可能', '是', '中国', '人', '出境游', '的', '又', '一大', '特色', '。', '\n', '\u3000', '\u3000', '俄罗斯', '、', '蒙古', '游', '\n', '\u3000', '\u3000', '国人', '今年', '出游', '“', '新亮点', '”', '\n', '\u3000', '\u3000', '东南亚', '国家', '打出', '“', '山水相连', '”', '牌', ',', '韩国', '和', '日本', '旅游界', '则', '希望', '以', '“', '文化', '渊源', '”', '赢得', '中国', '“', '休闲', '商机', '”', '。', '在', '《', '大长', '今', '》', '、', '“', '韩流', '”', '等', '文化', '因素', '刺激', '之下', ',', '中', '韩', '两国之间', '的', '航线', '变得', '越来越', '繁忙', '。', '就', '在', '“', '五一', '”', '前', ',', '大', '韩', '航空', '宣布', '计划', '5', '年内', '将', '韩中', '航线', '增至', '50', '条', '。', '\n', '\u3000', '\u3000', '旅游', '交通', '经济', '分析', '师刘斌', '说', ',', '2006', '年', '“', '五一', '”', '黄金周', ',', '中国', '周边旅游', '的', '新亮点', '是', '俄罗斯', '、', '蒙古国', '。', '随着', '夏季', '到来', ',', '北亚', '风光', '呈现出', '独特', '的', '吸引力', '。', '目前', ',', '俄罗斯', '专门', '为', '中国', '旅游者', '成立', '的', '“', '无国界', '世界', '”', '协会', '正', '全力以赴', '利用', '中', '俄', '两国', '互办', '“', '国家', '年', '”', '的', '机遇', ',', '吸引', '更', '多', '中国', '游客', '“', '北上', '消费', '”', '。', '\n', '\u3000', '\u3000', '羡慕', '黄金周', '\n', '\u3000', '\u3000', '印度', '日本', '都', '“', '心动', '”', '了', '\n', '\u3000', '\u3000', '旅游', '观察家', '指出', ',', '中国', '“', '旅游', '休闲', '”', '商机', ',', '正', '从', '东南亚', '向', '东北亚', '“', '扇形', '展开', '”', ',', '并', '惠及', '越来越', '多', '的', '邻邦', '。', '\n', '\u3000', '\u3000', '刘斌', '认为', ',', '目前', '东南亚', '抢', '得', '中国', '“', '休闲', '潮', '”', '之先', ',', '可以', '为', '中国', '东盟', '经济', '贸易', '一体化', '“', '推波助澜', '”', '。', '东北亚地区', '作为', '中国', '主要', '客源', '市场', ',', '“', '双向', '流动', '”', '将', '催生', '“', '东北亚', '旅游圈', '”', ',', '从而', '与', '东南亚', '旅游圈', '南北', '呼应', '。', '这样', ',', '中国', '人', '的', '休闲', '不仅', '将', '成为', '所有', '周边国家', '的', '商机', ',', '而且', '将', '成为', '中国', '与', '这些', '国家', '睦邻友好', '的', '“', '休闲', '纽带', '”', '。', '\n', '\u3000', '\u3000', '从', '发展', '旅游', '经济', '的', '角度', '来说', ',', '中国', '的', '黄金周', '无疑', '让', '各国', '羡慕', '。', '印度', '的', '一家', '报纸', '曾', '对', '中国政府', '“', '聪明', '并且', '执行', '有力', '的', '黄金周', '政策', '”', '大加', '赞赏', ',', '认为', '印度政府', '应当', '向', '中国', '学习', '。', '而', '日本', '为了', '促进', '旅游', '、', '拉动', '内需', ',', '也', '修改', '了', '“', '节日', '法', '”', ',', '人为', '地', '制造', '出', '更', '多', '的', '长假', ',', '方便', '人们', '外出', '旅游', '或', '安排', '各种', '休闲活动', '。', '(', '新华', '每日电讯', ')', '\n', '\u3000', '\u3000', '新闻', '链接', '\n', '\u3000', '\u3000', '悉尼', '\n', '\u3000', '\u3000', '“', '处处', '是', '中国', '人', ',', '还', '以为', '回国', '了', '”', '\n', '\u3000', '\u3000', '“', '到', '悉尼', '来', '旅游', ',', '到处', '都', '能', '看到', '中国', '人', '的', '面孔', '。', '要不是', '看到', '外国人', '多点', ',', '还', '以为', '又', '回到', '了', '中国', '呢', '!', '”', '一位', '来自', '北京', '的', '张姓', '游客', '说', '。', '\n', '\u3000', '\u3000', '这', '也', '是', '不少', '中国', '游客', '初到', '澳大利亚', '时', '的', '感觉', '。', '去年', ',', '有', '28', '万', '中国', '游客', '赴', '澳', '旅游', ',', '占来', '澳', '游客', '总数', '的', '5.2%', '。', '\n', '\u3000', '\u3000', '在', '去年', '12', '月', '澳大利亚联邦政府', '发布', '的', '旅游', '战略', '中', ',', '中国', '被', '认为', '是', '澳', '旅游业', '增长', '最快', '的', '市场', '。', '据澳', '旅游业', '预测', '委员会', '预计', ',', '中国', '到', '澳大利亚', '旅游', '的', '人数', '将', '以', '每年', '16.5%', '的', '速度', '增长', ',', '到', '2014', '年', ',', '将会', '有', '110', '万', '中国', '游客', '来澳', '旅游', ',', '澳大利亚', '每', '7', '名', '游客', '中', '就', '有', '1', '名', '中国', '公民', '。', '届时', ',', '中国', '将', '有望', '成为', '澳大利亚', '最大', '的', '客源国', ',', '中国', '游客', '每年', '将', '为', '澳', '旅游业', '贡献', '60', '亿澳元', '。', '\n', '\u3000', '\u3000', '巴黎', '\n', '\u3000', '\u3000', '中国', '人', '不再', '“', '上车', '睡觉', '下车', '拍照', '”', '\n', '\u3000', '\u3000', '四五', '月份', '本是', '中国', '人', '赴法', '旅游', '的', '淡季', ',', '但', '“', '五一', '”', '长假', '却是', '淡季', '中', '的', '旺季', ',', '法国', '各大', '华人', '旅行社', '在此期间', '接待', '的', '中国', '游客', '数量', '几乎', '是', '平时', '的', '两倍', '。', '而', '中国', '人', '对', '赴', '法国', '乃至', '欧洲', '旅游', '的', '观念', '也', '发生', '改变', '。', '\n', '\u3000', '\u3000', '据', '法国', '文华', '旅行社', '总经理', '陈超英', '介绍', ',', '过去', ',', '中国', '游客', '总想', '在', '最', '短时间', '内以', '最少', '费用', '游览', '到', '最', '多', '数量', '的', '法国', '及其', '周边国家', '景点', '。', '一时间', ',', '“', '上车', '睡觉', ',', '下车', '拍照', ',', '一问', '什么', '都', '不', '知道', '”', '这', '段', '顺口溜', '成', '了', '此类', '贪多', '求全', '的', '旅游', '方式', '的', '生动', '写照', '。', '\n', '\u3000', '\u3000', '几年', '过去', ',', '随着', '出境游', '机会', '增加', ',', '越来越', '多', '的', '中国', '游客', '迷上', '了', '欧美', '游客', '所', '青睐', '的', '休闲游', '和', '主题', '游', '。', '陈超英', '说', ',', '以', '文华', '旅行社', '为例', ',', '参加', '休闲游', '和', '主题', '游', '的', '中国', '游客', '三年', '前', '只', '占', '中国', '游客', '总数', '的', '5%', ',', '现在', '已', '占', '到', '了', '30%', ',', '预计', '三年', '后', '将', '达到', '50%', '左右', '。', '他', '说', ',', '这', '不仅', '说明', '中国', '游客', '的', '消费', '能力', '提高', ',', '也', '说明', '他们', '的', '消费', '心理', '趋于', '成熟', '。', '\n', '\u3000', '\u3000'], 'C000016')
    (['\u3000', '\u3000', '三九医药', '(', '000999', ')', '和', '三九生化', '(', '000403', ')', '今日', '同时', '发布公告', ',', '三九医药', '转让', '三九生化', '38.11', '%', '股权', '事宜', '获得', '国资委', '批准', ',', '三九医药', '将', '所', '持有', '的', '三九生化', '6162.1064', '万股', '和', '1906.0936', '万股', '国有', '法人股', '分别', '转让', '给', '振兴', '集团', '有限公司', '和', '山西', '恒源', '煤业', '有限公司', '。', '\n', '\u3000', '\u3000', '协议', '签订', '一年', '后', ',', '股权', '转让', '终于', '取得', '重大进展', ',', '也', '为', '三九集团', '的', '重组', '工作', '打下', '更', '坚实', '的', '基础', '。', '但', '在', '这', '一年', '中', ',', '三九生化', '却', '发生', '了', '大', '变化', '。', '\n', '\u3000', '\u3000', '根据', '年报', ',', '三九生化', '2005', '年度', '亏损', '5.21', '亿元', ',', '而', '2004', '年', '亏损额', '为', '1.98', '亿元', ',', '同时', ',', '每股', '净资产', '由', '2004', '年', '的', '2.55', '元', '变为', '-', '0.05', '元', ',', '净利润', '和', '净资产', '发生', '大幅', '变动', '。', '但', '在', '双方', '签订', '的', '协议', '中', ',', '收购价格', '为', '每股', '2.55', '元', '。', '\n', '\u3000', '\u3000', '某', '券商', '投行', '人士', '认为', ',', '由于', '当时', '双方', '所签', '的', '协议', '价格', '是', '以', '2004', '年', '的', '审计报告', '为', '依据', '的', ',', '时隔', '一年', ',', '公司', '的', '审计', '结果', '发生', '重大', '变化', ',', '如果', '仍然', '用', '2004', '年', '的', '审计', '结果', '来', '进行', '交易', '似乎', '并', '不', '合适', '。', '\n', '\u3000', '\u3000', '也', '有', '业内人士', '认为', ',', '签订', '的', '协议', '具有', '法律效力', ',', '国资委', '的', '批准', '是', '协议', '生效', '的', '前提', '。', '如今', '既然', '已经', '获准', ',', '就', '应该', '按照', '协议', '的', '价格', '执行', '。', '\n', '\u3000', '\u3000', '此前', '三九生化', '发布', '的', '2005', '年度报告', '被', '审计', '机构', '出具', '了', '非标', '意见', ',', '14', '位', '公司', '高管', '也', '对', '年报', '表示', '质疑', '。', '围绕', '股权', '转让', ',', '相关', '各方', '不知', '是否', '还会', '发生', '争议', '。', '但', '业内人士', '评价', ',', '对', '公司', '而言', ',', '股权', '顺利', '转让', ',', '让', '公司', '步入', '正常', '发展', '的', '轨道', ',', '这才', '是', '最', '重要', '的', '。'], 'C000010')
    (['\n', '\u3000', '\u3000', '中新网', '5', '月', '9', '日电', ' ', '\n', '据', '共同社', '报道', ',', '围绕', '导弹', '防御', '系统', '(', 'MD', ')', '问题', ',', '日本', '海上', '自卫队', '9', '日', '宣布', ',', '将', '派', '海上', '自卫队', '“', '宙斯', '盾', '”', '舰', '参加', '美国', '即将', '于', '6', '月', '在', '夏威夷', '近海', '实施', '的', '海基型', '拦截导弹', '(', 'SM3', ')', '的', '拦截', '试验', ',', '对', '目标', '进行', '雷达', '跟踪', '。', '\n', '\u3000', '\u3000', '“', '宙斯', '盾', '”', '护卫舰', '是', '首次', '参加', '此类', '拦截', '演习', '。', '海上', '自卫队', '幕僚长', '(', '相当于', '参谋长', ')', '斋藤', '隆', '表示', ',', '“', '将', '力争', '提高', '双方', '在', '海上', '的', '相互', '协调性', '”', ',', '由此可见', ',', '日美', '在', 'MD', '方面', '共享', '信息', '等', '合作', '体制', '将', '进一步', '得到', '确立', '。', '\n', '\u3000', '\u3000', '据', '海上', '自卫队', '透露', ',', '预定', '参加', '此次', '演习', '的', '是', '曾经', '根据', '《', '反恐', '特别', '措施', '法', '》', '在', '阿拉伯海', '上', '进行', '过', '海上', '燃油', '补给', '活动', '的', '“', '雾岛', '(', 'KIRISHIMA', ')', '”', '号', '(', '7250', '吨', ')', '。', '美国', '海军', '的', '“', '宙斯', '盾', '”', '舰', '计划', '用', 'SM3', '对', '模拟', '弹道导弹', '进行', '拦截', ',', '而', '“', '雾岛', '”', '号', '将', '跟踪', '模拟', '弹道导弹', '的', '轨迹', '。', '\n', '\u3000', '\u3000', '“', '雾岛', '”', '号', '计划', '于', '本月', '从', '位于', '神奈川县', '的', '横须贺', '基地', '出发', ',', '在', '参加', '拦截', '试验', '结束', '后', '还', '将', '参加', '环', '太平洋', '联合演习', '。', '\n', '\u3000', '\u3000', '美国', '迄今为止', '曾', '6', '次', '成功', '地', '进行', '了', 'SM3', '拦截', '试验', '。', '日本政府', '将', '于', '2007', '年度', '年底', '开始', '为', '海上', '自卫队', '的', '”', '宙斯', '盾', '”', '护卫舰', '装备', 'SM3', '。'], 'C000024')
    (['\u3000', '\u3000', '新华网', '深圳', '3', '月', '3', '日电', '(', '记者', '贾文军', ')', '全国', '拳击', '锦标赛', '3', '日', '在', '深圳市', '龙岗', '体育中心', '拉开战幕', ',', '在', '接下来', '的', '一周', '里', ',', '来自', '全国', '各地', '的', '200', '多名', '拳击', '健儿', '将', '在', '这里', '展开', '角逐', '。', '\n', '\n', '\u3000', '\u3000', '本次', '锦标赛', '由', '国家体育总局', '拳击', '跆拳道', '运动', '管理中心', '主办', '。', '比赛', '设置', '了', '51', '公斤', '、', '57', '公斤', '、', '64', '公斤', '、', '75', '公斤', '和', '91', '公斤', '5', '个', '级别', ',', '全国', '各地', '共有', '45', '支', '代表队', '参赛', '。', '\n', '\n', '\u3000', '\u3000', '此前', ',', '中国', '拳击', '队', '已经', '在', '深圳', '进行', '了', '3', '个', '月', '的', '冬训', '。', '国家体育总局', '拳击', '跆拳道', '运动', '管理中心', '副', '主任', '崔', '富国', '表示', ',', '要', '通过', '这次', '比赛', '来', '检验', '冬训', '的', '成果', ',', '也', '要', '根据', '比赛', '成绩', '为', '2008', '年', '北京', '奥运会', '选拔', '优秀人才', '。', '\n'], 'C000024')
    
    

    AODE分类器

    import numpy as np
    
    
    def getDataSet():
        dataSet = [
            ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, 1],
            ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, 1],
            ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, 1],
            ['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.608, 0.318, 1],
            ['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.556, 0.215, 1],
            ['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.403, 0.237, 1],
            ['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', 0.481, 0.149, 1],
            ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', 0.437, 0.211, 1],
            ['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', 0.666, 0.091, 0],
            ['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', 0.243, 0.267, 0],
            ['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', 0.245, 0.057, 0],
            ['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', 0.343, 0.099, 0],
            ['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', 0.639, 0.161, 0],
            ['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', 0.657, 0.198, 0],
            ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.360, 0.370, 0],
            ['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', 0.593, 0.042, 0],
            ['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', 0.719, 0.103, 0]
        ]
    
        features = ['色泽', '根蒂', '敲声', '纹理', '脐部', '触感']
    
        featureDic = {}
        for i in range(len(features)):
            featureList = [example[i] for example in dataSet]
            uniqueFeature = list(set(featureList))
            featureDic[features[i]] = uniqueFeature
    
        dataSet = np.array(dataSet)
        return dataSet, features, featureDic
    
    
    def AODE(dataSet, data, features, featureDic):
        m, n = dataSet.shape
        n = n - 3       # 特征不取连续值的属性,如密度和含糖量。
        pDir = {}       # 保存三个值。好瓜的可能性,坏瓜的可能性,和预测的值。
        for classLabel in ["好瓜", "坏瓜"]:
            P = 0.0
            if classLabel == "好瓜":
                sign = '1'
            else:
                sign = '0'
            extrDataSet = dataSet[dataSet[:, -1] == sign]    # 抽出类别为sign的数据
            for i in range(n):                               # 对于第i个特征
                xi = data[i]
                # 计算classLabel类,第i个属性上取值为xi的样本对总数据集的占比
                Dcxi = extrDataSet[extrDataSet[:, i] == xi]  # 第i个属性上取值为xi的样本数
                Ni = len(featureDic[features[i]])            # 第i个属性可能的取值数
                Pcxi = (len(Dcxi) + 1) / float(m + 2 * Ni)
                # 计算类别为c且在第i和第j个属性上分别为xi和xj的样本,对于类别为c属性为xi的样本的占比
                mulPCond = 1
                for j in range(n):
                    xj = data[j]
                    Dcxij = Dcxi[Dcxi[:, j] == xj]
                    Nj = len(featureDic[features[j]])
                    PCond = (len(Dcxij) + 1) / float(len(Dcxi) + Nj)
                    mulPCond *= PCond
                P += Pcxi * mulPCond
            pDir[classLabel] = P
    
        if pDir["好瓜"] > pDir["坏瓜"]:
            preClass = "好瓜"
        else:
            preClass = "坏瓜"
    
        return pDir["好瓜"], pDir["坏瓜"], preClass
    
    
    def test_accuracy(dataSet, features, featureDic):
        cnt = 0
        for data in dataSet:
            _, _, pre = AODE(dataSet, data, features, featureDic)
            if (pre == '好瓜' and data[-1] == '1') or (pre == '坏瓜' and data[-1] == '0'):
                cnt += 1
        return cnt / float(len(dataSet))
    
    
    def main():
        dataSet, features ,featureDic = getDataSet()
        pG, pB, pre = AODE(dataSet, dataSet[0], features, featureDic)
        print("pG = ", pG)
        print("pB = ", pB)
        print("pre = ", pre)
        print("real class = ", dataSet[0][-1])
        print(test_accuracy(dataSet, features, featureDic))
    
    
    if __name__ == '__main__':
        main()
    
    pG =  0.08503601601454483
    pB =  0.0028579262019532985
    pre =  好瓜
    real class =  1
    0.9411764705882353
    
    展开全文
  • 语义分类

    千次阅读 2018-05-23 09:43:30
    一开始数据集大概每类300条,准确率只有86%左右,文本分类要求数据量足够,才能训练处合适的模型,我选择数据集的过程中经历了很多波折,最后使用的清华的THUCNews,我觉得是我能找到的最优的数据集了,关于数据集我...
    
    
    alicelmx的博客

    小明酱的学习园地

    舆情监控系统——step2.CNN-基于tensorFlow实现

    中间经过了漫长的期末考试周,第二步拖了半个多月,终于把第二步做好了,使用了两种方法,现在我先主要介绍基于深度学习的方法GitHub代码点击此处

    数据集选择

    一开始数据集大概每类300条,准确率只有86%左右,文本分类要求数据量足够,才能训练处合适的模型,我选择数据集的过程中经历了很多波折,最后使用的清华的THUCNews,我觉得是我能找到的最优的数据集了,关于数据集我专门写了一个博文,请点这里。 
    最后使用的数据格式如下,因为原始数据量太大了,只抽取了一部分。

    这里写图片描述

    抽取、整理数据

    存放在text文件夹中,其中涉及两个模块:

    • copyData.py: 用于从每个分类拷贝1400个文件。
    • cnews_group.py:用于将多个文件整合到一个文件中。

    从每个分类拷贝1400个文件

    数据使用:

    训练集: 1100*7 
    验证集: 100*7 
    测试集: 200*7

    代码如下
    import os
    import glob
    import shutil
    import random
    
    basePath = "/Users/alicelmx/Documents/实习/文本分类/基于深度学习/SogouData/ClassFile/"
    newPath = "/Users/alicelmx/Documents/实习/文本分类/基于深度学习/text/"
    
    listPath = list(map(lambda  x:basePath+str(x)+"/",list(filter(lambda  x:not str(x).startswith("."),os.listdir(basePath)))))
    """
    训练集: 1100*7
    验证集: 100*7
    测试集: 200*7
    """
    def copy(listPath,MAXCOUNT=1400):
        for  path in listPath:
            newdir = newPath+ str(path).split("/")[-2]
            print("====================")
            print(newdir)
            print("====================")
    
            if not os.path.exists(newdir):
                os.mkdir(newdir)
            files=glob.glob(path+"*.txt")
    
            if len(files) < MAXCOUNT:
                resultlist = []
                for i in range(MAXCOUNT):
                    resultlist.append(random.choice(files))
            else:
                resultlist = random.sample(files,MAXCOUNT)
            for file in resultlist:
                shutil.copy(file,newdir)
    
    if  __name__=='__main__':
        copy(listPath)
        print("抽取成功!")
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37

    将多个文件整合到一个文件中

    目标

    创建sougou.train.txt(训练集1100*7)、sougou.test.txt(验证集100*7)、sougou.val.txt(测试集200*7),其中每一个文件包含每个类下的部分文件,存放于data文件夹中。 
    这里写图片描述

    代码实现
    #!/usr/bin/python
    # -*- coding: utf-8 -*-
    """
    将文本整合到 train、test、val 三个文件中
    """
    import  os
    
    basePath = "/Users/alicelmx/Documents/实习/文本分类/基于深度学习/text/"
    trainPath = "/Users/alicelmx/Documents/实习/文本分类/基于深度学习/data/"
    
    def _read_file(filename):
        """读取一个文件并转换为一行"""
        with open(filename, 'r', encoding='utf-8') as f:
            return f.read().replace('\n', '').replace('\t', '').replace('\u3000', '')
    
    def  save_file(dirname):
        """
            将多个文件整合并存到3个文件中
            dirname: 原数据目录
            文件内容格式:  类别\t内容
        """
        f_train = open(trainPath+"sougou.train.txt",'w',encoding='utf-8')
        f_test = open(trainPath + "sougou.test.txt", 'w', encoding='utf-8')
        f_val = open(trainPath + "sougou.val.txt", 'w', encoding='utf-8')
    
        for category in os.listdir(dirname):
            catdir = os.path.join(dirname,category)
            if not os.path.isdir(catdir):
                continue
            files = os.listdir(catdir)
            print(len(files))
    
            count = 0
            for cur_file in files:
                filename = os.path.join(catdir,cur_file)
                content = _read_file(filename)
    
                if count < 1100:
                    f_train.write(category+"\t"+content+"\n")
                elif count < 1300:
                    f_test.write(category+"\t"+content+"\n")
                else:
                    f_val.write(category + '\t' + content + '\n')
                count += 1
    
            print("===============")
            print("finish:",category)
            print("===============")
    
        f_train.close()
        f_test.close()
        f_val.close()
    
    if  __name__=='__main__':
        save_file(basePath)
        print(len(open(trainPath+"sougou.train.txt", 'r', encoding='utf-8').readlines()))
        print(len(open(trainPath + "sougou.test.txt", 'r', encoding='utf-8').readlines()))
        print(len(open(trainPath + "sougou.val.txt", 'r', encoding='utf-8').readlines()))
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58

    数据预处理

    data/cnews_loader.py为数据的预处理文件。

    1. read_file(): 读取文件数据;
    2. build_vocab():构建词汇表,使用字符级的表示,这一函数会将词汇表存储下来,避免每一次重复处理;
    3. read_vocab():读取上一步存储的词汇表,转换为{词:id}表示; read_category(): 将分类目录固定,转换为{类别: id}表示;
    4. to_words(): 将一条由id表示的数据重新转换为文字;

    完整代码

    #!/usr/bin/python
    # -*- coding: utf-8 -*-
    
    from collections import Counter
    import tensorflow.contrib.keras as kr
    import numpy as np
    import os
    
    def open_file(filename, mode='r'):
        """
        Commonly used file reader, change this to switch between python2 and python3.
        mode: 'r' or 'w' for read or write
        """
        return open(filename, mode, encoding='utf-8', errors='ignore')
    
    def read_file(filename):
        """读取文件数据"""
        contents, labels = [], []
        with open_file(filename) as f:
            for line in f:
                try:
                    label, content = line.strip().split('\t')
                    contents.append(list(content))
                    labels.append(label)
                except:
                    pass
        return contents, labels
    
    def build_vocab(train_dir, vocab_dir, vocab_size=5000):
        """根据训练集构建词汇表,存储"""
        data_train, _ = read_file(train_dir)
    
        all_data = []
        for content in data_train:
            all_data.extend(content)
    
        counter = Counter(all_data)
        count_pairs = counter.most_common(vocab_size - 1)
        words, _ = list(zip(*count_pairs))
        # 添加一个 <PAD> 来将所有文本pad为同一长度
        words = ['<PAD>'] + list(words)
    
        open_file(vocab_dir, mode='w').write('\n'.join(words) + '\n')
    
    def read_vocab(vocab_dir):
        """读取词汇表"""
        words = open_file(vocab_dir).read().strip().split('\n')
        word_to_id = dict(zip(words, range(len(words))))
    
        return words, word_to_id
    
    def read_category():
        """读取分类目录,固定"""
        categories =  [ '财经','房产','股票','家居','科技','时政','娱乐' ]
        cat_to_id = dict(zip(categories, range(len(categories))))
    
        return categories, cat_to_id
    
    def to_words(content, words):
        """将id表示的内容转换为文字"""
        return ''.join(words[x] for x in content)
    
    def process_file(filename, word_to_id, cat_to_id, max_length=600):
        """将文件转换为id表示"""
        contents, labels = read_file(filename)
    
        data_id, label_id = [], []
        for i in range(len(contents)):
            data_id.append([word_to_id[x] for x in contents[i] if x in word_to_id])
            label_id.append(cat_to_id[labels[i]])
    
        # 使用keras提供的pad_sequences来将文本pad为固定长度
        x_pad = kr.preprocessing.sequence.pad_sequences(data_id, max_length)
        y_pad = kr.utils.to_categorical(label_id)  # 将标签转换为one-hot表示
    
        return x_pad, y_pad
    
    def batch_iter(x, y, batch_size=64):
        """生成批次数据"""
        data_len = len(x)
        num_batch = int((data_len - 1) / batch_size) + 1
    
        indices = np.random.permutation(np.arange(data_len))
        x_shuffle = x[indices]
        y_shuffle = y[indices]
    
        for i in range(num_batch):
            start_id = i * batch_size
            end_id = min((i + 1) * batch_size, data_len)
            yield x_shuffle[start_id:end_id], y_shuffle[start_id:end_id]
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90

    配置CNN卷积神经网络模型

    见cnnModel.py文件

    #!/usr/bin/python
    # -*- coding: utf-8 -*-
    
    import tensorflow as tf
    
    class TCNNConfig(object):
        """CNN配置参数"""
        embedding_dim = 64      # 词向量维度
        seq_length = 600        # 序列长度
        num_classes = 7        # 类别数
        num_filters = 256        # 卷积核数目
        kernel_size = 5         # 卷积核尺寸
        vocab_size = 5000       # 词汇表达小
    
        hidden_dim = 128        # 全连接层神经元
    
        dropout_keep_prob = 0.5 # dropout保留比例
        learning_rate = 1e-3    # 学习率
    
        batch_size = 64         # 每批训练大小
        num_epochs = 10         # 总迭代轮次
    
        print_per_batch = 100    # 每多少轮输出一次结果
        save_per_batch = 10      # 每多少轮存入tensorboard
    
    
    class TextCNN(object):
        """文本分类,CNN模型"""
        def __init__(self, config):
            self.config = config
    
            # 三个待输入的数据
            self.input_x = tf.placeholder(tf.int32, [None, self.config.seq_length], name='input_x')
            self.input_y = tf.placeholder(tf.float32, [None, self.config.num_classes], name='input_y')
            self.keep_prob = tf.placeholder(tf.float32, name='keep_prob')
    
            self.cnn()
    
        def cnn(self):
            """CNN模型"""
            # 词向量映射
            with tf.device('/cpu:0'):
                embedding = tf.get_variable('embedding', [self.config.vocab_size, self.config.embedding_dim])
                embedding_inputs = tf.nn.embedding_lookup(embedding, self.input_x)
    
            with tf.name_scope("cnn"):
                # CNN layer
                conv = tf.layers.conv1d(embedding_inputs, self.config.num_filters, self.config.kernel_size, name='conv')
                # global max pooling layer
                gmp = tf.reduce_max(conv, reduction_indices=[1], name='gmp')
    
            with tf.name_scope("score"):
                # 全连接层,后面接dropout以及relu激活
                fc = tf.layers.dense(gmp, self.config.hidden_dim, name='fc1')
                fc = tf.contrib.layers.dropout(fc, self.keep_prob)
                fc = tf.nn.relu(fc)
    
                # 分类器
                self.logits = tf.layers.dense(fc, self.config.num_classes, name='fc2')
                self.y_pred_cls = tf.argmax(tf.nn.softmax(self.logits), 1)  # 预测类别
    
            with tf.name_scope("optimize"):
                # 损失函数,交叉熵
                cross_entropy = tf.nn.softmax_cross_entropy_with_logits(logits=self.logits, labels=self.input_y)
                self.loss = tf.reduce_mean(cross_entropy)
                # 优化器
                self.optim = tf.train.AdamOptimizer(learning_rate=self.config.learning_rate).minimize(self.loss)
    
            with tf.name_scope("accuracy"):
                # 准确率
                correct_pred = tf.equal(tf.argmax(self.input_y, 1), self.y_pred_cls)
                self.acc = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73

    训练和验证

    代码实现

    见runCNN.py 
    若之前进行过训练,请把tensorboard/textcnn删除,避免TensorBoard多次训练结果重叠。

    #!/usr/bin/python
    # -*- coding: utf-8 -*-
    
    from cnnModel import *
    from data.sougouLoader1 import *
    from sklearn import metrics
    import sys
    
    import time
    from datetime import timedelta
    
    
    base_dir = '/Users/alicelmx/Documents/实习/文本分类/基于深度学习/data/'
    train_dir = os.path.join(base_dir, 'sougou.train.txt')
    test_dir = os.path.join(base_dir, 'sougou.test.txt')
    val_dir = os.path.join(base_dir, 'sougou.val.txt')
    vocab_dir = os.path.join(base_dir, 'sougou.vocab.txt')
    
    save_dir = '/Users/alicelmx/Documents/实习/文本分类/基于深度学习/测试结果/'
    save_path = os.path.join(save_dir, 'best_validation')   # 最佳验证结果保存路径
    
    def get_time_dif(start_time):
        """获取已使用时间"""
        end_time = time.time()
        time_dif = end_time - start_time
        return timedelta(seconds=int(round(time_dif)))
    
    def feed_data(x_batch, y_batch, keep_prob):
        feed_dict = {
            model.input_x: x_batch,
            model.input_y: y_batch,
            model.keep_prob: keep_prob
        }
        return feed_dict
    
    def evaluate(sess, x_, y_):
        """评估在某一数据上的准确率和损失"""
        data_len = len(x_)
        batch_eval = batch_iter(x_, y_, 128)
        total_loss = 0.0
        total_acc = 0.0
        for x_batch, y_batch in batch_eval:
            batch_len = len(x_batch)
            feed_dict = feed_data(x_batch, y_batch, 1.0)
            loss, acc = sess.run([model.loss, model.acc], feed_dict=feed_dict)
            total_loss += loss * batch_len
            total_acc += acc * batch_len
    
        return total_loss / data_len, total_acc / data_len
    
    def train():
        print("Configuring TensorBoard and Saver...")
        # 配置 Tensorboard,重新训练时,请将tensorboard文件夹删除,不然图会覆盖
        tensorboard_dir = 'tensorboard/textcnn'
        if not os.path.exists(tensorboard_dir):
            os.makedirs(tensorboard_dir)
    
        tf.summary.scalar("loss", model.loss)
        tf.summary.scalar("accuracy", model.acc)
        merged_summary = tf.summary.merge_all()
        writer = tf.summary.FileWriter(tensorboard_dir)
    
        # 配置 Saver
        saver = tf.train.Saver()
        if not os.path.exists(save_dir):
            os.makedirs(save_dir)
    
        print("Loading training and validation data...")
        # 载入训练集与验证集
        start_time = time.time()
        x_train, y_train = process_file(train_dir, word_to_id, cat_to_id, config.seq_length)
        x_val, y_val = process_file(val_dir, word_to_id, cat_to_id, config.seq_length)
        time_dif = get_time_dif(start_time)
        print("Time usage:", time_dif)
    
        # 创建session
        session = tf.Session()
        session.run(tf.global_variables_initializer())
        writer.add_graph(session.graph)
    
        print('Training and evaluating...')
        start_time = time.time()
        total_batch = 0              # 总批次
        best_acc_val = 0.0           # 最佳验证集准确率
        last_improved = 0            # 记录上一次提升批次
        require_improvement = 1000   # 如果超过1000轮未提升,提前结束训练
    
        flag = False
        for epoch in range(config.num_epochs):
            print('Epoch:', epoch + 1)
            batch_train = batch_iter(x_train, y_train, config.batch_size)
            for x_batch, y_batch in batch_train:
                feed_dict = feed_data(x_batch, y_batch, config.dropout_keep_prob)
    
                if total_batch % config.save_per_batch == 0:
                    # 每多少轮次将训练结果写入tensorboard scalar
                    s = session.run(merged_summary, feed_dict=feed_dict)
                    writer.add_summary(s, total_batch)
    
                if total_batch % config.print_per_batch == 0:
                    # 每多少轮次输出在训练集和验证集上的性能
                    feed_dict[model.keep_prob] = 1.0
                    loss_train, acc_train = session.run([model.loss, model.acc], feed_dict=feed_dict)
                    loss_val, acc_val = evaluate(session, x_val, y_val)   # todo
    
                    if acc_val > best_acc_val:
                        # 保存最好结果
                        best_acc_val = acc_val
                        last_improved = total_batch
                        saver.save(sess=session, save_path=save_path)
                        improved_str = '*'
                    else:
                        improved_str = ''
    
                    time_dif = get_time_dif(start_time)
                    msg = 'Iter: {0:>6}, Train Loss: {1:>6.2}, Train Acc: {2:>7.2%},'\
                        + ' Val Loss: {3:>6.2}, Val Acc: {4:>7.2%}, Time: {5} {6}'
                    print(msg.format(total_batch, loss_train, acc_train, loss_val, acc_val, time_dif, improved_str))
    
                session.run(model.optim, feed_dict=feed_dict)  # 运行优化
                total_batch += 1
    
                if total_batch - last_improved > require_improvement:
                    # 验证集正确率长期不提升,提前结束训练
                    print("No optimization for a long time, auto-stopping...")
                    flag = True
                    break  # 跳出循环
            if flag:  # 同上
                break
    
    def test():
        print("Loading test data...")
        start_time = time.time()
        x_test, y_test = process_file(test_dir, word_to_id, cat_to_id, config.seq_length)
    
        session = tf.Session()
        session.run(tf.global_variables_initializer())
        saver = tf.train.Saver()
        saver.restore(sess=session, save_path=save_path)  # 读取保存的模型
    
        print('Testing...')
        loss_test, acc_test = evaluate(session, x_test, y_test)
        msg = 'Test Loss: {0:>6.2}, Test Acc: {1:>7.2%}'
        print(msg.format(loss_test, acc_test))
    
        batch_size = 128
        data_len = len(x_test)
        num_batch = int((data_len - 1) / batch_size) + 1
    
        y_test_cls = np.argmax(y_test, 1)
        y_pred_cls = np.zeros(shape=len(x_test), dtype=np.int32) # 保存预测结果
        for i in range(num_batch):   # 逐批次处理
            start_id = i * batch_size
            end_id = min((i + 1) * batch_size, data_len)
            feed_dict = {
                model.input_x: x_test[start_id:end_id],
                model.keep_prob: 1.0
            }
            y_pred_cls[start_id:end_id] = session.run(model.y_pred_cls, feed_dict=feed_dict)
    
        # 评估
        print("Precision, Recall and F1-Score...")
        print(metrics.classification_report(y_test_cls, y_pred_cls, target_names=categories))
    
        # 混淆矩阵
        print("Confusion Matrix...")
        cm = metrics.confusion_matrix(y_test_cls, y_pred_cls)
        print(cm)
    
        time_dif = get_time_dif(start_time)
        print("Time usage:", time_dif)
    
    
    if __name__ == '__main__':
        if len(sys.argv) != 2 or sys.argv[1] not in ['train', 'test']:
            raise ValueError("""usage: python run_cnn.py [train / test]""")
    
        print('Configuring CNN model...')
        config = TCNNConfig()
        if not os.path.exists(vocab_dir):  # 如果不存在词汇表,重建
            build_vocab(train_dir, vocab_dir, config.vocab_size)
        categories, cat_to_id = read_category()
        words, word_to_id = read_vocab(vocab_dir)
        config.vocab_size = len(words)
        model = TextCNN(config)
    
        if sys.argv[1] == 'train':
            train()
        else:
            test()
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90
    • 91
    • 92
    • 93
    • 94
    • 95
    • 96
    • 97
    • 98
    • 99
    • 100
    • 101
    • 102
    • 103
    • 104
    • 105
    • 106
    • 107
    • 108
    • 109
    • 110
    • 111
    • 112
    • 113
    • 114
    • 115
    • 116
    • 117
    • 118
    • 119
    • 120
    • 121
    • 122
    • 123
    • 124
    • 125
    • 126
    • 127
    • 128
    • 129
    • 130
    • 131
    • 132
    • 133
    • 134
    • 135
    • 136
    • 137
    • 138
    • 139
    • 140
    • 141
    • 142
    • 143
    • 144
    • 145
    • 146
    • 147
    • 148
    • 149
    • 150
    • 151
    • 152
    • 153
    • 154
    • 155
    • 156
    • 157
    • 158
    • 159
    • 160
    • 161
    • 162
    • 163
    • 164
    • 165
    • 166
    • 167
    • 168
    • 169
    • 170
    • 171
    • 172
    • 173
    • 174
    • 175
    • 176
    • 177
    • 178
    • 179
    • 180
    • 181
    • 182
    • 183
    • 184
    • 185
    • 186
    • 187
    • 188
    • 189
    • 190

    训练结果

    python runCNN.py train

    这里写图片描述

    验证结果

    python runCNN.py test 
    结果还行96.43%,至少达到我老板的需求了,可以交差了

    个人分类:  数据挖掘&机器学习
    今日上海27女股民竟悟出股市投资铁律 引爆股市贤兴 · 顶新

    用深度学习处理公众舆情分析

    2017年11月19日 1012KB 下载

    卖烧饼的大叔,得知手机上网赚钱!群鸿 · 顶新

    个人资料

    原创
    25
    粉丝
    12
    喜欢
    1
    评论
    7
    等级:
    访问:
    6267
    积分:
    317
    排名:
    25万+
    勋章:
    展开全文
  • 贷款五级分类

    千次阅读 2013-05-26 20:41:26
    结合中国国情,制定了《贷款分类指导原则》,要求商业银行依据借款人的实际还款能力进行贷款质量的五级分类,即按风险程度将贷款划分为五类:正常、关注、次级、可疑、损失,后三种为不良贷款。 编辑本段...
  • 什么叫资产五级分类

    千次阅读 2017-06-26 23:16:34
    后三类合称为不良贷款。第四条 五类贷款的定义分别为:正常:借款人能够履行合同,没有足够理由怀疑贷款本息不能按时足额偿还。关注:尽管借款人目前有能力偿还贷款本息,但存在一些可能对偿还产生不利影响的因素。...
  • 产品的种类(权威)

    千次阅读 2015-01-05 12:42:19
    产品分类  按传统和习惯一般把农产品分为粮油、果蔬及花卉、林产品、畜禽产品、水产品和其他农副产品六大类。  (一) 粮油  粮油是对谷类、豆类、油料及其初加工品的统称。粮油产品是关系到...
  • 银行客户分类

    千次阅读 2014-10-11 22:41:38
    银行为大客户提供的理财产品是可以“量身定制”的,比如客户有一笔大额资金,除了普通的理财产品可以选择以外,银行可以根据客户的要求来设计产品,客户可以根据自己的实际需要定产品期限、起息日、到期日等要素。...
  • 液晶屏背光板的分类及知识点

    千次阅读 2019-10-15 15:09:21
    液晶屏背光板的分类及知识点 背光板是提供LCD显示器产品中一个背面光源的光学组件。由于液晶玻璃本身不具发光特性,因此根据需要会在液晶玻璃后面加上一个发光源,即背光板。应用范围遍及医疗,美容,仪器仪表,车载...
  • 目录 ...2.证券公司资产管理产品有哪些分类? 3.证券公司资管计划案例 三、基金公司 1.基金公司业务种类 2.基金专户及其子公司专项资管计划 3.案例:中信华夏苏宁云创资产管理专项计划-来自...
  • 托福分类词汇

    2019-09-22 20:48:27
    托福分类词汇表(共17类863个常用单词) 一、psychology 心理 1. mental 心理的 2. physical 身体的,物质的,物理的 3. spiritual 心灵的 4. conformity 从众 5. majority 多数人 6. minority 少...
  • 【转】银行客户分类

    千次阅读 2018-03-23 13:55:30
     商业银行的客户分类体系就是要将前述商业银行客户评价的两个准则相互结合,形成客户分类体系的一个二维矩阵:风险——价值矩阵。它意味着在强调风险接受和强调利润贡献之间进行客户选择。风险最低、收益最大的举措...
  • 最近有个很火的段子:自从开始推进垃圾分类,上海市民每天都要经受两次来自老阿姨的灵魂拷问:“侬是什么垃圾?” 剩饭剩菜属于湿垃圾,外卖盒是干垃圾......有网友出主意,如果分不清,侬就以猪为标准。猪能吃的是...
  • 第四章 使用 scikit-learn 对数据分类 作者:Trent Hauck 译者:飞龙 协议:CC BY-NC-SA 4.0 分类在大量语境下都非常重要。例如,如果我们打算自动化一些决策过程,我们可以利用分类。在我们需要研究诈骗的...
  • 微信读书产品调研报告

    千次阅读 2020-02-14 21:36:15
    而电子阅读产品也是互联网时代下的特色与产物,在竞争激励的电子阅读产品市场中,微信读书也正凭借着高质量的产品设计赢取用户的称赞与信赖。 微信读书产品调研报告 产品名称:微信读书 产品版本:IOS V...
  • 产品经理基础

    2021-09-06 13:46:51
    一、产品经理行业认知 产品是企业的核心,而产品经理则是一个产品的灵魂,一个团队的核心。 随着互联网时代的发展,产品能力正变得越来越重要,它不再是某一个岗位的专有技能,而是每个互联网人都应该掌握的底层...
  • 产品读书《交互设计沉思录》

    千次阅读 2019-04-23 14:12:22
    交互设计是人与产品、系统、服务之间创建的一系列对话。对话随着第四维度(时间)而推进,因此要针对对话进行设计,就要理解自然对话的易变性和流动性。同时,可用性并不是衡量交互设计的唯一重要指标,其内核更应是...
  • 贝叶斯分类器(贝叶斯决策论,极大似然估计,朴素贝叶斯分类器,半朴素贝叶斯分类器,贝叶斯网)学习笔记 一、条件概率,全概率公式,贝叶斯公式 !]...
  • RFID卡射频卡分类

    千次阅读 2018-08-06 15:42:11
    目前生产RFID产品的很多公司都采用自己的标准,但国际上还没有形成统一的标准。现在,可供射频卡使用的几种标准有ISO10536、ISO14443、ISO15693和ISO18OOO。应用最多的是ISO14443和ISO15693,这两个标准都由物理特性...
  • 简单地说就是所应提供的功能,在使用上并不符合产品设计规格说明书中规定的要求,或是根本无法使用。这个错误常常会发生在初期过程的初期和中期,有许多在设计规格说明书中规定的功能无法运行,或是运行结果达不到...
  • 关于电商产品的工作分类,从流量角度我简单分为以下几类(下图),从流量的角度,交易链路在做的事情就是流量变现,把流量转变为GMV。所以我们工作的核心就是如何通过各种手段提升GMV。根据交易链路的环节,分工可以...
  • 生物医学材料的分类

    2020-06-10 11:27:31
    生物医学材料是指一类具有特殊性能、特种功能,用于人工器官、外科修复、理疗康复、诊断、治疗疾患,而对人体组织不会产生不良影响的材料。现在各种合成材料和天然高分子材料、金属和合金材料、陶瓷和碳素材料以及...
  • PCB的基本分类

    千次阅读 2020-05-06 17:17:20
    它的基本分类有: 一.按层数:以铜箔的层数(Layer)为依据 导线只出现在其中一面,在设计线路上有许多严格的限制(因为只有一面,布线间不能交叉而必须绕独自的路径),所以只有早期的电路才使用这类的板子. 这种电路板...
  • 本文分别先从AI产品需求发现阶段、再从AI产品需求设计制造阶段对数据挖掘的利用,然后落地到数据挖掘具体的案例解析,最后得出AI产品大数据观点。 经过多年互联网和移动互联网的飞猛发展,科技网络产品发展到...
  • 法规数字分类

    2017-06-17 07:36:12
    (2)客户资产管理业务人员具有从业资格,无不良行为记录,其中,具有3年以上自营、资产管理或者证券投资基金管理从业经历的人员不少于5人。 (3)最近1年未受到过行政处罚或刑事处罚。 18.集合资产管理计划应当向...
  • 点击上方“3D视觉工坊”,选择“星标”干货第一时间送达背景自动驾驶圈也有很多“黑话”,他们是算法蔑视、戏耍产品经理的金箍棒;是测试忽悠、蒙骗产品经理的芭蕉扇。自动驾驶技术的深奥及飞速革新导...
  • 各大网络安全厂商及安全产品

    千次阅读 2021-01-11 11:42:55
    国内哪些公司在做企业版安全产品开发?...这个是一个兄弟整理的安全产品厂商分类,找不到出处了。 防火墙类(UTM&FW&NGFW)厂商 WAF(web 应用防火墙)厂商 数据库审计类厂家 运维审计厂商
  • 纽扣电池的分类和介绍

    千次阅读 2012-03-08 22:47:45
    纽扣电池的分类和介绍  纽扣电池也是很常见的电池,个子小,型号多,通常一个电池能弄出好几个型号来,这个标准,那个标准,弄得一个东西好几个名。常常就有人拿着费了好大力气从手表里面卸下的纽扣电池,满电子...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,836
精华内容 3,134
关键字:

产品不良的分类