精华内容
下载资源
问答
  • 分库分表是什么 ...SELECT p.*,r.[地理区域名称],s.[店铺名称],s.[信誉] FROM [商品信息] p LEFT JOIN [地理区域] r ON p.[产地] = r.[地理区域编码] LEFT JOIN [店铺信息] s ON p.id = s.[所属...

    分库分表是什么

    下边以电商系统中的例子来说明,下图是电商系统卖家模块的表结构:
    在这里插入图片描述
    通过以下SQL能够获取到商品相关的店铺信息、地理区域信息:

    SELECT p.*,r.[地理区域名称],s.[店铺名称],s.[信誉]
    FROM [商品信息] p 
    LEFT JOIN [地理区域] r ON p.[产地] = r.[地理区域编码]
    LEFT JOIN [店铺信息] s ON s.id = p.[所属店铺]
    WHERE p.id = ?
    

    随着公司业务快速发展,数据库中的数据量猛增,访问性能也变慢了,优化迫在眉睫。分析一下问题出现在哪儿呢? 关系型数据库本身比较容易成为系统瓶颈,单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后,由于查询维度较多,即使添加从库、优化索引,做很多操作时性能仍下降严重。

    方案1:

    通过提升服务器硬件能力来提高数据处理能力,比如增加存储容量 、CPU等,这种方案成本很高,并且如果瓶颈在MySQL本身那么提高硬件也是有很的。

    方案2:

    把数据分散在不同的数据库中,使得单一数据库的数据量变小来缓解单一数据库的性能问题,从而达到提升数据库性能的目的,如下图:将电商数据库拆分为若干独立的数据库,并且对于大表也拆分为若干小表,通过这种数据库拆分的方法来解决数据库的性能问题。
    在这里插入图片描述
    分库分表就是为了解决由于数据量过大而导致数据库性能降低的问题,将原来独立的数据库拆分成若干数据库组成 ,将数据大表拆分成若干数据表组成,使得单一数据库、单一数据表的数据量变小,从而达到提升数据库性能的目的。

    垂直分表

    分库分表包括分库和分表两个部分,在生产中通常包括:垂直分库、水平分库、垂直分表、水平分表四种方式。
    先说 垂直分表:
    通常在商品列表中是不显示商品详情信息的,如下图:
    在这里插入图片描述
    用户在浏览商品列表时,只有对某商品感兴趣时才会查看该商品的详细描述。因此,商品信息中商品描述字段访问频次较低,且该字段存储占用空间较大,访问单个数据IO时间较长;商品信息中商品名称、商品图片、商品价格等其他字段数据访问频次较高。

    由于这两种数据的特性不一样,因此他考虑将商品信息表拆分如下:

    将访问频次低的商品描述信息单独存放在一张表中,访问频次较高的商品基本信息单独放在一张表中。
    在这里插入图片描述
    商品列表可采用以下sql:

    SELECT p.*,r.[地理区域名称],s.[店铺名称],s.[信誉]
    FROM [商品信息] p 
    LEFT JOIN [地理区域] r ON p.[产地] = r.[地理区域编码]
    LEFT JOIN [店铺信息] s ON s.id = p.[所属店铺]
    WHERE...ORDER BY...LIMIT...
    

    需要获取商品描述时,再通过以下sql获取:

    SELECT *
    FROM [商品描述] 
    WHERE [商品ID] = ?
    

    垂直分表定义:将一个表按照字段分成多表,每个表存储其中一部分字段。
    它带来的提升是:

    1.为了避免IO争抢并减少锁表的几率,查看详情的用户与商品信息浏览互不影响

    2.充分发挥热门数据的操作效率,商品信息的操作的高效率不会被商品描述的低效率所拖累。

    为什么大字段IO效率低:第一是由于数据量本身大,需要更长的读取时间;第二是跨页,页是数据库存储单位,很多查找及定位操作都是以页为单位,单页内的数据行越多数据库整体性能越好,而大字段占用空间大,单页内存储行数少,因此IO效率较低。第三,数据库以行为单位将数据加载到内存中,这样表中字段长度较短且访问频率较高,内存能加载更多的数据,命中率更高,减少了磁盘IO,从而提升了数据库性能。

    一般来说,某业务实体中的各个数据项的访问频次是不一样的,部分数据项可能是占用存储空间比较大的BLOB或是TEXT。例如上例中的商品描述。所以,当表数据量很大时,可以将表按字段切开,将热门字段、冷门字段分开放置在不同库中,这些库可以放在不同的存储设备上,避免IO争抢。垂直切分带来的性能提升主要集中在热门数据的操作效率上,而且磁盘争用情况减少。

    通常我们按以下原则进行垂直拆分:

    1. 把不常用的字段单独放在一张表;
    2. 把text,blob等大字段拆分出来放在附表中;
    3. 经常组合查询的列放在一张表中;

    垂直分库

    通过垂直分表性能得到了一定程度的提升,但是还没有达到要求,并且磁盘空间也快不够了,因为数据还是始终限制在一台服务器,库内垂直分表只解决了单一表数据量过大的问题,但没有将表分布到不同的服务器上,因此每个表还是竞争同一个物理机的CPU、内存、网络IO、磁盘。

    经过思考,他把原有的SELLER_DB(卖家库),分为了PRODUCT_DB(商品库)和STORE_DB(店铺库),并把这两个库分散到不同服务器,如下图:
    在这里插入图片描述
    由于商品信息与商品描述业务耦合度较高,因此一起被存放在PRODUCT_DB(商品库);而店铺信息相对独立,因此单独被存放在STORE_DB(店铺库)。

    垂直分库是指按照业务将表进行分类,分布到不同的数据库上面,每个库可以放在不同的服务器上,它的核心理念是专库专用。

    它带来的提升是:

    • 解决业务层面的耦合,业务清晰

    • 能对不同业务的数据进行分级管理、维护、监控、扩展等

    • 高并发场景下,垂直分库一定程度的提升IO、数据库连接数、降低单机硬件资源的瓶颈

      垂直分库通过将表按业务分类,然后分布在不同数据库,并且可以将这些数据库部署在不同服务器上,从而达到多个服务器共同分摊压力的效果,但是依然没有解决单表数据量过大的问题。

    水平分库

    经过垂直分库后,数据库性能问题得到一定程度的解决,但是随着业务量的增长,PRODUCT_DB(商品库)单库存储数据已经超出预估。粗略估计,目前有8w店铺,每个店铺平均150个不同规格的商品,再算上增长,那商品数量得往1500w+上预估,并且PRODUCT_DB(商品库)属于访问非常频繁的资源,单台服务器已经无法支撑。此时该如何优化?

    再次分库?但是从业务角度分析,目前情况已经无法再次垂直分库。

    尝试水平分库,将店铺ID为单数的和店铺ID为双数的商品信息分别放在两个库中。

    在这里插入图片描述
    也就是说,要操作某条数据,先分析这条数据所属的店铺ID。如果店铺ID为双数,将此操作映射至RRODUCT_DB1(商品库1);如果店铺ID为单数,将操作映射至RRODUCT_DB2(商品库2)。此操作要访问数据库名称的表达式为RRODUCT_DB[店铺ID%2 + 1] 。

    水平分库是把同一个表的数据按一定规则拆到不同的数据库中,每个库可以放在不同的服务器上。

    垂直分库是把不同表拆到不同数据库中,它是对数据行的拆分,不影响表结构

    它带来的提升是:

    • 解决了单库大数据,高并发的性能瓶颈。
    • 提高了系统的稳定性及可用性。

    稳定性体现在IO冲突减少,锁定减少,可用性指某个库出问题,部分可用`

    当一个应用难以再细粒度的垂直切分,或切分后数据量行数巨大,存在单库读写、存储性能瓶颈,这时候就需要进行水平分库了,经过水平切分的优化,往往能解决单库存储量及性能瓶颈。但由于同一个表被分配在不同的数据库,需要额外进行数据操作的路由工作,因此大大提升了系统复杂度。

    水平分表

    按照水平分库的思路对他把PRODUCT_DB_X(商品库)内的表也可以进行水平拆分,其目的也是为解决单表数据量大的问题,如下图:
    在这里插入图片描述
    与水平分库的思路类似,不过这次操作的目标是表,商品信息及商品描述被分成了两套表。如果商品ID为双数,将此操作映射至商品信息1表;如果商品ID为单数,将操作映射至商品信息2表。此操作要访问表名称的表达式为商品信息[商品ID%2 + 1] 。

    水平分表是在同一个数据库内,把同一个表的数据按一定规则拆到多个表中。

    它带来的提升是:

    • 优化单一表数据量过大而产生的性能问题

    • 避免IO争抢并减少锁表的几率

      库内的水平分表,解决了单一表数据量过大的问题,分出来的小表中只包含一部分数据,从而使得单个表的数据量变小,提高检索性能。

    总结

    垂直分表:可以把一个宽表的字段按访问频次、是否是大字段的原则拆分为多个表,这样既能使业务清晰,还能提升部分性能。拆分后,尽量从业务角度避免联查,否则性能方面将得不偿失。

    垂直分库:可以把多个表按业务耦合松紧归类,分别存放在不同的库,这些库可以分布在不同服务器,从而使访问压力被多服务器负载,大大提升性能,同时能提高整体架构的业务清晰度,不同的业务库可根据自身情况定制优化方案。但是它需要解决跨库带来的所有复杂问题。

    水平分库:可以把一个表的数据(按数据行)分到多个不同的库,每个库只有这个表的部分数据,这些库可以分布在不同服务器,从而使访问压力被多服务器负载,大大提升性能。它不仅需要解决跨库带来的所有复杂问题,还要解决数据路由的问题(数据路由问题后边介绍)。

    水平分表:可以把一个表的数据(按数据行)分到多个同一个数据库的多张表中,每个表只有这个表的部分数据,这样做能小幅提升性能,它仅仅作为水平分库的一个补充优化。

    一般来说,在系统设计阶段就应该根据业务耦合松紧来确定垂直分库,垂直分表方案,在数据量及访问压力不是特别大的情况,首先考虑缓存、读写分离、索引技术等方案。若数据量极大,且持续增长,再考虑水平分库水平分表方案。

    Sharding-jdbc视频分享

    分库分表生产方案Sharding-jdbc视频分享

    展开全文
  • mycat实现mysql大表自动水平扩展

    千次阅读 2016-03-03 17:27:33
    mycat实现mysql大表自动水平扩展
    1.mycat是一种数据库中间件,详细信息访问官网http://www.mycat.org.cn/
    2.架构图

    从上图可以看出:原来架构单服务器单库单表向多服务器多库多表转换
    这样做的好处是:
    • 解决单台服务器始终存在单个文件大小上限。无论是共享或独占方式的表空间,mysql数据文件大小受操作系统限制,不能无限增长
    • 解决单台服务器资源上限。单台机器的硬件资源不可能无限扩展。
    • 解决成本问题。1台昂贵的小型机的价格>20台普通服务器价格
    • 解决性能瓶颈。
    • 解决大表在线DDL操作难。
    实现思路:利用mycat强大的分表功能,首先配置3个节点用于分表,每个节点写500w数据,其中1个节点做为扩展接点,如果扩展节点被写数据那么,自动配置mycat增加数据节点。所以,始终保持至少有1个空数据节点。注意:一个server可以有多个数据节点
    3.mycat配置
    schema.xml配置
                    <?xml version="1.0"?>
                    <!DOCTYPE mycat:schema SYSTEM "schema.dtd">
                    <mycat:schema xmlns:mycat="http://org.opencloudb/">
                            <schema name="transdb" checkSQLschema="false">
                                    <table name="orders" primaryKey="id" autoIncrement="true" rule="auto-sharding-long-orders" dataNode="dn1,dn2,dn3" />
                            </schema>
                    
                            <dataNode name="dn1" dataHost="localhost1" database="transdb0" />
                            <dataNode name="dn2" dataHost="localhost2" database="transdb1" />
                            <dataNode name="dn3" dataHost="localhost3" database="transdb2" />

                    
                            <dataHost name="localhost1" maxCon="100000" minCon="10" balance="0"
                                    writeType="0" dbType="mysql" dbDriver="native">
                                    <heartbeat>select user()</heartbeat>
                                    <writeHost host="hostM1" url="db1:3306" user="root" password="123456"></writeHost>
                            </dataHost>
                            <dataHost name="localhost2" maxCon="100000" minCon="10" balance="0"
                                    writeType="0" dbType="mysql" dbDriver="native">
                                    <heartbeat>select user()</heartbeat>
                                    <!--heartbeat>select user()</heartbeat-->
                                    <writeHost host="hostS1" url="db2:3306" user="root" password="123456"></writeHost>
                            </dataHost>
                            <dataHost name="localhost3" maxCon="100000" minCon="10" balance="0"
                                    writeType="0" dbType="mysql" dbDriver="native">
                                    <heartbeat>select user()</heartbeat>
                                    <!--heartbeat>select user()</heartbeat-->
                                    <writeHost host="hostS2" url="db3:3306" user="root" password="123456"></writeHost>
                            </dataHost>
                    </mycat:schema>
    rule.xml   
    在rule.xml  添加如下内容(分表规则和算法)
                     <tableRule name="auto-sharding-long-orders">
                                <rule>
                                        <columns>id</columns>
                                        <algorithm>rang-long-orders</algorithm>
                                </rule>
                        </tableRule>   
                         <function name="rang-long-orders"
                                    class="org.opencloudb.route.function.AutoPartitionByLong">
                                    <property name="mapFile">autopartition-long-orders.txt</property>
                         </function>

    autopartition-long-orders.txt
    在conf目录中新增autopartition-long-orders.txt文件,用于rang-long-orders算法选择数据接点,内容如下(0,1,2分别对应schema.xml的dn1,dn2,dn3):
                # range start-end ,data node index
                # K=1000,M=10000.
                0-500M=0
                5000001-1000M=1
                10000001-1500M=2
    sequence_conf.properties
    在sequence_conf.properties添加全局自增序列,用于orders表自增id(调用方式:next value for MYCATSEQ_ORDER),添加如下内容:
                    ORDER.CURID=0
                    ORDER.HISIDS=
                    ORDER.MINID=0
                    ORDER.MAXID=1000000000
    server.xml配置如下:
                <?xml version="1.0" encoding="UTF-8"?>
                <!DOCTYPE mycat:server SYSTEM "server.dtd">
                <mycat:server xmlns:mycat="http://org.opencloudb/">
                        <system>
                                <property name="defaultSqlParser">druidparser</property>
                                <property name="sequnceHandlerType">0</property>
                                <property name="serverPort">3307</property> <property name="managerPort">9067</property>
                        </system>
                        <user name="mycat">
                                <property name="password">123456</property>
                                <property name="schemas">transdb</property>
                        </user>

                        <quarantine>
                           <whitehost>
                              <host host="127.0.0.1" user="mycat"/>
                              <host host="192.168.2.27" user="mycat"/>
                              <host host="192.168.2.45" user="mycat"/>
                           </whitehost>
                       <blacklist check="false"></blacklist>
                        </quarantine>
                </mycat:server>
    4.在每个节点上创建数据库和表(数据库编号dn1=>transdb0,dn2=>transdb1....)
                create database transdb0;
                use transdb0;
                create table orders (id int(11) NOT NULL AUTO_INCREMENT primary key,user_id int,pay decimal(22,2),goods_name char(50));
    5.启动mycat
    bin/mycat start
    6.测试分表功能
    插入数据python脚本
                    #!/bin/env python
                    #-*-coding:utf-8-*-
                    
                    import MySQLdb
                    from multiprocessing import Process;
                    import random
                    
                    def mysql_exec():
                        host='192.168.2.155'
                        port=3307
                        user='mycat'
                        passwd='123456'
                        dbname='transdb'
                        goods_name=random.choice(["IPONE6S", "APPLE", "IPONE7S", "IPONE8S", "IPONE9S","IPONE6P", "APPLE1", "IPONE7P", "IPONE8P", "IPONE9P"])
                        pay=round(random.uniform(100, 10000),2)
                        user_id=random.randint(1, 20000)
                        sql="insert into orders(id,user_id,pay,goods_name)values(next value for MYCATSEQ_ORDER ,%s ,%s ,%s);"
                        param=(user_id,pay,goods_name)
                        try:
                            conn=MySQLdb.connect(host=host,user=user,passwd=passwd,port=int(port),connect_timeout=1,charset='utf8')
                            conn.select_db(dbname)
                            curs = conn.cursor()
                            if param <> '':
                                curs.execute(sql,param)
                            else:
                                curs.execute(sql)
                            conn.commit()
                            curs.close()
                            conn.close()
                        except Exception,e:
                           print "mysql execute: " + str(e)
                    def main():
                            i=0
                            while i<10000000:
                                mysql_exec()
                                i=i+1
                    if __name__=='__main__':
                        main()
    登录mycat,查询所有节点数据
                mysql -umycat -p123456 -h192.168.2.155 transdb -P3307
                mysql> select count(1) from orders;
                +---------+
                | COUNT0  |
                +---------+
                | 7127006 |
                +---------+
    查询单个节点数据
                节点1:mysql -uroot -p -hdb1 transdb0
                mysql> select count(1) from orders;
                +----------+
                | count(1) |
                +----------+
                |  5000000 |
                +----------+
                1 row in set (1.09 sec)
                
                mysql> select min(id),max(id) from orders;
                +---------+---------+
                | min(id) | max(id) |
                +---------+---------+
                |       1 | 5000000 |
                +---------+---------+
                1 row in set (0.00 sec)
                节点2:mysql -uroot -p -hdb2 transdb1
                mysql> select min(id),max(id) from orders;
                +---------+---------+
                | min(id) | max(id) |
                +---------+---------+
                | 5000001 | 7137006 |
                +---------+---------+

    7.自动扩展
    schema.xml配置,红色字体为增加内容
                    <?xml version="1.0"?>
                    <!DOCTYPE mycat:schema SYSTEM "schema.dtd">
                    <mycat:schema xmlns:mycat="http://org.opencloudb/">
                            <schema name="transdb" checkSQLschema="false">
                                    <table name="orders" primaryKey="id" autoIncrement="true" rule="auto-sharding-long-orders" dataNode="dn1,dn2,dn3,dn4" />
                            </schema>
                    
                            <dataNode name="dn1" dataHost="localhost1" database="transdb0" />
                            <dataNode name="dn2" dataHost="localhost2" database="transdb1" />
                            <dataNode name="dn3" dataHost="localhost3" database="transdb2" />
                            <dataNode name="dn1" dataHost="localhost1" database="transdb3" />
    autopartition-long-orders.txt,红色字体为增加内容
      # range start-end ,data node index
                # K=1000,M=10000.
                0-500M=0
                5000001-1000M=1
                10000001-1500M=2
                15000001-2000M=3
    在扩展节点上创建数据库和表
                create database transdb3;
                use transdb3;
                create table orders (id int(11) NOT NULL AUTO_INCREMENT primary key,user_id int,pay decimal(22,2),goods_name char(50));
    重启mycat(实际上可以登录server.xml配置中的9067端口进行reload,但是该功能貌似不完善,restart更稳妥,但是会断开连接)
    8.扩展节点注意
    • 一定要有一个备用的空节点,防止现有节点数据满了,插入报错:(1064, "can't find any valid datanode :ORDERS -> ID -> 5000001")
    • 扩展节点如果与旧节点在相同的server上,应该确缓冲池可以加载所有节点数据页
    • 分表算法难以保证数据节点易扩展和访问热点分散,这个案例是才用范围分片算法,存在热点问题,即,可能80%的查询集中在最后一个数据节点
    • 每个节点的数据量并不是严格对应autopartition-long-orders.txt文件中的范围划分,实际上这个范围对应的是分片键的值。(这里是orders的id值)

    展开全文
  • 多因子模型水平测试题

    千次阅读 2018-05-02 10:26:50
    from:https://zhuanlan.zhihu.com/p/20343666本试题由李腾、陈烨、邓岳、@陈志岗 整理,欢迎补充!...因此,我们几位从业者合力整理了这份多因子模型水平测试题。以问题的方式激发思考,希望能够给从...

    from:https://zhuanlan.zhihu.com/p/20343666

    本试题由李腾、陈烨、邓岳、

    整理,欢迎补充!

    1 试卷说明

    测试目标:多因子模型是量化股票组合投资领域的基本工具,介绍性的资料很多。但学习这些资料之后,甚至一些老手也很难判断自己掌握到什么程度,或是在哪些方面有所缺失。因此,我们几位从业者合力整理了这份多因子模型水平测试题。以问题的方式激发思考,希望能够给从业者提供一个深度学习多因子模型的参考方向。列表中的很多问题我们也不知道最好的答案是什么,提示仅供参考。

    题目说明:多因子模型假设大量股票的未来收益率中的可预测部分由少数几个因子决定。由于同时影响大量股票,所以这些因子被称为共同因子。只影响单只或少数几只股票的特异因子,不在本试题的讨论范围内。多因子模型可用于收益预测、风险预测和业绩归因。业内对三种用途的多因子模型是否应具有统一的因子组并无定论。因此下面题目中很多问题,如无特殊说明,请针对三种用途分别作答。本试题侧重于多因子模型本身的理论和实践,因此对组合构建/优化、交易技术、历史回测技术等低相关主题不做深入探讨。


    2 试题

    因子

    1. A股市场驱动因子能分为哪几大类?【按信息源分:技术、基本面、情绪等】
    2. 常见的因子类别?【行业、技术、基本面、分析师预测、大数据】
    3. 除了最常用的回归法,还有没有其他方法可以进行单因子测试?各自优劣是什么?注:下面问题均针对回归法。【如果用分组法,可以看到非线性的关系】
    4. 单因子测试是否需要纠正版块、市值偏离等问题?如何纠正?【在版块偏离方面,可以设置行业虚拟变量。在市值偏离方面,可以取因子对市值回归的残差,但这种处理不一定有必要?】
    5. 行业归属因子是否应选择动态变化的数据?【是,否则在回归过程中用到未来信息】
    6. 混业经营的上市公司,其行业因子有哪些处理方式?利弊?
    7. 行业因子采用GICS、证监会、申万、中信等第三方数据更好?还是利用相关性、聚类分析等算法来动态确定更好?各自利弊?
    8. 规模因子(Size,也叫市值因子)为什么在中国具有如此重大的影响?选择长期暴露小盘股有哪些利弊?
    9. 市值因子应该怎么取?取市值本身、市值对数、市值平方根有什么区别,哪种更好?你认为流通市值和市值哪个信号更强?
    10. 换手率应该怎么计算?如遇长时间停牌,如何处理?
    11. 若某一因子包含长期平均数据(比如5年平均净利润),而中间有数据缺失的片段(比如最近5年中有2年的年报缺失),应该如何处理?现有两种参考方法:设为空值,或取现有数据的平均值充作长期均值。哪种更好?还是无所谓?
    12. 财务数据应该在哪个时点进行更新?比如月频的多因子模型,年报公布时间可能为3月或4月,是在3月底的时候即时更新那些已出的数据,还是在4月底统一更新使用?【有先有后,随时公布随时更新,或许更有时效性】
    13. 有哪些指标可以用来衡量单因子测试的结果?【t绝对值均值,|t|>2占比,t序列方差,beta均值,beta方差等】
    14. 依据单因子测试结果,如何对因子的有效程度进行排序?或者说,如何用单一指标衡量因子有效性?【参考:abs(mean(t))/std(t),也许有更优解】
    15. 所谓的“alpha因子”和“风险因子”,应该怎么进行区分?
    16. 你理解中有效且有逻辑的因子应该包括哪些?有逻辑但效果较差的因子应该包括哪些?如果采用某种方法组合出一个古怪的因子解释力很强,但是看不出因子的经济意义,你该怎么办?
    17. 如何打磨旧的因子,提高其有效性?
    18. 构建因子的新信息源如何寻找?有哪些思路?
    19. 现在常用的因子都是易于量化的因子,对于基本面因子、事件驱动因子、市场情绪因子等不易量化的因子,有无合适的处理方法?

    模型拟合

    1. 拟合多因子模型的综合目标是什么?
    2. 如何选择样本空间?例如对初上市股票、ST股票、指数成分股变动、停牌股票等异常情况的处理方法。
    3. 如何选取因子组?有什么可以参考的经典理论?【提示:BarraUSE3 Handbook】
    4. 从选择因子到多因子策略回测,一般有哪几个环节?哪些可以省去,哪些不能?【单因子测试(似乎可以省略),合并因子(貌似不能省略,因为不合并相似因子无法消除共线性),预测个股收益率、成本、跟踪误差等,再进行约束优化问题求解】
    5. 每一期的因子暴露度,如果不进行离群值、缺失值以及标准化处理,会有什么后果?如果选择进行处理,又会带来哪些需要注意的模型扭曲?
    6. 离群值处理方法有那几种?一种比较常用的办法是将离开均值N倍标准差距离以外的离群值拉回N倍标准差的位置上,这时候N一般取值多少?【离群值处理还可以用中位数去极值等办法,对题干所述方法,有把N取成2,2.5,3,5的,也许可以通过理论+实践验证一下哪种取值更好】
    7. 缺失值的处理方法有哪几种?现提供三种参考方式:一是把空置设为NaN,回归涉及NaN项时用程序自动忽略;二是把所有含NaN项的个股从当期票池中剔除;三是把所有NaN(在标准化后)设为零(或中位数)。它们有什么区别?哪种好?或者有没有更好的?
    8. 标准化的方法有哪些?标准化后数据近似呈现何种分布规律?各种标准化方法的利弊?【除了减去均值、再除以标准差,还可以取排序序数等】
    9. 带权重的标准化,权重怎么设置?是否需要和回归时的个股权重保持一致?
    10. 标准化、离群值处理、缺失值处理,三个环节如何确立先后顺序?
    11. 因子之间或多或少具有一些相关性,若把所有因子进行正交化处理,会发生什么情况?这样做或不这样做的理由是什么?
    12. 如何选择截面回归的频率?依据是什么?
    13. 回归模型涉及的个股收益率怎么计算?最简单的(又能保证一定精确度的)方法是什么?【可以用复权收盘价。精确结果应该是利用市场价格和分股、配股等影响收益的因素结合计算】
    14. 回归模型是否需要加入截距项(即常数项)?在什么情况下可以取,什么情况下不能取?【有行业因子时不能加入截距项,因为行业因子之和为全1向量,再加截距项就会导致回归系数不唯一确定】
    15. 回归时用OLS和WLS的区别在哪里?使用WLS的依据是什么?【Barra文档里提到两点:一是市场更关注那些流通市值更大的股票;二是对消除异方差有帮助,并且支出sqrt(流通市值)是对异方差的一个较好的估计,可以用作回归权重】
    16. 如何评估或衡量多因子模型的效果?
    17. 如何判断现有因子是否足够解释收益率?【R^2可以辅助判断,也许有更好的标准?】
    18. 中国股票市场多因子模型的R^2通常在什么量级?
    19. 为了提高R^2,尽可能多地加入各种因子,会导致什么问题?
    20. 如果一个因子与现有因子组均低相关,而且能够显著提高R^2,那么什么样的理由可能会使我们选择不加入这个因子?【因子收益率不稳定】
    21. 对于回归法因子测试,能否直接用不同截面的数据叠加在一起进行回归(即面板回归)?可能产生的后果是什么?【牛熊市数据可能分层了,掩盖真正的规律】
    22. 进行多元回归时,如何检验共线性、异方差问题?如何解决?
    23. 无风险资产在各个市场应该如何选择?中国市场有哪些选择?各自的利弊(例如历史长度、数据完整性、代表性等)?
    24. 计算beta值的基准(benchmark)如何选择?不同选择对整个模型影响有哪些方面?
    25. 似乎研究者已经惯于用线性模型来解释收益率,为什么不用更复杂的模型?(或者已经存在什么非线性的结果?)
    26. 拟合多因子模型时,数据挖掘问题有多严重?怎样降低过拟合的程度?

    收益预测

    1. 在多因子回归中,预测的目标是什么?收益率?对行业的超额收益率?对市场的超额收益率?还是其他的?
    2. 用于收益预测的多因子模型,在拟合时应侧重考虑哪些方面?
    3. 因子收益率如何预测?有哪些方法?是否有必要进行因子择时? 国外的文献对这方面的研究成果如何?
    4. 构建选股模型时,通常会对许多因子进行降维、合并,这样做的主要意义是什么?【国信、中信的多因子报告里都有相关介绍】
    5. 对将要合并的几个因子,如何分配它们的权重?请对静态、动态赋值各一例,它们各自的优劣是什么?【提示:静态比如简单平均,动态比如IC加权平均,参见安信或中信多因子报告。简单平均的好处是逻辑简洁便于计算,动态平均能更多地利用市场信息】
    6. 已知过去若干期的(合并后)因子暴露度,根据以上测试结果,如何预测下期收益率?
    7. 用IC(横截面相关性)衡量预测有效性有什么缺陷?
    8. 未来1日收益率预测的IC通常在什么水平?未来1月的呢?不同时间尺度之间是否有固定的转换关系?
    9. 预测时间尺度如何选择?未来1天、1周、1月、3月还是更长?【看你拥有的信息/因子在哪个时间尺度上最有效】
    10. 如何将多因子模型的预测与其它预测(例如定性研究对少数股票的预测)整合?【Black-Litterman模型】

    风险预测

    1. 用于风险预测的多因子模型,在拟合时应侧重考虑哪些方面?
    2. 是否有必要预测收益的波动率?如何预测收益的波动率?是否要在优化中使用波动率?
    3. 多因子模型预测出的协方差矩阵是否会有发生高度接近奇异的情况?
    4. 设我们称风险预测模型中的因子为“风险因子”,称收益预测模型中的因子为“alpha因子”。如果一个alpha因子也入选了风险因子,会对组合优化结果产生什么影响?如果在风险模型中特意剔除所有alpha因子,会对组合优化结果产生什么影响?
    5. BARRA的多因子风险预测模型主要在哪些细节上做了精细处理?
    6. BARRA在不同市场上的多因子风险预测模型之间的细微差异,反映了各个市场的哪些特点?
    7. 用日数据vs用月数据估计协方差矩阵,各适用于什么需求?用日内(例如分钟级)数据来估计协方差阵的好处与坏处是什么?
    8. 怎样衡量或评估风险预测模型的有效性?

    业绩归因

    1. 用于业绩归因的多因子模型,在拟合时应侧重考虑哪些方面?
    2. 有人认为,与用于预测的多因子模型相比,用于业绩归因的多因子模型,对因子之间的低共线性要求更高,请解释可能的原因?
    3. 业绩归因将组合收益分解为若干个因子上的收益和一个特异收益。一位有技术的定性投资经理(基于实地调研和对某些行业、公司的洞察力)的归因结果应该是什么样子?一位利用多因子模型量化选股的投资经理的归因结果应该是什么样子?
    4. 在对一个已知策略逻辑大体思路的投资组合进行业绩归因时,采用标准的因子组vs采用针对性的因子组各有什么利弊?【采用标准因子组便于与其它组合横比;采用针对性因子组便于与自身策略逻辑纵比】
    5. 多因子业绩归因系统输出的结果中,特异收益(specificreturn,即不可被因子解释的收益)如果显著地偏正或偏负,怎样解释?怎样调试归因系统来消除偏离?
    6. 纯多头组合业绩归因时,以总头寸或者主动头寸(=总头寸-基准头寸)为分析对象,各有什么利弊?
    7. 如果不知道组合持股明细,只知道组合每日收益率,怎样对它进行多因子业绩归因?误差会放大多少?
    8. 多因子业绩归因模型怎样与Brinson业绩归因模型整合使用?

    组合构建

    1. 利用多因子模型进行选股,求解每期股票权重的问题本质上是一个带约束的最优化问题,请阐述优化目标和约束条件各是什么?
    2. 组合优化有哪些常见方法?各要注意什么问题?
    3. 股票组合中个股权重上限的设计有什么技巧?大约应设置在什么范围?【个股权重不能太大,否则只会集中买入每个行业预期收益最高的股票;也不能太小,否则可能出现某个行业内所有股票都持仓至上限也无法达到行业中性。参考值:2%~3%,应根据实际情况调整取值】
    4. 是否要根据个股的交易量来限制个股权重的上限?
    5. 如何预估市场冲击?
    6. 是否可以(大概)控制每个版块的持仓个股数?如何做?【参考方法:股权重上限为它所处行业在沪深300(或其他基准)中占比除以希望持仓的个股数】
    7. 建立选股模型时,如何控制行业中性、市值中性(或其他条件)?
    8. 建立选股模型时,如何处理交易成本、股票停牌等问题?如何计买入、卖出价?
    9. 纯多头约束对组合构建的影响不止是少了一半的获利机会,这句话怎样理解?
    10. 纯多头股票组合策略应选择怎样的指数作为基准?沪深300、中证500、中证800?各有什么利弊?
    11. 应该每日调整头寸,还是更低的频率,例如每月,抑或每次财报集中发布之后?
    12. 多因子模型回测过程中,是否应对个股特别设立平仓与开仓条件(即对多因子的结果进行修正)?如何做?

    实盘

    1. 新策略从提出到开发,再到上线的流程中,历史回测(back-test)、实时模拟(paper-trading)和实盘交易(real-money)的关键差异何在,各自的优劣何在?
    2. 如何检测你的模型是否已经失效? 模型因子是否需要定期重选?
    3. 实盘中一个历史回测、实时模拟业绩都很好的策略发生了异常回撤,问题可能出在什么地方?应急预案是什么?
    4. 如何设计数据库表结构来记录实盘交易流水和每日资产明细?
    5. 在实盘交易中,模型给出的交易指令常常不能被精确地执行,如何评估其影响?

    数据

    1. 基本信息、行情、基本面等基础数据库的表结构应该怎样设计?出于怎样的考虑?
    2. 选择Mysql、SQL及其它数据库管理系统的利弊?
    3. 常见的数据来源有哪些,数据提供商有哪些,各有哪些优劣?
    4. 用网页抓取生成的数据源的利弊?
    5. 如何支持多数据源?
    6. 每个数据具有三个关键日期,数据日期、公告日期、录入日期。对于不同类型的数据项,上述三个关键日期之间的时滞情况不同,请对不同情况分别举例。数据库应怎样设计以全息保存三种关键日期,并使历史回测结果更加逼真?
    7. 行业分类数据选用哪家的好?
    8. 发现一只股票的某个财务数据异常,怎样找到真值?
    9. 如何记录基础数据的勘误历史?
    10. 怎么进行数据清洗?拥有哪些异常行为的股票应该列入黑名单?

    程序

    1. 分析程序用MATLAB、Python、R、C++等语言各自的利弊?哪种背景和需求的人应该选择哪种语言?
    2. 10年历史回测,数据量大约是多少,运算量大约是多少?怎样的内存不会溢出?
    3. 面向过程的架构vs面向对象架构来实现多因子模型各有什么利弊?

    综合

    1. 股票市场是否存在alpha,怎样验证?
    2. 传统的基本面投资方法与多因子模型都是为了得到股票组合,他们的异同是什么?
    3. 多因子回归模型与CAPM理论和APT理论的关系是什么?
    4. 一般的选股模型可以达到多少年化收益率和夏普比率?
    5. 在多因子模型的构造过程中,最核心的一个环节是什么?【我认为是预测收益率,也许有人认为是风险(跟踪误差)控制】
    6. 不同交易频率的组合投资策略——日内(高频、中频、低频)、日频、中期、长期,其对应的多因子模型有哪些不同?
    7. 为什么同样的策略,不同的执行者之间会存在无法抹去的误差(为什么你无法复制另一个人的研究报告成果)?
    8. 一般来说,多因子模型对数据敏感性很强,那么它的结果还有参考意义吗?
    9. 多因子模型作为一个如此成熟的策略,为什么还有前仆后继的研究者?
    10. 基于多因子模型的策略收益没有吸引力,从业者众多,是夕阳产业吗?年轻人学习多因子模型是否值得?
    11. 机器学习、人工智能的工具可以应用到多因子模型的哪些地方?

    3 评分标准

    市场上,达到“训练有素”级别的人已经为数不多,通常为大型投资研究机构入行5年以上的从业者;“专家”级别的人更少,仅凭资历以不能达到,还需要“天赋+勤奋+际遇”,少数机构投研核心1-2位;“大师”级别的人在全球范围屈指可数。



    展开全文
  • IT 工资水平

    千次阅读 2011-03-25 17:37:00
    逢年过节会发些纪念性的小东西,价格100以内;月薪可以重新商量,大连最高已经到了5K;听说曾拒给一个最后签微软的同学笔试机会; 7.江西宜春学院,教研,东北大学,硕士,安家费4-5W,一次签5年,年薪3-4W 8.杭州某...

    2007年计算机硕士应届毕业生薪资一览
        1.大连松下,研发,东北大学,硕士,月薪4.5K,每月交通补助等0.15K,自己缴纳15%的住房公积金,公司交纳25%,不提供住房,年终奖金=3个月工资,签3年,违约金5k
    2.广州腾讯,研发,东北大学,硕士,年薪10W,每月住房补助等1.2K,公积金交纳比例未知,不提供住房,年终奖未知
    3.北京微软研究院,研发,东北大学,硕士,年薪16W,其它未知。
    4.北京金山/大连金山,研发,东北大学,硕士,月薪3K-4K,其它未知
    5.杭州NEC,研发,东北大学,硕士,月薪5K-6K,其它未知
    6.沈阳东软/大连东软,研发,东北大学,硕士,月薪4K左右,一次签3年,个人住房公积金缴纳比例为工资10%,公司10%,毁约金=3个月工资×离期限年数,沈阳东软提供单身宿舍,环境不错,年终奖和部门有关,也和自己能力有关;逢年过节会发些纪念性的小东西,价格100以内;月薪可以重新商量,大连最高已经到了5K;听说曾拒给一个最后签微软的同学笔试机会;
    7.江西宜春学院,教研,东北大学,硕士,安家费4-5W,一次签5年,年薪3-4W
    8.杭州某日资IT公司,研发,杭州计量大学,本科,毕业两年后的今天,月薪大于1W,正在日本出差
    9.上海InterPac,研发兼销售,江西农业大学,本科,毕业两年后的今天,出差周游的大半个世界,年存款13W以上
    10.北京凌阳科技,研发,东北大学,硕士,月薪5.3K,公司地理位置大约在五环,提供单身宿舍,公司和个人各交纳10%住房公积金,一年一调薪(好好表现哦),违约金3W
    11.南京中兴,研发,武汉大学,硕士,第一年月薪6K,13个月工资,第二年开始年终奖2-3W,一次签3年,违约金15K,其他未知
    12.广东北电,研发,武汉大学,硕士,月薪7K,据说工作很轻松,所以办事效率也不咋高
    13.上海威盛(Viatech),研发,武汉大学,硕士,月薪8K,不太容易进
    14.大连OKI(日冲),研发,东北大学,硕士,月薪4.5K,过英语六级加0.3K,过日语三级加0.5K,自己缴纳15%的住房公积金,公司交纳25%,不提供住房
    15.南京趋势科技,研发,武汉大学,硕士,月薪8K,其他未知
    16.深圳华为,研发/技术支持,东北大学,硕士,月薪6K,其他未知
    17.洛阳一航光电所(613所),见习期间硕士年薪不低于6W,转正后享受科研岗位津贴
    2006年IT各大公司硕士薪资情况揭秘
    以下是根据06年浙大同学找工作的情况统计出来的信息。
    比那些贴烂掉的薪水帖要准确的多。
    有些公司薪水有个范围,表示根据笔试面试的情况定。
    都是研发测试类硕士的情况.

    Morgan IT 18万+bonus,共25万左右
    Google 17万9千多
    NI 拿到手14万,四金全部是公司交。
    MS atc 15.3万
    百度 7000至8500,发14个月,每个季度有4500至6000的奖金。
    NOKIA 研发12000左右

    美国道富银行IT部 8000至12000,发15个月
    浙大网新恒天    9500×15
    网易杭州研究院   9000至10000,发14个月
    ask.com   9000至12000,发14个月
    IBM CRL   (7500+800+900)*12+7500*2.5+3.3万(住房补贴,三年10万,平均到一年。)
    IBM CDL    (7500+800)*12+7500*2.5+3.3万
    nVidia   测试8000×15,研发10000×15,有期权。 (另一说9000×13,有期权)
    Trilogy 16万左右
    上海威盛 7500×13,不再提供宿舍
    杭州威盛 6000×13
    UT斯达康 6500/月,福利不错
    腾讯 7000×13,年终奖金15000,但是没有住房公积金
    MicroStategy 杭州职位每月12000,14个月,美国职位待遇不详
    泰鼎 8000×13,年终奖2个月薪水左右
    北京瞬联   9000至10000×12,第一年有10000元安家费
    上海展讯 6500至7000,发14-16个月,有期权
    Intel 8000×13,加上一些乱七八糟的补贴
    中兴 8-10万
    华为 5500+1000(1000是打在卡里面,取出来要扣20%税)
    方正   5000-7000 * 13    学生待遇,医疗不论大小   基本免费,有公积金。每年有探亲费。就是管理不行 太糟糕, 感觉像养老 生孩子的地方, 里面人员冗余的残渣比较多。
    这几个我比较了解,有很多朋友在,应该算是比较准确的。
    不过请注意哦,这里说的都是研发人员的硕士,本科的要低一点,非研发类的,比如行政,内勤也要低不少。
    做IT研发这一行,赚钱多是正常的,一方面行业利润高,另外,公司都是大公司,全国范围内层层选拔出来的那么几个超牛的顶尖人才。最后,这东西吃的都是青春饭,每天工作个十五六个小时很正常。一点不亚于在stanford读研究生。
    最真实的06年应届毕业生薪水
    按行业划分   
      [通讯]
      上海贝尔阿而卡特:8w/y 硕 (包括福利) (harry)
      朗讯青岛:7.5k/m 硕
      朗讯北京:9.6k/m 硕
      Cisco上海:9w/y 硕
      华为: 5000+800 硕士
      爱立信北京:6500税前
      西门子AD:3200
      中电赛龙 5050+800+150 硕士
      大唐移动 5500+900(车补房补饭补)
      大唐兴唐3650/m 硕士 (avivi)
      大唐信威研发 5500+900 硕士 (avivi)
      瑞斯康达 试用期5k,转正6k,补助有几百,硕士(avivi)
      中兴 5750 硕士 (avivi,lgb)
      数码视讯 4500-6000 硕士(avivi)
      阿德利亚 6k (avivi)
      港湾 4500+500 硕士 (avivi)
      
      
      [运营商]
      北京联通:硕士4000+2000/M
      太原联通:实习期3000/M本科
      上海联通:转正后10W/Y(加福利)
      河北联通:
      >试用期3-6个月 见习期1年 试用期在见习期内
      >试用期小本850
      >然后转正 定岗 见习期内奖金拿0.5
      >最低级的业务员是1到4岗 一般上来也只能定成1岗
      >1岗工资950 4岗工资1950
      >奖金占薪酬的50%
      >发13个月
      >剩下的就是补助 年终 逢年过节的发个钱了
      
      东莞电信:本本 实习期4W/Y,转正7~8W/Y(包括基本工资和奖金)
      广州电信:不具体说但是说平均每人9W.工资总额/人数.税后
      深圳电信:第一年6W.转正后9W.税后
      
      上海网通:转正后12W/Y (加福利)
      太原网通:1500-1600
      
      重庆移动:(CrewZ)
      >本本 实习期6个月 ,1k2/M
      >转正后7岗,2k+/M(平时所有的加在一起到手的,不算年终)
      
      
      [软件]
      微软:SDE14w/y SDET 12.5w/y
      :10w/y 硕 7w/y 本
      百度:研发13w/y 硕 业务类非常低
      Google:16k/m 硕
      盛大:本科4000,硕士5500.3个月的实习期.实习期待遇为正式的80%
      TOM网:本科4500税前
      汉略:本,3.2-3.5k税前+绩效奖金
      Infosys:
      >试用期6个月,培训10/18周(短期/长期,视是否为计算机、软件专业而定),其间
      >2.5k/m(本科)计算机、软件的为3k,转正另议。发13个月薪水,其中第13个月为全年
      >最高的一次工资。(deazi)
      
      
      [PC]
      明基:2500左右
      华硕:3000左右
      VIA:7000/m 提供宿舍 硕士 4000/m 本本 提供宿舍 伙食补助250
      
      
      [集团]
      Sony东京 25w/y
      intel:研发 研 8k*16 (税前基本工资)
      IBM CDL: 研 7.5k*14 (税前基本工资)
      IBM Sales: 研 5.8k*14 (税前基本工资)
      联想:4000税前.
      联想研究院:5300硕士
      方正电子 5k 硕士,但是只发70%,剩下30%作为奖金 (avivi)
      HP:SALES,5300税前
      
      
      [金融]
      四大全部: 本 5k*13 硕 5.3k*13 (税前基本工资)
      摩根斯坦利: 本 25w/y (税前基本工资)
      BOSH基金深圳:11K/M税前
      招行深圳总行培训生100/Y税后
      四大银行总行:第二年转正后10W/Y
      HSBC:7800税前
      
      
      [消费品]
      NESTLE:4200税前
      P&G:本科6200,研究生7200,博士生9000
      MARS:9150税前
      L'OREAL:4000+税前
      
      
      [其他]
      SHELL:7800税前
      EMERSON:研发7000税前 销售,本,基本工资4K+各种补助奖金等2K左右,税前
      Maersk:本,基本工资5.5K/M,税前
      3院33所 第一年5W,第二年7W (avivi)
      民航数据通信 4500 硕士 (avivi)

      通用电气中国医疗集团,研发,6500-7000/m,不包括福利
      西门子核磁共振,6000/m)(包括餐补,房补)
      通用电气医疗集团,modality specialist,5000/m
      东芝(中国)研发中心,5900/m,房补,车补,另外有2000左右。医疗免费。
      飞利浦东软医疗集团,4500/m,每年18个月工资。
      雅虎中国,研发,7000/m
    还有,陶氏化学IT Center 7100/m,外加800房补,餐补,分红。
       建行总行,硕士,4000+3000/m
      锐捷 3500/m左右
      南瑞 4500/m左右
      可能LZ是个研究生,基本上不会去低薪的电器行业。
      长虹 1500/m
      海信 1500/m
      TCL 1800-3000 集团内部不同公司薪水不同
      康佳 2500/m
      步步高 2500/m
      不过据说家电行业的隐形收入很高,而且拿的是提成,不是奖金。
    西门子家电 4500/M研发 销售:2K左右+提成
      ABB 销售底薪4500+奖金(比底薪稍低)
      GE 销售4K左右+奖金
      施耐德跟ABB收入差不多
      西门子 销售5K多一点
      28所 第一年4万,以后看部门
      东大金智4。3K 第一年6万,第二年8万,第三年10万
    各IT大公司薪水全集
        GE: 月薪:4500左右,如果扣税(300-400),住房公积金(10%约450)租房(800-1000),
      剩余3000元,吃饭消费:1000多,剩余不到2000

      Wal


     
    mart&Caca Cloa 很低,就不说了。
     
      Nestle,P&G, BAT: 待遇见GE

      Shell: 工资6500 左右,扣除方式见GE

      喳打:6000

      汇丰:6500-7000

      恒生:5500

      伍大:工资5000左右,各家有差别,加班出差有补贴,但是并不按照实际加班时间算,

     
      工作

      较辛苦:女人当男人用,男人当牲口用。

      华为:月薪7000,伙食补助300,交通补助500,年奖约有2万。年薪12万。

      中兴:年薪10万,月薪6000以上。

      大唐科技股份公司:月薪6000,每月可报销500元的各种费用。

      大唐中央研究院:试用期5500,转正后6500~15000不等,一年总的薪酬能够有10万。对于一些保险和住房公积金等单位和个人共同负担,医疗目前采用公费制,一年240元的医疗费,超过部分5年内的员工自负25%。个人档案存放在单位或者人才中心。另外中研院预计明年上市,员工持内部股。上市以后员工的档案统一存放在人才中心。

      高鸿公司:月薪4000,年薪7万。

      大唐信威:月薪6000。

      首信集团:试用期3500,转正后4500-5000,年薪6-8万,对于技术骨干解决住房。

      海尔集成电路设计公司:试用期3500,转正后5000,年薪7万。无住房等补贴。

      华虹NEC:月薪4500,不过据说奖金很高。

      摩托罗拉(北京):月薪7000,福利很好。

      贝尔实验室(北京):月薪8000,福利很好,有出国机会。

      信息产业部规划院:月薪5500,工作轻松。

      深圳中兴集成电路:月薪6000,年奖较多,工作很累。

      联想研究院:月薪6000。?联想手持事业部:月薪5000左右。

      联通北京公司:月薪3500-4000


    2005年IT公司薪水调查
    2005-10-21 17:04

    以下是我收集的几个公司给做研发的对口专业硕士毕业生开的薪水(均为税前,以后会继续添加和修改,希望大家不断补充)
    公司名   本科月薪  本科年薪   硕士月薪  硕士年薪     补充
    北京微软  8000                  10(税后)  研究院助理
    研究院
    ibm研究院              10000    12-15
    ibm公司  5400     7-8     同本科          support
    人员收入和出差天数有关,sales收入多来自提成
    intel                7000+(13m)  10+
    北京贝尔                     9
    北京sun               10000
    GE     3000+    5+
    北京联想               6500(13m)  7.5
    研究院
    南京趋势  6000+           9000          工作较轻松
    摩托罗拉               5600     9+    
    (南京)                           福利很好
    南京                 6000     7-8
    爱立信
    南京凤凰               6000+          福利很好
    江苏移动               7000+    10-12
    江苏联通               2000-3000  4
    江苏电信  2000-3000  4-6
    江苏邮电涉              2000     6
    及规划院
    江苏省                            和移动的待
    多媒体局                           遇相当。
    江苏纺织                     10     江苏舜天
    进出口公司                          待遇非常好
    南瑞继保               4000-5000  7-8
    南京联创  3-4k           7000+    10
    南大富士通 4800     5.5-6.5   5800     7.5-9.5
    南大苏福特 4000     6      5800
    南京金思维 2500
    华泰证券               4000     5      证券业其他收入很多
    南京招行  3000
    华为                 7000+800   10     表现好的有机会拿到15万
    中兴                 6000     8-10    年终奖较多,和项目情况有关
    南京日恒  2500-3500  4.5-6           6+     福利健全
    南京华宇               4000-7000
    江苏人寿  3500
    江苏建行  3000
    苏州明基  2000-3000
    上海Navion              6500     9-10    亚洲最佳雇主第7,福利环境好
    上海hp   4400           5400     9.6     补贴较多
    上海威胜               7000
    上海贝尔               3000+1900+300+(200-1000) 马上并入alcatel
          岗位 车贴房贴
    上海贝尔               6700     10     福利好
    阿尔卡特
    上海中芯  3000           4200
    上海华虹               5000左右,不能确定
    五大会计  本、硕、博同酬
    事务所
    PWC                 5250,过CPA加500 出差120/天.
    KPMG                 5300-6000,出差180/天.
    EY,                 5000(13个月),110/天,过CPA奖励1000,+100/月
    AA,                 5600
    南京DTT               3500-5000
    斯伦贝谢sema             6500-8000(18m)
    上海宝信               3000     6-7
    上海大霸  2500-3500
    东方通信  3000-4000
    烽火通信  3000-4000
    神州数码               4000     6
    UTStarcom              5000(16m)        福利好
    深大电话  4000     7-8                  福利好
    深圳证券通                    17
    信有限公司
    平安保险  4000*16+400*12+1000*5               内部管理比
    广州联通  4000-5000+1500(房贴)
    广东移动                     15+     待遇很高
    南方日报
    广州日报  5000+                       待遇比较高
    环球时报
    广州少男  3000
    少女杂志
    招商银行  9000                        待遇很高
    总部cs
    杰赛设计院 3k-4k                       签5年
    广东电信  2500
    珠海电信  3000     6      4000           珠海深圳特
    深圳电信  3000                        区上调20&
    广东邮电               7000
    规划院
    广州电信               7000-8000
    研发中心
    厦门建行        6-7
    cs
    成都迈普        5             10
    华为北研所:月薪7000,每月伙食补助300,交通补助500,年奖约有 2万。年薪12万。地点:上地信息产业基地华为大厦。
    中兴:年薪10万,月薪6000以上。不过与研究所效益有关,上海二所据说只有4500,但二所马上就要做3G产品的研发。
    大唐电信科技股份公司北京研发中心:月薪6000,每月可报销500 元的各种费用(手机费、的费、书费等)。个人档案存放在单位或者人才中                       心。地点:学院路40号。
    大唐电信集团中央研究院:试用期5500,转正后6500~15000 不等,一年总的薪酬能够有10万。对于一些保险和住房公积金等单位和个人
    共同负担,医疗目前采用公费制,一年240元的医疗费,超过部分5年内的员工自负25%。个人档案存放在单位或者人才中心。另外中研院
    预计明年上市,员工持内部股。上市以后员工的档案统一存放在人才 中心。地点:学院路40号。
    大唐高鸿公司:很早面试的(十月份),当时说试用期月薪3500,转正后4000,年薪能有7万。提供半年免费住宿。主要做ATM、IP交换机等。
    大唐信威公司:月薪6000,其余不知。主要做SCDMA产品研发。
    上海大唐移动通信公司:试用期3500,转正后5000,年薪7万。地点: 上海市漕溪路(徐汇区)。
    首信集团:试用期3500,转正后4500-5500,年薪6-8万,高的能有10万,对于技术骨干解决住房。工作地点在小西天(北师大附近)。
    北京海尔集成电路设计公司:试用期3500,转正后5000,年薪7 万。无住房等补贴。主要做高清晰度电视、信息家电的集成电路设计。工作地
               点:海淀区花园路4号(北三环附近)。
    北京华虹NEC:月薪4500,不过据说奖金很高。如果是技术骨干,1~2年后月薪可上1万(听说的)。
    摩托罗拉(北京):月薪7000,福利很好。主要做软件、DSP等。
    贝尔实验室(北京):月薪8000,福利很好,有出国培训机会。
    信息产业部规划院(北京):月薪5500,工作轻松。主要做电信网的规划。
    深圳中兴集成电路:月薪6000,年奖较多,工作很累的。户口必须落在深圳。
    联想研究院:月薪6000。
    联想手持事业部:月薪4500~5000左右。主要做PDA、掌上电脑。
    联通北京公司:月薪3500~4000。主要做电信网的规划,也有做管理的。
    转自:http://hi.baidu.com/%B2%DF%BB%AE%CA%A6/blog/item/c7100ade03d654156327981b.html

    展开全文
  • 爬虫入门级别教程(小白水平)

    千次阅读 多人点赞 2021-04-13 09:14:15
    我在搜索栏中输入了软件二字,现在我们想把这些价格信息抓取下来 我们查看页面源代码,发现里面有我们想要的数据。 在这之前,我们需要学习一个很方便的匹配规则-Xpath,Xpath嘛用过的人都说好~~~ Xapth的学习:...
  • 害阿里程序员差点被当场开除的P0事故

    万次阅读 多人点赞 2019-12-05 00:09:22
    P0属于最高级别事故,比如崩溃,页面无法访问,主流程不通,主功能未实现,或者在影响面上影响很大(即使bug本身不严重)。 P1事故属于高级别事故,一般属于主功能上的分支,支线流程,核心次功能等,后面还有P2,...
  • 对于右尾检验: p值=P[检验统计量>=检验统计量的观察值] 对于左尾检验: p值=p[检验统计量检验统计量的观察值] 对于双尾检验: p值=2*p[检验统计量>=|检验统计量的观察值|] p值决策 我们比较p值和显著性水平(alpha...
  • 未来人P57堪称最强笔记本

    千次阅读 2014-01-16 15:37:18
    售价约21万元 未来人P57堪称最强笔记本我们曾经肯定听说过外星人笔记本,强大的配置以及强炫酷的外观让我们动情不已,但是碍于价格太高,大部分人也只能看看。不过今天小编给大家介绍的是价格更高的地球人P57笔记本...
  • ps:概念: 水平分库:是把同一个表的数据按一定规则拆到不同的数据库中,每个库可以放在不同的服务器 上。 水平分表:是在同一个数据库内,把同一个表的数据按一定...二、对(一)Sharding-JDBC 整合mybatis-p...
  • (转)多因子模型水平测试题

    万次阅读 2016-10-14 20:37:53
    不错的贴,做个记号吧。https://zhuanlan.zhihu.com/p/20343666
  •   关于价格指数的定义,《CPI手册》中指出价格指数用于衡量一组价格在某一时期的相应变化幅度或百分比变化,它可以衡量当特定商品或服务价格发生变化对该组相对价格变动的...价格价格指数分别从绝对水平和相对...
  • 【通俗解释】P_value 假设检验

    千次阅读 2017-07-10 17:32:02
    既然他肯定会在集市上卖掉所有东西,那么这一小瓶尿他一定也会卖出去,只不过这瓶尿的价格可能也就是零吧。 这一次他赚了5400块,这可比以往的平均数5000块钱还多。那问题就来了:为什么这个月他赚的比平常多呢? 有...
  • iTSP组内几个弟兄对我的绩效模型提出了他们的看法,这也许是我没有考虑到的,或者无法考虑到的,其实有些内容在我的模型里面是有涉及的,但也许不够完善,还没有到足够好的地步,只是需要进一步的考虑。2008-07-13 ...
  • 公司的市盈率 (P/E) 告诉您投资者愿意为每单位 (£1、$1、€1) ...例如,公司股票目前的交易价格为每股 £40,前四个季度的平均每股收益为 £2,当年的 P/E 率为 20。 这意味着购买股票的投资者需支付 £20 ,以
  • 一:居中效果实现小结&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;1,文本居中&nbsp;&nbsp;&...文本水平居中:text-align:center;&nbsp;&nbsp;&
  • 转自:https://zhuanlan.zhihu.com/p/22823948?refer=jjscience 作者:江嘉键 链接:https://zhuanlan.zhihu.com/p/22823948 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 ...
  • 一文读懂PQuant与QQuant量化易金工

    千次阅读 2019-05-10 14:24:03
    转 一文读懂P Quant与 Q Quant ,量化交易与金融工程 原标题:P Quant 和 Q Quant 到底哪个是未来?  来源:李老师与何老师的CFA学习课堂  作者:何璇   P-Quant & Q-Quant (金融量化中的...
  • 专业单反虽然拥有良好画质,但是硕大的体型和昂贵的价格是阻挡入门级玩家的天然门槛。如今为了应对入门级玩家对于专业级操控和高画质表现的需求,专业厂商一直没有放弃对于专业级DC机身的研发。今天来到我们ZOL评测...
  • 股价S&P预测——线性回归

    千次阅读 2016-04-24 11:26:23
    Dataset本文的数据集是美国股票市场指数sp500.csv,这个指数显示了市整个股票市场的情况,数据集包含了从2005年到2015年每天收盘价格(价格市场关闭时):如果你只看一只股是得不到太多信息的,但是看这个指数可以得到一...
  • P-SIF长文本表示方法

    千次阅读 2020-07-08 16:33:22
    论文原文地址P-SIF: Document Embeddings Using Partition Averaging 一、论文的核心思想 回顾一下一般句向量的表示方法——简单的词向量加权平均可以很好的表示一个句向量,在很多任务下,比复杂的seqtoseq神经网络...
  • 转 一文读懂P Quant与 Q Quant ,量化交易与金融工程 原标题:P Quant 和 Q Quant 到底哪个是未来?  来源:李老师与何老师的CFA学习课堂  作者:何璇   P-Quant & Q-Quant (金融量化中的...
  • 为什么说程序员的前三年不要太看重工资水平? 这是很多程序界的”过来人“给新人提出的忠告。1、得出这样结论的依据是什么?为什么?2、对于程序员职业发展的影响是怎样的?修改 举报 ...
  • 真实的IT界内工资水平

    万次阅读 2008-11-19 00:04:00
    逢年过节会发些纪念性的小东西,价格100以内;月薪可以重新商量,大连最高已经到了5K;听说曾 拒给一个最后签微软的同学笔试机会; 7.江西宜春学院,教研,东北大学,硕士,安家费4-5W,一次签5年,年薪3-4W ...
  • 网络营销4p营销策略

    千次阅读 2014-10-22 19:21:20
    中,4P理论是什么呢?  一.产品策略  网络的逐渐发展,使消费者与厂商的直接对话成为了可能,消费个性化受到厂商的重视,这使 网络营销 中产品呈现出众多新特色,企业在制定产品策略时,应从 网络营销 环境...
  • from:https://zhuanlan.zhihu.com/p/48949717 更多精彩内容,欢迎关注公众号...价格行为是一段时间内的价格运动,这种运动留下了“足迹”,即资金的足迹。一旦理解得当,这个足迹便会向我们揭露图表上发生的故事.....
  • 利用Python预测股票价格

    千次阅读 多人点赞 2020-07-16 16:24:12
    作为一种技术手段,预测在金融、证券领域的应用非常广泛,尤其是对股票价格的预测。我们介绍一下获得股票数据的方法,并基于此对数据进行预处理,接着使用数据分析方法,建立基础特征,进一步构建预测模型,且基于新...
  • 【营销】史上最全4P、4C、4S、4R、4V、4I...在市场营销组合中4P分别是产品(product)价格(price)地点(place)促销(promotion)。 产品的组合 主要包括产品的实体、服务、品牌、包装。它是指企业提供给目标市场的货物、...
  • T440p是Haswell平台的14寸Thinkpad中最重也是性能最高的一款,也可能是同代Thinpad保留拆解乐趣最多的一款。 对Thinkpad,联想每一代都会去掉一些传统,添加一些自己的元素。这一代也不例外。 经过一段时间的使用...
  • 关于OLPH计划的那些事儿

    千次阅读 2009-05-15 10:46:00
    其实,黑客源于英文hacker,是指热衷于计算机技术,水平高超的电脑专家,尤其是程序设计人员。而利用电脑搞破坏或恶作剧的那些人,其实应称作cracker——“骇客”。近日,Gdium基金会就准备召集全球各地的黑客(注意...
  • 。IBM ThinkPad T60P 全面评测

    万次阅读 2006-11-02 20:30:00
    45000元都能买到些什么东西呢?如果去吃麦当劳,50元吃一顿的话,每天每顿吃的话,差不多够吃1年;如果拿来买球鞋,1000元1双的耐克鞋可以买45双,每天穿1双的话也足够一个半月不重复;...ThinkPad T60P就是这样一台笔

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 22,306
精华内容 8,922
关键字:

价格水平p