精华内容
下载资源
问答
  • sklearn接口的xgboost 分类器: xgboost.XGBClaaifier() xgboost.fit(x,y) 1. xgboost.predict(test_x)  2. xgboost.predict_proba...讨论: 结果1“可能”不准,因为predict默认采用0.5做阈值;另外,scor...

    sklearn接口的xgboost 分类器:

    xgboost.XGBClaaifier()

    xgboost.fit(x,y)

    1. xgboost.predict(test_x)  

    2. xgboost.predict_proba(test_x)

    3. xgboost.score(test_x,y)

    讨论:

    结果1“可能”不准,因为predict默认采用0.5做阈值;另外,score也是利用0.5做阈值计算的分数。

    而如果根据predict_proba,我们分析不同阈值下的正确率分数,会发现在某些阈值下,正确率分数会更高。

     

     

    非sklearn接口的xgboost分类器:

    xgboost.train()

    xgboost.predict() 只会输出概率或sigmoid转换前的贡献度model_a.predict(pred_contribs= True),需要人工指定阈值,才能做分类。

     

    展开全文
  • 关于ETL过程如何保证数据量的准确性和数据的正确性的讨论Flywolf2000这个问题很简单,就是ETL过程中,你怎么保证数据的准确性,这个准确性包含两个方面:数据量的准确性,数值的正确性。ITPUB个人空间l;o `^*ca)V f6...

    原创于2008年06月06日,2009年10月22日迁移至此。


    关于 ETL 过程如何保证数据量的准确性和数据的正确性的讨论

    Flywolf2000

    这个问题很简单,就是 ETL 过程中,你怎么保证数据的准确性,这个准确性包含两个方面:数据量的准确性,数值的正确性。 ITPUB个人空间l;o` ^*c

    a)V f6G ~,gC5q6517
    这个问题看起来很简单,但是却包含很多内容: ITPUB个人空间7x'g'Jk6Ku
    A
    、字符集的转换 —— 怎么将基于不同字符集的数据转换到目的数据库
    5Fk+Oj-`n6517 B
    、数据量的准确性 —— 使用 ETL 工具的质量监控工具就那么准么?我可遇到过不准的情况哦。
    2NTA[?2R:au3w6q`6517 C
    discard 的数据怎么重新能够加载回目的数据库中( ETL 已经完毕了,并不是所有的数据能够重新加载进取的)。 ITPUB个人空间 J(L/uJf0z
    D
    ETL 一般都是在晚上生产库结束后进行的,如果第二天发现 ETL 数据不对,怎么保证还能够抽取到昨天的业务数据? ITPUB个人空间1i7A(X#Pk"~LR/D
    E
    、一个指标的计算是经过多层次的抽取后完成的,怎么保证在抽取的过程中数值精度不丢失?怎么让业务人员理解其指标
    5F9T4^|.AX6517
    进行运算的过程( ETL 抽取的时提供的可是技术元数据,客户所关心的可是业务员数据)?

     

     

    wxlmail2008

    D 的 回答,好像会很麻烦吧,比如在分布式的情况下,抽取的数据是多个库的,而且源数据库(事物数据库)是很烦忙的,总不能停机处理把(特别是在金融,电信领 域),不过我知道他们是有备用数据库的(我不太清楚该术语,就用这个备用数据库代替了),就是一旦某一数据库宕掉,会自动启用另一数据库(这种备用数据库 也不只一个),是不是可以用备用数据库来抽取昨天的业务数据呢?
    &M:p!raQ&J+gV5h6517 ITPUB个人空间*M)PSn'^](C
    不知对不,偶想也不只一种方法吧,望 LZ 给予指正!

     

     

    hskd-iceman

    我的理解: ITPUB个人空间d1cu3t{
    A
    、如果数据源比较多而且字符集都不一样的话,字符集的转换的确是比较麻烦的,不过我想如果能够保证目标数据库的字符集是其它源数据库字符集的超集,或者是大部分源数据库字符集的超集,我想这样的麻烦可以减少很多。
    /a5@*r AS?Vy5Q;S6517 B
    、如果 ETL 处理的表比较多,那么除了用监控工具之外,我想不到有什么其它好的方法,或者可以写写过程之类的,让它定期运行,获取你关心的一些数据指标。 ITPUB个人空间'/6aY Xx$RV%}
    C
    ETL 已经完毕了,并不是所有的数据能够重新加载进取的?这个我不是很明白为什么不能重新加载进取?
    3VKkCV"]!v6517 D
    、 这一点的话楼上的建议也不错,我们现在一般不到生产库抽取数据,数据都是在备机上取的,因为直接到生产库抽数据会影响到正常的业务办理,这种方式不是很 好。不过如果没有备机的话,那也只能从生产机上取了,不过不是很明白为什么不能抽到昨天的业务数据?如果要保证抽到昨天的业务数据,既然技术上实现不了, 那只能通过别的途径了,是否可能跟客户谈谈,改变这种方式? ITPUB个人空间;^wkJa7w
    E
    、这个也是个问题,有时我们只能引导客户。 ITPUB个人空间L/F/w4LH8]wJo ^],`
    我的理解比较肤浅,希望大家都来讨论讨论。

     

     

    Bq_wang

    这个问题很简单,就是 ETL 过程中,你怎么保证数据的准确性,这个准确性包含两个方面:数据量的准确性,数值的正确性。
    J Gy-clUB M6517 ITPUB个人空间*F8`4g+V�Y_.S Z
    ITPUB个人空间!TH^/!g;N"Xm@B
    这个问题看起来很简单,但是却包含很多内容: ITPUB个人空间F0C%s}wGS
    A
    、字符集的转换 —— 怎么将基于不同字符集的数据转换到目的数据库。   ITPUB个人空间K4p/}%eR
    --
    数据库超集
    &ycT:Y.P/{ W)X/`6517 B
    、数据量的准确性 —— 使用 ETL 工具的质量监控工具就那么准么?我可遇到过不准的情况哦。 ITPUB个人空间qF@Zy8mh6?/MT
    --
    这个很难,我建议在不符合标准的数据上做个记号,全部写入到数据仓库中 ITPUB个人空间4U?U#G[ V
    C
    discard 的数据怎么重新能够加载回目的数据库中( ETL 已经完毕了,并不是所有的数据能够重新加载进取的)。 ITPUB个人空间A(D@wUN&]
    --
    通上,不符合条件数据的维度值给以一些缺省值,一般情况下流水作业很难重新补登再入库的
    g|Zi@8o7K8WV6517 D
    ETL 一般都是在晚上生产库结束后进行的,如果第二天发现 ETL 数据不对,怎么保证还能够抽取到昨天的业务数据?
    +F Bl�Y%H6517 --
    做个好的脚本,只负责删除和处理某个时间段的数据 ITPUB个人空间%z lv(fmk j
    E
    、一个指标的计算是经过多层次的抽取后完成的,怎么保证在抽取的过程中数值精度不丢失?怎么让业务人员理解其指标 ITPUB个人空间nzhH!N/`~ |
    进行运算的过程( ETL 抽取的时提供的可是技术元数据,客户所关心的可是业务员数据)?
    H9Q4`ll8S/q5}-F6517 --
    自己理解后,做好元数据维护和释义

     

     

    innovate511

    做个简单的补充,这些问题是最常见的 ETL 数据控制的问题,最好用治本的办法: ETL 工作流控制+控制表双重控制,同时 ETL 开发留出接口,让客户可以非正常情况下重新抽取(有的时候客户要求很怪, ETL 开发无法全部控制)。控制表我以前提到过,可以分为数据准确性控制表和 ETL 控制表两大类。而控制表有两种设计方法,一是由数据组成,二是直接存储逻辑(动态 SQL ),两者各有优势,数据组成的非常灵活,而逻辑组成的则方便管理 ,我都玩过,有机会可以一起探讨下。
    N%C*} Hk*w3g+gB6517
    Ur0u i(dm-k*}6517
    保持数据精度不丢失,这得看客户的需求,所以人们说到数据集市层的时候,数据粒度可以比较大,但也可以小到最低粒度,这样数据精度可以一直完好保存。如果是客户技术人员,就给他看技术元数据,如果是最终用户,就看业务元数据,或者直接对前端 UAT ,最终用户一般只要他们要的报表或者分析准确,满足他们的需求就行了。

     

     

    piliskys

    估计这只是理论的解决,实际中应该是不好使的
    iff,sGu6517
    就说两个吧 ITPUB个人空间C�g x0wz(x;C7kp
    c,
    不符合条件数据的维度 -- 很多时候不符合条件的是五花八门的,什么情况都可能,所以无法预先知道哪些是不符合条件的,
    j/k3E%`+V!U]eLdfY6517 d,
    不是所有数据只是插入操作,在业务系统中更新操作的数据很多,而且不是所有都有时间字段的, 具体问题还是要具体分析 ITPUB个人空间1P�gEw1ye`
    很多时候理论上是如此,事实却是另一面,这就是为什么有很多好的数据仓库方面的书籍而难有很好的数据仓库的实际项目

     

     

    xx_adam

    B ,我个人觉得对照业务系统数据记录条数和导入之后的记录条数进行比较,一致应该是准确的,不过 DW 中的表要建好主键约束
    Q_1L3K-K:sSU)WKC6517 D,
    一般情况下,业务系统会有一个时间戳,从昨天的时间戳重新抽取。 ITPUB个人空间W4Y$G{UX8dn
    E,
    在每一步的计算机中尽可能保留多的小数据位数据,不进行四舍五入

     

     

    mingjian129

    对照业务系统数据记录条数和导入之后的记录条数进行比较,如果一樣則很好辦,但是如果記錄數不一致的話,比較難去判斷哪些是已經導入的?哪些是沒有導入的?單純以時間戳的話是沒辦法去判斷的,而且如果從昨天的時間戳重新抽取的話,那么务必要刪掉已經導入的數據。

     

     

    gushangzao007

    D ETL 一般都是在晚上生产库结束后进行的,如果第二天发现 ETL 数据不对,怎么保证还能够抽取到昨天的业务数据? ITPUB个人空间6uNrr#BWeR�T
       
    回复:呵呵,如果用户可以接受的话,我一般把 ETL 执行安排在第二天的凌晨开始,从第二天凌晨开始抽取第一天的数据。
    e%H%Vuq/jc6517 E
    、一个指标的计算是经过多层次的抽取后完成的,怎么保证在抽取的过程中数值精度不丢失?怎么让业务人员理解其指标
    p*dqf(OM8Yw6517
    进行运算的过程( ETL 抽取的时提供的可是技术元数据,客户所关心的可是业务员数据)?
    Q8i&t1gzlP6517    
    回复:我认为在 ETL 的 过程中不对数值型数据据进行四舍五入操作,可有效防止数据精度不丢失,至于客户想看到多少位的精度,我们可以在前端展现中对数据进行格式化。为了让业务人 员能更好的理解指标的运算过程,我们一般在展现层以文字或在线帮助的形式对可能会引起歧义的指标给出后台的计算公式,帮助用户更好的理解指标含义。

     

     

    flywolf2000

    ITPUB个人空间f"W7j+z^(Tb k
    今天冒个泡说两句: ITPUB个人空间B%|W*wQm#g
    对于 A 问题字符集 bq_wang 说的是很贴切的,一般来说为了确保安全该使用字符集的超集合,对于 Oracle 数据库来说,是可以转换 ITPUB个人空间 MuljM"gy L%F'z
    字符集的,也就是说不同种字符集之间 Oracle 会自动给你转换,这个部分抽时间我传个最近整理的字符集 ppt ,大家看看
    F"ccA'@,S6517
    就知道了,但是我们这里讨论的不仅仅是 Oracle 数据库,这个时候你就要同时考虑操作系统字符集、客户端字符集、数据库
    kD-BLJ!TD @*D p6517
    字符集甚至应用程序字符集的问题。而最关键的是要看你抽取的数据是否落地,并且在落地的同时有没有进行字符集的转换, ITPUB个人空间0U9m;oU._x
    例如:如果从一个字符集的操作系统中导出来数据,传输过程中几次落地,但是仅仅是落地存储,即使落地的操作系统、客户 ITPUB个人空间}u:t5`)E
    端的字符集再怎么相互不兼容,这也不会影响了源数据。一般来说都会在 ETL 前详细调查源的字符集以落地解析的字符集以及 ITPUB个人空间4mwA3[.OJ
    目的地的字符集,如果这个过程是字符集的子集以及超级的话那当然最好了,如果不是那么就要评估数据的损失量或者制定 ASCII
    &/J%M2}&C|qJ2X6517
    的转换机制,因为字符集说白了就是将 存储为 ASCII 码,而这个 ASCII 在另个字符集展现中是什么样子的问题。 ITPUB个人空间^r-hl1O7S%vCv$`
    原创于2008年06月06日,2009年10月22日迁移至此。
    KY!P t~7H$V6517 ITPUB个人空间#F#E~/eD2iQ{d
    B
    数据量准确性问题,说实话至今好像还没有什么好的方法,因为 ETL 不是数据平移 ---- 用个 count 统计对比就能知道数据量是
    ,/%@b(S2F4oX6517
    否正确,当一个指标是经过多次 join 、过滤、判断、计算以后就已经很难保证抽取过来的数据是否在量上是正确的,一般我这边 ITPUB个人空间5@r/L*`U4@;`0at
    采取的方法是定义抽样检测,得出一定的概率,这个概率就算是指标体系的一个误差了。 ITPUB个人空间y]yeI)@.j!DGm�]3p
    ITPUB个人空间/8/w"i s L
    C bq_wang
    和其他人说的都有道理,有些业务数据在当天做完 ETL EOD 以后是没有办法再重新单独抽取的,在这种情况下要么
    7Uf*RR+C4h,M6517
    制定手工更改抽取的指标;要么启用前一天业务数据备份 ,再另一个环境下在人为的干预下重新跑一次该模块的 ETL 流程。而对于一
    )NLhE-F*a n�Xl'C6517
    些仅仅是静态平移、简单清洗的数据当然就不用这么麻烦了。 ITPUB个人空间?s~_2SR+e7L"u

    'TX WK*M6L l3J6517 D
    这个问题上我发现大家的想法都不太对,一般来说对于生产库的一些关键性交易数据都是要每天在抽取的之前做一次逻辑的备份 ——ITPUB个人空间"z1Q J HSEaRx
    就是类似于 create table table_name_2008_1_5 as select * from .... ,一旦第二天发现抽取问题,还有昨天的静态数据源;而
    )`bM9g7o6} F5b6517
    对于流水性质的数据来说我们就可以不用做 tmp 表而在第二天还能重新抽取了,但是对于那种可以删除流水的业务系统就有点
    ?Gf U0~)UPw6517
    变态了: ——
    PA L~*R9c:O-gq6517
    )x(@"iN6_!f4V2Y6517 E
    今天就先不说了,准备迷糊了,上面这些问题希望大家继续深层讨论,东西还是很多的。 ITPUB个人空间2NQR0U W2XU
    ITPUB个人空间yl%x9ml'F
    大家别仅仅就考虑我提出来的这 A--E 五个方面,可以集思广益,多谈谈大家在实际工作中遇到的问题。
    MKIm$JTq9VvX4g6517 ITPUB个人空间 Fg(Uz%],N8X
    好了,今天就罗嗦到这里,欢迎大家来拍砖头。

     

     

    Bearingpoint_NO

    这个问题看起来很简单,但是却包含很多内容: ITPUB个人空间x aZg7s+U%pb
    A
    、字符集的转换 —— 怎么将基于不同字符集的数据转换到目的数据库。
    "II*VPO;x s9B6517 B
    、数据量的准确性 —— 使用 ETL 工具的质量监控工具就那么准么?我可遇到过不准的情况哦。 ITPUB个人空间*I~Ty�s&Id6/
    C
    discard 的数据怎么重新能够加载回目的数据库中( ETL 已经完毕了,并不是所有的数据能够重新加载进取的)。
    c1aL*Z h&O

    展开全文
  • 讨论2:对于程序员学历是不是问题

    万次阅读 热门讨论 2009-07-22 16:06:00
    收到了两封围绕学历与工作话题的来信,通过这两封来信我们看到了部分学历较低的程序员面临的困惑,我想针对这两个读者的问题,我们大家讨论一下: 对于程序员学历是不是问题? 两封来信如下: 第一封:学校2009年...
        收到了两封围绕学历与工作话题的来信,通过这两封来信我们看到了部分学历较低的程序员面临的困惑,我想针对这两个读者的问题,我们大家讨论一下:
     

    对于程序员学历是不是问题?

     
    两封来信如下:
     
    第一封:
    学校2009年大学学历标准下来了,像我这样去年放弃报名机会的,现在可以报名第二批次。
    有两种学历类型,一种是中国农业大学的大专和内蒙古民族大学的大专,这种学历周期比较长,大概2年半到三年才可以拿到,费用8000左右
    还有一种是什么管理大学的,好像是北京的一个民办高校,交4000,就可以拿到本科,在八月份毕业的时候就可以拿到,拿这个学历有一个缺点,就是不能参加公务员考试,拿这个学历的条件我都达到了,从年龄上,技术上都可以。
    我不知道该如何选择???
    我比较倾向于拿农业大学的,但是学费较贵,周期较长,暂时对我八月份的就业起不到作用
    又比较倾向那个管理大学的,周期短,八月份拿到就可以为我的就业增加砝码(好像大专或本科毕业证是很多企业招聘的基础),如果没有学历证,那进一些企业比较困难(哪怕技术学的非常好,但缺乏实战经验)
    我该如何抉择?
    我有两种选择:
    一是:民办大学的本科+工程师证书,以后再考个微软或思科认证
    二是:工程师证书+3年后的专科证书(农大的),以后再考虑认证
    怎么办?
    迷茫中....时间不多了
     
    第二封:
    您好:
              看到您写的《我是主考官.....》,感觉您写的文章好贴近现实,很好的反映了我们这些求职者的对找工作恐惧、忧虑的内心,其实看了这些文章,对比自己的情况,你的文章从反面都给求职者一些正确求职的方法。很好,非常的好!
             我名字叫XXX,没上过大学,只是Aptech北大青鸟培训出来的"种子",培训的是Java程序设计,工作了一年,最近又回到了才开始找工作的状态,正在为找工作烦恼。基本情况就是这样的,没大学文凭,我只有两张证书,我想这个东东也没什么用的,现在我看到招聘都是本科、甚至本科以上,让我望而生畏,每当看到这些招聘,我都不敢投。在这种情况下,我一片迷茫,找不到方向。以前工作时因为同学的介绍,通过关系进入了。但是现在只得靠自己,正在烦恼、恐惧中,我想向你请教,我该怎么办?
     
    回信如下:
     
    走在IT职场上,向右看“学历”,向左看“学历”,向前看“学历”,向后看似乎还是“学历”。
    “学历”、“学历”、“学历”、“学历”......
    头都大了!!
     
    我不禁要问一句 :“学历真的就那么重要吗?”
     
    我们发现如下现象:
    学历本科以下,获得了证书的人说:
    我学习了各种证书,那个工作我可以干啊!?还要学历干什么?!!
     
    本科以上学历者说:
    他们没有经过大学学历教育,只是通过职业培训进入到了企业,而且以极低的工资,抢了我们的饭碗!!
     
    当我们缺少学历而有相应“工作能力”的朋友们抱怨,为啥我们找不到合适的招聘启示的时候,是否想到过,那些有学历而找不到工作的人也在抱怨,你们正在用极低的工资策略抢他们的饭碗呢?
     
    不管这两方面的人怎么说,大家是否愿意听听企业的主管们怎么说?
     
    和学历有关的,选人的4个需要说明的问题:
     
    我虽然不能代表所有企业的主考官,我只代表我自己,我也不想通过我的博文来讨好任何一方,我只说我处理这件事的一个实事:
     
    1、未获本科学历的“应届毕业生”因为年龄太小所以不要
    还记得,我在《我是主考官》故事1中,描述了一个“必删的简历”吧,我告诉大家,在那个邮件列表中,有相当一部分投过来的简历是年龄很小,甚至是高中毕业后参加了职业培训后就开始找工作了!!
     
    但,我说过,这些简历我是“必删的”!
     
    为什么删?
    20岁以下的,甚至有的只有17岁的同学们,还在花季年龄,还是那么的年轻,放着这么大好的时光,为什么不抓紧时间学习呢?为什么非要挤进这个早已拥挤不堪的工作社会呢?
     
    从企业的角度来看,20岁以下的同学我们是不会要的,这里根本不会管你的工作能力,你手里有一大堆证书也没有用,原因很简单,年龄过小,什么事情都得教,我是工作的主管不是一个小学老师。
     
    年龄合适指的是本科毕业的年龄,理论上应该在21岁以上。因此,这个年龄的应届毕业生应该是本科学历,也正因为这个原因,只有本科学历的“应届毕业生”可以进入我的视野。其他未满21岁的“应届毕业生”如大专,高中,都不会被关注。
     
    2、年龄合适没有工作能力的不要(不管有没有学历)
     
    21岁以上,但是没有工作能力同样不要,不管是否有本科学历。
    年龄合适说明你的社会经验已经具备,但这仅仅是一个必要条件,而不是充分条件,没有工作能力,啥都不会,连一个Java程序都没有编过,你让我怎么录用你?!
    所以,从这一点来说,有学历而不能进行工作,学历就没用了!
     
    3、公司硬性规定只要“本科”的,低学历者我根本看不到简历
     
    不是我不想见见有能力的同学,而是如果公司硬性规定,只要本科以上,我作为主管根本就看不到各位的简历,早就被HR专员删掉了。我根本没有机会了解各位的工作的能力,从而也根本没有办法和你争辩“学历到底是否重要”这个问题!!
     
    4、如果两个人能力相当,我会选择高学历者
     
    如果,公司不硬性规定本科以上,当然一般情况下这种情况是因为如下两个原因:
     
    1、这个人太难找,以至于不得不降低学历限制。
    2、希望找工资低的人,以降低项目开发成本,此行为属于短视行为(一般这是下策)。
     
    如果有两个人,工资和能力是一样的,我一定会选择高学历者,这是不容置疑的。
     
    上述4个问题,仅仅是从“找工作”这个问题而说,如果从“成才”的角度来说,学历真的不重要!!我们可以举出无数个没有学历而成才的例子,包括伟大的程序员!!
    而找工作和工作或许是第一步吧!
     
        具有Java开发程序的技能,也许你能完成Java程序的开发基本工作,但如果要想更深入的发展还需要更多的综合方面的知识。
        这些综合的知识恰恰就是在学校中学习到的东西。也许通过简单的培训可以进入一个简单工作的职位,但是需要注意的是,如果你一心想做技术工作,你进入岗位后需要加倍的努力,将人家在学校里学习到的知识补上来。

     

    作者:钟声   著有《Java程序员,上班那点事儿》一书。

     

    Java程序员,上班那点事儿》,前言,目录

    展开全文
  • ...程序猿DD ...然而,最后这个90%可见的最后一问可能直接让你功亏一篑。...你有什么问题想问我吗?...看似平淡无奇的问题,但是却蕴含着多方面的含义。...这个问题表面上给了你更多...加入各种主题讨论群 朕已阅 

    点击蓝色“程序猿DD”关注我

    回复“资源”获取独家整理的学习资料!

    640?

    作者 | 干货小分队

    来源 | blog.didispace.com

    640?wx_fmt=jpeg

    尽管,我们之前分享了这么多关于面试的主题:

    • ...

    然而,最后这个90%可见的最后一问可能直接让你功亏一篑。 这么厉害的最后一问:“ 你有什么问题想问我吗?”

    看似平淡无奇的问题,但是却蕴含着多方面的含义。这个问题表面上给了你更多了解公司和展现个人优势的机会,但是潜台词,也是考察你对公司的了解以及对想在这里工作的意愿,对岗位是否有自己的理解。这也是我们常常是说的,你的个人价值观是否与公司价值观一致的考察,价值观的一致是直接决定日后工作主动性以及对工作责任心的直接影响因素。

    那么如何回答好这类问题呢?今天分享一个万能的Github上的开源项目:reverse-interview,即:反向面试。

    Github地址:https://github.com/viraptor/reverse-interview

    这里记录了网友们整理的如何应对反向面试的N多优秀回答!给正在准备面试的你们~

    反向面试

    下面列表里的问题对于参加技术面试的人来说可能有些用。 列表里的问题并不一定适用于某个特定的职位或者工作类型, 也没有排序 最开始的时候这只是我自己的问题列表, 但是慢慢地添加了一些我觉得可能让我对这家公司亮红牌的问题。 我也注意到被我面试的人提问我的问题太少了, 感觉他们挺浪费机会的。

    如果你问过的问题没有被列出来, 请提交一个 PR。

    预期使用方式

    • 检查一下哪些问题你感兴趣

    • 检查一下哪些是你可以自己在网上找到答案的

    • 找不到的话就向面试官提问

    绝对不要想把这个列表里的每个问题都问一遍。

    请记住事情总是灵活的,组织的结构调整也会经常发生。 拥有一个 bug 追踪系统并不会保证高效处理 bug。CI/CD (持续集成系统) 也不一定保证交付时间会很短。

    职责

    • On-call (电话值班)的计划或者规定是什么?值班或者遇到问题加班时候有加班费吗?

    • 我的日常工作是什么?

    • 团队里面初级和高级工程师的比例是多少?(有计划改变吗)

    • 入职培训会是什么样的?

    • 自己单独的开发活动和按部就班工作的比例大概是怎样的?

    • 每天预期/核心工作时间是多少小时?

    • 在你看来,这个工作做到什么程度算成功?

    • 我入职的岗位是新增还是接替之前离职的同事?(是否有技术债需要还)?(zh)

    • 入职之后在哪个项目组,项目是新成立还是已有的?(zh)

    技术

    • 公司常用的技术栈是什么?

    • 你们怎么使用源码控制系统?

    • 你们怎么测试代码?

    • 你们怎么追踪 bug?

    • 你们怎么集成和部署代码改动?是使用持续集成和持续部署吗?

    • 你们的基础设施搭建方法在版本管理系统里吗?或者是代码化的吗?

    • 从计划到完成一项任务的工作流是什么样的?

    • 你们如何准备故障恢复?

    • 有标准的开发环境吗?是强制的吗?

    • 你们需要花费多长时间来给产品搭建一个本地测试环境?(分钟/小时/天)

    • 你们需要花费多长时间来响应代码或者依赖中的安全问题?

    • 所有的开发者都可以使用他们电脑的本地管理员权限吗?

    • 公司是否有技术分享交流活动?有的话,多久一次呢?(zh)

    团队

    • 工作是怎么组织的?

    • 团队内/团队间的交流通常是怎样的?

    • 如果遇到不同的意见怎样处理?

    • 谁来设定优先级 / 计划?

    • 如果被退回了会怎样?(“这个在预计的时间内做不完”)

    • 每周都会开什么类型的会议?

    • 产品/服务的规划是什么样的?(n周一发布 / 持续部署 / 多个发布流 / ...)

    • 生产环境发生事故了怎么办?是否有不批评人而分析问题的文化?

    • 有没有一些团队正在经历还尚待解决的挑战?

    • 公司技术团队的架构和人员组成?(zh)

    公司

    • 有没有会议/旅行预算?使用的规定是什么?

    • 晋升流程是怎样的?要求/预期是怎样沟通的?

    • 技术和管理两条职业路径是分开的吗?

    • 对于多元化招聘的现状或者观点是什么?

    • 有公司级别的学习资源吗?比如电子书订阅或者在线课程?

    • 有获取证书的预算吗?

    • 公司的成熟度如何?(早期寻找方向 / 有内容的工作 / 维护中 / ...)

    • 我可以为开源项目做贡献吗?是否需要审批?

    • 有竞业限制或者保密协议需要签吗?

    • 你们认为公司文化中的空白是什么?

    • 能够跟我说一公司处于不良情况,以及如何处理的故事吗?

    商业

    • 你们现在盈利吗?

    • 如果没有的话,还需要多久?

    • 公司的资金来源是什么?谁影响或者指定高层计划或方向?

    • 你们如何挣钱?

    • 什么阻止了你们挣更多的钱?

    • 你们认为什么是你们的竞争优势?

    远程工作

    • 远程工作和办公室工作的比例是多少?

    • 公司提供硬件吗?更新计划如何?

    • 额外的附件和家居可以通过公司购买吗?这方面是否有预算?

    • 有共享办公或者上网的预算吗?

    • 多久需要去一次办公室?

    • 公司的会议室是否一直为视频会议准备着?

    办公室工作

    • 办公室的布局如何?(开放的 / 小隔间 / 独立办公室)

    • 有没有支持/市场/或者其他需要大量打电话的团队在我的团队旁边办公?

    待遇

    • 如果有奖金计划的话,奖金如何分配?

    • 如果有奖金计划的话,过去的几年里通常会发百分之多少的奖金?

    • 有五险一金或者其他退休养老金等福利吗?如果有的话,公司有配套的商业保险吗?

    带薪休假

    • 带薪休假时间有多久?

    • 病假和事假是分开的还是一起算?

    • 我可以提前使用假期时间吗?也就是说应休假期是负的?

    • 假期的更新策略是什么样的?也就是说未休的假期能否滚入下一周期

    • 照顾小孩的政策如何?

    • 无薪休假政策是什么样的?

    其他资源

    可以在 Joel Test 找到更多灵感:https://www.joelonsoftware.com/2000/08/09/the-joel-test-12-steps-to-better-code/

    -互动-

    那么,通常遇到这个问题,你都是如何回答的呢?

    欢迎评论区交流

    本文通过OpenWrite的免费Markdown转换工具发布

    -END-

    留言交流不过瘾

    关注我,回复“加群”加入各种主题讨论群

    640?wx_fmt=gif

    640?wx_fmt=gif

    朕已阅 640?

    展开全文
  • 移动端开发中,你在ios手机上的页面是否出现过文字大小显示不正确的情况? 博主碰到过两种这样的情况 第一种: 如果出现这种bug,先试试给body加max-height:99999px;min-height:1px; 参考链接:...
  • 今天碰到这样一个问题:  n对括号正确匹配组成的字符串数,例如 1对括号:() 1种可能 2对括号:()() 1种可能  3对括号:((())) ()(()) ()()() (())() (()())
  • 今天我们在这里谈的tag标签的正确使用方法,就属于网站聚合页面优化的范凑。 tag标签优化是一种非常常见的网站优化手段。 百度百科的解释是:TAG标签是一种由您自己定义的,比分类更准确、更具体,可以概括文章...
  • 一,部分背包问题的贪心算法 部分背包问题可以用贪心算法求解,且能够得到最优解。 贪心策略是什么呢?将物品按单位重量 所具有的价值排序。总是优先选择单位重量下价值最大的物品。 单位重量所具有的价值...
  • 传了一个订单数据到ES,ID长这样:2018041817382997796,结果传上去之后,用Kibana查出来之后,ES的ID"_id"是对的,就是2018041817382997796,...最终确定原因为Kibana显示数据的问题,增删改查都没有问题,ES也没...
  • 问题描述: 在用ElementUI做动态表单时,数据的修改都是打开dialog(子组件)中进行操作的,但是在修改数据时,正常来说可以直接调用 this.$refs[str].resetFields() 直接清空,但是这里会出现一个问题: **form...
  • 笔者用过的网络系统和软件数量并不够多,有些的bug发现了也没能及时保留下来,还有些bug属于无关痛痒的,下面只是一些保留下来的问题,并且代表着一些漏洞或者风险的bug。 2. 12306 2.1 改签票款计算错误 先从最...
  • DSP连接不上CCS3.3的问题讨论

    千次阅读 2014-07-06 16:58:42
    请确保仿真器是好的(换块好的DSP板试试),不过一般不会倒霉到是这种问题吧(一个仿真器好贵呢) 检查JTAG接口的EMU0与EMU1是否有上拉电阻,NC管脚应该保持悬空 检查PLL滤波管脚是否正确,滤波器是否焊接好 我就有...
  • 关于头文件是否参与编译的讨论

    千次阅读 2015-08-01 12:23:59
    一、文章来由写项目的时候发现了这个问题,又是一个比较底层的问题,首先说明,这篇文章只是我根据查阅的资料和做的实验提出的一个讨论,并不一定就是正确答案。因为这个问题网上众说纷纭,我很欢迎大家参与这个讨论...
  • Spring环境中正确关闭线程池的姿势

    千次阅读 2020-07-19 10:58:32
    在这一节,先不讨论应用中线程池该如何优雅关闭以达到优雅停机的效果,只是简单介绍一下线程池正确关闭的姿势 为简化讨论的复杂性,本文的线程池均是指JDK中的java.util.concurrent.ThreadPoolExecutor 正确关闭...
  • 分析wireshark中无法正确显示字符的原因
  • 本技术博客的目的是想对2048涉及到相关的所有问题进行细致的分析与讨论,得到一些大家能够接受并且理解的结果。在这基础上,扩展2048的游戏性,使其变得更好玩,更有意思,更有耐玩性。本技术博客涵盖了有关2048的...
  • 看上去一个很简单的问题,结果却不是想象中的那样。良好的编码习惯是多么的重要啊。原文地址:http://topic.csdn.net/u/20080825/18/34F53E23-ECBC-4A91-B8B5-8C7F2A07F50A.html测试的代码如下:public class ...
  • Android WebView安全讨论

    千次阅读 2014-08-11 14:16:19
    正确的对待WebView的安全问题。我提出的解决方式也许不是最好的,可能还会有很多其他的更好的解决方案,我在这里也仅仅是抛砖引玉,希望大家能提出更好的解决方案出来,能让大家在讨论中都能获益。 下面我先抛出...
  • 分类问题的性能度量
  • httpSession的正确理解

    万次阅读 多人点赞 2018-09-06 09:47:51
    关于HttpSession的误解实在是太多了,本来是一个很简单的问题,怎会搞的如此的复杂呢?下面说说我的理解吧: 一个session就是一系列某用户和服务器间的通讯。服务器有能力分辨出不同的用户。一个session的建立是从...
  • (异常来自 HRESULT:0x8007000B)”的错误,在查阅相关资料后才知道,这个是项目所使用的目标平台问题,也就是anycpu的问题,64位应用调用32位的问题; 方法:鼠标右击项目—属性—生成—目标平台,将anycpu改为x64...
  • FPGA笔记(十)-正确初始化的重要性

    千次阅读 2016-07-14 21:40:02
    寄存器正确初始化——>reg [5:0] addresss=5'd1;//定义寄存器时就赋初值,initial块(用于Testbench)在.v文件是不可综合的 一个仿真的经验——>如果是posedge CLK触发的话,testbench里初始化CLK=1'b0;(这样看得更...
  • Java单例模式的正确实现

    万次阅读 多人点赞 2018-03-07 22:14:16
    Java单例模式 单例的好处 单例模式适合于应用中频繁创建的对象,如果是重量级的对象,更应该使用单例模式。...本文会一步一步由浅入深的讨论如何实现正确的单例模式。 单例模式的一般写法 饿汉式 public ...
  • NSMutableArray的正确使用

    千次阅读 2011-09-28 23:07:37
    iPhone程序开发中的内存泄漏问题是新手非常头痛的事情,可能是用C#这类自动垃圾释放的语言太习惯了,用xcode中的profile工具查了一下我写的小程序,内存泄漏了一大堆,经过一阵子排查,在NSMutableArray中添加对象后...
  • 关于BatchNorm的理解与讨论

    万次阅读 2018-07-27 21:31:48
    对于深度学习这种包含很多隐层的网络结构,在训练过程中,因为各层参数老在变,所以每个隐层都会面临covariate shift的问题,也就是在训练过程中,隐层的输入分布老是变来变去,这就是所谓的“Internal Covariate ...
  • MOS管的正确用法

    万次阅读 2018-11-06 10:19:03
    1 三极管和MOS管的基本特性三极管是电流控制电流器件,用基极电流的变化控制集电极电流的变化。有NPN型三极管和PNP型...有P沟道MOS管(简称PMOS)和N沟道MOS管(简称NMOS),符号如下(此处只讨论常用的增强型MOS...
  • Java正确处理InterruptedException的方法

    万次阅读 多人点赞 2011-09-23 18:13:50
    要想讨论正确处理InterrupedtException的方法,就要知道InterruptedException是什么。 根据Java Doc的定义 Thrown when a thread is waiting, sleeping, or otherwise occupied, and the thread is ...
  • 三、多选式无领导小组讨论题目  多选式题目是让考生在多种备选答案中选择其中有效的几种或对备选答案的重要性进行排序。这种问题主要考查考生分析问题、抓住问题本质等方面的能力。多选式题目往往没有一个确定的...
  • 如何正确的关闭线程池?

    万次阅读 2019-07-30 15:31:46
    本文更多要讨论的是当线程池调用shutdown方法后,会经历些什么?思考一下几个问题: 是否可以继续接受新任务?继续提交新任务会怎样? 等待队列里的任务是否还会执行? 正在执行的任务是否会立即中断? ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 492,270
精华内容 196,908
关键字:

如何正确的讨论问题