精华内容
下载资源
问答
  • 跨越鸿沟:计算机视觉-学术界工业界的GAP有多大?
    千次阅读
    2020-08-25 09:23:53

    2020年7月31日,由中国图象图形学学会主办、视觉大数据专委会承办,北京智源人工智能研究院和美团协办的ECCV 2020中国预会议成功举办。本次ECCV预会议秉承传统,组织了圆桌论坛,邀请来自工业界、学术界大咖,他们围绕“计算机视觉:学术界与工业界GAP有多大”这个主题谈及了各自的理解并分享了一些精彩观点。

    圆桌论坛由中科院自动化所的董晶博士主持,Wormpex AI Research 副总裁兼首席科学家华刚博士、华为云首席科学家田奇博士、微软亚洲研究院资深研究员王井东博士、美团AI平台视觉中心负责人魏晓林博士以及上海交通大学的熊红凯教授同框在线进行话题讨论。

    https://u.wechat.com/MEEasuYKkh9K_ixyKao-z3Y (二维码自动识别)

    上图左列由上至下为董晶、田奇、魏晓林,右列由上至下为华刚、王井东、熊红凯

    各位学者、大咖针对工业界与学术界在计算机视觉领域的研究生培养、人才吸引力法则与跨界合作研究的优劣势等热点话题展开激烈讨论,他们还对目前工业界与学术界对计算机视觉领域学术前沿探索与产品应用落地间存在的鸿沟,以及相互间人才流动的现实状况进行了深入的分析与交流,最后对未来计算机视觉的研究热点和热门行业也做出了积极的预测。

    精选观点

    我们精选了圆桌论坛中10条专家观点,大家可以先睹为快:

    • 在学术界的研究生需要有一种哲学的思辨能力。
    • 对于做研究的人来讲,写作这个事情可能对你一生来讲都是非常有帮助的。
    • 学生需要有“T型”的知识架构,不仅要在某个领域研究得深,而且还要有知识的广度。
    • 那些真正能做产品的人才,能够从客户的角度,去发现社会和用户需要什么。对待新的研究方向也有很好的敏感性。
    • 工业界跟学术界往往是一个Mix,工业界和学术界的紧密结合是一个双赢的局面。
    • 可能工业界像是“市场经济”,学术界可以说一定程度上是更偏向于“计划经济”。
    • 学术界和工业界之间的GAP就是从基础研究到落地,我们称为“使用鸿沟”。核心就是说,一般我们讲的学术界是从0到1,而工业界是从1到n。那么,怎么把“0到1”和“1到n”衔接到一起,就怎么缩短这样的“使用鸿沟”。
    • 在学术界,你的论文发表了之后,研究就结束了。但在工业界是不一样的,论文发表可能意味这个工作才刚刚开始,后面还有很长的路要走,还要把技术经过一些改进,使它能够成熟到去支持业务的落地。
    • 计算机视觉的发展趋势预测:深度学习与计算机视觉结合的可解释性、安全性、鲁棒性、透明性;小样本训练、自监督学习、知识图谱、模型压缩;数据高效、软硬结合。
    • 计算机视觉应用的行业机会可能存在于以下几个领域:安防、无人驾驶、线下零售。

    本次圆桌论坛完整视频观看入口:

    https://www.bilibili.com/video/BV17a4y177Mf/

    文字实录

    以下系对Panel讨论环节的文字实录,希望能对大家有所帮助或者启发。

    计算机视觉领域的应用型/学术型人才培养方面的现状和问题

    董晶:大家都知道,本次ECCV预会议面向很多计算机视觉领域的研究生,包括硕士和博士,他们在面临就业的时候,在工业界和学术界的一些优劣势是什么?此外,从各位老师的角度来看,你们更看重这些毕业生的哪些能力?他们应该在读书深造期间具备什么样的能力?或者说对这些研究生应该往哪些方向进行发展和培养?

    熊红凯:工业界的话,相信其他几位老师比我更有经验。我就谈谈我在学术界的一些体会。以前我对计算机视觉是有一定偏见的,因为计算机视觉当时的目标是让计算机像人一样具有视觉的观感。小时候看书,说我们人类面临三个世界,一个是虚拟的意识世界,另一个是现实的物理世界,第三个是真理世界,也就是数学世界。过去我们做学术其实更多的是面向数学世界,去寻找和发现这个世界上所存在的真理和规律。后来计算机视觉打开了这个窗口,我感觉计算机视觉实际上是在把人的意识世界和现实物理世界做了某种关联。

    从这个角度来讲,我觉得学术研究现在存在一个分歧,是应该更多的去面对真理和规律,还是说只去做现实世界与虚拟世界的一种关联。当然,我们可以比较客观地说,计算机视觉是让计算机去创造一种新的物种,像人一样具有可辨识、可观察的能力。但是,有一些理性的人也会认为,计算机视觉更多的还是一种麻痹人自身的娱乐方式。我原来对计算机视觉的偏见可能就是来自这方面。

    但是今天,我们可以看到现代生活方式的变化已经不可逆转了。计算机视觉技术已经延伸到很多客观的方面,而并不仅仅在于娱乐或者是消费的方面。因此,我觉得学术界和工业界就会慢慢地有一些融合,因为工业界毕竟更多的重心还是在于应用和市场的开拓;而在学术界,现在慢慢从原来的真理探索开始向人类领域进行拓展,也在与工业界找到一些共通点。

    我觉得计算机视觉方向的研究生,既然做研究,必然面临这些方面的思考,就是你做的东西到底有什么用?并不仅仅只是体现在经济效益上。所以我认为,在学术界的毕业生需要有一种哲学的思辨能力,而并不仅仅是做一种技术的应用,也并不仅仅是提高一些效率。我觉得学术型人才必须找到一些能够打动他自己的、确实存在的规律和真理,而不仅仅是把现实和虚拟做一些简单的融合。

    董晶:我觉得熊老师现在对我们计算机视觉领域研究生提出了一个更高的要求,不仅要求他们的动手实践能力、编程能力要过关,还要在发现规律、总结规律这方面上升到一个哲学的高度。感谢熊老师的发言,那王老师对此怎么看呢?

    王井东:我虽然是来自于工业界,其实更多的还是偏学术界一点。刚刚熊老师讲的高度非常高,我就讲一讲我在我们这边带实习生十几年的一些感受和心得。

    微软亚洲研究院前院长沈向洋博士也是我当时在研究院实习时候的Mentor,曾经提到过“三好学生”,就是数学要好,编程要好,最后一个态度要好。首先想做学术研究,也包括做工业界的其他工作,态度是第一重要的。没有好的态度,光有好的基础,那是不够的。目前,特别是2012年以来,很多读硕士和博士的学生觉得数学不重要,只要会调参就可以了。但大家今后走向工作岗位,可能就会发现,光会调参是不够的,是没有优势的,因为调参每个人都会,所以数学还是很重要的。其次是编程,我们是做计算机科学方向的,编程自然非常重要。

    除了上面这三个方面,从我过去的很多经历,包括跟学生的交流以及跟学生合作做研究的经历,我觉得还有一点非常重要,就是交流。Communication这个词其实很泛,不仅仅是说口头交流,对我们做研究的人来讲,还有写作,比如写论文,也是很重要的。

    交流是除了上述三个方面以外最为关键的一点,因为我们做研究很难是一个人独立去做研究,往往需要跟很多人去合作。在合作的时候,比如说带实习生或学生合作的时候,往往会出现这样的问题,我们和学生讨论一些问题,那我们讨论的东西跟学生最终接受的东西,都是一样的吗?其实,不见得是一样的。那么,怎样保证你这些讨论能够达成一个共识,交流(写作)就会变得很重要。

    从我的经验来讲,往往建议研究生多写作。写作不是就要写论文,其实平时的交流也要写出来。如果你写作很好,那么别人看你的东西就知道你是怎么想的,而不像口头交流会产生很多意思不到位的状况。

    写作,对我们的帮助,不仅仅包括我们刚刚提到的idea层次上的,其实还包括对我们对自己的规划。不仅仅对做研究有帮助,对将来的工作也是非常重要的,比如说对很多学校的老师做Proposal也很重要。以前华刚老师在我们这边,我们也在一起讨论这个事情,我们在公司做研究,缺少一个写Proposal的过程,而这个事情我觉得现在越来越重要。这是从大的角度来讲,Proposal就是帮你规划将来的几年你打算怎么去做,对这个领域怎么去了解。

    可能大家会想,这些事情我天天都在思考,那这个问题我还能不了解吗?但是当你真正把这些问题写出来的时候,你就会发现(写出来与想法)之间的差距还是非常大的,而你写出来之后带来的好处也非常多。所以说,对于这些研究生不仅仅是在读的,包括马上要工作的,不管是学术界的还是工业界的,我觉得写作这个事情可能对你一生来讲都是非常有帮助的。

    董晶:井东老师对学生的笔杆子要求非常高,他们得把自己的想法写出来,这样才能被认可,才能被更多的人看到。

    田奇:大家知道,我本身是在学术界待了很多年,其实现在跟学术界联系也非常紧密,我做了17年老师,这两年在公司也是从事一些研究到行业落地的工作。从我的角度来回答这个问题,就是说看一看学术界和工业界需要什么样的人才。如果你具备这样的一些素质的话,那你就有一些优势,如果不足的话,可能就要弥补一下。学术界大家讲的比较多了,讲的就是源头研究、基础研究,主要研究的就是技术创新等等。那么从工业界角度来讲的话,我以前也做过一些类似的报告,所以总结了几点:

    • 第一点,从工业界来讲的话,我们可能需要这些学生专精一个领域,并且在这个领域中有一定深度的专业认识、专业技能和创造力。
    • 第二点,其实井东老师也提到了,就是要有沟通合作的能力,同时要有多领域理解的能力,就是我们常说的具备“T型”的知识架构,不仅要在这个领域研究得深,而且还要有知识的广度。
    • 第三点,从我们现在的一些行业应用来讲的话,要有一些真正能做产品的人才,能够从客户的角度,去发现社会和用户需要什么,能从应用场景去思考计算机视觉能够做什么,以此来激发一些更新的研究。
    • 第四点,是希望学生能够对待新的研究方向有很好的敏感性,包括对研究方向的发展、新的场景以及应用。
    • 最后还有一点,我们工业界也是需要一些有崇高理想境界的人才,毕竟AI还是以人为本,那么我们应该为人们的一些基础文化需求去服务,使AI能够更好地帮助这个社会,服务于更多的客户。

    这就是现在我站在工业界角度分享的对学生需求的一些理解。

    董晶:我觉得田老师其实还表达了一个观点是,我们的学生也是要因材施教、物尽其用,咱们有什么能力都可以发挥出来,其实在工业界、学术界都是能找到“闪光点”的。

    如何看待产业界和学术界参加国际顶会发表科研成果的热度

    董晶:今年ECCV 2020接收了1400篇文章,其中Oral(口头发表)只有104篇,而这些文章很多都是工业界和学术界联合发表的。那么,各位老师是怎么看待产业界和学术界联合参加国际顶会发表科研成果的热度的?今年ECCV来自工业界和学术界的大量联合投稿,是否也体现和反映计算机视觉领域在工业界和学术界越来越紧密的结合?工业界和学术界是否存在鸿沟?我们从有用的技术和有趣的研究两个角度出发,讨论怎样能够更好的帮助大家特别是年轻人发展。

    华刚:热度的存在是一个客观现象,存在即合理,我们也希望这个趋势能够一直紧密的保持下去。

    现在的热度,从方法论来讲的话,尽管有很多计算机视觉的研究员不愿意去承认这个事实,其实计算机视觉在被深度学习所主导,而深度学习的一个局限性就是需要大量的数据,这种数据学术界在实验室中是很难批量产生的。另外,计算机视觉从某种程度上来讲和应用结合的也比较紧密。

    从数据的角度来讲,工业界和学术界结合,学术界的得益之处在于,可以通过学生到公司去实习,或者是说有一些联合的项目能够获取(工业界的)数据。那从这个角度来讲的话,二者结合能推动这个领域的前进。

    从工业界的角度来看,过去PhD的培养本身是为学术界培养的,大部分博士毕业生都会去做教授。现在发展到今天,我们各个领域都有“通货膨胀”,其实高校的位置也就这么多,那就产生了一种职业,一批能做研究的博士也在工业界工作。

    所以,我在这里要给大家讲一个观点,其实我一直在思考这个问题,对于一个在工业界工作的人,他的工作和他的Career是不是应该分开来看待。

    井东老师刚才说他在工业界工作,其实是学术界的,我不认可这个观点。你就是工业界的人,只是说你作为一名研究员,你有一个学术界的属性,就是你在不同的时间戴了不同的“帽子”。从这个角度来讲的话,因为工业界有这么一群研究员,也是非常优秀的研究员,他的研究因为要平衡两个方面,一方面他要为公司的业务服务,就是为商业服务,往往他自己的精力就会更多的聚焦在短期要产出成果,但是他自己还能够通过跟高校合作来持续一些更长期、更加探索性的研究。这是非常有价值的。

    我觉得这从两方面的意义来看,它是一个双赢的情况,所以我并不觉得工业界跟学术界有多大的鸿沟,包括从有用的技术和有趣的研究来讲,当计算机视觉这个领域发展到今天,其实很难去区分是不是学术界的人就是高校老师和学生在做有趣的研究,而工业界的研究员只是在做有用的技术,它往往是一个Mix。这是我的一个观点,我是希望这个热度能够一直保持下去,因为这会是一个双赢的局面。

    魏晓林:我们现在是否有鸿沟,然后何去何从?我觉得计算机视觉这个方向总体上工业界跟学术界之间的GAP是变得越来越小了,这也是大家有目共睹的。GAP在逐渐变小,对工业界来说是有直接益处的,无论是研发人员的招聘还是技术的快速落地,越来越多的公司受益匪浅。

    那为什么GAP会小?首先当然是因为深度学习发展的影响。目前,工业界在应用场景、大规模数据、计算算力上,对于深度学习的研发范式都提供了极大的支持,而这些场景和资源在学术界是比较难接触到的。比如,现在很多论文,特别是国外的Google、Facebook的论文动辄就是上亿体量的大规模的数据和上千张GPU联合训练,这在学术界是吃不消的。

    另外一个原因是,越来越多计算机视觉的高层次研究员和教授加入到了工业界中,人的流动也缩小了学术界和工业界的GAP。还有一个现象是,工业界最近几年大量招收计算机视觉领域的实习生做项目和发论文,有的部门和公司的实习生比全职员工还多,这是一个“三赢”的局面,同时实习生也加速了工业界和学术界的紧密结合

    我觉得从现在来看,GAP小是非常好的,我们不希望工业界和学术界有明显断档的。但是从未来的角度来讲,我倒是觉得,可能有些时候我们的GAP还可以更大一点

    我觉得还是要回到这个事情的本质上来说,我们要看学术界和工业界最终的目的是什么?我们打个比方说的话,可能工业界它是个“市场经济”,更偏向于通过市场驱动、用户驱动来一步步反推,反推出我们需要做什么样的研究。学术界可以说一定程度上是更偏向于“计划经济”,由政府来分配顶层领域的资源,助力并规划长期的发展。

    所以从这种角度来讲,我其实希望学术界投入到基础研究上的精力可以更多一点,可以想得和做得更远一点。这样的话,对于未来,比如再往后看5年10年20年,其实这种推动力可以更加好地持续下去。所以我感觉现在GAP小是好事,长期来看GAP大些也是好事。

    工业界与学术界对顶刊顶会论文的重视程度

    董晶:希望各位老师谈谈目前工业界与学术界对顶会顶刊论文的重视程度,是不是人才引进的判断标准?以及工业界和学术界对科研人才的吸引力法则,是什么原因让科研人才能够在学术界和工业界来去自如?

    华刚:首先,我不愿意把工业界与学术界之间称为GAP。我希望大家理解一点,其实在研究跟开发以及技术应用到实际的场景中间,有一个大的循环。在一个初创性技术的开始,你希望自己的研究跟开发过程能有一个阶段性的分离,你希望把做这个基础研究的人保护起来,让他有一个干净的环境去做研究。

    如果把研究跟论文发表联系起来就是说,研究做到一定程度,就一定要把它发表出来。如果说这个研究是自由形式的话,就可以发表到顶会顶刊上去。我要讲的学术界跟工业界的第一个区别就是,在学术界,你的论文发表了之后,研究就结束了。但在工业界是不一样的,论文发表可能意味这个工作才刚刚开始,后面还有很长的路要走,还要把技术经过一些改进,使它能够成熟到去支持业务的落地。

    我把学术界定义成高校,其实学术共同体是一个很大的范畴,它并不只是包含高校的老师和学生,至于说科研人才在学术界和工业界来去自如,我觉得那是每个人自己职业上的选择,没有特别多可以评论的。很多人可能会有“水土不服”的现象,只是说你在哪个行当你要去做哪个行当的事情,我觉得大家都应该用心去做。

    至于说工业界对学术领会期刊的重视程度,其实你为论文本身做了什么研究工作,可能在找工作的阶段并不是那么重要,它更多是一个记录,说明你的思维有逻辑性,你对自己的思维能够有一个组织性。

    而我们在评判面试候选人的时候,如果你有这些论文可以加分,但可能只是在初始“敲门砖”的阶段,你可能更容易吸引到面试官的眼球。实际上,我的每个应聘者我都会自己去聊一下,看他究竟写了几篇论文,里面有多少思想是他自己的,他自己有没有形成一个成熟的逻辑体系。我觉得这是去看人才是不是优秀的几个标准之一。

    刚才各位老师也提到很多,更看重人才的一些基本技能,我觉得这些都是我们会去考察的各个方面。但是我觉得最重要的是,在工业界需要的人才都要有一些能够解决问题的真正技能。因为在工业界有很多应用场景的问题,其实还是需要你追着问题然后去解决问题,在这个过程中建立你自己的技术(壁垒)

    田奇:我觉得工业界和学术界其实核心都是人才,我们都需要理论扎实,工作能力强,善于合作,善于创新的优秀的科研人才。同时也存在一些差异,之前也讨论过,学术界更希望是能够把实践升华到一种理论的人才。工业界来讲的话,其实是“不管黑猫白猫,抓到老鼠是好猫”,更看重解决问题的能力。

    刚才提到对于顶会顶刊的重视程度,实际上我们现在研究院,还是会更偏重一些顶会,像CVPR、ECCV、ICCV等,这个跟学术界的重视程度都差不多。如果说对人才吸纳来讲的话,那么我们更可能关注以下几点:比如说作者是不是第一作者,是不是原创者,对开源有没有一些贡献;在一些AI的比赛中,是不是能展现很强的研究能力以及工程开发能力;是否参加非常丰富多彩的课外活动,能够对知识面的广度有一个提升。

    还有一个就是学术界和工业界实际上是“复古”的,现在在华为经常说的有一句话“向上突破天”,其实就是谈你的创新能力要强,另外一句是“向下扎到根”,就是说我们要贴近行业。

    从这种角度来讲的话,学术界和工业界之间的GAP就是从基础研究到落地,我们称为“使用鸿沟”。核心就是说,一般我们讲的学术界是从0到1,工业界是从1到n。怎么把“0到1”和“1到n”衔接到一起,就怎样缩短这些“使用鸿沟”,其实就是说研究到落地中间的一个沉淀过程。

    最后说一下,学术界和工业界上是一个循环,就像华刚说的,其实学术界为工业界输送了不少人才,但是也有很多工业界的人才慢慢的回流到学术界了,这样就带来一些新的机会,这样的话就叫互补互益、齐头并进。

    魏晓林:关于顶刊顶会,我觉得可以从两个方面来说,首先说顶刊顶会是到工业界入门的门槛。其实很有意思,大家多少年了一直在说,我们不应该过于重视论文数量这些事情,我们要去追求事情的本质,技术研发要在纯净的环境里做真正有意义的长期研究。

    但是这个事情感觉现在来说还是个跳不出来的“死循环”,大家无论是在学术界还是在工业界,其实对待论文就变成了一个新的“高考”,它是一个“开卷考试”,刚才各位老师说的能力,其实在一定程度上都在开卷考试当中有一个很好的体现

    所以在入门的时候,我们确实看论文,看你的发表论文的数量、质量,包括到底是不是你自己的想法,这些东西我们都非常看重。但是,另一层面我们同时也会像一个“艺术考试”一样,既有这种试卷考试也有面试,面试在其中也起到非常重要的作用,去真正探究这个同学的素质和能力。

    第二个方面是说,在公司内部我们是否重视顶刊顶会这个事情,实际上我们是反推的,就是我们还是要从市场来反推到底我们需要什么样的技术,技术在落地的时候可能就会有一些副产品,有一些产出,那我们就顺便就写成论文投稿,至少在美团是这样,因为我们的KPI确实不看顶会顶刊论文的数量。

    另外,其实当我们在说工业界、学术界的时候,有一个很有意思的现象是“学术界”可能只有几个学术界,比如:国内的学术界和国外的学术界,而“工业界”其实是有n个工业界,每一个公司都是一个工业界,每一个公司它的市场所面对的用户都是不一样的,所以它的“工业界”所代表的背后的含义也是不一样的。

    熊红凯:我觉得原来传统学术界,上个世纪五六十年代的时候,那个时候的其实并不注重顶会顶刊。我记得他们当时跟我讲说一个前辈哈佛大学毕业,其实没发表任何论文,最后就当上助理教授了。

    今天我们总喜欢讲学顶会顶刊,我觉得这实际上是一个“偷懒”的想法,因为我们不愿意去评判一个人的学术能力,或者说我们无法快速地评判一个人的学术能力。就是像今天我们孩子的教育一样,就是希望通过一个证书来做评判,而不愿意从他的实质思想和内容上去做评判,或者说也不愿意花很多的时间去培养他、观察他。

    我觉得其实不管是工业界还是学术界都面临这样一个问题,就是“快餐文化”,总是希望通过一些证书或者其他的证明来短平快地处理一些事情。现在我们带研究生包括招聘老师都是这样,我相信工业界招聘员工可能也会用这样的一种方式。

    然后现在“推陈出新”了,根据顶会顶刊的论文接收率来确定它到底是怎样一个顶会,怎样一个顶刊,最后来做一个判断。其实这里面也良莠不齐,我觉得很难根据这个来真正客观地做出评判。这就跟高考一样,我们选拔出了一些优秀的人才,但同时也丧失了一些优秀的人才,所以这个很难讲。

    其实在学术界,很多学者也还是希望能够用传统的方式,最好是能更多地从这个人的思想来做一个判断,是否愿意聘用他或者是给他这样一个发展的周期。

    当然前面井东老师提到的写作能力、表达能力可能也是一个关键因素。这个方面我其实对工业界确实没有太大的发言权,但是在学术界如果真的希望做一些学术探索,或者是做一些精知识的总结、规律的发现的话,还是需要有更多的具有独立思想,并且愿意做探索的、不是过于快速的去做一些短平快的研究的人才。我觉得这样可能是更长远的一个培养方式。

    王井东:刚才王亮老师(CSIG视觉大数据专委会主任)说我是学术界的,华刚老师好像不完全同意。其实这个事情是好事情,大家今天对学术界工业界区分的没有那么的清楚,比如说田奇老师从学校到公司,华刚老师也是从学校到公司,都是游刃有余。十年前我们做计算机视觉研究的人,其实很多研究生博士毕业以后发现工作了之后不做这个方向,或者说在这个方向很难找到理想的职位,今天来讲这个事情好像就不存在,这是非常好的一件事情。对于科研人员来讲,因为现在在工业界,其实很多需要研究的地方,不像以前一样毕业之后的情况,这是很好的一件事情,这也是为什么我们能够自由切换。

    所以说我还是鼓励大家,咱们(工业界)在计算机视觉领域还是要去做研究的,特别是有了深度学习以后,咱们在工业界去做一些项目的时候,如果说你仅仅是说像以前把工业界学术界的定义分的那么清楚,工业界就简单的实现,今天可能抱着这样一个理念去做工业界的工作的时候,你可能也很难做得非常好。

    计算机视觉的发展趋势及研究热点预测

    董晶:最后一个话题,我们想请各位老师分别讲一下自己对计算机视觉领域发展方向的一些预测或者看法。王井东:我就先讲一讲研究热点。尽管计算机视觉领域里很多研究人员不承认这件事情,现在深度学习还是成为了计算机视觉里面主导的方法。深度学习在计算机视觉里面有很多缺点,比如说不可解释性、安全性等等。所以说,深度学习在计算机视觉领域未来怎么跟推理结合起来,可能成为一个研究的热点,也是很多工业界落地需要去解决的问题,如安全性、透明性、可解释性等。

    华刚:首先,我觉得计算机视觉最有可能在产业上繁荣的三个领域,第一个是安防大家已经看到了,包括城市互联网、城市大脑这些都可以归于安防的范畴,应用前景特别是在中国的市场也是显而易见的。第二个领域,我还是对计算机视觉在无人驾驶这个领域是相当看好的。第三个其实很多人还没有注意到的,我觉得线下零售会有一个突破,这个行业的突破可能会发生在行业内部,就是说要深入到行业中去。这个在目前的阶段来看还是比较困难的,主要是因为技术还没到那个程度,还需要很多投资去打破这个瓶颈。以上这三个行业我认为是比较有希望的。

    下一个阶段计算机视觉的研究热点,我觉得有两个趋势,首先大家会越来越看到深度学习和计算机视觉领域一些知识结合得更好,结合起来之后就会产生更好、更可解释、更鲁棒的一些模型。

    另外,大家如果注意到的,就是目前包括CVPR也好,ECCV也好,投稿论文的主题比例的话,就会发现大家其实也在注意到怎么利用小数据去训练模型,能够达到一个很好计算机视觉的模型,我觉得大家在这一块会持续投入一段时间。当然研究热点总是很难预测的,因为它总是一个量变到一定的阶段,才会有一个质变,就是说某个方法某一个点可能会突然热起来,这是不可预测的。

    田奇:总的来讲,包括整个AI的发展趋势聊得比较多的就是一些自主自治、资源高效、安全可信。具体一点来说,我认为在计算机视觉领域所有的问题还是总结到数据、模型和知识的提取。

    从数据层面来讲,我们会聚焦在数据高效,因为深度学习需要大量的数据标注,将来我们怎么把数据的利用率高效做得更好,把数据深层的质量做的更好。从模型来讲,除了性能,我们还要考虑到一些具体的限制和功耗时延,这是设计成本。

    我们的一个发展趋势是把软硬件的结合,同时因为计算机视觉是一种使用技术,所以硬件厂商和AI算法厂商将来怎么样来进行协同。从单点的技术方向来讲的话,比如说针对这种数据高效的话,将来无监督学习、AutoML、边缘计算、知识蒸馏、模型迁移,这些都是比较好的研究热点。

    魏晓林:从研究领域来说,很多老师刚才都提到了很多不同的领域。我们在思考未来发展趋势这个事情的时候,背后有个大逻辑,就是我们更加关注新的开发范式和研发范式的变化

    深度学习是一个新的、完全颠覆了原来软件系统研发流程的范式,在这个大的范畴下面,其实有一些新的子范式可能会很快出现。比如说,小样本模型虽然还没有应用的非常广,它起到的作用是加快迭代速度、降低计算成本;像自监督学习,减少了人力标注成本和时间,可以利用到更广泛的数据;AutoML可以减少人工研发的人工成本;像多模态学习、视觉跟知识图谱的结合等,长期甚至可能影响到AI部门的组织形式。另外,我们也十分关注更”便宜“的AI,比如说模型压缩、端侧推理带来成本上的节省。

    从应用层面来讲的话,我们更加关注的就是刚才华老师讲的像新零售,也包括美团在做的无人配送,这些都是可以颠覆行业的落地场景。

    熊红凯:现在大家经常说人工智能是不是可以完全从数据中来,那么这个也就是说大的范式是从“类脑科学”开始,大家都是从类脑当中去看人是怎么思想的,或者干脆就从研究者的本身看研究者的本身是什么思想。我看到现在“神经计算”开始比较热,这属于研究人的思想,我对这个其实是持保留意见的,因为这个可能会对人本身产生一种负面的效果。

    此外,我觉得从人本身的才能上来讲,人更多的是一种把意识世界和现实物理世界进行融合的个体,但是计算机世界最后可能就“合二为一”了,也就是大家也不可能区分到底什么是虚拟,什么是真实的。就像美国影片《西部世界》一样,可能最后的一种需求就在于享受一种“虚拟”的生活,这种生活就是说我可以就把我的生活贯穿在这个世界中,最后就开始享受这种生活。

    我觉得计算机视觉如果从商业最后的发展趋势,或者从资本的角度来讲,可能最后将变成这样,最后跟图形、游戏,跟所有的现实生活融二为一,这可能会是将来。但是,这肯定也存在“两面性”。

    董晶:再次感谢各位老师的分享。如果对今天这个议题做一个小结的话,我们主要讨论了学术界跟工业界的GAP,其实是一枚硬币的两个方向,就像我们男人跟女人一样,大家各有所长,优势互补,而且还要不断的沟通,才能够将互补的优势发挥出来,这样才能够共造一个非常和谐、非常美好的未来。

    http://weixin.qq.com/r/9HVSSg3EOFBHrUkp9yDm (二维码自动识别)

     

     

    发布于 08-20

    更多相关内容
  • 链接:https://www.zhihu.com/question/23057324编辑:深度学习与计算机视觉声明:仅做学术分享,侵删问题:经常在网上看到人说学术界收入低,还很累什么的。...

    链接:https://www.zhihu.com/question/23057324

    编辑:深度学习与计算机视觉

    声明:仅做学术分享,侵删

    问题:

    经常在网上看到人说学术界收入低,还很累什么的。可是我们系的老师,我感觉老老实实搞理论的,年入10W也不是事;出去工作的师兄/姐很多也就10W一点。为什么还会有科研穷三代的说法?

    作者:Feitong Yang
    https://www.zhihu.com/question/23057324/answer/163051092

    这个东西还是要多方面看待的,国内的情况不是很清楚。我说点我了解的。

    一方面,AP这样的职位给的不多。在我们领域,可能80k左右不错了。当然某些商学院之类的起薪就是100+k还有bonus,我就不说了(专业没选好没办法)。但是总体来说,慢慢会长,比如我们这里的full professor也是200k到300k一年。当然,要从AP到full professor,这个就看你打拼了。

    教职有些福利还是不要忘了。比如一些学校,如果教职工孩子在本校就读,学校是直接给教职工的孩子免学费。我们学校是教职工孩子不管在哪个学校读书,学校帮忙付一半的学费。如果夫妻双方都在我们学校,那小孩的学费就免掉了。在美国,本科一年学费50-60k是很正常的。很多学生和家庭都是自己贷款读书。这一部分福利还是不容小视的。

    其他的福利我觉得应该也有,但是具体我就不是特别清楚了。

    另一方面去业界,如果找到好工作,湾去和纽约码农/数据科学家最近都长得挺多的,120k以上起步吧。不过感觉扣税之后差距不是很明显。当然,如果bonus也算上,业界还是能拿到很体面的工资的。如果能去华尔街之类的地方,那的确应该赚挺多的。

    所以我觉得业界工作和教职工作差别不会特别大。不同档位的都有。不过平均起点的话业界应该搞一些。当然,现在要想当faculty,很多领域要做postdoc,一年大概40-50k。这相比起来就少了。如果你觉得没钱是个大问题,或者你真的觉得挣钱是一件表重要的事情,我觉得业界看起来是好一些。不过,真的做出了不错的研究,我觉得教职薪水也是不错的。很多人因为研究做得好,funding拿得多,很快拿到full professor了,而且还可以出现其他学校过来挖人,趁机要求学校涨工资的情况。

    最后…只要不把教职当作简单的上课教书,下课做研究就好了。每一个PI就是一个startup的founder。

    作者:匿名用户
    https://www.zhihu.com/question/23057324/answer/104829534

    必须匿名,工信部高校。
    一个老师,上课跟我们讲了点私密的事情,他今年35-40之间,是教授。
    项目金额不算多,一年300-500万。
    里面20%是规定可以拿的,剩下的可以搞多少就各显神通了。
    不缺勤,年底津贴10万。
    工资,那就是用来零花的。

    说完这些,他充满羡慕的补充了一句:(北京某高校,不妨猜猜)某教授一年项目2个多亿。

    所以,学术界叫导师老板,可不只是因为学生要打杂干活。

    作者:匿名用户
    https://www.zhihu.com/question/23057324/answer/164824503

    提供一个数据点,美国经济金融博士毕业后学界工业界收入差距不大。去学术界top50商院做金融或者会计教授200k-300k; 去好的hedge fund, 第一年all in compensation 也差不多这个数字。最后选哪个完全看个人兴趣和风险偏好。private sector收入上不封顶,还可以住在大城市,工卡要抽签,绿卡一般eb2。大多数好学校都在乡下, 生活成本不高,学校当教授工卡不抽签,商院一般愿意用eb1办绿卡。

    作者:Yuhang Liu
    https://www.zhihu.com/question/23057324/answer/104633737

    我在数学圈看到的情况是,应数硕士两年毕业做quant或者做cs相关的工作,找到8-10万刀以上的工作并不是很难。我见过最高的有14万底薪+4万奖金的起薪。这还是硕士。如果是应数PhD毕业的话,去业界最高的我听说有30万刀起薪的。

    上面说的数字都是宾大这个级别的学校的例子,如果是哈耶普麻的大神们去业界应该还能更高。

    学术界呢?PhD 5年每年2.5-3万刀奖学金(不过这个无所谓,反正很多PhD也不是要去学术界的)。

    如果继续做学术的话,博士后一轮2-3年 3-5万刀(什么?你说不想做博后?某IMO金牌告诉我不做博后直接拿ap在数学界得是菲奖级别的人)。

    假设你运气足够好,你做一轮博后就拿到了ap,那这个波动范围就比较大了,我猜7-12万都有可能?(不过ap后来的工资好像是可以涨的),那一轮ap大概7-9年,假设你运气仍然比较好,你ap转正了( ap转正也不是很简单,宾大数学系现在有5,6个ap,我觉得能有一个评上tenure就不错了),大概能有15万?(我觉得这还得是前20的好学校才能给tenure这么高的薪水。。)ok,现在你差不多也快40岁了。

    快40岁的时候(还是得在运气足够好、能顺利拿到博后和ap以及ap转正的情况下)拿的薪水可能还不如24岁硕士毕业生的起薪(而且金融行业涨薪快),这就是活生生的现实。

    所以吧,我觉得,对学术没太大兴趣,或者物质欲望很强烈的人,都不适合做学术。。(当然我这里说的是基础理科,别的学科比如商科之类的大概好很多吧)

    作者:周赛
    https://www.zhihu.com/question/23057324/answer/175063844

    说说国内。学术界前面若干年钱必然是少的,并且确实辛苦。互联网公司的码农搞996,高校年轻教师搞的是从起床到睡觉除了必要的生理活动之外几乎都在思考研究。(当然如果个人准备万年副教授的另当别论)

    区别在于到达职业天花板之后。通常这个年龄差不多是40岁。码农之所以说是年轻人的行业,是因为现在看来天花板来的比较早,差不多35岁就到天花板了。(这完全是因为加班加的多,用10年的时间走完了15年的路)这时候高校教授可以愉快的过寒暑假了,想多挣钱的可以通过积累的人脉挣一些钱,而且绝对不用担心失业。工业界的人们这时候开始进入中年危机,工作时间长度难以和年轻人抗衡,裁员的时候有风险,并且由于他们之前赚钱比较多所以消费比较高,比如说送子女出国留学之类的,这时候骑虎难下,只能硬着头皮拼命了。

    作者:Frank
    https://www.zhihu.com/question/23057324/answer/104789440

    分国内和国外。国内某985工科学校见到的是,工科老师一般都有很多项目,一年赚几百万似乎只是中等水平。接项目,开公司,挂职,合作,成立工作室,项目评审,公司顾问,疯狂压榨研究生,财源滚滚。公积金高。上等水平的老师公司一年千万有的已经上市,下等水平的至少车房无忧各若干套。国外老师项目少,近年国外老师纷纷跑国内拉项目已很常见。平台,专业很重要。


    作者:SimonLan

    https://www.zhihu.com/question/23057324/answer/174482856

    谈点粗浅的认识:无论学术界还是工业界,收入多的都是“混的好的”那些人。收入多少真的和学术还是工业关系不是很大。学术界和工业界都有屌丝和土豪。
    相对更能把握经济分配权利的、行动迅速的就能在你那个圈里收入更多一点。

    作者:匿名用户
    https://www.zhihu.com/question/23057324/answer/277397144

    说学术挣得少的,要么就是没读博的,要么就是在国外的吧。

    国内教授,工资那个叫吃饭钱,人家大头在项目,副教授教授的头衔是为了好干副业,而副业一年几百万几千万都不是问题。

    我学校教授工资全北京211最低,但人家五道口十几套房,你以为是存工资买下来的吗?

    国内有个词叫“灰色收入”,在被IT人看不上眼的传统领域里贯彻的淋漓尽致。

    每当看到学IT的在炫耀自己每个月几十K的工资我就想笑,你工资条上几十K就是你全部的收入,这些收入要供你全部的支出,有些人工资条上只有几K,但人家还有各种没写在工资条上的福利,是你用几十K都买不来的,还有更多收入,根本没办法拿出来说。

    一个帝都普通一本的老师,没啥学术能力,各种做项目开你们都看不上眼的破公司,一年就能挣你得存上几十年的钱,而人家住宿和吃饭学校作为福利给解决了,你还要和别人合租。

    一个二本毕业的在深山老林里搞工程的项目经理,每个月工资一万出头,好像很可怜,但你知道这一个项目他能给自己捞几百万吗?你知道他一家人包括老婆孩子和父母,衣食住行全能“合理”的放进项目支出,还能给全家人安排工作白拿工资吗?

    有些人哭穷是为了掩盖自己的灰色收入,就像清华的说自己是五道口男子技术学院的,你要真信了,那就真傻了。

    作者:匿名用户
    https://www.zhihu.com/question/23057324/answer/1052079277

    本人计算机专业,计算视觉方向。几进几出学界和工业界。背景大概就是北美前50的博士。

    读博士那会儿,一个月貌似$2200,在波士顿

    刚毕业,2012那会儿,我先进到某佛研究所做博后,大概一年$75K。同时找其他职位。

    几个月后,进到当地某上市公司,大概一年工资+奖金+股票,一年大概有个$110K出头一点。

    一年后,公司部门重组,我被告知半年内自谋出路。

    2014年初,我跳到西部某研究所,工资多了点,但是股票和奖金都变成了0,总体上看还少了一点,大概$105K的样子。

    做到2016年,内部升级成功,外加做PI的额外奖金,差不都能有$130K了。

    2018年夏,拿到纽约某公立学校和东部某小学校的发考题,结果么都是差不多$100K上下(当然,必须说明这是9个月的工资,额外的3个月,自己拿funding养自己,可以多发一些)。但是,怎么的也不可能超过$150K。

    几乎同时,拿到FLAG中某家研究院的科学家offer。一年工资+奖金+股票,总包$350K。我果断选择了工业界。

    今年,刚刚内部升级成功,具体能涨多少还不知道。


    我想上面的数字,$100K 比 $350K, 已经很能够说明问题了。

    从长期来看,这个对比会更加的明显。因为,即便你变成终身教职,也很难$200K,还要其他额外的title才有可能。而做企业的科学家,每提升一个大级别,涨20%是绝对不算多的。而且公司的股票收入很难完全算清楚。呵呵,偶周围有的科学家,进来的早,股票只有如今价格的1/4。几乎可以说早就实现了财务自由。

    当然,不可否认的一点是,近年来AI相关方向看涨。所以,这样的对比,在其他专业上不见的存在普遍性。

    另外,我想要说的一点是,至少我个人并非完全是因为收入而选择工业界的。我是更愿意做研究性的工作,期待在未知中探索的。也正是因为这一点,我才会更愿意选择工业界。

    在我的专业里面,没钱等于没有成果。公司里面可以负担你,同时跑几百个实验,每个实验用上几块GPU。嗯,你没有听错,只要你愿意完全可以一次用上上百,甚至上千的GPU。反观,绝大多数学校里面,呵呵,排队去吧。一个实验估计没有几天是跑不下来的,为什么?因为就这么多GPU,所有师生要一起分着用。不排队不行。又或者,某些老师自己的项目里面可以配备相关的硬件,但是这样的机器基本都在个位数。

    换句话说,同样的实验,我在公司里面几乎可以高效100倍。这也决定了,更多的时候,我完全可以偷懒,让结果来决定研究的方向;而非先冥思苦想,确定一条能产生好结果的方向,然后再去做实验。打个更通俗的比方,在工业界,我就好像配备了机关枪,子弹随便打,只要看准目标大概扫扫就行,看谁倒下了,上去补两枪就行;在学术界,我就一把小手枪,还要省着弹药,看到目标要喵半天,巴不得一颗子弹就能搞定目标。

    另外想说的是,同样的学生资源,工业界也比学界多的多,也好得多。你很难想象在一个随便的美国州立学校(国内985也一样),随便拉出个博士生就有顶会顶刊。但是,在公司里面,几乎只有达到这样的标准,才有可能拿到实习的机会。而谁都知道,和没有还成果的人比,显然是已经出过成果的人,更容易出成果。

    在工业界,你也可以做学术。只是说,你需要适当的圆滑一些,让公司的某些产品和科研目标能和自己的兴趣align起来。

    ☆ END ☆

    如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 mthler」,每日朋友圈更新一篇高质量博文(无广告)。

    扫描二维码添加小编↓

    展开全文
  • 语义相似性是计算语言学和人工智能领域的各种应用中的一个通用问题,无论是在学术界还是工业界。 示例包括词义消歧、单词拼写错误的检测和更正(不正确)、文本分割、图像检索、多模态文档检索和自动超文本链接。...
  • 从社交网络、在线图像/视频分享平台、电子商务到教育、医疗保健等,机器学习方法已被用于各种现实世界的应用。
  • 因此,我觉得学术界工业界就会慢慢地有一些融合,因为工业界毕竟更多的重心还是在于应用和市场的开拓;而在学术界,现在慢慢从原来的真理探索开始向人类领域进行拓展,也在与工业界找到一些共通点。 我觉得计算机...

    来自:美团技术团队

    2020年7月31日,由中国图象图形学学会主办、视觉大数据专委会承办,北京智源人工智能研究院和美团协办的ECCV 2020中国预会议成功举办。本次ECCV预会议秉承传统,组织了圆桌论坛,邀请来自工业界、学术界大咖,他们围绕“计算机视觉:学术界与工业界GAP有多大”这个主题谈及了各自的理解并分享了一些精彩观点。

    圆桌论坛由中科院自动化所的董晶博士主持,Wormpex AI Research 副总裁兼首席科学家华刚博士、华为云首席科学家田奇博士、微软亚洲研究院资深研究员王井东博士、美团AI平台视觉中心负责人魏晓林博士以及上海交通大学的熊红凯教授同框在线进行话题讨论。

    上图左列由上至下为董晶、田奇、魏晓林

    右列由上至下为华刚、王井东、熊红凯

    各位学者、大咖针对工业界与学术界在计算机视觉领域的研究生培养、人才吸引力法则与跨界合作研究的优劣势等热点话题展开激烈讨论,他们还对目前工业界与学术界对计算机视觉领域学术前沿探索与产品应用落地间存在的鸿沟,以及相互间人才流动的现实状况进行了深入的分析与交流,最后对未来计算机视觉的研究热点和热门行业也做出了积极的预测。

    精选观点

    -----

    我们精选了圆桌论坛中10条专家观点,大家可以先睹为快:

    • 在学术界的研究生需要有一种哲学的思辨能力。

    • 对于做研究的人来讲,写作这个事情可能对你一生来讲都是非常有帮助的。

    • 学生需要有“T型”的知识架构,不仅要在某个领域研究得深,而且还要有知识的广度。

    • 那些真正能做产品的人才,能够从客户的角度,去发现社会和用户需要什么。对待新的研究方向也有很好的敏感性。

    • 工业界跟学术界往往是一个Mix,工业界和学术界的紧密结合是一个双赢的局面。

    • 可能工业界像是“市场经济”,学术界可以说一定程度上是更偏向于“计划经济”。

    • 学术界和工业界之间的GAP就是从基础研究到落地,我们称为“使用鸿沟”。核心就是说,一般我们讲的学术界是从0到1,而工业界是从1到n。那么,怎么把“0到1”和“1到n”衔接到一起,就怎么缩短这样的“使用鸿沟”。

    • 在学术界,你的论文发表了之后,研究就结束了。但在工业界是不一样的,论文发表可能意味这个工作才刚刚开始,后面还有很长的路要走,还要把技术经过一些改进,使它能够成熟到去支持业务的落地。

    • 计算机视觉的发展趋势预测:深度学习与计算机视觉结合的可解释性、安全性、鲁棒性、透明性;小样本训练、自监督学习、知识图谱、模型压缩;数据高效、软硬结合。

    • 计算机视觉应用的行业机会可能存在于以下几个领域:安防、无人驾驶、线下零售。

    本次圆桌论坛完整视频观看入口:

    https://www.bilibili.com/video/BV17a4y177Mf/

    或点击文末“阅读原文”观看完整视频

    文字实录

    -----

    以下系对Panel讨论环节的文字实录,希望能对大家有所帮助或者启发。

    计算机视觉领域的应用型/学术型人才培养方面的现状和问题

    董晶:大家都知道,本次ECCV预会议面向很多计算机视觉领域的研究生,包括硕士和博士,他们在面临就业的时候,在工业界和学术界的一些优劣势是什么?此外,从各位老师的角度来看,你们更看重这些毕业生的哪些能力?他们应该在读书深造期间具备什么样的能力?或者说对这些研究生应该往哪些方向进行发展和培养?

    熊红凯:工业界的话,相信其他几位老师比我更有经验。我就谈谈我在学术界的一些体会。以前我对计算机视觉是有一定偏见的,因为计算机视觉当时的目标是让计算机像人一样具有视觉的观感。

    小时候看书,说我们人类面临三个世界,一个是虚拟的意识世界,另一个是现实的物理世界,第三个是真理世界,也就是数学世界。过去我们做学术其实更多的是面向数学世界,去寻找和发现这个世界上所存在的真理和规律。后来计算机视觉打开了这个窗口,我感觉计算机视觉实际上是在把人的意识世界和现实物理世界做了某种关联。从这个角度来讲,我觉得学术研究现在存在一个分歧,是应该更多的去面对真理和规律,还是说只去做现实世界与虚拟世界的一种关联。

    当然,我们可以比较客观地说,计算机视觉是让计算机去创造一种新的物种,像人一样具有可辨识、可观察的能力。但是,有一些理性的人也会认为,计算机视觉更多的还是一种麻痹人自身的娱乐方式。我原来对计算机视觉的偏见可能就是来自这方面。

    但是今天,我们可以看到现代生活方式的变化已经不可逆转了。计算机视觉技术已经延伸到很多客观的方面,而并不仅仅在于娱乐或者是消费的方面。因此,我觉得学术界和工业界就会慢慢地有一些融合,因为工业界毕竟更多的重心还是在于应用和市场的开拓;而在学术界,现在慢慢从原来的真理探索开始向人类领域进行拓展,也在与工业界找到一些共通点。

    我觉得计算机视觉方向的研究生,既然做研究,必然面临这些方面的思考,就是你做的东西到底有什么用?并不仅仅只是体现在经济效益上。所以我认为,在学术界的毕业生需要有一种哲学的思辨能力,而并不仅仅是做一种技术的应用,也并不仅仅是提高一些效率。我觉得学术型人才必须找到一些能够打动他自己的、确实存在的规律和真理,而不仅仅是把现实和虚拟做一些简单的融合。

    董晶:我觉得熊老师现在对我们计算机视觉领域研究生提出了一个更高的要求,不仅要求他们的动手实践能力、编程能力要过关,还要在发现规律、总结规律这方面上升到一个哲学的高度。感谢熊老师的发言,那王老师对此怎么看呢?

    王井东:我虽然是来自于工业界,其实更多的还是偏学术界一点。刚刚熊老师讲的高度非常高,我就讲一讲我在我们这边带实习生十几年的一些感受和心得。

    微软亚洲研究院前院长沈向洋博士也是我当时在研究院实习时候的Mentor,曾经提到过“三好学生”,就是数学要好,编程要好,最后一个态度要好。首先想做学术研究,也包括做工业界的其他工作,态度是第一重要的。没有好的态度,光有好的基础,那是不够的。目前,特别是2012年以来,很多读硕士和博士的学生觉得数学不重要,只要会调参就可以了。但大家今后走向工作岗位,可能就会发现,光会调参是不够的,是没有优势的,因为调参每个人都会,所以数学还是很重要的。其次是编程,我们是做计算机科学方向的,编程自然非常重要。

    除了上面这三个方面,从我过去的很多经历,包括跟学生的交流以及跟学生合作做研究的经历,我觉得还有一点非常重要,就是交流。Communication这个词其实很泛,不仅仅是说口头交流,对我们做研究的人来讲,还有写作,比如写论文,也是很重要的。

    交流是除了上述三个方面以外最为关键的一点,因为我们做研究很难是一个人独立去做研究,往往需要跟很多人去合作。在合作的时候,比如说带实习生或学生合作的时候,往往会出现这样的问题,我们和学生讨论一些问题,那我们讨论的东西跟学生最终接受的东西,都是一样的吗?其实,不见得是一样的。那么,怎样保证你这些讨论能够达成一个共识,交流(写作)就会变得很重要。

    从我的经验来讲,往往建议研究生多写作。写作不是就要写论文,其实平时的交流也要写出来。如果你写作很好,那么别人看你的东西就知道你是怎么想的,而不像口头交流会产生很多意思不到位的状况。

    写作,对我们的帮助,不仅仅包括我们刚刚提到的idea层次上的,其实还包括对我们对自己的规划。不仅仅对做研究有帮助,对将来的工作也是非常重要的,比如说对很多学校的老师做Proposal也很重要。以前华刚老师在我们这边,我们也在一起讨论这个事情,我们在公司做研究,缺少一个写Proposal的过程,而这个事情我觉得现在越来越重要。这是从大的角度来讲,Proposal就是帮你规划将来的几年你打算怎么去做,对这个领域怎么去了解。

    可能大家会想,这些事情我天天都在思考,那这个问题我还能不了解吗?但是当你真正把这些问题写出来的时候,你就会发现(写出来与想法)之间的差距还是非常大的,而你写出来之后带来的好处也非常多。所以说,对于这些研究生不仅仅是在读的,包括马上要工作的,不管是学术界的还是工业界的,我觉得写作这个事情可能对你一生来讲都是非常有帮助的。

    董晶:井东老师对学生的笔杆子要求非常高,他们得把自己的想法写出来,这样才能被认可,才能被更多的人看到。

    田奇:大家知道,我本身是在学术界待了很多年,其实现在跟学术界联系也非常紧密,我做了17年老师,这两年在公司也是从事一些研究到行业落地的工作。

    从我的角度来回答这个问题,就是说看一看学术界和工业界需要什么样的人才。如果你具备这样的一些素质的话,那你就有一些优势,如果不足的话,可能就要弥补一下。

    学术界大家讲的比较多了,讲的就是源头研究、基础研究,主要研究的就是技术创新等等。那么从工业界角度来讲的话,我以前也做过一些类似的报告,所以总结了几点:

    • 第一点,从工业界来讲的话,我们可能需要这些学生专精一个领域,并且在这个领域中有一定深度的专业认识、专业技能和创造力。

    • 第二点,其实井东老师也提到了,就是要有沟通合作的能力,同时要有多领域理解的能力,就是我们常说的具备“T型”的知识架构,不仅要在这个领域研究得深,而且还要有知识的广度。

    • 第三点,从我们现在的一些行业应用来讲的话,要有一些真正能做产品的人才,能够从客户的角度,去发现社会和用户需要什么,能从应用场景去思考计算机视觉能够做什么,以此来激发一些更新的研究。

    • 第四点,是希望学生能够对待新的研究方向有很好的敏感性,包括对研究方向的发展、新的场景以及应用。

    • 最后还有一点,我们工业界也是需要一些有崇高理想境界的人才,毕竟AI还是以人为本,那么我们应该为人们的一些基础文化需求去服务,使AI能够更好地帮助这个社会,服务于更多的客户。

    这就是现在我站在工业界角度分享的对学生需求的一些理解。

    董晶:我觉得田老师其实还表达了一个观点是,我们的学生也是要因材施教、物尽其用,咱们有什么能力都可以发挥出来,其实在工业界、学术界都是能找到“闪光点”的。

    如何看待产业界和学术界参加国际顶会发表科研成果的热度

    董晶:今年ECCV 2020接收了1400篇文章,其中Oral(口头发表)只有104篇,而这些文章很多都是工业界和学术界联合发表的。那么,各位老师是怎么看待产业界和学术界联合参加国际顶会发表科研成果的热度的?今年ECCV来自工业界和学术界的大量联合投稿,是否也体现和反映计算机视觉领域在工业界和学术界越来越紧密的结合?工业界和学术界是否存在鸿沟?我们从有用的技术和有趣的研究两个角度出发,讨论怎样能够更好的帮助大家特别是年轻人发展。

    华刚:热度的存在是一个客观现象,存在即合理,我们也希望这个趋势能够一直紧密的保持下去。

    现在的热度,从方法论来讲的话,尽管有很多计算机视觉的研究员不愿意去承认这个事实,其实计算机视觉在被深度学习所主导,而深度学习的一个局限性就是需要大量的数据,这种数据学术界在实验室中是很难批量产生的。另外,计算机视觉从某种程度上来讲和应用结合的也比较紧密。

    从数据的角度来讲,工业界和学术界结合,学术界的得益之处在于,可以通过学生到公司去实习,或者是说有一些联合的项目能够获取(工业界的)数据。那从这个角度来讲的话,二者结合能推动这个领域的前进。

    从工业界的角度来看,过去PhD的培养本身是为学术界培养的,大部分博士毕业生都会去做教授。现在发展到今天,我们各个领域都有“通货膨胀”,其实高校的位置也就这么多,那就产生了一种职业,一批能做研究的博士也在工业界工作。

    所以,我在这里要给大家讲一个观点,其实我一直在思考这个问题,对于一个在工业界工作的人,他的工作和他的Career是不是应该分开来看待。

    井东老师刚才说他在工业界工作,其实是学术界的,我不认可这个观点。你就是工业界的人,只是说你作为一名研究员,你有一个学术界的属性,就是你在不同的时间戴了不同的“帽子”。从这个角度来讲的话,因为工业界有这么一群研究员,也是非常优秀的研究员,他的研究因为要平衡两个方面,一方面他要为公司的业务服务,就是为商业服务,往往他自己的精力就会更多的聚焦在短期要产出成果,但是他自己还能够通过跟高校合作来持续一些更长期、更加探索性的研究。这是非常有价值的。

    我觉得这从两方面的意义来看,它是一个双赢的情况,所以我并不觉得工业界跟学术界有多大的鸿沟,包括从有用的技术和有趣的研究来讲,当计算机视觉这个领域发展到今天,其实难去区分是不是学术界的人就是高校老师和学生在做有趣的研究,而工业界的研究员只是在做有用的技术,它往往是一个Mix。这是我的一个观点,我是希望这个热度能够一直保持下去,因为这会是一个双赢的局面。

    魏晓林:我们现在是否有鸿沟,然后何去何从?我觉得计算机视觉这个方向总体上工业界跟学术界之间的GAP是变得越来越小了,这也是大家有目共睹的。GAP在逐渐变小,对工业界来说是有直接益处的,无论是研发人员的招聘还是技术的快速落地,越来越多的公司受益匪浅。

    那为什么GAP会小?首先当然是因为深度学习发展的影响。目前,工业界在应用场景、大规模数据、计算算力上,对于深度学习的研发范式都提供了极大的支持,而这些场景和资源在学术界是比较难接触到的。比如,现在很多论文,特别是国外的Google、Facebook的论文动辄就是上亿体量的大规模的数据和上千张GPU联合训练,这在学术界是吃不消的。

    另外一个原因是,越来越多计算机视觉的高层次研究员和教授加入到了工业界中,人的流动也缩小了学术界和工业界的GAP。还有一个现象是,工业界最近几年大量招收计算机视觉领域的实习生做项目和发论文,有的部门和公司的实习生比全职员工还多,这是一个“三赢”的局面,同时实习生也加速了工业界和学术界的紧密结合

    我觉得从现在来看,GAP小是非常好的,我们不希望工业界和学术界有明显断档的。但是从未来的角度来讲,我倒是觉得,可能有些时候我们的GAP还可以更大一点

    我觉得还是要回到这个事情的本质上来说,我们要看学术界和工业界最终的目的是什么?我们打个比方说的话,可能工业界它是个“市场经济”,更偏向于通过市场驱动、用户驱动来一步步反推,反推出我们需要做什么样的研究。学术界可以说一定程度上是更偏向于“计划经济”,由政府来分配顶层领域的资源,助力并规划长期的发展。

    所以从这种角度来讲,我其实希望学术界投入到基础研究上的精力可以更多一点,可以想得和做得更远一点。这样的话,对于未来,比如再往后看5年10年20年,其实这种推动力可以更加好地持续下去。所以我感觉现在GAP小是好事,长期来看GAP大些也是好事。

    工业界与学术界对顶刊顶会论文的重视程度

    董晶:希望各位老师谈谈目前工业界与学术界对顶会顶刊论文的重视程度,是不是人才引进的判断标准?以及工业界和学术界对科研人才的吸引力法则,是什么原因让科研人才能够在学术界和工业界来去自如?

    华刚:首先,我不愿意把工业界与学术界之间称为GAP。我希望大家理解一点,其实在研究跟开发以及技术应用到实际的场景中间,有一个大的循环。在一个初创性技术的开始,你希望自己的研究跟开发过程能有一个阶段性的分离,你希望把做这个基础研究的人保护起来,让他有一个干净的环境去做研究。

    如果把研究跟论文发表联系起来就是说,研究做到一定程度,就一定要把它发表出来。如果说这个研究是自由形式的话,就可以发表到顶会顶刊上去。我要讲的学术界跟工业界的第一个区别就是,在学术界,你的论文发表了之后,研究就结束了。但在工业界是不一样的,论文发表可能意味这个工作才刚刚开始,后面还有很长的路要走,还要把技术经过一些改进,使它能够成熟到去支持业务的落地。

    我把学术界定义成高校,其实学术共同体是一个很大的范畴,它并不只是包含高校的老师和学生,至于说科研人才在学术界和工业界来去自如,我觉得那是每个人自己职业上的选择,没有特别多可以评论的。很多人可能会有“水土不服”的现象,只是说你在哪个行当你要去做哪个行当的事情,我觉得大家都应该用心去做。

    至于说工业界对学术领会期刊的重视程度,其实你为论文本身做了什么研究工作,可能在找工作的阶段并不是那么重要,它更多是一个记录,说明你的思维有逻辑性,你对自己的思维能够有一个组织性。

    而我们在评判面试候选人的时候,如果你有这些论文可以加分,但可能只是在初始“敲门砖”的阶段,你可能更容易吸引到面试官的眼球。实际上,我的每个应聘者我都会自己去聊一下,看他究竟写了几篇论文,里面有多少思想是他自己的,他自己有没有形成一个成熟的逻辑体系。我觉得这是去看人才是不是优秀的几个标准之一。

    刚才各位老师也提到很多,更看重人才的一些基本技能,我觉得这些都是我们会去考察的各个方面。但是我觉得最重要的是,在工业界需要的人才都要有一些能够解决问题的真正技能。因为在工业界有很多应用场景的问题,其实还是需要你追着问题然后去解决问题,在这个过程中建立你自己的技术(壁垒

    田奇:我觉得工业界和学术界其实核心都是人才,我们都需要理论扎实,工作能力强,善于合作,善于创新的优秀的科研人才。同时也存在一些差异,之前也讨论过,学术界更希望是能够把实践升华到一种理论的人才。工业界来讲的话,其实是“不管黑猫白猫,抓到老鼠是好猫”,更看重解决问题的能力。

    刚才提到对于顶会顶刊的重视程度,实际上我们现在研究院,还是会更偏重一些顶会,像CVPR、ECCV、ICCV等,这个跟学术界的重视程度都差不多。如果说对人才吸纳来讲的话,那么我们更可能关注以下几点:比如说作者是不是第一作者,是不是原创者,对开源有没有一些贡献;在一些AI的比赛中,是不是能展现很强的研究能力以及工程开发能力;是否参加非常丰富多彩的课外活动,能够对知识面的广度有一个提升。

    还有一个就是学术界和工业界实际上是“复古”的,现在在华为经常说的有一句话“向上突破天”,其实就是谈你的创新能力要强,另外一句是“向下扎到根”,就是说我们要贴近行业。

    从这种角度来讲的话,学术界和工业界之间的GAP就是从基础研究到落地,我们称为“使用鸿沟”。核心就是说,一般我们讲的学术界是从0到1,工业界是从1到n。怎么把“0到1”和“1到n”衔接到一起,就怎样缩短这些“使用鸿沟”,其实就是说研究到落地中间的一个沉淀过程。

    最后说一下,学术界和工业界上是一个循环,就像华刚说的,其实学术界为工业界输送了不少人才,但是也有很多工业界的人才慢慢的回流到学术界了,这样就带来一些新的机会,这样的话就叫互补互益、齐头并进。

    魏晓林:关于顶刊顶会,我觉得可以从两个方面来说,首先说顶刊顶会是到工业界入门的门槛。其实很有意思,大家多少年了一直在说,我们不应该过于重视论文数量这些事情,我们要去追求事情的本质,技术研发要在纯净的环境里做真正有意义的长期研究。

    但是这个事情感觉现在来说还是个跳不出来的“死循环”,大家无论是在学术界还是在工业界,其实对待论文就变成了一个新的“高考”,它是一个“开卷考试”,刚才各位老师说的能力,其实在一定程度上都在开卷考试当中有一个很好的体现

    所以在入门的时候,我们确实看论文,看你的发表论文的数量、质量,包括到底是不是你自己的想法,这些东西我们都非常看重。但是,另一层面我们同时也会像一个“艺术考试”一样,既有这种试卷考试也有面试,面试在其中也起到非常重要的作用,去真正探究这个同学的素质和能力。

    第二个方面是说,在公司内部我们是否重视顶刊顶会这个事情,实际上我们是反推的,就是我们还是要从市场来反推到底我们需要什么样的技术,技术在落地的时候可能就会有一些副产品,有一些产出,那我们就顺便就写成论文投稿,至少在美团是这样,因为我们的KPI确实不看顶会顶刊论文的数量。

    另外,其实当我们在说工业界、学术界的时候,有一个很有意思的现象是“学术界”可能只有几个学术界,比如:国内的学术界和国外的学术界,而“工业界”其实是有n个工业界,每一个公司都是一个工业界,每一个公司它的市场所面对的用户都是不一样的,所以它的“工业界”所代表的背后的含义也是不一样的。

    熊红凯:我觉得原来传统学术界,上个世纪五六十年代的时候,那个时候的其实并不注重顶会顶刊。我记得他们当时跟我讲说一个前辈哈佛大学毕业,其实没发表任何论文,最后就当上助理教授了。

    今天我们总喜欢讲学顶会顶刊,我觉得这实际上是一个“偷懒”的想法,因为我们不愿意去评判一个人的学术能力,或者说我们无法快速地评判一个人的学术能力。就是像今天我们孩子的教育一样,就是希望通过一个证书来做评判,而不愿意从他的实质思想和内容上去做评判,或者说也不愿意花很多的时间去培养他、观察他。

    我觉得其实不管是工业界还是学术界都面临这样一个问题,就是“快餐文化”,总是希望通过一些证书或者其他的证明来短平快地处理一些事情。现在我们带研究生包括招聘老师都是这样,我相信工业界招聘员工可能也会用这样的一种方式。

    然后现在“推陈出新”了,根据顶会顶刊的论文接收率来确定它到底是怎样一个顶会,怎样一个顶刊,最后来做一个判断。其实这里面也良莠不齐,我觉得很难根据这个来真正客观地做出评判。这就跟高考一样,我们选拔出了一些优秀的人才,但同时也丧失了一些优秀的人才,所以这个很难讲。

    其实在学术界,很多学者也还是希望能够用传统的方式,最好是能更多地从这个人的思想来做一个判断,是否愿意聘用他或者是给他这样一个发展的周期。

    当然前面井东老师提到的写作能力、表达能力可能也是一个关键因素。这个方面我其实对工业界确实没有太大的发言权,但是在学术界如果真的希望做一些学术探索,或者是做一些精知识的总结、规律的发现的话,还是需要有更多的具有独立思想,并且愿意做探索的、不是过于快速的去做一些短平快的研究的人才。我觉得这样可能是更长远的一个培养方式。

    王井东:刚才王亮老师(CSIG视觉大数据专委会主任)说我是学术界的,华刚老师好像不完全同意。其实这个事情是好事情,大家今天对学术界工业界区分的没有那么的清楚,比如说田奇老师从学校到公司,华刚老师也是从学校到公司,都是游刃有余。十年前我们做计算机视觉研究的人,其实很多研究生博士毕业以后发现工作了之后不做这个方向,或者说在这个方向很难找到理想的职位,今天来讲这个事情好像就不存在,这是非常好的一件事情。对于科研人员来讲,因为现在在工业界,其实很多需要研究的地方,不像以前一样毕业之后的情况,这是很好的一件事情,这也是为什么我们能够自由切换。

    所以说我还是鼓励大家,咱们(工业界)在计算机视觉领域还是要去做研究的,特别是有了深度学习以后,咱们在工业界去做一些项目的时候,如果说你仅仅是说像以前把工业界学术界的定义分的那么清楚,工业界就简单的实现,今天可能抱着这样一个理念去做工业界的工作的时候,你可能也很难做得非常好。

    计算机视觉的发展趋势及研究热点预测

    董晶:最后一个话题,我们想请各位老师分别讲一下自己对计算机视觉领域发展方向的一些预测或者看法。

    王井东:我就先讲一讲研究热点。尽管计算机视觉领域里很多研究人员不承认这件事情,现在深度学习还是成为了计算机视觉里面主导的方法。深度学习在计算机视觉里面有很多缺点,比如说不可解释性、安全性等等。所以说,深度学习在计算机视觉领域未来怎么跟推理结合起来,可能成为一个研究的热点,也是很多工业界落地需要去解决的问题,如安全性、透明性、可解释性等。

    华刚:首先,我觉得计算机视觉最有可能在产业上繁荣的三个领域,第一个是安防大家已经看到了,包括城市互联网、城市大脑这些都可以归于安防的范畴,应用前景特别是在中国的市场也是显而易见的。第二个领域,我还是对计算机视觉在无人驾驶这个领域是相当看好的。第三个其实很多人还没有注意到的,我觉得线下零售会有一个突破,这个行业的突破可能会发生在行业内部,就是说要深入到行业中去。这个在目前的阶段来看还是比较困难的,主要是因为技术还没到那个程度,还需要很多投资去打破这个瓶颈。以上这三个行业我认为是比较有希望的。

    下一个阶段计算机视觉的研究热点,我觉得有两个趋势,首先大家会越来越看到深度学习和计算机视觉领域一些知识结合得更好,结合起来之后就会产生更好、更可解释、更鲁棒的一些模型。

    另外,大家如果注意到的,就是目前包括CVPR也好,ECCV也好,投稿论文的主题比例的话,就会发现大家其实也在注意到怎么利用小数据去训练模型,能够达到一个很好计算机视觉的模型,我觉得大家在这一块会持续投入一段时间。当然研究热点总是很难预测的,因为它总是一个量变到一定的阶段,才会有一个质变,就是说某个方法某一个点可能会突然热起来,这是不可预测的。

    田奇:总的来讲,包括整个AI的发展趋势聊得比较多的就是一些自主自治、资源高效、安全可信。具体一点来说,我认为在计算机视觉领域所有的问题还是总结到数据、模型和知识的提取。

    从数据层面来讲,我们会聚焦在数据高效,因为深度学习需要大量的数据标注,将来我们怎么把数据的利用率高效做得更好,把数据深层的质量做的更好。从模型来讲,除了性能,我们还要考虑到一些具体的限制和功耗时延,这是设计成本。

    我们的一个发展趋势是把软硬件的结合,同时因为计算机视觉是一种使用技术,所以硬件厂商和AI算法厂商将来怎么样来进行协同。从单点的技术方向来讲的话,比如说针对这种数据高效的话,将来无监督学习、AutoML、边缘计算、知识蒸馏、模型迁移,这些都是比较好的研究热点。

    魏晓林:从研究领域来说,很多老师刚才都提到了很多不同的领域。我们在思考未来发展趋势这个事情的时候,背后有个大逻辑,就是我们更加关注新的开发范式和研发范式的变化

    深度学习是一个新的、完全颠覆了原来软件系统研发流程的范式,在这个大的范畴下面,其实有一些新的子范式可能会很快出现。比如说,小样本模型虽然还没有应用的非常广,它起到的作用是加快迭代速度、降低计算成本;像自监督学习,减少了人力标注成本和时间,可以利用到更广泛的数据;AutoML可以减少人工研发的人工成本;像多模态学习、视觉跟知识图谱的结合等,长期甚至可能影响到AI部门的组织形式。另外,我们也十分关注更”便宜“的AI,比如说模型压缩、端侧推理带来成本上的节省。

    从应用层面来讲的话,我们更加关注的就是刚才华老师讲的像新零售,也包括美团在做的无人配送,这些都是可以颠覆行业的落地场景。

    熊红凯:现在大家经常说人工智能是不是可以完全从数据中来,那么这个也就是说大的范式是从“类脑科学”开始,大家都是从类脑当中去看人是怎么思想的,或者干脆就从研究者的本身看研究者的本身是什么思想。我看到现在“神经计算”开始比较热,这属于研究人的思想,我对这个其实是持保留意见的,因为这个可能会对人本身产生一种负面的效果。

    此外,我觉得从人本身的才能上来讲,人更多的是一种把意识世界和现实物理世界进行融合的个体,但是计算机世界最后可能就“合二为一”了,也就是大家也不可能区分到底什么是虚拟,什么是真实的。就像美国影片《西部世界》一样,可能最后的一种需求就在于享受一种“虚拟”的生活,这种生活就是说我可以就把我的生活贯穿在这个世界中,最后就开始享受这种生活。

    我觉得计算机视觉如果从商业最后的发展趋势,或者从资本的角度来讲,可能最后将变成这样,最后跟图形、游戏,跟所有的现实生活融二为一,这可能会是将来。但是,这肯定也存在“两面性”。

    董晶:再次感谢各位老师的分享。如果对今天这个议题做一个小结的话,我们主要讨论了学术界跟工业界的GAP,其实是一枚硬币的两个方向,就像我们男人跟女人一样,大家各有所长,优势互补,而且还要不断的沟通,才能够将互补的优势发挥出来,这样才能够共造一个非常和谐、非常美好的未来。

    说个正事哈

    由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

    (1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

    (2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

    感谢支持,比心

    投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

    方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

    记得备注呦

    推荐两个专辑给大家:

    专辑 | 李宏毅人类语言处理2020笔记

    专辑 | NLP论文解读

    
    整理不易,还望给个在看!
    
    展开全文
  • 近年来,随着以深度学习为代表的机器学习方法在计算机视觉领域的广泛应用,以及计算机视觉在工业界场景中不断落地,CV领域的产、学两界之间的界限逐渐模糊,高校师生大规模加入工业界探索,而工业界...

    近年来,随着以深度学习为代表的机器学习方法在计算机视觉领域的广泛应用,以及计算机视觉在工业界场景中不断落地,CV领域的产、学两界之间的界限逐渐模糊,高校师生大规模加入工业界探索,而工业界也投入大量资本进行学术研究。这就导致一个“奇怪”的现象,在学术顶会中,常常会看到,一篇学术论文的研究者,既有高校师生,又有企业研发团队,似乎基础研究和商业已经实现了无缝衔接。

     

    站在2020年下半年,在计算机视觉领域,学术界和工业界是否还存在 GAP 呢?CV领域研究生如何成功顺利跨入企业,成为优秀人才?企业的顶会参与越来越多,难道他们真的在乎研究?计算机视觉研究的未来趋势有哪些?

     

    针对这些问题,在由中国图象图形学学会主办、视觉大数据专委会承办,北京智源人工智能研究院和美团协办的ECCV 2020中国预会议上,华刚(Wormpex AI Research 副总裁兼首席科学家)、田奇(华为诺亚方舟计算机视觉首席科学家)、王井东(微软亚洲研究院)、魏晓林(美团视觉智能中心负责人)、熊红凯(上海交通大学教授)等学术界和工业界CV学者进行了一次深入探讨,圆桌主席由董晶(中科院自动化所副研究员)担任。

     

    左列由上至下为董晶、田奇、熊红凯

    右列由上至下为华刚、魏晓林、王井东

    整理:智源社区 贾伟

    一、当前CV领域的研究生(硕士、博士)应该具备的哪些能力?

     

    //熊红凯——CV,不仅是技术,更是对真理的探索

    我几乎没离开过学校,关于学术界,下面谈谈自己的经验。

     

    小时候,家人告诉我,人类面对三个世界,第一个是意识世界,第二个是现实物理世界,第三个是真理的世界或者数学的世界。

     

    按照这种观点,做学术更多的是面向第三个世界,即数学的世界。换句话说就是,做学术的目的是面向物理世界,去寻找它真正存在的规律。而意识世界,我们无法左右,只能通过梦境或其他方式呈现。

     

    但后来接触到计算机视觉,它让计算机像人一样具有视觉的观感。这就意味着,计算机视觉给意识世界打开了一个窗口,它把意识世界和现实的物理世界进行了关联。

     

    现在学术研究存在一个分歧,对心理世界和物理世界的关联研究(不是对真理或规律的研究)是不是学术研究?因为很多人认为计算机视觉的研究成果更多的是用来娱乐和消费,而非探索真理。但我认为,抛开市场的层面,计算机视觉本身是一种向人类自身意识的拓展,这才是计算机视觉作为一种学术研究的内核。

     

    当然,这是我对计算机视觉的理解。

     

    从事计算机视觉研究的学生们,既然选择这个领域,就要有哲学层面上对这个领域的思考,找到那种能打动自己的部分。核心层面要始终意识到,这并不仅仅是一种能带来经济效益的技术,更是一种真理的探索。

     

    //王井东——写作很重要!

    我虽然是来自工业界,但实际上更多的还是偏学术界一点。刚才熊老师讲的高度非常高。我就讲一讲在这十几年中,我带实习生的一些感受或心得吧,当然讲的很多东西实际上是从别人那里学到的。

     

    沈向洋曾经提过“三好学生”。哪“三好”呢?就是数学好、编程好、态度好。

     

    • 数学好:2012年以来,许多学生认为数学不再重要,只需要调参就行了。但其实这是误解。大家以后走向工作岗位,就会发现光会调参是不够的,你没有优势,因为每个人都会调参。只有数学技能充分,才能够具备优势。

    • 编程好:这个很自然,做计算机方向,编程当然重要。

    • 态度好:你想做学术研究,态度是第一。没有一个好的态度,光有良好的基础是不够的。

     

    除了这三个以外,从我个人的许多经历中,我认为还有一点非常重要,就是交流。交流,并不是单指口头交流;对于做研究的人来讲,写作也是一种很重要的交流。

     

    为什么会这么讲呢?做研究,并非是一个人,往往需要跟很多人去合作。在合作的过程中,比如我带一些学生,往往会出现这种情况,我跟学生去讨论一些问题,但不同学生所接受的东西是不一样的。那么,怎么才能保证,最后大家能够达成一个共识?

     

    我的一个建议就是,把它写出来。

     

    写作,并不仅仅是指写论文。其实平时的交流也需要写出来。把平时的交流写下来,一个好处就是,如果你写的好,别人可以非常清晰地看到你最近在想什么,而口头交流则会有许多意思不到位或理解不到位的情况。

     

    除了对自己idea进行写作外,其实对自己其他方面(例如规划、报告等)的写作也非常重要。这个技能其实是非常重要的,它能够帮助你去规划过去和将来的几年应该怎么去做。可能有人会想,我不用写,因为头脑中每天都在想这个问题;但事实上是,只有当你真正把这个东西写出来后,才会发现你头脑中想的和实际中发生的到底有多大差距。因为你在头脑中构想时往往会遗漏许多细节,当你写下来时,才会注意到这些东西。

     

    因此,我建议学生们,不管是在做学术研究,还是到公司工作,写作这个事情,应该做起来,这对你一生都会是非常有帮助的。

     

    //田奇——不管到哪儿,都要有崇高的精神

    2017年以前,我在学校当老师;之后几年,我在公司从事研究。因此我从行业的角度来说一说,工业界需要什么样的人才。如果你具备这样一些素质的话,可能就会有一些优势;如果不足,可能要弥补一下。

     

    我总结了几点:

     

    第一点,在工业界来,首先需要专精一个领域,在这个领域中要有一定深度的专业技能和创造力。

     

    第二点,其实井东也提到了,就是沟通合作的能力。同时,我们也要有多领域理解能力,就是能够理解别人的工作。这就要求具备“T型“的知识架构,不仅要有知识的深度,还要有知识的广度。

     

    第三点,从行业应用的角度来说,要有一些真正懂得人工智能产品的人才。这就要求能够从客户的角度,去发现他们真正需要什么;或者,从应用的场景去思考计算机视觉能够做什么,从而来激发一些更新的研究。

     

    第四点,就是能够对新的业务方向具备很好的敏感性,对它的发展有快速、准确把握的能力。

     

    最后,我之前在其他场合也谈过,就是需要有崇高的理想境界,能够以人为本,去思考如何利用自己的能力,去为人们的精神文化需求服务。

     

    二、请问大家是怎么看待产业界和学术界参与国际顶级会议发表科研成果的热度的?

     

    //华刚——Win-Win:学术界与产业界的融合

    它的存在是一个客观现象。从我们的角度来说,也非常希望这个趋势能够一直这样紧密的保持下去的。

     

    现在的热度主要来自于两个方面。

     

    第一,现在CV的研究,从方法论上来说,是被深度学习主导的,而深度学习需要大量的数据,这种数据,学术界没有,而产业界却很丰富。这时候产业界与学术界结合,教授们会把他们的学生送到企业去做实习,从而能够访问这些数据;而企业也得到了优秀人才。这本身是一个平衡。

     

    第二,PHD本身是为学术界培养的,大部分博士毕业之后应该是去做教授的,但现在博士生太多了,有点“通货膨胀”,而高校位置就那么多,于是就产生了一个职业,就是工业界中有一群做研究的博士。这群人本身有两个身份,一方面要为企业的商业利益服务,另一方面他也能给自己分配一些精力做研究。他能够通过与高校合作的方式来带学生,通过这种方式,他能够去做一些更难、更长期、更加具有探索性的项目。

     

    从这两个方面来看,其实学术界与产业界之间的深度合作,是一种双赢的局面。所以我并不觉得产业界和学术界存在多大的鸿沟,从有用的技术、有趣的研究这方面考虑,特别是CV发展到今天这种程度,已经很难去区分是不是学术界的问题了。高校的老师和学生在做有趣的研究,而工业界的研究员在做有用的技术,两者结合,Win-Win。

     

    所以,我希望这种热度能够一直保持下去。

     

    //魏晓林——实习生,学术界和工业界融合的桥梁

    视觉这个方向,工业界和学术界总体的 GAP 越来越小,这个大家有目共睹。对工业界来讲,GAP小是非常有利的,企业方便招到优秀的人才,另外也能很快将最前沿的算法应用到实际产品中,不断迭代和创新。

     

    为什么 GAP 越来越小呢?刚才华刚老师也提到,深度学习这种新的范式,使得企业具备了学术界所不具备的优势,比如大规模标注数据、算力以及问题的实际应用场景。学术界很难拿到这种资源,这也导致很多非常高层次的学者加入到了工业界。

     

    其实还有一个现象,就是有大量的 CV 领域的学生加入到企业进行实习,并在企业里做研究,发paper。他们,事实上,起到了工业界和学术界融合的桥梁角色。

     

    从现在来看,我觉得两个领域的GAP小一些比较好,这样研究和应用不至于脱节。但是从长远来看,我觉得可能 GAP 大一点会好,因为我觉得还是要回到事情的本质。驱动学术界前进的是基础研究,这是需要花费更多精力,做一些长远探索的事情,往往需要五年、十年之后才能见到效果;而驱动企业去做研究的动力,本质上是商业,它更关注是否能给企业带来经济效益,是短期的。所以两者之间尽管可以密切合作,但也应当保持一点距离。

    三、工业界和学术界对顶会顶刊的重视程度/人才吸纳/技术成熟度的判断标准是否有差别?

    //华刚——进入企业,论文只是一个敲门砖

    学术界和工业界在论文发表上的区别,其实蛮大的。在学术界,论文发表即意味着结束;而在工业界,论文发表只是工作的开始,因为你的研究只是一个概念论证,后面如何进一步提升性能如何找到落地场景等,还有很长的路要走。

     

    至于说工业界对学术顶会期刊的重视程度,其实你之前发表的论文具体做了什么,在找工作的阶段并不重要,它更多的只是一个记录,说明你具备逻辑性思维,在评选候选人的时候,论文是一个加分项,更容易吸引眼球,但也仅限于此,只是初始时的一个敲门砖。实际上,每个候选人,我都会去聊一下他的论文,看看究竟这里头有多少思想是他自己的。更重要的是,他到底有没有形成一个成熟的逻辑体系,我觉得这才是一个人才是否优秀的重要标准之一。其实工业界,更重要的是去看你真实的技能,就是能否去解决问题,因为在工业界很多时候,都是你追着问题,去解决问题,在这个过程中来建立你的技术。所以解决问题的能力,才是工业界衡量人才的标准。

     

    //田奇——解决问题的能力,才是核心竞争力

    工业界和学术界,其实它的核心都是人才,都需要非常优秀的AI人才。我们都希望这些人才理论扎实,工作能力强,善于合作,善于创新。但两个领域也有一些差别,学术界更需要的是能够将实践升华为理论的能力;而工业界,其实秉着“不管黑猫白猫,抓到老鼠就是好猫”的态度,更看重解决问题的能力。

     

    关于顶会、顶刊,应该把两者分开来看。工业界会更重视顶会一些,因为能够快速地把工作发表出来。在顶会方面,工业界和学术界的重视程度差不多。

     

    关于人才吸纳,工业界可能更关注以下几点:作者是不是第一作者;有没有对一些开源项目做出一些贡献;或者在一些AI比赛中有很强的表现;是否有参加项目的实习经历;是否有丰富多彩的课外活动等。这里面看的不仅是研究能力,还有工程开发能力。

     

    //魏晓林——企业的论文,只是技术的副产品

    关于顶会顶刊论文,从工业界,我觉得可以从两个方面来说。

    首先,入门工业界,也即进入企业,大家还是要看论文情况的。尽管这么多年来,我们都在强调不要过于重视论文的数量,应该追求事情的本质。但这就像高考一样,尽管它并不能完全反应出一个人真正的实力,但仍然是一个重要的衡量标准。

    第二个方面,在公司内部我们是否重视顶会?这个问题需要去反推。在公司,我们会从市场的需求来反推需要什么技术,这些技术在落地的过程中会产生一些副产品,于是我们就顺便发了个顶会文章。其他公司我不太清楚,至少在美团,我们的KPI里没有必须要发表多少论文。

     

    //熊红凯——传统的学术界,论文不是衡量一切的标准

    我说一下学术界。我自己以及家里人都是学术界的人,我也认识一些传统的学术界的前辈。我觉得传统的学术界,其实并不注重顶会顶刊。其中有个前辈说他当时哈佛大学毕业,没有发表任何论文,但最后还是被留为助理教授了。我记得,卡尔曼博士毕业也是没有论文的,当时也没有很大的影响力,但后来却做出了控制论。

     

    今天我们总喜欢讲顶会、顶刊,这实际上是一个偷懒的想法,因为我们不愿意从一个人真正的思想和能力上去认真评判一个人的学术能力,只好用论文的数量或其他一些证书来作为衡量标准。我觉得这其实,不管是工业界还是学术界,都面临的一个问题,就是快餐文化,希望能够用更多证书,短平快地处理一些事情。

     

    针对顶会顶刊,大家会用它的接收率来判断这个顶会、顶刊的质量。但大家都知道,即使评价特别高的顶会顶刊,其发表的论文也是良莠不齐的,因为研究成果的重要性,很难用这些数据评价出来的。

     

    在学术界,其实很多学者可能更希望能用传统的方式,从这个人的思想来做判断,决定是否聘用他,或给他一个发展的周期。

    四、请您谈谈本领域工业界和学术界对科研人员的吸引力法则?您如何看待和定义这两者的界别和角色转换的关系?

    //华刚——横亘在学术界、工业界之间的不是GAP

    我其实不愿意把学术界和工业界之间的不同称为「GAP」。因为研究、开发以及将技术应用到实际场景,这是一个大循环,是相互衔接的。另一方面,我们把学术界限定为高校,事实上,学术共同体是一个很大的范畴,并不只是包含高校的老师和学生。魏老师提到希望学术界和工业界保持一点距离,这其实是希望能够把做基础研究的人保护起来,给他一个干净的环境去做事情。

     

    我们来说,人才在高校和企业之间的流动,我觉得只是每个人自己职业上的选择,其实没有必要拿来评论。其中当然很多人会有“水土不服”的现象,这个只能说,在哪个行当就要做哪个行当的事情,高校进企业的教授,或企业进高校的研究员都要有这样的心态。

     

    //田奇——学术界和工业界互补互益、齐头并进

     

    关于学术界和工业界的关系,我认为是互补的。在华为,我们经常说一句话就是,向上突破天,向下扎到根。前一句就是谈你的创新能力要强,后一句就是说我们要贴近行业。所以我们提出要全栈全场景,这就要求从基础研究到产业落地全部覆盖。如果我们把学术界的研究看做从 0 到 1,那么工业界的工作就是从 1 到 N。怎么把 0~1 和 1~N之间的缩小呢?这就需要有一个从研究到落地的沉淀过程。这个沉淀过程需要那些具备很强的build能力的人才。就像刚才华刚说的,学术界和工业界其实是一个循环,学术界给工业界输送了不少人才,我们也看到很多工业界的人才慢慢回流到学术界,这带来的一个结果就是,他们是带着新问题而来的,因此可以给学术界注入新鲜的内容。因此,我认为它们是互补互益、齐头并进的。

     

    //魏晓林——学术界只有几个学术界,工业界却有N个工业界

     

    在计算机机视觉领域,一个很有意思的现象是,学术界可能只有几个学术界,例如国内的学术界和国外的学术界;而工业界却有 N 个工业界,每一个公司都是一个工业界,因为每一个公司,它的市场所面对的用户历史都是不一样的,它背后所代表的含义也是不一样的。

     

    //王井东——两界不分,这是好事情

    刚才王亮老师说我是学术界,而华刚老师不完全同意,认为我是工业界,这意味着大家今天对学术界和工业界之间的区分没有那么清楚了。田奇老师是从学校去的公司,华刚老师也是,大家在这两种身份中切换,都是游刃有余。这是一件好事情。

    10年前咱们做视觉研究的人,很多研究生博士毕业后,发现很难找到理想的职业,今天来看这个事情就不存在了。因为现在在工业界,其实有很多需要研究的地方,不像以前一样,毕业即转行。这是很好的一件事情。

    五、请您谈谈您对未来 3-5年中计算机视觉行业的发展趋势,对可期的Top 1-2-3行业或某行业的前景预期?下一个阶段计算机视觉的研究热点在哪里?

    //王井东——与推理结合

     

    视觉发展到今天,尽管许多研究人员不承认,但Deep Learning事实上就是计算机视觉领域的主流方法。但大家发现Deep Learning存在很多缺点,例如不可解释性、安全性等问题。我认为计算机视觉接下来一个重点就是,要考虑怎么和推理结合起来;具体到方法上,就是怎么和神经符号这些方法进行结合。这也是解决可解释性、安全性和透明性等问题的途径。

     

    //华刚——三个繁荣产业,两个研究趋势

     

    首先,我觉得视觉最有可能三个产业领域上繁荣:第一是安防,大家已经看到了,包括城市大脑这些,我把都归于安防的范畴;第二是无人驾驶,这个行当是相当看好的;第三是零售,很多人还没有注意到,但我觉得视觉会对这个行业产生一个大的颠覆。

     

    下一个阶段计算机视觉的研究热点,我觉得有两个重要趋势。一个是,深度学习与计算机视觉的一些领域知识结合越来越多,结合之后才能产生更好的可解释、鲁棒的模型;另一个是,用小数据去训练模型。

     

    //田奇——数据利用好,至关重要

    关于AI的趋势已经聊了很多,就是一些自主自治、资源高效、安全可信等。在计算机视觉领域,其实所有的问题总结来说就是数据、模型和知识的提取。最主要的还是聚焦在数据高效上。因为深度学习需要大量标注数据,如何把数据利用好至关重要。从数据层面,就是把数据的质量做好。另外,一个发展趋势是怎么把软硬件结合起来。从单点的技术来讲,如何进行无监督学习、AutoML、边缘计算、知识蒸馏、模型迁移等都是比较好的研究方向。

     

    //魏晓林——大范式下的小范式

    前几位老师都讲了很多,其背后的大逻辑其实就是,我么应该更加关注新的技术范式,像深度学习一样能够完全颠覆原来的范式。

     

    当然,在大的范式下面,有一些小的范式。例如,小样本学习,虽然还没有应用非常广,但它能够加快迭代速度、降低计算成本;自监督学习,能够减少标注成本;AutoML,可以减少人工研发的人工成本;多模态学习与知识图谱的集合、CV与知识图谱的结合,可以对组织上产生一些影响;此外,还有模型压缩,从而找到更加便宜的算法。

     

    //熊红凯——回到哲学层面,重新思考视觉

     

    刚才几位老师提到的,我就不再赘述了。

     

    我这里强调一下新范式的问题。人工智能在最初是基于符号、基于专家系统、基于统计的,最近深度学习火起来之后,我们主要是基于数据。那么接来下大的范式会是什么呢?一个可能的方向便是类脑,即看人是怎么产生思想的,通过模仿人的思考过程来进行研究。

     

    从应用来讲,刚才华刚老师提了几个方向,但这都是可预见的。我觉得,思考这个问题,还得回到哲学层面上,计算机视觉本身更多的是把人的意识世界和现实物理世界进行融合,最终达到我们无法区分到底什么是虚拟、什么是真实的地步。这是我们发展的终极状态,我认为商业落地可以尝试从这个角度来往回推演,从而得出什么才是值得做的应用场景。

    点击阅读原文,进入智源社区参与更多讨论。

    关于我们

    北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,简称BAAI)成立于2018年11月,是在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区政府推动成立的新型研发机构。

    //智源研究院简介

    /// 

    学术思想 | 基础理论 | 顶尖人才 | 企业创新 | 发展政策


    展开全文
  • 一起探讨NLP的边界和未来,学术界工业界在“语言与智能高峰论坛”上擦出火花....pdf
  • 提出了学术界工业界关于在供应链管理中使用区块链技术的宝贵见解。 设计/方法论/途径:我回顾了 2008 年至 2020 年主要研究区块链技术在供应链管理中的使用的文献。此外,我探索了两个区块链项目:Nimble 和...
  • 工业界学术界

    千次阅读 2018-04-16 11:30:25
    后面总结
  • IE-Survey:北航大数据高精尖中心张日崇研究团队对信息撤除领域的研究。包括实体识别,关系撤除,属性撤除等子任务,每类子任务分别对学术界工业界进行研究
  • QA调查:北航大数据高精尖中心研究张日崇团队对问答系统的研究。包括知识图谱问答系统(KBQA)和文本问答系统(TextQA),每类系统分别对学术界工业界进行研究
  • 本文发表于《中国计算机学会通讯》2015年第5期,转载已获得授权 作者:菲利普·郭 (Philip Guo),...● 工业界:成为某个企业、非盈利组织或政府部门的科研人员或工程师; ● 学术界:成为某所大学的助理教授。
  • 本文主要介绍了IMU基本结构原理和误差的相关概念,IMU误差模型,并较详细介绍了商用产品和学术文献提到的两种IMU标定方法。本文原创。 本文阅读时间约8分钟 了解IMU和误差 IMU(Inertial Measurement Unit)是...
  • 目标是作为在学术界工业界的机器机器研究研发的相关人员之间的主轴。 作者 洪钊桦 电子邮件 , JStarCraft AI架构 JStarCraft AI框架各个模块之间的关系: JStarCraft AI特性 属性与特征 连续 离散 模块与实例 ...
  • 根据这几年的积累,整理了一份国内外学术界工业界的牛人和大牛团队,供大家申请硕士、博士、博士后和找工作参考。 国内学校(排名不分先后): 哈工大社会计算与信息检索实验室:刘挺老师坐镇,教师包括:秦兵、...
  • 一直困扰本人的一个问题。。。。。。。
  • 假设:人们通过自己的理解觉得位置因素对广告领域的ctr预估有很大的影响,也就是position bias 一些简单的实验: 1:眼球追踪的实验(paper1) 2:用户问卷调查 3:一些论文中还提出在成熟推荐业务中对小流量的...
  • 前面一篇文章,对近20年的position bias发展做了详细的描述、列举,下面这篇文章配合上一篇文章,将一些阶段性发展,有代表意义的解决办法进行下详解 一、贝叶斯模型 2007年 贝叶斯模型 ...其中的 p(seen|ad,pos)...
  • 最近,大规模知识图谱库的研究和应用在学术界工业界引起了足够的注意力[1-5]。一个知识图谱旨在描述现实世界中存在的实体以及实体之间的关系。知识图谱于2012年5月17日由[Google]正式提出[6],其初衷是为了提高...
  • 电影分类是学术界工业界都感兴趣的话题。 大多数分类都集中在用户对选择未来电影的偏好上。 但是,针对电影未来流行程度的分类方案使制片人、金融家、学者甚至观众能够了解导致电影成功的因素。 这是因为太多不同...
  • 浅谈产业界与学术界的合作研究(转)

    千次阅读 2019-01-15 11:10:02
    浅谈产业界与学术界的合作研究(转) [编者注:原文可参阅: http://blog.sciencenet.cn/blog-414166-795432.html ] 最近网络上有一个流传甚广的微故事:“某企业引进了一条香皂包装线,结果发现经常会有空盒流过...
  • 位于硅谷团的丁羽老师,在大洋彼岸的凌晨,为同学们分享了在学术研究和工业界做研究和工业界做应用的一些体会,分析了学术研究和工业做研究有哪些相同哪些不同。从2016年毕业到现在4年的时间里,在工业界里产生了的...
  • 职业学校心理学在工商的实践:可能性还是白日梦? 学校心理学卷 f0。 七月。 1983 职业学校心理学在商业和工业中的实践:可能性还是白日梦? EDWARD M. LEVINSON 爱德华王子县学校(弗吉尼亚州) THOMAS H. ...
  • 学术界和行业研究使研究人员能够进行与当前商业惯例和背景更为相关的研究项目。 虽然,一些建筑的研究... 通过为加纳的学术界工业界的合作研究提供最紧迫的要求,它揭示了对加纳建筑业合作研究需求的更深刻的了解。
  • 演讲嘉宾:刘嘉屹,物理学博士,目前在位于加州的博世研究技术中心任大数据平台学习系统研究员。刘博士本科毕业于北京大学物理系,其后在美国伊利诺伊大学香槟分校,芝加哥大学,以及德国慕尼黑大学从事宇宙学研究。...
  • 然而,由于AI是一种新的编程范式,无论是学术界还是工业界,对于AI测试的研究还刚刚起步。 1.AI测试及挑战 AI作为一项变革性的技术已经渗透到了各行各业,随着AI在各行各业的应用日益广泛,对AI系统测试的需求也...
  • 遗传算法是一种模仿自然生物进化过程中选择和遗传的机理而构造出的一种优化搜索算法。但是,简单遗传算法的收敛速度较慢、稳定性较差。针对这些同题,本文提出了几种方法来改善遗传算法性能的操作,在文中分别讨论...
  • 「离开大厂,回归学术界」在近两年似乎已经成为了一种趋势,尤其是对于 AI 产业界而言,更是如此。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 29,533
精华内容 11,813
关键字:

学术界还是工业界