订阅业界RSS CSDN首页> 业界

[逝者]自然语言处理大师Fred Jelinek

发表于2010-09-16 20:37| 次阅读| 来源CSDN原创| 0 条评论| 作者刘江

摘要:现代语音识别和自然语言处理研究的先驱、美国工程院院士Frederick Jelinek近日辞世。他开创性地将语音识别视为通信问题,从而改变了这一领域的方向,使语音识别真正成为可能。

 

Jelinek

Frederick Jelinek(来源:Jelinek的个人网站

Language Log发表文章,引述约翰·霍普金斯大学工程院院长Nick Jones的通知,现代语音识别和自然语言处理研究的先驱、美国工程院院士、该校教授Frederick Jelinek已于9月14日辞世,享年78岁。

关于Jelinek,前Google研究员吴军(现在腾讯工作)在其广为流传的系列文章《数学之美》中曾有专文介绍,推荐阅读。以下文字的素材基本上来自吴军的文章与Jelinek个人网站。

Jelinek 1932年生于捷克一个富有的犹太家庭。二战期间父亲死在集中营,他也失学了。他从小成绩并不好,战后更是一塌糊涂。1949年全家移居美国。1950-1954年曾在纽约城市学院夜校读书。后获得奖学金,入读麻省理工学院,有机会得到信息论之父香农、语言学大师 Roman Jakobson 和乔姆斯基的教诲。1962年他以论文"Coding for Discrete Memoryless Two-Way Channels" 获得博士学位。

他先后在麻省理工学院、哈佛大学和康奈尔大学任教,以康奈尔时间最长(1962-1974)。1968年开始,他也同时在IBM研究中心工作。1974年后成为全职研究员,领导了当时最为强大的语言处理研究团体。吴军的文章中评论:

 在那里,贾里尼克组建了阵容空前绝后强大的研究队伍,其中包括他的著名搭档波尔(Bahl),著名的语音识别 Dragon 公司的创始人贝克夫妇,解决最大熵迭代算法的达拉皮垂 (Della Pietra)孪生兄弟,BCJR 算法的另外两个共同提出者库克(Cocke)和拉维夫(Raviv),以及第一个提出机器翻译统计模型的布朗。

在这里,Jelinek开创性地将语音识别视为通信问题,并用两个隐含马尔可夫模型(声学模型和语言模型)建立了统计语音识别的框架结构,将统计模型引入语音识别和语言处理,从而改变了这一领域的方向。此外,他还与其他合作者提出了数字通信领域最重要的算法之一BCJR算法(名称来自以四位发明者的姓氏首字母)。

1993年他加入约翰·霍普金斯大学,建立了又一研究重镇CLSP实验室,培养了大批人才。

Jelinek的名言是:“我每开除一名语言学家,我的语音识别系统错误率就降低一个百分点。”当然,这里面有玩笑的成分,因为他2004年接受Antonio Zampolli奖的演讲题目则是“我的一些最好的朋友是语言学家”(演示稿链接)。演讲的最后他说到:

 物理学家研究物理现象,语言学家研究语言现象。

 工程师要学会利用物理学家的真知灼见,而我们则要学会利用语言学家的真知灼见。

 

CSDN原创,未经许可,不得转载。

 

[逝者]自然语言处理大师Fred Jelinek