订阅业界RSS CSDN首页> 业界

专访POWER 8编程挑战赛选手王瑞:多线程提高算法运算效率

发表于2015-06-01 17:04| 来源未知| 作者李洪亮

摘要:由CSDN和IBM联合举办的“IBM Power 8极限性能挑战赛 ”自正式启动以来,受到了许多编程爱好者及程序员们的关注。 该大赛以云计算的方式为开发者提供了Power 8开发环境,开发者将利用Power 8的特性,基于不同场景进行应用开发。

由CSDN和IBM联合举办的“IBM Power 8极限性能挑战赛 ”自正式启动以来,受到了许多编程爱好者及程序员们的关注。 该大赛以云计算的方式为开发者提供了Power 8开发环境,开发者将利用Power 8的特性,基于不同场景进行应用开发。

此次大赛主要面向广大CSDN注册开发者,大赛以云计算的方式为开发者提供了Power 8开发环境,开发者利用Power 8的特性,基于不同场景进行应用开发。此次大赛,不仅使更多的开发者充分利用了Power 8,也为开发者、技术达人提供一个展示自我的舞台。

Power 8极限性能挑战赛已成功举办四期。(第一期“博客反垃圾”、第二期“敏感词大文本过滤”、第三期“文章TOP 100”、第四期”计算质数”)。现在,我们又迎来了极限算法挑战赛第五期本期挑战赛的题目是“文本分类”,具体任务由CSDN提供两批已经分类好的文本,其中一批用户编写算法实现分类模型,另一批数据用于验证用户算法模型效果。需要说明的是,大赛主要考察程序的是算法的正确率及处理速度,对开发语言、开发工具并不进行限定。

到目前为止,已经有数百名开发者报名并参加了此次大赛,为了让更多的开发者了解此次大赛的进展情况,日前,我们专访了其中一位参赛选手王瑞,希望通过他的参赛经历,吸引更多的技术达人参与到大赛之中。

1.可否介绍一下你的技术开发经历?目前,主要关注哪些技术领域? 

王瑞:大家好,我是isnowfy,很高兴参加这次分本分类比赛,本身主要在从事算法方面的工作,像推荐,nlp之类的工作。

2.关于您算法设计的思路,主要用到了什么计算模型?请简单描述一下所设计算法的基本思路? 

王瑞:算法主要用了贝叶斯模型和svm模型,还利用了信息熵增益的方式选取feature,还用了分词。首先用分词找出出现的词,然后用信息熵增益找到有用的词,之后训练贝叶斯和svm模型,最后把两个模型结合一下

3.参赛中在设计算法过程遇到了哪些困难?如何解决的? 

王瑞:主要的困难还是在调参上,需要反复试验。

4.相对于其他方式您之所以选择这一模型,主要是源于哪方面的优势?是否还有继续优化的可能? 

王瑞:模型的优势在于准确率较高,劣势的话就是速度方面,后续可以利用多线程的方式提高速度

5.基于这一思路的算法设计,能否充分发挥IBM Power8的多线程计算优势?您是否尝试过比较多线程与单 线程的性能差距? 

王瑞:Power8上多线程和单线程的性能差异还是蛮大的,不过由于这一期还是主要比的是准确率,所以在性能方面没有过多的优化

6.对于IBM Power 8,你最关注的技术要点是什么?原因是什么?能否谈谈对未来这一领域技术趋势的看法? 

王瑞:关于Power 8我想我最关注的还是运算性能的问题,现在GPU的运算能力被大家开发了出来,所以现在很多机器学习的算法都在尝试用GPU去运算,同样,我想知道Power 8是否能在运算能力上压过GPU,毕竟CPU上的程序还是大家比较容易接受并且容易写的,多线程并发编程肯定是未来的一个趋势。现在大家都在提大数据,云计算,都是要依赖大量的计算能力的,高并发肯定会带来更强大的运算,在大数据时代取得更大的成果的,不知道是不是以后CPU也会有一个分支,淡化上下文切换的能力,而去提高计算能力呢,十分期待将来CPU带来的更强大的运算能力。

7、Power8算法大赛需要有效的算法以及优秀的平台结合,才能获得更短的运行时间。在算法与POWER平台结合方面您有什么心得可分享? 

王瑞:这次没有特别结合power8的地方,以往几期的经验来说还是在于编译器优化和多线程的选择上。

8、您认为Power8平台相比个人平台有哪些优势? 

王瑞:明显的比个人平台要快,跑一下多线程的东西很有优势,而且有独特的内存锁的机制。

9、参加这次算法挑战赛的感受如何?对这一活动有什么好的建议?

王瑞:非常感谢这次IBM和CSDN举办的这次比赛,给很多热爱技术的同学提供了一个提高自己的平台,希望以后这样的比赛能够越来越多,也希望这样的比赛能够越办越好。

0
0