-
Linux下推荐的常用应用程序列表
2014-05-25 01:21:56Linux下推荐的常用应用程序列表 一,网页浏览 1,firefox firefox是现在最火的一个浏览器,支持好多扩展和插件,也有很多漂亮的主题.firefox就是mozilla-firefox,他是把mozilla的网页浏览的功能分离为一个单独的...Linux下推荐的常用应用程序列表
一,网页浏览
1,firefox
firefox是现在最火的一个浏览器,支持好多扩展和插件,也有很多漂亮的主题.firefox就是mozilla-firefox,他是把mozilla的网页浏览的功能分离为一个单独的浏览器.Firefox一般是linux系统自带的默认浏览器.
2,opera(非开源免费软件)
opera是号称最快的浏览器.能直接浏览wap网站,并且在浏览器集成了irc聊天,电子邮件,新闻组,RSS的简单功能.并且能改变使浏览器识别为IE或mozilla.
3,mozilla
mozilla的前身是netscape,知道一点计算机的历史的人都知道这个浏览器.集网页浏览,新闻组,网页设计,电子邮件等于一体的浏览器.被捆绑在windows操作系统里面的IE挤垮之后,现在为开放源代码的软件.
4,dillo
这个是我见过的最小的,最快的浏览器.有最基本的网页浏览的功能.有的网页效果不支持.但速度绝对是一流的快.默认不支持中文,可以下载已经打过中文补丁的版本.
5,w3m
w3m是一个基于文本的浏览器,能在控制台下使用.支持中文.在某些时候能应急用一下.安装
插件之后支持图片.
二,联络聊天
1,lumaqq
在linux下面兼容QQ的客户端.是用sun JAVA编写的,启动的时候有点慢.支持自定义表情,手机短信显示等级,QQ群等.并且能使用QQ网络硬盘
2,Gaim
一个多功能的聊天工具.支持几乎所有的聊天协议.如icq,msn,jabber等.安装openq插件后支持QQ.
3,Xchat
一个irc聊天工具.irc是什么?玩windows可以不知道irc,但玩linux必须知道.irc是一个聊天工具.在中国还不是太流行.(黑客都是用这个交流的哦!)
4,eva
一个KDE环境的的QQ客户端,有文件传输,屏幕抓图等功能.
三,Email客户端
1,evolution
GNOME默认的邮件客户端.支持pop3,imap4,smtp等协议.有联系人,邮件,日历,任务,等功能,如果你有很多办公事务要处理,这个软件和适合你.
2,thunderbird
像firefox一样,从mozilla分离出来的邮件客户端.在windows,linux等下都有相当大的用户群.
3,kmail
KDE桌面套件的一部分.
4,mutt
mutt是一个命令行的邮件客户端
四,下载工具(类似于flashget的下载管理工具)
这类的工具很多.wget是最常用的.是一个基于文本的下载工具,我一般用他的图形界面的
gwget.另外还有prozilla(图形界面为prozgui),Downloader for X(简称为d4x)等.firefox的插件DownThemAll,是一个多线程下载工具,在firefox中集成,使用类似Flashget.
五,FTP客户端
1,CoralFTP
一个用python写的FTP客户端.在建立站点的时候可以选择站点的文件目录编码,因此在显示中文的时候不会有乱码.
2,gftp
gftp是GNOME里面的一个软件,功能很多,但如果ftp服务器是GBK编码,而系统使用的是
UTF-8,下载的中文文件名就会出现乱码.这个bug可以打补丁解决,各大发型版都有相应的软件包.
3,lftp
一个基于文本的ftp工具.很简单,很好用.支持中文(与终端的编码有关,如乱码,改变终端的编码即可).
六,P2P下载工具
1,bittorrent
不用说也知道这个软件是做什么的.基于文本BT下载工具.图形端界面为bttorrentgui.这个是BT的始祖.
2,bitstorm lite
基于C++和GTK2的BT下载工具.目前还在开发中.现在只有下载功能.当种子为GB编码时不会有乱码.
3,Azureus
Azureus是一个用JAVA写的BT下载工具,功能强大.但运行的时候占用系统资源太多,且不稳定.
3,ktorrent
KDE套件中的BT下载工具.功能和界面类似于BitCommet.
4,amule
就是linux下载电骡.
七,RSS阅读
1,liferea
liferea是GNOME的RSS收集器.能在软件中调用mozilla或者gtkhtml显示订阅内容.
2,aKregator
aKregator是KDE里面的RSS阅读器.
3,浏览器
Opera本身就有RSS feed自动识别和阅读的能力.还可以用firefox+saga扩展.
八,BBS客户端1,Qterm
Qterm是国人开发的基于QT的BBS客户端.支持鼠标操作,能看图片.
2,pcmanX
pcmanX是国人台湾那部分人写的.可以在UNIX和Windows上使用.基于gtk2的,用GNOME做桌面的不愿装QT的可以尝试这个.
3,终端
等gnome-terminal,konsole终端,把字符编码设为gb,直接用telnet登陆bbs.
九,文件管理1,nautilus
GNOME默认的文件管理软件.也能登陆ftp,samba网上邻居等.集成刻录功能.
2,konqueror
KDE默认的文件管理软件.和nautilus类似.konqueror也是一个很好的web浏览器.
3,rox-filer
用fvwm.xfce的人经常拿这个做桌面和默认的文件管理软件,小巧快捷,但使用和常规的文件管理软件不同..
十,压缩解压缩软件
1,ark
kdeutils中的一个软件.能自动调用系统中已经安装的压缩解压缩软件.在konqueror中右键集成.
2,file-roller
GNOME中的默认压缩解压缩软件.和ark一样的软件.能直接解压缩rpm和deb包.
3,rar, zip, tar, gzip, bzip2等,命令行的压缩解压缩软件.ark和file-roller都是调用这些软件来压缩解压缩的.例如要解压缩rar格式的压缩包就须安装unrar.
4,p7zip传说中压缩比最高的软件.和windows下的7zip功能类似.可惜的是只有命令行的.
十一,文本编辑软件
1,kate,kwrite,kedit是KDE中的文本编辑器,界面类似,kate功能最强,支持语法加亮,能编辑大文件等.别的软件中的文本编辑功能一般是调用这几个软件.
2,gedit,GNOME的文本编辑器.支持多页面.
3,leafpad,mousepad类似windows记事本的简单的文本编辑软件.
4,vim和emacs
命令行的文本编辑软件.这两个是linux里面最常用的.经常有人为了这两个软件争得目红耳
赤.emacs可以装各种扩展,收发邮件,浏览网页等,成为一个外能的平台.相对来说vi较为专注一点.
5,如果不得不面对控制台,却需要编辑文本文件,可以尝试nano.在dos里面用过pico的人会很熟悉的.
6,十六进制编辑软件有ghex(GNOME),khexedit(KDE).
十二,电子书阅读器
1,Acrobat Reader中文版(英文版的不能正常现实中文;此软件为非开源免费软件).adobe官方出品.完美支持PDF中文显示.
2,xpdf.xpdf对没有内嵌中文支持的PDF文档,能调用系统的字体渲染.前提是安装有
xpdf-chinese-simplifiled
3,xpdf的是基于motif1(这个我不确认啊,看界面猜的),界面不美观,使用不人性化.现在常用的有evince,gpdf,kpdf等,也都是必须安装xpdf-chinese-simplifiled猜能现实没有内嵌中文字体的pdf.
4,chm格式的阅读软件有chmsee,kchmviewer,gnochm等.国人开发的chmsee对中文支持最好.
5,ps格式的阅读软件有kghostview,evince等.
十三,英汉词典
1,星际译王
词库丰富,朗道词库英汉汉英各四十多万.牛津英汉双解三十九万.还可以下载别的专业词库
.支持屏幕取词.能发音.
2,reciteword
一个英语学习软件.有大学英语四六级.托福,雅思词汇等词库.有单词初记,趣味打靶,听力实战,打字神功等功能.很完美!
十四,音频播放(注:不知为什么原文没有提到xmms和mplayer这两个很经典的音频软件)
1、audacious播放器,非常成熟的一个音频播放器。
2,beep-media-player
和千千静听一样的仿winamp的音频播放软件.可以播放包括ape,wma在内的几乎所有的格式.能直接使用winamp的皮肤!安装插件后能在线自动下载歌词.甚至还可以安装插件支持视频播放!他是xmms的替代产品.xmms是以前linux上用得最多的音频播放软件,基于gtk1的.
3,rhythmbox
GNOME默认的音乐播放器,以gstreamer为核心,能播放几乎所有的格式.播放器外观仿
iTunes,但较朴素.没有均衡器.
4,amarok
KDE上的音乐管理器,以xine或getreamer,arts为核心,和rhythmbox风格一样,但界面很漂亮.完美支持UTF8和非UTF8编码的tag.
十五,CD播放器(一般的音频播放软件都能播放CD)
1,gnome-cd
GNOME的cd播放器,小巧,音质也挺好的.
2,kscd
KDE默认的CD播放器.
十六,CD抓轨和音频转换1,sound-juicer
GNOME默认的CD抓轨软件.默认能抓取为ogg,flac,wav格式,也可以自己添加支持直接转为别的格式..
2,grip
一个集播放CD,CD抓轨于一体的软件.功能比前者强.
3,kaudiocreater
KDE下的抓轨软件.功能相当于sound-juicer.
4,soundkonverter
KDE里的音频转换软件,支持ogg,flac,mp3,wma,wav的转换.
5,sound converter
GNOME里面的音频转换软件,以gstreamer为后端.支持ogg,flac,mp3,wav等格式的转换.
6,基于命令行的转换软件:
abcde cd---ogg,mp3,flac,mpc
flac wav,aiff,raw---flac
oggenc wav,aiff,raw---ogg
faac 其他 ---aac,mp4
faad aac,mp4---其他
lame 其他---mp3
cdda2wav cd---wav
jack cd---wav,ogg,etc
mp32ogg(script) mp3---ogg
mp3burn(script) mp3,ogg,flac---cd
sox aiff,au,mp3(只读).ogg,wav等互相转换
十七,音频编辑1,glame
Glame是lame的图形端.lame是mp3最好的编码..
2,audacity
audacity是一个跨平台的音频编辑软件,能在linux,windows,mac平台上.支持wav,mp3,ogg格式的编辑,功能强大.
十八,视频播放软件
1,mplayer
mplayer是最强的视频播放软件,支持目前几乎所有的音频视频格式,流媒体协议.支持换皮肤,支持外挂字幕.软件为命令行的,图形界面为gmplayer.必须安装官方提供的win32codecs才能支持所有的格式.
2,totem-xine
totem是GNOME默认的视频播放软件,基于xine的totem加上mplayer的win32codecs,就可以播放几乎所有的格式.totem-gstreamer不能播放real格式和部分quicktime(.mov等),windows meida(wmv等)格式.
3,realplayer
real公司官方出品,非开源软件.基于开源的helix写的.支持mp3,ogg,swf(flash4.0),mp4,3gp等格式,也支持rm,rmvb.软件是针对oss的.普通播放会很卡,必须安装alsa-oss,再用aoss realplay启动realplayer才不卡.
4,vlc
vlc支持除rm,rmvb格式外几乎所有的格式,支持xvid,divx,mp3,ogg,mpeg等编码(不支持部分aac编码),而且支持mms,rtfs的协议.将vlc的浏览器插件安装之后就可以在线播放了.甚至你可以在线播放ftp上的影音文件.
5,kaffeine
kaffeine是一个前端,可以用xine,arts,gstreamer任何一个做后端.基于xine的kaffeine支持所有格式.他是KDE里面的视频播放软件.
6,kmplayer
kmplayer是一个KDE的简单的视频播放软件,他可以用mplayer或xine等做后端.
十九,视频转换和编辑
1,mencoder
mencoder是mplayer里面的视频转换软件.命令行的.几乎所有mplayer能播放的格式都可以转换.
2,ffmpeg
ffmpeg支持MPEG,DivX,MPEG4,AC3,DV等40多种编码,AVI,MPEG,OGG,Matroska,ASF等90多种解码.ffmpeg也是命令行的.
3,kino
Kino可以让你录制、创作、编辑以及用DV便携式数字摄象机播放。与其他编辑器不同的是,这个程序可以用键盘快速进行编辑。
二十,刻录软件
1,k3b
k3b是一个专业级的刻录软件,通过简单的鼠标点击你可以刻录iso,刻录bin/cue,制作音频CD,制作视频DVD,制作数据CD,制作数据DVD,从DVD,CD提取ISO等.还能自动演证md5.在功能和使用方便性等方面比nero强多了.
2,gnomebaker
GNOME的刻录软件,功能比k3b要差一点.能刻录数据音频CD,数据DVD等,支持iso,cue/bin.
3,nautilus
nautilus集成数据刻录功能.
4,基于命令行的刻录软件,别的刻录软件大多是以这些软件为基础的.
cdrecord---刻录CD/DVD或擦除CD-RW/DVD-RW
cdda2wav---CD抓轨为WAV音频
mkisofs---从文件制作ISO镜像
cdrdao---DAO(一次写盘)
vcdimager---将mpeg转换为VCD1,VCD2,SVCD,HQVCD的bin,cue格式.软件包内还含有vcdxrip,cdxa2mpeg等将VCD转换为mpeg
vcdtools---mkvcdfs用来制作能刻录VCD的镜像文件,vcdmplex用来将音频和视频合成为mkisofs能使用的格式.
dvdauther---从mpeg2制作DVD
dvdbackup---可将DVD复制到硬盘上,必要的时候可以用mkisofs和dvdrecord再次刻录DVD.
dvd+rw-tools---一套将DVD镜像刻录到DVD的软件.
二十一,办公套件
1,openoffice.org
目前最新版的openoffice.org已经支持粗体和斜体中文.openoffice.org和MS office的兼容性很好.openoffice.org能直接输出为pdf.
2,koffice是KDE的办公套件.据说很好用,但和MS兼容性不好.gnome-office也待于发展
另外还有永中office,WPS2005,redoffice等.没有用过,就不评论了.openoffice.org已经很完美了.(永中office,WPS2005,redoffice为非开源软件,openoffice.org为LGPL开源软件)
3.中标普华office
二十二,图像处理
1,gimp
gimp是一个类似于photoshop的图像处理软件.功能要比photoshop要强.打开photoshop要老长时间,而打开gimp只需要几秒.gimp有很多扩展,能制作gif动画,并且还可以直接输出视频
......
2,dia
dia是一个矢量图作图软件,对应windows里面的cisco.画电路图,流程图等很不错.
3,inkscape
inkscape是一个类似于CorelDraw的矢量图做图软件.能import JPG等格式图像,能打dia做的图像.文件默认保存为.svg格式.
4,xfig
xfig是一个专业的矢量作图软件.我没用过,看文档好像能家居设计,做地图等.默认保存格式为.fig,需要转换为jpeg等格式.
二十三,3D作图.
1,blender
linux下面的3Dmax,制作3D动画.
2,maya(非开源软件)
专业的的3D作图软件.这个不用我介绍了吧.收费的.哈哈
二十四,看图软件
1,gthumb
gthumb是一个类似于acdsee的看图软件,支持缩略图,支持全屏.并且还能调整图像,转化格式,旋转,裁减等功能.
2,gqview,eog
gqview和gthumb差不差多,但要简单一点.没有太多的功能.eog类似于win里面的图片传真查看器.
3,KDE里面的看图软件有gwenview等.本身konqueror就是一个好的看图软件.
二十五,CAD软件
1,Qcad
Qcad是一个简单的cad作图软件.只能做2D图像.上手很快的,拿上就会.
2,Pro/E WildFire 2.0(非开源软件)
Pro Engineer的linux版本的.相信这个软件能满足大家CAD/CAM的需求.
二十六,模拟器
1,dosbox
能模拟一些dos命令,软件.
2,wine
能模拟一部分windows软件,如IE,M$ office,QQ等.
3,cedega(非开源软件)
cedega是一个基于wine的软件,对游戏做了优化,玩CS,魔兽没问题.一点也不卡,但鼠标有点飘.
4,CrossOver Office(非开源软件)
他和cedega类似的模拟windows应用程序的软件.不同的是他的侧重点在于办公.
5,游戏模拟器
snes9x---nes模拟器,xmame---mame模拟器,vba---GBA......等.
二十七,虚拟机
1,VMware
最常见的虚拟机,很多初学linux的人都喜欢在他里面先装一下看看..在linux下面也有行
版本.可以用VMware再模拟一个linux或windows.免费软件.
2,qemu
开放源代码的虚拟机,操作方便.安装kqemu加速后速度不比VMware慢.我在虚拟机里面安装了一个solaris和一个windows2000,感觉还可以.目前qemu支持模拟x86,arm,powerpc,sparc等CPU.并且还支持把ata硬盘的一个分区作为虚拟机的一个硬盘加载.
二十八,编程
1,vim+gcc+gdb
这是个黄金组合,最原始的也是最流行的linux开发环境.gcc编译效率很高.他还可以交叉编译,这个是别的软件所无法比拟的,在x86为别的平台开发软件大多都要用到gcc的交叉编译.
2,别的语言有perl, python,tcl/tk,shell等.
3,IDE
Kdevelop是KDE下面的c/c++集成开发套件.Anjuta是GNOME下的IDE.能开C/C++.perl,
python等.
4,界面设计
KDE下的QT designer.GNOME下的Glade interface designer等.
5,eclipse
eclipse是一个开放的,可扩展的IDE.主要是为开发java程序,也能开发C/C++.有大量的高手为其写插件.
6,非开源的软件有Jbuilder,netbeans,kylix等.
二十九,网页设计
1,NVU
NVU是把mozilla-composer分离出来的只有网页设计的功能,但目前还不完善,使用并不比composer方便.NVU是所见即所得的软件.
2,Bluefish
Bluefish 是为有经验的网页设计者和网页编程者使用的编辑器。它支持许多编程和标记语言,但主要专注于编辑动态交互网站。
3,Screem
Screem是GNOME套件中的网站开发环境.他不仅能编辑网页,还能让你更方便地管理站点.
4,quanta plus
quanta plus是KDE里面的web开发环境.功能类似于screem.
三十,科学计算
1,Matlab
Matlab是当今国际上最流行的科学运算语言,有linux下的发型版本.为非开源软件.
2,OctaveOctave是一个与Matlab兼容,主要用于数值计算语言.GPL发布的.
3,Labplot是一个免费的数学分析和2D,3D画图软件,类似Origin.基于KDE的.
4,Scilab是另一个可以代替Matlab的科学计算软件
三十一,科学制图
1,metapost
metapost一种画图语言,可以精确的画出你想要的图形,通常生成eps格式配合latex使用,画出的图形是矢量的,可以支持无限缩放.
2,gnuplot
gnuplot可以用函数绘制二维的三维的图形,可以输出成很多种格式的图形.
三十二,数据库linux下数据库系统主要有oracle,PostgreSQL,MySQL.后两个是开放源代码的. -
[ 转]Linux下推荐的常用应用程序列表
2009-02-13 21:07:00一,网页浏览1,firefoxfirefox是现在最火的一个浏览器,支持好多扩展和插件,也有很多漂亮的主题.firefox就是mozilla-firefox,他是把mozilla的网页浏览的功能分离为一个单独的浏览器.Firefox一般是linux系统自带的默认...一,网页浏览
1,firefox
firefox是现在最火的一个浏览器,支持好多扩展和插件,也有很多漂亮的主题.firefox就是mozilla-firefox,他是把mozilla的网页浏览的功能分离为一个单独的浏览器.Firefox一般是linux系统自带的默认浏览器.
2,opera(非开源免费软件)
opera是号称最快的浏览器.能直接浏览wap网站,并且在浏览器集成了irc聊天,电子邮件,新闻组,RSS的简单功能.并且能改变使浏览器识别为IE或mozilla.
3,mozilla
mozilla的前身是netscape,知道一点计算机的历史的人都知道这个浏览器.集网页浏览,新闻组,网页设计,电子邮件等于一体的浏览器.被捆绑在windows操作系统里面的IE挤垮之后,现在为开放源代码的软件.
4,dillo
这个是我见过的最小的,最快的浏览器.有最基本的网页浏览的功能.有的网页效果不支持.但速度绝对是一流的快.默认不支持中文,可以下载已经打过中文补丁的版本.
5,w3m
w3m是一个基于文本的浏览器,能在控制台下使用.支持中文.在某些时候能应急用一下.安装插件之后支持图片.
二,联络聊天
1,lumaqq
在linux下面兼容QQ的客户端.是用sun JAVA编写的,启动的时候有点慢.支持自定义表情,手机短信显示等级,QQ群等.并且能使用QQ网络硬盘
2,Gaim
一个多功能的聊天工具.支持几乎所有的聊天协议.如icq,msn,jabber等.安装openq插件后支持QQ.
3,Xchat
一个irc聊天工具.irc是什么?玩windows可以不知道irc,但玩linux必须知道.irc是一个聊天工具.在中国还不是太流行.(黑客都是用这个交流的哦!)
4,eva
一个KDE环境的的QQ客户端,有文件传输,屏幕抓图等功能.
三,Email客户端
1,evolution
GNOME默认的邮件客户端.支持pop3,imap4,smtp等协议.有联系人,邮件,日历,任务,等功能,如果你有很多办公事务要处理,这个软件和适合你.
2,thunderbird
像firefox一样,从mozilla分离出来的邮件客户端.在windows,linux等下都有相当大的用户群.
3,kmail
KDE桌面套件的一部分.
4,mutt
mutt是一个命令行的邮件客户端
四,下载工具(类似于flashget的下载管理工具)
这类的工具很多.wget是最常用的.是一个基于文本的下载工具,我一般用他的图形界面的gwget.另外还有prozilla(图形界面为 prozgui),Downloader for X(简称为d4x)等.firefox的插件DownThemAll,是一个多线程下载工具,在 firefox中集成,使用类似Flashget.
五,FTP客户端
1,CoralFTP
一个用python写的FTP客户端.在建立站点的时候可以选择站点的文件目录编码,因此在显示中文的时候不会有乱码.
2,gftp
gftp是GNOME里面的一个软件,功能很多,但如果ftp服务器是GBK编码,而系统使用的是UTF-8,下载的中文文件名就会出现乱码.这个bug可以打补丁解决,各大发型版都有相应的软件包.
3,lftp
一个基于文本的ftp工具.很简单,很好用.支持中文(与终端的编码有关,如乱码,改变终端的编码即可).
六,P2P下载工具
1,bittorrent
不用说也知道这个软件是做什么的.基于文本BT下载工具.图形端界面为bttorrentgui.这个是BT的始祖.
2,bitstorm lite
基于C++和GTK2的BT下载工具.目前还在开发中.现在只有下载功能.当种子为GB编码时不会有乱码.
3,Azureus
Azureus是一个用JAVA写的BT下载工具,功能强大.但运行的时候占用系统资源太多,且不稳定.
3,ktorrent
KDE套件中的BT下载工具.功能和界面类似于BitCommet.
4,amule
就是linux下载电骡.
七,RSS阅读
1,liferea
liferea是GNOME的RSS收集器.能在软件中调用mozilla或者gtkhtml显示订阅内容.
2,aKregator
aKregator是KDE里面的RSS阅读器.
3,浏览器
Opera本身就有RSS feed自动识别和阅读的能力.还可以用firefox+saga扩展.
八,BBS客户端
1,Qterm
Qterm是国人开发的基于QT的BBS客户端.支持鼠标操作,能看图片.
2,pcmanX
pcmanX是国人台湾那部分人写的.可以在UNIX和Windows上使用.基于gtk2的,用GNOME做桌面的不愿装QT的可以尝试这个.
3,终端
等gnome-terminal,konsole终端,把字符编码设为gb,直接用telnet登陆bbs.
九,文件管理
1,nautilus
GNOME默认的文件管理软件.也能登陆ftp,samba网上邻居等.集成刻录功能.
2,konqueror
KDE默认的文件管理软件.和nautilus类似.konqueror也是一个很好的web浏览器.
3,rox-filer
用fvwm.xfce的人经常拿这个做桌面和默认的文件管理软件,小巧快捷,但使用和常规的文件管理软件不同..
十,压缩解压缩软件
1,ark
kdeutils中的一个软件.能自动调用系统中已经安装的压缩解压缩软件.在konqueror中右键集成.
2,file-roller
GNOME中的默认压缩解压缩软件.和ark一样的软件.能直接解压缩rpm和deb包.
3,rar, zip, tar, gzip, bzip2等,命令行的压缩解压缩软件.ark和file-roller都是调用这些软件来压缩解压缩的.例如要解压缩rar格式的压缩包就须安装unrar.
4,p7zip传说中压缩比最高的软件.和windows下的7zip功能类似.可惜的是只有命令行的.
十一,文本编辑软件
1,kate,kwrite,kedit是KDE中的文本编辑器,界面类似,kate功能最强,支持语法加亮,能编辑大文件等.别的软件中的文本编辑功能一般是调用这几个软件.
2,gedit,GNOME的文本编辑器.支持多页面.
3,leafpad,mousepad类似windows记事本的简单的文本编辑软件.
4,vim和emacs
命令行的文本编辑软件.这两个是linux里面最常用的.经常有人为了这两个软件争得目红耳赤.emacs可以装各种扩展,收发邮件,浏览网页等,成为一个外能的平台.相对来说vi较为专注一点.
5,如果不得不面对控制台,却需要编辑文本文件,可以尝试nano.在dos里面用过pico的人会很熟悉的.
6,十六进制编辑软件有ghex(GNOME),khexedit(KDE).
十二,电子书阅读器
1,Acrobat Reader中文版(英文版的不能正常现实中文;此软件为非开源免费软件).adobe官方出品.完美支持PDF中文显示.
2,xpdf.xpdf对没有内嵌中文支持的PDF文档,能调用系统的字体渲染.前提是安装有xpdf-chinese-simplifiled
3,xpdf的是基于motif1(这个我不确认啊,看界面猜的),界面不美观,使用不人性化.现在常用的有evince,gpdf,kpdf等,也都是必须安装xpdf-chinese-simplifiled猜能现实没有内嵌中文字体的pdf.
4,chm格式的阅读软件有chmsee,kchmviewer,gnochm等.国人开发的chmsee对中文支持最好.
5,ps格式的阅读软件有kghostview,evince等.
十三,英汉词典
1,星际译王
词库丰富,朗道词库英汉汉英各四十多万.牛津英汉双解三十九万.还可以下载别的专业词库.支持屏幕取词.能发音.
2,reciteword
一个英语学习软件.有大学英语四六级.托福,雅思词汇等词库.有单词初记,趣味打靶,听力实战,打字神功等功能.很完美!
十四,音频播放
1,beep-media-player
和千千静听一样的仿winamp的音频播放软件.可以播放包括ape,wma在内的几乎所有的格式.能直接使用winamp的皮肤!安装插件后能在线自动下载歌词.甚至还可以安装插件支持视频播放!他是xmms的替代产品.xmms是以前linux上用得最多的音频播放软件,基于gtk1的.
2,rhythmbox
GNOME默认的音乐播放器,以gstreamer为核心,能播放几乎所有的格式.播放器外观仿iTunes,但较朴素.没有均衡器.
3,amarok
KDE上的音乐管理器,以xine或getreamer,arts为核心,和rhythmbox风格一样,但界面很漂亮.完美支持UTF8和非UTF8编码的tag.
十五,CD播放器(一般的音频播放软件都能播放CD)
1,gnome-cd
GNOME的cd播放器,小巧,音质也挺好的.
2,kscd
KDE默认的CD播放器.
十六,CD抓轨和音频转换
1,sound-juicer
GNOME默认的CD抓轨软件.默认能抓取为ogg,flac,wav格式,也可以自己添加支持直接转为别的格式..
2,grip
一个集播放CD,CD抓轨于一体的软件.功能比前者强.
3,kaudiocreater
KDE下的抓轨软件.功能相当于sound-juicer.
4,soundkonverter
KDE里的音频转换软件,支持ogg,flac,mp3,wma,wav的转换.
5,sound converter
GNOME里面的音频转换软件,以gstreamer为后端.支持ogg,flac,mp3,wav等格式的转换.
6,基于命令行的转换软件:
abcde cd---ogg,mp3,flac,mpc
flac wav,aiff,raw---flac
oggenc wav,aiff,raw---ogg
faac 其他 ---aac,mp4
faad aac,mp4---其他
lame 其他---mp3
cdda2wav cd---wav
jack cd---wav,ogg,etc
mp32ogg(script) mp3---ogg
mp3burn(script) mp3,ogg,flac---cd
sox aiff,au,mp3(只读).ogg,wav等互相转换
十七,音频编辑
1,glame
Glame是lame的图形端.lame是mp3最好的编码..
2,audacity
audacity是一个跨平台的音频编辑软件,能在linux,windows,mac平台上.支持wav,mp3,ogg格式的编辑,功能强大.
十八,视频播放软件
1,mplayer
mplayer是最强的视频播放软件,支持目前几乎所有的音频视频格式,流媒体协议.支持换皮肤,支持外挂字幕.软件为命令行的,图形界面为gmplayer.必须安装官方提供的win32codecs才能支持所有的格式.
2,totem-xine
totem 是GNOME默认的视频播放软件,基于xine的totem加上mplayer的win32codecs,就可以播放几乎所有的格式.totem- gstreamer不能播放real格式和部分quicktime(.mov等),windows meida(wmv等)格式.
3,realplayer
real 公司官方出品,非开源软件.基于开源的helix写的.支持mp3,ogg,swf(flash4.0),mp4,3gp等格式,也支持rm,rmvb. 软件是针对oss的.普通播放会很卡,必须安装alsa-oss,再用aoss realplay启动realplayer才不卡.
4,vlc
vlc支持除rm,rmvb格式外几乎所有的格式,支持xvid,divx,mp3,ogg,mpeg等编码(不支持部分aac编码),而且支持mms,rtfs的协议.将vlc的浏览器插件安装之后就可以在线播放了.甚至你可以在线播放ftp上的影音文件.
5,kaffeine
kaffeine是一个前端,可以用xine,arts,gstreamer任何一个做后端.基于xine的kaffeine支持所有格式.他是KDE里面的视频播放软件.
6,kmplayer
kmplayer是一个KDE的简单的视频播放软件,他可以用mplayer或xine等做后端.
十九,视频转换和编辑
1,mencoder
mencoder是mplayer里面的视频转换软件.命令行的.几乎所有mplayer能播放的格式都可以转换.
2,ffmpeg
ffmpeg支持MPEG,DivX,MPEG4,AC3,DV等40多种编码,AVI,MPEG,OGG,Matroska,ASF等90多种解码.ffmpeg也是命令行的.
3,kino
Kino可以让你录制、创作、编辑以及用DV便携式数字摄象机播放。与其他编辑器不同的是,这个程序可以用键盘快速进行编辑。
二十,刻录软件
1,k3b
k3b是一个专业级的刻录软件,通过简单的鼠标点击你可以刻录iso,刻录bin/cue,制作音频CD,制作视频DVD,制作数据CD,制作数据DVD,从DVD,CD提取ISO等.还能自动演证md5.在功能和使用方便性等方面比nero强多了.
2,gnomebaker
GNOME的刻录软件,功能比k3b要差一点.能刻录数据音频CD,数据DVD等,支持iso,cue/bin.
3,nautilus
nautilus集成数据刻录功能.
4,基于命令行的刻录软件,别的刻录软件大多是以这些软件为基础的.
cdrecord---刻录CD/DVD或擦除CD-RW/DVD-RW
cdda2wav---CD抓轨为WAV音频
mkisofs---从文件制作ISO镜像
cdrdao---DAO(一次写盘)
vcdimager---将mpeg转换为VCD1,VCD2,SVCD,HQVCD的bin,cue格式.软件包内还含有vcdxrip,cdxa2mpeg等将VCD转换为mpeg
vcdtools---mkvcdfs用来制作能刻录VCD的镜像文件,vcdmplex用来将音频和视频合成为mkisofs能使用的格式.
dvdauther---从mpeg2制作DVD
dvdbackup---可将DVD复制到硬盘上,必要的时候可以用mkisofs和dvdrecord再次刻录DVD.
dvd+rw-tools---一套将DVD镜像刻录到DVD的软件.
二十一,办公套件
1,openoffice.org
目前最新版的openoffice.org已经支持粗体和斜体中文.openoffice.org和MS office的兼容性很好.openoffice.org能直接输出为pdf.
2,koffice是KDE的办公套件.据说很好用,但和MS兼容性不好.gnome-office也待于发展
另外还有永中office,WPS2005,redoffice等.没有用过,就不评论了.openoffice.org已经很完美了.(永中office,WPS2005,redoffice为非开源软件,openoffice.org为LGPL开源软件)
二十二,图像处理
1,gimp
gimp是一个类似于photoshop的图像处理软件.功能要比photoshop要强.打开photoshop要老长时间,而打开gimp只需要几秒.gimp有很多扩展,能制作gif动画,并且还可以直接输出视频......
2,dia
dia是一个矢量图作图软件,对应windows里面的cisco.画电路图,流程图等很不错.
3,inkscape
inkscape是一个类似于CorelDraw的矢量图做图软件.能import JPG等格式图像,能打开dia做的图像.文件默认保存为.svg格式.
4,xfig
xfig是一个专业的矢量作图软件.我没用过,看文档好像能家居设计,做地图等.默认保存格式为.fig,需要转换为jpeg等格式.
二十三,3D作图.
1,blender
linux下面的3Dmax,制作3D动画.
2,maya(非开源软件)
专业的的3D作图软件.这个不用我介绍了吧.收费的.哈哈
二十四,看图软件
1,gthumb
gthumb是一个类似于acdsee的看图软件,支持缩略图,支持全屏.并且还能调整图像,转化格式,旋转,裁减等功能.
2,gqview,eog
gqview和gthumb差不差多,但要简单一点.没有太多的功能.eog类似于win里面的图片传真查看器.
3,KDE里面的看图软件有gwenview等.本身konqueror就是一个好的看图软件.
二十五,CAD软件
1,Qcad
Qcad是一个简单的cad作图软件.只能做2D图像.上手很快的,拿上就会.
2,Pro/E WildFire 2.0(非开源软件)
Pro Engineer的linux版本的.相信这个软件能满足大家CAD/CAM的需求.
二十六,模拟器
1,dosbox
能模拟一些dos命令,软件.
2,wine
能模拟一部分windows软件,如IE,M$ office,QQ等.
3,cedega(非开源软件)
cedega是一个基于wine的软件,对游戏做了优化,玩CS,魔兽没问题.一点也不卡,但鼠标有点飘.
4,CrossOver Office(非开源软件)
他和cedega类似的模拟windows应用程序的软件.不同的是他的侧重点在于办公.
5,游戏模拟器
snes9x---nes模拟器,xmame---mame模拟器,vba---GBA......等.
二十七,虚拟机
1,VMware
最常见的虚拟机,很多初学linux的人都喜欢在他里面先装一下看看..在linux下面也有发行版本.可以用VMware再模拟一个linux或windows.免费软件.
2,qemu
开放源代码的虚拟机,操作方便.安装kqemu加速后速度不比VMware慢.我在虚拟机里面安装了一个solaris和一个windows2000,感觉还可以.目前qemu支持模拟x86,arm,powerpc,sparc等CPU.并且还支持把ata硬盘的一个分区作为虚拟机的一个硬盘加载.
二十八,编程
1,vim+gcc+gdb
这是个黄金组合,最原始的也是最流行的linux开发环境.gcc编译效率很高.他还可以交叉编译,这个是别的软件所无法比拟的,在x86为别的平台开发软件大多都要用到gcc的交叉编译.
2,别的语言有perl, python,tcl/tk,shell等.
3,IDE
Kdevelop是KDE下面的c/c++集成开发套件.Anjuta是GNOME下的IDE.能开发C/C++.perl,python等.
4,界面设计
KDE下的QT designer.GNOME下的Glade interface designer等.
5,eclipse
eclipse是一个开放的,可扩展的IDE.主要是为开发java程序,也能开发C/C++.有大量的高手为其写插件.
6,非开源的软件有Jbuilder,netbeans,kylix等.
二十九,网页设计
1,NVU
NVU是把mozilla-composer分离出来的只有网页设计的功能,但目前还不完善,使用并不比composer方便.NVU是所见即所得的软件.
2,Bluefish
Bluefish 是为有经验的网页设计者和网页编程者使用的编辑器。它支持许多编程和标记语言,但主要专注于编辑动态交互网站。
3,Screem
Screem是GNOME套件中的网站开发环境.他不仅能编辑网页,还能让你更方便地管理站点.
4,quanta plus
quanta plus是KDE里面的web开发环境.功能类似于screem.
三十,科学计算
1,Matlab
Matlab是当今国际上最流行的科学运算语言,有linux下的发型版本.为非开源软件.
2,Octave
Octave是一个与Matlab兼容,主要用于数值计算语言.GPL发布的.
3,Labplot是一个免费的数学分析和2D,3D画图软件,类似Origin.基于KDE的.
4,Scilab是另一个可以代替Matlab的科学计算软件
三十一,科学制图
1,metapost
metapost一种画图语言,可以精确的画出你想要的图形,通常生成eps格式配合latex使用,画出的图形是矢量的,可以支持无限缩放.
2,gnuplot
gnuplot可以用函数绘制二维的三维的图形,可以输出成很多种格式的图形.
三十二,数据库
linux下数据库系统主要有oracle,PostgreSQL,MySQL.后两个是开放源代码的.
三十三,服务器
这个是linux的强项.我在这里不再多说了. -
Hexo博客主题应用
2017-05-03 14:46:35我这里以yilia为例为大家介绍主题的应用。 然后在网上找到自己喜欢的主题。我这里给大家推荐这个还是很不错的哦。 yilia预览:yilia yilia代码库:yilia Hexo官网的其他主题:Hexo theme 1.首先我们找到自己本地的...关于如何搭建Github Pages博客我已经介绍了。
如果不了解的或者想了解博主所写的东西,可以来我看我得另一篇博客:如何使用Hexo建立自己的Github Pages博客
我这里以yilia为例为大家介绍主题的应用。
然后在网上找到自己喜欢的主题。我这里给大家推荐这个还是很不错的哦。
yilia预览:yilia
yilia代码库:yilia
Hexo官网的其他主题:Hexo
1.首先我们找到自己本地的Hexo文件夹下。
然后右键Git Bash Here
$ git clone https://github.com/litten/hexo-theme-yilia themes/yilia
通过以上命令我们把相应的主题下载到自己的hexo主题里边来。
2.修改配置文件
修改博客目录
E:\hexo\_config.yml
中的theme属性,将其设置为yilia。3.找到主题对应下边的配置文件,然后修改相应信息。
4.生成目录,在E:\hexo目录下运行
npm i hexo-generator-json-content --save
然后在主题下边的配置文件加入以下代码
jsonContent: meta: false pages: false posts: title: true date: true path: true text: true raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true
就可以正常的显示目录了。
-
推荐linux下常用的软件_linux推荐
2020-09-27 00:02:38nux下常用软件推荐列表 Liux下推荐的常用应用程序列表 一,网页浏览 1firefx firefo是现在最火的一个浏览器支持好多扩展和插件,也有很多漂亮的主题.firfox就是mozilfifox,他是把mozilla的网页浏览的功能分离为一个... -
个性化推荐和资源分配在金融和经济中的应用.pdf
2019-08-29 08:13:37港中文大学计算机系副教授张胜誉在CCAI 2017中国人工智能大会上做了主题为《个性化推荐和资源分配在金融和经济中的应用》的分享,就人工智能进入金融,个性化推荐,共享经济下的分配和定价问题做了深入的分析。 -
Embedding在网易严选搜索推荐中的应用
2020-10-09 16:31:06严选于18年下半年开始探索向量化在搜索推荐场景中的运用,从最开始基于商品召回用户的任务到后续的搜索召回、搜索个性化排序、搜索底纹、搜索发现词、搜索建议词、跨类目推荐、推荐召回、多兴趣召回、通用排序、端...导读:向量化在业界的运用越来越广,近期也有许多文章分享过相关的主题。严选于18年下半年开始探索向量化在搜索推荐场景中的运用,从最开始基于商品召回用户的任务到后续的搜索召回、搜索个性化排序、搜索底纹、搜索发现词、搜索建议词、跨类目推荐、推荐召回、多兴趣召回、通用排序、端智能重排等等,我们不断拓宽向量体系在严选的运用,在这过程中一点点迭代与沉淀。本文将从模型算法和落地运用等角度做简要介绍,希望能给读者一些启发。
01
向量体系
上图是对严选向量体系的一个概览。引言中说了那么多运用场景,第一眼看会觉得有些场景之间跨度蛮大,但是仔细考虑一下我们会发现,其实电商场景的大部分任务(包含以上所述的)都是在做对象之间的匹配,可能是商品和人的匹配,可能是检索词和商品的匹配,可能是用户和检索词的匹配等等。
于是,摆在我们面前的问题就是如何把我们目前遇到的以及将来会遇到的对象进行一个比较好的表征并刻画对象之间的相似度,其本质是学习出各个对象在同一个空间中距离的刻画。
如果我们把各个对象都学习到同一个空间,那么这些对象之间的组合几乎能覆盖各种运用场景,例如我们拥有用户(U)、商品(I)、检索词(Q) 的表征,仅仅是这三者的组合就可以有例如U2I、Q2I、I2Q、Q2Q、U2Q、I2I等等,我们进一步扩展类目、专题等等的表征之后能覆盖的场景就更多了。
那么我们如何去表征各个对象呢?向量凭借着简单的结构、快速的相似性计算、强大的表征能力有着得天独厚的优势。因此我们选择向量作为对象的表征方式。
当然有了向量表征仅仅是第一步,为了能让其服务于各个场景,线上线下需要其他模块的辅助配合,需要将具体的场景进行抽象,同时过程中也离不开不断的迭代优化,需要考虑模型的效果、稳定性、可扩展性、以及线上性能等等。
由点及面,在有了向量基础后,我们需要进一步扩展向量存储、向量计算等能力,进一步,由面到体,我们需要不断去分析和抽象具体的业务场景,以此不断铺开向量体系在实际业务中的落地运用。
02
算法模型
最开始我们使用的是图嵌入技术同时学习商品和用户,例如LINE、Node2Vec等模型(节点做标示进行区分),后续也尝试过使用YoutubeDNN的方式学习商品和用户向量,最后为了兼顾模型的可扩展性以及稀疏数据上表征的可靠性,我们选择了两步走的策略。
-
确认商品是整个电商场景中的核心,单独学习优化商品向量表征
-
其他对象都和商品有直接或者间接的关系(交互),通过专门的聚合模块得到对象表征
实践表明,这个两步走的策略在我们的场景中要优于之前尝试的方案,接下来我会对这两步做简要的介绍。
1. 商品向量学习
商品向量的学习关键在于用户行为数据的梳理以及模型的构建(参考了Airbnb的模型,在其基础上做了较多改进)。
商品是电商场景下用户交互最核心的东西,大部分的用户行为都围绕着商品。大量的用户行为中,天然的包含了用户对商品的认知,通过对这些认知的提取,我们便能够刻画出用户眼中商品的样子,利用用户眼中商品的样子能更好得去引导用户的行为。
我们有用户和商品交互的各种数据以及商品自身的一些属性。用户的连续点击行为能在商品之间构建关联;用户的购买行为能告诉我们用户的探索路径更容易收敛到哪些商品;用户的相继的购买行为能反应商品之间的搭配购买信息;商品自身的属性能在冷启动时给我们提供很多额外信息等等。我们要做的就是融合行为和属性学习出商品向量。
从上图可以看到,我们训练数据的构建其实可以等效看成构建了商品之间有权有向的关系图,同时增加了一些转化导向的长连接。我们的模型训练有别于传统的方式,对一个单一训练样本 center(中心商品):contexts(临近点击):global(序列内购买) ,我们希望 center 和 contexts(包含多个id) 以及 center 和 global 的距离越接近越好,所以在构建损失函数的时候我们一次性算出 center 和 contexts(包含多个id) 的相似性以及 center 和 global 的相似性,然后再加上负采样的约束。对于负采样,我们采取的是在一个 batch 内构建负样本的方式,这种方式简单有效且能满足按照样本出现的频率采样,同时结合矩阵运算能加快训练数据。在获取负样本后我们进一步构建 pair-wise 的loss,这对模型效果能有一些提升。模型的细节可以参考下图。
还有需要提及的一点是,为了学习到更好的商品向量表征,通常的方式是每日全量重新训练商品向量,但是这就引入了一些问题,例如每日的商品向量不在同一个空间中,相互之间的计算是没有意义的,如果不小心拿隔日向量进行了计算,会引入意外的结果。于是有人会采用增量训练的方式,每日只对新增的商品做推断获取它们的向量,但是这样也会引入一些问题,比如商品之间的关系并不是稳定不变的,只针对新商品做推断的话会使得原有商品之间的关系无法依据新数据进行调整。
针对这些问题我们提出了两种解决方案,一种是在隔日的向量空间之间学习一个仿射变换,对当日学得的向量做仿射变换,然后最小化相邻两天共现对象向量间的差异,这样仿射变换后的向量就能变换到历史空间中,同时包含一些新的结构信息。还有一种方案类似预训练的方式,在第二日训练的时候拿前一日的向量做初始化,对于没有出现过的对象做随机初始化,然后降低学习率做微调学习。在我们的场景中第二种方案效果相对好一些,第一种也能取得不错的效果。
此外从19年下半年开始我们也针对GNN相关的模型做了尝试,例如graphSAGE、LightGCN、SR-GNN等,目前看来SR-GNN模型在我们的场景中效果还可以。
2. 扩展向量学习
假设我们只有商品向量(I),我们能做的事相对比较局限,例如我们可以做基于I2I的各种任务、我们可以将商品向量作为预训练的向量提供给具体场景用于迁移学习。进一步我们获取了用户向量(U)之后,我们便可以做U2I、I2U等召回场景,很多分享案例都止步于此,但是只要我们再加一个对象例如检索词向量(U),我们的运用场景就瞬间开阔了许多,进一步我们还会有类目向量(C)、专题向量(T)等等。
随着业务场景的铺开,我们会遇到越来越多的对象匹配任务。我们可以针对每个场景分别学习,例如针对商品和检索词构建深度模型,学习他们的相似度量,例如针对检索词历史进行挖掘做检索词的相关推荐,例如针对用户和商品的历史交互建模做商品的召回,例如针对用户和专题的交互历史做专题召回等等,在这样的模式下每新增一个场景我们就需要花费人力去开发和后期维护,并且有的新增场景一开始并没有训练数据给你使用。考虑到可扩展性,我们可以将这些对象统一到一个增量向量产出框架中,抽象出一套聚合逻辑,产出同一向量空间中的向量。
结合落地实践,我们的聚合模块主要包含上图所示的子模块, 我们将新增对象叫做target,将基础的商品叫做source。到实际场景中,对象和商品的交互可能存在时间上的先后,因此需要时间衰减模块来处理时间因子;考虑到对象和商品的交互次数会有频次上的差异,我们需要权重累计模块来处理这个因素;考虑到对象和商品的交互会有一些噪音数据比如用户的误点击行为、或者运营的错误配置等等,我们需要噪音过滤模块来对噪音数据降权;考虑到有的场景使用单向量表征更合适,我们需要对交互数据做自注意力机制的处理,来凸显主要兴趣,因此引入了注意力机制模块;但是在有些场景,对象交互的商品往往是分布在空间中的多个区域(对用户而言是多兴趣表征,对检索词而言是多义词表征),为此我们加入了聚类模块(可以使用传统的聚类算法,也可以考虑用复杂网络中的社区检测算法来进行聚类,一般是在全局商品上进行操作),来输出对象的多向量表征。
凭借通用聚合框架,每次我们要新增对象的向量表征的时候,只需要处理一份target和source的关系表,同时每一个source都带上target和它交互的相关附加信息,将这份关系数据输入聚合框架便能产出和商品向量属于同一向量空间的对象向量了,任意对象之间都可以相互计算,判断相似情况。此外聚合模块的逻辑经过较小的改动也可以直接运用到线上对象的实时向量表征中。
03
相关技术
要建造大楼仅仅有基础的砖块肯定是不够的,我们还需要钢筋和水泥,需要脚手架等等。
有了基础向量,随之而来的就是大规模向量计算问题。初期各种任务主要集中在离线计算,所以我们自研了基于数据分块、矩阵运算和并行计算的离线大规模相似度计算模块,百亿规模的精确计算在单机上基本能在几分钟内完成,后期进一步调研了一些最近邻搜索算法后,使用了LSH、FAISS等方式来做大规模向量召回,并运用到线上实时召回中,感兴趣的读者可自行查阅相关资料。
我们的向量体系不仅仅运用在常见的召回任务中,在很多线上的基础排序任务中也发挥了重要作用。我们开发了一套线上向量存取和实时向量异步聚合的服务。基于这个服务,我们进一步开发了通用排序服务,例如基于用户的实时向量对搜索结果做Top个性化重排、基于检索词对专题进行排序、对众多的活动页商品做实时个性化排序等等。也正是基于这个服务,我们在一定程度上将搜索和推荐的部分任务统一到了同一个框架中。
此外在电商场景中效果的提升离不开实时数据的辅助,因此在我们的体系中实时行为数据模块也发挥了重要的作用。
04
落地分享
最后针对一些具体的场景展开介绍下,给读者一个更为完整的阅读体验。
1. 搜索场景
先谈一谈搜索场景,搜索场景不仅仅限于商品的召回和排序,搜索的底纹、发现词、建议词等都能为搜索导流,而这些也都能利用统一向量体系得到较好的解决。
例如发现词场景,我们需要基于用户的行为对用户推荐相关可能想搜的词汇,传统的方式通常基于query挖掘,基于用户先前搜索的词汇给用户推荐更多相关的词汇,但其实从用户浏览过的商品也能推测出用户想搜的商品,而这两个角度很自然得可以通过向量体系中的Q2Q(基于用户的搜索词)和I2Q(基于用户的浏览商品)来得到解决,进一步也可以直接通过U2Q(基于用户的各种行为)来获取 。(Q2Q 、I2Q 、U2Q的运用)
在此多说一句,为了更好的效果,通常需要结合离线数据和实时的数据,例如用户(U)就会有离线长期向量、离线短期向量、实时聚合向量(时间维度)、实时多兴趣向量(空间维度)等区分,同时为了性能提升部分相似性计算也可以挪到离线完成,此外在类似推荐的场景使用非多兴趣向量的时候多样性往往扩散得不够,这时候就会需要I2I(可拆分出相似和相关结果)的帮忙。(时空表征的运用)
建议词场景同理,基于Q2Q便可以,当然实际运用时Q2Q中的第二个Q和第一个Q是不同的,第二个Q需要是质量较好的Q,候选是需要考虑Q的句法结构,例如形容词+名词、名词+名词等,需要考虑Q被大众搜索过的次数、需要考虑Q在搜索后能召回的数量、需要考虑Q在搜索后用户点击的数量等等,这些都可以离线处理好,在检索词向量库的基础上过滤出一份优质检索词向量库。(Q2Q的运用)
此外基于检索词向量做商品的召回扩充其实在一定程度上融合并强化了传统的基于同义词扩充召回、基于SEO扩充召回等等方案,因为检索词向量之间的相似性天然的刻画了基于用户行为的词汇同义性,同时单商品上的SEO词会通过商品关系网扩充到其他商品上,那么基于检索词向量自然能召回那些即使没有相应SEO但是应该有那些SEO的商品。(Q2I的运用)
基于向量体系对搜索排序的优化也是水到渠成的,所有的优化可以看作是基于预训练向量的排序运用,而且扩展了数据的边界,不仅仅局限于搜索场景,将全局的行为都融入到了搜索中。
搜索场景的重点是帮用户快速找到他需要的商品,传统的认知是检索词包含了用户所有的意图,但是事实显然不是如此,比如T恤一词就相当宽泛。这其实可以看作是贝叶斯推断,假设我们不知道用户任何其他信息,基于T恤一词我们会有一个先验估计,得出一个基础排序。(检索词向量、商品向量的运用)
但是当我们获取更多是事实之后,我们的信息多了,那么必然可以去修正我们之前估计。例如我知道这个用户前几天看了一些女性鞋子,那么显然将女性T恤排在更前面会是合理的选择(离线长短期用户向量、商品向量的运用),同时我们又知道这个用户刚刚在其他页面浏览了一些运动健身的器械,那么显然将部分运动T恤提前会有不错的收益,实际模型上线后提升了搜索排序的鲁棒性、提高了搜索个性化的实时反馈能力、提升了搜素转化率,取得了不错的效果。(实时用户向量、商品向量的运用)
下图是对以上提到的部分场景的一个汇总。
当我们进一步引入类目向量和专题向量后,我们会发现运用的场景又进一步扩充了。在搜索场景中,通常会面临类目预测的问题,当我们拥有了检索词向量和类目向量之后我们能轻松地推断出每个检索词的主类目,对于没有出现过的长检索词,我们在计算前加入分词模块,通常便可推断出他们的类目了。此外当我们设定相似度的阈值之后,我们也可以为检索词作出多类目的预测,以满足不同场景的需求。(Q2C的运用)
此外在搜索场景,为了充分利用搜索流量,我们还会做专题的召回以及和商品的混排,商品和专题属于异构数据,通常我们需要构建额外的模型来对专题作出排序。但是当我们有了专题向量之后(此处提一下,专题向量其实可以有两个,一个是基于关联商品聚合的,还有一个是基于专题的文本进行推断得到,因为检索词本质上是文字,专题的文本可以拆分后用检索词向量进行描述),我们便可以方便的对专题进行排序然后呈现。(Q2T的运用)
2. 推荐召回
接着我们再说一说向量体系在推荐召回中发挥的作用。这里面涉及到了用户的多种向量表征,对于用户的刻画当然是越精细越好,在我们的场景中我们学习了用户长期向量、短期向量、实时向量、用户多兴趣向量、用户群体向量等等,不同的向量有着不同的使用场景,对于展示位置比较少的推荐位,我们关注用户的主要兴趣,所以一般使用单兴趣向量即可(我们模型训练得到的单兴趣向量也可召回不同兴趣面的商品,但是相似头部的商品相对还是比较集中);在一些展示位较多的推荐位置例如猜你喜欢模块,我们需要兼顾推荐的多样性,所以一般会使用用户多兴趣向量召回商品(实时多兴趣和离线多兴趣);对于行为较少的新人,我们则会采用用户群体向量去召回商品,实际中也取得了不错的效果。(各种U2I的运用)
3. 购买预测
此外再提一个购买预测的场景,用户日常的行为可能是目的明确地浏览、也可能是目的不明地闲逛,那么如何区分是哪种行为呢。其实很简单,分析下用户看过的商品之间是相似的还是没什么关联的就行,很显然(I2I)能满足我们的需求,我们可以为每个商品计算它与其它所有商品相似度得分的均值(记为S),如果每个商品最终得分都较大,那么用户是在目的明确地浏览,如果每个商品的得分都较小那么用户是在目的不明地闲逛,如果几个商品得分较高,几个商品得分较低,那么用户是相对集中的看了几个类似商品,同时无意地点了几个其他商品。基于以上我们可以挑选出那些目的明确地浏览的用户。至此读者可能会想,然后把得分最大的商品挑出来就可以了,但是其实还没有结束。截止到目前我们只使用了用户当日的行为,但是我们上手还有用户以往的行为,这些信息不能浪费,它们会修正我们当下作出的判断。假设今日挑选出的商品中,有的商品用户前几日就很有兴趣,那么今日他购买的概率必然比S得分相似的其他商品要更大,因此更好的判断应当基于今日的S以及用户前几日兴趣对商品们的得分(U2I) , 这个项目的上线明显提升了用户的转化。(I2I和U2I的运用)
05
总结展望
向量体系有着很明显的优势,它能让我们迅速完成产品新功能的上线并取得不错的效果,同时在有的场景中也能完胜一些老的复杂的方法,这恰恰也印证了奥卡姆剃刀原则。
随着表征对象的增加以及对业务的进一步理解,我们仍将一步步不断拓宽向量体系在业务中的落地,但是在实践中我们也会发现它的局限性,这个局限性一方面来自于向量表征结构自身,另一方面源于部分实际问题的复杂性需要新的表征方式来解决,所以我们将会进一步探索其他的表征方式,以及新的技术方向。
-
-
Sublime Text 3 主题设计与应用
2018-02-02 16:20:42作为编辑器之神,sublime之所以能受到大众的欢迎,就是因为其拥有优雅流畅的操作界面,此博客将介绍sublime配置使用主题以及自定义主题的具体方法 1)下载使用主题插件 sublime自带相当多的主题插件,其中下图第... -
云原生下的应用系统配置变更管理:confd
2019-08-23 22:17:53回到主题,confd是阿里的Nacos 作者推荐的工具,对于大型的复杂的应用系统,特别实用,它提供配置变更的自动下发,及时生效。 它解决的痛点 配置管理变得繁琐 配置项越来越多 修改后需要重新... -
CSDN互联网大数据应用主题月视频
2018-09-13 14:56:50互联网作为大数据时代的发源地,学习,掌握大数据技术也成为不少工程师必备技能,该视频培训教程共有15课时,分别从这几大方面介绍大数据技术应用,大数据人工智能时代下互联网人才技能分析、推荐系统A/B架构设计等... -
SACC 2013:大数据可视化应用及推荐
2017-09-01 15:47:00文章讲的是SACC 2013:大数据可视化应用及推荐,...大会将以“大数据下的IT架构变迁”为主题,邀请国内最牛的IT架构师与工程师们来分享他们最新的技术应用经验与成功案例。据了解,中国系统架构师大会自2009年首次... -
ohmyzsh主题推荐_主题四五:数据整理,命令行环境
2021-01-23 15:20:38除空格之外的"任意单个字符"* 匹配前面字符零次或多次+ 匹配前面字符一次或多次[abc] 匹配 a, b 和 c 中的任意一个(RX1|RX2) 任何能够匹配RX1 或 RX2的结果^ 行首$ 行尾和 + 在默认情况下是贪婪模式,也就是说,... -
【今日推荐】10大流行的 Metro UI 风格的 Bootstrap 主题和模板
2013-04-11 09:35:00Metro UI 是一种界面展示技术,是 Windows 8 的主要界面显示风格。Metro 界面和 iOS、Android 界面最大的区别在于:后两种都是... 如果你的下一个网站项目或 Web 应用程序想使用 Windows 8 Metro 风格,那么下面列... -
神策数据算法专家:推荐系统的实践与思考(下)
2019-04-09 17:26:28本文内容来自神策数据《智能推荐——应用场景与技术难点剖析》闭门会分享内容整理,分享者为神策数据算法专家胡士文,分享主题为《推荐系统的实践与思考》,前面我们介绍了算法和数据部分(PPT 下载 | 神策数据算法... -
学习App:2015年三款人气学习类手机应用推荐
2015-01-13 10:24:54下面推荐的几款各有千秋,主题功能都有练习冲刺,错题本,成绩反馈,学习互动交流等,需要指出的是大题小作推出的PK竞技功能别具一格,很有趣味性,如果不想以为枯燥练习的朋友可以关注。1、大题小作大题小作logo大... -
-
天庭最牛系统 推荐下载_PPT 下载 | 神策数据算法专家:推荐系统的实践与思考(下)...
2020-12-18 03:05:21本文内容来自神策数据《智能推荐——应用场景与技术难点剖析》闭门会分享内容整理,分享者为神策数据算法专家胡士文,分享主题为《推荐系统的实践与思考》,前面我们介绍了算法和数据部分(神策数据算法专家:推荐... -
PPT 下载 | 神策数据算法专家:推荐系统的实践与思考(下)
2019-04-03 16:21:52本文内容来自神策数据《智能推荐——应用场景与技术难点剖析》闭门会分享内容整理,分享者为神策数据算法专家胡士文,分享主题为《推荐系统的实践与思考》,前面我们介绍了算法和数据... -
项目中反射的应用
2019-01-11 11:38:14业务场景:我们时用springboot做的一个app(项目模块做完后,需要加入如今日头条的推荐和关注模块) 模块:有十几个主题,主题下有若干指标,每个主题和指标都被唯一区分; 架构:有一个总接口,抽取主题相同的... -
复杂文本网数据的主题建模进展
2021-02-21 08:05:09主题建模方法吸引了世界范围的广泛兴趣,并且促进了许多重要的数据挖掘、计算机视觉和计算生物应用系统的发展,包括文本自动摘要、信息检索、信息推荐、主题检测和追踪、自然场景理解、人体动作识别以及微阵列基因... -
特别推荐:15个精美 Metro UI 风格 WordPress 主题
2013-02-22 10:46:00Metro 风格的设计在移动应用和 Web 设计领域成为流行趋势,在过去数月被讨论得非常多。Metro UI 的设计带给你的第一印象是彩色方块和简约的设计,这有利于以文字为主的界面导航。...显示下一个界面的部分元素... -
融入词汇共现的社交网络用户情感Biterm主题模型
2021-01-19 17:41:44通过词汇共现算法对主题进行研究,推断文本集级别信息的主题,并通过分析特定场景下的评论文本集中的词汇配对集及其相应主题的情感,达到准确预测用户对特定场景的兴趣、偏好和情感的目的。结果证明,所提方法能准确... -
-
-
Linux下常用软件推荐列表(欢迎补充。。。)
2012-11-10 16:41:38Linux下推荐的常用应用程序列表 一,网页浏览 1,firefox firefox是现在最火的一个浏览器,支持好多扩展和插件,也有很多漂亮的主题.firefox就是mozilla-firefox,他是把mozilla的网页浏览的功能分离为一个单独的... -
Flutter中的MaterialButton不能使用全局主题颜色的真正原因
2019-07-25 14:13:42在页面中想设置下按钮的宽度,首先想到的是RaisedButton,主要是有阴影,并且官方推荐的,但是不能设置宽度和高度,然后选用其父类MaterialButton,可以使用minWidth这个属性,也有阴影等效果,但是新的问题,我设置... -
京东电商广告和推荐的机器学习系统实践
2016-10-24 18:54:00大家好,我是来自京东的包勇军,我今天分享的主题是《京东电商广告和推荐的机器学习系统实践》,介绍下我们部门在广告和推荐系统中应用机器学习算法的实践经验,包括浅层模型和深度学习算法的应用,正好也涵盖了...
-
基于Qt的LibVLC开发教程
-
标量PML-FDTD算法在弱导光器件仿真中的应用
-
漫谈TCP新算法Elastic-TCP
-
虚幻4引擎基础
-
ELF视频教程
-
【工具使用篇】Sublime Text 3 全程详细图文使用教程
-
MySQL 多实例安装 及配置主从复制实验环境
-
app服务端.rar
-
MPICH1.4+CODEBLOCK WINDOWS 64位安装指南
-
浅谈用户引导设计
-
一天学完MySQL数据库
-
JS_08-JQuery快速制作高效网页交互特效
-
洛谷P5015 [NOIP2018 普及组] 标题统计经典解法
-
在敏捷软件开发中使用虚拟化技术
-
MHA 高可用 MySQL 架构与 Altas 读写分离
-
Python剑指42.(lc53.)连续子数组的最大和---动态规划、分治算法
-
基于线性光放大器的全光逻辑异或门理论分析
-
Qt调用libVLC实现播放器
-
TeamFoundationServer2010Scrum1.0与持续集成的最佳实践
-
vue3从0到1-超详细