精华内容
下载资源
问答
  • Linux下一直没有类似 ...Linux 下的软件在不断诞生完善,我也再一次整理了有关文件快速搜索的工具,希望对你有帮助咯。老将们locate因为不怎么好用,但是比较简单而且古老,所以放在前面。sudo apt install lo...

    Linux下一直没有类似 Everything 的软件已经不是什么新鲜事了。不信你去百度“linux everything”,结果一大堆,但最后的体验结果都是不尽人意。主要是索引速度上不能满足大家。

    Linux 下的软件在不断诞生完善,我也再一次整理了有关文件快速搜索的工具,希望对你有帮助咯。

    老将们

    locate

    因为不怎么好用,但是比较简单而且古老,所以放在前面。

    sudo apt install locate

    然后更新索引:

    updatedb

    最后你就可以使用这个命令搜索文件了:

    $ locate -b -i "*lamport*pdf*"

    Catfish

    这个也是老将。Catfish 已被大多数流行的 Linux 发行版所收录,因此,你只需通过所用发行版的包管理工具即可安装。如果你对 Catfish 的源代码感兴趣,那么也可从作者的网站获取。

    但本质上 Catfish 搜索文件也只是调用 find、locate、slocate 等命令。Catfish 可设定不同的搜索条件,如精确匹配、搜索隐藏文件、全文搜索、限制搜索结果数量等。此外,也可选择要执行搜索的目录,并对搜索结果执行相应操作。

    Tracker

    一个 Gnome 下的项目,不单纯是个搜索工具,它要做的是搜索引擎、搜索工具和元数据存储系统,数据组织、存储、分类的一站式解决方案。

    地址:https://wiki.gnome.org/Projects/Tracker/

    Beagle

    没用过,别人推荐的,依赖 Java,太大不想装(30MB)。

    官网:http://beagle-project.org/

    Fasd

    新将们

    深度文件管理器(1.4版本+)

    深度最近发布了 15.4 RC,文件管理器更新到1.4版本,加入了快速搜索文件的功能。

    下面 GIF 图片展示了新建一个文件夹后迅速搜索,以检测深度文件搜索的效率:

    4a62c38bec7e

    深度实时文件搜索

    可以看到即使是刚创建的文件,深度文件管理器也可以快速搜索出来。

    不足之处在于对于 root 用户(整个硬盘环境搜索)来说,效率就不是那么好了。也不能搜索其他挂载盘,除非你进入到该磁盘再搜索。

    PS:这次更新界面还不错。很多地方有了调整。系统全局的半透明磨砂处理很舒服。

    4a62c38bec7e

    Deepin

    FSearch

    4a62c38bec7e

    FSearch

    速度很快,作者自称在 windows 下是 everything 的粉,对 Linux 下各种搜索引擎都不满意(作者说试用过 ANGRYsearch、Tracker、CatFish、regain、fzf 等),于是用 C 和 GTK3 做了一个。

    软件可以选择使用白名单索引,而且每次打开程序时自动增量更新索引

    ANGRYsearch

    号称要做 Linux 版的 Everything,用 QT5 做的。与 FSearch 一样界面和操作都类似 everything,作者也提及了 FSearch。速度也不错,不过相比上面那个可能功能有些差异(不是差距)。

    软件可以自动更新索引,适合使用 QT 编写的桌面环境。

    4a62c38bec7e

    ANGRYsearch

    fzf

    地址:https://github.com/junegunn/fzf

    一个命令行的模糊搜索工具,FSearch 作者也推荐使用。速度还不错,即打即出结果,几乎没有延迟(当然得花一段时间索引)。

    4a62c38bec7e

    支持 vim

    因为是 Go 写的,所以跨平台(不过 Windows 下都有 Everything 了吧)。

    Albert

    吐槽一句 README 的 GIF 图片居然有 9MB 那么大,打开一下没了 10MB 流量,心疼。

    下面是自己录制的 GIF,一个演示。

    4a62c38bec7e

    快速搜索

    展开全文
  • robots协议屏蔽搜索引擎抓取Robots协议(也称为爬虫...有时候有些页面访问消耗性能比较高不想让搜索引擎抓取,可以在根目录下放robots.txt文件屏蔽搜索引擎或者设置搜索引擎可以抓取文件范围以及规则。文件写法:User...

    robots协议屏蔽搜索引擎抓取

    Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。

    有时候有些页面访问消耗性能比较高不想让搜索引擎抓取,可以在根目录下放robots.txt文件屏蔽搜索引擎或者设置搜索引擎可以抓取文件范围以及规则。

    文件写法:

    User-agent: 这里的代表的所有的搜索引擎种类,*是一个通配符

    Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录

    Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录

    Disallow: /phpinc/ 这里定义是禁止爬寻phpinc目录下面的目录

    Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以”.htm”为后缀的URL(包含子目录)

    Disallow: /? 禁止访问网站中所有包含问号 (?) 的网址

    Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片

    Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件

    Allow: /framework/ 这里定义是允许爬寻framework目录下面的目录

    Allow: /temp 这里定义是允许爬寻temp的整个目录

    Allow: .htm$ 仅允许访问以”.htm”为后缀的URL

    Allow: .gif$ 允许抓取网页和gif格式图片

    Sitemap: 网站地图 告诉爬虫这个页面是网站地图

    例1. 禁止所有搜索引擎访问网站的任何部分

    User-agent: *

    Disallow: /

    例2. 允许所有的robots访问 (或者也可以建一个空文件 “/robots.txt” file):

    User-agent: *

    Allow: /

    例3. 禁止某个搜索引擎的访问:

    User-agent: BadBot

    Disallow: /

    例4. 允许某个搜索引擎的访问:

    User-agent: Baiduspider

    allow:/

    Sitemap网站地图注意事项:

    Sitemap:与https://www.hao-blog.com/sitemap.xml 之间的连接是英文冒号如下:

    Sitemap:https://www.hao-blog.com/sitemap.xml

    Sitemap:https://www.hao-blog.com/sitemap.txt

    Sitemap:https://www.hao-blog.com/sitemap.html

    以下是错误的书写形式:

    Sitemap:https://www.hao-blog.com/sitemap.xml

    Sitemap:https://www.hao-blog.com/sitemap.txt

    Sitemap:https://www.hao-blog.com/sitemap.html

    挡在浏览器中看到时错误的就会显示乱码状态

    a32ec0d8f6ec68e2e656527b5d590d08.png

    展开全文
  • 什么是robots.txt文件?搜索引擎使用spider程序自动访问互联网上...您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。请注意,仅当您的网站包...

    什么是robots.txt文件?

    搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。

    请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

    robots.txt文件放在哪里?

    robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。网站 URL

    相应的 robots.txt的 URL

    http://www.w3.org/

    http://www.w3.org/robots.txt

    http://www.w3.org:80/

    http://www.w3.org:80/robots.txt

    http://www.w3.org:1234/

    http://www.w3.org:1234/robots.txt

    http://w3.org/

    http://w3.org/robots.txt

    我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?

    如果其他网站链接了您robots.txt文件中设置的禁止收录的网页,那么这些网页仍然可能会出现在百度的搜索结果中,但您的网页上的内容不会被抓取、建入索引和显示,百度搜索结果中展示的仅是其他网站对您相关网页的描述。

    禁止搜索引擎跟踪网页的链接,而只对网页建索引

    如果您不想搜索引擎追踪此网页上的链接,且不传递链接的权重,请将此元标记置入网页的 部分:

    如果您不想百度追踪某一条特定链接,百度还支持更精确的控制,请将此标记直接写在某条链接上:

    sign in

    要允许其他搜索引擎跟踪,但仅防止百度跟踪您网页的链接,请将此元标记置入网页的 部分:

    禁止搜索引擎在搜索结果中显示网页快照,而只对网页建索引

    要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的 部分:

    要允许其他搜索引擎显示快照,但仅防止百度显示,请使用以下标记:

    注:此标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。

    我想禁止百度图片搜索收录某些图片,该如何设置?

    禁止Baiduspider抓取网站上所有图片、禁止或允许Baiduspider抓取网站上的某种特定格式的图片文件可以通过设置robots实现,请参考“robots.txt文件用法举例”中的例10、11、12。

    我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?

    如果其他网站链接了您robots.txt文件中设置的禁止收录的网页,那么这些网页仍然可能会出现在百度的搜索结果中,但您的网页上的内容不会被抓取、建入索引和显示,百度搜索结果中展示的仅是其他网站对您相关网页的描述。

    robots.txt文件的格式

    "robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:

    ":"。

    在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow和Allow行,详细情况如下:

    User-agent:

    该项的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到"robots.txt"的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则对任何robot均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名为"SomeBot"只受到"User-agent:SomeBot"后面的Disallow和Allow行的限制。

    Disallow:

    该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀,以Disallow项的值开头的URL不会被robot访问。例如"Disallow:/help"禁止robot访问/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"则允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。"Disallow:"说明允许robot访问该网站的所有url,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"不存在或者为空文件,则对于所有的搜索引擎robot,该网站都是开放的。

    Allow:

    该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL是允许robot访问的。例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。

    需要特别注意的是Disallow与Allow行的顺序是有意义的,robot会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL。

    使用"*"和"$":

    Baiduspider支持使用通配符"*"和"$"来模糊匹配url。

    "$" 匹配行结束符。

    "*" 匹配0或多个任意字符。

    URL匹配举例Allow或Disallow的值

    URL

    匹配结果

    /tmp

    /tmp

    yes

    /tmp

    /tmp.html

    yes

    /tmp

    /tmp/a.html

    yes

    /tmp/

    /tmp

    no

    /tmp/

    /tmphoho

    no

    /tmp/

    /tmp/a.html

    yes

    /Hello*

    /Hello.html

    yes

    /He*lo

    /Hello,lolo

    yes

    /Heap*lo

    /Hello,lolo

    no

    html$

    /tmpa.html

    yes

    /a.html$

    /a.html

    yes

    htm$

    /a.html

    no

    robots.txt文件用法举例例1. 禁止所有搜索引擎访问网站的任何部分

    下载该robots.txt文件

    User-agent: *

    Disallow: /

    例2. 允许所有的robot访问

    (或者也可以建一个空文件 "/robots.txt")

    User-agent: *

    Disallow:

    或者

    User-agent: *

    Allow: /

    例3. 仅禁止Baiduspider访问您的网站

    User-agent: Baiduspider

    Disallow: /

    例4. 仅允许Baiduspider访问您的网站

    User-agent: Baiduspider

    Disallow:

    User-agent: *

    Disallow: /

    例5. 禁止spider访问特定目录

    在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即robot不会访问这三个目录。需要注意的是对每一个目录必须分开声明,而不能写成 "Disallow: /cgi-bin/ /tmp/"。

    User-agent: *

    Disallow: /cgi-bin/

    Disallow: /tmp/

    Disallow: /~joe/

    例6. 允许访问特定目录中的部分url

    User-agent: *

    Allow: /cgi-bin/see

    Allow: /tmp/hi

    Allow: /~joe/look

    Disallow: /cgi-bin/

    Disallow: /tmp/

    Disallow: /~joe/

    例7. 使用"*"限制访问url

    禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。

    User-agent: *

    Disallow: /cgi-bin/*.htm

    例8. 使用"$"限制访问url

    仅允许访问以".htm"为后缀的URL。

    User-agent: *

    Allow: .htm$

    Disallow: /

    例9. 禁止访问网站中所有的动态页面

    User-agent: *

    Disallow: /*?*

    例10. 禁止Baiduspider抓取网站上所有图片

    仅允许抓取网页,禁止抓取任何图片。

    User-agent: Baiduspider

    Disallow: /*.jpg$

    Disallow: /*.jpeg$

    Disallow: /*.gif$

    Disallow: /*.png$

    Disallow: /*.bmp$

    例11. 仅允许Baiduspider抓取网页和.gif格式图片

    允许抓取网页和gif格式图片,不允许抓取其他格式图片

    User-agent: Baiduspider

    Allow: /*.gif$

    Disallow: /*.jpg$

    Disallow: /*.jpeg$

    Disallow: /*.png$

    Disallow: /*.bmp$

    例12. 仅禁止Baiduspider抓取.jpg格式图片

    User-agent: Baiduspider

    Disallow: /*.jpg$

    展开全文
  • 推荐几款优秀的、甚至可以代替谷歌的搜索引擎。本文将要推荐的搜索引擎分为4类,分别是国内可使用、国内不可使用、视频搜索、特殊。每个搜索引擎都将展示网址、介绍、效果图。

    前言

    本推荐参照网站searchenginejournal.com,原版为英文网站,且推荐的部分搜索引擎无法在国内使用,因此推荐阅读本篇博客。
    参照网站链接:17 Great Search Engines You Can Use Instead of Google

    想必大家都被搜索引擎的事情困扰过,百度有大量的广告,谷歌又无法在国内使用,那么到底有没有比较优秀的搜索引擎呢。下面我就来推荐几款优秀的、甚至可以代替谷歌的搜索引擎。本文将要推荐的搜索引擎分为4类,分别是国内可使用、国内不可使用、视频搜索、特殊。每个搜索引擎都将展示网址、介绍、效果图。

    国内可使用

    Bing

    传送门:Bing
    网址:https://cn.bing.com/

    介绍:
    国内可以使用。
    分为国内版和国际版,点击标签即可切换,且会切换对应的界面语言,中文/英文。
    Bing的图片搜索GUI要优于它的竞争对手,而且直观得多。
    Bing也为视频提供了同样干净的用户体验,使其成为视频搜索的首选源。
    截至2020年1月,微软网站处理了美国四分之一的搜索查询。

    效果图:
    在这里插入图片描述

    Baidu

    传送门:Baidu
    网址:https://www.baidu.com/

    介绍:
    国内可使用。
    不做过多介绍,用过的都知道。
    存在大量广告,搜索结果排序不合理,当做备用的搜索引擎还是可以的。

    效果图:
    在这里插入图片描述

    Yandex

    传送门:Yandex
    网址:https://yandex.com/

    介绍:
    国内可以使用。
    想要在美国以外寻找搜索视角?
    超过45%的俄罗斯互联网用户使用Yandex。白俄罗斯、哈萨克斯坦、土耳其和乌克兰也在使用。
    Yandex是一个总体上易于使用的搜索引擎。作为额外的奖励,它提供了一套非常酷的工具

    效果图:
    在这里插入图片描述

    Swisscows

    传送门:Swisscows
    网址:https://swisscows.com/

    介绍:
    国内可以使用。
    隐私性较好。
    它以尊重用户隐私为荣,从不收集、存储或跟踪数据。
    它使用人工智能来确定用户查询的上下文。
    随着时间的推移,Swisscows承诺会以惊人的准确性回答你的问题。

    效果图:
    在这里插入图片描述

    OneSearch

    传送门:OneSearch
    网址:https://www.onesearch.com/

    介绍:
    国内可以使用。
    OneSearch在2020年1月被Verizon Media推出,是专注于隐私的搜索引擎。
    它承诺:
    没有cookie追踪,重新定位,或个人资料。
    不得与广告商共享个人资料。
    不存储用户搜索历史。
    公正的,未经过滤的搜索结果。
    加密的搜索词。

    效果图:
    在这里插入图片描述

    Qwant

    传送门:Qwant
    网址:https://www.qwant.com/

    介绍:
    可在国内使用。
    Qwant是由法国出品的一个搜索引擎,以15种语言面向35个国家开放。
    专注于保护用户的隐私和信息安全,并对移动端性展示进行了专门的优化处理。是一个著名的匿名搜索。

    效果图:
    在这里插入图片描述

    Search Encrypt

    传送门:Search Encrypt
    网址:https://www.searchencrypt.com/

    介绍:
    国内可以使用,但只能搜索英文。
    Search Encrypt是一个私人搜索引擎,使用本地加密,以确保您的搜索保持私有。
    它使用一种加密方法的组合,包括安全套接字层加密和AES-256加密。
    当您输入一个查询时,Search Encrypt将从其搜索合作伙伴的网络中提取结果并交付所请求的信息。
    Search Encrypt的一个最好的部分是,您的搜索词最终将过期,因此您的信息将保持私密。

    效果图:
    在这里插入图片描述

    国内不可使用

    Google

    传送门:Google
    网址:https://www.google.com/

    介绍:
    国内不可使用。
    Google搜索引擎主要的搜索服务有:网页,图片,音乐,视频,地图,新闻,问答。
    其中,Google学术 广受研究人员的欢迎。

    效果图:
    在这里插入图片描述

    DuckDuckGo

    传送门:DuckDuckGo
    网址:https://duckduckgo.com/

    介绍:
    国内不可使用,要使用需要特殊方法。
    DuckDuckGo不会收集或存储您的任何个人信息。
    这意味着你可以安心地进行搜索,而不必担心电脑屏幕上的恶魔会盯着你。
    对于那些希望保持自己的浏览习惯和个人信息隐私的人来说,DuckDuckGo是完美的选择。

    效果图:
    在这里插入图片描述

    StartPage

    传送门:StartPage
    网址:https://www.startpage.com/

    介绍:
    国内不可使用,要使用需要特殊方法。
    StartPage提供来自谷歌的答案,对于那些喜欢谷歌的搜索结果,但不喜欢被跟踪和存储搜索历史的人来说,这是完美的选择。
    它还包括URL生成器、代理服务和HTTPS支持。URL生成器特别有用,因为它不需要收集cookie。相反,它会以促进隐私保护的方式记住你的设置。

    效果图:
    在这里插入图片描述

    Wiki.com

    传送门:Wiki.com
    网址:https://www.wiki.com/
    维基百科官网:https://en.wikipedia.org/wiki/Main_Page

    介绍:
    国内不可使用。
    Wiki.com从网上数千个维基百科中提取结果。
    对于那些喜欢像维基百科这样的社区信息的人来说,它是一个完美的搜索引擎。

    效果图:
    在这里插入图片描述

    视频搜索

    Bilibili

    传送门:Bilibili
    网址:https://www.bilibili.com/

    介绍:
    国内可以使用。
    包含动画、音乐、电影、等内容。
    需要注意的是,部分内容需要充值大会员才可以观看,支持正版。

    效果图:
    在这里插入图片描述

    电影盒子

    传送门:电影盒子
    网址:http://www.tv8box.com/
    域名发布页:链接

    介绍:
    国内可以使用。
    包含电影、电视剧、动漫、等各种影视作品。
    资源很全,包含各种VIP资源,免费观看,没有广告。
    可以登录账号,进行收藏等操作,有对应的手机APP。

    效果图:
    在这里插入图片描述

    AGE

    传送门:AGE
    网址:https://www.agefans.cc/

    介绍:
    国内可以使用。
    专门看动漫的网站。
    有登录功能,有对应的手机APP。
    资源很全,想看的都可以找到,还有百度网盘下载功能。

    效果图:
    在这里插入图片描述

    ZzzFun

    传送门:ZzzFun
    网址:http://www.zzzfun.com/

    介绍:
    国内可以使用。
    专门看动漫的网站,有登录功能,有对应的手机APP。

    效果图:
    在这里插入图片描述

    YouTube

    传送门:YouTube
    网址:https://www.youtube.com/

    介绍:
    国内不可使用。
    国际的视频分享网站,若是想看国际视频,选择YouTube绝对没错。

    效果图:
    在这里插入图片描述

    特殊

    该章节介绍一些具有特殊功能的搜索引擎。

    CSDN

    传送门:CSDN
    网址:https://www.csdn.net/

    介绍:
    国内可以使用。
    主要提供计算机相关内容的检索。

    效果图:
    在这里插入图片描述

    Stack Overflow

    传送门:Stack Overflow
    网址:https://stackoverflow.com/

    介绍:
    国内不可使用。
    主要提供计算机相关内容的检索。

    效果图:
    在这里插入图片描述

    CC Search

    传送门:CC Search
    网址:https://search.creativecommons.org/

    介绍:
    国内可以使用。
    主要检索无版权的图片、音乐、视频。
    CC Search应该是你寻找几乎任何类型的无版权内容的第一站。
    这个搜索引擎是完美的,你需要的图片、音乐或视频,不用担心被愤怒的作者追你剽窃他们的作品。
    CC Search的工作方式很简单:它从Soundcloud、Wikimedia和Flickr等平台提取结果,并将结果标记为创作共用材料。

    效果图:
    在这里插入图片描述

    Ecosia

    传送门:Ecosia
    网址:https://www.ecosia.org/

    介绍:
    国内可以使用。
    想要拯救地球,一次拯救一棵树?那就试试这个环保搜索引擎吧!
    这可能会让你感到惊讶,但你的谷歌搜索实际上会产生相当多的二氧化碳。
    因此,Ecosia利用搜索引擎查询产生的收入来种树。
    Ecosia通常需要大约45次搜索来种植一棵新树。

    效果图:
    在这里插入图片描述

    SlideShare

    传送门:SlideShare
    网址:https://www.slideshare.net/

    介绍:
    国内不可使用。
    SlideShare允许您搜索文档化的幻灯片演示文稿(PDF格式)。
    你也可以搜索电子书和pdf文件,如果你要准备一个商业演示文稿,这是一个很好的工具。
    SlideShare还允许您保存幻灯片,甚至下载整个幻灯片在您的本地计算机上使用

    效果图:
    在这里插入图片描述

    Internet Archive

    传送门:Internet Archive
    网址:https://archive.org/

    介绍:
    国内不可使用。
    这个搜索引擎提供大量的文档材料,包括数百万免费视频、书籍、音乐和软件。
    本质上,Internet Archive(互联网档案馆)是一个巨大的在线图书馆,在那里你可以访问任何你能想到的东西。

    效果图:
    在这里插入图片描述

    Twitter

    传送门:Twitter
    网址:http://www.twitter.com/

    介绍:
    国内不可使用。
    作为实时搜索引擎,Twitter很强大。在紧急情况下,这是每分钟更新信息的绝佳场所。
    谷歌的算法可能很优秀,但没有什么能比得上实时的Twitter。

    效果图:
    在这里插入图片描述

    结论

    除去Baidu和Google,优秀的搜索引擎还是有很多的。
    若你没有特殊要求,国际通用的Bing就是很好的选择。
    若你比较注重保护隐私,可以尝试Swisscows、OneSearch或Qwant。
    若你可以通过特殊手段科学上网,那么你可以尝试DuckDuckGo或StartPage。
    若你想要检索图片、音乐等资源,可以尝试CC Search或Internet Archive。
    若你想要检索幻灯片,可以尝试SlideShare。
    若你想要检索动漫,可以尝试AGE或ZzzFun。
    若你想要检索视频,可以尝试Bilibili、电影盒子或YouTube。
    若你想在检索的同时拯救地球,为环保贡献一份力量,可以尝试Ecosia。

    展开全文
  • win7系统要找某个文件,可以...所以一般我们都是可以通过打开搜索引擎来加快搜索速度。1、在任务栏空白处点击右键,选择属性;2、在“任务栏属性”界面点击“开始菜单”选卡,然后点击“自定义”;3、在“自定义”菜...
  • ElasticSearch 全文搜索引擎

    千次阅读 2021-11-13 10:23:51
    es也使用 Java 开发并使用 Lucene 作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的 RESTful API 来隐藏 Lucene 的复杂性,从而让全文搜索变得简单。 什么是 Lucene? ES 是在之前的 Luce
  • 我们经常使用搜索引擎。当我们需要查询时,我们可以使用像 Google 这样的搜索引擎来检索最相关的答案。 大多数查询格式是基于文本的。但并不是大多数时候,文本对于找到相关的答案是非常有用的。 例如,你想在...
  • 什么是搜索引擎?有什么作用?01 什么是搜索引擎及搜索系统02 搜索引擎的发展史03 搜索引擎的分类1. 全文搜索引擎2. 元搜索引擎3. 垂直搜索引擎4. 目录搜索引擎 作者:大数据DT 来源:大数据DT 导读:我们现在正...
  • iOS开发中.pch 文件的使用及其相关工程设置 .pch文件 也是一个头文件,pch头文件的内容能被项目中的其他所有源文件共享和访问.是一个预编译文件. 首先说一下pch的作用: 1.存放一些全局的宏(整个项目中都用得上的宏) ...
  • 搜索引擎的整体工作流程如下: 用户通过网络访问元搜索引擎并向服务器发出查询,服务器接收到查询内容后,先访问结果数据库,查询近期记录中是否存在相同的查询,如果存在,返回结果; 如果没有,将查询进行处理...
  • 国外除了Google还有什么搜索引擎?

    千次阅读 2020-12-31 11:15:57
    全球搜索引擎,大收集!!
  • 3. 我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?如果其他网站链接了您...4.禁止搜索引擎跟踪网页的链接,而只对网页建索引如果您不想搜索引擎追踪此网页上的链接,且不传递链...
  • 搜索引擎优化就是更好更便捷的获客通道。 在过去十多年我除了做点技术外,...搜索引擎要把优质的内容展示给用户,实现搜索价值、用户价值,让搜索引擎服务商和用户实现多赢,这样才会有继续生存下去的养分。过去,我
  • 类别:技术杂谈 / 日期:2017-02-01 / 浏览:1990 / 评论:0有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是The Robots META标签。...
  • 搜索引擎语法

    2021-01-24 17:03:20
    搜索引擎语法 使用搜索引擎搜索的时候,可以使用特定的语法来筛选搜索结果,达到精准搜索的目的。 1. + (加号) 搜索结果要求包含两个及两个以上关键字。 【用法】:关键词 【示例】:疑犯追踪+资源 【说明】:相当...
  • 图3 engines.json文件的初始内容 由此可见,只需要在此文件夹中添加对应搜索引擎的信息(名字,网址链接等),便可将新的搜索引擎添加至Zotero软件中。 以“Connected Papers”为例,将对应代码复制到engines.json...
  • 搜索引擎大致可以分为四个部分:搜集、分析、索引、查询。 搜集,就是我们常说的利用爬虫爬取网页。 分析,主要负责网页内容抽取、分词,构建临时索引,计算 PageRank 值这几部分工作。 索引,主要负责通过分析阶段...
  • 常见的 mysql 搜索引擎

    2021-01-18 18:37:24
    简单来说,存储引擎就是指表的类型以及表在计算机上的存储方式。存储引擎的概念是MySQL的特点,Oracle中没有专门的存储引擎的概念,Oracle有OLTP和OLAP模式的区分。不同的存储引擎决定了MySQL数据库中的表可以用不同...
  • 百度搜索引擎语法

    2021-07-23 16:48:30
    filetype :搜索文件的后缀名、扩展名 如:filetype:docx 返回所有以 docx 结尾的 word 文件的 url 地址 关键字+空格+filetype+ :+文件类型 如:凹凸世界 filetype:blv 搜索凹凸世界相关的blv文件 info :...
  • Elasticsearch(简称ES)是一个基于Apache Lucene(TM)的开源搜索引擎,无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。
  • PHP百度云盘搜索引擎爬虫程序源码,一款基于PHP框架的百度云盘磁力搜索引擎框架程序源码,包括了网页前台后台程序,云盘爬虫搜索等一系列完整的搜索引擎相关服务内容,主要基于学习使用,当然,用户也能深度定制一套...
  • mysql中常见的数据库引擎之间的比较 转载自 深入浅出mysql...若要修改默认引擎,可以修改配置文件中的default-storage-engine。可以通过:show variables like ‘default_storage_engine’;查看当前数据库到默认引擎...
  • 搜索引擎语法--实用

    2021-06-28 09:10:58
    搜索引擎是大家在日常生活和工作中必备的工具,是我们查个明星八卦、地址,搜索遇到的某个问题的解决方法,另外,其实搜索引擎的背后,有很多鲜为人知的搜索语法。 1、 filetype 搜索文件的后缀或者扩展名 2、info...
  • 下文我会分享10种搜索技巧,助你快速找到你想要的资料。 01.关键字搜索 关键字搜索是最基础的搜索,这个旨在提取关键字。 比如你的电脑蓝屏了,不是搜“我的电脑为什么蓝屏了?”而是可以直接搜索“电脑蓝屏”。 ...
  • 总体分为三个步骤:第一步准备环境,主要会用到云搜索服务、弹性云服务器和虚拟私有云。云搜索服务(Cloud Search Service)是一个基于Elasticsearch且完全托管的在线分布式搜索服务,为用户提供结构化、非结构化文本...
  • 源码简介 :适用范围:百度云网盘 搜索引擎 ...搜索引擎 , 爬虫 +网站,搜索引擎采用Xunsearch高效搜索,源码很简单,附带安装教程,可二开,这里吾爱免费分享给大家,全自动更新百度云盘内容,全自动采集哦! #...
  • 注意:内置的搜索引擎已在新版中废弃,此文档已过期AKCMS支持两种搜索:基于数据库的字符串搜索和基于搜索引擎的关键词搜索。二者各有优劣,需要根据自己网站的情况自行选择。本文综合多个方面进行比较,供大家...
  • 搜索引擎的常用使用技巧

    千次阅读 2021-07-17 04:49:54
    搜索引擎的常用使用技巧搜索引擎是指根据...谷歌搜索引擎一般情况下可以用来搜索学术性内容, 而和中文有关尤其的诗词相关的中文内容, 笔者习惯使用百度搜索。下面就来谈一下笔者在使用过程中比较常用的几种技巧。一...
  • 海量数据搜索---demo展示百度、谷歌搜索引擎的实现 在我们平常的生活工作中,百度、谷歌这些搜索网站已经成为了我们受教解惑的学校,俗话说得好,“有问题找度娘”。那么百度是如何在海量数据中找到自己需要的...
  • 有些站长比较喜欢将站点上线测试(不喜欢在本地测试),但是又不想被百度等搜索引擎抓取,那么应该怎么暂时屏蔽呢?今天 boke112 就跟大家简单介绍几种方法。方法一:wordpress 站点可以直接登录站点后台 >> ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 232,650
精华内容 93,060
关键字:

文件内容搜索引擎