精华内容
下载资源
问答
  • 如果你是通过浏览器用百度搜索则与新政策完全没关系 正好前不久不少粉丝来问过我这样一个问题:怎么屏蔽手机浏览器上的「跳转某某APP打开查看」提示 那今天阿虚就来教一下怎么解决吧,毕竟这东西的确是有点烦人… ...

    最近阿虚看到个消息说「百度」发布了新政策,禁止网站通过搜索引擎打开后折叠内容强迫下载APP客户端

    听起来似乎是百度难得良心一回?

    但实际上该政策仅限于手机百度APP内

    如果你是通过浏览器用百度搜索则与新政策完全没关系

    正好前不久不少粉丝来问过我这样一个问题:怎么屏蔽手机浏览器上的「跳转某某APP打开查看」提示

    那今天阿虚就来教一下怎么解决吧,毕竟这东西的确是有点烦人…

    屏蔽「跳转某某APP打开查看」这个问题我细看了下,还得分俩类:

    1. 文章只能显示部分,然后提示你需要安装APP才能查看的,这种应该是大家主要想问的
    2. 你手机上装了某个APP,比如知乎,那么你在浏览器中打开知乎的链接,就会自动跳转知乎打开

    第2种情况其实我觉得还好吧…毕竟你都装了APP,跳转用APP查看也没什么吧?

    下文的话,也主要教怎么解决第1种情况,第2种情况会稍微说两句

    ▍1 解决提示你装APP查看全文

    这个问题可能在百度上体现的比较恶心,虽然手动是能避免让它跳转到百度APP查看,但你起码得点击5下

    除百度外CSDN、知乎、虎扑、豆瓣…等等啥的好像也有这个情况

    那下面就说下怎么解决这个问题吧

    ● 1.1 阅读模式

    其实像百家号这种情况,只需要将浏览器切换到「阅读模式」便可解决,如今很多浏览器都有这个功能

    iPhone 的 Safari 浏览器切换到阅读模式的方式是点击浏览器左上角

    其他浏览器怎么切换到到阅读模式这里就不说了哈,反正不是在浏览器的顶部,就是在浏览器底部,或者菜单栏里面

    如果浏览器有这个功能的话,肯定是随便找一下就能找到的~~(安卓上的Via浏览器没有阅读模式)~~

    ● 1.2 微信的奇妙用法

    众所周知,微信一直对外链限制的死死的,甚至狠起来连腾讯自家的应用都 “ 杀 ”

    去年微信安全中心发过一样一个处理公告:《对第三方违规导流链接的处理公示》

    为了避免对用户造成误导,要求各种网站禁止弹出「跳转到XXX打开」的提示,否则就会在微信上被禁止访问

    各大厂商自然也不会傻到放弃微信这12亿的用户,自然纷纷照办

    于是,我们反倒可以利用这一点——比如,在微信里访问百度 baidu.com

    可以看到上图哈,点击「︾」按钮后,直接就展开内容了,并不会有任何弹窗提示

    除外知乎、虎扑、快手、QQ音乐、QQ浏览器、腾讯视频、网易新闻、好看视频…等等链接,都可以通过在微信内打开直接访问

    ● 1.3 切换为桌面模式

    安卓、苹果通用的还有个方法是切换为桌面模式

    对于「贴吧」这种,在移动端不下载APP就无法查看全文的,可以通过切换手机浏览器为桌面模式来解决

    iPhone 的 Safari 浏览器切换桌面模式的地方还是在左上角

    切换之后,我们再调整一下页面显示大小就OK了

    PS:某些网站(尤其小说、视频网站)的广告其实是移动版专享的,你只要在 Safari 里请求桌面网站,这些不正经的广告就都消失了(而且这类网站在手机上访问桌面版其实和移动版显示是一样的)

    ● 1.4 禁止百度的JS权限

    这个弹窗提示实际是靠 Java Script 代码来实现的,所以其实只要你禁止网站启用 Java Script 即可解决

    而这也是比较推荐的方法

    不过能单独禁用某一网站 Java Script 功能的浏览器似乎不多,这里阿虚说几个自己知道的

    ❶安卓

    安卓端可以用 Via浏览器(还有X浏览器也可以),点击有弹窗的网站页面左上角,即可进行网站设定

    这里面对百家号的网站禁用掉 Java Script 即可

    禁止 Java Script 之后,再刷新百家号的网页,你就会发现直接就其不仅没弹窗让你下载百度APP了,而且直接就展开全文了!(这里阿虚就不录屏演示了)

    ❷苹果

    苹果手机则可以用 Alook浏览器,还是一样的点击网页的左上角,可以进行网站设置,通用的禁止掉JavaScript 功能即可

    ● 1.5 改浏览器UA

    另外下面这个方法也行

    安卓手机的话,把浏览器的UA标识改为 iPhone,就再也不会出现APP跳转了

    就是欺骗百度你是 iPhone,结果跳不到苹果商店哈哈哈

    同理 iPhone 可以把浏览器UA改为安卓(Alook浏览器可以改)

    ● 1.6 安装油猴脚本(安卓)

    我之前也写过多次,解决某一网站问题,基本上都靠油猴脚本

    你可以针对各种有弹出某某APP打开提示的网站,去装对应的油猴脚本来屏蔽

    而能在手机上安装油猴脚本的浏览器也挺多的Yandex、Kiwi、海阔视界、Via

    ❶海阔视界

    下载地址:https://axutongxue.com/(6-10栏)

    其中海阔视界是最简单的,因为其内置了油猴脚本管理器,还能安装Via插件

    ❷Via

    下载地址:https://axutongxue.com/(6-10栏)

    Via浏览器可以直接到Via轻插件分享社区安装插件:http://m.via-app.cn/

    如果你懂一些通配符和域名的知识,也是可以安装油猴脚本的

    比如阿虚想装这个油猴脚本:https://greasyfork.org/zh-CN/scripts/420496

    然后手动填写脚本作用的域名:*.baidu.com/*,接着点击确定,就能生效了

    不过缺点是有些油猴脚本可能会在Via浏览器上失效,具体哪些能用还得自己多测试

    ❸Kiwi 如何安装油猴脚本

    下载地址:https://axutongxue.com/(6-10栏)

    如果愿意折腾,其实 Yandex、Kiwi 是更优的选择,毕竟这俩是可以安装浏览器扩展

    而油猴脚本管理器只是众多扩展之一而已

    之前的文章好像都没提过这俩浏览器怎么安装浏览器扩展,今天就多嘴两句吧

    下面以 Kiwi 浏览器为例子,说一下怎么安装 ViolentMonkey 暴力猴的油猴脚本管理器(同为油猴脚本管理器的篡改猴 Tampermonkey 阿虚测试过安装不了),Yandex可以参考这个

    先到下面的地址下载暴力猴扩展文件

    • 国内可访问Chrome扩展下载地址1:https://chrome.zzzmh.cn/info?token=jinjaccalgkegednnccohejagnlnfdag
    • 国内可访问Chrome扩展下载地址2:https://www.gugeapps.net/webstore/detail/violentmonkey/jinjaccalgkegednnccohejagnlnfdag

    下载的目录一般是在手机根目录的 Download 文件夹

    找到下载的压缩包,点击它,解压

    这里需要注意的是:解压后的crx文件,在文件管理器中可能是看不见的,但的确是被解压了出来

    回到 Kiwi 浏览器当中,在主页,点击右上角打开「扩展程序」然后打开扩展程序的「开发者模式」,接着点击「Load」然后在文件管理器中找到刚刚解压出来的crx文件,就能进行安装了

    装上之后还不能够用,你要手动启用暴力猴扩展

    接着就能去 greasfork.org 安装油猴脚本了

    打开这个油猴脚本地址:https://greasyfork.org/zh-CN/scripts/420496

    现在你访问百家号的内容,弹窗就会变成下图了…

    点击继续便可以继续在浏览器上查看文章

    ● 1.7 安装Via轻插件(iOS)

    虽然 iOS上目前还没有能装油猴脚本的浏览器,不过alook浏览器现在已经支持 Java Script 脚本了

    这也是 iOS 上首款支持 JavaScript 脚本的浏览器!

    不会写 JavaScript 脚本也没事,安卓上的 Via 浏览器搭建了一个很好的 JavaScript 脚本分享社区:http://m.via-app.cn/

    大家直接用 Alook 打开以上链接,就能直接去找到下面这些扩展进行安装了

    ▍2 点开一个网址时不让它自动跳转到APP

    那如果你手机上装了某个APP,比如知乎

    然后你在浏览器打开知乎的链接时,一般都是会自动跳转到知乎APP进行查看的

    好像有一些粉丝也想问这种情况怎么能不跳转,直接就在浏览器中查看也是有办法的

    ● 2.1 换浏览器

    安卓、苹果通用的方法就是换浏览器了

    安卓端用之前推荐的海阔视界、Via、X浏览器、Kiwi、Yandex等等浏览器都是可以解决这个问题

    苹果端的Alook浏览器也可以的

    ● 2.2 苹果设备上长按链接

    比如虎扑,默认如果你手机上装有虎扑APP的话,打开虎扑的链接会直接唤醒你的虎扑APP

    但你只需要下面这样操作一次,后面就都会在浏览器中打开了

    长按虎扑的链接,你可以看到此时会让你选择「打开(Safari中)」还是「在“虎扑”中打开」,这里选择第一个即可

    之后你再打开虎扑的链接,就都会用Safari打开了

    展开全文
  • 腾讯面试题: 百度搜索为什么那么快?

    万次阅读 多人点赞 2020-05-07 19:17:06
    我还记得去年面腾讯时,面试官最后一个问题是:百度/google的搜索为什么那么快? 这个问题我懵了,我从来没想过,搜素引擎的原理是什么 然后我回答:百度爬取了各个网站的信息,然后进行排序,当输入关键词的时候...

    我还记得去年面腾讯时,面试官最后轻飘飘的问:百度/google的搜索为什么那么快?

    这个问题我懵了,我从来没想过,搜索引擎的原理是什么

    然后我整整思考了2000ms,回答:百度爬取了各个网站的信息,然后进行排序,当输入关键词的时候进行文档比对……巴拉巴拉

    面试官:这不是我想要的答案

    我内心
    在这里插入图片描述


    这个问题我一直耿耿于怀,终于今天,我把他写出来,以后再问,我直接把这篇文章甩给他!!!

    两个字:倒排,将贯穿整篇文章,也是面试官想要的答案

    首先我们知道,百度肯定是有爬虫,到处爬取网页,进行某种处理。然后通过你输入的关键词进行某种计算再返回给你的

    我们先来看看什么是某种处理

    某种处理

    当百度爬取了海量网页后,每一个网页我们称为”文档“,不可能就杂乱无章的放着,它使用了文档集合,就是类似的文档放在一个集合中

    那什么样的文档算类似呢?相信你猜到了,文档中有相同关键字的就可以放在一个集合中

    来举例说明

    假设全世界只有下面5个文档(网页),文档内容也很简单,就一句话(注意是文档内容,不是标题)

    image-20200507163757569

    百度爬取后,将他们进行编号,然后对文档进行扫描分词,因为百度内部有词库,匹配上的词将被切分,所以文档1号将被切分为【谷歌,地图,之父,跳槽,FaceBook】,后面的文档也一样,然后对切分出来的单词进行倒排处理,形成倒排列表

    image-20200507164140174

    啥是倒排处理?右边这堆杂乱无章的数字咋来的?别急,仔细看,1号单词“谷歌”是不是在1,2,3,4,5号文档都出现过?9号单词“离开”是不是只在3号文档出现过?

    是的,倒排列表所做的,就是保存对应单词所出现过的文档编号

    我想你开始明白他的目的了,当我们搜索“谷歌”的时候,他就会获得“谷歌”这一单词对应的倒排列表,知道哪些文档包含他,然后将这些文档提取出来返回给你,这就是一种单词映射文档的方法

    但是,没那么简单,因为只有这样的话,我在一篇博客上把所有的单词都写上,这样杂乱无章的文章岂不是要被推荐给全体中国人???

    所以倒排列表还要保存下列信息

    image-20200507164836182

    保留的信息变成了二元组,比如16号单词“网站”的(5:1),5表示出现的文档编号,1表示出现的次数,也就是说,有了这个信息,如果一个单词在文档中频率越高(英文缩写TF),搜索引擎就可以把他排在前面推给你

    除了频率,还有位置,比如”谷歌“就是在1号文档中出现了一次的单词,位置在第一个,用<1>表示

    image-20200507165150616

    可能到这你有点记不住有哪些网页了,再看一遍比对下

    image-20200507163757569

    这样子,搜素引擎就可以根据你的关键词在倒排列表中找到含有这个关键词的文档集合,然后根据关键词在文档集合中各个文档出现的频率和位置综合判断返回给你排序后的文档

    上句话比较长,加粗部分连在一起读意思不变

    实际上很多搜索引擎基本就是这样做的,只不过各家还有别的参考标准,比如百度还会参考热度,你的搜索记录,还有网站给的钱(你懂的)等等综合打分,按评分高低返回搜索结果的排序

    上面的所以记录处理好后都会存放在磁盘中,然后等你关键词来后再调入内存


    假设世界上只有5个文档,那么上面的东西完全够了,但实际上,世界上有亿万个文档,此时,问题的性质已经变了,不是找不找得到的问题,而是怎么找更快,更准的问题,这需要算法,也就是我们上面提到的某种计算

    某种计算

    第一个问题就是,词库那么多,当你输入“苹果”的时候,百度如何将你的关键词和他内部倒排列表的“苹果”一词联系起来?

    计算机是不认识“苹果”的,这里,可以通过哈希的方法将“苹果”转换为一个编号

    所谓哈希,即是将一个词通过某种算法映射为一个符号,比如“将单词转换为其长度”就是一种算法,虽然很low,这样“苹果”就是2,“梨”就是1,不同的哈希算法有不同的转换结果,但是必然会有一个东西——哈希冲突,比如“桃子”也是2,此时,需要使用链表,也称冲突表,将编号相同的单词链在一起

    image-20200507170500512

    当我们搜索“苹果”的时候,经过哈希计算,得知其编号为2,然后发现2中有一个链表,里面可能保存着“苹果”,”桃子”,“蘑菇”等,然后再遍历链表找到苹果即可

    这里和java8中的hashmap思想一致,不过链表也会过长,所以可以使用别的数据结构代替,比如红黑树,b树等

    解决了第一个问题,我们就可以通过关键词获得他的Id,然后得到所建立的倒排列表了,比如“谷歌

    image-20200507171253060

    第二个问题,由于文档的数量庞大,我们获取的文档往往编号位数都很多,而不像上图那样1,2,3,4,5,导致倒排列表无谓的扩大,所以我们这里进行作差

    在这里插入图片描述

    就是后面的文档编号减去前面的,在取文档(从磁盘中读取)的时候加回来即可

    第三个问题,如何从磁盘中读取文档

    现在我们已经有了倒排列表

    在这里插入图片描述

    可以有两种方法从磁盘中读取文档

    两次遍历法

    第一遍,扫描文档集合,找到文档数量N, 文档集合内所包含的不同单词数M,和每个单词出现的频率DF(如下图),以及一些别的必要信息,这些东西所占内存加起来,得到需要开辟的内存空间,

    在这里插入图片描述

    同时这个空间是以单词为单位划分,比如“谷歌”一词有5篇文档,

    1. 第一遍主要就是确定要开辟多大的内存空间来显示文档

    2. 第二遍扫描,就是边扫描,匹配对应的文档编号(三元组中的第一个数),载入内存

    但是这个方法有一个问题,那就是文档集合有多大,内存就有多大,所以,很可能内存会溢出,不过都放在内存中速度也很快,这是一种空间换时间的方法

    相信你发现了,但凡涉及到读取,一定有两种以上的方法,空间优先或是时间优先,第二种就是时间换空间——排序法

    排序法

    现在我们只用固定大小的内存,如何从上图中的倒排列表得知每个单词对应的文章集合所需要的内存空间有多少呢?

    我们需要解析文档,构造(单词ID,文档ID,单词频率)三元组,然后进行排序,按单词ID,文档ID,单词频率先后排,最后如果规定的内存满了,就将这些三元组通通写入一个临时文件A中

    在这里插入图片描述

    为什么要这样呢?想想看,如果我们最后拿到了一个(单词A,文档A,单词频率),我们就可以很轻松的知道一个单词对应哪个文档,和对应的频率,

    也就是一个三元组告诉我们单词A对应的文档A,另一个三元组告诉我们单词A对应文档B……,这些三元组加起来我们就知道了单词A对应的文档集合,就可以知道他需要多少内存空间来填补这些文档了

    可能解析50个文档后规定的内存就满了,然后把这些三元组们写入磁盘临时文件A,就可以再读下一篇50个文档了,注意,词典是不断增加的,比如前50个文档只有上面7个单词,后50个文档可能出现了别的单词,此时要插入词典中,词典一直在内存

    这样,只用固定大小的内存就可以50一批的解析完所有文档,写入了一个个的临时文件A,B,C,D,再将这些临时文件合并,就是把他们分别读入内存中的缓冲区,合成最终索引后再写入磁盘,这样通过最终索引就知道有哪些单词对应多少文档,还有频率,然后根据这些开辟内存空间读取进入内存返回给你即可

    image-20200507181036502

    排序法叙述起来比较复杂,但是其实理解起来很简单,耐心读一定能懂哦

    限于篇幅,这里只讲了你输入关键词到他返回给你大致的网页的过程,其实,百度如何爬取网页?如何保证网页的时效性?如何筛选垃圾网站?如何分布式存储海量网页?如何应对超长关键字查询?如何根据用户历史记录精准分析用户意图?
    等等都需要大量的篇幅详解,一篇文章不可能讲完,下次有机会再分析吧

    作者简介 :【小松漫步】,微信公众号同名,喜欢读书和收集书,文章参考自《这就是搜索引擎核心技术详解》,关注公众号回复【搜索引擎】,即可获取资源,一起交流学习吧

    展开全文
  • 通过tkinter实现百度搜索

    万次阅读 2020-01-11 22:15:12
    百度搜索 已打包成 百度搜索.exe """ import tkinter import win32api from selenium.webdriver import Chrome entry = None def callback(): global entry keywords = entry.get() if not keywords: ...
    """
    百度搜索可视化
    """
    import tkinter
    
    import win32api
    from selenium.webdriver import Chrome
    
    entry = None
    
    
    def callback():
        global entry
        keywords = entry.get()
        if not keywords:
            win32api.MessageBox(0, '请输入搜索关键字', '提示', 0)
            return
        chrome = Chrome()
        chrome.get('https://www.baidu.com/')
        chrome.find_element_by_id('kw').send_keys(keywords)
        chrome.find_element_by_id('su').click()
    
        # bilibili关键字搜索
        # chrome.get('https://www.bilibili.com/')
        # chrome.find_element_by_xpath('//form[@id="nav_searchform"]/input').send_keys(keywords)
        # chrome.find_element_by_xpath('//div[@class="nav-search-btn"]/button').click()
    
    
    def main():
        global entry
        tk = tkinter.Tk()
        # tk.resizable(width=False,height=False)  # 固定窗体大小?无效
        tk.title('百度搜索')
    
        # 1.设置窗体居中
        # screenwidth = tk.winfo_screenwidth()  # 获取屏幕宽度
        # screenheight = tk.winfo_screenheight()  # 获取屏幕高度
        # # 计算窗体大小,位置参数,width,height:窗体宽高
        # width = 100
        # height = 50
        # size = '%dx%d+%d+%d' % (width, height, (screenwidth - width) / 2, (screenheight - height) / 2)
        # tk.geometry(size)  # 设置窗体位置为屏幕居中
    
        # 2.设置窗体右下角,无效
        # screenwidth = tk.winfo_screenwidth()  # 获取屏幕宽度
        # screenheight = tk.winfo_screenheight()  # 获取屏幕高度
        # print(screenwidth,screenheight)
        # # 计算窗体大小,位置参数,width,height:窗体宽高
        # width = 100
        # height = 50
        # size = '%dx%d+%d+%d' % (width, height, (screenwidth - width), (screenheight - height))
        # tk.geometry(size)  # 设置窗体位置为屏幕右下角
    
        # 获取窗体x,y
        # tk.update()
        # print(tk.winfo_x())
        # print(tk.winfo_y())
    
        tk.geometry('+0+0')  # 固定屏幕左上角
        # tk.geometry('+1440+770')
    
        entry = tkinter.Entry(tk)
        entry.pack()
    
        button = tkinter.Button(tk, text='百度一下', command=callback)
        button.pack()
    
        tk.mainloop()
    
    
    if __name__ == '__main__':
        main()
    

     

    展开全文
  • 百度搜索引擎蜘蛛的IP地址段发给大家: 123.125.68.*:这个蜘蛛每每来,另外来的少,示意网站大概要进入沙盒了,或被者降权。 220.181.68.*:每天这个IP段只增不减很有大概进沙盒或K站。 220.181.7.*:代表百度...

    百度搜索引擎蜘蛛的IP地址段发给大家:

    123.125.68.*:这个蜘蛛每每来,另外来的少,示意网站大概要进入沙盒了,或被者降权。

    220.181.68.*:每天这个IP段只增不减很有大概进沙盒或K站。

    220.181.7.*:代表百度蜘蛛IP拜访,预备抓取你工具。

    123.125.66.*:代表百度蜘蛛IP拜访,预备抓取你工具。

    121.14.89.*:这个ip段作为渡过新站调查期。

    203.208.60.*:这个ip段会出现在新站及站点有不正常征象后。

    210.72.225.:这个ip段不连续巡查各站。

    125.90.88.*:广东茂名市电信也属于百度蜘蛛IP重要形成身分,是新上线站较多,另有运用过站长东西,或SEO综合检测形成的。

    220.181.108.95:这个是百度抓取首页的公用IP,如是220.181.108段的话,根本来说你的网站会每天隔夜快照,相对错不了的,我包管。

    220.181.108.92:同上98%抓取首页,大概还会抓取其他(不是指内页)220.181段属于权重IP段此段爬过的文章或首页根本24小时放出来。

    123.125.71.106:抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是首创或收罗文章。

    220.181.108.91:属于综合的,重要抓取首页和内页或其他,属于权重IP段,爬过的文章或首页根本24小时放出来。

    220.181.108.75:重点抓取更新文章的内页到达90%,8%抓取首页,2%其他。权重IP

    展开全文
  • HTML百度搜索框实现(附源码带注释)

    万次阅读 多人点赞 2019-05-11 21:55:44
    1.百度类效果 源码: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <met....
  • 手把手教你用Python爬取百度搜索结果并保存

    千次阅读 多人点赞 2021-02-17 09:00:00
    点击上方“Python爬虫与数据挖掘”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤朝辞白帝彩云间,千里江陵一日还。一、前言大家好,我是崔艳飞。众所周知,百度...
  • 百度搜索引擎工作原理

    万次阅读 2019-01-13 16:52:00
    我们设计这个章节的目的,除了从官方的角度发出一些声音、纠正一些之前的误读外,还希望通过不断更新内容,与百度搜索引擎发展保持同步,给各位站长带来最新的、与百度高相关的信息。本章主要内容分为四个章节,分别...
  • 百度搜索API

    千次阅读 2020-01-20 14:40:00
    最近需要做一个爬取新闻网站的项目,但考虑到各个网站的搜索api都不同,且准确性较低,所以...百度搜索API 基本链接1http://www.baidu.com/s?wd=关键字&cl=类型&pn=页码&ie=gb2312&rn=显示条数&am...
  • [HTML] 百度搜索框的基本实现 源码

    万次阅读 2019-03-16 01:19:37
    在搭建个人网站过程中,我们可能想要在页面加入搜索栏以增加网页实用性,本文主要介绍如何在页面加入百度搜索引擎。
  • HTTPS协议的站点信息更加安全,同时可降低网站被劫持的风险,如网站同时存在HTTP和HTTPS站点,可使用本工具进行认证,便于百度搜索识别网站...以上是百度搜索平台的说明 需要注意的点是: 1、你的网站里不准有htt...
  • 屏蔽烦人的百度搜索热点

    万次阅读 多人点赞 2018-10-08 09:37:13
    开发时,在百度上搜索一些资料时,总是不经意看到百度搜索热点的一些新闻,然后经不住诱惑的标题就不经意间点了进去,然后就是连锁反应了。。等再次回到开发时已经是半小时之后的事了。又要把想要的东西重新捋一遍,...
  • word=代表手机移动搜索,wd=代表电脑PC搜索 sa=ib(首页) sa=tb(上方搜索输入框) sa=np(内页) ================================================================ oq=上一次搜索词(之前利用这个刷出下拉) rq...
  • Selenium实现最简单的百度搜索功能

    千次阅读 2020-09-12 15:44:41
    1.测试环境搭建 安装python3.x,https://www.python.org/downloads/ 安装seleium,此处使用pip安装即可,pip install selenium 下载浏览器驱动 chrome:...下载后创建文件夹C:\driver,添加到系统环境变量P
  • 百度搜索引擎 - 搜索关键字排名 API

    千次阅读 2019-07-08 10:45:22
    如果想用程序模拟在浏览器中使用百度搜索的结果,最先想到的就是爬虫了, 然而,还有一个更简单的方式可以使用,那就行直接使用百度的 API ,返回是 json 格式的数据,简直不要太爽。。。 API: ...
  • 测试案例——测试百度搜索

    千次阅读 多人点赞 2020-04-22 21:38:13
    面试题目描述:如何测试百度搜索框? 功能测试: 1.输入内容。 输入不同形式的内容:字符,图片,音频等输入字符,是否有默认的高频相关字符在下拉菜单中显示出来 内容为空 内容含有特殊字符,如空格等。输入...
  • // 爬取百度搜索并保存成文件 int a = 0 ; while ( a > - 1 ) { a = input . read ( ) ; fout . write ( a ) ; } fout . close ( ) ; File file = new File ( ...
  • 爬取百度搜索结果的爬虫

    万次阅读 热门讨论 2017-08-02 19:26:54
    是这样的,在所谓的网络空间搜索引擎钟馗之眼搜索某cms名称,发现搜索结果只有可怜的17条,而在百度搜索“”Powered by 某cms””,结果有约2,150个,差距还是很大的。而去国外的那个撒旦搜这个cms,结果直接为“No ...
  • 这里以X浏览器为例,百度搜索后,点击右上角 对该网站禁用js(因为是通过这个js脚本进行的客户端判断、出现次数、构造跳转网址的) 5.最后返回刷新即可, 6.最后将会启用百度的**【精简模式】** 重点是:广告、...
  • 百度搜索框测试点

    千次阅读 2021-03-15 15:47:02
    面试题目描述:如何测试百度搜索框? 功能测试: 1.输入内容。 输入不同形式的内容:字符,图片,音频等输入字符,是否有默认的高频相关字符在下拉菜单中显示出来 内容为空 内容含有特殊字符,如空格等。输入前后的...
  • 百度搜索框提示功能

    万次阅读 2019-03-08 16:15:19
    方便的将“百度搜索框(带提示功能)”直接加入到您的网页中。 将以下代码加入到您的网页中, 即可获得带有“搜索框提示”功能的百度搜索框。 &lt;!-- 百度搜索框 --&gt; &lt;form action="...
  • Python爬虫爬取百度搜索内容接口-xpath

    万次阅读 多人点赞 2018-11-12 23:39:55
    完整代码实现如下 import requests import urllib.parse from requests.exceptions import RequestException from urllib.parse import urljoin from lxml import etree import re import json # 百度搜索接口 def ...
  • 百度搜索常用api

    千次阅读 2019-09-26 19:35:03
    http://www.baidu.com/s?wd=关键字 wd(Keyword):查询的关键词...cl=3 cl(Class):搜索类型,cl=3为网页搜索,cl=2为图片搜索;http://video.baidu.com/v?rn=20&pn=0 pn(Page Number):显示结果的页数;http://w...
  • 仿百度搜索实现的一个搜索功能控件,主要包括:自动提示、搜索历史等功能 源码工程地址:示例源码 效果图 安装 由于源码未创建npm包,所以请手动下载工具源码使用,谢谢!~ 使用方式 import {tool_type_enum} from...
  • python 爬取简单的百度搜索结果

    万次阅读 2018-10-22 22:14:41
    爬取百度搜索结果 主要还要借助xpath helper谷歌浏览器的插件来操作更容易找到需要查找信息的xpath位置 还要首先了解一下百度搜索请求的参数 lm默认为0,天数限制,但是好像只有1有用。 默认每页10条信息,rn pn...
  • 百度搜索框制作

    千次阅读 2019-04-07 21:11:35
    好几天没有写文章了,今天想起了百度搜索框的实现,所以就来说一下这个吧 css代码: <style> #box { width: 450px; margin: 200px auto; } #txt { width: 350px; } </style&...
  • JS实现仿百度搜索框(实时返回搜索建议项)

    万次阅读 多人点赞 2018-11-02 16:29:36
    向输入框动态输入时关键词,将当前关键词作为问号参数后面的值,因为要跨域使用百度的接口,所以通过 JSONP 跨域创建 Ajax 请求。回调函数处理返回值。 尝试研究了一下百度的接口,发现原生的 XHR 接口参数有点复杂...
  • Google搜索引擎设置百度搜索

    千次阅读 2020-08-20 09:14:21
    电脑上新安装的Google浏览器一直不能搜索,还以为是浏览器破损了什么的。 百度才想起来Google浏览器在2010年的时候就退出中国...在下拉框里就可以选择你想使用的搜索引擎了|(我选的是百度,用顺手了。)也可以在下
  • 【2020-07】落地页获取百度搜索关键字最新方法

    千次阅读 多人点赞 2020-07-26 22:22:03
    js获取访客百度搜索词最新方法 此方法不仅可以在搜索落地页获取百度的访客搜词关键词,在进入页面后的任意浏览页都能快速获取到本次访客来访的搜索引擎以及搜索关键词。 如果需要实时监控访客的搜索关键词数据请参照...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 341,417
精华内容 136,566
关键字:

百度搜索