精华内容
下载资源
问答
  • 同学写了个网页,页面有一个点赞的按钮,于是恶作剧写了个脚本自动化点赞,直接点到了“23333”……工具:python+splintersplinter安装:sudo pip install splinter打开python,直接命令行下输入:from splinter ...

    同学写了个网页,页面有一个点赞的按钮,于是恶作剧写了个脚本自动化点赞,直接点到了“23333”……

    工具:python+splinter

    splinter安装:

    sudo pip install splinter

    打开python,直接命令行下输入:

    from splinter import Browser
    
    url = 'your website'
    #open your browser
    browser = Browser()
    #visit your website
    browser.visit(url)
    #loop
    while (1):
        #'goodBoy' is the id of the button
        browser.find_by_id('goodBoy').click()
    browser.quit()

    ……于是它会打开你的浏览器,访问指定网站并不断地点击id对应的按钮!

    以上纯属无聊玩一玩~实际上这个功能还是挺实用的!比如下面我们来模拟下登陆126邮箱吧!

    #coding=utf-8
    import time
    from splinter import Browser
    
    def splinter(url):
        browser = Browser()
        #login 126 email websize
        browser.visit(url)
        #wait web element loading
        time.sleep(5)
        #fill in account and password
        browser.find_by_id('idInput').fill('xxxxxx')
        browser.find_by_id('pwdInput').fill('xxxxx')
        #click the button of login
        browser.find_by_id('loginBtn').click()
        time.sleep(8)
        #close the window of brower
        browser.quit()
    
    if __name__ == '__main__':
        websize ='http://www.126.com'
        splinter(websize)

    以上代码实现了:打开126的网站,在用户名和密码栏输入账号密码,并点击登陆按钮进行登陆~

    展开全文
  • 初次实践:python网页自动截图 步骤如下: (1) 安装python selenium 库,推荐使用pip快速安装最新版本 pip install selenium (2) 检查Chrome浏览器的版本,下载对应版本的chromedriver。 (3) 通过地址栏里...

    初次实践:python网页自动截图

    步骤如下:

           (1) 安装python selenium 库,推荐使用pip快速安装最新版本 pip install selenium

           (2) 检查Chrome浏览器的版本,下载对应版本的chromedriver。

           (3) 通过地址栏里输入命令 chrome://version/

     

            在 http://npm.taobao.org/mirrors/chromedriver/ 的网址上下载对应的chromedriver,下载下来的文件是一个压缩包,然后解压就会有一个exe文件,把exe文件copy下来放到chrome的同一路径下(也可直接放在python路径下),然后复制这个路径在环境配置里的系统环境path添加chromedriver的路径配置环境变量。

           (4) 编写测试代码:

    from selenium import webdriver
    import threading
    import time
    import os
    import datetime
    
    def road_situation():
        # 每隔30秒截屏一次
    
        t = threading.Timer(30, road_situation)
        t.start()
        # start = datetime.datetime.now()
        # print(start)
        # 初始化一个谷歌浏览器实例
        driver = webdriver.Chrome()
        driver.maximize_window()
    
        driver.get("https://www.sohu.com/")
        # driver.refresh()
        driver.get_screenshot_as_file(r"E:\PyCharm2017project\Atest\maintest\picture\%s.png" %time.strftime('%Y-%m-%d-%H-%M-%S',time.localtime(time.time())))
        print(os.getcwd())
        # end = datetime.datetime.now()
        # print(end)
        # print(end - start)
        driver.quit()
    
    if __name__ == "__main__":
        road_situation()

            但截取的是打开网页后的全屏,后面下拉的页面没有截取到,没有达到想要的效果,

            如果页面较大,页面会产生上下翻页的效果,屏幕截图无法应对此种页面,截图看到的网页只有一部分。后使用selenium + phantomjs实现网页长截图可以解决这一问题。

     

    法一:使用 selenium + phantomjs实现网页长截图

    步骤如下:

            (1) 安装python selenium 库,推荐使用pip快速安装最新版本 pip install selenium

            (2) 下载phantomjs.exe,将其添加到环境变量 path 中 。方便起见可以直接放在python的安装目录根目录下。下载链接:https://phantomjs.org/download.html

             (3) 编写测试代码

    from selenium import webdriver  ##从selenium库导入webdirver
    import threading
    import time
    import os
    import datetime
    
    def road_situation():
        # 每隔30秒截屏一次
    
        t = threading.Timer(30, road_situation)
        t.start()
        # start = datetime.datetime.now()
        # print(start)
        # 初始化一个谷歌浏览器实例
        ##使用webdirver.PhantomJS()方法新建一个phantomjs的对象,这里会使用到phantomjs.exe,环境变量path中找不到phantomjs.exe,则会报错
        driver = webdriver.PhantomJS()
        driver.maximize_window() #设置phantomjs浏览器全屏显示
    
        #使用get()方法,打开指定页面。注意这里是phantomjs是无界面的,所以不会有任何页面显示
        driver.get("https://www.sohu.com/")
        # driver.refresh()
        driver.get_screenshot_as_file(r"E:\PyCharm2017project\Atest\maintest\picture\%s.png" %time.strftime('%Y-%m-%d-%H-%M-%S',time.localtime(time.time())))
        print(os.getcwd())
        # end = datetime.datetime.now()
        # print(end)
        # print(end - start)
         #关闭phantomjs浏览器,不要忽略了这一步,否则你会在任务浏览器中发现许多phantomjs进程
        driver.quit()
    
    if __name__ == "__main__":
        road_situation()

    网页转PNG图片(截取的png图片):

     

    法二:python将网页转化为pdf:

            (1) 安装python pdfkit 库,推荐使用pip快速安装最新版本,pip install pdfkit

            (2) 下载wkhtmltopdf安装包,并且安装到电脑上,在系统Path变量中添加wkhtmltopdf的bin路径,以便于pdfkit的调用。

    下载链接https://wkhtmltopdf.org/downloads.html

            (3) 编写测试代码

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
    """
    @author:ZSW
    @file:htmltopdf.py
    @time:2020/09/14
    """
    import pdfkit
    import time
    import datetime
    def save_to_pdf(url):
        '''
        根据url,将文章保存到本地
        :param url:
        :return:
        '''
        start = datetime.datetime.now()
        print(start)
        # 本来直接调用pdfkid的from方法就可以了,但是由于我们的wkhtmltopdf安装包有点问题,一直没法搜到,所以只能用本办法,直接配置了wk的地址
        # wkhtmltopdf下载链接: https://wkhtmltopdf.org/downloads.html
        config = pdfkit.configuration(wkhtmltopdf=r'E:\htmltopdf\wkhtmltopdf\bin\wkhtmltopdf.exe')
        pdfkit.from_url(url, r"E:\PyCharm2017project\Atest\maintest\picture\%s.pdf"
                        %time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime(time.time())), configuration=config)
        end = datetime.datetime.now()
        print(end)
        print(end - start)
    
    if __name__ =='__main__':
        url = "https://www.sohu.com/"
        save_to_pdf(url)

    网页转PDF文件:

     

    法三:

    注:如果不是有特别的需求,可以用Chrome浏览器将网页页面另存为PDF的功能,步骤如下:

            (1) 打开需要转为PDF的网页;

            (2) 右击鼠标按键——选择‘打印’——再选择‘另存为PDF’——点击‘保存即可’。

            (3) 打开保存的pdf查看,其效果和法二实现的一样。

    小结:经过简单实践,两种方法都能够实现网页自动长截图,但使用方法二的效率更高些,运行时间较法一短。但对于像搜狐首页这种长下拉的网页,截取的pdf(图片)中 有些图片未加载出来。

    参考链接:https://blog.csdn.net/xc_zhou/article/details/80952168

                      https://www.jb51.net/article/140366.htm

    展开全文
  • python自动输入

    万次阅读 多人点赞 2018-05-23 23:09:11
    首先,我们的目的是用python做一个自动输入,控制的程序,能用的地方也很少。我是最近在登一些学校的网站的时候要用到一些信息,来回的输入又很麻烦,就在网上找了这样一个功能的python库吧,叫做——pyautogui。好...

    (废话)

    这篇文章是我的第一篇文章,写的不好的地方,请大家多多指教哈,谢谢。

    首先,我们的目的是用python做一个自动输入,控制的程序,能用的地方也很少。我是最近在登一些学校的网站的时候要用到一些信息,来回的输入又很麻烦,就在网上找了这样一个功能的python库吧,叫做——pyautogui。

    好,咱们下面进行主题

    1.安装pyautogui库

    我的电脑上用的是win10的python3.6,这个版本不错。(python的环境很不错,直接在官网上就能下,无毒无害,非常牛逼,老爷机也能带的动0)。我们要让我们的python安装pyautogui库。

    我一直用命令指示符的方法。很方便的。

    首先用管理员的身份进入命令指示符(最好管理员,因为我也不知道会出现什么样问题,管理员很牛逼的),然后就这样。


    然后我们直接在他给的语句后面直接输入pip install pyautogui。然后你耐心的等一会,计算机正在安装pyautogui,安装成功的话,会有提示。

    2.检验pyautogui的安装成功

    打开python的idel,然后导入pyautogui的库 import pyautogui。如果是直接出现>>>就说明安装成功了。就想下面这样。


    3.pyautogui的常用函数

    这里我就说几个我用在这个小项目里的,pyautogui中有很多函数,功能很强大,大家如果想了解更多的函数使用,可以参考

    https://muxuezi.github.io/posts/doc-pyautogui.html

    http://blog.topspeedsnail.com/archives/5373

    好了,开始介绍喽。

    3.1第一个pyautogui.click()

    这个函数是用于模拟鼠标的点击动作,比如:pyautogui.click(100,500)就是让鼠标移动到(100,500)这个位置然后点击。

    3.2第二个pyautogui.doubleClick()

    这个函数和上一个很像,确实,这是双击,注意这里的C是大写的,用法和上面一样

    3.3第三个pyautogui.typewrite()

    先举个例子吧。

    pyautogui.typewrite(['1','7','0','6','3','0','0','1','tab'],'0.25')

    前面的数字就是分别打出数字,‘tab’是键盘上的TAB功能键,注意两边是用  [ ]  括起来的。后面的’0.25‘是时间,意思就是打出这几个数字需要多少时间,可大可小很好用。

    pyautogui.typewrite('154642',0.25)也可以这么用,直接打出这几个数字,不需要那么复杂,但是这个不能打出键盘功能键。

    PyAutoGUI键盘表:

    ‘enter’(或‘return’ 或 ‘\n’)

    回车

    ‘esc’

    ESC键

    ‘shiftleft’‘shiftright’

    左右SHIFT键

    ‘altleft’‘altright’

    左右ALT键

    ‘ctrlleft’‘ctrlright’

    左右CTRL

    ‘tab’ (‘\t’)

    TAB

    ‘backspace’‘delete’

    BACKSPACE 、DELETE键

    ‘pageup’‘pagedown’

    PAGE UP 和 PAGE DOWN键

    ‘home’‘end’

    HOME 和 END键

    ‘up’‘down’‘left’,‘right’

    箭头键

    ‘f1’‘f2’‘f3’….

    F1…….F12键

    ‘volumemute’‘volumedown’,‘volumeup’

    有些键盘没有

    ‘pause’

    PAUSE键

    ‘capslock’‘numlock’,‘scrolllock’

    CAPS LOCKNUM LOCK, 和 SCROLLLOCK 键

    ‘insert’

    INSINSERT键

    ‘printscreen’

    PRTSC 或 PRINT SCREEN键

    ‘winleft’‘winright’

    Win键

    ‘command’

    Mac OS X command键

    需要什么功能键在上面上找就行了。在举个功能键的例子。

    pyautogui.typewrite(['enter','a','b','left','x','e'],'0.6')

    不过这个函数也有缺陷,它不能输入汉字,只能输入功能键,数字,字母。

    那么问题来了,如果我们想输入汉字怎么办?

    我想了一个凑合能用的办法,但是不适合大范围输入,如果只要输入个姓名,性别啥的可以完成。

    pyautogui.typewrite(['l','i','h','a','i','g','u','a','n','1',],'0.25')

    大家可以先切入中文输入法试一下,前面的字母就是用中文输入法输入拼音,后面的'1'就是打字中的选择喽。大家能理解这个意思就行了,是不是感觉很粗糙,嘿嘿嘿。

    3.4最后再说一个定位鼠标位置的函数pyautogui.position()

    直接在python的idle中输入pyautogui.position()就行了,它就会返回鼠标的位置。


    最后上一个我自己写的抢课的自动输入的程序,大家参考一下哈。



    展开全文
  • 在日常工作中常常需要重复填写某些...webdriver是python的selenium库中的一个自动化测试工具,它能完全模拟浏览器的操作,无需处理复杂的request、post,对爬虫初学者十分友好。一、环境配置python3.6+selenium库+...

    在日常工作中常常需要重复填写某些表单,如果人工完成,费时费力,而且网络延迟令人十分崩溃。如果能够用程序实现自动填表,效率可以提高一倍以上,并且能够移植到多台计算机,进一步提高工作效率。webdriver是python的selenium库中的一个自动化测试工具,它能完全模拟浏览器的操作,无需处理复杂的request、post,对爬虫初学者十分友好。

    一、环境配置

    python3.6+selenium库+xlrd库+xlwt库

    其中xlrd和xlwt库用于读写excel表中的数据。

    还要下载一个浏览器的driver文件用于打开浏览器,注意要选择与计算机系统相符合的版本(max/windows64位/windows32位)

    将下载下来的driver.exe放到浏览器根目录和python的根目录

    二、打开网页

    以IE浏览器为例,以下两行代码就可以实现打开一个IE浏览器并且访问我们需要填表的网站

    driver=webdriver.Ie()

    driver.get("http://xxxx.com/")

    如果网站需要登陆(需要填表的一般是公司内部网站),再写一个login函数,将driver作为参数调用

    driver = login(driver)

    注意一定要将driver传回,这样driver才能继续接受程序的指令

    三、元素定位

    webdriver的工作原理是找到网页中某一个元素,可以对其进行填入数据或点击等操作。

    我主要用到的元素定位方式有

    driver.find_element_by_id("someid")#通过元素的id定位

    driver.find_element_by_css_selector("input[value="确定"")#查找一个input元素,它的value属性值为"确定"

    driver.find_element_by_xpath("//span[contains(@style,"COLOR: red")]/span[1]")#查找一个style属性值为"COLOR:red"的span元素的第一个span子元素

    (1)通过id定位

    如果我们想在网页表单的某一个位置填某项值或者点击某个按钮,我们首先要用开发者工具查看这个元素的源代码,然后首先观察它有没有id,如果有id,直接用id定位该元素。然后,用

    driver.find_element_by_id("someid").click()#点击元素

    driver.find_element_by_id("someid").send_keys("somekeys")#填入"somekeys"

    driver.find_element_by_id("someid").clear()#清空输入框中已有的值

    实现我们想要做的操作。

    (2)通过ccs selector定位

    如果我们想要操作的元素没有ID,那么我们就要找到它跟网页其他元素不同的特征,ccs selector是一种十分灵活的定位方式,其中用value定位是一个不错的选择。以

    driver.find_element_by_css_selector("input[value="确定"")

    为例,双引号中的input可以换成任何网页元素(div、span、input、a等),中括号中是该元素的某一个属性(style、id、value、class等),等号后面是该属性的值。

    注意,如果网页中有多个元素同时满足ccs selector的条件,如有多个value=“确定” 的input,那么find_element_by_css_selector只会定位到在html源代码中最靠前的一个,而find_elements_by_css_selector会找到源代码中所有满足条件的元素,并以列表的形式返回这些找到的元素。例如,网页中弹出很多个提示框,我们要一一去点确定,可以这样操作

    list=driver.find_elements_by_css_selector("input[value=" 确定 "]")for l inlist:

    l.click()

    但是,如果这些提示框是重叠出现的,而最上层的提示框实际上在源码中更靠后的位置,那么列表中第一个“确定”元素就会被叠在上面的提示框遮挡,无法点击,这个时候倒序一下数组就可以了,从最后一个“确定”元素开始点击

    query=driver.find_elements_by_css_selector("input[value=" 确定 "]")for q in query[::-1]:

    q.click()

    (3)通过xpath定位

    xpath定位比较复杂但是非常全面,当这个元素的class、style属性和其他元素一样,实在没什么特点可以一步定位的时候,我们就可以用xpath,先找到我们想要的元素的父子兄弟元素,再定位到我们想要的元素。例如

    driver.find_element_by_xpath("//*[@class="submit clear"]/input[1]").click()

    text=driver.find_element_by_xpath("//input[@value=" 确定 "]/../preceding-sibling::div[1]").text

    driver.find_elements_by_xpath("//span[contains(@style,"COLOR: red")]/span[1]")

    引号中的//表示相对定位,表示从源代码中任何地方开始寻找。

    //后可以跟任何元素,*代表任意元素,即定位符合属性筛选任何元素。

    中括号内是属性的筛选条件,@后可以加任意属性。contains(@style,"COLOR: red")表示的筛选条件是:style属性中包含”COLOR:red“。这里为什么不直接用@style="COLOR: red"

    的原因是,可能在我们审查源代码的时候这个元素的style属性只有"COLOR: red"这一条,但是动态界面的style属性经常变化,程序运行时直接用等于是定位不到这个元素的。

    /.. 可以定位这个元素的父亲元素

    / 可以定位这个元素的子元素

    /preceding-sibling:: 可以定位这个元素的哥哥元素

    /following-sibling:: 可以定位这个元素的弟弟元素

    如/input[1]表示子元素中第一个input、/../preceding-sibling::div[1]表示父元素的哥哥元素中的第一个div

    (4)通过当前节点定位

    有时候我们会遇到需要判断一下元素当前的状态(是否被选择)再决定接下来的操作的情况,这时就需要用一个变量来保存当前节点

    LTE=driver.find_element_by_xpath("//input[@id="LTE"]/../span[1]"

    然后再用get_attribute获得当前节点元素的属性,在这个例子里,如果元素为蓝色,就不需要点击。代码实现为:

    if LTE.get_attribute("style")=="COLOR: blue":pass

    else:

    LET.click()

    需要筛选出特定文本的情况:

    red=driver.find_elements_by_xpath("//span[contains(@style,"COLOR: red")]/span[1]")#找出所有红色的文本

    for r inred:if "低消" in r.text:#如果文本信息中包含"低消’

    r.find_element_by_xpath("./../preceding-sibling::input[1]").click()#注意从当前节点定位的时候要以"./’开头

    break

    如果寻找的元素需要滚动界面才能看到,这个时候可以用js聚焦此元素,页面便会滚动到该元素的位置

    target=driver.find_element_by_css_selector("input[value=" 确定 "]")

    driver.execute_script("arguments[0].scrollIntoView();", target)

    target.click()

    四、不确定情况处理

    (1)有可能出现的弹窗

    在填表过程中,有些地方有可能出现一个弹框也有可能不出现,这个时候,无论这个弹窗是什么,用try..except语句处理就可以解决

    js触发的弹窗:

    try:

    driver.find_element_by_css_selector("input[value=" 确定 "]").click()exceptException as e:pass

    网页alert弹窗:

    try:

    driver.switch_to.alert.dismiss()exceptException:pass

    dismiss()对应的是alert弹窗的”取消“项,accept()对应的是”确定“项,driver.switch_to.alert.text 可以获得弹窗的文本内容。

    (2)数量不定的弹窗

    对上文提到的多个提示框情况,除了用 query=driver.find_elements_by_css_selector("input[value=" 确定 "]") 一次性找到所有元素再顺序或倒序点击之外,还可以用一个while循环解决

    while(1):try:

    driver.find_element_by_css_selector("input[value=" 确定 "]").click()exceptException as e:break

    (3)网络延迟

    有些网页在点击查询信息之后需要加载一段时间,加载中的页面是找不到我们接下来想找的元素的,因此程序就会报错,此时有两种解决方法。

    一种是固定等待一段时间,等待网页加载完毕,这种方法的缺点是很难找到等待的最佳时间,太短的话页面还没加载完,太长就影响效率

    time.sleep(2)

    另一种是用一个while循环一直寻找下一个我们要找的元素

    while(1):try:

    driver.find_element_by_id("continueTrade").click()break

    exceptException:pass

    这种方法的前提是下一个要找的元素必定会出现

    五、frame处理

    总结起来就是:frameset不用切,frame层层切。最好一系列填表操作完后都用 driver.switch_to.default_content() 回到原文档,这样不容易混乱

    这里再补充一点frame没有id时的切入方法

    frame= self.driver.find_element_by_xpath("/html/body/div[12]/iframe")#先定位frame位置,用一个变量储存这个节点

    self.driver.switch_to_frame(frame)#再切入这个节点

    六、excel数据读写

    excel数据读写十分简单,看代码就好了:

    defread(file):

    data= xlrd.open_workbook(file)#打开excel文件

    table = data.sheets()[0]#读取第一个sheet的数据

    phones = table.col_values(0)#以列表形式存储第一列数据

    peoples = table.col_values(1)#以列表形式存储第二列数据

    returnphones,peoplesdefwrite(result):

    file=xlwt.Workbook()#创建一个excel文件

    table = file.add_sheet("sheet1")#添加一个sheet

    for i in range(len(result)):#写入数据

    table.write(i,0,result[i][0])

    table.write(i,1,result[i][1])

    table.write(i,2,result[i][2])

    file.save("result.xls")

    结语:希望技术能让人们从无意义的重复劳动中解脱:D

    展开全文
  • Pycharmexcel文件:导入的excel模板二、python代码 由于工作需要,需要每天定时导入相关excel文件进入后台数据库,由于导入的逻辑比较复杂,所以决定通过python模拟登陆导入网站,点击相关功能来实现自动导入。...
  • Python进行网页自动打卡系统安装Python下载Chromedriver安装selenium设置定时自动运行Python程序 安装Python 可以直接Python官网下载,需要进行路径环境配置,最好还要下载一个顺手的编辑器。也可以用anaconda平台...
  • Python写一个个输入任意内容自动下载图片的程序 我们需要用到os、requests、re这几个模块,其中os和re是自带的requests需要额外安装。 pip install requests 然后打开 image.baidu.com 搜索任意图片然后F12...
  • 安装selenium : 在终端输入: pip install selenium 下载chromedriver : [http://chromedriver.storage.googleapis.com/index.html]下载 (与安装的chrome浏览器版本一致)。 二、示例 1.XPath获取 例如使用chrome...
  • 1.输入内容 send_keys('valve'):输入内容valve #定位输入框 input_box = browser.find_element_by_id('kw') try: #输入内容:selenium input_box.send_keys('selenium') print('搜索关键词:selenium') except...
  • 这是我的第一个真正意思上的自动化脚本。 1、练习的测试用例为: 打开百度首页,搜索“胡歌”,然后检索列表,有无“胡歌的新浪微博”这个链接 2、在写脚本之前,需要明确测试的步骤,具体到每个步骤需要做什么,...
  • python怎么模拟点击网页按钮?

    千次阅读 2020-02-25 16:52:39
    python怎么模拟点击网页按钮 前提环境: Python3 和 Visual Studio Code安装完毕 . 安装selenium : 在终端输入: pip install selenium, 如图 下载chromedriver : 登录...
  • Python - 爬虫实现网页自动登录、点击与页面的跳转

    千次阅读 多人点赞 2019-11-22 23:52:15
    近段时间,因熊孩子沉迷于电视而致命学习成绩下降,遂有了在不影响家里老人正常观看电视的情况下对电视进行限制的需求,经过思索后准备利用爬虫技术来实现,即在熊孩子放学时自动登录网管交换机来对机顶盒进行限速,...
  • (一)PYTHON的安装(已安装,可跳过此不步骤) 1、PYTHON下载 PYTHON官网:https://www.python.org/ 按照对应的系统下载,我这里是window系统,点击windows,根据自己系统操作位数下载 ...
  • 自动打开百度,自动输入网易云音乐,自动点击搜索按钮,实现搜索,效果如下: python代码如下(具体步骤下面解释): #导入模块 from selenium import webdriver import time #实例化Chrome浏览器对象 driver=...
  • python 获取网页内容

    万次阅读 多人点赞 2018-11-07 15:07:16
    1.安装pip 我的个人桌面系统用的linuxmint,系统默认没有安装pip,考虑到后面安装... $ sudo apt install python-pip 安装成功,查看PIP版本:     1 $ pip -V 2.安装reques...
  • python自动化操作网页(谷歌浏览器)

    千次阅读 2020-09-27 22:26:30
    python自动化操作网页谷歌浏览器所需工具下载.zip 一、python自动登录判题系统 from selenium import webdriver from selenium.webdriver.common.keys import Keys #打开网页 url="http://acm.wzu.edu.cn/index/"...
  • python3 使用requests获取网页内容

    千次阅读 2018-10-21 12:42:51
    以获取豆瓣网页内容为例 #导入需要用到的模块 import requests #准备一个url url='https://movie.douban.com/top250' res=requests.get(url) #requests模块会自动解码来自服务器的内容,可以使用res.encoding来查看...
  • 需要模拟手机端来进行登录,这样固然可以对文章进行爬取,但是很多时候并不是非常智能的翻页或者是点击继续阅读,基于最简单的百度文库爬取方法,在这边博客中,我们实现了自动点击预览全文并进行全文的爬取。...
  • Python爬取网页数据

    万次阅读 多人点赞 2018-08-29 17:20:35
    都说python网页数据方便,我们今天就来试试,python爬取数据到底有多方便 简介 爬取数据,基本都是通过网页的URL得到这个网页的源代码,根据源代码筛选出需要的信息 准备 IDE:pyCharm 库:requests、...
  • driver.get("") # 地址栏里输入健康打卡的网址 driver.implicitly_wait(2) # 设置隐式等待时间 username=driver.find_element_by_id('zh') if(username): username.send_keys("")#账号 driver.find_element_by_id...
  • python实现自动刷题

    万次阅读 热门讨论 2020-04-08 12:29:03
    使用Python实现云豆网自动刷题 所有代码全是Py3 要有一些Python基础emmm不用太多 不懂就问 我的QQ:2025450852 大体思路: 控制浏览器模拟点击 利用漏洞拿到正确答案 填入答案 需要导入的模块 from selenium import...
  • 初识python自动登录网页

    千次阅读 2014-07-08 15:55:26
    学校的3a限制流量,每个月只有10g,怎么能够用了,看了一下,校园网登录的网页,发现可以用强大的python来模拟登录,从而可以破解其他人的账号。。。很不道德的样子,其实我没怎么用其他人的流量,只是看一下能不能...
  • 直接入正题---Python selenium自动控制浏览器对网页的数据进行抓取,其中包含按钮点击、跳转页面、搜索框的输入、页面的价值数据存储、mongodb自动id标识等等等。 1、首先介绍一下Python selenium ---自动化测试...
  • python网页编辑器-网页python编辑

    千次阅读 2020-10-30 22:58:18
    好了,卖了这么多关子,下面容我向你郑重推荐这款超强的 python 编辑器——google colaboratory!? 02 这就是个网页!? 没错,colab 是一个免费的 jupyter notebook 环境(你可以想成是网页版多功能笔记本),它不...
  • Python开发网页自动化测试脚本

    千次阅读 2013-07-21 16:35:26
    通常对于一个稍具规模的系统,一些新的改动势必会带来一些额外的功能回归测试工作,而这个工作是非常... Python的世界有一个开源框架Splinter,可以非常棒的模拟浏览器的行为(从某种意义上也可以说是人的访问点击行为

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 26,049
精华内容 10,419
关键字:

python网页自动点击输入内容

python 订阅