精华内容
下载资源
问答
  • 【Android】扇贝单词--破解版
  • ShanBay 仿扇贝单词制作的学单词应用
  • 小程序扇贝单词大师辅助程序 该程序是在的基础上添加了单词大师辅助功能,因此也兼容知乎答题王(小程序头脑王者),首先感谢知乎答题王(小程序头脑王者)辅助工具的作者大大。 说明 该程序仅供娱乐 答案中被:spade...
  • 一个 Chrome 查单词插件 支持划词,自动加入扇贝单词生词本,方便手机同步学习。.zip,好学单词-ChaZD 查字典的分支,支持划词,自动加入扇贝单词生词本,方便手机同步学习。
  • 单词的时候,使用快捷键(默认为`i`)搜索当前单词对应的图片,帮助记忆 https://github.com/eric6356/shanbay-image/ 欢迎来 github 提 issue,或者给我发邮件 支持语言:中文 (简体)
  • 扇贝单词与百词斩的竞品分析

    千次阅读 2018-07-11 20:43:29
    任务二:做一个产品的竞品分析:扇贝单词与百词斩的竞品分析一、概览1竞品选择 扇贝单词(版本:8.0.302) 百词斩(版本:6.2.15)选择百词斩和扇贝单词的原因1、百词斩和扇贝属于同属...

    任务二:做一个产品的竞品分析:扇贝单词与百词斩的竞品分析

    一、概览

    1竞品选择

                                                                 

                          扇贝单词(版本:8.0.302)                         百词斩(版本:6.2.15)

    选择百词斩和扇贝单词的原因

    1、百词斩和扇贝属于同属于英语教育类的单词软件,满足同样的需求;

    2、各大软件中心下载量,评分率、好评率,百词斩在所有同类型单词产品中处于领先地位,扇贝单词位居二、三;

    3、百词斩与扇贝单词的背单词模式不同,百词斩是图片联想记忆法,扇贝单词是传统的背词法;

    分析目的:

    1、探索图片联想记忆法的背词模式和传统背词模式的对用户下载软件并使用,及其使用体验感的影响;

    2、提升扇贝单词的传统背词模式的使用体验;


    2体验环境

    体验机型:MI6X

    操作系统:Android 7.1.2

    二 市场状况




    结论:扇贝单词占市场份额较小约为16%,在同类软件中约第三,百词斩占市场份额52%,在同类软件中第一。

    三 目标用户分析

    用户特点:用户年龄集中30-39岁,约占总人数的50%,人群主体为在职人员。

    用户的需求分析:

    1、碎片化学习。可利用上下班通勤、中午休息等时间进行记忆,提高英语能力。

    2、梯度选择。能够根据自身的英语水平,以及应对的考试来选择单词的量级和范围。

    3、高效记忆。背单词的模式记忆效率高。

    4、计划与监督。制定良好计划,养成背诵习惯。

    四 竞品分析

    1 战略层


    结论:

    扇贝单词是一款以养成用户英语学习习惯为愿景,采用启发式提示记忆法有效对抗遗忘,采用打卡的方式培养用户背词习惯、社区小组等社交方式形成良好的学习氛围的英语背词软件。

    百词斩是一款针对英语考试的,采用图背的方法,为每个单词提供趣味的配图和场景例句加深用户对单词印象,采用多模式复习加强用户记忆,运用打卡和单词进度条来计划和监督的背词软件。

    2 范围层



    2.2 功能详细对比

    2.2.1 背词功能

    扇贝单词:

                                                         

    分析:

    1、扇贝单词在背词模块的自评模式中,显示单词、音标以及播放读音。从英语输入的听、读入手,加深用户对单词的印象;

    2、在探索模式中,显示这单词、单词中文、例句、扩展笔记以及播放例句加深用户对单词的理解,从而提高背词效率;


    百词斩:


    分析:

    1、在新词模式中在例句中用高饱和颜色标出要背单词,抓住用户的注意力,加深用户对单词的印象;

    2、自动朗读附加场景背景配音的例句,根据例句选择正确的图片(可根据个性词包定制),以类似于选择游戏的方式,增加背词的趣味性,从而提升用户对背单词的兴趣;

    3、在词汇详细模式中,显示这单词、单词中文、例句、趣味的单词视频、形近词等以及播放附加场景背景配音的例句,从多角度加深单词理解,同时不失趣味性,使用户在大量背词时不易感觉枯燥;

    评论及建议

    评论:

    扇贝单词是传统的看单词听读音,辅助以例句和扩展笔记的背词方法。

    1、记忆高效。直接联系中文与英文的无媒介的的记忆方式;

    2、可碎片化学习。自动同步单词进度;

    3、大量纯文字的重复记忆动作带来的记忆低效;

    建议:

    1、例句配音场景化。在例句配音中结合例句场景增加背景音效,增加背词趣味;

    2、加入单词语义相关图片辅助单词理解记忆,如将图片插入到单词不认识模式时的单词提示中,以减缓重复的纯文字记忆带来的记忆低效;

               

    2.2.2拓展词包

    扇贝单词

       

    分析:

    1、柯林斯字典权威释义,帮助用户理解单词语义和使用场景,提高记忆效率;

    2、英语智慧词根,学习单词构成,加深对单词语义的理解,扩展同根词汇,横向扩展单词量;

    3、派生联想,通过构词语法和语义衍生单词,纵向扩展单词量;



    百词斩


    分析:

    派生联想,通过单词形近衍生单词,纵向扩展单词量,同时保证用户的准确记忆。

    评论及建议

    评论:

    1、扩大单词量,提高记忆效率。扩展词包是单词之间产生联系,降低单个单词的零散记忆带来的记忆门槛,提高背单词的效率;

    2、扇贝单词用户可试用拓展包,试用期过后需要购买,购买分为30天、半年、一年使用期,分别需要支付等量的扇贝。扇贝可以通过购买和每日打卡获得。满足更深层次的需求,协助用户进行更深层次的理解和记忆;

    建议:

    词根只用于部分合适的单词。对于大部分的单词词根的解释牵强,联系弱,但易产生辅助记忆理解的效果。同时加入记忆媒介,降低记忆效率。


    2.2.3单词复习

    扇贝单词-单词测试

        

    扇贝单词-例句测试

      

    分析:

    1、新词测试。今日单词测试,只测试新词汇,迅速强化单词记忆短板;

    2、双模式选择。单词测试和例句测试能够巩固单词记忆;


    百词斩


    分析:

    1、多复习模式。12种复习模式供用户挑选合适的复习方式,以提升背词计划完成效率;

    2、多不同的角度切入巩固单词。从听力角度、阅读角度、写作角度提供复习方式,贴近用户背词需求,提高复习单词效率;

    评论及建议

    评论:

    1、强化记忆短板。专门复习今日新词,使用户能迅速复习新词,减缓今日全部单词一起复习导致的新词遗忘速度,从而提升背词效率;

    2、复习模式少。仅有4种模式,例句测试模块须支付1000贝壳(电子币),减少用户的选择;

    建议:

    1、增加复习模块。增加听音辩义、全拼练习、听词速记等模块,满足不同用户对英语学习的复习的不同侧重;

    2、减少支付。1000贝壳等于10元,在朋友圈分享1次为10个贝壳,减少例句模块的贝壳支付,能够提高用户复习模块功能的使用率;

    2.2.4单词查询

    扇贝

    查词模块

        

    单词详情

       

    分析:

    1、联想查询。可根据输入的首字联想查询单词,提高字典使用便捷性;

    2、扩充新单词。一键加入明日单词计划中,将查词与背词结合,目标性学习词汇,提高用户学习效率;


    百词斩

    查词模块

                        

    单词详细

                       

    分析:

    1、精确查词。输入中文和英文查出单词与大部分电子字典相同,电子词典可用性高;

    2、横向扩展。近义词、反义词、形近词扩展单词;

    评论:

    不准确查词。如输入爱,常见的对应单词love,like,不在结果列表中。

    建议:

    优化查词算法,完善字典词库。提高用户对字典的信任度和使用度,更好的将查词与背词结合,目标性学习词汇,提高用户学习效率;

    3 结构层

    3.1扇贝单词

    扇贝单词的产品结构逻辑关系简单明确。

    1、功能点划分明确、合理。用户可以直观容易地找到操作切入点,用户可以通过首页、课程、发现、我的这4个入口直接访问各大功能区;

    2、盈利模块切入点过多。例如365天计划5个、扩展词包4个、电子书平均每本2.5个,导致页面繁杂,操作效率降低;

    建议:将365计划、扩展词包的入口放于发现和使用模块的提示购买处,简化美观页面提高操作效率。


    3.2百词斩


    功能点划分不够合理。大部分功能聚集在首页,使得功能模块繁杂、同时功能逻辑划分不合理,如百词斩商城在“我的里面”,而“周边”模块仅有百词斩天猫商城的跳转。

    建议:将百词斩商城与百词斩天猫商城并列放于“周边”入口模块下。

    4 框架层

    扇贝单词   

        

    1、首页界面简洁、结构清晰。底部图标提供不同逻辑的功能模块的入口,横向线条将页面横向分,分别对应不同功能块,图标和图片对应相应功能;

    2、把背词、打卡、单词进度、再来一组、单词测试等功能放于首页中间板块,符合用户的核心、刚需、高频的背单词的需求的设计;

    3、采用绿色为主点缀色,有友好、可执行的感觉。绿色加粗的“打卡天数”和高饱和绿色"开始学习“button引导用户点击开始学习,增加打卡天数;

    4、为关联软件引流。将关联软件的入口放于主模块下方,吸引有口语、听力、阅读方面英语学习需求的下载相应软件并使用,提高用户对扇贝系列软件的粘着度;

    5、首页顶部辅助以查词功能,将词典定位为软件常用功能,底部辅助以短语背词、看视频背词增加用户的背词选择;


    百词斩

       

    1、首页结构清晰。底部图标提供不同逻辑的功能模块的入口,以块、button、图片混合方式划分功能;

    2、把背词、打卡、单词进度、再来一组、修改计划等功能放于首页中间板块,符合用户的核心、刚需、高频的背单词的需求的设计;

    3、界面明暗分明突出首页中间板块,采用理智、引导的蓝色为标记颜色,高亮”单词进度“和”开始背单词吧“引导用户点击背词增进单词进度;

    4、为关联软件引流。将关联软件的入口放于主模块下方,吸引有阅读方面英语学习需求的下载相应软件并使用,提高用户对百词斩系列软件的粘着度;

    5、首页顶部辅助以查词功能,词典定位为次于背词的重要常用功能;

    5 表现层

    扇贝单词:

    1、扇贝单词的页面布局大方整洁,非常的干净;

    2、用低饱和度的灰色横线,采用友好、可执行的绿色为主点缀色,友好分割功能块,抓住用户注意力;

    3、采取一定的圆角修饰Button,视觉体验上温和友好;

    百词斩:

    1、页面功能连接较多,略显繁杂但总体整齐;

    2、界面明暗分明突出首页中间板块,采用理智、引导的蓝色为标记颜色,抓住用户注意力;

    3、在板块、Button上都大量采用圆角修饰,视觉体验上更加温和友好;


    四 盈利模式分析

    扇贝单词

    1、扇贝商城:周边文凭,如文具、四六级单词书、长难句;

    2、保险计划:如21天早起计划用户购买计划,并如期如实的打卡实施,扇贝奖励徽章和一定数量的贝壳;

    3、电子资源:三大扩展词包、电子书、网上课程;

    百词斩

    百词斩天猫旗舰店和百词斩商城,主营文具、百词斩出品的英文名著、单词书、真题试卷、生活周边等。

    五 总结与建议


    1 总结

    扇贝单词:

    扇贝单词是一款以养成用户英语学习习惯为愿景,采用启发式提示记忆法有效对抗遗忘,采用打卡的方式培养用户背词习惯、社区小组等社交方式形成良好的学习氛围的英语学习类软件。

    主要用户特点:

    用户对纯文字记忆接受程度高,用户使用时间比较规律,能够准时完成打卡任务和保险计划,对软件社交活跃程度高,用户年龄集中在14-26岁,多为在校学生,希望稳定提升英语水平。

    优势:

    • 页面布局大方整洁,非常的干净;
    • 可碎片化学习。自动同步单词进度;
    • 单词书涵盖范围广、种类多;
    • 三大单词扩展包横向纵向扩充英语单词量;
    • 小组、同桌等社交方式形成良好的学习氛围;

    劣势:

    • 大量纯文字记忆,带来的背词效率下降;
    • 无离线下载功能,不能满足无网络或流量不足时的使用;
    • 单词测试模式少。仅有4个模式,其中例句测试下的2个模式的使用需要支付一定的贝壳;
    • 不准确查词。如输入爱,常见的对应单词love,like,不在结果列表中;

    百词斩:

    百词斩是一款针对英语考试的,采用图背的方法,为每个单词提供趣味的配图和场景例句加深用户对单词印象,采用多模式复习加强用户记忆,运用打卡和单词进度条来计划和监督的背词软件

    主要用户特点:

    偏好图像记忆方法,或纯文字记忆接受程度低、有碎片信息阅读习惯的用户,软件社交粘着度低,用户年龄集中在25-40岁,多为在职员工,希望应试英语水平提升。

    优势:

    • 单词图背、趣味场景配音,减少大量纯文字记忆,带来的背词效率下降;
    • 可碎片化学习。自动同步单词进度;
    • 离线下载功能,满足无网络或流量不足时的使用;
    • 多复习模式选择。能够从不同角度,用不同的方式巩固单词;
    • 精准查词。准确的查词功能和附加的近义词、反义词、形近词词包;

    劣势:

    • 增加图片为记忆媒介,降低中文和英文之间的记忆的效率;
    • 单词书涵盖范围小,种类有限;
    • 同义词、反义词仅位于字典,对背词没有增益;

    2 如果我是扇贝PM

    我会:

    1、加入单词语义相关图片辅助单词理解记忆,如将图片插入到单词不认识模式时的单词提示中,以减缓重复的纯文字记忆带来的记忆低效;

    2、例句配音场景化。在例句配音中结合例句场景增加背景音效,增加背词趣味;

    3、增加复习模块。增加听音辩义、全拼练习、听词速记等模块,满足不同用户对英语学习的复习的不同侧重;

    4、优化查词算法,完善字典词库。提高用户对字典的信任度和使用度,更好的将查词与背词结合,目标性学习词汇,提高用户学习效率;

    展开全文
  • 大概查看了网页,我们只需爬取单词和含义即可。首先我们先来查看网页源码 下面分别把他们解析出来: ,分析完毕后,我们就可以通过代码进行实现了。 etree_obj = etree.HTML(html) word_list = etree_obj.xpath('//...

      大家好,我是不温卜火,是一名计算机学院大数据专业大三的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只在csdn这一个平台进行更新,博客主页:https://buwenbuhuo.blog.csdn.net/
    1

    PS:由于现在越来越多的人未经本人同意直接爬取博主本人文章,博主在此特别声明:未经本人允许,禁止转载!!!


    2


    推荐

    31
      ♥各位如果想要交流的话,可以加下QQ交流群:974178910,里面有各种你想要的学习资料。♥

      ♥欢迎大家关注公众号【不温卜火】,关注公众号即可以提前阅读又可以获取各种干货哦,同时公众号每满1024及1024倍数则会抽奖赠送机械键盘一份+IT书籍1份哟~♥
    30
    现在的博主正在发呆,无意之中打开了扇贝Python必背词汇的网址。那么既然打开了,再加上博主挺无聊的。那么就尝试爬取一下这个网页!

    3
    扇贝Python必背词汇网址:https://www.shanbay.com/wordlist/110521/232414/

    一、网页分析

    我们打开此网站之后,通过以往爬取网页的经验,会发现此网页特别容易爬取。
    4
    大概查看了网页,我们只需爬取单词和含义即可。首先我们先来查看网页源码
    5
    下面分别把他们解析出来:
    6
    7
    🆗,分析完毕后,我们就可以通过代码进行实现了。

        etree_obj = etree.HTML(html)
        word_list = etree_obj.xpath('//strong/text()')
        explain_list = etree_obj.xpath('//td[@class="span10"]/text()')
        item_zip = zip(word_list,explain_list)
        for item in item_zip:
            items.append(item)
    

    分析完内容,下面就开始分析分页。鉴于此URL只有三页URL,因此,博主就使用最简单的方式,把Url拼接出来

    base_url = "https://www.shanbay.com/wordlist/110521/232414/?page={}"
    
    for i in range(1, 4):
        url = base_url.format(i)
        print(url)
    

    8
    9

    二、代码实现

    # encoding: utf-8
    '''
      @author 李华鑫
      @create 2020-10-08 8:10
      Mycsdn:https://buwenbuhuo.blog.csdn.net/
      @contact: 459804692@qq.com
      @software: Pycharm
      @file: 作业:爬扇贝Python必背词汇.py
      @Version:1.0
      
    '''
    import csv
    import requests
    from lxml import etree
    
    """
    https://www.shanbay.com/wordlist/110521/232414/?page=1
    https://www.shanbay.com/wordlist/110521/232414/?page=2
    https://www.shanbay.com/wordlist/110521/232414/?page=3
    
    //strong                         # en
    //td[@class="span10"]            # cn
    """
    base_url = "https://www.shanbay.com/wordlist/110521/232414/?page={}"
    
    headers={
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36',
    }
    
    items =[]
    
    def parse_url(url):
        """解析url,得到响应内容"""
        response = requests.get(url=url,headers=headers)
        return response.content.decode("utf-8")
    
    def parse_html(html):
        """使用xpath解析html"""
        etree_obj = etree.HTML(html)
        word_list = etree_obj.xpath('//strong/text()')
        explain_list = etree_obj.xpath('//td[@class="span10"]/text()')
        item_zip = zip(word_list,explain_list)
        for item in item_zip:
            items.append(item)
    
    def save():
        """将数据保存到csv中"""
        with open("./shanbei.csv", "a", encoding="utf-8") as file:
           writer = csv.writer(file)
           for item in items:
                writer.writerow(item)
    
    def start():
        """开始爬虫"""
        for i in range(1, 4):
            url = base_url.format(i)
            html = parse_url(url)
            parse_html(html)
        save()
    
    if __name__ == '__main__':
        start()
    

    三、运行结果

    10
    17

    美好的日子总是短暂的,虽然还想继续与大家畅谈,但是本篇博文到此已经结束了,如果还嫌不够过瘾,不用担心,我们下篇见!


    18

      好书不厌读百回,熟读课思子自知。而我想要成为全场最靓的仔,就必须坚持通过学习来获取更多知识,用知识改变命运,用博客见证成长,用行动证明我在努力。
      如果我的博客对你有帮助、如果你喜欢我的博客内容,请“点赞” “评论”“收藏”一键三连哦!听说点赞的人运气不会太差,每一天都会元气满满呦!如果实在要白嫖的话,那祝你开心每一天,欢迎常来我博客看看。
      码字不易,大家的支持就是我坚持下去的动力。点赞后不要忘了关注我哦!

    19
    20

    展开全文
  • 今天跟着老师爬取扇贝单词的网页版,把网页内的单词及其翻译爬取到本地,并保存成 txt 文件,网页是这样的: 说一句题外话,真不知道老师咋弄到的这个网页,我自己找怎么也没找到老师的这个界面。先给你们网页...

    扇贝单词

    今天跟着老师爬取扇贝单词的网页版,是把网页内的单词及其翻译爬取到本地,并保存成 txt 文件,网页是这样的:

    说一句题外话,真不知道老师咋弄到的这个网页,我自己找怎么也没找到老师的这个界面。先给你们网页链接:扇贝单词 。

    那么下面进入正题:

    开始同以往一样,导入包,获取 URL ,发起请求,获得响应:

    url = 'https://www.shanbay.com/wordlist/110521/232414/?page=1'
    
    response = requests.get(url=url).text
    # print(response)

    这里我们是把接收网页响应的 response 格式设置成了文本格式,因为到后面我们就可以直接使用 response 结果,不用再变格式了。打印出来我们发现是目标网页的源代码,并且也没有乱码,说明就没什么问题。

    下面我们会用到 xpath 去获取我们想要的网页元素,如果不懂 xpath 的可以直接去 w3c手册上 看一下使用教程,或者看我这篇博客:xpath 全解 。在使用 xpath 前,我们还需要变换成 xpath 能查询的格式,就类似于数据结构上的二叉树那种,从树根结点往下,一个一个子结点地去找,直到找到目标结点为止。

    #使用模块
    from lxml import etree
    
    # 利用 etree 转换页面格式,提取信息
    tree = etree.HTML(response)

    下面我们就该去网页源码中找目标结点了,找到如下:

    首先我们考虑直接用 tr 属性标签行不行(一般都是不行的),那么我们获取当前结点下的所有 tr 属性标签,并验证一下对不对:

    # 找 tr :20个
    tr = tree.xpath('//tr')
    print(len(tr)) #找多了

    上面我们变换格式后,tree就是当前结点,而当前结点是根结点,而我们查取的 tr 属性标签即是从当前整个源码中查找 tr 标签的结点,单词当前页面下只有20个,所以我们只需要判断获取的 tr 标签个数多不多于20就行了,输出结果是多余的,说明直接用 tr 标签去获取单词的方法是不可行的,会涉及到其他无关的内容。那么下面的方法就是我们一般常用到的方法

    tr_list = tree.xpath("//table[@class='table table-bordered table-striped']/tbody/tr")
    print(len(tr_list))

    首先我们定位到 class 属性值等于 “ table table-bordered table-striped ” 的 table 标签位置,再从 table 下找到 tbody 标签,再深入一层就是我们的目标 tr 便签了,经验证个数后也是对的,那么现在我们是定位到了每一条单词的信息,下面我们要做的就是从当前一条信息中提取到我们要的单词及其翻译的内容。再次观察网页源码:

    接下来,我们逐个获取每条单词信息中的单词及其翻译:

    for tr in tr_list :
         # 单词
        word = tr.xpath("./td/strong/text()")
    
        # 翻译
        fanyi = tr.xpath('./td/text()')
    
        print(word)
        print(fanyi)

    运行后发现结果没错,是我们想要的输出,但发现输出内容还是有点不对:

    输出的内容有些像列表类型,我们查看输出类型后确实是 list 类型,看着输出内容上加的引号很不舒服,解决只需要稍微改动一点输出形式就行了:

    print(word[0])
    print(fanyi[0])

    再次输出的时候就很正常了。到此我们主要的工作就差不多完成了,下面我们将爬取到的信息保存成 txt 文件:

    Info = 'word:' + str(word[0]) + '\n' + 'fanyi:' + str(fanyi[0]) +'\n\n'
    with open('扇贝.txt','a',encoding='utf-8') as fp:
        fp.write(Info)

    我们将单词及其翻译连接成一条信息,在向文件中保存的时候,其内容只能是字符串,所以有了上面的类型转换(读者可自行查看下 word[0] 是什么数据类型),另外保存时,‘ a ’ 表示向文件中追加元素,因为是在 for 循环下,每读一条单词的数据,分析提取后就追加到 txt 文件中。

    到此为止,简单的扇贝单词就爬下来了;不过我们看到这一单元的必备词汇不止 20 个,后面还有两页,都爬下来最好。其实也很简单,我们在第一页和第二页的时候,对比网址会发现它们的规律,所以全都爬取的话,只需要在最外层加一个 for 循环,另外对 URL 稍做一下改动就可以了。

    下面是完整代码:

    import requests
    
    from lxml import etree
    
    # 1、发起请求,获取响应
    for i in range(1,4):
        url = 'https://www.shanbay.com/wordlist/110521/232414/?page={}'.format(i)
    
        response = requests.get(url=url).text
        # print(response)
    
        # 利用 etree 转换页面格式,提取信息
        tree = etree.HTML(response)
    
        # 要求:提取每一个单词及其翻译
        # 1)、找 tr :20个
        # tr = tree.xpath('//tr')
        # print(len(tr)) 找多了
    
        tr_list = tree.xpath("//table[@class='table table-bordered table-striped']/tbody/tr")
        # print(len(tr_list))
        # print(tr_list)
    
        for tr in tr_list :
            # 单词
            word = tr.xpath("./td/strong/text()")
    
            # 翻译
            fanyi = tr.xpath('./td/text()')
    
            # print(word)
            # # print(fanyi)
            
            print(word[0])
            print(fanyi[0])
    
            Info = 'word:' + str(word[0]) + '\n' + 'fanyi:' + str(fanyi[0]) +'\n\n'
            with open('danci.txt','a',encoding='utf-8') as fp:
                fp.write(Info)
    
            pass
    

     

    展开全文
  • Python爬虫-爬取扇贝单词(Xpath)

    千次阅读 2019-08-19 15:34:05
    爬取扇贝单词 **======================** ==================================================================================   ===============================================================...

    爬取扇贝单词

    **======================**

    image

    ==================================================================================

    image

    ==========================================================================

    结果示例:

    image

    ====================================================

    '''
    扇贝单词:
    1. 把python单词列表download下来
    2. 主要联系目的是xpath
    3. 理论上讲不需要登录
    4. https://www.shanbay.com/wordlist/104899/202159/
    '''
    '''
    遇到不懂的问题?Python学习交流群:1136201545满足你的需求,资料都已经上传群文件,可以自行下载!
    '''
    from urllib import request
    from lxml import etree
    
    import json
    
    #词汇表
    words = []
    
    
    def shanbei(page):
        url = "https://www.shanbay.com/wordlist/104899/202159/?page=%s"%page
        print(url)
    
        rsp = request.urlopen(url)
    
        html = rsp.read()
    
        #解析html
        html = etree.HTML(html)
    
        tr_list = html.xpath("//tr")
    
    
        # 遍历每个tr元素,每一个tr对应一个单词和介绍
        for tr in tr_list:
            '''
            查相应的单词和介绍
            '''
            word = {}
    
            strong = tr.xpath('.//strong')
            if len(strong):
                # strip把找到的内容去掉空格
                name = strong[0].text.strip()
                word['name'] = name
    
            # 查找单词的释义
            td_content = tr.xpath('./td[@class="span10"]')
            if len(td_content):
                content = td_content[0].text.strip()
                word['content'] = content
    
            print(word)
    
            if word != {}:
                words.append(word)
    
    
    if __name__ == '__main__':
    
        shanbei(2)
    
    展开全文
  • 在打开扇贝单词时,会出现卡在进入每日一词的界面中(即卡在进入APP的界面中),需要在后台关闭APP,然后重新启动,才能够进入。否则不管等多久,都在卡在进入界面中。 3.采访使用者感受、背景、需求   采访的...
  • python爬虫,爬取扇贝当日单词,cookie登录, 分页爬取当日的单词,保存到excel
  • [python爬虫]模拟登陆扇贝单词

    千次阅读 2016-05-16 16:25:32
    登完了教务处,就试试登陆别的吧,这次选择的是扇贝单词的网页版,貌似是用djando搭建的。 用chrome的开发者工具先观察一下登陆的过程,可以发现post表单的内容还是比较简单的,就是自己的用户名密码,还有一个csrf...
  • 启用「扇贝单词同步」功能后收藏词汇将被同步到扇贝单词,但是必须先登录, 亦然 单词被收入生词簿后有五个阶段,分别对应红/橘/黄/蓝/绿 每个阶段的吐司间隔分别为5分钟,30分钟,1小时,6小时,12小时 在每次吐司...
  • 浅谈墨墨背单词APP和扇贝单词APP的优缺点.pdf
  • “互联网 ”模式下英语词汇App新途径探索——以百词斩、扇贝单词、沪江开心词场为例.pdf
  • 英语词汇App研究——以百词斩、扇贝单词、沪江开心词场为例.pdf
  • 仿扇贝单词----自定义可拖拽控件

    千次阅读 2016-06-14 15:07:32
    仿扇贝单词—-自定义可拖拽控件最近在做项目时需要实现一个可以拖动的控件,用于在有限的屏幕内显示更多的内容.先给大家看一下效果图. 这个效果的主要特点有以下几点: 1.只有按住拖拽的按钮时才可以拖动,下面的内容...
  • 扇贝单词书中的单词可以发音

    千次阅读 2017-07-21 20:39:45
    然而点开单词书发现没有单词发音, 这可怎么办? 于是乎随手写了如下的小脚本, 可以在单词书的一个list中点击单词的时候发音。 也就是在下图界面中,单击一次单词即可听到美式发音(暂无英式发音)。 -----...
  • 在windows xp上使用Python获取扇贝单词每日一句-附件资源
  • A:百词斩 B:扇贝单词 一、基本任务 1.测试进度表 | 项目 | 内容说明 | 预估耗时(分钟) | 实际耗时 (分钟) | | -------------- | -------------------------- | ------------------ | ------------ | | ...
  • 改进扇贝单词app中的信息可视化 1、简介 这篇博客是一个信息可视化的案例研究。 这学期我们学习了一门信息可视化课程,发现信息可视化居然是一个非常有趣并且相当有挑战性的领域。在完成了这门课的学习后,我们...
  • requests爬取扇贝单词

    2019-01-03 21:47:46
    "扇贝单词第%s页.txt" % page with open ( file_name , "w" , encoding = "utf-8" ) as fp : for i in ret : print ( i [ 0 ] + "\t" + i [ - 1 ] ) fp . write ( i [ 0 ] + "\t" ...
  • #查找单词 strong = tr.xpath('.//strong') if len(strong): name = strong[0].text.strip() word['name'] = name #查找单词内容 td_content = tr.xpath('./td[@class="span10"]') if len(td_content): ...
  • xpath爬个扇贝单词

    2019-04-29 20:25:16
    有多少页单词就能爬多少页,就是用这几行代码跳出死循环的,也就是说说捕获不到数据就说明页码到头了。 tr_list = tree.xpath('//table[@class="table table-bordered table-striped"]/tbody/tr') if not tr_li.....
  • 比较好看的Chrome划词翻译搜狗插件自带生词簿及吐司弹词记忆可与有道扇贝单词同步
  • 通过感知身边一切新事物可以更好地磨练自己的产品直觉,体验一款...在产品100上看到Facebook产品设计总监Julie Zhuo拷问产品的14个问题,非常靠谱,本文以扇贝单词为例,回答这14个问题。希望能加深自己对产品的理解。
  • pyhton爬虫--爬取扇贝单词

    千次阅读 2019-05-26 22:30:34
    爬取所有的单词 分页爬取 写入一个文件里面 然后写入json文件中 最后写入文档 “”" import os import requests from lxml import etree def python(page): #起始的url for page in range(1,int(page)+1): path='...
  • 爬取糗事百科 & 扇贝单词 (xpath练习)

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,481
精华内容 592
关键字:

扇贝单词