精华内容
下载资源
问答
  • Python分析了1980~2015年考研英语真题词汇,原来考研应该这样考!作者:阿广概述前言数据介绍实现过程考研英语词汇统计分析搞笑一刻阿广说每日问题推荐阅读前言我们渐渐长大,从一开始的初生牛犊不怕虎到渐渐惧怕...

    微信改版,加星标不迷路!

    0a2d3046-5759-4087-8cd1-9a813b1f5313.gif

    用Python分析了1980~2015年考研英语真题词汇,原来考研应该这样考!

    作者:阿广

    概述

    前言

    数据介绍

    实现过程

    考研英语词汇统计分析

    搞笑一刻

    阿广说

    每日问题

    推荐阅读

    前言

    我们渐渐长大,从一开始的初生牛犊不怕虎到渐渐惧怕孤独,从一开始的单打独斗到渐渐合群躲避孤独。不巧的是,考研就是一个孤单修炼的事情,没有任何人能够去帮你,于是二十出头的我们,从“牛b吊炸天,我要改变全世界”逐渐蜕变成“我要适应这个世界,我要适应孤单”。过去总是赶赴一场又一场热闹,在觥筹交错间,推杯换盏时,说一些违心的话,做一些违心的事,慢慢失去自我。但愿,酒阑人散后,剩下的只有空虚落寞;但愿,灯火阑珊处,留下是考研最美好的回忆。

    数据介绍

    本文统计的对象为1980年以来英语试卷所包含的词汇,并对其进行了分析和总结。

    5868ac0f-5c8f-4a6c-9de4-ee48daf2c238.png

    实现过程

    (1)加载基础词汇

    bw = open('data/basic_words.txt')

    basicwords = []

    for eachLine in bw:

    basicwords.append(sw.simplify_word(re.split("[^A-Za-z]", eachLine)[0].lower()))

    #print re.split("[^A-Za-z]", eachLine)[0]

    print(len(list(set(basicwords))))

    basicwords = list(set(basicwords))

    (2)加载超纲词汇

    notindagang = np.zeros(33)

    chaogangword = {}

    for j in range(33):

    for k in wy.eywords[j]:

    if k not in dw.dagangwords and k not in bw.basicwords:

    #notindagang[j] += 1

    if chaogangword.has_key(k):

    chaogangword[k] += 1

    else:

    chaogangword[k] = 1

    for j in range(33):

    for k in wy.eywords[j]:

    if k not in dw.dagangwords and k not in bw.basicwords:

    if chaogangword[k] <= 2:

    notindagang[j] += 1

    chaogangword = sorted(chaogangword.iteritems(), key = lambda e:e[1], reverse = True)

    print('Chaogangword =',chaogangword)

    pnotindagang = [float(x) / len(wy.eywords[i]) for i,x in enumerate(notindagang)]

    (3)词汇分析

    def simplify_word(a):

    #如果已经可以判断是名词,动词,形容词,副词,连词

    if enumerate.is_noun(a) or enumerate.is_verb(a) or enumerate.is_adjective(a) or enumerate.is_adverb(a) or enumerate.is_connective(a):

    return a

    try:#测试是否为动词,如果是则返回

    enumerate.is_verb(enumerate.verb.present(a))

    return enumerate.verb.present(a)

    except:#否则继续检查

    pass

    #测试是否是名词

    if enumerate.is_noun(enumerate.noun.singular(a)):

    return enumerate.noun.singular(a)

    otherwordlist.append(a)

    #print a

    return a

    (4)加载大纲词汇

    dagang = open('data/5495大纲词汇.txt')

    dagangwords = []

    for eachLine in dagang:

    dagangwords.append(sw.simplify_word(re.split("[^A-Za-z]", eachLine)[0].lower()))

    #print re.split("[^A-Za-z]", eachLine)[0]

    print(len(list(set(dagangwords))))

    dagangwords = list(set(dagangwords))

    (5)考研英语真题单词数据可视化

    x33 = 1980*np.ones(33)+range(33)

    x32 = 1981*np.ones(32)+range(32)

    plt.figure('wordeachyear')

    plt.plot(x33,wy.eywords_volume,'r--o',alpha = 0.5)

    plt.grid(True)

    plt.show()

    plt.figure('notindagang')

    plt.plot(x33,cgw.notindagang,'o-', alpha = 0.5)

    plt.grid(True)

    plt.show()

    plt.figure('wn')

    plt.plot(wy.eywords_volume,cgw.pnotindagang,'bo')

    plt.show()

    plt.figure('pchaogang')

    plt.plot(x33,cgw.pnotindagang,'o-', alpha = 0.5)

    plt.grid(True)

    plt.show()

    plt.figure('notinpast')

    plt.bar(x33,nip.words_not_in_the_past, color = 'green', alpha = 0.5)

    plt.grid(True)

    plt.show()

    plt.figure('wordsAppearLastTime')

    plt.plot(x32, walt.es, 'b--o', alpha = 0.5)

    plt.grid(True)

    plt.show()

    plt.figure('pwordsAppearLastTime')

    #plt.axes([1980, 2013 , 0.35 ,0.6])

    plt.plot(x32, walt.esr1, 'r-o')

    plt.plot(x32, walt.esr2, 'b--o', alpha = 0.4)

    plt.plot(x32, walt.esr3, 'y--o', alpha = 0.4)

    plt.grid(True)

    plt.show()

    https://github.com/zandaoguang/English

    或者点击查看原文即可获得源码

    考研英语真题词汇统计结果

    1.第i+1年出现的从1980~i年间从未出现过的单词

    a3834a8a-104d-40b1-8350-b5b5c3f1ef0f.jpg

    2.第一年真题中出现的单词数

    107ac808-94de-4444-a19b-888502c01ab4.jpg

    3.每一年都出现的单词

    and, have, other, most, last, all, year, way, hi, like, because, your, new, know, english, chinese, if, you, they, this, give, people, he, not, many, question, from, into, such, work, over, would, make, translation, up, in, no, then, an, will, some, section, we, with, these, it, there, which, by, so, one, when, do, those, can, four, be, that, must, of, say, should, than, a, become, at, write, who, on, the, only, to, but, about, or, for

    4.相邻年份考研真题词汇重复数

    17b16c59-f436-4151-8488-9a9e11183ff4.jpg

    5.相邻年份考研真题词汇重复率

    97cc5e09-c846-4189-bfd9-361b3d48f5ee.jpg

    6.计算35年来真题词汇超纲率

    38eea284-09a6-4a1f-ad59-de4169cba029.jpg

    7.拟合

    1a00f43c-ba0e-4b60-96d8-8769be36fb18.jpg

    搞笑一刻

    3971f250-7fff-44e5-93e2-d83357a16e63.png

    30df8ca9-c07d-4759-9de1-79b63252a8c5.png

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    我问了我考研同学的成绩了,只说了一句:“来,再开一局”……

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    用四个字形容考完研后的自己:“重在参与”

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    我已经用了四年的时间证明了自己不是读书的这块料,但学校没有放弃我,给了我最后三天,让我证明了我自己,确实不是读书这块料。

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    今天去考研自习室,发现一美女坐我座位上,心中颇为惊喜,激动的走过去问“请问美女你有男朋友了吗?”美女忽然脸红:“没有”。“没有男朋友还敢抢我座位, 一边去!”

    627e2efe-47e0-4cf0-aa30-0fb967167bd4.jpg

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    考研的叫普遍性,不考的那叫特殊性。答题纸写满那叫具体性,啥都不会那叫历史性,机读卡填错了那叫抽象性。考上了那叫前进性,没考上那叫曲折性,报了名去考那叫必然性,睡过了没去考那叫偶然性——所以考研是普遍性特殊性具体性历史性抽象性前进性曲折性必然性偶然性高度统一的结果。

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    发下卷子正心凉,一紧张,词全忘,似曾相识,何意却不详。完型排序两茫茫,看阅读,泪千行。步出考场见同窗,都一样,很受伤,如此成绩无颜见爹娘。只待明朝发榜日,结绳套,系房梁,从此阴阳两相望。空惆怅,叹悲凉,来生再做考研状元郎。

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    考研就像参加超级女生,能坚持到最后的都是纯爷们!

    947686cc-2b1c-40af-8d9b-09bc1d8277cb.gif

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    考研英语,单词几乎是研考生心里永远的痛,今年又考倒了一大片,何必总是拿外国话来为难自己的同胞呢?

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    考研的都是勇士,考上去的是上士,考下去的是下士,还站着的是战士,考躺下的是烈士!

    8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

    我爸说过的最让我感动的一句话:孩子好好加油吧!以前我打麻将都是玩10块的,现在为了供你考研,我都只玩1块的了……

    b4b2db16-5ef4-4550-85d7-84676ede09fc.gif

    注:以上均为段子,希望每一位考研人本周六周日过过过!

    阿广说

    时光如白驹过隙,世事如白云苍狗。转眼间,我们也迎来了继高考以来第二次决定命运的战斗-考研。“考研是孤独的,孤独两个字拆开,有孩童,有瓜果,有小犬,有蚊蝇,足以撑起一个那年盛夏傍晚的巷子口,人情味十足。稚儿擎瓜柳蓬下,细犬逐蝶深巷中。人间繁华多笑语,唯我空余两鬓清风。孩童、水果、猫、狗、飞蝇当然热闹,可都与你无关,这就叫孤独,这就叫考研。”

    6ac522bf-8d3d-43fc-b2c9-62649513c99a.gif

    推荐阅读

    94933b75-6f27-4aab-ade1-9ea1c16379e5.png

    85892435-b397-44d3-9c2b-785da7ed289b.png

    今日问题

    85892435-b397-44d3-9c2b-785da7ed289b.png

    在计算机领域,你认为考研有必要吗?

    打卡格式:打卡第n天,答:...

    展开全文
  • Python爬取新东方考研真题

    千次阅读 2017-05-19 20:12:27
    要考研,想看看各个院校的真题,网上找了下,发现新东方真题库里面的考研真题还挺齐全的,网址:http://new.bj.xdf.cn/zhentiku/daxue/kaoyan/kyzyk/list_381_1.html 于是随手写了个爬虫爬取所有 新闻学 的考研题...

    要考研,想看看各个院校的真题,网上找了下,发现新东方真题库里面的考研真题还挺齐全的,网址:http://new.bj.xdf.cn/zhentiku/daxue/kaoyan/kyzyk/list_381_1.html

    于是随手写了个爬虫爬取所有 新闻学 的考研题,脚本如下:

    from urllib import urlopen
    from bs4 import BeautifulSoup
    import re
    
    for page in range(17):
        if page == 0:
            continue
        firstUrl = "http://new.bj.xdf.cn/zhentiku/daxue/kaoyan/kyzyk/list_381_" + str(page) + ".html"
        print "[Begin] scrap page", firstUrl
        html = urlopen(firstUrl)
        data = html.read()
        bsobj = BeautifulSoup(data)
    
        li = bsobj.findAll("a", {"title": re.compile(u"(.*?)新闻(.*?)")})
    
        for l in li:
            url = "http://new.bj.xdf.cn" + l.attrs["href"]
            filename = l.attrs["title"] + ".html"
            subdata = BeautifulSoup(urlopen(url).read())
            with open(filename, 'w') as f:
                f.write('<meta charset=\"UTF-8\">\n')
                f.write('%s' % subdata.select(".article-wrap"))
                f.close()
        print "[End]" 
    展开全文
  • python 爬虫爬取新东方考研真题

    千次阅读 2016-11-15 11:11:35
    女朋友要考研,想看看各个院校的真题,网上找了下,发现新东方真题库里面的考研真题还挺齐全的,网址:http://new.bj.xdf.cn/zhentiku/daxue/kaoyan/kyzyk/list_381_1.html于是随手写了个爬虫爬取所有 新闻学 的考研...

    女朋友要考研,想看看各个院校的真题,网上找了下,发现新东方真题库里面的考研真题还挺齐全的,网址:http://new.bj.xdf.cn/zhentiku/daxue/kaoyan/kyzyk/list_381_1.html

    于是随手写了个爬虫爬取所有 新闻学 的考研题,脚本如下:

    from urllib import urlopen
    from bs4 import BeautifulSoup
    import re
    
    for page in range(17):
        if page == 0:
            continue
        firstUrl = "http://new.bj.xdf.cn/zhentiku/daxue/kaoyan/kyzyk/list_381_" + str(page) + ".html"
        print "[Begin] scrap page", firstUrl
        html = urlopen(firstUrl)
        data = html.read()
        bsobj = BeautifulSoup(data)
    
        li = bsobj.findAll("a", {"title": re.compile(u"(.*?)新闻(.*?)")})
    
        for l in li:
            url = "http://new.bj.xdf.cn" + l.attrs["href"]
            filename = l.attrs["title"] + ".html"
            subdata = BeautifulSoup(urlopen(url).read())
            with open(filename, 'w') as f:
                f.write('<meta charset=\"UTF-8\">\n')
                f.write('%s' % subdata.select(".article-wrap"))
                f.close()
        print "[End]" 
    展开全文
  • 考研数学中会涉及到很多微积分的题目。微积分是高等数学最重要的概念,对于这么重要的数学工具,python肯定不会错过。我们不难找到,在sympy这个python数学计算模块中,存在Derivative和Integral两个方法,可以用来...

    考研数学中会涉及到很多微积分的题目。微积分是高等数学最重要的概念,对于这么重要的数学工具,python肯定不会错过。我们不难找到,在sympy这个python数学计算模块中,存在Derivative和Integral两个方法,可以用来计算微分和积分,我们可以使用Symbol方法来定义代数式中的符号。以下,我选择了两道真题来进行演示:

    一、求高阶导数
    17年数学一真题

    from sympy import Derivative, Integral, Symbol
    x = Symbol('x')
    result = Derivative((1/(1+x*x)),x,3).doit().subs({x:0})
    print(result)
    

    输出结果:

    0
    [Finished in 0.7s]
    

    二、求解不定积分
    19年数学二真题
    源代码:

    from sympy import Integral, Symbol
    x = Symbol('x')
    result = Integral((3*x+6)/((x-1)*(x-1)*(x*x+x+1)),x).doit()
    print(result)
    

    运行结果如下:

    -2*log(x - 1) + log(x**2 + x + 1) - 3/(x - 1)
    [Finished in 0.7s]
    

    我们看到,python只用了0.7秒就解完了,比人手动计算的速度快了好几个数量级。

    总结以下,本文的知识点有:
    1.导入sympy模块中的微积分计算方法;
    2.使用Derivative(fun,var,order)方法对函数表达式求导,注意Derivative可以传入的参数,分别是方程式、变量、和阶数;
    3.使用Integral(fun,var)进行函数表达式的积分计算,注意如果需要计算定积分,对var可以赋值元组(var,start,end);
    4…doit()方法进行计算并且返回计算结果。

    展开全文
  • python统计历年考研英语真题词频

    千次阅读 多人点赞 2018-08-24 11:29:15
    86_17_1.txt ————1986年到2017年考研英语一真题txt文件 86_17_2.txt ————1986年到2017年考研英语二真题txt文件 86_17_1_2.txt ————1986年到2017年考研英语一、二真题txt文件 2.词频统计及保存结果 ...
  • 该资源为2018年杭州电子科技大学计算机网络考研真题,资源高清无水印哦!
  • 苏州大学计算机考研 复试机试真题2013-2021真题Python题解   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博主目前仅在CSDN中写博客,唯一博客更新的地址...
  • 不巧的是,考研就是一个孤单修炼的事情,没有任何人能够去帮你,于是二十出头的我们,从“牛b吊炸天,我要改变全世界”逐渐蜕变成“我要适应这个世界,我要适应孤单”。过去总是赶赴一场又一场热闹,在觥筹交错间...
  • 86_17_1.txt ————1986年到2017年考研英语一真题txt文件 86_17_2.txt ————1986年到2017年考研英语二真题txt文件 86_17_1_2.txt ————1986年到2017年考研英语一、二真题txt文件 2.词频统计及保存结果...
  • 目录单选填空全部代码真题文件程序设计题 注,以下答案仅为个人所做,不代表标准答案 单选 1、列表a=[1],b=[2,3],执行a. extend(b)后,a的值为 ( ) A、[1,2,3] B、[1,[2,3]] C、[1,2] D、以上都不对 a=[1] b=[2,3]...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 610
精华内容 244
关键字:

python考研真题

python 订阅