精华内容
下载资源
问答
  • 月度计划之201210月中旬—11.15

    千次阅读 2012-10-12 13:34:43
    1.接下来的之内,主要的任务是写小论文,白天得保证有4个小时是在看论文。 2.晚上主要任务是看数电,模电,这两门作为从事于硬件的人来说是最基本的要求。对于电子信息的学生来说更是如此。一般来说晚上顶多...

    1.接下来的一个月之内,主要的任务是写小论文,白天得保证有4个小时是在看论文。

    2.晚上主要任务是看数电,模电,这两门作为从事于硬件的人来说是最基本的要求。对于电子信息的学生来说更是如此。一般来说晚上顶多也就能学习2个小时,因为期间会被qq无数次的打断奋斗(这是一项长期计划)

    3.继续学习Altium Designer可以开始视频的第二次学习,并结合Altium的官方培训教材,最好看英文版的,对以后看英文资料有好处。

    为了写小论文,得把arm板的学习推后一段时间了,另外邵贝贝那本ucos,才看了一半啊,现在也看不成了,我勒个去我有那么忙吗?

    展开全文
  • 我不知道将一年的四分之的时间拿出来找工作这算...废话不多说,流水账似的记录一下人生的第次苦逼求职经历。当然,几乎全是失败的经历,想从这里得到一些成功经验的还是趁早绕道吧。因为LZ本科是机械出身,硕士

    我不知道将一年的四分之一的时间拿出来找工作这算不算变态!!!!!!


    以前只是从新闻里看到类似“今年就业形势比较严峻”之类的话,一毛钱感觉没有,真正到自己找工作的时候,算是结结实实的体会了一把,其中的各种酸甜苦辣咸,只怕经历的才能体会吧。废话不多说,流水账似的记录一下人生中的第一次苦逼求职经历。当然,几乎全是失败的经历,想从这里得到一些成功经验的还是趁早绕道吧。因为LZ本科是机械出身,硕士期间改做C++程序猿,所以后文中提到软件开发和机械方面的岗位都有投过并面试的经历各位看官不要吃惊。


    从暑假末期就开始在各大招聘网站上填写简历,投递简历了。当时懵懵懂懂,每天只刷大街,现在想想可能当时错过了好多机会。后来熟悉了才慢慢的在51,智联,应届生以及各种山寨求职网上开辟战场。


    8月30号接到新岸线的面试通知,第一次面,过程是兴奋的,结果是悲惨的。先是笔试一些C++的题目,其实都是特别基础网上一搜一大把的题目,但是苦于没有听师兄的话,没准备,当然做的很差劲。笔试完立刻就是技术面,因为是面试的岗位是做视频,所以跟硕士的项目相关性还是挺大的,聊了不少。印象比较深的一个问题是“给你一段视频,如何根据视频中拍摄的内容对摄像机进行标定”,果断没有思路。当然也果断没有了然后。


    整整一个九月份都是在投啊投啊,一点回音没有,本应该大举投简历准备面试的十一假期,因为苦逼的感情问题完全耽误了。


    十一假期回归之后,就是疯狂的跑宣讲会,因为老板的要求比较严格,白天只能坐班,只有晚上才去各大高校转转宣讲会。最多的时候一周七天,每天下班之后就是宣讲会,等投完简历之后才回宿舍吃点饭。


    10.11北航,航天信息宣讲会。没然后。

    10.12北理,全路通宣讲会。农大,东软宣讲加笔试。全部没然后。

    10.16农大,北汽宣讲会。投了汽车工程总院,北京现代,北京奔驰三家单位。有一点点然后。

    10.17北航,数码视讯宣讲加笔试。没然后。

    10.18北航,中软宣讲加笔试。没然后。

    10.22凌云光子笔试。这是51上投的。先是笔试,然后上机,然后面试。笔试题还是老套路,印象比较深是一道递归的题目,因为在后来的面试中被问到了,上机的题目只记得一道将my name is abc.转换成abc. is name my。面试是三面一。最后通知是上机没有通过。很悲情的说拜拜了。

    10.23北科,北方微电子宣讲。没然后。

    10.24北科,暴风影音宣讲加笔试。暴风影音的笔试参加完基本上有死的冲动了,7道题只做了3道还不保证全部正确。结果自然是没有然后。

    10.26北科,凯普林宣讲加笔试。貌似只招五个人,而且是全部岗位只招5个人。果断做完题目走人。结果依旧是没有然后。

    11.02天舟上元笔试加人力面。结束的时候给我一道上机题目,说做完后发到人力邮箱。然后我按时按量做完发过去就没有然后了。

    11.06汉王笔试。基础的C++题目,比较高端的基础知识考核办法。结果还是没有然后。

    11.07上午横河电机笔试,下午CAXA笔试加面试。横河电机笔试感觉做的不好,几个小算法都没有理解到位,但可能是前边的概念性题目做的不错,通过了笔试。CAXA的笔试和面试都感觉不错,也顺利进入了下一轮。

    11.09北京现代面试。现代的面试通知得到的莫名其妙,因为距离投简历已经超过半个月了,本以为没消息了。投递的是生产岗位,和我一组群面的是一帮人力和财务岗的战友,在气势和口才上跟这些文科的同学一比,我算是悲了大剧了。然后就没有然后了。

    11.13上午广东卫星科技面试。下午因特驰。卫星主要是聊聊,因为毕业时间问题没谈拢,后来打电话约二面,因为不给解决户口我直接回绝了。因特驰这个公司,我直接想说呵呵,去了直接叫我报一个培训班,我只能笑呵呵的说再见。

    11.14上午横河电机初面。下午CAXA二面。横河初面是人力和技术,感觉很不错,跟两个面试官聊的很high,技术gg还跟我分享他找工作时的经历,人力mm后来一直联系并负责通知结果,并在最后我被宣布没戏的时候给了几句安慰,对于两个人印象都很好。下午CAXA二面是老总,能从我眼神和话里知道我要隐藏什么东西的大牛,很是膜拜。顺利拿到CAXA的offer。

    11.17北邮双选会,竟然一个回音没有。我了个擦。

    11.20横河电机二面。二面是两个部门的部长,应该都是技术大牛。现在回想起来,最后没有被录取的原因很可能是这个环节出了问题,因为决定是否录取可能是综合考虑三轮的成绩。但是顺利进了终面。

    11.22东芝医疗笔试加面试。继暴风影音之后,再次身受重伤的经历。大概也就是这次让我萌生了改行不做程序猿的念头。当时站在东芝公司外的马路上,如果不是得到横河终面的电话,我估计我直接躺马路上寻短见了。东芝自然是没然后。

    11.23航空结算笔试。感受了央企的工作氛围,后来通知笔试没有通过,可是我投的是技术支持啊,对于技术支持的笔试成绩要那么看重吗?但是还好在和hr沟通后争取到一个面试机会。

    11.27横河电机终面。和老总聊的很轻松愉快,也从老总身上学到很多东西。让我一度抱有很大的信心能够拿到offer,但是最后给我的通知是我不适合做技术,更适合做销售。不管是不是搪塞我,反正是坚定了我不做研发的念头。但是苦逼的死在终面上的滋味的确不好受啊,而且横河电机无论从工作环境还是岗位的匹配度以及各种说的上来说不上来的方面都跟我理想中的工作贴合度很高啊。硬生生的20多天啊。sigh~

    12.04中广上洋笔试加面试。让我知道了传说中的产品工程师应该就是销售、技术支持、测试的三合一版本。因为不给解决户口,二面没有参加。

    12.11某车企面试并最终签约。鉴于之前的软件方向的苦逼求职经历。果断下定决心不做软件。用本科的机械老本行和硕士期间项目里十分牵强的一些相关性以及一点点拿得出手的英语外加百年修来的运气拿到了这个offer并最终签约,个中辛酸一笔带过。


    这些只是可以罗列出来的,其实还有N多投入海底的简历。哎,说多了都是眼泪啊。

    看到没,不好好学习的下场就是这样,如果不是上辈子修来的运气,结果很可能就回家卖红薯了。


    展开全文
  • 它提供了百多个详实的应用案例,足以涵盖编程过程经常遇到的方方面面,由此详细阐释出各种高效且简洁的写法。本书第1 版曾畅销十之久…… [ 样章试读 ] 本书是享有盛誉的...

    五月书讯

    番茄工作法图解 ——走进北京电视台


    ◎ 以25分钟为单位划分 
    ◎ 作者: [瑞典] Staffan Noteberg  
    ◎ 工作法简约不简单 
    ◎ 译者:大胖

    视频链接地址: http://video.sina.com.cn/v/b/50811344-1802565057.html

    延伸阅读:


    本期主打

    已出版
    即将出版
    黑客与画家
    本书是硅谷创业之父Paul Graham 的文集,主要介绍黑客即优秀程序员的爱好和动机,讨论黑客成长、黑客对世界的贡献以及编程语言和黑客工作方法等所有对计算机时代感兴趣……
    [样章试读 ]
    罗素的故事
    这是一本漫画书,以20 世纪最具影响力的哲学家、数学家、逻辑学家伯特兰·罗素的成长为主线,讲述了逻辑学在20 世纪的发展历程,并介绍了同一时代的许多人物……
    [样章试读 ]
    博客也疯狂:ProBlogger经营之道(第2版)

    本书为喜欢网络创业的朋友提供了一种怎样写好博客并利博客赢利的方法。其作者是世界热门博客网站www.problogger.net的创办人。
    [样章试读 ]

    漫画生命史话

    旨在以浅显易懂的语言和轻松愉快的形式带领读者探寻生命的奥秘。所涵盖的内容涉及生命体内分子的故事、性和细胞生命、遗传规律、遗传表现以及遗传对物种的作用。
    [样章试读 ]

    javascript dom编程艺术(第2版)

    本书讲述了JavaScript、DOM 和HTML 5 的基础知识,着重介绍DOM 编程技术背后的思路和原则:平稳退化、渐进增强和以用户为中心等。这些概念对于任何前端web 开发工作都非常重要。
    [样章试读 ]

    编程珠玑
    本书是计算机科学方面的经典名著《编程珠玑》的姊妹篇,讲述了对于程序员有共性的知识。书中涵盖了程序员操纵程序的技术、程序员取舍的技巧、输入和输出设计以及算法示例……
    [样章试读 ]
    c#与.net 4高级程序设计:第5版

    本书是C# 领域久负盛名的经典著作,深入全面地叙述了C# 编程语言和.NET 平台核心,并以大量示例剖析相关概念。
    [样章试读 ]

    perl高效编程
    是Perl 编程领域的“圣经级”著作。它提供了一百多个详实的应用案例,足以涵盖编程过程中经常遇到的方方面面,由此详细阐释出各种高效且简洁的写法。本书第1 版曾畅销十年之久……
    [样章试读 ]
    黑客与画家
    本书是享有盛誉的ASP.NET 经典名著,涵盖了ASP.NET 4 的方方面面,包括了所有最新的特性,如图表控件、url 路由引擎、ado.net entity framework 的使用和wcf 数据服务等。
    [样章试读 ]
    MongoDB权威指南

    MongoDB如何帮你管理通过Web应用收集的海量数据呢?通过本书的权威解读,你会了解面向文档数据库的诸多优点,会发现MongoDB如此稳定、性能优越甚至能够无限水平扩展背后的原因。
    [样章试读 ]


    1-4月热点图书回顾

    图灵一月盛宴
    国际知名交互式设计专家力作,全彩印刷的《简约至上:交互式设计四策略》
    C++步步为营攻破C++堡垒,编程专家为你指点迷津的《C++探秘:68讲贯通》
    编程效率的极致追求,北大POJv ACM经典题目解析之《短码之美——编程达人的心得技法》
    虚拟世界首席架构师Jobe Makar权威作品《AcionScript大型网页游戏开发游戏》
    经典著作全面升级,Python程序员案头必备《Python参考手册》
    引领下一代web开发潮流《HTML5高级程序设计》
    好评如潮的C# 4.0实战图书《C# 4.0捷径教程》
    世界顶级专家thomas kyte力作《Oracle Database 9i/10g/11g编程艺术:深入数据库体系结构(第2版)》
    步步为营攻破C++堡垒,编程专家为你指点迷津《C++探秘:68讲贯通C++》

     

    图灵二月盛宴
    将本地PC游戏轻松移植到Android的秘技《精通Android游戏开发》
    全彩印刷,番茄工作法发明人弗朗西斯科·西里洛作序推荐《番茄工作法图解:简单易行的时间管理方法》
    第项19届Jolt大奖获奖作品,《人件》作者又一力作《项目百态:深入理解软件项目行为模式》

    图灵三月盛宴
    微软资深技术专家力作,亚马逊全五星评价《构建高性能可扩展ASP.NET网站》
    创建高可用性网页表单的经验和技巧《Web表单设计:创建高可用性的网页表单》
    充分展现自我,赢取理想工作 从容应对难题,留下完美印象《人人都有好工作:IT行业求职面试必读》
    深入剖析iPhone及iPad核心特性《iPhone与iPad开发实战》
    理论与实践的完美结合 涵盖软件标准和开发方法的最新进展《软件测试(第3版)》
    SEO+可用性=完美搜索体验《网站搜索设计——兼顾SEO及可用性的网站设计心得》
    netbeans 的创始人,也是netbeans 项目最初的架构师所著的《软件框架设计的艺术》
    项目管理初学者的最佳伴侣《写给大家看的项目管理书(第2版)》

    图灵四月盛宴
    释放JavaScript和DOM编程的惊人潜力 涵盖HTML5及jQuery 《JavaScript DOM编程艺术(第2版)》
    揭示健壮网络程序的秘密 网络编程人员必备 《TCP/IP高效编程:改善网络程序的44个技巧》
    跟随硅谷创业之父,走进黑客世界。 《黑客与画家:硅谷创业之父Paul Graham文集》
    带你探索电子学的奇妙胜境《身边的电子学:36个有趣的电子小实验》
    提升博客人气不可不用的绝招《博客也疯狂:ProBlogger经营之道(第2版)》
    代码示例丰富,提供C#和VB.NET两种版本 《ASP.NET 4揭秘(卷1)(卷2)》
    Amazon超级畅销书,权威新版王者归来《C#与.NET 4高级程序设计(第5版)》

     

    详细请点击图灵教育五月书讯

    展开全文
  • 中国裁判文书网爬虫思路详细分析 201811可用、前言二、编写爬虫的主要难点1.需要使用JS进行运算。2.需要读取cookie。3.使用eval函数加密自定义函数。4.使用复杂的算法消耗计算时间。5.代码的密钥值具有...

    一、前言

    最近有一些风险防范的需求,需要从中国裁判文书网批量下载一些裁判文书。但人工操作过于繁琐,于是对网站研究了一下,编写了一个爬虫实现了批量下载目录和正文。
    这个网站的反爬虫策略非常先进,使用了很多方法来增加爬取成本。编写这个网站的爬虫,需要具备丰富的经验技巧和坚强的毅力。
    这个网站的反爬虫策略更新很快,互联网上关于这个网站爬虫的文章基本都失效了,于是整理出了这篇非常详细的文章。可以帮助大家快速理解网站的层次结构和爬取的流程方法,编写出相关的程序。

    二、编写爬虫的主要难点

    这个网站的爬取方法比较复杂,除了需要使用常规的GET和POST方法之外,还有以下方面需要考虑。

    1.需要使用JS进行运算

    要求客户端运算JS,是现代反爬虫技术比较流行的方法。爬虫需要添加相关的逻辑来实现JS代码里的算法。
    由于这个网站更新的频率相当高,而且JS算法非常复杂,所以这个网站的爬虫最好是直接引用官方的JS,而不是重新实现算法。实现的方法有很多,比如可以使用程序构造特定的HTML和JS组合,使用无界面的谷歌浏览器来完成。

    2.使用eval函数加密自定义函数

    网站中的JS函数,有很多是加密的。这些函数代码使用eval函数嵌套多层,需要用eval函数解析JS代码多次,才能获得原始的函数,这样的代码难以阅读来分析算法,必须采用直接引用JS的方法来实现爬虫的算法。

    3.使用复杂的算法消耗计算时间

    网站中有一处密钥是用JS计算的,涉及MD5、SHA、BASE64等算法,非常复杂。经测试,一台i3处理器的计算机,计算这个密钥需要花费六七秒种。可见官方的反爬虫决心非常强。

    4.代码中的密钥值具有迷惑性

    代码中有一个密钥变量设置了初始值,看起来这个值就是最后要用的值,但实际上不是,这个密钥变量在通讯的时候,会被更新为另一个值。为了提高分析效率,可以使用浏览器的调试功能,加入断点,一步一步调试,就可以迅速找到更新这个变量的位置。

    5.对同一个IP地址的请求有限制

    获取列表页面没有限制,可以无限爬取。获取正文页面有限制,同一个IP地址每天不能请求太多,否则会出现验证码。这个验证码的识别还是很简单的,可以通过识别图像的方法解决,也可以通过更换IP的方法解决。

    6.加密算法策略升级比较频繁

    这个网站的更新相当频繁,主要是更新反爬虫策略。为这个网站编写爬虫,要做好长久的分析网站、改写爬虫准备,代码的结构和注释尽量要方便自己的阅读。

    三、获取列表的详细步骤

    1. 重要变量

    1) guid

    在客户端生成的一串随机生成的16进制字符串,用减号分隔。
    例如:c3495d84-0174-52af282e-1d5dffbefa00
    每次通讯时都需要生成一次新值。
    创建方法:Javascript

    var guidCreate = function () {
        var createGuid = function () {
            return (((1 + Math.random()) * 0x10000) | 0).toString(16).substring(1);
        }
    	var guid = createGuid() + createGuid() + "-" + createGuid() + "-" + createGuid() + createGuid() + "-" + createGuid() + createGuid() + createGuid();
    	return guid;
    }
    

    2) number

    将上一个步骤生成的guid通过POST方法提交给服务器,得到一个8位长度的字符串。
    例如:YUCLQLY4
    提交地址:http://wenshu.court.gov.cn/ValiCode/GetCode
    提交参数:guid
    后期运算的时候,有时候会用number的前4位。

    3) conditions

    这是搜索字符串,根据实际关键字拼接即可。
    比如:要搜索案件名称为“测试”的文书,字符串为“searchWord 测试 AJMC 案件名称:测试”,空格用加号替换,中文需要使用UTF-8字符集编码,如:“searchWord+%E6%B5%8B%E8%AF%95+AJMC++%E6%A1%88%E4%BB%B6%E5%90%8D%E7%A7%B0:%E6%B5%8B%E8%AF%95”

    4) vjkl5

    将guid和number和conditions三者通过GET方法提交给服务器,得到一个变量名为vjkl5的Cookie。
    例如提交地址:http://wenshu.court.gov.cn/list/list/?sorttype=1&number=YUCLQLY4&guid=c3495d84-0174-52af282e-1d5dffbefa00&conditions=searchWord+测试+AJMC++案件名称:测试
    返回的Cookie:

    _gscu_2116842793=38217821u8ob4015; _gscbrs_2116842793=1; ASP.NET_SessionId=obvr1tuaealkxakdqpuqfsnz; Hm_lvt_d2caefee2de09b8a6ea438d74fd98db2=1539738124,1539939830,1540547054; Hm_lpvt_d2caefee2de09b8a6ea438d74fd98db2=1540547316; _gscs_2116842793=t405470532wtpyg81|pv:5; vjkl5=ff9d8c3899ffecaf6901681896c33528ecc7678d
    

    其中最后一段vjkl5=ff9d8c3899ffecaf6901681896c33528ecc7678d就是。
    这个提交地址需要保存下来,获取列表的时候也会用到。

    5) vl5x

    这个获取方法比较复杂,是对vjkl5进行复杂运算之后得到。
    涉及的JS加密函数比较多,最好能直接引用官方的JS代码进行运算。
    涉及到主要的代码在
    http://wenshu.court.gov.cn/Assets/js/20180914/Lawyee.CPWSW.ListExtend.js
    http://wenshu.court.gov.cn/Assets/Js/pako.min.js
    http://wenshu.court.gov.cn/Assets/js/dist/libs/sha1.js
    http://wenshu.court.gov.cn/Assets/js/dist/libs/base64.js
    http://wenshu.court.gov.cn/Assets/js/dist/libs/md5.js
    运算之后的结果是类似这样的字符串:f4f43bd13437aabc06e327ed。

    2. 发送请求

    列表的获取是通过POST方法实现的。

    提交地址:http://wenshu.court.gov.cn/List/ListContent
    HTTP头需要具有:
    ‘Host’ => ‘wenshu.court.gov.cn
    ‘Referer’ => 获取vjkl5时提交的http://wenshu.court.gov.cn/list/list开头的地址
    ‘Origin’ => ‘http://wenshu.court.gov.cn

    POST参数:
    ‘Param’ => ‘案件名称:测试’
    ‘Index’ =>当前要获取的页码
    ‘Page’ => ‘20’
    ‘Order’ => ‘法院层级’,
    ‘Direction’ => ‘asc’,
    ‘vl5x’ => 之前得到的vl5x
    ‘number’ => 之前得到的number的前四位
    ‘guid’ => 重新生成一次guid

    3. 分析结果

    如果参数无误,会得到一个JSON格式的文本。如:

    "[{\"RunEval\":\"w61aw4vCrsKCMBDDvRbCjMKLNsOcw7gDw4TClcKfcMKXwpPChhh8wrFQTMOlwq7CjMO/LiBBwqQIeMKhwrXDoknDiBjDmsOpw4w5wqfDk8KSScKcw67DgsOVw7oUw4jDsBjDj39jGR7CtsKzwo3CjMO2wovDnVIuwqLDlcKawrnCjksCw4Zqw7MDEWDCvsKjQsOGQMOkS8KOK24lw6wtDHTCh8KyMMOYPSjChsONwoUIUALDlMKhCcO4woMwWEMOCAN1wqATw4jCgRJ2AAbChWDCocOhwp7Dp8OPJ0F0OMOFw7IvwogjOcOxfMOyRcOyMMOmwp4vwqlbw7HCnC/CnG4rKTFCwrjDjMOJJjg9w4ZMJ8OaZ8Kyw5fDqcO9w58Jw4TDksOhw4TCg8KcdMKGBCU/wpXChMKPw65Owr7DoHnCsgrDrlrDn0ZMw6Vow7XDo0XCqgzCtSrCkQLCocKWQ0PDrAJkN0VLwq/CrcKwO3rCvMOiw7bCssOvw78Ww7RYw5V3wqlaW8KDRR0uw4jDgMKRWsKPw7XCoMKJwrTDhcKsHsKlwobCjXwyw5rDocKieBNVwrPCkA3CnwlLE2ssflPCjDQeM8ONwrVmw7AuMsOPw49Iwo19w7DDl0EvNcOzwojDm8OTwr4Jw5M4ah3DkcOHASBHw4EqLU7CpwbDjkrCvWrDujXChRzDpcO9N8Odw7thZcK0HMKQenTCnBbCiQc8wqXCtMKcccOvCg==\",\"Count\":\"965\"},{\"裁判要旨段原文\":\"本院认为,根据再审申请人的申请再审事由,本院对再审申请人是否侵犯某公司的名誉权进行审查:
《最高人民法院关于审理名誉权案件若干问题的解释》规定:消费者对生产者、经营者、销售者的产品质量或者服务质量进行批评、评论,不应当认定为侵害他人名誉权。但借机\",\"不公开理由\":\"\",\"案件类型\":\"2\",\"裁判日期\":\"2017-07-27\",\"案件名称\":\"王某、某公司测试合同纠纷再审审查与审判监督民事裁定书\",\"文书ID\":\"DcOOw4cRw4BACMOAw4DClsOIHE9iw78lw5kFaFbCsSdEQH3Dm8KGdsOwwqRzXRjCvGV9DgxcB0ENwrDCuEM5wo9vNDlaIMKFw4/DlMOFLifDujjCnDpNwrYzwpXDh3DCuABfMcOlVsKRXcOZwrTDpD1DwqUnD3wofTAPwrUqJjbDg8Ovw6zDgsO5CEoDIQl7wqZgw7dHQkgRW33CvcKjw7/DrXbDosOmw7s/wrjDv8KQwojDng9Sw6gdG8K3fA==\",\"审判程序\":\"再审审查与审判监督\",\"案号\":\"(2017)最高法民申0000号\",\"法院名称\":\"最高人民法院\"},{\"裁判要旨段原文\":\"本院认为:双方解除劳动关系后办理工作交接手续是劳动者应尽的义务。双方在交接过程中发生摩擦,某公司要求李某支付因此产生的误工费、换锁和解码费用,原审认为该诉请不属劳动争议调整范围不予处理。某公司的权利并未被剥夺,可以另行主张,故该公司以原审\",\"案件类型\":\"2\",\"裁判日期\":\"2014-03-13\",\"案件名称\":\"某公司与李某劳动争议纠纷民事再审裁定书\",\"文书ID\":\"DcOMw4cRw4AwDMOEw4DClsKOSTTCn2LDqsK/JMOrwovDgcKsD2DCqsKGA8O5ICDCmxErUQ8aw77DmMKUHMOZfsOMwqjDqybCq8K9wpzDiULDisKLe8KuWzHDpcOOw7cZOsOjaTLConAywovDlT7Cq1XCjkDDpDA8wqRQwo/Dq8KPPW9cwqbCmMKsGxNAw7JmPQnDrFotwpzDjcOGw6DClGrCo1lAw73CrsOdFMObPmPCp2TDvcOtOgfCmsKaG35pwrl5wofCjsOKHsOKw4gf\",\"审判程序\":\"再审审查与审判监督\",\"案号\":\"(2013)豫法立二民申字第0000号\",\"法院名称\":\"河南省高级人民法院\"},……
    

    对其进行格式化:

    "[
        {
            \"RunEval\": \"w61aw4vCrsKCMBDDvRbCjMKLNsOcw7gDw4TClcKfcMKXwpPChhh8wrFQTMOlwq7CjMO/LiBBwqQIeMKhwrXDoknDiBjDmsOpw4w5wqfDk8KSScKcw67DgsOVw7oUw4jDsBjDj39jGR7CtsKzwo3CjMO2wovDnVIuwqLDlcKawrnCjksCw4Zqw7MDEWDCvsKjQsOGQMOkS8KOK24lw6wtDHTCh8KyMMOYPSjChsONwoUIUALDlMKhCcO4woMwWEMOCAN1wqATw4jCgRJ2AAbChWDCocOhwp7Dp8OPJ0F0OMOFw7IvwogjOcOxfMOyRcOyMMOmwp4vwqlbw7HCnC/CnG4rKTFCwrjDjMOJJjg9w4ZMJ8OaZ8Kyw5fDqcO9w58Jw4TDksOhw4TCg8KcdMKGBCU/wpXChMKPw65Owr7DoHnCsgrDrlrDn0ZMw6Vow7XDo0XCqgzCtSrCkQLCocKWQ0PDrAJkN0VLwq/CrcKwO3rCvMOiw7bCssOvw78Ww7RYw5V3wqlaW8KDRR0uw4jDgMKRWsKPw7XCoMKJwrTDhcKsHsKlwobCjXwyw5rDocKieBNVwrPCkA3CnwlLE2ssflPCjDQeM8ONwrVmw7AuMsOPw49Iwo19w7DDl0EvNcOzwojDm8OTwr4Jw5M4ah3DkcOHASBHw4EqLU7CpwbDjkrCvWrDujXChRzDpcO9N8Odw7thZcK0HMKQenTCnBbCiQc8wqXCtMKcccOvCg==\",
            \"Count\": \"965\"
        },
        {
            \"裁判要旨段原文\": \"本院认为,根据再审申请人的申请再审事由,本院对再审申请人是否侵犯某公司的名誉权进行审查:
《最高人民法院关于审理名誉权案件若干问题的解释》规定:消费者对生产者、经营者、销售者的产品质量或者服务质量进行批评、评论,不应当认定为侵害他人名誉权。但借机\",
            \"不公开理由\": \"\",
            \"案件类型\": \"2\",
            \"裁判日期\": \"2017-07-27\",
            \"案件名称\": \"王某、某公司测试合同纠纷再审审查与审判监督民事裁定书\",
            \"文书ID\": \"DcOOw4cRw4BACMOAw4DClsOIHE9iw78lw5kFaFbCsSdEQH3Dm8KGdsOwwqRzXRjCvGV9DgxcB0ENwrDCuEM5wo9vNDlaIMKFw4/DlMOFLifDujjCnDpNwrYzwpXDh3DCuABfMcOlVsKRXcOZwrTDpD1DwqUnD3wofTAPwrUqJjbDg8Ovw6zDgsO5CEoDIQl7wqZgw7dHQkgRW33CvcKjw7/DrXbDosOmw7s/wrjDv8KQwojDng9Sw6gdG8K3fA==\",
            \"审判程序\": \"再审审查与审判监督\",
            \"案号\": \"(2017)最高法民申0000号\",
            \"法院名称\": \"最高人民法院\"
        },
        {
            \"裁判要旨段原文\": \"本院认为:双方解除劳动关系后办理工作交接手续是劳动者应尽的义务。双方在交接过程中发生摩擦,某公司要求李某支付因此产生的误工费、换锁和解码费用,原审认为该诉请不属劳动争议调整范围不予处理。某公司的权利并未被剥夺,可以另行主张,故该公司以原审\",
            \"案件类型\": \"2\",
            \"裁判日期\": \"2014-03-13\",
            \"案件名称\": \"某公司与李某劳动争议纠纷民事再审裁定书\",
            \"文书ID\": \"DcOMw4cRw4AwDMOEw4DClsKOSTTCn2LDqsK/JMOrwovDgcKsD2DCqsKGA8O5ICDCmxErUQ8aw77DmMKUHMOZfsOMwqjDqybCq8K9wpzDiULDisKLe8KuWzHDpcOOw7cZOsOjaTLConAywovDlT7Cq1XCjkDDpDA8wqRQwo/Dq8KPPW9cwqbCmMKsGxNAw7JmPQnDrFotwpzDjcOGw6DClGrCo1lAw73CrsOdFMObPmPCp2TDvcOtOgfCmsKaG35pwrl5wofCjsOKHsOKw4gf\",
            \"审判程序\": \"再审审查与审判监督\",
            \"案号\": \"(2013)豫法立二民申字第0000号\",
            \"法院名称\": \"河南省高级人民法院\"
        },
    ……
    

    RunEval是用来解密本页正文网址的重要字符串。
    Count是本次查询得到的记录条数。
    后面是查询结果的信息,每条记录都有:裁判要旨段原文、案件类型、裁判日期、案件名称、文书ID、审判程序、案号、法院名称。文书ID包含了加密之后的正文网址信息,解密之后即可获得。

    四、获取正文的详细步骤

    1. 重要变量

    1) RunEval

    在上一个获取列表的步骤里,返回的信息包含RunEval。

    2) key

    key是一个16进制字符串,如:64da29c4a3550111c751824d。
    这里的key在JS代码里的完整名字是:com.str._KEY。在一处代码里,明确写了com.str._KEY初始值为:12345678900000001234567890000000,但这个值是不能用的。需要由RunEval进行复杂运算获得。获取方法比较复杂,可以通过执行JS的方法获得,涉及到的JS文件有:
    http://wenshu.court.gov.cn/Assets/Js/components/core-min.js
    http://wenshu.court.gov.cn/Assets/js/20180919/Lawyee.CPWSW.List.js
    http://wenshu.court.gov.cn/Assets/Js/rollups/aes.js
    http://wenshu.court.gov.cn/Assets/js/Base64.js
    http://wenshu.court.gov.cn/Assets/Js/rawinflate.js
    http://wenshu.court.gov.cn/Assets/Js/rawdeflate.js
    http://wenshu.court.gov.cn/Assets/Js/pako.min.js

    3) wsid

    将前面获得的每条记录的文书ID,设为wsid。

    4) docid

    在将key 赋值为com.str._KEY后,使用JS代码中的Navi函数,加入参数是wsid,可以算出docid。
    docid是一串16进制字符,用减号分隔,如:a374170b-47d0-405b-8d82-a834012d069c。
    获取方法比较复杂,可以通过执行JS的方法获得,涉及到的JS文件有:
    http://wenshu.court.gov.cn/Assets/Js/components/core-min.js
    http://wenshu.court.gov.cn/Assets/js/20180919/Lawyee.CPWSW.List.js
    http://wenshu.court.gov.cn/Assets/Js/rollups/aes.js
    http://wenshu.court.gov.cn/Assets/js/Base64.js
    http://wenshu.court.gov.cn/Assets/Js/rawinflate.js
    http://wenshu.court.gov.cn/Assets/Js/rawdeflate.js
    http://wenshu.court.gov.cn/Assets/Js/pako.min.js

    5) KeyWord

    搜索时用的关键字,中文需要使用UTF-8字符集编码。

    2. 发送请求

    列表的获取是通过GET方法实现的。

    提交地址:http://wenshu.court.gov.cn/CreateContentJS/CreateContentJS.aspx
    HTTP头需要具有:
    ‘Referer’ => http://wenshu.court.gov.cn/content/content?DocID=“获得的docid”&KeyWord=“获得的KeyWord”
    参数需要有:
    ‘DocID’ =>“获得的docid”

    3. 分析结果

    如果参数无误,会得到一段JS代码。如:

    $(function(){$("#con_llcs").html("浏览:1329次")});$(function(){var caseinfo=JSON.stringify({"法院ID":"0","案件基本情况段原文":"","附加原文":"","审判程序":"再审审查与审判监督","案号":"(2017)最高法民申0000号","不公开理由":"","法院地市":"","法院省份":"最高人民法院","文本首部段落原文":"","法院区域":"","文书ID":"a374170b-47d0-405b-8d82-a834012d069c","案件名称":"王某、某公司测试合同纠纷再审审查与审判监督民事裁定书","法院名称":"最高人民法院","裁判要旨段原文":"","法院区县":"","补正文书":"2","DocContent":"","文书全文类型":"1","诉讼记录段原文":"再审申请人王某因与被申请人某公司(以下简称某公司)、一审被告某公司、某中心侵犯名誉权纠纷一案,不服青海省高级人民法院(2016)青民终000号民事判决,向本院申请再审。本院依法组成合议庭对本案进行了审查,现已审查终结","判决结果段原文":"","文本尾部原文":"","上传日期":"\/Date(1531497600000)\/","案件类型":"2","诉讼参与人信息部分原文":"","文书类型":null,"裁判日期":null,"结案方式":null,"效力层级":null});$(document).attr("title","王某、某公司测试合同纠纷再审审查与审判监督民事裁定书");$("#tdSource").html("王某、某公司测试合同纠纷再审审查与审判监督民事裁定书 (2017)最高法民申0000号");$("#hidDocID").val("a374170b-47d0-405b-8d82-a834012d069c");$("#hidCaseName").val("王某、某公司测试合同纠纷再审审查与审判监督民事裁定书");$("#hidCaseNumber").val("(2017)最高法民申0000号");$("#hidCaseInfo").val(caseinfo);$("#hidCourt").val("最高人民法院");$("#hidCaseType").val("2");$("#HidCourtID").val("0");$("#hidRequireLogin").val("0");});$(function(){var dirData = {Elements: ["RelateInfo", "LegalBase"],RelateInfo: [{ name: "审理法院", key: "court", value: "最高人民法院" },{ name: "案件类型", key: "caseType", value: "民事案件" },{ name: "案由", key: "reason", value: "测试合同纠纷" },{ name: "审理程序", key: "trialRound", value: "再审审查与审判监督" },{ name: "裁判日期", key: "trialDate", value: "2017-07-27" },{ name: "当事人", key: "appellor", value: "王某,某公司,某公司,某中心" }],LegalBase: [{法规名称:'《中华人民共和国民事诉讼法》',Items:[{法条名称:'第二百零四条',法条内容:'第二百零四条   系统尚未收录或引用有误
'}]}]};if ($("#divTool_Summary").length > 0) {$("#divTool_Summary").ContentSummary({ data: dirData });}});$(function() {
    var jsonHtmlData = "{\"Title\":\"王某、某公司测试合同纠纷再审审查与审判监督民事裁定书\",\"PubDate\":\"2018-07-14\",\"Html\":\"<a type='dir' name='WBSB'></a><div style='TEXT-ALIGN: center; LINE-HEIGHT: 25pt; MARGIN: 0.5pt 0cm; FONT-FAMILY: 宋体; FONT-SIZE: 22pt;'>中华人民共和国最高人民法院</div><div style='TEXT-ALIGN: center; LINE-HEIGHT: 30pt; MARGIN: 0.5pt 0cm; FONT-FAMILY: 仿宋; FONT-SIZE: 26pt;'>民 事 裁 定 书</div><div style='TEXT-ALIGN: right; LINE-HEIGHT: 30pt; MARGIN: 0.5pt 0cm;  FONT-FAMILY: 仿宋;FONT-SIZE: 16pt; '>(2017)最高法民申2170号</div><a type='dir' name='DSRXX'></a><div style='LINE-HEIGHT: 25pt;TEXT-ALIGN:justify;TEXT-JUSTIFY:inter-ideograph; TEXT-INDENT: 30pt; MARGIN: 0.5pt 0cm;FONT-FAMILY: 仿宋; FONT-SIZE: 16pt;'>
    

    这里各个字段写的很清楚,正文的HTML代码也在里面,直接提取出来就可以了。

    五、后记

    按照这个思路编写出程序,就可以顺利爬取了。到这里,整个流程就介绍完了。

    展开全文
  • 在进行频次、周期业务处理的时候,需要查询日、周、、季度、等周期时间,为此而写的个时间工具类。 import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.ArrayList...
  • 最近在做部队项目,有用到、季、、日、周价格管理,本来想省事写个六级级联的脚本控制一下完事儿,更何况原型给的也并不美观,也就没怎么着急。  后来,闲来无聊,瞄了眼jquery Datepicker,也跟了跟...
  • 而在这系列过程背后浮出的各大IT公司的笔试/面试题则蕴含着诸多思想与设计,细细把玩,思考一番亦能有不少收获。 上个,本博客着重整理九腾讯,创新工场,淘宝等公司最新面试十三题,此次重点整理百度,阿里...
  • 老太火拽出75岁大妈

    千次阅读 2004-08-18 14:17:00
    法制晚报 20040810日中午12时30分许,通州区西马庄园小区41号楼10单元二层住户家中发生煤气爆炸,当时正在火场的李老太毫不犹豫地冲进厨房,勇敢地救出了被火烧伤的75岁的王大妈。 80岁的李老太介绍,王大妈...
  • 2013到2014学习计划及总结(更新至20193)

    千次阅读 热门讨论 2014-10-08 13:32:49
    20135月中旬我给自己制定了个1.5的学习计划,计划的起点为20135,计划的终点为201412底。虽然现在并没有到达计划的截止时间,但是我已经从该计划中收获了很多,并发现了自身的问题,所以便提前3个...
  • 16,平凡而又收获的一年

    千次阅读 热门讨论 2016-12-31 22:01:48
    16,平凡而又收获的一年岁月如水,时间飞逝,转眼间,已经到了年尾,即将引来新的一年,我要赶紧抓住16的尾巴,写篇文章记录一下我16的点点滴滴。篇章大概如下,学习&工作室篇,实习篇,盛夏六, 博客篇,...
  • 昨天好个公众号推送关于Python2.7正式“退休”的消息,有个网站专门做了个python2.7退休的倒计时。不过Python官方博客的说法是,2020的4还会发布python2...
  • 智能一代云平台(三):15上半年维护总结

    万次阅读 热门讨论 2015-07-05 21:31:57
    月中旬,由大洲为大Boss建立起支维护的队伍。其实之前大洲就询问我这次活动多吗?自己不多,大洲说块儿弄系统,正好我对服务器了解稍微多点。我当时口答应,并担保一定给弄好。 六底就开始考试,时间...
  • 如何计算某天是星期

    千次阅读 2014-09-22 15:45:12
    星期制度是种有古老传统的制度。...以尽管中国的传统工作周期是十天(比如王勃《滕王阁序》说的“十休暇”,即是  指官员的工作每十日为个周期,第十日休假),但后来也采取了西方的星期制度。
  • 如何快速算出个日期是星期

    万次阅读 2007-11-19 21:16:00
    最常见的公式:(如果你觉得很烦,看公式就可以了) W = [Y-1] + [(Y-1)/4] - [(Y-1)/100] + [(Y-1)/400] + D Y是年份数,D是这一天在这一年中的累积天数,也就是这一天在这一年中是第天。 最好用的是蔡勒公式: W = ...
  • 1、 pt&lt;-ts(p, freq = 1, start = 2011) ...frequency=12表示以月份为单位,start 表示时间开始点,start=c(2011,1) 表示从20111开始 3、季度 pt &lt;- ts(p, frequency = 4, start ...
  • 计算任意天是星期的问题

    千次阅读 2012-09-12 17:25:10
    星期制度是种有古老传统的制度。...以尽管中国的传统工作周期是十天(比如王勃《滕王阁序》说的“十休暇”,即是  指官员的工作每十日为个周期,第十日休假),但后来也采取了西方的星期制度。
  • 据国内某基金公司所作的统计,在20057月中旬至9月中旬这 个当年最为明显的波段中,真正能够做到相对低点(最低点1012点前后三天)申购,相对高点(最高点1220点前后三天)赎回的客户只有两个,占全部101595个客户的...
  • 16,悲痛又收获的一年

    万次阅读 多人点赞 2016-12-17 13:02:27
    花开后坐着北上的列车,和铁哥们商量着,一边上班,一边干票事。想法至今认为都还好。那些夜里都是满脑在想着如何构思,如何定我们的战略。毕竟大家都经,没有什么导师告诉我们,应该准备怎样,钱都准备好了...
  • 细算起来,从去年七月份来到计算所,已经一年多了,这一年经历了很多、成长了很多,想在这里把这一年实习的经历和感受都记录下来,为已经保研成功的小伙伴做个参考。 在写的过程,这一年的一幕幕在脑海像过...
  • 更新 | 20199计算机二级office模拟题库

    万次阅读 多人点赞 2019-07-03 23:00:01
    20199(56次)全国计算机等级考试(以下简称NCRE)将于9月中旬举行。已经报名的同学请利用暑期时间好好准备吧! > 20199月份最新二级题库看文末 ▼ 公众号内回复关键词:2305, 获取下载链接 考前学习 ...
  • 很幸运在 17 年中旬受到阿里棒喝,由于17开始写博客,Android 自定义贝塞尔曲线 这篇文章发布到 github 没多久点赞数蹭蹭往上涨,3 个后阿里突然主动联系到我,邀请我进行电话面试。当时感觉自己还挺能,但现实...
  • 关于以来找工作的经验总结

    千次阅读 2012-09-13 11:33:27
    我就开始了自己找工作的日子,大概是从七月中旬开始在网上疯狂的投简历,结果呢接到的面试电话寥寥无几,偶尔找我去面试的公司,去才知道是那种交钱培训的,我本身对这种IT培训公司特别的反感,难道我在学校四学...
  • 20126月中旬,在媳妇儿拿到西安中软的offer之后,我一边接着找工作,一边去看媳妇儿。后来在媳妇儿的推介下,又厚着脸皮去中软面试,笔试题由于做过次,所以十五分钟就做完了。然后经过了1面,2面,3面。正当我...
  • 2020313日 感恩娃娃婆婆

    万次阅读 2020-03-13 21:11:14
    xixi婆婆过来帮忙带xixi已经有些日子了,1月中旬过来,到现在3月中旬,满打满算2个了,因为疫情,所以原计划中的春节回家也被迫取消了,不过幸好的是,xixi婆婆非常喜欢xixi,相处的很好,每天虽然累些,但是也很...
  • 从194月中旬实习回来,就开始c++学习之路,每天坚持更新博客,无奈事情太多,毕业设计答辩,很忙,就停止了更新,毕设得分很高,哈哈,自(。・∀・)ノ゙嗨一下。紧接着,就开始投简历,目标地点北京、西安,起初没...
  • 资讯--20194

    千次阅读 2019-05-13 15:00:35
    都已经5月中旬了,这篇4的资讯报告有点晚 另外,最近去了个苏州的展会,2019全球人工智能产品应用博览会,收获不大,但聊胜于无,到时候整理整理放上来。 Yoshua Bengio、Geoffrey Hinton、Yann LeCun获得了...
  • 时间:2013529日 上午 主持人是杜玉杰,上午位重量级的演讲嘉宾来自政府、CloudStack的创始人以及位开源ElastOS的掌门人,最后是圆桌会议。 上午的会议主要是围绕宏观上展开的,当然ElastOS是个例外...
  • 数据融合项目自201810月中旬开始,至20192上旬止,经过了接近四个的开发进入稳定版。在此次开发过程中,在各个方面都遇到了一些问题,最终影响了开发的效率,和产品的质量。但是,也从中吸取了经验和教训,...
  • CISSP考试复习经历分享202012

    千次阅读 2020-12-03 10:54:07
    回过头看,CISSP复习考试并不是特别艰难,而困难在于想考试的人大都面临工作任务...8月中旬儿子出生,有半个没日没夜带娃,啥都没看,所以第二遍有效看书时间两个,总算对整体知识有印象了。这个时间我感觉很好,.
  • 根据、周、日设置时间节点的日期工具类 import com.web.zuozuo.result.consts.DateTimePattern; import java.text.ParseException; import java.text.SimpleDateFormat; import java.time.*; import java....

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 25,926
精华内容 10,370
关键字:

一年中中旬是几月