精华内容
下载资源
问答
  • 天眼查询

    千次阅读 2017-11-23 17:13:34
    天眼查官方网址:...天眼查是一款 “都能用的商业调查工具”,实现了企业信息、企业发展、司法风险、经营风险、经营状况、知识产权等40种数据维度查询(企业工商信息、法律诉讼、法院公告、商标专利、向外投资、

    天眼查官方网址:https://www.tianyancha.com/

    国家企业信息信息公开系统:http://www.gsxt.gov.cn/corp-query-homepage.html


    介绍:

    天眼查是一款 “都能用的商业调查工具”,实现了企业信息、企业发展、司法风险、经营风险、经营状况、知识产权等40种数据维度查询(企业工商信息、法律诉讼、法院公告、商标专利、向外投资、分支机构、变更信息、债券、网站备案、著作权、招投标、失信、经营异常、企业年报、招聘及新闻动态等),深度商业“关系梳理”,专业信用报告呈现等功能。适合金融、投资、律师、咨询、记者、商务等人士。


    查看指标:

    1.天眼评分

           天眼查评分系统的逻辑极其复杂,是综合考量了企业自身、投资、股权等因素后,设计的独家评分模型,极具参考价值,分数越高,表明该企业综合实力越强。




    展开全文
  • 天眼查

    2016-10-12 14:15:00
    转载于:https://www.cnblogs.com/communist/p/5952633.html

    转载于:https://www.cnblogs.com/communist/p/5952633.html

    展开全文
  • 实现天眼查POST查询

    2019-08-04 13:18:19
    由于工作原因,需要在天眼查网站上查询大约九百个公司的工商信息。数量有点多,所以手动查询是不可能的了,因此写了个程序进行自动查询并且把获取到的信息导入到Excel表格中。我们通过用易语言写一个天眼查POST查询...
  • 天眼查的滑块验证码可不可以解决呢?答案是一定可以的。今天我们就来聊聊类似天眼查这种滑块验证码的解决方案。解决滑块验证码的步骤有这么几步。第一:截图。通过各种技术手段截目标图如下:代码实现片段:button =...

    相信做爬虫的很多小伙伴一定会遇到很多滑块验证码的问题。在爬取天眼查的时候是要求需要登陆的。天眼查的滑块验证码可不可以解决呢?答案是一定可以的。今天我们就来聊聊类似天眼查这种滑块验证码的解决方案。

    解决滑块验证码的步骤有这么几步。第一:截图。通过各种技术手段截目标图如下:

    代码实现片段:

    button = driver.find_element_by_xpath('/html/body/div[10]/div[2]/div[2]/div[2]/div[2]')

    ActionChains(driver).move_to_element(button).click_and_hold().perform()

    image_node = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH, '/html/body/div[10]/div[2]/div[2]/div[1]/div[2]/div[1]/a[2]/div[1]')))

    left = image_node.location["x"]

    top = image_node.location["y"]

    element_width = image_node.location["x"] + image_node.size['width']

    element_height = image_node.location["y"] + image_node.size['height']

    driver.save_screenshot("./tianyancha.png")

    原理:拖动滑块使得缺口出现,定位图片元素,通过图片的位置和大小,截图。截图效果如下

    第二步:计算出滑动距离

    代码如下:

    def return_distance():

    """

    根据截取的验证码图片计算滑动距离

    """

    print("调用return_distance 方法-----------------------")

    img = Image.open("./yanzhengma.png")

    weight, height = img.size

    for iin range(65, weight):

    for jin range(height):

    img = img.convert('RGB')

    str_strlist = img.load()

    data = str_strlist[i, j]

    a, b, c = data

    if ain list(range(10))and bin list(range(60, 80)):

    print("有返回值-------------")

    return i -6

    第三步:设计出滑动轨迹,网上有很多中滑动根轨迹这里我也是参考的别人的轨迹,效果还不错。

    代码如下:

    def get_track(self, distance):

    """

    根据偏移量和手动操作模拟计算移动轨迹

    :paramdistance: 偏移量

    :return: 移动轨迹

    """

    # 移动轨迹

    tracks = []

    # 当前位移

    current =0

    # 减速阈值

    mid = distance *4 /5

    # 时间间隔

    # t = 0.2

    t =0.2

    # 初始速度

    v =0

    while current < distance:

    if current < mid:

    # a = random.uniform(3, 7)

    a = random.uniform(2, 5)

    else:

    a = -(random.uniform(12.5, 13.5))

    # a = -(random.uniform(12.5, 13.5))

    v0 = v

    v = v0 + a * t

    x = v0 * t +1 /2 * a * t * t

    current += x

    if 0.6 < current - distance <1:

    x = x -0.53

    tracks.append(round(x, 2))

    elif 1 < current - distance <1.5:

    x = x -1.4

    tracks.append(round(x, 2))

    elif 1.5 < current - distance <3:

    x = x -1.8

    tracks.append(round(x, 2))

    else:

    tracks.append(round(x, 2))

    return tracks

    最后:获取滑柄,模拟滑动

    def move_to_gap(self, slider, tracks):

    """

    将滑块移动至偏移量处

    :paramslider: 滑块

    :paramtracks: 移动轨迹

    :return:

    """

    action = ActionChains(self.browser)

    action.click_and_hold(slider).perform()

    for xin tracks:

    # time.sleep(random.randrange(20, 40) / 200)

    action.move_by_offset(xoffset=x,yoffset=-1).perform()

    action = ActionChains(self.browser)

    time.sleep(2)

    action.release().perform()

    # print(self.browser.current_window_handle)

    展开全文
  • 刚开始学习Python,不愿意看基础,记忆不好,那些语法记不住,直接上个项目,这样比较深刻刚好公司有个情况要查企业的信息,就想做个爬虫吧,有验证码的不愿意搞,那是个老大难问题,就选择了天眼查过程都略了,直接...

    刚开始学习Python,不愿意看基础,记忆不好,那些语法记不住,直接上个项目,这样比较深刻

    刚好公司有个情况要查企业的信息,就想做个爬虫吧,有验证码的不愿意搞,那是个老大难问题,就选择了天眼查

    过程都略了,直接写个结果吧,总结出来的步骤如下:

    一、天眼查最大的障碍在于字体问题,这个网上都有介绍,大概意思就是说,在网页显示出来的某些字符,是天眼查自己的字体文件处理的。

    比如汉字 坐  的utf-8的编码是 b'\\u5750'  ,但在天眼查的字体文件里,这个编码对应的汉字是  万 。

    这样在页面上某些地方肉眼看到的比如 2500万元,但实际通过标准编码得到的是 2500坐元。其实还有数字,也全部是打乱的。

    这样爬到的结果就是后面那个了,这不是我想要的。

    二、该字体文件,每天都变,没有固定的,这样想通过做个编码对应表的方法也被否决了。

    三、只能一步一步来了,先把该字体文件下载下来,然后通过 fontTools 来操作字体文件,我通过转成xml文件,结合fontCreator,看了一下字体文件的结构,大概知道是怎么回事了

    from fontTools.ttLib importTTFont

    font1= TTFont('D:/Temp/num4.woff')

    font1.saveXML('D:/Temp/font4.xml')

    四、把字体结构弄清楚之后,把里面所有的编码,结合该字体,生成位图。

    importosimportPIL.Image, PIL.ImageFont, PIL.ImageDraw

    image=PIL.Image

    ImageDraw=PIL.ImageDraw

    ImageFont=PIL.ImageFont

    text= u"坐"im= image.new("RGB", (300, 50), (255, 255, 255))

    dr=ImageDraw.Draw(im)

    font= ImageFont.truetype(os.path.join("fonts", "d:/temp/num4.woff"), 14)

    dr.text((10, 5), text, font=font, fill="#000000")

    im.show()

    im.save("d:/temp/t.png")

    #因为我只是学习,所以并没有写完整代码,以上代码只是用来结合字体生成图片的示例

    五、把字体文件中涉及到的字按顺序生成的图片,通过OCR识别成字,这个我前面的文章就是专门有写ocr的,识别率100%

    六、得到的结果应该是这样的

    七、最后通过抓取的结果,然后转成对应的编码,即可得到想要的结果了

    八、其它,用fonttools直接获取字体相关的数据如下代码

    from fontTools.ttLib importTTFont

    font1= TTFont('D:/Temp/num3.woff')

    cmap=font1['cmap']

    cdict=cmap.getBestCmap()

    acs=ord('3')print(acs)print(cdict)#print(cdict[31532])#glyf=list(font1['glyf'].keys())#print(glyf)#bfd=glyf.index('_#58')#print(bfd)

    展开全文
  • 最新天眼查python爬虫

    2020-06-08 15:53:36
    因公司需求,需要根据公司名称爬取天眼查详细信息,先从工商局抓取需要的公司名称,然后根据名称抓取天眼查数据,2020年6月8号最新抓取天眼查python爬虫
  • 一,因为某个ip延长内查询次数过多,所以查询时会自动跳到登陆界面,这种情况需要使用一个手机号进行三,假如短时间呢使用很多很多次查询的话,天眼查有人机判断的验证码,需要手动打开天眼查网站进行一下人机验证。...
  • 天眼查.zip

    2019-06-04 17:04:01
    天眼查破解版。手机安装即可使用,安全无毒。内有可用账号。
  • 天眼查数据抓取

    2018-03-14 17:30:27
    天眼查公司数据抓取 自动登陆 跳转抓取 翻页 写入数据库
  • 本次以天眼查和猫眼电影为例,解析怎样爬取替换的真实数据,感谢 "两个眼" 。。,本文使用python3。分析先来个简单点的:天眼查打开天眼查,找到阿里巴巴的页面 https://www.tianyancha.com/company/59837300,可以...
  • 一,因为某个ip延长内查询次数过多,所以查询时会自动跳到登陆界面,这种情况需要使用一个手机号进行三,假如短时间呢使用很多很多次查询的话,天眼查有人机判断的验证码,需要手动打开天眼查网站进行一下人机验证。
  • java天眼查爬虫

    2018-05-19 20:58:39
    使用jsoup做的java爬虫, 登录自己的天眼查账号, 爬取公司详细数. 不足: 大概执行100次请求之后会被识别为机器人.
  • 天眼查企业查询爬虫

    千次阅读 2020-07-07 13:03:54
    写一个天眼查的爬虫,大家有需要的可以直接拿来用,是基于selenium写的。所以使用之前得下载上这个插件。 爬的是上面的那个页面 from selenium import webdriver from selenium.webdriver.support.wait import ...
  • 天眼查爬虫学习demo

    2019-01-22 10:33:14
    天眼查爬虫,用到了Python的各种解析及IP池技术,仅供学习使用
  • 根据天眼查最新的xpath写的天眼查爬虫,亲测可以用,爬数据十分方便
  • Python-Tianyancha2018-01-31 更新看到有两位朋友提交了Issues,在这里集中回答一下。...天眼查工商注册信息爬虫采用Excel表格作为输入,根据公司名称查询该公司相关的工商注册信息。包含并不限于...
  • 天眼查抓取脚本tianyancha.py
  • 准备环境python 3.7版本安装对应的库:pip install 安装库名requestsBeautifulSoupcx_Oracleurllibrandom解析网页规则查看爬取网站入口规则这个天眼查的规则就是在https://www.tianyancha.com/search?key=这个地址后...
  • 天眼查一面

    2020-11-10 14:57:00
    天眼查一面 当时忘记录屏了,凭印象写,直接开始 面试 写代码吧,合并两个有序数组(这个在美团一面的时候也考了,写的时候还是紧张,不过不是很难,写完了面试官看了看说逻辑没有问题) 实习的经历都做了什么,有...
  • 天眼查.py自动下载企业信用报告
  • 天眼查每次能到处5000条数据,模板暂时看是固定的,,,特地发上来一个给大家。没有数据。不过本人有个可以批量管理天眼查excel的简单通用企业信息共享软件正在开发中。。。已经可以在线更新,所以想了解和提建议的...
  • 天眼查二面

    2021-02-03 16:03:04
    天眼查二面 好久没写面经,刚刚实习结束,来把自己之前的面经总结下。 我忘记这是哪个公司了,好像是天眼查二面吧,上题。 JVM内存结构了解过吗 JVM分了哪几块 堆、栈、方法区存哪些数据 OOM(好像是这个)是什么 ...
  • 手动访问天眼查页面,发现页面提示确认是否是机器人。请大神指导怎么能躲过反爬取检测。问题:目前不太清楚天眼查是根据IP,还是根据cookie来做的反爬取限制。尝试过的操作:1、延长每次请求的时间,设置为3s中爬取...
  • 学习系列之天眼查爬虫

    千次阅读 2019-11-07 17:36:55
    天眼查APP爬虫爬虫不用逆向app爬取天眼查 爬虫不用逆向app爬取天眼查 遇到个好人破解了天眼查app的参数加密,链接如下 https://blog.csdn.net/ggl1438/article/details/102937819 ...
  • Python访问天眼查

    万次阅读 2017-07-11 11:28:48
    Python访问天眼查,浏览器获取cookie,爬虫的雏形
  • 有没有什么工具可以爬取天眼查网站中的企业信息?或者爬取天眼查企业信息的相关的Java代码?
  • 不少用户发现,专业的商业查询软件天眼查已全线预装进华为Mate系列中。华为Mate40发布会现场据了解,华为Mate40系列在性能方面,搭载了旗舰芯片麒麟9000,性能超过骁龙865+、三星Exynos1080等芯片,是今年最强安卓...
  • 天眼查sign 算法破解

    2019-07-10 17:57:00
    天眼查sign 算法破解最近真的在sign算法破解上一去不复返前几天看过了企查查的sign破解今天再看看天眼查的sign算法破解,说的好(zhuang)点(bi)就是破解,不好的就是这是很简单的东西啊,只需要找key就可以了,话...
  • # -*- coding: utf-8 -*-import reimport csvimport scrapyimport redisredis_cli = redis.Redis(host="127.0.0.1",port=6379)class SearchSpider(scrapy.Spider):name = "search"...
  • 天眼查企查查辅助工具(辽宁省),电销公司必备利器!

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 950
精华内容 380
关键字:

天眼查