精华内容
下载资源
问答
  • for i in linklist: print("当前获取: %s"%(i)) results.append(parseEachBlog(i)) parseData() delTempFile() 附:文章类型的图像识别 川川大佬:python菜鸟_川川菜鸟_CSDN博客 帮蓝多多解答了关于文章类型是图片...

    写在前面:

    本文已获得原博主授权转载,转载链接:Python爬虫分析CSDN个人博客数据_Caso_卡索的博客-CSDN博客

    代码来源Caso_卡索博主的github:https://github.com/xiaoma101017/ParseCSDNBlog

    转载目的仅供存档学习及日常使用,请勿做商业用途。

    Step one:检查网页源代码:

    爬取代码运行过程:

    爬取结果:

    附:完整代码(有部分修改)

    import requests
    from bs4 import BeautifulSoup
    import pandas as pd
    import os
    import re
    Host = "lddwarehouse.blog.csdn.net" # 请求头host参数
    User_Agent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36 "
    Source = 'html.txt'   # 临时保存博客列表html源码
    EachSource = 'each.txt' # 临时保存每篇博客html源码
    OUTPUT = "蓝多多博客汇总.csv"  # 输出博客信息到 csv 文件
    results = [] # 存储全部数据
    #相关函数定义
    def parseEachBlog(link):
        referer = "Referer: " + link
        headers = {"Referer": referer, "User-Agent": User_Agent}
        r = requests.post(link, headers=headers)
        html = r.text
        with open(EachSource, 'w', encoding='UTF-8') as f:
            f.write(html)
        soup = BeautifulSoup(open(EachSource, 'r', encoding='UTF-8'), features="html.parser")
        readcontent = soup.select('.bar-content  .read-count')
        collection = soup.select('.bar-content .get-collection')
        readcounts = re.sub(r'\D', "", str(readcontent[0]))
        collections = re.sub(r'\D', "", str(collection[0]))
        print(soup.select('.title-article')[0])
        blogname = soup.select('.title-article')[0].text
        time = soup.select('.bar-content .time')[0].text
        programa = soup.select('.blog-tags-box .tag-link')[0].text
        print(programa)
        type = soup.select('.text-center .font')[0].text #这里代码有误,需要用到下面的图像识别
        print(type)
        eachBlog = [blogname, link, readcounts, collections, time, programa, type]
        return eachBlog
    def getBlogList(pages):
        listhome = "https://" + Host + "/article/list/"
        pagenums = [] # 转换后的pages页数
        for i in range(1, int(pages)+1):
            pagenums.append(str(i))
    
        for number in pagenums:
            url = listhome + number + "?t=1"
            headers = {"Referer": url, "Host": Host, "User-Agent": User_Agent}
            response = requests.post(url, headers=headers)
            html = response.text
            with open(Source, 'a', encoding='UTF-8') as f:
                f.write(html)
        # 获取全部博客的链接
        soup = BeautifulSoup(open(Source, 'r', encoding='UTF-8'), features="html.parser")
        hrefs = []
        re_patterm = "^https://lddwarehouse.blog.csdn.net/article/details/\d+$"
        for a in soup.find_all('a', href=True):
            if a.get_text(strip=True):
                href = a['href']
                if re.match(re_patterm, href):
                    if hrefs.count(href) == 0:
                        hrefs.append(href)
        return hrefs
    def parseData():
        results.sort(key=lambda result:int(result[2]), reverse=True) # 按浏览量排序
        dataframe = pd.DataFrame(data=results)
        dataframe.columns = ['文章标题', '文章链接', '浏览量', '收藏量', '发布时间','第一所属专栏','文章类型']
        dataframe.to_csv(OUTPUT, index=False, sep=',',encoding='gbk')
    def delTempFile():
        if os.path.exists(Source):
            os.remove(Source)
        if os.path.exists(EachSource):
            os.remove(EachSource)
    
    if __name__ == '__main__':
        pages = input("请输入博客列表页数: ")
        linklist = getBlogList(pages)
        print("开始获取数据...")
        for i in linklist:
            print("当前获取: %s"%(i))
            results.append(parseEachBlog(i))
        parseData()
        delTempFile()

    附:文章类型的图像识别

    川川大佬:python菜鸟_川川菜鸟_CSDN博客 帮蓝多多解答了关于文章类型是图片如何处理的问题,非常感谢!

    Step one :先使用soup.select获取该篇文章类型的图片描述:

    Step two :使用save函数将这个图保存到本地(在下面的识别完成以后再删除)

     Step three:读取图片并提取文字:

    import ddddocr
    
    ocr = ddddocr.DdddOcr()
    with open('c.png', 'rb') as f:
        img_bytes = f.read()
    res = ocr.classification(img_bytes)
    
    print(res)

    即可获得该文章类型的text:

    交流:

    (代码还没有修改,有兴趣可以自己先试试嗷)

    展开全文
  • 注意去耦电容要靠近芯片等需要去耦的地方,电容有自身的去耦半径,所以不能离得太远 8、电源线、地线尽可能粗,地线在底部敷铜 9、画板子后要多多检查,不确定的地方一定要问学长或老师,尽量减少板子报废的可能性 ...

    1、焊接不要带尖刺,拆元件时不要去硬怼板子或器件,可以适当沾点焊锡就很容易蹭掉它
    2、信号线不要走直角,尽量减少弯折和过孔的次数
    3、线不要直闯单片机等的引脚,如必须要在两排针脚中间过要尽可能在正中间
    4、要考虑人机交互,比如:串口、按键、LCD、LED、蜂鸣器等
    5、四角要留有固定板子的通孔、打孔要注意尺寸
    6、封装要选对,根据实际需要选择封装,要考虑针脚间距,注意器件大小,比如单片机和显示屏会不会撞到。
    7、避免出现似连似不连的情况,尤其是要检查每个过孔
    电容放在舵机电源线上才能起稳压作用。舵机电容尽量大于470uf。注意去耦电容要靠近芯片等需要去耦的地方,电容有自身的去耦半径,所以不能离得太远
    8、电源线、地线尽可能粗,地线在底部敷铜
    9、画板子后要多多检查,不确定的地方一定要问学长或老师,尽量减少板子报废的可能性
    10、板子要尽可能的紧凑,而且要模块化,比如电源模块、运放模块、电机驱动模块
    11、与软件要多沟通,硬件是是整个系统能够稳定运行的基础。硬件电路的设计不仅需要考虑功能性,而且需要对其稳定性及可靠性进行准确的设计,需要不断的测试与改进。
    12、注意有些引脚的配置是固定的,但有些比如LCD的引脚是可以修改的(实验室有个文件替换,替换之后就可以随意更改了),在布局走线时可以根据情况选择最近最佳的引脚。
    13、重心设计:重心要集中在车模中心位置,避免出现打脚迟钝和神龙摆尾的情况。
    14、传感器固定:电感前瞻一定要尽可能与赛道水平,不要倾斜。器件固定要牢固,用3D打印自制支架是个很好的方式。
    15、机械结构很重要!四轮车主销调整:轮胎软化、打磨;轴承润滑;轮距合适;主销后倾角、主销内倾角;车轮外倾角;前轮前束
    16、减震设计;防撞设计,避免撞击或飞坡触发停车
    17、车模整体紧凑、如需加配重,位置根据车模情况择优选择
    18、多看技术报告(智能车官网—资料下载处可以下载)
    19、多多参考实验室往届程序
    20、函数、变量的命名用英语会显得更好,拼音很让人头大的。
    21、代码加注释,而且要对齐。代码要模块化,尽量分文件,比如:转向控制(PID等)、速度控制(差速、闭环等)、路径(编码器计路程等)、元素识别等分开来,方便后期完善,也方便队友参考
    22、一些经常要用到的数值可选择采用宏定义#define 这样要修改的话,改一次就行了
    23、要清晰的知道自己程序每个模块运行的时间
    24、多去实地观测(发送上位机、显示屏显示等),实践是检验程序优劣的唯一方式。理论上可行与实地跑车还是有很大差距的(比如环岛识别)
    25、不同的模式尽量选用按键去调整,频繁的下载程序在赛场上很浪费时间
    26、调出一个具有普适性的参数的大前提是具有一个整洁的赛道,作为实验室的一员要能够主动的去打扫实验室卫生,环境的因素也会影响你调车的心情和参数的质量
    27、珍惜实验室的资源,要有价格意识,要珍惜,随意乱扔的现象要杜绝,勤拿少取。
    28、要学会修理器件、板子等,不要“坏了”就把旧的放到一边,直接换新的,学会Debug才能更好的提升自己。
    29、调参数时需要通过理论分析+实际测试(显示到显示屏手推观察、发送到上位机查看、写入SD卡等方式),不要不断的随意给参数值,random是没有多大意义的。
    30、作息:如果在凌晨一点前睡觉,建议8点之前就起床。千万不要因为熬夜而损失了一大上午的时光,一日之计在于晨。如果浪费了一上午就失去了熬夜的意义。
    31、焊台、胶枪等用完记得关掉,最后离开实验室时关窗、拉闸、锁门。
    32、不要忽视路肩的作用,压到路肩就要引起注意,因为比赛时可能会受路肩位置、高度的影响,可能压了一下就再也回不来了。
    33、注重团队合作,多多沟通,不要每个人做每个人自己的,最后好多种方案却都没有优化到极致

    展开全文
  • 蓝多多备忘录: (1)关闭程序打开电脑的注册表编辑器(按住win+R快捷键运行,然后输入regedit.exe) (2)找到一级目录HKEY_CURRENT_USER下的software目录,在该级目录里找到install option目录, (3)删除注册列表中的...

    蓝多多备忘录:
    (1)关闭程序打开电脑的注册表编辑器(按住win+R快捷键运行,然后输入regedit.exe)
    (2)找到一级目录HKEY_CURRENT_USER下的software目录,在该级目录里找到install option目录,
    (3)删除注册列表中的第二项名为option6.9的文件重启。
    我之前的做法:
    当然也可以选择安装在虚拟机里,拍摄快照,使用期过后恢复之前的快照
    注意word中mathtype的使用可能与ctrl+V键冲突。

    展开全文
  • 进入安装目录(我这里是D:\WinRAR)。新建文本文件:rarreg.key。 将以下内容复制到文本文件中(从下面三个中任选其一即可),保存。 RAR registration data Federal Agency for Education 1000000 PC usage ...

    WinRAR下载官网:http://www.winrar.com.cn/
    进入安装目录(我这里是D:\WinRAR)。新建文本文件:rarreg.key。 将以下内容复制到文本文件中(从下面三个中任选其一即可),保存。

    RAR registration data 
    Federal Agency for Education 
    1000000 PC usage license 
    UID=b621cca9a84bc5deffbf 
    6412612250ffbf533df6db2dfe8ccc3aae5362c06d54762105357d 
    5e3b1489e751c76bf6e0640001014be50a52303fed29664b074145 
    7e567d04159ad8defc3fb6edf32831fd1966f72c21c0c53c02fbbb 
    2f91cfca671d9c482b11b8ac3281cb21378e85606494da349941fa 
    e9ee328f12dc73e90b6356b921fbfb8522d6562a6a4b97e8ef6c9f 
    fb866be1e3826b5aa126a4d2bfe9336ad63003fc0e71c307fc2c60 
    64416495d4c55a0cc82d402110498da970812063934815d81470829275 
    
    RAR registration data 
    Database Administrators 
    5 PC usage license 
    UID=54d582e921e445f1bfe8 
    6412212250bfe8e73e20bdb947f60ef0da9624150bcf8668412c68 
    84affda559742bbb686d6071302587655a7ba28d516e17834b7616 
    47cd79a293eb4c0e4fbf5e9f967e6ed5b28a02418d0ab2549fc4da 
    19e4644f2345190bf26ff7bcd0c819f12560b57cf28adc164a00c6 
    3174fcbb69509912e7c7c4793779b941901c6c793b7319cc395ee0 
    8bddb923fa08fc20019b59d0b246e0ac325d2e5854d4f97a602fc0 
    a4357b8f857cfb717545410ecad088fb28a2a3cf0dff2102863273
    
    RAR registration data
    UID=e33833d78c2c0898e955
    6412212250e95588c466400e9630b23bef5d788a75720ae75924e4
    7cf9c79f173eacde7fe9606ea41721891cb65478a0f78663dc50db
    76a74e71b9192ecf6c76b6b542d29af84d4645b89781c403b01bc3
    4da596be22317aa6e9ba6f1d37db9b3f9a6017d30cfd23a3ed301e
    dd0369c01e5988d5ae099793e2808c5f28ee79914987e664cae6a5
    14fd0d66bfeba99dc231c0c843377d18b4fef8af23788a43603c50
    9bee024024e41971d98056b516723c598dd3a5d267d32622402316
    

    检查结果:Help->About WinRAR
    这里再提供一个参考链接:https://blog.csdn.net/u010001058/article/details/82350510

    展开全文
  • 三、实验代码: #include //蓝多多软件工程实验(二) using namespace std; float a, b, c; int main() { cout ; cin >> a >> b >> c; if (cin.fail()) { cout , you entered an illegal number!\n"; cout ;...
  • Input n Input Keyword I=0 Match=0 Do While I“No Match” 10: Else Print Match End #include "stdio.h"//蓝多多软件工程实验一 #include "string.h" #include using namespace std; int main() { int N; char...
  • 如下所示: 选中pom.xml,右键点击add as maven project, 稍等片刻后... 以上这篇解决IDEA创建maven项目时pom.xml没有变的问题就是编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
  • 注意你的s、sc、c表中包含的数据是否正确哦,代码蓝多多一个一个调试的都是没问题的哦!阅读之前请先点个赞。 –1.查询s表中的所有记录 select * from s select sno,sname,sex,age,sdept from s –2.查询全体学生的...
  • 数据库原理实验六:SQL Sever 2005的安全与保护 ...本节实验内容参考课本P430实验指导 (1)-(5)参见课本8-13、8-14、8-15、8-16、8-17的操作步骤 (注意修改后要断开连接(右击->“停止”)再重新链接) ...
  • 本资料为工程大认识实习报告,本人认识实习A,认识实习主要是对专业领域的了解和听一些公司讲座的心得体会。本文档仅供参考,请勿抄袭,大佬勿喷。如有问题请私聊博主。
  • 微信物联网生态主要分在微信硬件开发平台与腾讯物联开发平台,前者已经停止维护,但依然有着很大的学习价值,而后者作为主推的平台,集成很多功能,包括从微信程序实现配网到控制;       为了...
  • 数据库原理实验四:视图与索引

    千次阅读 2020-12-06 16:07:06
    注意你的s、sc、c表中包含的数据是否正确哦,代码蓝多多一个一个调试的都是没问题的哦!阅读之前请先点个赞。 –1. 使用Transact-SQL语句创建“计算机系”学生的视图Stu_CS1。 create view Stu_CS1 (sno,sname,sex,...
  • 数据库原理期末复习资料(sues版),下载地址:https://download.csdn.net/download/qq_43554335/14033335 数据库原理实验二:表的创建与管理
  • 操作系统实验三:进程管理

    千次阅读 2021-01-21 18:23:54
    操作系统期末复习总结(SUES版): ...实验三 进程管理 一、实验要求 (1)掌握操作系统中进程的基本概念; (2)掌握 Linux操作系统进程管理基本方法; (3)了解进程并发运行的过程。...① 启动vi编辑器,并将其调入后台
  • 四、实验代码 请从2000H(内存RAM区的起始地址)地址开始编程。 A 2000 1 编程实现: (1)将55H存入2060H,将99H存入2061H; MVRD R0,2060 MVRD R1,0055 STRR [R0],R1 ...(2)(2060H)+(2061H),将结果存入2062...
  • ML学习分享系列(2)_计算广告窥[中]

    万次阅读 2016-02-19 12:11:37
    我们是一群对机器学习感兴趣的伙伴,对于神奇的机器学习经常有“一探究竟”的冲动,却因为孤身一人学习的寂寞、亦或繁忙考试工作之余的小小拖延症,而没有持续这份对知识的渴求和热情。 由于深感类似情况的...
  • 操作系统实验二:用户接口

    千次阅读 2020-12-02 15:10:48
    操作系统期末复习总结(SUES版): ...实验二 用户接口 一、实验要求 (1)掌握Shell环境变量、管道、输入输出重定向的使用方法; (2)熟悉Shell程序设计。 二、实验内容 (1) 输入输出重定向: ...
  • 有需要的伙伴可直接长按扫码关注添加微信,回复 「git」 即可下载,我会逐个发送给大家: 后续如果遇到有用的工具或者资源,依然还会持续分享,也欢迎大家多多安利和交流,一起分享成长。 我是阿秀,一个简单的...
  • 本文档参考:孔丽红老师主编的《数据库原理》总结,包括超星学习通练习及期末复习资料,适合工程大数据库原理期末复习使用。
  • 点上方字计算机视觉联盟获取更多干货在右上方···设为星标★,与你不见不散仅作学术分享,不代表本公众号立场,侵权联系删除转载于:机器之心AI博士笔记系列推荐周志华《机器学习》手推笔记...
  • 点上方字人工智能算法与Python大数据获取更多干货在右上方···设为星标★,第一时间获取资源仅做学术分享,如有侵权,联系删除转载于 :机器之心在数据挖掘中,我们经常需要计算样本之...
  • 希望未来毕业能参加下hvv的红对抗,向各位安全大佬学习。 这一年,在四月份参加了XDef安全峰会,包括信创、高级威胁分析、网络安全创新创业、漏洞竞赛交流论坛,不仅听了很多安全技术干货分享,也听取了顶会论文的...
  • 实验六 Java多线程设计 1.实验目的: 掌握线程的概念,学会用两种方法进行多线程的设计。 2.实验内容: (1)用继承Thread类的方法进行多线程设计。两个线程为计算和显示质数。 (2)用Runnable接口的方法进行多...
  • 文章目录一、前言二、设备核心代码2.1 蓝牙控制2.2 WiFi控制2.3 外设驱动三、微信程序核心代码3.1 蓝牙搜索3.2 蓝牙服务发现四、感谢另外,不要把我的博客作为学习标准,我的只是笔记,难有疏忽之处,如果有,请指...
  •  我写过很多物联网控制的博文系列,包括微信公众号、微信程序控制硬件,私有云对接天猫精灵服务器,抑或是硬件端 esp8266/esp32 等系列博文,这是一个一个专题是写下我们如何在阿里云物联网上全栈开发我们的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 828
精华内容 331
关键字:

蓝多多的小仓库