精华内容
下载资源
问答
  • 其实一直想把我和她的微信聊天记录...、工具准备(苹果手机也可,文末) 1、root的安卓手机,装有微信。 2、安装RE浏览器或者ES浏览器。 3、加密数据库DB文件打开工具:sqlcipher.exe(下载链接:微云分享) ...

    其实一直想把我和她的微信聊天记录导出到文本,整理出来拿出来翻翻,然后再查阅了大量网络资料后,我成功的将我和她的聊天记录整理成excel的形式,如下所示:

     

     

     

    那么我们开始。

     

    一、工具准备(苹果手机也可,在文末)

    1、root的安卓手机,装有微信。

    2、安装RE浏览器或者ES浏览器。

    3、加密数据库DB文件打开工具:sqlcipher.exe(下载链接:微云分享

    4、Excel

    5、MATLAB(可选)

     

    二、找到加密的微信聊天记录文件

    依次选择根目录/data/data/com.tencent.mm/MicroMsg,如下图

     

     

    如上图,一般加密的数据库文件在两个长名字文件夹之一,自己寻找。

    打开文件夹后,会找到EnMicroMsg.db这个文件,将这个文件用re管理器拷贝到手机主目录,然后拷贝到手机上即可。

     

    三、打开数据库EnMicroMsg.db

    下载加密数据库DB文件打开工具:sqlcipher.exe(下载链接:微云分享)。

     

    直接运行,选择打开,如下图,需要密码:

     

     

     

    那么请看下一步,找到密码。

     

    四、寻找数据库文件密码

     

    目前各种资料得出的密码获取方式是 <手机IMEI号+微信UIN号> 的MD5码前七位。

    IMEI号位15位,比如000000000000000,微信UIN号为9位,比如123456789.

     

    MD5码在线生成:MD5在线加密/解密/破解 - 站长工具

     

    如下图,输入手机IMEI号+微信UIN号,选择加密方式32位小,取MD5码前七位即为密码。

     

     

    所以,我们只需要知道手机IMEI号和微信UIN号即可获得密码,请看下步,怎么获得IMEI号和微信UIN号。

     

    五、获取手机IMEI号和微信UIN号

    1、手机IMEI号

    这个很简单,拨号界面输入*#06#即可,双卡双待手机两个串号,这个自行尝试。

    2、微信UIN号获取

    还是在re管理器依次寻找

    根目录/data/data/com.tencent.mm/shared_prefs/system_config_prefs.xml

    system_config_prefs.xml这个文件拷贝到手机主目录,才能打开,如下所示:

     

     

    即可得到UIN号。

     

    六、导出聊天记录到CSV

    经过第四步和第五步,我们已经打开加密的db文件,如下所示:

     

     

    我们直奔主题,如下图,找到message导出csv即可,修改文件后缀csv

     

     

     

    七、处理聊天记录csv文件

    导出的csv文件包含了所有的聊天记录,我们通过探索,发现如下图:

     

    一般寻找图上这几项,分别是isSend(0则为对方发的消息,1是我发的消息),createTime(10位UNIX时间戳,可以算法转换为标准时间),talker(这个是关键,你与某个联系人的对话就为一个taker id,锁定了它就锁定了你与她的所有对话),content(聊天文字内容)。

     

    那么,我们思路清晰了,我们只需要找到talker即可,通过Excel的筛选即可完成,excel操作很简单,但如此大的excel文件,打开编辑可是非常慢的,所以我用MATLAB实现处理,并将整理好的聊天记录导出到excel文件中。

     

    程序如下:

    clc;
    clear all;
    
    [FileName,PathName] = uigetfile('*.csv','选择导出的数据库csv文件');
    file = fullfile(PathName,FileName);
     [num,txt,raw]=xlsread(file);
    
    % clearvars -except  num txt raw
    talkerid=input('请输入Talker的ID:','s');
    
    talker=txt(:,8);%列出所有的talker ID
    
    [ta , y] = find(strcmp(talker,talkerid));%寻找刚才输入的talker ID
    
     mcontent=cell(length(ta),1);
    for i=1:length(ta)
    
     who(i)=num(ta(i)-1, 5)  ;%定义一个isSend cell数组,来鉴别是谁发的消息
    
     mtime(i)=num(ta(i), 7)  ;%定义一个createTime cell数组,来存储10位UNIX时间戳
    
     mcontent{i}=txt(ta(i), 9)  ;%定义一个content cell数组,来存储聊天内容
    end
    
     who=who';
     %%%%%%%%%%%%%%%下面这段程序是将isSend cell数组中的0替换为对方,1替换为我%%%%%%%%%%%%
    myname=find(who==1);
    hername=find(who==0);
    % all=find(who==2);
    
    
    
    
    ourname=cell(length(who),1);
    
    
    for i=1:length(myname)
    ourname{myname(i),1}='我';
    end
    
    
    for i=1:length(hername)
    ourname{hername(i),1}='真好';
    end
    
    % for i=1:length(all)
    % ourname{all(i),1}='未知';
    % end
    
    
    %%%%%%%%%%%%%%%%%%%%%%%%%下面这段程序是将createTime cell数组中时间戳取前10位转换位北京时间%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
    % ourname=ourname';
      mtime=mtime';
      mtime=num2str(mtime);%转换成字符串,取前10位时间戳
      mtime=mtime(:,1:10);
     mtime=str2num(mtime);
    mtime=dateconvert(mtime);
    mtime=mtime';
    
    
    %%%%%%%%%%%%%%%%%%%%%%%%%下面这段程序是将content cell数组中汉字去掉引号,否则写入excel报错%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
    for i=1:length(mcontent)
        mcontent1(i)=mcontent{i};
    end
    mcontent1=mcontent1';
    
    
    
    
    %%%%%%%%%%%%%%%%%%%%%%%%%下面这段程序是将时间、发言人、聊天内容汇总,写入excel中%%%%%
    ultimate=[mtime,ourname,mcontent1];
    xlswrite('lovemore1.xlsx',ultimate);
    
    
    
    %UNIX时间戳转换成标准时间,北京时间需要加8小时,也就是8*3600秒
    function [ date ] = dateconvert(x)  
    
    for i=1:length(x)
    date{i}=datestr(datetime(x(i)+8*3600, 'ConvertFrom', 'posixtime' ));
    
    end  
    
    end
    

     

     

    然后,就可以搞定啦,如果嫌最终的excel打开还是慢,你可以用excel导出到txt也行啊。

     

     

    ---------------------------------下面是苹果的-----------------------------------------------------------------------

     

    一、工具准备

    1、iTunes

    2、pp助手

    3、加密数据库DB文件打开工具:sqlcipher.exe(下载链接:微云分享

    4、Excel

    5、MATLAB(可选)

     

    二、获取数据库db文件

    苹果的db文件没有加密,所以只要找到db文件即可用sqlcipher打开。

    我们开始!

    1、iTunes备份手机

    如下图,手机链接电脑,备份即可。

     

     

    2、PP助手导出备份

    电脑安装pp助手,手机链接PP助手,点击备份还原,找到iTunes备份文件夹,如下图:输入AppDomain-com.tencent.xin:/,即可看到,将Documents文件夹拷贝到电脑即可。

     

     

    然后,我们打开Documents文件夹,找到如下图所示的fts_message.db就是要的聊天记录数据库。

     

     

     

    然后,我们直接用sqlcipher打开,如下所示:

    苹果的和安卓不一样,苹果将你与某个人的对话放到各自的table里,所以直接导出csv即可。

     

     

    但是只有创建时间和聊天内容,谁发送的消息没找到。。。

    程序也简单多了,如下:

    clc;
    clear all;
    
    [FileName,PathName] = uigetfile('*.csv','选择导出的数据库csv文件');
    file = fullfile(PathName,FileName);
     [num,txt,raw]=xlsread(file);
    
    
    % clearvars -except  num txt raw
     
     mtime=dateconvert(num(:,4))';
     mcontent1=txt(2:end,5);
     
     
    ultimate=[mtime,mcontent1];
     xlswrite('ILoveYouForever.xlsx',ultimate);
    
    
    
    %UNIX时间戳转换成标准时间,北京时间需要加8小时,也就是8*3600秒
    function [ date ] = dateconvert(x)  
    
    for i=1:length(x)
    date{i}=datestr(datetime(x(i)+8*3600, 'ConvertFrom', 'posixtime' ));
    
    end  
    
    end
    

     

    导出的excel如下:

     

     

     

    ------------------------------------------------------------------------

    from 微信公众号:万能搜吧 (每天来点精简的分享)

    ------------------------------------------------------------------------

    展开全文
  • 场景一、图书馆、书店、机场、火车上、公交地铁上、旅行的路上、听音乐……发现一段不错的文字或歌词想要做书摘笔记,或者编辑成短文发到微博、微头条、朋友圈装B,但是手机上打字很慢或没太多时间打字,等闲...

    首先,展示两个文字编辑的场景,这样的场景每天都在我们身边发生。

    场景一、在图书馆、书店、机场、火车上、公交地铁上、旅行的路上、听音乐……发现一段不错的文字或歌词想要做书摘笔记,或者编辑成短文发到微博、微头条、朋友圈里装B,但是在手机上打字很慢或没太多时间打字,等闲下来再去整理时却丢失了灵感。

    场景二、企业新媒体运营一项很重要的工作就是文字编辑,有时候需要处理一些电子文本(PDF)、纸质文件(书籍)、报表、图片资料(会议上拍的大屏照片)等。如果要对这些资料上的文字进行编辑,最原始的方法就是把资料的文字用键盘敲出来,然后再编辑整理。

    那么问题来了,如果这些这些资料非常多,全部用键盘敲出这些文字,要花费一个人一个工作日甚至更多时间来完成。而老板在一旁不停的催促,要三个小时后使用这些资料。怎么办?

    今天塘主给大家推荐几个 OCR 文字识别转换工具,这几款工具塘主已经亲自测试使用过,文字识别率达 99%。工具虽小,但却能大幅度提升文字编辑的效率。

    什么是OCR?

    OCR(Optical Character Recognition,光学字符识别),是属于图型识别(Pattern Recognition,PR)的一门学问。其目的就是要让计算机知道它到底看到了什么,尤其是文字资料。

    由于 OCR 是一门与识别率拔河的技术,因此如何除错或利用辅助信息提高识别正确率,是判断一个 OCR 文字识别工具好与不好的重要依据。

    OCR文字识别工具

    一、OCRMaker Online(免费在线文字识别)

    OCRMaker Online简介:

    OCRMker Online 通过使用光学字符识别(Optical Character Recognition - OCR)技术将文本文档的扫描或(智能手机)图像转换为可编辑文件。它使用最先进的现代 OCR 软件。识别质量与商业 OCR SDK 软件(例如Abbyy)相当。 使用非常简单只需上传图像文件。 OCR软 件采用 JPG,PNG 或 PDF(测试中),唯一的限制是图像/ PDF 不能大于 5MB。 OCRMker Online 承诺上传的数据是绝对安全的,网站不存储任何数据。 支持识别的语言:中文、英语、法语、德语、阿拉伯语、希腊语、日语、韩语、葡萄牙语、俄语、西班牙语(如有其它需求可以联系网站客服)。

    使用方法:只需简单四步,轻松识别文字。

    上传图片 ➢ 开始识别 ➢ 获得结果 ➢ 识别校正

    个别字体识别不了怎么办,别急 OCR Online 开发了校对功能,保证文本信息万无一失。

    为获得最佳 OCR 结果,请务必为文档选择正确的 OCR 语言。

    最好不要直接识别手写文档,因为任何 OCR 只能处理打印的文档。为了获得最佳结果,只包含数字的图像(Number OCR)使用韩语作为 OCR 语言。

    除了在电脑上操作,目前 OCRMaker Online 也支持移动端文字识别,使用方法同上。

    二、图片文字识别(小程序)

    微信里的小程序应用类小程序也非常多,而且很多小程序日常生活中使用频率很高,其中一款小程序就是文字识别。

    在搜索小程序的框里输入图片文字识,会跳出一个小程序。

    使用方法:

    点击进入图片文字识别小程序。

    点相册选择已经拍下的文本图片,或者点击拍照拍下文本图片。稍等片刻后,文本信息即可识别出来。

    底部有四个功能键。

    翻译:中译英、英译中

    选词:选者一段或多段文字

    另外两个是复制和分享。这两个功能一看便会,不再详细解说。

    随后微信会收到一份服务通知(不喜欢也可以取消通知功能),通知内显示识别结果。

    进入小程序查看,可对文字编辑整理。

    如果文本图片比较多,可以选择批量识别,一次最多可添加 9 张图片。

    点击图片文字识别主页面的“设置”,显示模板通知、发送识别结果到电脑、识别记录说明,如下图所示。

    三、白描(APP, OCR文字识别与翻译工具)

    只能在 iOS 设备上通过 App Store 获取此 App,最新版本 1.7.7 。

    白描的使用场景有:

    拍照翻译文字、公司文件转录、纸质书阅读笔记摘录、截图文字内容提取、身份证识别、购物小票识别等多种场景适用。

    白描功能特色:

    1、云端识别:

    云端OCR识别引擎,识别准确度随着自动学习越来越高,识别速度快;另外可以放心的是,图片上传经过加密处理,无需担心隐私。

    2、批量识别:

    同类app里的领跑者,能一次识别9张图片,批量识别后也可以对多张原图同时进行校对。

    3、自动识别出结果中的电话、链接、地址,点击即可直接使用。

    4、支持系统相册插件识别,无需打开APP即可快速完成识别。

    5、识别结果自动存为历史记录,检索方便。

    6、支持表格识别:

    7、识别结果翻译:

    支持简体中文、日语、英语、韩语、法语、西班牙语、阿拉伯语、俄语、德语、葡萄牙语、意大利语、繁体中文、粤语、文言文的互译;

    8、多语言识别:

    支持中文、英语、日语、韩语、法语、德语、俄语、西班牙语的OCR识别。

    9、灵活选择:

    手指流畅顺滑,即可分块选择需要的文字,想要哪段点哪段(想查看所有文本,不需要按行点选);识别结果可编辑且选择复制到各种app中使用,支持微信、QQ、有道云、印象笔记等软件。

    10、快速校对:

    在识别结果页面点击“校对”按钮进行校对,可以在不离开编辑区域的情况下方便对照着原文修改,弥补 OCR 技术的不完美之处(大概是手写字不够工整时需要担待一点)。

    11、识别结果自动分段,弥补了大多数识别软件无法还原原文段落的问题。

    以上就是塘主为大家整理的文字识别工具,包含了电脑移动端,可以满足你几乎所有的文字识别需求。

    四、QQ

     此功能qq自带的,长按需要转换的图片,有时会弹出菜单显示“识别图中文字”字样的选项。但注意若图中含有大量非文字元素,可能无法识别。

    大部分转载自搜狐文章http://www.sohu.com/a/201176288_672182

    展开全文
  • 文章目录0、写前面1、编程能力 0、写前面 讲道理,谈到【找工作】这个问题,我就很焦虑。...这个文章应该会是个【记录】的文章,看看自己这一路走来 学了什么,准备学什么,需要学什么,希望和各位共...

    声明:

    1)该文章整理自网上的大牛和机器学习专家无私奉献的资料,具体引用的资料请看参考文献。
    2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除。
    3)博主才疏学浅,文中如有不当之处,请各位指出,共同进步,谢谢。
    4)此属于第一版本,若有错误,还需继续修正与增删。还望大家多多指点。大家都共享一点点,一起为祖国科研的推进添砖加瓦。

    〇、写在前面

    在这里插入图片描述
    讲道理,其实这个博客我是怀着一个很严肃的心情准备写的,但是吧,一谈到【找工作】这个问题,我就很焦虑。。。。。。看到这个省略号了嘛?这就是我的心情 😐,尤其是在就业一年比一年难的情况下。为什么这么说?

    事实上19届秋招算法岗就有些【供过于求】了,头条甚至发了 算法劝退贴。而这很大程度上就是由于前几年算法就业形势太好了,导致一大批人转算法,这导致的大泡沫其实还没有消化掉,所以其实不是现在算法突然不好找工作了,而是之前太容易了。其实你说公司真的不缺算法工程师嘛?当然不是,公司也是有算法工程师的缺口的,那为什么出现这种情况?除了要劝退一部分盲目入行的同学;听到、遇到的好几个HR都说,收到几百份简历,但是没什么匹配的。所以说做算法的人多是真的,可是需要做算法的人也是真的,而主要的矛盾点在于 供需不匹配

    所以在经历过好多次心态崩裂,也问过很多前辈和大佬之后,参考了很多大佬的文章之后,我决定来总结一下如果想成为一个【深度学习算法工程师】需要什么学习能力和知识储备。这个文章应该会是一个【记录】性质的文章,期望看看自己这一路走来 学了什么准备学什么需要学什么,希望和各位共勉。

    一、编程能力

    这真是个老生常谈的问题,为什么这么说呢,自然是因为这个【编程能力】我听过不下几百遍,听的脑瓜子都疼,可是没法子,这就是 必备技能,必备到什么程度?

    这么说吧,假如你想写作文,如果你不会写字,组词,造句,我想你应该完全没法完成这个创作过程。很形象吧,但是也确实如此,仔细想一想,招你进去是要干活的,公司不会招聘一个只会 MATLAB 或者 python 都用不熟的人来做项目开发吧,做纯算法研究都不行。

    • MATLAB 大家都懂的,做实验室研究确实很棒,高效方便的矩阵和数组运算,画图方面也相当不错,但是工业应用还没听过谁说是用 MATLAB 实现的呢。
    • python 你可能想问为什么,可以这么说,如果连 python 这样比较简单的语言还用不熟,那真是无话可说。

    那么 具体地说,编程能力需要哪些基本要求呢?

    (1)熟练使用 linux

    在这里插入图片描述
    新手肯定都是用 Windows 起手的了,像我之前就是这样,但是在学习过程中发现在 Windows 上搞不定了,一般也会先忍几次,然后掉头就去学 linux 了,一定是这样的过程。哪些在 Windows 上真的搞不定呢?比如:最新论文中提出的视觉开源算法等等。

    但是在条件上可能很多人都觉得不是太合适,比如实验室条件,电脑条件等等,不过对我们而言,linux 并不需要了解太深。装个 ubuntu 系统,常用的文件操作、程序编译等知道就OK了。剩下的完全是在使用的过程中现用现学,手边常备一本书 《鸟哥的linux私房菜》,神书,你可以百度或者Google一下自然就知道这个书的强大了。在或者现在的网络比较强大了,资源也是很多,实验楼 也是一个不错的选择,帮你搭配好的环境,直接使用就OK了。如果还是想自己搞一下,虚拟机也是一个不错的选择,不会影响你电脑本来的环境配置,但是还满足了要求。

    个人计划

    • 《鸟哥的linux私房菜》
    • 实验楼

    (2)熟练使用 python

    在这里插入图片描述
    网络如此发达的今天,如果你说你找不到资源我是不相信的,但是如果你说你眼花缭乱了,我是毫不质疑的。因为我当时就就是这样的,基础部分看廖雪峰的 python教程 就可以了,我个人有看一些,但是真正入门的是一本书——《Python编程:从入门到实践》,极其的基础,但是对小白来说非常友好。

    有的同学会问是学 python2 还是 python3?这么说吧,python 核心团队计划2020年停止支持 python2,也就是说 python2 马上就要说再见了,肯定还是学 python3,遇到之前的 python2 的代码再查找区别即可。python 学起来其实很简单,看别人代码的过程就是学习的过程。对于不熟悉的用法多搜下官方文档,如 pythonnumpypandasmatplotscikit-learn等等。

    python 的开发环境值得说一下,因为有太多选择,这里比较建议使用 pycharm 和 jupyter notebook 吧,具体可以参考这个博客——Windows10 下 Anaconda和 PyCharm 的详细的安装教程(图文并茂)

    个人计划

    • 《Python编程:从入门到实践》
    • 《疯狂Python讲义》

    (3)流畅使用 C++

    在这里插入图片描述
    至于 C++,比较普遍的都是 《C++ primer》《C++ primer plus》 这样的大块头书,如果是入门的话应该还可以,倒是不如 《王道程序员求职宝典》 这类书实用。大块头书优点在于全面,同时也往往导致了重点不突出。如果想看视频课程的话,推荐中国慕课上北大的《程序设计与算法》,第1门课程是 C 语言程序设计,第2门课程是算法基础,第3门课程是 C++ 程序设计。看视频课程一般比较慢,如果没什么基础或者特别想把基础学好的话,强烈推荐。

    个人计划

    • 《C++ primer》
    • 《C++ primer plus》
    • 程序设计与算法课程(一)
    • 程序设计与算法课程(三)

    (4)良好的算法基础

    在这里插入图片描述
    其实没做过检测或者分割或者其他的,是很正常的,快速跟进就是了,这是公司开发的常态。但是如果一些网络结构基础,图像的基础概念,卷积神经网络的基础——大话卷积神经网络CNN(干货满满),等等,这样很可能会犯很多低级错误,可能会出现很多问题。

    这就要求开发能力必须过关,因为算法效率在实际生产中还是有要求的。工业界用的算法是滞后于学术界好几年的,不要对公司所做的算法有太多的幻想,现实数据比你想的质量差太多,现实用的算法也没有那么高端,大部分时间都不是用在建模。

    个人计划

    • LeetCode
    • 牛客网
    • 《剑指offer》

    python:

    • 《算法图解》
    • 《用Python解决数据结构与算法问题》
    • 《数据结构与算法 Python语言描述》

    C++:

    • 《啊哈!算法》
    • 程序设计与算法课程(二)
    • 《算法导论中文第三版》(这是本神书。。。)

    (5)良好的编程习惯

    在这里插入图片描述
    这里说的习惯有:多使用类,多利用函数封装,写好项目的目录结构,良好的变量或者函数命名,善用程序的注释功能,Python 编程语言需要遵循 PEP8 规范(杂谈——Python代码写得丑怎么办?autopep8来帮你)等等。这可以帮助你更好的和同事或者同行沟通,而且看着也舒服,就算好久不看程序了,依然可以做到很好的回溯记忆。

    二、深度学习理论

    在这里插入图片描述
    基于深度学习的计算机视觉是计算机视觉的两大方向之一,另一个是 SLAM,机器学习包括深度学习里的大部分算法本质上都是用来做 分类 的。具体到计算机视觉领域一般就是 物体分类(Object Classification)目标检测(Object Detection)语义分割(Image Semantic Segmentation) 等,当然也有一些很酷又好玩的东西比如 edges2catsdeepart 等等。

    我主要做一些【图像重建】或者【超分辨率】相关的东西。其实一般是看一看论文,复现复现网络结构,或者直接跑一跑别人的代码,做一做网络结构修改,调一调超参数。前期的图像数据集制作,还有预处理才是主要的工作。深度学习为什么这么强?它比传统的图像处理方法好吗?它主要解决了什么样的问题呢?

    个人比较认同是以下三点:学习特征的能力很强,通用性强,开发优化维护成本低。存在的问题可能就是数据量,对 label 的精准性要求比较大。之前看过的一个文章写得不错,参见 为什么深度学习几乎成了计算机视觉研究的标配?

    关于这一部分理论的学习,漫天飞的各种资源。这里推荐一些:

    个人计划

    • 《一天搞懂深度学习》
    • CS231N课程
    • Deep Learning AI课程
    • 《DeepLearning深度学习花书》
    • 《Tensorflow+实战Google深度学习框架》
    • 《图解神经网络与深度学习》
    • 《PyTorch深度学习实战》
    • 《Python 深度学习(Keras)》
    • 《深度学习之Pytorch》
    • 《深度学习框架PyTorch》
    • 《PaddlePaddle与深度学习应用实战》
    • 《动⼿学深度学习》
    • 《深度学习之PyTorch实战计算机视觉》
    • 经典深度学习论文

    三、g++, CMake和Makefile

    在这里插入图片描述
    python 是脚本语言,而当前大量的 AI 算法都部署在移动端嵌入式平台,需要使用 c / c++ / java 语言,g++,CMake 和 Makefile 正是 Linux 下编译 C系代码 的工具,也是必备的基础。实际上一些python,matlab开源项目也需要预编译,更多的等到了工作岗位自然懂。

    个人计划

    • g++
    • CMake
    • Makefile

    四、shell,vim 和 git

    在这里插入图片描述
    Linux 下一个熟练的工程师,会比 Windows 下工作效率高很多,提高写代码效率可以从终端多任务管理,熟练使用 shell 命令,熟练使用 vim 等开发环境,熟练使用 git 命令等地方入手。

    • shell 命令是 Linux 的操作基础,也是学习使用 Linux 的开始,而慢慢熟悉高级的 shell 命令在将来的工作中会带来很大的效率提升。
    • vim 是 Linux 下最常用的编辑器,从小白到高手都可以使用,而它的列编辑,查找替换,自动补全等功能都是效率的保证,或许从visual studio等环境切换过来的同学刚开始会有些许不适应,但是时间久了就会越来越明白 vim 的好。
    • git 是程序员必备的素养,慢慢学会维护几个自己的代码库,等到将来出问题的时候就明白了。

    个人计划

    • shell
    • vim
    • git

    五、python 爬虫

    在这里插入图片描述
    深度学习项目开发中最重要的就是 数据!!!或许是一句戏言,但是有一句话是这么说的,深度学习在目前阶段可以认为是一个数据的游戏,你的数据更好,标记的更完美,你的运行结果就更棒。尤其是实际的项目经常没有足够多的数据,这个时候就需要自己去想办法获取了。除了公开的数据集之外,其他的数据怎么获得呢?互联网是一个什么资源都有的大宝库,学会使用好爬虫,你将可能成为时代里最有资源的人,我想叫你金矿工,而且这也很可能是项目成功的开始。

    个人计划

    • 网络爬虫
    • 《Python项目案例开发从入门到实战——爬虫、游戏和机器学习》

    六、数据可视化

    在这里插入图片描述
    处理数据的一个常用的手段就是数据可视化!在深度学习项目中,常需要的数据可视化操作包括原始图片数据的可视化,损失和精度的可视化等。除了对数据可视化,还需要对模型进行可视化,方便调试和感知。

    这个方面我的建议是多打一些比赛,多看一看别人的代码和博客,这样就会很容易学会的。

    个人计划

    • Kaggle
    • 天池

    七、数学基础

    在这里插入图片描述

    • 微积分:其实个人感觉涉及的微积分知识相对简单,积分很少,微分也不是特别复杂,花一天时间学一学就行。

    • 概率论与统计:这个比较高深,是应用在机器学习领域里最重要的数序分支。应用比如:条件概率、相关系数、最大似然、大数定律、马尔可夫链等等,还是得好好搞一下概率。

    • 线性代数:数字图像本身就是以矩阵的形式呈现的,多个向量组成的样本也是矩阵这种形式非常常见,大多机器学习算法里每个样本都是以向量的形式存在的,多个矩阵叠加则是以张量(tensor)的形式存在 Google 深度学习库 TensorFlow 的字面意思之一。

    • 凸优化:这个需要单独拎出来说一下。因为太多问题(尤其机器学习领域)都是优化问题(求最优),凸优化是里面最简单的形式,所以大家都在想办法怎么把一般的优化问题转化为凸优化问题。至于单纯的凸优化理论,好像已经比较成熟了。在机器学习里,经常会看到什么求对偶问题、KKT条件等,潜下心花两天学一学。

    数学知识真的没必要系统学习,效率低又耗时,毕竟大家都有本科或者研究生的基础了,这就足够了。用的最多的就是矩阵论!!!或者用到的时候学,学完之后总结一下。再就是活学活用网上的搜索资源,比如 CSDN、知乎等等。

    个人计划

    八、公众号

    时代变了,一百年前的人类绝对想像不出自己有了困惑不是去翻书或请教他人而是告诉身旁的一台机器。如今,小学生做道算术题或小女生来个大姨妈都要问问电脑:这是怎么回事。但这些与学视觉又有什么关系呢?——答:没有。好像跑偏的有点多了,再扯远一点吧。跨越时间维度来思考一些新事物的发生及其与旧事物的联系,也许会给你一种想象的自由。比如电报、电话、视频聊天和全息通话用 HoloLens 通话,再比如马车、汽车、火车、飞机和火箭太空旅行,蒸汽机、电、互联网和AI。所以活用资源,多看肯定没错,不过要有所选择的看,不能啥都看,,,人的精力还是优先的。

    先说明公众号不是打广告,推荐几个自己看的而已(排名没有先后顺序)。

    • 机器学习实验室
    • 磐创AI
    • kaggle竞赛宝典
    • 有三AI
    • 我爱计算机视觉
    • Datawhale
    • 计算机视觉life
    • CVer
    • 小小挖掘机

    九、彩蛋

    看一下目录,你会发现它向一把小刀一样,是不是?希望你我能剑锋所指,所向披靡!!!

    推荐一个自己写的博客——大话卷积神经网络CNN(干货满满),种树从现在开始。

    在这里插入图片描述

    如果有幸帮到你,请帮我点个【赞】,给个【关注】!如果能顺带【评论】给个鼓励,我将不胜感激。

    如果想要更多的资源,欢迎关注 @我是管小亮,文字强迫症MAX~

    回复【福利】即可获取我为你准备的大礼,包括C++,编程四大件,NLP,深度学习等等的资料。

    想看更多文(段)章(子),欢迎关注微信公众号「程序员管小亮」~

    在这里插入图片描述
    学习AI可以看一下这个课程!
    在这里插入图片描述

    参考文章

    展开全文
  • 本软件无需安装 双击打开就能用,适用于Windows 7以上平台; 具有截图文字识别,拖拽文字识别,打开文字识别,翻译文字等功能 可用于图片和PDF中文字的识别提取...上一段日语文字识别吧,具体效果自己下软件去验...

    软件无需安装,双击打开就能用,适用于Windows 7以上平台;

    具有截图文字识别,拖拽文字识别,打开文字识别,翻译文字等功能

    可用于图片和PDF中文字的识别提取中,电脑一切看得见的文件都可以识别,支持10国语言

    软件地址:https://pan.baidu.com/s/1zIzGB55PO9h5_xECs4U5YQ 提取码:fvjc 

    上一段日语文字识别吧,具体效果自己下软件去验证

    可以直接图片拖进去也可以识别

    翻译功能也是支持多种语言

    双击文本框可以复制文字还有记录导出繁体字,功能很多自己去摸索

    可以关注下公众号timor君,也可以在下方留言把您的需求留下我们做进一步的改进

    百度链接:https://pan.baidu.com/s/1zIzGB55PO9h5_xECs4U5YQ   提取码:fvjc 

    展开全文
  • 如何通过电脑黑掉个国家?

    千次阅读 2017-11-03 16:51:46
    注释:此检测部分已经授权,其它部分存在争议,但非黑产行为,要买数据的勿扰。 前言 ...继续往下想,中国的...再往下想,如果你能够控制中国的短信记录系统,理论上来说你中国的互联网就是神一般的存在,想
  • linux第阶段学习笔记基础

    千次阅读 多人点赞 2019-06-12 19:57:06
    这里,需要注意的是,读只能在一块磁盘上进行,并不会进行并行读取,性能取决于硬盘中较快的块。写的话通常比单块磁盘要慢,虽然是并行写,即对两块磁盘的写入是同时进行的,但因为要比较两块硬盘中的数据,所以...
  • 对于客户端同学开发来说,写一段代码想真机上看看,是非常容易的。  那么这么一个大前端的环境下,客户端开发想写点html和js代码,又想手机上看看效果,怎么办呢?  需要以下几个步骤: 大体流程:1. ...
  • 作为个软件开发者,你一定会对网络应用如何工作有个完整的... 首先嘛,你得浏览器输入要网址:2. 浏览器查找域名的IP地址导航的第步是通过访问的域名找出其IP地址。DNS查找过程如下:* 浏览器缓存 – 浏览器会
  • 朋友给我发了句话 很奇怪,前几个月的时候看到这些理都不理的我,这次想都没想就复制下来了 正以为要被嘲笑的时候,好玩的事情发了 真的可以! 当然热爱学习的我对于这神奇的事一定会搞清楚这咋整的 史诗级...
  • 记录坎坷的面试

    万次阅读 多人点赞 2019-08-06 15:37:05
    >= 10元,合理的分配方案 只要求思路,不用写出来 CSS定位:position取值,给一段代码:画出位置 阿里一面:电面 围绕项目: 你自己的项目中认为有挑战性的,难点是什么 针对自己的说的这些难点,说一下自己是怎么...
  • python+web编程学习总结记录

    千次阅读 2016-06-13 15:58:03
    近来个多星期一直学习py的web编程,从零开始,短暂时间接受的很多知识都需要消化吸收,所以这里把这个过程梳理遍,尽量用自己的语言去描述这些知识点。 首先是web编程的必备知识:HTTP协议。超文本...
  • 如何做好科研实验记录

    千次阅读 2019-03-20 21:07:27
    ... “实践是检验真理的唯一标准”,科研实验是实践中的环。 科学研究是以诚实守信为基础的事业,自诞生之始就把追求真理、...科研实验记录是科技档案的部分,是指科学研究过程中,关于实验计划、过程、结果、分...
  • 最近小编查看百度指数的时候发现“录屏软件”这个词的指数一直下降,这就说明了个原因,那就是现在用电脑录屏软件的人越来越少,原因是现在很多用户都开始使用手机录屏软件,随着移动市场的快速崛起,PC市场的...
  • 我想了很久,我再以文章的形式来表述也许无法表达出我的感觉和实际情况,于是我决定公开我和她的聊天记录部分。用户:131364(破破)==================================================消息组:学生==============...
  • 学习目的 本期将会学习个京东项目,综合知识非常多。
  • 分析微信聊天记录(1)——获取微信聊天记录 文章目录分析微信聊天记录(1\)——获取微信聊天记录获取 `EnMicroMsg.db `文件已root手机小米手机获取数据库密码导出数据库windowslinuxmac总结 获取微信聊天记录的主要...
  • 电脑犯罪的历史与现状

    千次阅读 2013-05-02 09:39:37
    我(Jeff Atwood)写过篇文章“I Was a Teenage Hacker”(我10几岁时曾是名黑客),描述了我1980年代后期使用计算机做过的一些非法之事。我那时犯罪了吗?我真的是名罪犯吗?我不这么认为。说白了,我那时...
  • blender教学记录

    千次阅读 2018-09-15 10:08:34
    通过多次实际课程,觉得比较可行的教学顺序和内容(主要是唐老师和教研组的一些讨论) 实际课程中可能会发生变化,这门课需要教师对blender有相当的...因为该课需要记录大量的快捷键,需要学生准备个本子,或是...
  • 近来拼多多爆出的羊毛党事件使得计算机信息安全再次被提到人们的面前,原本属于计算机安全学科...这消息瞬间薅羊毛行业内流传开来。凌晨5点左右,羊毛党内部已经彻底发酵的“抢券行动”,被发布到了一些公开论...
  • 近期,我正在打算学习研究下汇编和反汇编的技术,3月9号,我某个诡异的下载网上准备下载个ini文件查看器,我以为按照老套路只要点普通的线路下载就不会下载到广告插件,结果打开后依然是充满广告插件的安装界面...
  • 关于tableau里面展示部分时间的问题简述 需求:给的销售量是6月到10月的每天的数据,现在只想要9月到10月的数据, 把日期的维度拖到列,把单量拖到行,注意这个时间的日期维度。 选择适合自己时间方式 根据自己...
  • 生活工作中有时我们喜欢图片或者纸质文档上的一段文字,这些文字重新输入,又费时费力?? 今天小编给大家分享一款微信小程序【传图取字】,高精度自动识别图片、文档及PPT中的文字,一键提取并能复制和分享,从而...
  • 电脑史话

    千次阅读 2014-11-16 16:38:16
    从1980年8月到1981年8月,整整一年的时间,埃斯特奇领导着“国际象棋”工程计划13人小组奋力攻关。“当时很少有人体会到,这小组人即将改写全世界的历史。”(英特尔华裔副总裁虞有澄语)据说,IBM公司后来...
  • 电脑硬件故障维护小全

    千次阅读 2013-08-14 10:28:46
    【主板故障】是整个电脑的关键部件,在电脑起着至关重要的作用。如果主板产生故障将会影响到整个PC机系统的工作。下面,我们就起来看看主板使用过程中最常见的故障有哪些。 常见故障:开机无显示 电脑...
  • 最近公司要求做个项目,实现备份和导出虚拟代表和医生的微信聊天记录的功能,于是想了一下可从以下两个方面入手,并分析了一下他们的优劣势 解密微信数据库,直接用 Sql 语句查询导表上传 直接操作数据库,联系人和...
  • 首先感谢现在网上资源丰富,能够获得很多人的总结,结合自身实际进行了学习记录。并着重标注了其中关键核心 目录 1)Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent...
  • 遇到个需求,要用手机扫描纸质面单,获取面单上的手机号,最后决定用tesseract这个开源OCR库,移植到Android平台是tess-two Android平台tess-two地址:https://github.com/tesseract-ocr 我把手机号扫描的算法...
  • 微信聊天记录提取及分析(wordcloud+pyecharts)

    千次阅读 多人点赞 2020-11-21 22:14:49
    0. 前言 ​ 之所以想要提取微信的聊天记录并分析是因为也开始再学习python,但是...安卓\电脑微信聊天记录导出表格 微信聊天记录数据提取并分析 利用python做微信聊天记录词云分析 提取微信数据库的主体流程都差不多,
  • 电脑客户端上应实现对多个监视点的显示,电视墙上应实现将指定的个或多个监控点实时图像显示在一个或多个显示器上,并能选择 1 、 4 、 6 、 9 、 10 、 16 等多种画面分割,能提供多种分辨率,并可以实现全屏显示...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 31,041
精华内容 12,416
关键字:

在电脑里记录一段文字