精华内容
下载资源
问答
  • 2015-09-26 16:20:33
    编解码学习笔记(一):基本概念

    媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范 标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从 wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫“天下维客”。wiki的中文还是很不错的,但是阅读后建议再阅读英文。

      我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经

    更多相关内容
  • iOS 微信数据库分析

    千次阅读 2017-05-17 09:01:50
    1. 怎么得到这些文件? 过去,我可以提示用户越狱之后用 iTools 自行把微信 App 所在文件夹复制出来。然而自从某个版本的 iOS .../User/Media 这里的文件,而需要的本地数据 /User/Containers/Data/Application

    原文地址:http://www.jianshu.com/p/07a8d87e698b

    1. 怎么得到这些文件?

    过去,我可以提示用户在越狱之后用 iTools 自行把微信 App 所在文件夹复制出来。然而自从某个版本的 iOS 开始,在不越狱的情况下,我们只能看到 /User/Media 这里的文件,而需要的本地数据在 /User/Containers/Data/Application/微信的UID。强迫用户为了这么一件事前去越狱显然不太友好,而对“聊天记录迁移”抓包也不方便,所以我想到另一种途径。

    这就是 iTunes 备份。从经验判断,恢复备份之后微信里的聊天记录都还在,说明肯定这些文件在备份的时候保存到了电脑上。它们在哪里?苹果官方给了答案。简单地说,Windows 下在 `\用户\(用户名)\AppData\Roaming\Apple Computer\MobileSync\Backup`。

    不过,iTunes 备份的文件夹结构不是很友好,似乎每个手机上的文件名都变成了一串序号,当然打开相关的 plist 然后看出规律也不难。好消息是,已经有很多人做了类似的事情,例如 iphonebackupbrowser,它也是用 C# 写的,用起来比较方便。

    因此,我做的第一步是让用户选取做好的 iTunes 备份,从上面那个源码,稍微修改一下就可以找到 com.tencent.xin 的相关文件,从而在程序里直接通过 iOS 上的路径找到对应的文件。

    下面以 iTools 为例


    03a232a651...64467f3030 这个文件夹是 微信ID 的 MD5值。
    如果曾经登陆过其他账号,就会有N个对应账号的文件夹。

    如果想知道当前登陆的是哪个微信,就要关注LocalInfo.lst了,把这个文件导出来,然后修改其后缀名为.plist,然后打开可以看到下图


    Item2纪录的是当前登陆的微信ID,然后转换成MD5值就是上图的文件夹名称了
    Item3是对应的电话号码账号

    2. 文件夹对应的账号其他信息

    上面我们说到,文件夹名字是 微信ID 的MD5值,但是怎么才能获取该 微信号 的名字,头像等各种其他信息呢?



    找到文件夹里的mmsetting.archive,按照国际惯例,改成plist后打开



    账号信息一览无为,想要什么可自行提取

    3. 主要的数据库

    iOS版微信,基本上所有的 好友 和 聊天 数据都是存放在DB这个文件夹。
    好友:WCDB_Contact.sqlite
    聊天:MM.sqlite


    好友:WCDB_Contact.sqlite



    这个库,我们主要关心的是 Friend 这个表,然后打开一看,疯了,里面很多字段直接使用Blob的格式纪录,查看内容全部都是二进制显示,肉眼比较难直接获取有用的信息。





    经过鄙人几天的努力,大概弄懂了个别字段的意思,下面详细说明


    userName

    这个顾名思义就是 微信号ID 了
    如果以 @chatroom 结尾的,就是群


    type

    这个第一眼看是普通的数字,但是它真正的意义是把这个数字转换成二进制去看。

    数字二进制意义
    00微信运动
    11微信应用
    210app + 群
    311好友
    4100群里面的人
    6110群好友,对方加你,你未通过
    7111群里面的人,而且互为好友
    111011拉黑别人
    671000011标星
    256100000000删除好友
    259100000011不让他看我的朋友圈
    6553910000000000000011不看他的朋友圈

    从上面的表格大致可以看出来
    第一位:你是否加对方为好友
    第二位:对方是否加你为好友
    第三位:是否群里面的
    第四位:你主动拉黑对方

    第七位:标星
    剩下的只是大概,还未落实是否准确,还有更多的希望大家发现后留言给我,一同探讨。


    dbcontactremark

    这个字段是使用Blod去纪录的,而通过观察,发现是一种很有趣的纪录方式。

    开头若干字节未知信息 --> (1 字节类型说明 --> 1(?) 字节长度 --> 字符串) 若干个

    1. 先取第i位(i=0),这个应该说明作用的,但是我还没弄懂它的意思。
    2. 取后一位(i+1),这个说明的是后面正文的长度,假设你取得的值是15
    3. 然后从(i+2)开始,截取15个字节,转换成字符串就是正文了
    4. 重复1-3,直至读取完所有字节为止

    还是不明白的话,直接上代码好了

    //解析dbcontactremark
    -(NSArray*)getRemarkDataBy:(NSData *)data{
        Byte *testByte = (Byte *)[data bytes];
    
        NSMutableArray* arr = [[NSMutableArray alloc]init];
        int len = 0;
        int index = 0;
        while (true) {
            index++;
            len = testByte[index];
            index++;
    
            if (index + len > [data length]) {
                break;
            }
    
            NSString* str = [[NSString alloc]initWithData:[data subdataWithRange:NSMakeRange(index, len)] encoding:NSUTF8StringEncoding];
            if (str != nil) {
                [arr addObject:str];
            }
    
            index += len;
        }
    
        return [arr copy];
    }

    附上两个运行中截取数据的图(最后一列有特殊意义,文章下面会再作解析)




    dbcontactheadimage

    顾名思义,这个列代表的头像的信息



    大致可以看出,里面有直接一个http的网址,只要把这个网址截取出来就好了,这里我用了最笨的方法

    //解析dbcontactheadimage
    -(NSString *)getPhotoBy:(NSData *)data{
        if (data.length <= 8) {
            return @"";
        }
    
        int begin = 0;
        int end = 0;
    
        Byte *byteData = (Byte *)[data bytes];
        for(int i=0;i<[data length];i++){
            if (byteData[i] == 104 && begin == 0) {//104 = "h"
                begin = i;
            }
    
            if (byteData[i] == 26 && end == 0) {//26 = "结束"
                end = i;
            }
        }
    
        if (begin > 0 && end > 0) {
            int len = end - begin;
            NSData* tempData = [data subdataWithRange:NSMakeRange(begin, len)];
            NSString* str = [[NSString alloc]initWithData:tempData encoding:NSASCIIStringEncoding];
    
            return str;
        }
    
        return @"";
    }

    dbcontactchatroom

    这个字段只有 群 才有内容,其内容说明了该 群 的所有成员



    内容由两部分组成,第一部分是所有的成员的 微信ID,用 ;(分号)隔开。另一部分则是比较详细的XML格式

    <RoomData>
        <Member UserName="xxxx">
            <Flag>N</Flag>
            <DisplayName>xxxx</DisplayName>
        </Member>
        ...
    </RoomData>

    标签

    微信里还有一个叫标签的分组方式,而标签是存放在数据库里面,而是Documents/微信号的MD5/contactlabel.list,继续改成plist就可以查看




    首先红框告诉你一共有多少分组
    黄框,分组ID 3 => 标签名 bbb
    绿框,分组ID 2 => 标签名 aa a
    篮框,分组ID 1 => 标签名 qqq

    到这里,你肯定会问,那标签的成员在哪啊?
    其实,上面我们曾经见过了,在分析 dbcontactremark的时候



    这里最后的一个字符串 3,4,其实就是表示这个好友,是存在 标签ID=3标签ID=4 的这两个标签里面。


    好友的资料到这里就结束了,接下来我们来介绍聊天信息


    聊天:MM.sqlite

    有了前面的准备,我们已经可以解析 Chat_[0-9a-f]{32} 表,并且以文本形式导出每个对话的聊天记录。怎么知道聊天的对象是谁?Chat_ 后面是 UsrName 或 alias 的 MD5 值。



    首先看一下聊天记录的结构。MesLocalID 是一个比较重要的数字,虽然暂时还用不到。CreateTime 顾名思义,并且应该是 UTC+0 的。Message 就是消息本身。Type 表示消息的类型,可以自己试验一下,最后 Des 应该表示我是否为消息的接收方。

    下面简单描述一下我见到过的 Type 和对应的 Message 处理:

    10000: 系统消息,就是那种居中的。

    34: 语音,消息里会有 <voicemsg> 标签,可以读出来长度等信息。具体文件的处理下一节再讲,下同。

    47: 表情,<emoji> 标签里面可以找到一些信息。

    62: 小视频,<videomsg>

    50: 视频/语音通话,<voipinvitemsg>。本来在微信里二者就可以切换,对用户解释得太细也没啥用。

    3: 图片。

    48: 位置。

    42: 名片。

    49: 链接。这里面包含的类别比较多,在 Message 里面会有 <title><des><url><thumburl> 等信息。微信应该是通过 <type> 标签来确定一些特殊的应用,比如 2001 是红包,2000 转账,17 实时位置共享,6 文件。(我试过把它或者后面的模板地址改成别的,好像不管用。)

    对于导出文字来说,这些特殊的东西就给用户显示个“[图片]”、“[表情]”吧。

    还有一个问题是群聊,特点是用户名为 \d+@chatroom。在群聊当中,每个人(除了自己)的发言前面都会有“微信号:\n”,好让我们知道对方身份。

    4.其他多媒体资源

    为了给用户初恋般的体验,我还希望能尽量还原聊天的全部内容,这就需要加入对应的图片(头像)、语音、视频、动画表情等元素。

    我们自然会想在 Documents/微信号的MD5 文件夹下面找这些内容。这时很容易发现:

    (1) Img

    Img 文件夹中有一些以 MD5 命名的文件夹,它们对应数据库中的各 Chat_ 表,而具体文件是以数字编号的,这个编号等于对应消息的 MesLocalID(上面提到过)。文件有三种后缀:.pic、.pic_hd、.pic_thum,顾名思义是正常大小的图片、原图、缩略图。基本上是 JPEG 格式吧,这个影响不大。

    (2) Video

    Video 文件夹类似,有 .video_thum 扩展名的缩略图,以及 .mp4 的视频本体。视频是 AVC+AAC 编码的,不过仍然不重要吧。

    (3) Audio

    Audio 是语音,以前是 3GP 格式,现在打开之后可以看到 SILK_V3 的字样,搜索可以直接发现编译好的转换程序。不过没有源码,也可以自行搜索其他解决方案。

    然而在这个版本中,我始终没有从备份当中找到动画表情和头像这两项资源。怎么回事?

    正好那段时间盘古越狱出现了,我把完整的 Documents 和 Library 文件夹复制出来,看了一遍。原来它们在 Library/WechatPrivate 里,而这个文件夹设置成了不备份。这也有道理,因为前面的几个是个人的资源,而头像和表情随时都可以再去下载,所以并不需要放在 iTunes 备份当中。

    那么不越狱的情况下,我们怎么获得它们呢?记得上面提到过,在每个好友的 dbContactHeadImage 当中有正常和放大头像的地址;如果看一下含有动画表情的消息,其中也有这个表情的 GIF 地址。好的,下载就可以了。

    5.总结

    以上描述了找到微信聊天记录涉及的文件的方法,不过讲道理它们都只能算是“有根据的推测”。因为聊天记录这件事不太方便收集测试数据,只能保证它们符合我能找到的记录。

    展开全文
  • 大数据公司数据挖掘的49个案例

    万次阅读 2021-02-08 00:00:00
    数据来源于“聚石塔”——一个大型的数据分享平台,它通过共享阿里巴巴旗下各个子公司的数据资源来创造商业价值。这款产品就是大数据团队把淘宝交易流程各个环节的数据整合互联,然后基于商业理解对信息进行分类...

    本文是近年来不同行业、不同领域的大数据公司的一些经典案例总结。尽管有些已经是几年前的案例,但其中的深层逻辑对于未来仍有启发。

    本文力图从企业运营和管理的角度,梳理出发掘大数据价值的一般规律:一是以数据驱动的决策,主要通过提高预测概率,来提高决策成功率;二是以数据驱动的流程,主要是形成营销闭环战略,提高销售漏斗的转化率;三是以数据驱动的产品,在产品设计阶段,强调个性化;在产品运营阶段,则强调迭代式创新。

    01 上篇:天然大数据公司的各种套餐

    从谷歌、亚马逊、Facebook、LinkedIn,到阿里、百度、腾讯,都因其拥有大量的用户注册和运营信息,成为天然的大数据公司。而像IBM、Oracle、EMC、惠普这类大型技术公司纷纷投身大数据,通过整合大数据的信息和应用,给其他公司提供“硬件软件 数据”的整体解决方案。我们关注的重点是大数据的价值,第一类公司首当其冲。

    下面就是这些天然大数据公司的挖掘价值的典型案例。

    1. 亚马逊的“信息公司”

    如果全球哪家公司从大数据发掘出了最大价值,截至目前,答案可能非亚马逊莫属。亚马逊也要处理海量数据,这些交易数据的直接价值更大。

    作为一家“信息公司”,亚马逊不仅从每个用户的购买行为中获得信息,还将每个用户在其网站上的所有行为都记录下来:页面停留时间、用户是否查看评论、每个搜索的关键词、浏览的商品等等。这种对数据价值的高度敏感和重视,以及强大的挖掘能力,使得亚马逊早已远远超出了它的传统运营方式。

    亚马逊CTO Werner Vogels在CeBIT上关于大数据的演讲,向与会者描述了亚马逊在大数据时代的商业蓝图。长期以来,亚马逊一直通过大数据分析,尝试定位客户和和获取客户反馈。

    “在此过程中,你会发现数据越大,结果越好。为什么有的企业在商业上不断犯错?那是因为他们没有足够的数据对运营和决策提供支持,”Vogels说,“一旦进入大数据的世界,企业的手中将握有无限可能。”从支撑新兴技术企业的基础设施到消费内容的移动设备,亚马逊的触角已触及到更为广阔的领域。

    亚马逊推荐:亚马逊的各个业务环节都离不开“数据驱动”的身影。在亚马逊上买过东西的朋友可能对它的推荐功能都很熟悉,“买过X商品的人,也同时买过Y商品”的推荐功能看上去很简单,却非常有效,同时这些精准推荐结果的得出过程也非常复杂。

    亚马逊预测:用户需求预测是通过历史数据来预测用户未来的需求。对于书、手机、家电这些东西——亚马逊内部叫硬需求的产品,你可以认为是“标品”——预测是比较准的,甚至可以预测到相关产品属性的需求。但是对于服装这样软需求产品,亚马逊干了十多年都没有办法预测得很好,因为这类东西受到的干扰因素太多了,比如:用户的对颜色款式的喜好,穿上去合不合身,爱人朋友喜不喜欢…… 这类东西太易变,买得人多反而会卖不好,所以需要更为复杂的预测模型。

    亚马逊测试:你会认为亚马逊网站上的某段页面文字只是碰巧出现的吗?其实,亚马逊会在网站上持续不断地测试新的设计方案,从而找出转化率最高的方案。整个网站的布局、字体大小、颜色、按钮以及其他所有的设计,其实都是在多次审慎测试后的最优结果。

    亚马逊记录:亚马逊的移动应用让用户有一个流畅的无处不在的体验的同时,也通过收集手机上的数据深入地了解了每个用户的喜好信息;更值得一提的是Kindle Fire,内嵌的Silk浏览器可以将用户的行为数据一一记录下来。

    以数据为导向的方法并不仅限于以上领域,亚马逊的企业文化就是冷冰冰的数据导向型文化。对于亚马逊来说,大数据意味着大销售量。数据显示出什么是有效的、什么是无效的,新的商业投资项目必须要有数据的支撑。对数据的长期专注让亚马逊能够以更低的售价提供更好的服务。

    2. 谷歌的意图

    如果说有一家科技公司准确定义了“大数据”概念的话,那一定是谷歌。根据搜索研究公司comScore的数据,仅2012年3月一个月的时间,谷歌处理的搜索词条数量就高达122亿条。谷歌的体量和规模,使它拥有比其他大多数企业更多的应用大数据的途径。

    谷歌搜索引擎本身的设计,就旨在让它能够无缝链接成千上万的服务器。如果出现更多的处理或存储需要,抑或某台服务器崩溃,谷歌的工程师们只要再添加更多的服务器就能轻松搞定。将所有这些数据集合在一起所带来的结果是:企业不仅从最好的技术中获益,同样还可以从最好的信息中获益。下面选择谷歌公司的其中三个亮点。

    谷歌意图:谷歌不仅存储了搜索结果中出现的网络连接,还会储存用户搜索关键词的行为,它能够精准地记录下人们进行搜索行为的时间、内容和方式,坐拥人们在谷歌网站进行搜索及经过其网络时所产生的大量机器数据。这些数据能够让谷歌优化广告排序,并将搜索流量转化为盈利模式。谷歌不仅能追踪人们的搜索行为,而且还能够预测出搜索者下一步将要做什么。用户所输入的每一个搜索请求,都会让谷歌知道他在寻找什么,所有人类行为都会在互联网上留下痕迹路径,谷歌占领了一个绝佳的点位来捕捉和分析该路径。换言之,谷歌能在你意识到自己要找什么之前预测出你的意图。这种抓取、存储并对海量人机数据进行分析,然后据此进行预测的能力,就是数据驱动的产品。

    谷歌分析:谷歌在搜索之外还有更多获取数据的途径。企业安装“谷歌分析”之类的产品来追踪访问者在其站点的足迹,而谷歌也可获得这些数据。网站还使用“谷歌广告联盟”,将来自谷歌广告客户网的广告展示在其站点,因此,谷歌不仅可以洞察自己网站上广告的展示效果,同样还可以对其他广告发布站点的展示效果一览无余。

    谷歌趋势:既然搜索本身是网民的“意图数据库”,当然可以根据某一专题搜索量的涨跌,预测下一步的走势。谷歌趋势可以预测旅游、地产、汽车的销售。此类预测最着名的就是谷歌流感趋势,跟踪全球范围的流感等病疫传播,依据网民搜索,分析全球范围内流感等病疫的传播状况。

    3. eBay的分析平台

    早在2006年,eBay就成立了大数据分析平台。为了准确分析用户的购物行为,eBay定义了超过500种类型的数据,对顾客的行为进行跟踪分析。eBay分析平台高级总监Oliver Ratzesberger说:“在这个平台上,可以将结构化数据和非结构化数据结合在一起,通过分析促进eBay的业务创新和利润增长。”

    eBay行为分析:在早期,eBay网页上的每一个功能的更改,通常由对该功能非常了解的产品经理决定,判断的依据主要是产品经理的个人经验。而通过对用户行为数据的分析,网页上任何功能的修改都交由用户去决定。“每当有一个不错的创意或者点子,我们都会在网站上选定一定范围的用户进行测试。通过对这些用户的行为分析,来看这个创意是否带来了预期的效果。”

    eBay广告分析:更显着的变化反映在广告费上。eBay对互联网广告的投入一直很大,通过购买一些网页搜索的关键字,将潜在客户引入eBay网站。

    4. 塔吉特的“数据关联挖掘”

    利用先进的统计方法,商家可以通过用户的购买历史记录分析来建立模型,预测未来的购买行为,进而设计促销活动和个性服务避免用户流失到其他竞争对手那边。

    美国第三大零售商塔吉特,通过分析所有女性客户购买记录,可以“猜出”哪些是孕妇。其发现女性客户会在怀孕四个月左右,大量购买无香味乳液。由此挖掘出25项与怀孕高度相关的商品,制作“怀孕预测”指数。推算出预产期后,就能抢先一步,将孕妇装、婴儿床等折扣券寄给客户。

    塔吉特还创建了一套购买女性行为在怀孕期间产生变化的模型,不仅如此,如果用户从它们的店铺中购买了婴儿用品,它们在接下来的几年中会根据婴儿的生长周期定期给这些顾客推送相关产品,使这些客户形成长期的忠诚度。

    5. 中国移动的数据化运营

    通过大数据分析,中国移动能够对企业运营的全业务进行针对性的监控、预警、跟踪。大数据系统可以在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。

    客户流失预警:一个客户使用最新款的诺基亚手机,每月准时缴费、平均一年致电客服3次,使用WEP和彩信业务。如果按照传统的数据分析,可能这是一位客户满意度非常高、流失概率非常低的客户。事实上,当搜集了包括微博、社交网络等新型来源的客户数据之后,这位客户的真实情况可能是这样的:客户在国外购买的这款手机,手机中的部分功能在国内无法使用,在某个固定地点手机经常断线,彩信无法使用——他的使用体验极差,正在面临流失风险。这就是中国移动一个大数据分析的应用场景。通过全面获取业务信息,可能颠覆常规分析思路下做出的结论,打破传统数据源的边界,注重社交媒体等新型数据来源,通过各种渠道获取尽可能多的客户反馈信息,并从这些数据中挖掘更多的价值。

    数据增值应用:对运营商来说,数据分析在政府服务市场上前景巨大。运营商也可以在交通、应对突发灾害、维稳等工作中使大数据技术发挥更大的作用。运营商处在一个数据交换中心的地位,在掌握用户行为方面具有先天的优势。作为信息技术的又一次变革,大数据的出现正在给技术进步和社会发展带来全新的方向,而谁掌握了这一方向,谁就可能成功。对于运营商来说,在数据处理分析上,需要转型的不仅是技巧和法律问题,更需要转变思维方式,以商业化角度思考大数据营销。

    6. Twitter中的兴趣和情绪

    Twitter兴趣聚类:通过过滤用户归属地、发推位置和相关关键词,Twitter建立了一系列定制化的客户数据流。比如,通过过滤电影片名、位置和情绪标签,你可以知道洛杉矶、纽约和伦敦等城市最受欢迎的电影是哪些。而根据用户发布的个人行为描述,你甚至能搜索到那些在加拿大滑雪的日本游客。从这个视角看,Twitter的兴趣图谱的效率优于Facebook的社交图谱。Twitter的用户数据所能产生的潜在价值同样令人惊叹。在社交媒体网站正在收集越来越多的数据的形势下,它们或许能找到更好的方式来利用这些数据盈利,并使其取代广告成为自身提高收入的主要方式。这些社交网站真正的价值可能在于数据本身。相信在不久的将来,如果寻找到既能充分利用用户数据,又可合理规避对用户隐私的威胁,社交数据所蕴藏的巨大能量将会彻底被开启。

    Twitter情绪分析:Twitter自己并不经营每一款数据产品,但它把数据授权给了像DataSift这样的数据服务公司,很多公司利用Twitter社交数据,做出了各种让人吃惊的应用,从社交监测到医疗应用,甚至可以去追踪流感疫情爆发,社交媒体监测平台DataSift还创造了一款金融数据产品。华尔街“德温特资本市场”公司首席执行官保罗·霍廷每天的工作之一,就是利用电脑程序分析全球3.4亿微博账户的留言,进而判断民众情绪,再以“1”到“50”进行打分。根据打分结果,霍廷再决定如何处理手中数以百万美元计的股票。霍廷的判断原则很简单:如果所有人似乎都高兴,那就买入;如果大家的焦虑情绪上升,那就抛售。一些媒体公司会把观众收视率数据打包到产品里,再转卖给频道制作人和内容创造者。

    精确的数据一旦与社交媒体数据相结合,对未来的预测会非常准。

    7. 特易购的精准定向

    聪明的商家通过用户的购买历史记录分析来建立模型,为他们量身预测未来的购物清单,进而设计促销活动和个性服务,让他们源源不断地为之买单。

    特易购是全球利润第二大的零售商,这家英国超级市场巨人从用户行为分析中获得了巨大的利益。从其会员卡的用户购买记录中,特易购可以了解一个用户是什么“类别”的客人,如速食者、单身、有上学孩子的家庭等等。

    这样的分类可以为提供很大的市场回报,比如,通过邮件或信件寄给用户的促销可以变得十分个性化,店内的促销也可以根据周围人群的喜好、消费的时段来更加有针对性,从而提高货品的流通。这样的做法为特易购获得了丰厚的回报,仅在市场宣传一项,就能帮助特易购每年节省3.5亿英镑的费用。

    Tesco的优惠券:特易购每季会为顾客量身定做6张优惠券。其中4张是客户经常购买的货品,而另外2张则是根据该客户以往的消费行为数据分析,极有可能在未来会购买的产品。仅在1999年,特易购就送出了14.5万份面向不同的细分客户群的购物指南杂志和优惠券组合。更妙的是,这样的低价无损公司整体的盈利水平。通过追踪这些短期优惠券的回笼率,了解到客户在所有门店的消费情况,特易购还可以精确地计算出投资回报。发放优惠券吸引顾客其实已经是很老套的做法了,而且许多的促销活动实际只是来掠夺公司未来的销售额。然而,依赖于扎实的数据分析来定向发放优惠券的特易购,却可以维持每年超过1亿英镑的销售额增长。

    特易购同样有会员数据库,通过已有的数据,就能找到那些对价格敏感的客户,然后在公司可以接受的最低成本水平上,为这类顾客倾向购买的商品确定一个最低价。这样的好处一是吸引了这部分顾客,二是不必在其他商品上浪费钱降价促销。

    特易购的精准运营:这家连锁超市在其数据仓库中收集了700万部冰箱的数据。通过对这些数据的分析,进行更全面的监控并进行主动的维修以降低整体能耗。

    8. Facebook的好友推荐

    Facebook是社交网络巨擎,但是在挖掘大数据价值方面,好像办法不多,值得一提的就是好友推荐。

    Facebook使用大数据来追踪用户在其网络的行为,通过识别你在它的网络中的好友,从而给出新的好友推荐建议,用户拥有越多的好友,他们与Facebook之间的黏度就越高。更多的好友意味着用户会分享更多照片、发布更多状态更新、玩更多的游戏。

    9. LinkedIn的猎头价值

    LinkedIn网站使用大数据在求职者和招聘职位之间建立关联。有了LinkedIn,猎头们再也不用向潜在的受聘者打陌生电话来碰运气,而可以通过简单的搜索找出潜在受聘者并联系他们。

    与此相似,求职者也可以通过联系网站上其他人,自然而然地将自己推销给潜在的雇主。有两个例子能够生动呈现LinkedIn的数据价值:几年前,LinkedIn忽然发现近期雷曼兄弟的来访者多了起来,当时并没引起重视,过了不久,雷曼兄弟宣布倒闭;而在谷歌宣布退出中国的前一个月,在LinkedIn发现了一些平时很少见的谷歌产品经理在线,这也是相同的道理。

    10. 沃尔玛的数据基因

    早在1969年沃尔玛就开始使用计算机来跟踪存货,1974年就将其分销中心与各家商场运用计算机进行库存控制。1983年,沃尔玛所有门店都开始采用条形码扫描系统。

    1987年,沃尔玛完成了公司内部的卫星系统的安装,该系统使得总部,分销中心和各个商场之间可以实现实时,双向的数据和声音传输。采用这些在当时还是小众和超前的信息技术来搜集运营数据为沃尔玛最近20年的崛起打下了坚实的地基,从而发现了“啤酒与尿布”关联。

    如今,沃尔玛拥有着全世界最大的数据仓库,在数据仓库中存储着沃尔玛数千家连锁店在65周内每一笔销售的详细记录,这使得业务人员可以通过分析购买行为更加了解他们的客户。

    通过这些数据,业务员可以分析顾客的购买行为,从而供应最佳的销售服务。沃尔玛一直致力于改善自身的数据收集技术,从条形码扫描,到安装卫星系统实现双向数据传输,整个公司都充满了数据基因。

    2012年4月,沃尔玛又收购了一家研究网络社交基因的公司Kosmix,在数据基因的基础上,又增加了社交基因。

    11. 阿里小贷和聚石塔

    虽然阿里系的余额宝如日中天,但其实阿里小贷才真正体现出了大数据的价值。早在2010年阿里就已经建立了“淘宝小贷”,通过对贷款客户下游订单、上游供应商、经营信用等全方位的评估,就可以在没有见面情况下,给客户放款,这当然是对阿里平台上大数据的挖掘。

    数据来源于“聚石塔”——一个大型的数据分享平台,它通过共享阿里巴巴旗下各个子公司的数据资源来创造商业价值。这款产品就是大数据团队把淘宝交易流程各个环节的数据整合互联,然后基于商业理解对信息进行分类储存和分析加工,并与决策行为连接起来所产生的效果。

    12. 西尔斯的数据大集成

    在过去,美国零售巨头西尔斯控股公司,需要八周时间才能制定出个性化的销售方案,但往往做出来的时候,它已不再是最佳方案。

    痛定思痛,决定整合其专售的三个品牌——Sears、Craftsman、Lands'End的客户、产品以及销售数据,使用群集收集来自不同品牌的数据,并在群集上直接分析数据,而不是像以前那样先存入数据仓库,避免了浪费时间——先把来自各处的数据合并之后再做分析。

    这种调整让公司的推销方案更快、更精准,可以从海量信息中挖掘价值,但是价值巨大,困难也巨大:这些数据需要超大规模分析,且分散在不同品牌的数据库与数据仓库中,不仅数量庞大而且支离破碎。

    西尔斯的困境,在传统企业中非常普遍,这些企业家一直想不通,既然互联网零售商亚马逊可以推荐阅读书目、推荐电影、推荐可供购买的产品,为什么他们所在的企业却做不到类似的事情。

    西尔斯公司首席技术官菲里·谢利(Phil Shelley)说:如果要制定一系列复杂推荐方案质量更高,需要更及时、更细致、更个性化的数据,传统企业的IT架构根本不能完成这些任务,需要痛下决心,才能完成转型。

    02 中篇:轻公司数据创业狂欢

    在“数据盛宴”中,是否只有大公司的狂欢?并非如此,从事大数据产业的轻公司将无处不在。新兴的创业公司通过出售数据和服务更有针对性地提供单个解决方案,把大数据商业化、商品化,才是更加值得我们关注的模式。这将带来继门户网站、搜索引擎、社交媒体之后的新一波创业浪潮和产业革命,并会对传统的咨询公司产生强烈冲击。

    13. PredPol的犯罪预测

    PredPol公司通过与洛杉矶和圣克鲁斯的警方以及一群研究人员合作,基于地震预测算法的变体和犯罪数据来预测犯罪发生的几率,可以精确到500平方英尺的范围内。在洛杉矶运用该算法的地区,盗窃罪和暴力犯罪分布下降了33%和21%。

    14. Tipp24 AG的赌徒行为预测

    Tipp24 AG针对欧洲博彩业构建的下注和预测平台。该公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。SAP公司正在试图收购KXEN,“SAP想通过这次收购来扭转其长久以来在预测分析方面的劣势”。

    15. Inrix的堵车预言

    交通的参与者多种多样,是大数据最能发挥价值的领域。交通流量数据公司Inrix依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避开正在堵车的路段,并且帮他们提前规划好行程。汽车制造商、移动应用开发者、运输企业以及各类互联网企业都需要Inrix的路况报告。奥迪、福特、日产、微软等巨头都是Inrix的客户。

    16. 潘吉瓦的时尚预测

    消费者追寻意见领袖的生活方式。潘吉瓦公司就是用数据分析来预测流行趋势,以此为基础甚至撬动全球贸易。比如,它们通过41次追踪《暮光之城》的徽章、袜子的运输情况,分析在这部电影中主角的服饰对流行趋势有多大影响率,并将分析结果告知用户,建议他们对自己的行动做出恰当的调整。

    17. 潘多拉的音乐推荐

    美国在线音乐网站潘多拉特别聘请一些音乐专家,让他们每个人平均花上20分钟去分析一首歌曲,并赋予每首歌400种不同的属性。如果你表示喜欢一首歌,程序会自动寻找跟这首歌“基因”相同的歌曲,猜测你也会喜欢并采用推荐引擎技术推荐给你。借助这种人海战术,潘多拉网站已经分析了74万首歌曲。

    18. Futrix Health的医疗方案

    Futrix Health是一家专注于用通过数据为患者制定医疗解决方案的公司,从安装在智能手机上的个人健康应用,到诊所、医院里医生使用的电子健康记录仪,甚至是革命性的数字化基因组数据,均连接到后端数据仓库上。从而为患者制定最佳的医院选择、医药选择。

    该如何将采集到医疗保健机构的大量操作信息,分析患者情况或治疗效果,实施任何高效率的措施,使之更具有意义——大数据时代提供的机会,不再是简单地收集这些数据,而是如何运用数据来更好地认知这个世界。

    19. Retention Science的用户粘性

    在零售领域,创业公司Retention Science发布了一个为电子商务企业提供增强用户粘性的数据分析及市场策略设计的平台,它的用户建模引擎具备自学习功能,通过使用算法和统计模型来设计优化用户粘性的策略。

    平台的用户数据分析都是实时进行,以确保用户行为预测总是符合实际用户行为更新;同时,动态的根据这些行为预测来设计一些促销策略。RS目前已获得Baroda Ventures, Mohr Davidow Ventures, Double M Partners及一些着名天使投资人130万美金的投资。

    20. 众瀛的婚嫁后推荐

    江苏众瀛联合数据科技有限公司构建了这样一个大数据平台——将准备结婚的新人作为目标消费者,并把与结婚购物相关的商家加入其中。

    一对新人到薇薇新娘婚纱影楼拍了婚纱照,在实名登记了自己的信息后会被上传到大数据平台上。大数据平台能根据新人在婚纱影楼的消费情况和偏好风格,大致分析判断出新人后续消费需求,即时发送奖励和促销短信。

    比如邀请他们到红星美凯龙购买家具、到红豆家纺选购床上用品、到国美电器选购家用电器、到希尔顿酒店摆酒席……如果新人在红星美凯龙购买了中式家具,说明他们偏好中国传统文化,就推荐他们购买红豆家纺的中式家居用品。

    21. Takadu的数字驯水

    水,向来是个不好管理的东西:自来水公司发现某个水压计出现问题,可能需要花上很长的时间排查共用一个水压计的若干水管。等找到的时侯,大量的水已经被浪费了。以色列一家名为Takadu的水系统预警服务公司解决了这个问题。

    Takadu把埋在地下的自来水管道水压计、用水量和天气等检测数据搜集起来,通过亚马逊的云服务传回Takadu公司的电脑进行算法分析,如果发现城市某处地下自来水管道出现爆水管、渗水以及水压不足等异常状况,就会用大约10分钟完成分析生成一份报告,发回给这片自来水管道的维修部门。

    报告中,除了提供异常状况类型以及水管的损坏状况——每秒漏出多少立方米的水,还能相对精确地标出问题水管具体在哪里。检测每千米“水路”,Takadu的月收费是1万美元。

    22. 百合网的婚恋匹配

    电商行业的现金收入源自数据,而婚恋网站的商业模型更是根植于对数据的研究。比如,作为一家婚恋网站,百合网不仅需要经常做一些研究报告,分析注册用户的年龄、地域、学历、经济收入等数据,即便是每名注册用户小小的头像照片,这背后也大有挖掘的价值。

    百合网研究规划部李琦曾经对百合网上海量注册用户的头像信息进行分析,发现那些受欢迎头像照片不仅与照片主人的长相有关,同时照片上人物的表情、脸部比例、清晰度等因素也在很大程度上决定了照片主人受欢迎的程度。

    例如,对于女性会员,微笑的表情、直视前方的眼神和淡淡的妆容能增加自己受欢迎的概率,而那些脸部比例占照片1/2、穿着正式、眼神直视没有多余pose的男性则更可能成为婚恋网站上的宠儿。

    23. Prismatic的新闻外衣

    Prismatic是一款个性化新闻应用,只有4名创始员工,凭借互联网数据爬虫和社交网络开发平台的数据,依托亚马逊的云计算平台,实现了大数据的精益创业。

    Prismatic不提供统一的设计精良的新闻订阅或推荐界面,而是根据分析用户的Facebook 或Twitter资料,为用户做一对一的数据分析和推荐。

    从盈利模式来看,Prismatic不是依靠广告费生存下来,也不是传统的新闻媒介,而是一个披着新闻应用外衣的电子商务公司。名义上为了给用户个性化推荐新闻而得到用户的个人信息进行数据分析,针对性的推出推荐商品,从而从电子商务中盈利。

    24. Opower的对比激励

    人类都有和同类对比的天性,例如,一家政府机构收集不同地点从事同类工作的多组员工的数据,仅仅将这些信息公诸于众就促使落后员工提高了绩效。

    在能源行业,Opower使用数据对比来提高消费用电的能效,并取得了显着的成功。作为一家SaaS的创新公司,Opower与多家电力公司合作,分析美国家庭用电费用并将之与周围的邻居用电情况进行对比,被服务的家庭每个月都会受到一份对比的报告,显示自家用电在整个区域或全美类似家庭所处水平,以鼓励节约用电。

    Opower的服务以覆盖了美国几百万户居民家庭,预计将为美国消费用电每年节省5亿美元。Opower报告信封,看上去像账单,它们使用行为技术轻轻地说服公用事业客户降低消耗。

    Opower已经推出了它的大数据平台 Opower4 ,通过分析各种智能电表和用电行为,电力公司等公用事业单位成为Opower的盈利来源。而对一般用户而言,Opower完全是免费的。

    25. Chango和Uniqlick的点击消费

    使用新的数据技术,诸如美国的Chango公司和中国的Uniqlick公司正在数字广告行业中探索新的商业模式——实时竞拍数字广告。

    通过了解互联网用户在网络的搜索、浏览等行为,这些公司可以为广告主提供最有可能对其商品感兴趣的用户群,从而进行精准营销;更长期的趋势是,将广告投放给最有可能购买的用户群。

    这样的做法对于广告主来说,可以获得更高的转换率,而对于发布广告的网站来说,也提高了广告位的价值。

    26. 众趣的行为辩析

    众趣是国内第一家社交媒体数据管理平台,目前国内主要的社交开放平台在用户数据的开放性方面仍比较保守,身为第三方数据分析公司,能够获得的用户数据还十分有限,要使用这些用户数据需获得用户许可。

    众趣通过运营统计学等相关数据分析原理对用户数据进行过滤,最终完成的是对一个用户的行为、动作等个体特征的描述。这些描述可以帮助品牌营销者了解消费者的消费习惯及需求;也可以帮助企业的领导增强对自己员工的了解。除了对个体以及群体行为特征的描述外,这些数据分析结果还可用于对用户群体的行为预测,从而为营销者提供一些前瞻性的市场分析。

    众趣数据分析的结果只能精准到群组而无法达到个人。此类的用户数据研究除在市场营销领域具有一定的参考价之外,目前大多还主要用于配合一些小调研。此外,这些数据还可以实现对用户甚至企业机构的信用评级,在金融领域也有一定程度的使用。

    27. 拖拉网的明天猜想

    导购电商的拖拉网制作了“明天穿什么”这一应用。在这个应用当中,众多时装圈权威人士输送时装搭配与风格单品,由用户任意打分,根据用户的打分偏好,拖拉网便能猜到明天她们想穿什么,然后为她在数十万件网购时装中推荐单品,并且实现直通购买下单。在获取客户数据后,后台分析也是各显神通。

    拖拉网加入了更多变量来考核自己的推荐模式。比如有消费者明天要参加一个聚会,不知道要穿什么风格,也没有看天气预报,希望导购网站能帮她把这些场景和自己的信息组合起来,给出一整套的解决方案。

    于是日期、地域、场合、风格,这些都成为穿衣搭配解决方案的变量,经过不断的组合呈现给用户,据拖拉网数据,用户在看到一个比较优质的搭配,并有场景性引导的时候,点击到最后页面完成购买的转化率会比单品推荐高40%。

    28. SeeChange的基因健康

    现在人们有了把人类基因档案序列化的能力,这允许医生和科学家去预测病人对于某些疾病的易感染性和其他不利的条件,可以减少治疗过程的时间和花费。

    位于旧金山的SeeChange公司创建了一套新的健康保险模式。该公司通过分析客户的个人健康记录、医疗报销记录、以及药店的数据,来判断该客户对于慢性病的易感性,并判断该客户是否有可能从一些定制的康复套餐中获利。

    SeeChange同时设计健康计划,并设立奖励机制鼓励客户主动完成健康行动,全过程都通过其数据分析引擎来监控。

    29. Given Imaging的图像诊断

    以色列的Given Imaging公司发明了一种胶囊,内置摄像头,患者服用后胶囊能以大约每秒14张照片的频率拍摄消化道内的情况,并同时传回外置的图像接收器,患者病征通过配套的软件被录入数据库,在4至6小时内胶囊相机将通过人体排泄离开体外。

    一般来说,医生都是在靠自己的个人经验进行病征判断,难免会对一些疑似阴影拿捏不准甚至延误病人治疗。现在通过Given Imaging的数据库,当医生发现一个可疑的肿瘤时,双击当前图像后,过去其他医生拍摄过的类似图像和他们的诊断结果都会悉数被提取出来。

    可以说,一个病人的问题不再是一个医生在看,而是成千上万个医生在同时给出意见,并由来自大量其他病人的图像给出佐证。这样的数据对比,不但提高了医生诊断的效率,还提升了准确度。

    30. Entelo的“前猎头”

    真正的技术人才永远是各大公司的抢手货,绝对不要坐等他们向你投简历,因为在他们还没有机会写简历之前很可能已经被其他公司抢走了。Entelo公司能替企业家们推荐那些才刚刚萌发跳槽动机的高级技术人才,以便先下手为强。

    Entelo的数据库里目前有3亿份简历。而如何判断高级人才的跳槽倾向,Entelo有一套正在申请专利的算法。这套算法有70多个指标用于判定跳槽倾向。某公司的股价下跌、高层大换血、刚被另一大公司收购,这些都会被Entelo看作是导致该公司人才跳槽的可能性因素。

    于是Entelo就会立刻把该公司里的高级人才的信息推送给订阅了自己服务的企业家们。企业家们收到的简历跟一般的简历还不一样。Entelo抓取了这些人才在各大社交网络的信息。这样企业家们可以了解该人提交过哪些代码,在网上都回答了些什么样的问题,在Twitter上都发表的是些什么样的信息。

    总之,这些准备“挖角”的企业家能够看到一个活生生的目标人才站在面前。

    31. FlightCaster和Passur的延误预测

    航空业分秒必争,尤其是航班抵达的准确时间。如果一班飞机提前到达,地勤人员还没准备好,乘客和乘务员就会被困在飞机上白白耽误时间;如果一班飞机延误,地勤人员就只能坐着干等,白白消耗成本。

    美国一家大航空公司从其内部报告中发现,大约10%的航班的实际到达时间与预计到达时间相差10分钟以上,30%的航班相差5分钟以上。FlightCaster是一家提供航班延误信息预测的公司,主要根据航空公司的航班运行情况进行预测。

    与航空公司所拥有的类似航班运行情况的专有信息一样,该公司拥有大量国内航班飞行和航班实时运行状况的历史数据。Flightcaster的秘诀就是其对大数据分析的有效利用和使用适当的软件工具对产出数据进行实时管理。

    Passur Aerospace是专门为航空业提供决策支持的技术公司。通过搜集天气、航班日程表等公开数据,结合自己独立收集的其他影响航班因素的非公开数据,综合预测航班到港时间。时至2012年,Passur公司已经拥有超过155处雷达接收站,每4.6秒就收集一次雷达上每架飞机的一系列信息,这会持续地带来海量数据。

    不仅如此,经过长期的数据收集,Passur拥有了一个超过十年的巨大的多维信息载体,为透彻的分析和恰当的数据模型提供了可能。Passur公司相信,航空公司依据它们提供的航班到达时间做计划,能为每个机场每年节省数百万美元。

    32. Climate的农业保险

    一家名为气候公司的创业企业每天都会对美国境内超过100万个地点、未来两年的天气情况进行超过1万次模拟,其数据量庞大、动态、实时。随后,该公司将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险。

    通过遥感获取土壤数据,这和我们过去所熟悉的通过网络服务获取用户网络行为数据不是一回事,数据的概念得以极大的扩充。要想对每块田地提供精准的保险服务,肯定还需要与土地数据相配套的农产品期货、气候预测、国际贸易、国际政治和军事安全、国民经济,产业竞争等等各方面的数。

    在如此庞杂的大数据基础上推出的商业模式是创新的,同现有农作物保险方式相比具备极大竞争力,并且是可持续和规模化的。更妙的是,这家公司基于大数据的运营,完全没有进行高额的网络设施投资,只是租用了亚马逊的公共云服务,一个月几万美元而已。

    33. Hiptype的记录阅读

    几乎所有的收费电子书都会提供部分章节让读者试读,其实,出版商需要弄清楚人们读到了哪里、读完后有没有购买,以及其他各种体验,才能卖出更多的电子书。

    美国创业公司Hiptype开发了一套电子书阅读分析工具,其商业模式就在试图解决这一难题。Hiptype自称为“面向电子书的Google Analytics”,能够提供与电子书有关的丰富数据。它不仅能统计电子书的试读和购买次数,还能绘制出“读者图谱”,包括用户的年龄、收入和地理位置等。

    此外,它还能告诉出版商读者在看完免费章节后是否进行了购买,有多少读者看完了整本书,以及读者平均看了多少页,读者最喜欢从哪个章节开始看,又在哪个章节半途而废,等等。

    Hiptype能够与电子书整合在一起,出版商无论选择哪种渠道,总是能够获得用户数据。Hiptype收集的所有数据都是匿名的。用户在下载了内置Hiptype服务的电子书时,会得到一个提示,可以选择将其屏蔽。

    34. 安客诚的“人网合一”

    网络营销存在一个巨大问题,如何获知在网上使用几个不同名称的人是否是同一个人?安诚客推出了一种名为“观众操作系统”的技术方案解决了这个问题。它允许市场营销者与你的 “数字人物”绑定,即使你由于婚姻换了名字,或者使用昵称,或者偶尔使用中名,它也照样能够解答那个已经换了地址或者电话号码的人是否是同一个人的问题。

    AOS 可以汇集不同数据库中的信息,这些数据或离线或在线,是公司可能在不同场合针对个人而收集的。通过使用AbiliTec——一种Acxiom也拥有的数字化“身份识别”技术——AOS将客户信息删繁就简,得到简单单一的结果。AOS帮助安诚客的广告客户使用他们的数据在Facebook上找到广告投放目标用户。

    03 下篇:数据关联、数据废气和黑暗数据

    大数据主要不作因果判断,主要适用于关联分析。很多关联分析并不需要复杂的模型,只需要具有大数据的意识。

    很多机构都有数据废气,数据不是用完就是被舍弃,它的再利用价值也许你现在不清楚,但在未来的某一刻,它会迸发出来,可以化废为宝。

    黑暗数据就是那些针对单一目标而收集的数据,通常用过之后就被归档闲置,其真正价值未能被充分挖掘。如果黑暗数据用在恰当的地方,也能公司的事业变得光明。

    35. 数据关联分析

    某公司团队曾经使用来自手机的位置数据,来推测美国圣诞节购物季开始那一天有多少人在梅西百货公司的停车场停车,进而可以预测其当天的销售额,这远早于梅西百货自己统计出的销售记录。无论是华尔街的分析师或者传统产业的高管,都会因这种敏锐的洞察力获得极大的竞争优势。

    对于税务部门来说,税务欺骗正在日益的被关注,这时大数据可以用于增加政府识别诈骗的流程。在隐私允许的地方,政府部门可以综合各个方面的数据比如车辆的登记,海外旅游的数据来发现个人的花费模式,使税务贡献不被叠加。同时一个可疑的问题出现了,这并没有直接的证据指向诈骗,这些结论并不能用来去控告个人。但是他可以帮助政府部门去明确他们的审计和其他的审核以及一些流程。

    36. 数据废气

    物流公司的数据原来只服务于运营需要,但一经再利用,物流公司就华丽转身为金融公司,数据用以评估客户的信用,提供无抵押贷款,或者拿运送途中的货品作为抵押提供贷款;物流公司甚至可以转变为金融信息服务公司来判断各个细分经济领域的运行和走势。

    有公司已经在大数据中有接近“上帝俯视”的感觉,美国洛杉矶的一家企业宣称,他们将全球夜景的历史数据建立模型,在过滤掉波动之后,做出了投资房地产和消费的研究报告。

    麦当劳则通过外送服务,在售卖汉堡的同时获得了用户的精准地址,这些地址数据汇集之后,就变成了一份绝妙的房地产业的内部数据。

    37. 黑暗数据

    在特定情况下,黑暗数据可以用作其他用途。Infinity Property & Casualty公司用累积的理赔师报告来分析欺诈案例,通过算法挽回了1200万美元的代位追偿金额。一家电气销售公司,通过积累10年ERP销售数据分析,按照电气设备的生命周期,给5年前的老客户逐一拜访,获得了1000万元以上电气设备维修订单,顺利地进入MRO市场。

    38. 客户流失分析

    美国运通以前只能实现事后诸葛亮式的报告和滞后的预测,传统的BI已经无法满足其业务发展的需要。

    于是,AmEx开始构建真正能够预测客户忠诚度的模型,基于历史交易数据,用115个变量来进行分析预测。该公司表示,对于澳大利亚将于之后4个月中流失的客户,已经能够识别出其中的24%。这样的客户流失分析,当然可以用于挽留客户。

    酒店业可以为消费者定制相应的独特的个性房间,甚至可以在墙纸上放上消费者的微博的旅游心情等等。旅游业可以根据大数据为消费者提供其可能会喜好的本地特色产品、活动、小而美的小众景点等等来挽回游客的心。

    39. 快餐业的视频分析

    快餐业的公司可以通过视频分析等候队列的长度,然后自动变化电子菜单显示的内容。如果队列较长,则显示可以快速供给的食物;如果队列较短,则显示那些利润较高但准备时间相对长的食品。

    40. 大数据竞选

    2012年,参与竞选的奥巴马团队确定了三个最根本的目标:让更多的人掏更多的钱,让更多的选民投票给奥巴马,让更多的人参与进来!

    这需要“微观”层面的认知:每个选民最有可能被什么因素说服?每个选民在什么情况下最有可能掏腰包?什么样的广告投放渠道能够最高效获取目标选民?如竞选总指挥吉姆·梅西纳所说,在整个竞选活中,没有数据做支撑的假设不能存在。

    为了筹到10亿美元的竞选款,奥巴马的数据挖掘团队在过去两年搜集、存储和分析了大量数据。他们注意到,影星乔治·克鲁尼对美国西海岸40岁至49岁的女性具有非常大的吸引力:她们无疑是最有可能为了在好莱坞与克鲁尼和奥巴马共进晚餐而不惜自掏腰包的一个群体。克鲁尼在自家豪宅举办的筹款宴会上,为奥巴马筹集到数百万美元的竞选资金。

    此后,当奥巴马团队决定在东海岸物色一位对于这个女性群体具有相同号召力的影星时,数据团队发现莎拉·杰西卡·帕克的粉丝们也同样喜欢竞赛、小型宴会和名人。“克鲁尼效应”被成功地复制到了东海岸。

    在整个的竞选中,奥巴马团队的广告费用花了不到3亿美元,而罗姆尼团队则花了近4亿美元却落败,其中一个重要的原因在于,奥巴马的数据团队对于广告购买的决策,是经过缜密的数据分析之后才制定的。一项民调显示,80%的美国选民认为奥巴马比罗姆尼让他们感觉更加重视自己。

    结果是,奥巴马团队筹得的第一个1亿美元中,98%来自于小于250美元的小额捐款,而罗姆尼团队在筹得相同数额捐款的情况下,这一比例仅为31%。

    41. 监控非法改建

    “私搭乱建”在哪个国家都是一件闹心的事,而且容易引起火灾。非法在屋内打隔断的建筑物着火的可能性比其他建筑物高很多。纽约市每年接到2.5万宗有关房屋住得过于拥挤的投诉,但市里只有200名处理投诉的巡视员。

    市长办公室一个分析专家小组觉得大数据可以帮助解决这一需求与资源的落差。该小组建立了一个市内全部90万座建筑物的数据库,并在其中加入市里19个部门所收集到的数据:欠税扣押记录、水电使用异常、缴费拖欠、服务切断、救护车使用、当地犯罪率、鼠患投诉等等。

    接下来,他们将这一数据库与过去5年中按严重程度排列的建筑物着火记录进行比较,希望找出相关性。果然,建筑物类型和建造年份是与火灾相关的因素。不过,一个没怎么预料到的结果是,获得外砖墙施工许可的建筑物与较低的严重火灾发生率之间存在相关性。

    利用所有这些数据,该小组建立了一个可以帮助他们确定哪些住房拥挤投诉需要紧急处理的系统。他们所记录的建筑物的各种特征数据都不是导致火灾的原因,但这些数据与火灾隐患的增加或降低存在相关性。这种知识被证明是极具价值的:过去房屋巡视员出现场时签发房屋腾空令的比例只有13%,在采用新办法之后,这个比例上升到了70%。

    42. 榨菜指数

    负责起草《全国促进城镇化健康发展规划(2011-2020年)》(以下简称“城镇化规划”)的国家发改委规划司官员需要精确知道人口的流动,怎么统计出这些流动人口成为难题。

    榨菜,属于低质易耗品,收入增长对于榨菜的消费几乎没有影响。一般情况下,城市常住人口对于方便面和榨菜等方便食品的消费量,基本上是恒定的。销量的变化,主要由流动人口造成。

    据国家发改委官员的说法,涪陵榨菜这几年在全国各地区销售份额变化,能够反映人口流动趋势,一个被称为“榨菜指数”的宏观经济指标就诞生了。国家发改委规划司官员发现,涪陵榨菜在华南地区销售份额由2007年的49%、2008年的48%、2009年的47.58%、2010年的38.50%下滑到2011年的29.99%。

    这个数据表明,华南地区人口流出速度非常快。他们依据“榨菜指标”,将全国分为人口流入区和人口流出区两部分,针对两个区的不同人口结构,在政策制定上将会有所不同。

    43. 天气账单

    常言道,“天有不测之风云”,遇到过出门旅游、重要户外路演、举办婚礼等重要时刻却被糟糕的天气弄坏心情甚至造成经济损失的情况吗?

    全球第一家气象保险公司“天气账单”能为用户提供各类气候担保。客户登录“天气账单”公司网站,然后给出在某个特定时间段里不希望遇到的温度或雨量范围。“天气账单”网站会在100毫秒内查询出客户指定地区的天气预报,以及美国国家气象局记载的该地区以往30年的天气数据。通过计算分析天气数据,网站会以承保人的身份给出保单的价格。这项服务不仅个人用户需要,一些公司,比如旅行社也很乐意参与。

    一家全球性饮料企业将外部合作伙伴的每日天气预报信息集成,录入其需求和存货规划流程。通过分析特定日子的温度、降水和日照时间等3个数据点,该公司减少了在欧洲一个关键市场的存货量,同时使预测准确度提高了大约5%。

    44. 历史情景再现

    微软和以色列理工学院的研究人员已开发出一款软件,能根据过去20年《纽约时报》的文章以及其他在线数据预测传染病或者其他社会问题可能会于何时何地爆发。

    在利用历史数据进行测试时,该系统的表现十分惊人。例如,根据2006年对安哥拉干旱的报道,该系统预测安哥拉很可能发生霍乱。这是由于,通过此前发生的多起事件,该系统了解到在干旱出现的几年后霍乱爆发的可能性将上升。

    此外,该系统根据对2007年初非洲大型飓风的报道,再次对安哥拉发生霍乱做出预警。而在不到一周之后,报道显示安哥拉确实发生了霍乱。在其他测试,例如对疾病、暴力事件及伤亡人数的预测中,该系统的准确率达到70%至90%。

    该系统的信息来自过去22年中《纽约时报》的报道存档,具体时间为1986年至2007年。不过,该系统也利用了网络上的其他一些数据,了解什么样的事件会带来特定的社会问题。这些信息来源提供了不存在于新闻文章但却有价值的内容,有助于确定不同事件之间的因果关系或前后关系。

    例如,该系统能够推断卢旺达和安哥拉城市之间所发生事件的关系,因为这两个国家都位于非洲,有着类似的GDP,其他一些因素也很相似。根据这种方法,该系统认为,在预测霍乱爆发方面,应当考虑国家或城市的位置,国土面积有多少是水域,人口密度和GDP是多少,以及近几年是否发生过干旱。

    负责此项研发工作的Horvitz表示,近几十年来,世界的许多方面都发生了改变,不过人类的本性和环境的许多方面仍然未变,因此软件可以从以往的数据中了解事情发生的模式,从而预测未来会发生什么。他表示:“对于回溯更久之前的数据,我个人很感兴趣。”

    此类预测工具的市场正在形成。例如,一家名为RecordedFuture的创业公司根据网上的前瞻性报道和其他信息来源预测未来事件,该公司的客户包括政府情报部门。该公司CEOChristopherAhlberg表示,利用“硬数据”来进行预测是可行的,但从原型系统到商用产品还有很长的路要走。

    45. Nike+传感鞋

    耐克凭借一种名为Nike+的新产品变身为大数据营销的创新公司。所谓Nike+,是一种以“Nike跑鞋或腕带+传感器”的产品,只要运动者穿着Nike+的跑鞋运动,iPod就可以存储并显示运动日期,时间、距离、热量消耗值等数据。用户上传数据到耐克社区,就能和同好分享讨论。

    耐克和Facebook达成协议,用户上传的跑步状态会实时更新到账户里,朋友可以评论并点击一个“鼓掌”按钮——神奇的是,这样你在跑步的时候便能够在音乐中听到朋友们的鼓掌声。

    随着跑步者不断上传自己的跑步路线,耐克由此掌握了主要城市里最佳跑步路线的数据库。有了Nike+,耐克组织的城市跑步活动效果更好。参赛者在规定时间内将自己的跑步数据上传,看哪个城市累积的距离长。

    凭借运动者上传的数据,耐克公司已经成功建立了全球最大的运动网上社区,超过500万活跃的用户,每天不停地上传数据,耐克借此与消费者建立前所未有的牢固关系。海量的数据对于耐克了解用户习惯、改进产品、精准投放和精准营销又起到了不可替代的作用。

    46. 沃尔沃的工业互联网

    在沃尔沃集团,通过在卡车产品中安装传感器和嵌入式CPU,从刹车到中央门锁系统等形形色色的车辆使用信息,正源源不断地传输到沃尔沃集团总部。

    “对这些数据进行分析,不仅可以帮助我们制造更好的汽车,还可以帮助客户们获取更好体验。”沃尔沃集团CIORichStrader说。这些数据正在被用来优化生产流程,以提升客户体验和提升安全性。

    将来自不同客户的使用数据进行分析,可以让产品部门提早发现产品潜在的问题,并在这些问题发生之前提前向客户预警。“产品设计方面的缺陷,此前可能需要有50万台销量的时候才能暴露出来,而现在只需要1000台,我们就能发现潜在的缺陷。”

    47. McKesson的动态供应链

    在美国最大的医药贸易商McKesson公司,对大数据的应用也已经远远领先于大多数企业,将先进的分析能力融合到每天处理200万个订单的供应链业务中,并且监督超过80亿美元的存货。

    对于在途存货的管理,McKesson开发了一种供应链模型,它根据产品线、运输费用甚至碳排放量而提供了极为准确的维护成本视图。据公司流程改造副总裁RobertGooby说,这些详细信息使公司能够更加真实地了解任意时间点的运营情况。

    McKesson利用先进分析技术的另一个领域是对配送中心内的物理存货配置进行模拟和自动化处理。评估政策和供应链变化的能力帮助公司增强了对客户的响应能力,同时减少了流动资金。总体来讲,McKesson的供应链转型使公司节省了超过1亿美元的流动资金。

    48. 纸牌屋与电影业

    《纸牌屋》最大的特点在于,与以往电视剧的制作流程不同,这是一部“网络剧”。简而言之,不仅传播渠道是互联网观看,这部剧从诞生之初就是一部根据“大数据”,即互联网观众欣赏口味来设计的产品。

    Netflix成功之处在于其强大的推荐系统Cinematch,该系统基于用户视频点播的基础数据如评分、播放、快进、时间、地点、终端等,储存在数据库后通过数据分析,计算出用户可能喜爱的影片,并为他提供定制化的推荐。为此他们开设了年Netflix大奖(点击查看获奖算法),用百万美元悬赏,奖励能够将其电影推荐算法准确性提高至少10%的人。

    未来的电影制作成本将大幅降低,一千粉丝足以使电影成功。还是像《技术元素》里说:“目光聚集的地方,金钱必将追随。”

    49. 点评与餐饮业

    美国很多州政府在与餐饮点评网lep展开合作,监督餐饮行业的卫生情况,效果非常好。人们不再像以前那样从窗口去看餐馆里的情况,而是从手机APP里的评论!在中国的本地化O2O点评比如大众点评、番茄点等等,消费者可以对任何商家进行评判,同时商家也可以通过这些评判来提升自己的服务能力,在环节上进行更大力度的效率优化。

    未来的餐饮行业将会由互联网和社会化媒体上所产生和承载的数据彻底带动起来,会有越来越多的人加入点评中,餐馆优胜劣汰的速度将会大幅加快。

    联互通社区


    互联互通社区专注于IT互联网交流与学习,关注公众号:互联互通社区,每日获取最新报告并附带专题内容辅助学习。方案打造与宣讲、架构设计与执行、技术攻坚与培训、数据中台等技术咨询与服务合作请+微信:hulianhutongshequ

    展开全文
  • 前面 看到这个项目的同好们如果有推荐的 Github 项目或是觉得有用、有趣的网站等都可以发起 issue 或 PR。 友情链接: ruanyf / weekly GrowingGit / GitHub-Chinese-Top-Charts 有趣项目 chrislgarry / ...

    写在前面

    看到这个项目的同好们如果有推荐的 Github 项目或是觉得有用、有趣的网站等都可以发起 issue 或 PR。

    友情链接:

    有趣项目

    chrislgarry / Apollo-11

    阿波罗 11 号。

    YunYouJun / air-conditioner

    ❄️ 云空调,便携小空调,为你的夏日带去清凉!
    网站: https://ac.yunyoujun.cn/
    类似网站: https://fan.elpsy.cn/

    VincentSit / ChinaMobilePhoneNumberRegex

    一组匹配中国大陆手机号码的正则表达式。

    houshanren / hangzhou_house_knowledge

    2017年买房经历总结出来的买房购房知识分享给大家,希望对大家有所帮助。买房不易,且买且珍惜。

    komeiji-satori / Dress

    好耶 是女装。

    Aniket965 / Hello-world

    搜集所有的编程语言如何打印 “Hello World”。

    cmiscm / leonsans

    代码生成的字体。
    网站: https://leon-kim.com/examples/

    shimohq / chinese-programmer-wrong-pronunciation

    中国程序员容易发音错误的单词。

    kelseyhightower / nocode

    写出最安全和可靠的应用的方法:啥也不写,哪也不部署。

    danistefanovic / build-your-own-x

    🤓 Build your own (insert technology here)

    声音地图

    该网站将不同情绪对应的声音,画成一幅地图。鼠标移到每个点上,都会听到声音,比如包含了 50% 的敬爱、33% 的同情、17% 满意的声音。

    地球时间线

    网页展示地球演化的 46 亿年。

    低地轨道可视化

    这个可视化作品,可以让大家感受一下地球低轨道太空的实际状态,看看有多少太空垃圾。

    airpano

    超高清 360° 全景航拍。

    宇宙模型

    一个浏览器的 3D 显示实验项目,在网页上展示 10 万颗恒星,讲解宇宙知识。

    EmailFuture

    给未来的自己或他人写信。
    同类产品:FutureMe

    City Walks

    City Walks 是一款真「云逛街」产品,它通过视频的方式,让你足不出户,就能在雅典、阿姆斯特丹、罗马、里斯本、耶路撒冷、上海、重庆、里约热内卢等 37 个城市的街头闲逛,俗称云逛街。

    Little Big City

    Little Big City 是一款非常有趣的在线 3D 城市模拟生成器。网站目前提供了球体和立体地图两种形式,只需在右下角输入某一地区的经纬度信息,Little Big City 就会根据真实的地图数据,生成与城市环境对应的立体地图。

    Drive & Listen

    Drive & Listen 是一款给电脑前的同学们纯欣赏使用的小服务,它提供了 49 个城市的开车视频与当地电台,让你可以体验一边听着当地的收音机,一边开车在城市里转悠。

    In Pieces

    In Pieces 是一个公益网站,它们希望通过这样的方式来呼吁人们更多的关注这些濒临灭绝的动物们。网页利用了 HTML5 绘制了许多珍惜的濒危动物。这些动物均由 CSS 小片组织而成,色彩搭配非常惊艳。

    Silk

    Silk 是一个对称绘画的网站。笔触非常独特,它会自动进行对称绘图,即使你没有任何绘画基础,也可以在这里画出非常好看的图形。在网页的设置中,还可以调整增加对称轴的数量、调整颜色、是否中心对称等,可以绘制出非常华丽的图形。
    类似网站: https://www.aliciaunderhill.xyz/Andala/

    This x Does Not Exist

    这个___不存在。

    需要我帮你百度 一下吗

    怒怼伸手党。

    SaekiRaku / vscode-rainbow-fart

    一个在你编程时疯狂称赞你的 VSCode 扩展插件。
    网站: https://saekiraku.github.io/vscode-rainbow-fart/

    KYDronePilot / SpaceEye

    将地球的卫星照片当作 Windows、macOS 桌面壁纸的小工具。
    网站: https://spaceeye.app/

    Kaiyiwing / qwerty-learner

    为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件。
    网站: https://qwerty.kaiyi.cool/

    Fluid Paint

    一个网页画板工具,可以定制笔刷,产生刷油漆的流体效果,非常精美。

    cuiliang / ClickShow

    在鼠标点击左键、右键或者中键时,显示类似波纹的效果。

    数据库

    中国语言资源保护工程采录展示平台

    中国语言资源采录展示平台是中国语言资源保护工程的重要组成部分。主要任务是保存和管理大规模汉语方言和少数民族语言调查点采集的珍贵多媒体数据,利用科学化、规范化和具有前瞻性的技术手段,完成所有语言资源的数字化、存储管理、整理分析和应用展示等方面的工作。

    应用程序启动画面库

    这个仓库收集各种程序各个版本的开机画面。

    How Music Taste Evolved

    这个网站提供 1958 - 2016 每年美国最流行的五首歌曲,可以在线试听片段,了解美国大众音乐口味的变化。

    chinese-poetry / chinese-poetry

    最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近 5.5 万首唐诗加 26 万宋诗. 两宋时期 1564 位词人,21050 首词。

    水果证件照

    Python 爬虫保存美国农业部网站的水果数据库。

    Windy

    气象观测网站。

    类似网站: https://www.ventusky.com/

    Animated Knots

    绳结打法数据库。

    Artvee

    该网站收集古典艺术品的照片和海报,都可以免费下载使用。

    Etymology

    汉字字形汇总,一个老外(汉字叔叔) 20 多年的杰作,让人肃然起敬。
    B 站:https://space.bilibili.com/697174669

    故宫博物院藏品总目

    故宫博物院官方的藏品目录,共收入 180 多万件,可以在线搜索,部分藏品带有彩色照片和文字介绍。

    纪妖

    中国妖怪百集,网站包括但不仅限于妖、怪、神、鬼、精、魔、仙等怪力乱神,甚至还包括一些神奇的植物。知妖是一个开放的在线“妖怪”资料库。致力于收集、整理、介绍、分享古人文献中的“妖怪”。

    中国古籍保护网

    中国古籍保护网。
    古籍网站:https://new.shuge.org/

    十年前

    这个网站可以查看,十年前的同一天,美国的十几个著名网站是什么样子。

    iptv-org / iptv

    网络直播源。

    PaperSizes

    这个网站收集各种纸张的规格,按照行业和国别分类,总计有几百种之多。

    Can You Run It

    Can I Run It 是一个帮你测试电脑性能的网站,它的游戏数据库中拥有超过 8500 款游戏,只需要选择你想要玩的游戏,下载一个小程序,几秒钟后就会告诉你:你的电脑能运行它吗。

    工具

    GitSquared / edex-ui

    跨平台全屏科幻效果终端工具。

    svenstaro / genact

    摸鱼神器,无意义任务命令行生成。
    网站: https://svenstaro.github.io/genact/

    Jannchie / Historical-ranking-data-visualization-based-on-d3.js

    这是一个数据可视化项目,能够将历史数据排名转化为动态柱状图图表。

    FabDevGit / barchartrace

    在线生成条形竞赛图动画。
    网站: https://fabdevgit.github.io/barchartrace/
    网站: https://app.flourish.studio/

    Datawrapper

    著名的数据可视化生成工具,只要在网页上提交数据,经过几步配置,就能生成杂志级的可视化图表。

    leon-ai / leon

    Leon is your open-source personal assistant.

    menzi11 / BullshitGenerator

    狗屁不通文章生成器。
    网站: https://suulnnka.github.io/BullshitGenerator/index.html

    3b1b / manim

    数学动画引擎。

    SkalskiP / make-sense

    对图片添加标签的在线工具。
    网站: https://makesense.ai

    nondanee / UnblockNeteaseMusic

    解锁网易云音乐客户端变灰歌曲。

    monicahq / monica

    私人客户关系管理(CRM)。记住你的朋友、家人、商务关系。
    网站: https://www.monicahq.com/

    flexifont

    生成自己创建的手写字体。

    世界各国虚拟身份生成

    世界各国虚拟身份信息、地址、信用卡生成。

    holynova / gushi_namer

    古诗文起名古诗文起名。
    网站: http://xiaosang.net/gushi_namer/

    AI声音合成

    AI声音合成。

    Github 相关

    pomber / git-history

    GitHub 提交历史。
    网站: https://githistory.xyz/

    GitHub Skyline

    GitHub 官方出品,将你过去一年的提交统计转成一个三维的直方图,并且提供 stl 文件下载,进行 3D 打印。

    OssArt

    打印你的 GitHub Activity 贡献图,最长 12 年。

    tipsy / profile-summary-for-github

    可视化 GitHub 个人信息。
    网站: https://profile-summary-for-github.com/user/TommyMerlin

    anuraghazra / github-readme-stats

    在你的 README 中获取动态生成的 GitHub 统计信息!
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QDTaaZKe-1652860769910)(https://github-readme-stats.vercel.app/api?username=TommyMerlin&theme=vue)]

    gelstudios / gitfiti

    随意更改 commit 历史。

    carloscuesta / gitmoji

    在 commit 信息中添加 emoji。😜
    网站: https://gitmoji.carloscuesta.me/

    GitHub Card

    生成 GitHub 仓库预览图。

    antonkomarev / github-profile-views-counter

    统计你的 GitHub 个人主页被访问的次数。
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NltBgQfR-1652860769911)(https://komarev.com/ghpvc/?username=TommyMerlin)]

    游戏

    在线万花尺绘制器

    在线万花尺绘制工具。

    JustArchiNET / ArchiSteamFarm

    Steam挂卡。

    rwv / chinese-dos-games

    🎮 中文 DOS 游戏。
    类似网站: https://talks.dos.zone/t/collections/44653

    ornicar / lila

    国际象棋。

    Brick Block

    一个浏览器小游戏,使用砖块随心所欲建造大楼,只支持桌面浏览器。

    TownScaper

    一个休闲小游戏,只要随意点击,就能生成不可思议的美丽建筑物。

    其他

    emojimix

    混合两个 emoji 然后生成一个新的 emoji。

    Emoji to Scale

    这个网站选出一组 Emoji 符号,按照体积从小到大的顺序排列,可以滚动浏览。

    Ambient Chaos

    一个网页的背景音生成器,提供20多种声音,比如风声、雨声、火车站、教堂钟声等。每种都可以调节音量,还可以选择声音进行合成。


    机器学习

    学习资料

    apachecn / AiLearning

    AiLearning: 机器学习 - MachineLearning - ML、深度学习 - DeepLearning - DL、自然语言处理 NLP。
    网站: http://ailearning.apachecn.org

    scutan90 / DeepLearning-500-questions

    深度学习500问,以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述。

    GokuMohandas / practicalAI

    A practical approach to machine learning.

    roboticcam/machine-learning-notes

    不间断更新机器学习,概率模型和深度学习的讲义(1000+页)和视频链接。

    afshinea / stanford-cs-229-machine-learning

    VIP cheatsheets for Stanford’s CS 229 Machine Learning.
    网站: https://stanford.edu/~shervine/teaching/cs-229

    fengdu78 / deeplearning_ai_books

    deeplearning.ai(吴恩达老师的深度学习课程笔记及资源)。

    fengdu78 / Coursera-ML-AndrewNg-Notes

    吴恩达老师的机器学习课程个人笔记。

    microsoft / ai-edu

    AI education materials for Chinese students, teachers and IT professionals.

    firmai / industry-machine-learning

    机器学习在工业上的应用实例。

    书籍资源

    datawhalechina / pumpkin-book

    《机器学习》(西瓜书)公式推导解析,在线阅读地址:https://datawhalechina.github.io/pumpkin-book

    zergtant / pytorch-handbook

    pytorch handbook 是一本开源的书籍,目标是帮助那些希望和使用 PyTorch 进行深度学习开发和研究的朋友快速入门,其中包含的 Pytorch 教程全部通过测试保证可以成功运行。

    fengdu78 / lihang-code

    《统计学习方法》的代码实现。

    d2l-ai / d2l-zh

    《动手学深度学习》:面向中文读者、能运行、可讨论。英文版即伯克利“深度学习导论(STAT 157)”教材。
    视频:https://space.bilibili.com/209599371/channel/detail?cid=23541
    PDF: https://github.com/TommyMerlin/Repository-Collection/tree/master/files

    MLEveryday / 100-Days-Of-ML-Code

    100-Days-Of-ML-Code中文版。

    工具

    streamlit / streamlit

    一个机器学习工具,可以一边写脚本,一边自动生成模型的可视化运行结果。还可以生成网页控件,手动拖拉查看模型变化。
    网站: https://streamlit.io/

    fastnlp / fitlog

    fitlog 是一款在深度学习训练中用于辅助用户记录日志和管理代码的工具。
    网站: https://fitlog.readthedocs.io/zh/latest/

    开源项目

    microsoft / computervision-recipes

    计算机视觉系统最佳实践,包含各种 CV 示例项目。示例使用 PytTorch 深度学习库+ Jupyter 文件,涵盖:图像分类、相似、识别、追踪等方面。

    数据集

    awesomedata / awesome-public-datasets

    数据集汇总。

    datasetsearch

    谷歌-数据集搜索。

    Charmve / Surface-Defect-Detection

    表面缺陷检测数据集。


    Python

    学习资源

    jackfrued / Python-100-Days

    Python - 100天从新手到大师。

    TheAlgorithms / Python

    算法的 Python 实现。All Algorithms implemented in Python.

    vinta / awesome-python

    A curated list of awesome Python frameworks, libraries, software and resources.
    网站: https://awesome-python.com/

    fluentpython / example-code

    《流畅的Python》书中代码。Example code for the book Fluent Python.

    leisurelicht / wtfpython-cn

    wtfpython 的中文翻译。

    qxf2 / wtfiswronghere

    新手常犯的Python错误。

    rougier / matplotlib-cheatsheet

    Matplotlib 3.1 cheat sheet. From an upcoming book on matplotlib.

    abhat222 / Data-Science–Cheat-Sheet

    Data-Science–Cheat-Sheet.

    gto76 / python-cheatsheet

    Comprehensive Python Cheatsheet.

    第三方库/开源项目

    fxsjy / jieba

    结巴中文分词。

    lancopku / pkuseg-python

    pkuseg 多领域中文分词工具。

    fighting41love / funNLP

    中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配

    amueller / word_cloud

    词云生成。A little word cloud generator in Python.
    网站: https://amueller.github.io/word_cloud
    类似网站: https://wordart.com/

    jakevdp / PythonDataScienceHandbook

    Python 数据处理。Python Data Science Handbook: full text in Jupyter Notebooks.

    xchaoinfo / fuck-login

    模拟登录一些知名的网站,为了方便爬取需要登录的网站。

    bokeh / bokeh

    浏览器交互式数据可视化工具。
    网站: https://bokeh.org/

    rsalmei / alive-progress

    Python 炫酷进度条项目。


    Java

    资源汇总

    Snailclimb / JavaGuide

    【Java 学习+面试指南】 一份涵盖大部分Java程序员所需要掌握的核心知识。
    网站: https://gitee.com/SnailClimb/JavaGuide

    doocs / advanced-java

    😮 互联网 Java 工程师进阶知识完全扫盲:涵盖高并发、分布式、高可用、微服务、海量数据处理等领域知识,后端同学必看,前端同学也可学习。
    网站: https://doocs.github.io/advanced-java

    xingshaocheng / architect-awesome

    后端架构师技术图谱。
    网站: https://docs.justauth.whnb.wang/

    aalansehaiyang / technology-talk

    汇总 java 生态圈常用技术框架、开源中间件,系统架构、数据库、大公司架构案例、常用三方类库、项目管理、线上问题排查、个人成长、思考等知识。

    AobingJava / JavaFamily

    【互联网一线大厂面试+学习指南】进阶知识完全扫盲:涵盖高并发、分布式、高可用、微服务等领域知识。

    ZhongFuCheng3y / 3y

    📓从 Java 基础、JavaWeb 基础到常用的框架再到面试题都有完整的教程,几乎涵盖了Java后端必备的知识点。

    Java基础

    crossoverJie / JCSprout

    👨‍🎓 Java Core Sprout : basic, concurrent, algorithm.
    网站: https://crossoverjie.top/JCSprout

    wuyouzhuguli / SpringAll

    循序渐进,学习 Spring Boot、Spring Boot & Shiro、Spring Cloud、Spring Security & Spring Security OAuth2,博客 Spring 系列源码。

    hollischuang / toBeTopJavaer

    To Be Top Javaer - Java工程师成神之路。
    网站: http://hollischuang.gitee.io/tobetopjavaer/#/

    iluwatar / java-design-patterns

    Design patterns implemented in Java.
    网站: https://java-design-patterns.com/

    TheAlgorithms / Java

    All Algorithms implemented in Java.

    huangz1990 / redis

    《Redis Command Reference》全文的中文翻译版。
    网站: http://RedisDoc.com

    Spring Boot

    xkcoding / spring-boot-demo

    spring boot demo 是一个用来深度学习并实战 spring boot 的项目,目前总共包含 65 个集成demo,已经完成 53 个。 该项目已成功集成 actuator(监控)、admin(可视化监控)、logback(日志)、aopLog(通过AOP记录web请求日志)、统一异常处理(json级别和页面级别)、freemarker(模板引擎)、thymeleaf(模板引擎)、Beetl(模板引擎)、Enjoy(模板引擎)、JdbcTemplate(通用JDBC操作数据库)、JPA(强大的ORM框架)、mybatis(强大的ORM框架)、通用Mapper(快速操作Mybatis)、PageHelper(通用的Mybatis分页插件)…

    lihengming / spring-boot-api-project-seed

    🌱🚀一个基于Spring Boot & MyBatis的种子项目,用于快速构建中小型API、RESTful API项目~

    ityouknow / spring-boot-examples

    Spring Boot 教程、技术栈示例代码,快速简单上手教程。
    网站: http://www.ityouknow.com/spring-boot.html

    hansonwang99 / Spring-Boot-In-Action

    Spring Boot 系列实战合集。
    网站: https://www.codesheep.cn/

    Spring Cloud

    keets2012 / microservice-integration

    整合的项目包括网关、auth 权限服务和 backend 服务。提供了一套微服务架构下,网关服务路由、鉴权和授权认证的项目案例。

    sqshq / piggymetrics

    Microservice Architecture with Spring Boot, Spring Cloud and Docker.

    dyc87112 / SpringCloud-Learning

    Spring Cloud 基础教程。
    网站: http://blog.didispace.com/

    相关工具

    alibaba / druid

    阿里巴巴数据库事业部出品,为监控而生的数据库连接池。

    alibaba / p3c

    Alibaba Java Coding Guidelines pmd implements and IDE plugin.

    looly / hutool

    A set of tools that keep Java sweet.
    网站: http://www.hutool.cn/

    alibaba / easyexcel

    快速、简单避免 OOM 的 java 处理 Excel 工具。
    网站: https://www.yuque.com/easyexcel/doc/easyexcel

    jhy / jsoup

    Java HTML 解析器。
    网站: https://github.com/jhy/jsoup

    binarywang / java-testdata-generator

    Java 测试数据生成,包括姓名、身份证号、地址、邮箱、电话号。
    类似工具: https://github.com/HannnnXiao/javafaker

    开源项目

    qiurunze123 / miaosha

    ⭐⭐⭐⭐秒杀系统设计与实现.互联网工程师进阶与分析🙋🐓

    macrozheng / mall

    mall 项目是一套电商系统,包括前台商城系统及后台管理系统,基于 SpringBoot+MyBatis 实现,采用 Docker 容器化部署。 前台商城系统包含首页门户、商品推荐、商品搜索、商品展示、购物车、订单流程、会员中心、客户服务、帮助中心等模块。 后台管理系统包含商品管理、订单管理、会员管理、促销管理、运营管理、内容管理、统计报表、财务管理、权限管理、设置等模块。
    网站: http://www.macrozheng.com/admin/

    lenve / vhr

    微人事是一个前后端分离的人力资源管理系统,项目采用 SpringBoot+Vue 开发。

    lenve / VBlog

    V部落,Vue+SpringBoot 实现的多用户博客管理平台!

    justauth / JustAuth

    💯 史上最全的整合第三方登录的开源库。目前已支持 Github、Gitee、微博、钉钉、百度、Coding、腾讯云开发者平台、OSChina、支付宝、QQ、微信、淘宝、Google、Facebook、抖音、领英、小米、微软、今日头条、Teambition、StackOverflow、Pinterest、人人、华为、企业微信、酷家乐、Gitlab、美团、饿了么和推特等第三方平台的授权登录。 Login, so easy!
    网站: https://docs.justauth.whnb.wang/


    C++

    学习资源

    Light-City / CPlusPlusThings

    C++那些事。
    网站: https://light-city.club/sc/

    applenob / Cpp_Primer_Practice

    搞定C++👊。C++ Primer 中文版第5版学习仓库,包括笔记和课后练习答案。

    changkun / modern-cpp-tutorial

    📚 Modern C++ Tutorial。
    网站: https://changkun.de/modern-cpp/

    开源项目

    google / googletest

    Google 测试和模拟框架。

    clangen / musikcube

    一个使用C ++编写的跨平台,运行于终端上的音乐播放器。
    网站: https://musikcube.com/

    fffaraz / awesome-cpp

    Awesome C++。

    google / googletest

    谷歌 Testing 和 Mocking 框架。

    PointCloudLibrary / pcl

    点云库。
    网站: https://pointclouds.org/


    C# DOTNET

    TheAlgorithms / C-Sharp

    算法的 C# 实现。

    Live-Charts / Live-Charts

    .NET 下简单、灵活、可交互的图表。

    0xd4d / dnSpy

    .NET 调试和编译器。

    shimat / opencvsharp

    .NET 框架下的OpenCV。

    dathlin / HslCommunication

    工业物联网基础架构框架,专注于基础技术通信和跨平台、跨语言通信功能,实现多种主流 PLC 数据读写。
    网站: http://www.hslcommunication.cn

    quozd / awesome-dotnet

    .NET 库、工具、框架、软件合集。

    microsoft / dotnet

    .NET 官方仓库。

    yuzhengyang / Fork

    C# 工具包,C# 工具类,常用方法,系统 API,文件处理、加密解密、Winform 美化(C# Tools)。

    Jimmey-Jiang / Common.Utility

    比较全面的 C# 帮助类,各种功能性代码。


    WPF

    MaterialDesignInXAML / MaterialDesignInXamlToolkit

    Google’s Material Design in XAML & WPF, for C# & VB.Net.
    网站: http://materialdesigninxaml.net/

    MahApps / MahApps.Metro

    允许开发人员以最小的代价为自己的 WPF 应用程序拼凑一个 Metro 或 Modern 的 UI。
    网站: https://mahapps.com

    firstfloorsoftware / mui

    WPF Modern UI。

    xceedsoftware / wpftoolkit

    WPF 控件。

    microsoft / WPF-Samples

    WPF 相关实例仓库。

    Panuon / PanuonUI

    一个好看精致、开源无限制使用的 WPF 控件库。

    Panuon / PanuonUI.Silver

    Panuon.UI optimized version. A beautiful wpf ui library using templates & attached properties.

    kwonganding / wpf.controls

    在学习中和使用 WPF 中,学习、借鉴了很多网友的文章和开源的项目的知识。发现提供实际项目开发需要的基础控件、样式的文章大都比较散,不成系列。因此基于现在项目中使用开发了一个 WPF 基础 UI 库。


    大学课程资源

    USTC-Resource / USTC-Course

    中国科学技术大学课程资源。
    网站: https://ustc-resource.github.io/USTC-Course

    PKUanonym / REKCARC-TSC-UHT

    清华大学计算机系课程攻略。

    lib-pku / libpku

    北京大学课程资料。
    网站: https://lib-pku.github.io/

    QSCTech / zju-icicles

    浙江大学课程攻略共享计划。
    网站: https://qsctech.github.io/zju-icicles/

    study-is-wonderful

    本项目主要面向汉语人群,收集了一些比较好的公开课资源。
    网站: https://qsctech.github.io/zju-icicles/

    TheNetAdmin / zjuthesis

    浙江大学毕业论文 Latex 模板。


    前端/博客

    学习资源

    qianguyihao / Web

    前端入门和进阶学习笔记,超详细的Web前端学习图文教程。

    helloqingfeng / Awsome-Front-End-learning-resource

    GitHub最全的前端资源汇总仓库(包括前端学习、开发资源、求职面试等)。

    kamranahmedse / developer-roadmap

    Web 开发路线图(2020)。
    网站: https://roadmap.sh/

    CavsZhouyou / Front-End-Interview-Notebook

    🐜前端面试复习笔记。

    lydiahallie / javascript-questions

    JavaScript 相关问题及解答合集。✨

    airbnb / javascript

    JavaScript Style Guide

    elsewhencode / project-guidelines

    JavaScript 项目最佳实践合集。

    前端工具

    pandao / editor.md

    开源可嵌入的在线Markdown编辑器(模块)。
    网站: http://editor.md.ipandao.com/

    tabler / tabler-icons

    450个免费的 MIT 许可的高质量 svg 图标。

    Binaryify / NeteaseCloudMusicApi

    网易云音乐 Node.js API service
    网站: https://binaryify.github.io/NeteaseCloudMusicApi

    博客框架

    theme-next / hexo-theme-next

    Hexo主题。

    docsifyjs / docsify

    🃏 文档网页生成器。
    网站: https://docsify.js.org/

    vuejs / vuepress

    📝 极简 Vue 驱动的静态网页生成器。
    网站: https://vuepress.vuejs.org/

    开源项目

    PanJiaChen / vue-element-admin

    🎉 Vue 管理系统。
    网站: https://panjiachen.github.io/vue-element-admin

    PanJiaChen / vue-admin-template

    Vue2.0 最小化管理系统模板。
    网站: https://git.io/fAnuM

    renrenio / renren-fast-vue

    renren-fast-vue基于vue、element-ui构建开发,实现renren-fast后台管理前端功能,提供一套更优的前端解决方案。
    网站: http://fast.demo.renren.io/

    iview / iview-admin

    基于 iView 的 Vue 2.0 管理系统模板。
    网站: https://admin.iviewui.com/

    electron / electron

    :electron: 基于 Javascript、HTML 和 CSS 构件跨平台的桌面应用。
    网站: https://electronjs.org/

    opendigg / awesome-github-vue

    Vue相关开源项目库汇总。
    网站: http://www.opendigg.com/tags/front-vue

    sentsin / layui

    采用自身模块规范编写的前端 UI 框架,遵循原生 HTML/CSS/JS 的书写形式,极低门槛,拿来即用。
    网站: https://www.layui.com/

    bradtraversy / vanillawebprojects

    仅靠 HTML5, CSS 和 JavaScript 构建的微型项目。

    前端库

    beizhedenglong / rough-charts

    手绘风格的 React 图表库。
    网站: https://beizhedenglong.github.io/rough-charts/?path=/docs/roughcharts--page

    leeoniya / uPlot

    📈 A small, fast chart for time series, lines, areas, ohlc & bars.
    一个 JS 的网页小型图表库,用于快速渲染超大型数据集,系统资源占用少。

    transloadit / uppy

    一个文件上传的 JS 库。
    网站: https://uppy.io/

    timqian / chart.xkcd

    一个 XKCD 漫画风格的网页图表库。
    网站: https://timqian.com/chart.xkcd/

    前端开发精选工具库

    收集前端开发各方面的工具。

    multiavatar / Multiavatar

    生成人物头像的 JS 库。支持随机生成一个好看、独特、多文化的头像。
    网站: https://multiavatar.com/

    nhn / tui.image-editor

    功能齐全的图片编辑器。支持图片剪裁、旋转、涂鸦等功能,实现了 Vue 和 React 封装的组件。
    网站: http://ui.toast.com/tui-image-editor

    naptha / tesseract.js

    支持多种语言的文字识别的 JS 库,能够方便、准确的把图片中的文字解析提取出来(可复制)。
    网站: http://tesseract.projectnaptha.com/

    CSS

    necolas / normalize.css

    A modern alternative to CSS resets.
    网站: http://necolas.github.io/normalize.css/

    l-hammer / You-need-to-know-css

    Web开发者应该掌握的 CSS tricks。
    网站: https://lhammer.cn/You-need-to-know-css/#/zh-cn/

    chokcoco / CSS-Inspiration

    CSS Inspiration,在这里找到写 CSS 的灵感!
    网站: https://chokcoco.github.io/CSS-Inspiration/

    QiShaoXuan / css_tricks

    一些 CSS 常用样式。
    网站: https://qishaoxuan.github.io/css_tricks/

    tobiasahlin / SpinKit

    CSS 写的加载动画合集。
    网站: http://tobiasahlin.com/spinkit/

    animista

    一些 CSS 实现的动画效果。

    kognise / water.css

    一个专门为简单页面和示例网页准备的 CSS 框架。
    网站: https://watercss.kognise.dev/

    flukeout / css-diner

    通过游戏方式在线学习 CSS 选择器知识。
    网站: https://flukeout.github.io/


    资源汇总

    sindresorhus / awesome

    许多有趣主题 Awesome 合集。

    dipakkr / A-to-Z-Resources-for-Students

    大学生实用资源合集。

    LisaDziuba / Awesome-Design-Tools

    最好的设计工具。

    TonnyL / Awesome_APIs

    API 合集。

    public-apis / public-apis

    免费 API 合集。

    matiassingers / awesome-readme

    Awesome READMEs 合集.

    ryanoasis / nerd-fonts

    图标、字体集合。🔡

    justjavac / awesome-wechat-weapp

    微信小程序开发资源汇总 💯

    521xueweihan / HelloGitHub

    分享 GitHub 上有趣、入门级的开源项目。
    网站: https://hellogithub.com/

    kon9chunkit / GitHub-Chinese-Top-Charts

    🇨🇳 GitHub 中文排行榜,帮助你发现高分优秀中文项目、更高效地吸收国人的优秀经验成果;榜单每周更新一次,敬请关注!

    ruanyf / weekly

    科技爱好者周刊,每周五发布。

    niezhiyang / open_source_team

    国内顶尖团队的开源地址。


    CS相关

    CyC2018 / CS-Notes

    📚 技术面试必备基础知识、Leetcode 题解、Java、C++、Python、后端面试、操作系统、计算机网络、系统设计。

    halfrost / LeetCode-Go

    LeetCode 题解。
    网站: https://books.halfrost.com/leetcode/

    LeetCode-Go

    Leetcode 算法刷题笔记。
    网站: https://books.halfrost.com/leetcode/

    prakhar1989 / awesome-courses

    📚 大学CS课程。

    EbookFoundation / free-programming-books

    📚 编程相关书籍。

    justjavac / free-programming-books-zh_CN

    📚 免费的计算机编程类中文书籍

    ruanyf / free-books

    互联网上的免费书籍。

    geeeeeeeeek / git-recipes

    🥡 高质量的 Git 中文教程。

    github / gitignore

    有用的 .gitignore 模板合集。

    ziishaned / learn-regex

    学习正则表达式。Learn regex the easy way.

    相关网站: https://regex101.com/

    相关网站: https://regex-vis.com/

    相关网站: https://jex.im/regulex/#!flags=&re=^(a|b)*%3F%24

    Lellansin / Cipher-examples

    常见加密算法。

    tuteng / Best-websites-a-programmer-should-visit-zh

    程序员应该访问的最佳网站中文版。

    设计模式

    该网站为中文教程,使用通俗的语言,介绍各种设计模式,图文并茂。此外,还有代码重构方面的英语内容。

    Visu Algo

    该网站有各种常用算法的可视化演示。

    endoflife.date

    这个网站列出了几乎所有主流项目的生命周期列表,可以快速查询哪些版本还在支持,哪些版本已经过期。


    工具

    开发工具

    repl.it

    在线编程语言环境平台,可以在浏览器里面自动加载并运行各种 GitHub 仓库。这里有一个 C++ 写的命令行扫雷游戏,直接在浏览器运行。

    Gitpod

    浏览器里面的 IDE 编辑环境,一键加载 GitHub 仓库,内部使用的是 VSCode Web 版。

    conwnet / github1s

    通过 VS Code 在线快速阅读 GitHub 项目代码。

    docker-slim / docker-slim

    一个 Docker 镜像文件的瘦身工具,据称最好情况下,可以让镜像文件体积缩小为原来的30分之一。
    网站: https://dockersl.im/

    i18ns.com

    一个制作国际化应用的利器。该网站收集各种语言包,你输入中文,它返回各种语言包对这个词的翻译。

    endpoints.dev

    该网站向每个用户提供一个独特的 API 终点(endpoint),用于接受 HTTP 请求。用户发来的所有请求,都可以在该网站实时显示,用于调试和记录。

    slatedocs / slate

    API 文档的静态站点生成器。
    网站: https://slatedocs.github.io/slate/#introduction

    star7th / showdoc

    ShowDoc is a tool greatly applicable for an IT team to share documents online一个非常适合IT团队的在线API文档、技术文档工具。
    网站: https://www.showdoc.cc/

    萧明 / knife4j

    knife4j 是为 Java MVC 框架集成 Swagger 生成 Api 文档的工具,前身是 swagger-bootstrap-ui。
    网站: https://doc.xiaominfo.com/knife4j/documentation/

    smart-doc-team / smart-doc

    smart-doc 是一款同时支持 java restful api 和 apache dubbo rpc 接口文档生成的工具。完全基于注释生成文档,做到零侵入。
    网站:

    mockoon / mockoon

    Mockoon 是在本地运行 mock api 最简单、最快的方法。无需远程部署,无需帐户,开源。

    voidcosmos / npkill

    查找列出系统中的 node_modules 文件及文件大小,可选择删除。
    网站: https://npkill.js.org/

    测试数据生成 API

    RandomUser

    生成随机的用户数据。
    API示例: https://randomuser.me/api/?gender=female

    Bacon Ipsum

    lorem ipsum 生成器。
    API示例: https://baconipsum.com/api/?type=meat-and-filler

    FakerAPI

    假数据生成合集。
    API示例: https://fakerapi.it/api/v1/addresses?_quantity=1

    客户端工具

    plotly / falcon

    免费开源的 SQL 客户端。
    网站: https://plot.ly/free-sql-client-download/

    soimort / you-get

    下载器。

    ytdl-org / youtube-dl

    命令行视频下载工具。
    网站: http://ytdl-org.github.io/youtube-dl/

    lazydocker

    命令行管理 Docker 服务的一个图形界面工具。

    cuiocean / ZY-Player

    ▶️ 跨平台桌面端视频资源播放器.简洁无广告.免费高颜值. 🎞
    网站: http://zyplayer.fun/

    Micro

    一个命令行的文本编辑器,有窗格和便签,系统资源占用少,支持 Linux 和 Windows 系统。

    CopyTranslator / CopyTranslator

    翻译小工具。
    类似工具:https://github.com/ravenxrz/RubberTranslator

    pavlobu / deskreen

    将电脑屏幕共享到浏览器中,做第二块屏幕。
    网站: http://deskreen.com/

    Albert-W / Folder-locker

    一个小巧的文件上锁软件,没有压缩和加密过程,方便快捷。

    torchgm / RoundedTB

    分段显示 Windows 11 任务栏,让它像 Mac。

    hiroi-sora

    批量对本地图片文件进行离线OCR文字识别。

    查询

    WhoisXML API

    该网站提供各种网络信息查询,比如 IP 地理地址、Whois、DNS 等。

    anvaka / vs

    输入一个产品的名字,该工具会根据谷歌的自动搜索提示,生成一张图,上面是经常与该产品进行对比的其他产品。
    网站: https://anvaka.github.io/vs/

    符号清单

    常用符号的 Unicode 码点、HTML 代码和 HTML 实体写法。
    网站: https://unicode-table.com/
    网站: https://blog.csdn.net/wy_97/article/details/77749405

    重定向侦测

    该网站用来查看某个网址的重定向(redirect)情况。

    CheatSheet 汇总

    这个网站收集各种软件的 Cheat Sheet(常用操作表)。
    同类网站: http://www.cheat-sheets.org/

    Country Flags API

    国旗图标。

    世界银行

    世界银行统计数据。

    hao.199it

    数据查询。

    emojipedia

    查询各个平台的 Emoji 的高清图片

    Your First GitHub Commit

    这个网站可以找出你的第一个 GitHub 提交。

    variflight

    全球航班飞行轨迹实时跟踪雷达。

    一证通查

    工信部推出的官方服务,查看个人名下登记了多少张电话卡。

    thunlp / WantWords

    万词王。反向词典,返回语义匹配查询描述的词。

    在线工具

    hakimel / reveal.js

    HTML Presentation 框架。

    pearmini / gossip

    一个高效创建和演示炫酷幻灯片的用户界面!
    网站: https://pearmini.gitee.io/gossip/

    slidevjs / slidev

    使用 Markdown 格式编写 PPT 幻灯片。
    网站: https://cn.sli.dev/

    ksky521 / nodeppt

    将 Markdown 文档转成幻灯片,在浏览器演示的工具。
    网站: https://nodeppt.js.org/

    Sketchviz

    生成手绘风格的流程图的在线工具。
    类似网站: https://excalidraw.com/

    code2flow

    一个符合直觉的,从伪码生成流程图的工具。

    Excalidraw

    手画效果流程图。

    asciiflow

    一个画 ASCII 码框图的网站。

    文本到图形的在线工具

    这个页面给出一个在线工具的清单,可以将文本(图形的描述)渲染成图形,比如 PlantUML 和 ASCIIFlow。

    Plectica

    在线绘制知识图谱。

    Raileo

    该网站提供网站状态监控服务。免费账户可以监控三个网址,监控内容包括:运行时间监控、性能监控、SSL 监控和页面大小监控。

    upptime / upptime

    一个免费开源的网站正常运行时间(uptime)监控服务。
    网站: https://upptime.js.org/

    zhaoolee / ChromeAppHeroes

    🌈谷粒-Chrome插件英雄榜, 为优秀的Chrome插件写一本中文说明书, 让Chrome插件英雄们造福人类~
    网站: https://v2fy.com/ChromeAppHeroes/

    badges / shields

    Badges 在线生成。
    网站: https://shields.io/

    ripienaar / free-for-dev

    该仓库收集各种可以免费使用的(或有免费层的)互联网服务。
    网站: https://free-for.dev

    avataaars generator

    开源的卡通头像生成器,可以定制各种头像参数。
    类似网站:https://multiavatar.com/

    Notion Avatar Maker

    在线制作 Notion 风格的个人头像。

    双拼输入法练习

    在线练习双拼输入法的网站,漂亮的键位图,支持多种双拼方案。这里还有一个同类网站

    ExplainShell.com

    Bash 命令的可视化解释工具。遇到复杂的 Bash 命令,可以输入到这个网站,查看该命令的解释。

    AudioMass

    一个在线的音频处理工具,可以对声音的波形进行各种加工,添加特效。

    Flourish

    在线数据可视化工具。

    rawgraphs

    一个 Web 工具,只要把电子表格的数据复制粘贴到网页上,就可以转成数据可视化图形,不需要编写代码。

    MyGraphPaper

    生成笔记纸、方格纸、网格纸、草稿纸、乐谱纸、画稿纸等多种类型笔记纸,可下载 PDF。

    随机数据生成器

    这个网站提供一个 API,可以让你定制想要的随机数据,以 JSON 格式返回。

    Screen Share Party

    该网站通过 WebRTC 协议把你的桌面分享给其他人。它生成一个 URL,其他人访问这个 URL,就能看到你的桌面。

    Diffchecker

    可以检查文本、图片、PDF 之间的差异。

    Calligrapher.ai

    可以将英文输入变成手写体,并具有动画效果,提供 SVG 格式下载。

    Profile Pic Maker

    一个在线工具,上传人像照片,可以自动提取头像,生成大头照图片。

    Logseq

    一个开源的在线笔记工具,具有强大的知识整理功能。特点是所有数据都储存在你的 GitHub 仓库里面,网站本身不保存用户数据。
    网站: https://logseq.com/

    best-resume-ever

    一个基于 Web 的简历模板,可以生成网页简历,然后用浏览器打印成 PDF 文件。
    网站: https://salomonelli.github.io/best-resume-ever

    我的 WiFi 卡片

    我的 WiFi 卡片是一款简单易用的生成可扫描的 Wi-Fi 密码信息二维码的在线服务。可直接使用手机相机直接扫描 我的WiFi 卡片,就能连接至对应 Wi-Fi,而无需输入密码。

    Thumbnail.AI

    这个在线服务可以为任意 URL,自动生成标题图片,便于在社交媒体引用文章时,提供缩略图。

    Ray.so

    可以生成漂亮的代码截图,颜色、阴影、背景都可以调整。
    类似网站: https://carbon.now.sh/
    类似网站: https://codeimg.io/
    类似网站: https://www.codepng.app/

    Text2image

    一个将文字或代码转换成图片的网页工具,可定制项多,主题、水印、阴影特效等都能自定义。

    alyssaxuu / screenity

    一个强大的屏幕录制和标注的 Chrome 插件。
    网站: https://chrome.google.com/webstore/detail/screenity-screen-recorder/kbbdabhdfibnancpjfhlkhafgdilcnji

    RobinLinus / snapdrop

    局域网内部分享文件。
    网站: https://snapdrop.net/
    类似网站: http://cend.me/

    微软文字转语音

    文字转语音。

    jsonhero-io / jsonhero-web

    JSON 可视化工具。
    网站: https://jsonhero.io/
    类似网站: https://jsonvisio.com/

    云短信

    在线短信接收。
    类似网站:https://www.zusms.com/
    类似网站:http://www.z-sms.com/
    类似网站:https://jieduanxin.com/

    临时邮箱

    临时邮箱、十分钟邮箱。
    类似网站:https://10minutemail.net/
    类似网站:https://10minutemail.com/
    类似网站:https://m.kuku.lu/
    类似网站:https://www.linshiyouxiang.net/
    类似网站:https://mailnesia.com/
    类似网站:https://mailsac.com/
    类似网站:https://mail7.io/
    类似网站:https://www.mohmal.com/en
    类似网站:https://temp-mail.io/zh/
    类似网站:http://www.yopmail.fr/zh/email-generator.php

    图片相关

    Aipix

    在线图片编辑器,AI 抠图。

    Holiday Card Maker

    上传肖像照,软件会自动去除背景,生成各种节日照片。

    AI Picture Restorer

    去除老照片的破损和折痕。

    ColouriseSG

    老照片上色。

    类似网站:https://jpghd.com/

    jpgHD

    图片无损放大。

    类似网站:https://github.com/AaronFeng753/Waifu2x-Extension-GUI

    Geometrize

    将照片转成基于几何形状的水彩画。

    QRpicture

    一个在线工具,把图片变成可以扫描的二维码。

    LogoLy

    P 站风格图标生成。

    xoihazard

    半调图片生成。

    SVG Waves

    生成 SVG 的波浪图片。

    beurtschipper / Depix

    发布图片时,很多人喜欢使用马赛克隐去敏感信息,这个工具可以将打马赛克的文字还原。所以,隐藏信息尽量不要使用马赛克,最好是覆盖掉。

    逗比拯救世界

    表情包搜索网站。

    地图相关

    自然资源部标准地图服务系统

    地图下载。

    类似网站:http://www.onegreen.net/maps/m/

    World Imagery Wayback

    查看各个时期的卫星图像。

    类似网站:https://earthexplorer.usgs.gov/

    大卫拉姆齐地图图书馆

    古地图下载。

    类似网站: https://digitalatlas.ascdc.sinica.edu.tw/

    Terrain2STL

    该网站可以获取全球任何一个地点的地形图,生成 STL 文件供下载。

    中国历史地理信息平台

    复旦大学·中国历史地理信息平台。

    学术地图发布平台

    浙江大学·学术地图发布平台

    地图选择器

    生成全国各省市区地图,可下载 svg 格式。

    Antipodes Map

    这个地图工具可以显示任意地点在地球另一边的对应地点,比如在上海打一个洞穿越地心,就会来到阿根廷的恩特雷里奥斯省。

    兰图绘

    方便易用的在线地图绘制网站。

    国家地名信息库

    中国·国家地名信息库。

    电力设施地图

    该网站的地图显示全世界电力设施的位置,包括电厂、变电站、输电线等等,甚至还有风力发电机。

    东京地铁实时 3D 地图

    这是一个 3D 地图,实时显示每一部地铁列车的位置。

    设计工具

    Happy Hues

    该网站提供一系列配色方案,可以实时切换、定制,查看效果。

    中国色

    中国传统颜色。

    AI 生成的渐变

    用户指定一个颜色,该网站会自动生成基于该颜色的渐变模式。

    Cool Backgrounds

    自动生成背景图片的工具网站,现在提供五种风格,每种都可以定制。

    优秀文章

    GPS 原理解释

    解释了 GPS 的数学原理:卫星为什么可以用来定位?大量使用了动画图片进行说明。

    傅里叶变换交互式入门

    傅里叶变换交互式入门。

    马尔可夫链的可视化解释

    使用大量动画,解释什么是马尔可夫链。

    动画电影的制作过程

    迪斯尼的官方网页,解释动画电影是如何制作的,配有很多图片和视频。

    了解字体的基础知识

    设计师入门系列,介绍英文字体的基础知识,帮你认识各种字体名词。

    展开全文
  • python常考题目

    2021-02-06 14:32:38
    简洁优雅 ,面向对象,跨平台, Python是动态类型语言,而Java是静态类型语言. 7.说说你知道的Python3 和 Python2 之间的区别 print, string/unicode, exception, divide, xrange, 8.了解 Python 之禅么? import ...
  • 数据分析最具价值的49个案例(建议收藏)

    万次阅读 多人点赞 2019-01-04 16:18:44
    导读:本文是近年来不同行业、不同领域的大数据公司的一些经典案例总结。尽管有些已经是几年前的案例,但其中的深层逻辑对于未来仍有启发。 本文力图从企业运营和管理的角度,梳理出发掘...产品运营阶段,则强调...
  • python基础问题汇总

    万次阅读 2020-06-01 18:09:01
    Python中,能够通过一个对象,出其type、class、attribute或method的能力,称为反射或自省 具有反射能力的函数有type(),isinstance(),callable().dir().getattr()等 32.metaclass or type ...
  • eBay分析平台高级总监Oliver Ratzesberger说:“这个平台上,可以将结构化数据和非结构化数据结合一起,通过分析促进eBay的业务创新和利润增长。”   eBay行为分析:早期,eBay网页上的每一个功能的...
  • 微信小程序入门笔记(一)

    千次阅读 2020-12-25 22:45:24
    曾命名为“官号平台”、“媒体平台”、微信公众号,最终定位为“公众平台”,无疑让我们看到一个微信对后续更大的期望。 利用公众账号平台进行自媒体活动,简单来说就是进行一对多的媒体性行为活动,如商家通过申请...
  • 9652

    千次阅读 2020-05-26 20:49:24
    laravel框架提供了两种方式处理会话(Session )数据: (1)全局的辅助函数 session ...has 方法可用于检查数据项 Session 中是否存在。如果存在并且不为 null 的话返回 true: if ($request->sess
  • 测试开发笔记

    万次阅读 多人点赞 2019-11-14 17:11:58
    测试开发笔记 第一章 测试基础 7 什么是软件测试: 7 ...验收测试:(系统测试之后) 11 回归测试: 11 4.测试过程(干什么,怎么干) 12 5.各阶段输入、输出标准以及入口、出口准则:(测试阶段过程要素) 1...
  • eBay分析平台高级总监Oliver Ratzesberger说:“这个平台上,可以将结构化数据和非结构化数据结合一起,通过分析促进eBay的业务创新和利润增长。” eBay行为分析:早期,eBay网页上的每一个功能的更改,通常由...
  • 对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找“正在做”大数据的49个样本。...三是以数据驱动的产品,产品设计阶段,强调个性化;产品运营阶段,则强调迭代式创新。   ...
  • Haskell大世界+思考

    千次阅读 2019-09-02 10:43:43
    推荐论文大佬建议MetaHaskell 实现类型系统语言抽象/模式问题解决方案Haskell工业界有哪些实际的应用?关于fp的一些思考递归是循环的超集。同样是a higher level of abstraction轮子封装。世界运作的规律的更加...
  • eBay分析平台高级总监Oliver Ratzesberger说:“这个平台上,可以将结构化数据和非结构化数据结合一起,通过分析促进eBay的业务创新和利润增长。” eBay行为分析:早期,eBay网页上的每一个功能的更改,通常...
  • 最近因为项目的关系,需要理清媒体的codec,比较搞的是,豆丁网上看运营商的规范 标准,同一运营商同样的业务不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。...
  • 最近因为项目的关系,需要理清媒体的codec,比较搞的是,豆丁网上看运营商的规范 标准,同一运营商同样的业务不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。...
  • 大数据公司挖掘数据价值的49个典型案例  对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找“正在做”大数据的49个样本。...三是以数据驱动的产品,产品设计阶段,强调个...
  • 各种音视频编解码学习...最近因为项目的关系,需要理清媒体的codec,比较搞的是,豆丁网上看运营商的规范 标准,同一运营商同样的业务不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在...
  • 如果到了根域名服务器还是不到域名的对应信息,那只能说明一个问题:这个域名本来就不存在,它没有网上正式注册过。或者卖域名的把它回收掉了(通常是因为欠费)。 这也就是为什么打开一个新页面会有点慢,因为...

空空如也

空空如也

1 2 3 4 5 ... 8
收藏数 144
精华内容 57
关键字:

silk的共享平台数据库在哪找