精华内容
下载资源
问答
  • 2010-03-11 10:56:09

    excel中时间是用数字表示的, 可以用 --"18:00"来查看时间对应的数字 (注这个数字也可能大与1)

     

    excel里如何判断一个时间是否在这个时间段里

     

    =if(and(a1>=--"8:0",a1<=--"12:0"),"在范围内","不在范围内")

     

    按时间段分类

    0:00   -   8:00   为1

    8:00   - 18:00 为2

    18:00 -   0:00   为3

     

    =IF(AND(C4>=--"8:0",C4<=--"18:0"),2,IF(AND(C4>--"18:0",C4<1),3,1))

     

    解释: 时间在8点和18点之间的标记为2。 大于18点和小于1的标记为3, 因为下午12点(12pm,0点后)会转为大于1的数。 其余的为1.

    更多相关内容
  • 文章信息本周阅读的论文是题目《Multilevel Wavelet Decomposition Network for Interpretable Time Series Analysi...

    文章信息

    本周阅读的论文是题目为《Multilevel Wavelet Decomposition Network for Interpretable Time Series Analysis》的一篇2018年发表在《Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining》上的涉及时间序列数据预测的文章。

    摘要

    近年来,时间序列应用在几乎所有的学术和工业领域都出现了前所未有的崛起。各种类型的深度神经网络模型被引入到时间序列分析中,但对重要的频率信息还缺乏有效的建模。基于此,文章提出了一种基于小波的神经网络结构,称为多级小波分解网络( multilevel Wavelet Decomposition network, mWDN ),用于建立时间序列分析的频率感知深度学习模型。mWDN模型保留了多级离散小波分解在连续学习中的优势,同时可以在深度神经网络框架下对所有参数进行调整。在mWDN的基础上,进一步提出了两种用于时间序列分类和预测的深度学习模型:残差分类( Residual Classification Flow, RCF )和多频长短时记忆( multi-frequency Long Short-Term Memory, mLSTM )。这两种模型以不同频率的mWDN分解的全部或部分子序列作为输入,通过反向传播算法在全局学习所有的参数,使得基于小波的频率分析能够无缝嵌入到深度学习框架中。在40个UCR数据集和真实用户量数据集上的大量实验表明,基于mWDN的时间序列模型具有良好的性能。特别的,文章提出的一种基于mWDN模型的重要性分析方法,该方法成功地识别出了对时间序列分析至关重要的时间序列元素和mWDN层。这实际上说明了mWDN的可解释性优势,可以看作是对可解释性深度学习的一次深入探索。

    介绍

    近年来,伴随着深度学习领域的飞速发展,不同类型的深度神经网络模型被应用于时间序列处理分析方面并在实际生活中取得了满意的效果,例如循环神经网络(RNN),使用记忆节点来捕捉序列节点的相关性,但大部分的这些模型都没有利用时间序列的频率信息。

    小波分解是一种在时域和频域上刻画时间序列特征的常用方法。只管来说,可以将它作为特征提取工具,用于深度模型建模前的数据预处理。虽然这种松散的耦合方式可能会提高原始神经网络模型的预测性能,但没有采用独立的参数推理过程进行全局优化。如何将小波分解整合到深度学习模型中仍然具有挑战性。

    这篇文章提出了一个基于小波分解的神经网络模型,叫做多级小波分解网络(mWDN),为时间序列分析搭建了频率感知的深度学习模型。与标准的多级离散小波分解模型(MDWD)相似,mWDN模型可以将一个时间序列分解为一组频率由高到低的子序列,这是模型获得频率因子的关键。但与参数固定的MDWD模型不同,mWDN中的所有参数都可以进行学习,以适应不同学习任务的训练数据。也就是说,mWDN模型既可以利用小波分解对时间序列进行分析,又可以利用深度神经网络的学习能力学习参数。

    基于mWDN,文章设计了两种分别用于时间序列分类(TSC)和时间序列预测(TSF)的深度学习模型,即Residual Classification Flow(RCF)和multi-frequency Long Short-Term Memory(mLSTM)。其中TSC的关键问题是从时间序列数据中尽可能提取代表性特征,因此RCF模型采用mWDN不同层级的分解结果作为输入,采用残差学习方法和分类器堆栈的方式挖掘隐藏在子序列中的特征。至于TSF问题,其关键在于根据不同频率下的隐藏趋势推断时间序列数据的未来状态。因此,mLSTM模型将所有由mWDN分解得到的高频子序列数据分别放入独立的LSTM模型中,并将所有LSTM模型的输出进行整合进行最终预测。值得注意的是RCF和mLSTM模型的所有参数,包括mWDN的参数都是使用端对端的反向传播算法进行训练的。通过这种方式,基于小波的频率分析可以无缝的嵌入到深度学习模型中。

    模型

    1. Multi-level Discrete Wavelet Decomposition

    多级离散小波分解(如图1)是一种基于小波变换的离散信号分析方法,该方法通过对时间序列进行分解,将时间序列逐级分为低频和高频子序列,从而提取多级时间-频率特征。

    以时间序列2bd47baa5b2a8ca5aea1669248d7f34f.png为例,分解得到的第i层的低频和高频子序列分别以3ff2199e14773237b4e01ace6523950b.png30e435a565e9d521696f1b997dd23f40.png表示。在第i+1层,MDWD使用一个低频滤波953d46f8afc8eae760f876b6e12f18da.png和一个高频滤波38a69fea1b0679c0d7584ca3cd32b44b.png,对上一层的低频子序列进行卷积操作,如下所示:

    e3bf3f18fa69933b510a8585f92fb253.png

    其中,a148cd309183cbc27fbd018016691b02.png表示第i层中低频率子序列的第n个元素,并且1ce25ed58ae3f5d614dc1ec451d2f188.png被设置为输入的序列。第i层的低频和高频子序列5024806331b5653cb65fab7babad15f5.png9d9107c63906ae63dd3ddc1081700019.png是由中间变量序列98da0b181bfc5d29888039b7b362b9b9.png2cd7aae6de6b5c1eaa940de78751b2a1.png进行二分之一的下采样获得。

    子序列b7fdec0ca1d75e24ca9bd71b940b43ed.png被成为时间序列数据X的第i层分解结果。特别的,该序列满足:1)可以由子序列完整重建原始序列X;2)不同层级的序列具有不同的时间和频率分辨率。随着层级的增加,频率分辨率不断增加,而时间分辨率,特别是低频子序列的时间分辨率不断减小。

    67c9572b68e8e6be480463229e9021f8.png

    图1 mWDN模型框架

    2. Multi-level Wavelet Decomposition Network

    图一为mWDN模型的构架图。正如图片中所示,mWDN模型依照以下两个公式分层次分解时间序列数据:

    91e0625c49993c3eba923f214fb8c7a6.png

    ae2ff7a14188357bac8e46f937a6b4ac.png表示sigmoid激活函数,75fb560847f6027b82e33e234cecbc2e.png2c3b40d45e73e3763fd358d1e87f1360.png分别是可训练的偏差矩阵,其初始为接近零的随机数值。可以看出来,公式(2)中的方程与公式(1)中的方程非常相似。d356b1ab71620b4ccd6d0ab2fe64b0d3.png39940a2f7ae23166f9d9f233c8d7c97e.png分别表示时间序列X在第i层级分解生成的低频和高频子序列,这是由中间变量8e9a77b62d27256bba2f733eb4f82926.png8bfa9bba4384e5ec7070909760ff3d15.png通过平均池化进行下采样所获得:398a5800f643cbdf893e32d4ed59898f.png

    为了实现公式(1)的卷积操作,我们设置了初始化的权重矩阵和如下:

    800c55ee87671ebb10020e8aacc8f217.png

    很明显的,ffb40e7ebd8f00c01654221a01458823.pngce94cb32e959466692f2783623e07b9d.png,其中P是4c9161af02c16665be607770873a3175.png的尺寸大小。权重矩阵中的是满足cc71991ca416212f96916f0db3659e54.png4ff35f0ad73f9989be6baf5f94a3e785.png的随机值。文章在模型中使用Daubechies 4 小波系数,其滤波器系数如下:

    c067da9737945bdc615a675caa53c855.png

    由公式(2)到公式(3),文章使用深度神经网络框架实现近似的MDWD模型。值得注意的,虽然权重矩阵初始化为MDWD模型的滤波器系数,但仍然可以根据真实数据的扰动对矩阵进行训练。

    3. Residual Classification Flow

    TRC任务主要是对未知类别标签的时间序列进行预测分类。其关键是从时间序列数据中提取出明显的特征。由mWDN模型分解得到的自然时间频率特征X可以应用到TSC。在该部分,文章提出了Residual Classification Flow(RCF)网络去挖掘mWDN在TSC任务中的潜在应用。

    654d0de7b7fa7c163ddf4651de205d80.png

    图2 RCF模型框架

    RCF模型的框架如图2所示,包含了许多独立的分类器。RCF模型通过前向神经网络将第i层mWDN生成的子序列c3c1eb4afbd11217807ffce8528369e4.png1c443fbb790e171f16ce3997a94ac20f.png连接在一起:

    4c4016f7cb7ee068e95766161d30ad75.png

    可以表示为一个多层感知机,或者一个卷积神经网络,又或者其他类型的神经网络,并且代表可训练参数。另外,RCF模型采用了残差网络结构将和所有分类器进行连接:

    76f622198ae93e303a30a9081ba987c6.png

    表示softmax分类器,表示时间序列的类别标签的one-hot编码预测值。RCF模型对各层级mWDN的分解结果9080014bcc1ed36367686cfa1393abe9.png进行演化。因为在不同mWDN层级的分解结果有不同的时间和频率分辨率,所以RCF模型可以充分捕捉不同时间和频率分辨率的输入时间序列的模式。换句话说,RCF采用了一种多视图学习方法来实现高性能的时间序列分类。

    此外,深度残差网络被提出来以解决在使用更深层次的网络结构可能导致训练困难的问题。RCF也继承了这个优点。在式(6)中,第i层级的分类器基于和第i-1层级分类器的决策做出决策。因此,用户可以追加残差分类器直到模型的分类性能不再提高。

    4. Multi-frequency Long Short-Term Memory

    文章提出了基于mWDN多频率的长短时记忆神经网络解决TSF问题。mLSTM模型的设计是基于对时间序列中隐藏节点的时间相关性与频率密切相关的认知。例如,大尺度的时间相关性,如长时趋势通常处于低频,而小尺度的时间相关性,如短期干扰和事件则通常处于高频。因此文章把复杂的TSF问题划分成许多子问题来预测由mWDN分解得到的子序列,这将会使问题相对更简单,因为子序列的频率组成更加简化。

    给定一个无限长度的时间序列,在该序列上给出一个从过去到时刻t且大小为T的滑动窗口如下:

    20a22bd72c82c6689ed5d41dad98ce54.png

    使用mWDN分解X从而获得第i层级的低频和高频序列数据如下:

    1bba1ba16f41ea9050c4c3036d7ab5c0.png

    如图3所示,mLSTM模型使用最后一层的分解结果,即子序列

    d672cfea41b32dd83b52e451464d82a9.png

    作为N+1个独立的LSTM子网络的输入。每个子LSTM网络预测5dbfe4253d167f7a6ebc31c1a75ec579.png中每个子序列的未来状态。最后,通过一个全连接神经网络将各个子LSTM网络的预测值融合在一起得到最终预测结果。

    71954156e3b7f2d8c1a3d354ad555399.png

    图3 mLSTM框架

    实验

    在这部分,文章评估了基于mWDN的模型在解决TSC和TSF问题时的性能。

    (1)Task 1: Time Series Classification

    实验设置:在UCR时间序列库的40个数据集上,对不同的模型的分类性能进行了测试,主要模型如下:

    • RNN和LSTM:循环神经网络和长短时记忆神经网络是两种经典的深度神经网络模型,广泛应用于时间序列分析。

    • MLP, FCN, and ResNet:这三种模型被提出作为强有力的baselines用于UCR时间序列库。他们有相同的框架:一层输入层,紧接着三个隐藏偏差块,最后以一个softmax激活函数作为输出层。MLP采用一个全连接层作为它的偏差块,FCN和ResNet则分别采用一个卷积层和残差卷积网络作为它们的偏差块。

    • MLP-RCF, FCN-RCF and ResNet-RCF:这三个模型使用MLP/FCN/ResNet的偏差块作为公式(5)RCF模型中的。我们比较了RCF模型和MLP/FCN/ResNet的分类效果以验证RCF的有效性。

    • Wavelet-RCF:该模型与ResNet-RCF模型有着相同的结果,但使用mWDN部分替换了使用固定参数的标准MDWD。我们比较了它和ResNet-RCF模型以验证mWDM中可训练参数的有效性。

    对于每个数据集来说,我们每个模型都跑了十次,将返回的平均分类误差作为评价指标。为了比较所有数据集上的表现性能,文章进一步提出了Mean Per-Class Error(MPCE)作为每个模型的评价指标。令为第k个数据集的类别数,表示每个模型在该数据集上的错误率,则每个模型的MPCE计算如下所示:

    1776999a63b4bcfcb4602c5f0d57ce91.png

    注意,类别数量的因子在MPCE中被抹去。MPCE其取值越小,整体性能越好。

    结果&分析:表1展示了实验结果,总结信息列在了下面两行。注意,每个数据集中最好的表现用黑体加粗表示出来,第二好的则用斜体表示出来。在所有baselines中,FCN-RCF取得了最棒的表现,有最小的MACE值,并且在40个数据集中取得了19个数据集的最好表现。而FCN也取得了比较满意的表现,其在9个数据集上的表现最优,并且有比较小的MPCE:0.023,但与FCM-RCF的差距还是比较大。由表格1还可以看出,MLP-RCF在37个数据集上的表现都要优于MLP,ResNet-RCF在27个数据集上的表现要优于ResNet。这表明RCF框架确实是一个可以兼容不同类型深度学习分类器的通用框架,能够显著提升TSC任务的分类性能。

    另外,表格1表明Wavelet-RCF在MPCE和AVG排名上取得了第二好的表现性能,这说明由小波分解得到的频率信息对时间序列问题非常有帮助。另外,从表中可以清楚看出ResNet-RCF模型在大多数据集上的性能优于Wavelet-RCF,这有力的证明了我们的RCF框架在深度学习下采用参数可训练的mWDN,而不直接使用传统的小波分解作为特征提取工具的优势。从技术上更准确的讲,与Wavelet-RCF相比,基于mWND的ResNet-RCF模型可以在频域先验和训练数据可能性间取得一个较好的权衡。这也很好解释了为什么基于RCF的模型可以取得更好的预测结果在先前的实验观察中。

    表1 Comparison of Classification Performance on 40 UCR Time Series Datasets

    0f73fb5bb6c492214a326d6e329b480e.png

    (2)TaskⅡ: Time Series Forecasting

    实验设置:文章测试了mLSTM模型对一个访问量预测场景的预测能力。实验采用了一个名为WuxiCellPhone的真实数据集,该数据集包含了位于无锡市中心的20个手机基站在两周内的用户量时间序列数据,用户量时间序列的统计时间粒度是5min。该实验,选择了以下的模型作为baselines:

    • SAE (Stacked Auto-Encoders),被广泛应用于各种TSF任务中;

    • RNN (Recurrent Neural Networks) 和 LSTM (Long Short-Term Memory),专门为时间序列分析所提出的模型;

    • wLSTM,与mLSTM有相同的结构,但将mWDM部分替换成标准的MDWD。

    这部分使用了常用的两个指标去评估模型的表现性能,包括Mean Absolute Percentage Error (MAPE) 和 Root Mean Square Error (RMSE),具体定义如下:

    88b94d749d07e66896ad68e897ff3e44.png

    结果&分析:我们比较了在两个TSF场景下(具体场景可以查阅原文)所有模型的表现性能。在第一个场景,文章预测了在子序列期间基站的平均用户数,时段的长度由5到30分钟不定。图4比较了一个星期内20个基站的平均表现性能。从图片可以发现,尽管随着时间长度增加,所有模型的预测误差逐渐变小,但mLSTM还是取得了最好的表现。具体来说,mLSTM模型始终优于wLSTM模型,再次验证了mWDN用于时间序列预测的可行性。

    在第二个场景中,文章预测给定时间间隔从0到30分钟后下一个5分钟内的平均用户数。图5比较了mLSTM和其他baselines的预测性能。与场景1观察到的趋势不同,伴随时间刻度增加预测误差会逐渐增加。同时从图5可以看出,mLSTM表现结果再一次优于其他baselines,也证明了由场景一观察到的结果。

    973f9e5ce64cccf82e607e3eb6610fba.png

    图4 Comparison of prediction performance with varying period lengths(Scenario Ⅰ)

    f9fa667901f64297607529fc0b0b6921.png

    图5 Comparison of prediction performance with varying interval lengths(Scenario Ⅱ)

    可解释性研究

    在该章节,文章重点介绍了mWDN模型得独特优势:可解释性。由于mWDN嵌入了离散小波分解,因此mWDN的中间层的输出和1a209b29db2d3c804bf346e0b8bf0c97.png继承了小波分解的物理意义。文章采用两个数据集对此进行解释:WuxiCellPhone和ECGFiveDays。图6(a)展示了一天之内手机基站的用户数量序列数据,图6(b)展示了心电图 (ECG) 样本。

    009e9908efe4a6a9883f1c2371e1dc57.png

    图6 时间序列数据样本

    (1)实验动机

    图7分别展示了mLSTM和RCF模型中输入图6时间序列样本后mWDN层的输出。图7(a)描述了mLSTM中经过三层小波分解以后的子序列,正如图片所示,由04a2e67627474b0e7eaafe6d25b98ab6.pngaf642cbd466df8e6604a097236779509.png,中间层的输出对应于输入序列从高到低的频率分量。相同的情况也可以从图7(b)中所看到,分别表示RCF模型前三层的输出,这表明mWDN的中间层继承了小波分解中的频率分解。

    2695bab182cccb5a2ee57066a699a566.png

    图7 mWDN模型生成的子序列

    (2)重要性分析

    文章介绍了一种针对mWDN模型重要性分析的方法,旨在量化每个隐藏层对mWDN模型最后输出的影响重要程度。我们定义了使用神经网络进行时间序列分类或预测的问题如下:

    2bb721f2c9168e016e9508c4c3d607b9.png

    其中M表示神经网络,x表示输入的序列数据并且p表示预测值。给予一个训练好的模型M,如果对第i个元素的一个小的扰动会对输出p造成很大的改变,则说明M对非常敏感。因此,神经网络M对输入序列的第i个元素的敏感度被定义为4a52bd6157403304809ccb94dc1ea13f.png对的偏导数如下式:

    8bdf532b2f0604d72b83ff0f86f7c821.png

    显而易见的,表示给定模型M关于的函数。给定J个训练样本的训练数据集933956a3d7ff33267a500753595e1931.png,输入序列x的第i个元素对模型M的重要性可以定义为:

    943cb0f50da4541272b41f339a5bb128.png

    其中是第j个训练样本中第i个元素的取值。

    上述重要性的计算公式可以延申到mWDN模型的隐藏层。假设a为mWDN模型的a隐藏层的一个输出,神经网络M可以重新改写为:

    2100ba28e9073e70bda25caf70cb202d.png

    并且a对模型M的敏感性定义为:

    dcc36fbd02b18bd50bc5df85bcbbd815.png

    给定一个训练数据集9baf40373f8aec396ab12a9418c056d5.png,a对模型M的重要性计算如下:

    5480a5523f7ff3ae8bc155eb6f325b8b.png

    和分别表示一个时间序列元素和一个mWDN层对模型的重要性。

    (3)实验结果

    图8和图9分别展示了重要性分析的结果。图8中,mLSTM模型在WuxiCellPhone上测试。图8(b)展示了所有元素的重要性图谱,其中x轴表示时间戳,图谱颜色表示特征的重要性:越红越重要。从图谱中可以看出最新的元素比旧的元素更重要,这在时间序列分析场景中是非常合理的,也证明了信息的时间价值。

    图8(a)展示了按照频率递增的顺序从上到下排列的隐藏层重要图谱。为了便于比较,文章将输出的长度统一。从图谱中,可以观察到顶部的低频层有着更高的重要性;并且只有具有更高重要性的隐藏层展示了与图8(b)一致的时间价值。这些都预示着mWDN中的低频层对时间序列的成功预测更重要。这并不难理解,因为从低频层捕捉到的信息通常表示人类活动的基本趋势,因此可以很好用于预测未来。

    图9描绘了RCF模型在ECGFiverDay数据集上训练的重要性图谱。如图9(b)所示,最重要的元素大概位于100到110的时间轴,与图8(b)十分不同。为了更好理解,回想一下,这个范围对应于心电图的T波,涵盖了心脏放松和准备下一次收缩的这段时间。通常认为,T波异常表明生理功能严重受损。因此,描述T波元素对分类任务更重要。

    图9(a)为隐藏层的重要性频谱图,同时按频率的递增顺序从上到下排列。其中一个与图8(a)相反的有趣现象是,高频层对于ECGFiveDays的分类任务更重要。为了理解这一点,我们应该明白低频层捕捉到的ECG曲线的总体趋势对每个人来说都非常相似的,而高频层所捕获的异常波动才是识别心脏病的真正可区分信息。这也揭示了时间序列分类和时间序列预测的不同。

    本节的实验证明了结合小波分解和文章提出的重要性分析方法所产生的mWDN模型的可解释性优势,也可以看作是对深度学习黑盒问题的探讨。

    总结‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

    这篇文章的主要目的是为时间序列分析建立频率感知的深度学习模型。为了实现这个目标,我们首先设计了新的基于小波分解的神经网络结构mWDN,用于时间序列的频率学习,通过使所有参数都可以训练,可以无缝嵌入到深度学习框架中。基于mWDN结构,文章针对时间序列分类和预测任务,进一步设计了两种深度学习模型,并且在大量的真实数据集上进行的实验表明,他们比最先进的模型更具有优势。作为对可解释深度学习的一种新的尝试,文章进一步提出了重要性分析方法,用于识别影响时间序列分析的重要因素,从而验证了mWDN的可解释优点。

    Attention

    欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

    展开全文
  • www.pmcaff.com本文作者一只特立独行的Eric于社区发布“我有时下班打顺风车,周围几大公司(滴滴、百度、新浪、网易)的产品经理都会来接我。因为我用的是真名。”俞军20...

    www.pmcaff.com

    本文为作者 一只特立独行的Eric 于社区发布

    “我有时下班打个顺风车,周围几大公司(滴滴、百度、新浪、网易)的产品经理都会来接我。因为我用的是真名。”俞军2017年接受PingWest采访时说道。

    作为中国最有影响力的产品经理之一,俞军的经历是难以复制的,尤其在行业进入成熟期之后,增量用户的枯竭加剧了巨头的马太效应,迫使“古典产品”更加冷静、保守,不可避免地走向平庸。

    此时此刻,在“道”的层面把最关键的问题讲清楚,可能是一个顶尖产品经理的社会责任,《俞军产品方法论》实现了这个目标;但遗憾的是,它传递价值的“交易成本”高于了大多数人的预期。

    读者视角的“说人话”

    《俞军产品方法论》的内容可以概括为三个部分:

    “理性决策”的方法论。

    两个重要的模型,“用户模型”,“交易模型”。

    产品经理的选拔与成长。

    图1:《俞军产品方法论》的目录架构

    关于本书的受众,俞军在自序里写道,

    本书适合的读者为:

    在产品工作中遇到过需求冲突或资源冲突,有过权衡取舍困难的人;

    或者在创业和业务发展思考过用户价值和商业价值的人;

    或需要了解如何选拔和培养产品经理的人;

    或个人成长遇到瓶颈和迷茫的产品经理;

    或有兴趣选择产品经理为职业的人;

    或对神秘的出行领域产品工作好奇的人;

    以及对产品工作感兴趣的其他互联网从业人士。

    本书在豆瓣拿到了8.0分,但最高票的“差评”也反映出了阅读门槛对读者产生的困扰。

    图2:《俞军产品方法论》最高位短评

    • 堆砌概念

    • 忽略实证

    • 案例匮乏

    • 戛然而止

    以上是我的团队读完后给我的反馈,对于不懂经济学的同学,很难在诸多的概念中产生共鸣,更提不上延展思考。

    我很理解大家的心情,毕竟中国最顶尖的产品经理写书,大家的预期(或者说认知局限)是至少在“术”的层面能看到系统的见解,但拿到的却是一本讲“道”的书,存在一定的认知失调。

    其实在《时间简史》出版之时,霍金已经取得了他在黑洞研究中的主要成就,他最初还是倾向使用比较学术化的语言,后来在编辑的建议下对全书进行了重写,使之尽可能通俗易懂,避免为外行人设置太高的门槛。据说书中多一个方程,销量就会减半,因此霍金在书中只使用了一个方程,就是爱因斯坦的质能方程(E=mc²)。

    很可惜俞军老师这本书没有重写,这一定程度会影响本书的传播范围,但并不影响内容的高质量。

    我个人对本书的评价非常高,是因为它代表了一个“产品学派”的诞生,一个以微观经济学与心理学为基础的交叉学科,是产品历史上值得纪念的一本书。

    相信,未来一定会有众多的信徒不断去发展这套理论,对这个行业、职业都是好事。

    这本书在讲什么?

    Prat1 “理性决策”的方法论

    理性决策的三个核心要素:理性的信念、理性的目标、理性的行动。

    理性的信念,是一个自知自省的过程,包括我们所掌握信息的充分度,情绪层对选择的影响,自身是否具备决策的能力(演绎法+归纳法),以及对认知偏差的风险检查(路径依赖、心理账户......)。

    理性的目标,是在约束条件下的总价值最大化。首先,搞清楚约束条件很重要,很多的需求在没有资源的情况下是无法提供解决方案的。其次,不同目标之间总价值的评估决定了决策质量,忽略这一点,很容易将最核心的资源放在不重要的事情上。

    理性的行动,是基于目标给出最优的解决方案,经历知行合一的过程。

    由于概念有些抽象,可以通过案例来理解。

    案例:想从0~1做一款网约车产品

    1.1 理性目标的产生

    ①目标选择

    我为什么想做网约车产品?我发现了什么机会?

    那为什么不去做区块链、新零售、人工智能?

    ②效用评估

    我的网约车服务是整合社会运力还是自营车辆、自营司机,为什么?

    如果我选择做自营,并认为服务的差异化是破局点,那我能有神州专车(竞品)做得更好吗,怎么做到?

    即使自营的服务更好,但多出来的溢价乘客会买单吗,如果不会,我能长期补贴其中的差额部分吗?补贴可持续吗?后续补贴能停吗(同问瑞幸)?

    ③约束条件

    如果选择做自营,财务模型是怎么样的,我的资金能做多大规模?

    我没有招募司机、管理司机的经验,应该找谁来做这个事情?我目前的条件能不能找到?找不到的话,会成为强阻碍点吗?

    1.2 理性信念的自查

    理性目标产出后,还要对认知进行自查:

    我有什么信息掌握是不够充分的,导致某一层演绎法的结论极不可靠。

    比如:我在公开数据看到某厂商已经做到了1000万月活用户(以此作为判断依据),但从内部人士了解到在200~300万。

    是否存在幸存者偏差。

    比如:在决策时只分析了成功且仍然存在的产品,大量失败的产品我都没有分析。

    是否存在路径依赖。

    比如:3年前我在一家O2O公司做销售负责人,业务发展迅猛,我个人取得了很大的成功。对于这次出行创业,我仍然坚信销售比产品重要得多,这是对的吗?

    1.3 理性行动的过程

    经历了认知的深度思考,最后确认要做“自营网约车”。此时再讨论具体的设计方案:

    • 创立公司、搭建核心的初创团队,设计中长期的激励机制,资金准备、场地租赁、设备采购、核心人员招募等。

    • 初版的产品方案设计,包括:Logo、Slogan、设计风格、数据结构、订单系统、调度系统、用户中心、支付中心、发票中心、运营管理平台等产品模块。

    • 初版的运营方案设计,包括:车辆采购、维保流程、司机招募、薪酬与社保方案、考核机制、培训体系等运营模块。

    俞军老师想告诉我们,相比行动,理性的信念、目标是产品经理更需要关注的。因为时间、资本、劳动力永远是有限的、稀缺的,如何正确地配置到“无限”的目标上去,这种能力才是核心。

    我非常认可这种决策的方法。在应届毕业的时候,勤奋地行动确实更容易收获正向的反馈,但越接近三十岁,单一的勤奋行动的价值就削弱得越厉害,构建理性决策的能力越早越好。

    Part2  析用户模型

    产品经理要研究用户行为及其背后的意义。—俞军

    2.1 从用户的五个属性提炼需求

    俞军老师对用户的论述中有一段非常经典的话,是整本书对我价值最大的部分,即:“用户不是自然人,而是需求的集合”。

    对于用户,大家有不同的理解,通常的理解是用户即自然人。以微信为例,一般的统计报告可能显示其“用户”为11亿,如果把微信的其他功能(支付、公众号、小程序、朋友圈、群等)都删掉,只留下通讯功能,它的用户数可能还是11亿,但它的商业估值可能就从2000亿美元变成了200亿美元。这种将用户定义为自然人的做法,显然在大型互联网产品上并不适用。

    从产品经理的视角来看,用户不是自然人,而是需求的集合。

    想透了从这个问题最本质,再向上思考问题就显得非常容易了。比如:关于需求集合,C端与B端产品的区别。

    图3:C端、B端需求集合的差异

    即使把用户回归到“自然人”的角度(TO C),也满足俞军老师提出的“用户的五个属性”:

    异质性:指用户特点千差万别,几乎很难找到两个完全一样的用户。因为用户的偏好、认知、所拥有的的资源是不一样的,所以不能把用户统一成一个单一的用户画像。

    情境性:指用户的行为受环境的影响,没有情景就没有用户,同一个用户在不同的环境下会有不同的反应和行为。

    可塑性:指用户是可变的,其偏好和认知会随着外界的不同信息刺激发生变化和演化,具备可塑性。

    自利性:指用户追求个人总效用最大化。

    有限理性:指用户虽然追求理性,但他的能力是有限的,其判断经常出错,也经常被骗,所以只能做到有限的程度。

    上述观点仍然过于抽象,我把它解读为:在不同场景下,用户往往有不同的角色(如:在公司是员工、回到家是父母、进卧室是丈夫等),即使对同一款产品,他们在不同场景的使用动机也可能是不同的。

    以微信为例:

    早上9点,刚到公司摸鱼,使用微信和前同事聊天,吐槽老板提议增加“奋斗日”。(需求:情绪纾解)

    下午8点,吃晚饭期间使用微信刷公众号。(需求:获取信息)

    晚上10点,在回家的地铁上,使用微信玩小游戏。(需求:娱乐)

    晚上11点50分,准时给女神发“你要早点休息哟,记得多喝热水。”的每日消息,虽然女神从未回复,但还是会怨恨微信没有“已读”功能。(需求:谁说舔狗一无所有?)

    而对用户的角色→场景→动机的集合梳理,本质上是掌握更全面的用户信息,以便由动机提炼出显性需求,这个过程是非常考验产品能力的。举个案例:

    用户反馈:想在知乎上添加一个“答案置顶30分钟”功能。

    动机分析:了解到用户提该需求的动机是:“针对于那些旧问题,希望通过该功能将自己的新答案顶上去一段时间,这样才有机会让更多人看到。”

    需求满足:产品当然不可能用“置顶30分钟”的方案,因为当同一问题下大量答案同时使用置顶,内容消费者的体验会非常糟糕。另一种解决思路,是通过内容消费者的核心阅读渠道,精准分发“新内容”(例:知乎的“推荐”模块),在实现加量的同时也保障了内容消费者的体验,这就是知乎的“内容自荐”。

    图4:显性需求的挖掘过程

    关于“显/隐性需求”,不少人会举乔布斯的例子。认为13年前大家都在专注将手机的按键、滚轮设计得更精妙的时候,乔布斯却能看到触控交互的时代,这是顶级产品经理挖掘“隐性需求”的天赋。

    但仔细想想,一个认知十分有限的产品经理,别人眼中的“显性需求”对他来说可能也是“隐性需求”,这种相对的比较,证明了培养“隐性需求”的挖掘能力,仍然是不断精进、自省的过程,需要依靠对用户动机的精准把握,以及复杂产品的设计能力(普遍认同的“隐性需求”一般需要更全新、更复杂的产品才能满足)。

    2.2 用户价值公式

    俞军老师最著名的公式:

    用户价值=新体验-旧体验-切换成本

    这个公式很容易理解,相比微信,子弹短信提供的语音信息,用户不需要付出“听语音的成本”,因为它直接转化成了文字。对于经常收大段大段微信语音的同学,是一种非常好的新体验。所以这里的“新体验-旧体验”是正值。

    但是,微信上沉淀多年的好友关系,海量的公众号资源,六七年的朋友圈记录等等,都让“切换成本”变得非常高,所以对于绝大部分微信用户,子弹短信的“用户价值”仍为负数,用户不会放弃微信。

    即便是字节跳动曾重金押注的多闪,也无法突破微信的切换壁垒。

    图5:试图挑战微信的三款社交产品(多闪、聊天宝、马桶MT)

    Part3  解析交易模型

    用户的每一次主动行为都是与世界的一次交易。—俞军

    3.1 效用与行为

    针对交易行为,俞军老师着重讲了效用与行为之间的关系,以及交易成本。

    图6:用户行为背后的机制分析

    关于效用,他说:

    在产品研究的范围内,我们可以认为用户约等于“偏好和认知函数”。偏好是主观的模式用户对事物(是什么)和事物的效用(对我有没有用,有多少用)的综合认知结果。偏好同时受先天遗传因素和后天社会经验的影响。

    讲得还是太抽象了。

    简单来说,用户使用一款产品,他的成本至少有“时间成本”,当前这个信息爆炸的时代,时间资源反而是最珍贵的,大量APP都希望占据用户在不同场景下(通勤、周末、午休、上班......)的时间资源时,而用户只会选择“对他最有用的那款产品”。

    这种“有用的认知”就是效用的体现,它是一种主观的认知。比如:Eric认为读书比听演唱会更能让他满足,Maggie则相反(尤其是五月天的演唱会),所以Eric提议用一张五月天的演唱会内场票(1000元)换Maggie年会发的2000元亚马逊购书卡就成为了可能,交易会让双方都变得更好。

    明白了上述的道理,就能对企业家经常倡导的“用户第一”有更好的理解。我们提供产品或者服务,不能够站在生产者的角度,认为我多么辛苦找了这么多人加班做出来的东西,你怎么就不用呢(这届用户不行)?

    对于用户来说,主观上没用的东西,不论你投入多少社会必要劳动时间生产,他都不会付费的。这就是西方经济学反击马克思劳动价值论的核心论点之一。

    3.2 降低交易成本

    关于交易成本,俞军老师说:

    市场行交易成本主要分为以下三类:

    搜寻(商品和交易对象)成本和度量(交易对象和商品的属性)成本;

    寻价(议价比价)成本和决策(决策和订立契约)成本;

    实施成本和保障(权利、违约、意外、监督等)成本。

    这是一套非常好的归纳逻辑,可以概括现实中的各种产品问题,我们也可以使用它去反向检查产品。

    • 搜寻成本与度量成本

    认知困难:要找的SKU到底在哪个导航里呢?

    负面预期:这个ICON可以点吗,点了会不会出问题?

    度量困难:这家餐厅装修看着不错,到底好不好吃?大众点评的评分可信吗?

    • 寻价成本和决策成本

    供给不足导致的排队等待:软件园高峰期,在不加价的情况下,需要排队近1个小时才能打到车。

    线下的议价流程在线上租房信息平台达成意向后,仍需要线下与房东再面对面议价,签署合同。

    商业化带来的决策延迟:每次打开APP,弹窗广告都要强制展示5min以上。

    • 实施成本和保障成本

    冗余的操作:每次微信AA账单需要打开“钱包-收付款-群收款”然后发到群里,而不能直接在群聊里发起。

    中断与重复:每次公众号文章看到一半退出回消息,要重新看需要打开公众号再把文章搜索出来(浮窗功能出来之前..)。

    信任危机:害怕低价促销的产品质量没有保障,不敢买(在“7天无理由退货”推出前的困境)。

    Part4  滴滴的案例实践

    任何理论都需要大量实践才能真正掌握,我以滴滴出行为例,结合俞军老师对用户、交易模型的讲解,来分析产品的几个功能。

    注:案例实践的内容写于2019年初,与产品最新版本有差异。

    4.1 效用

    作为用户,使用滴滴出行的快车服务,我们能获得多少“效用”?

    随时随地快速叫车,不用再为夜晚路上没有出租车打而烦恼。

    司机找乘客,不用为了打车到处走。

    透明的用车价格,不用再跟黑车司机议价、拼车。

    严格的路径规划,不用担心导致的绕路多计费。

    良好的司机服务,出行属于买方市场,乘客的评价对司机的利益影响较大,该模式倒逼司机提供更好的服务。

    相比传统出租车,滴滴快车在初期通过“补贴”快速获取市场份额,培养用户习惯。在补贴退出后,产品仍然能向用户提供“更快速响应、更多元、更方便、更透明安全(综合效用)”的出行服务。

    4.2 交易成本

    Ⅰ、减少用户的不确定性,降低“搜寻成本”。

    ①提前告知重要信息

    一般用户在选择目的地后,会想要知道多久能打到车。为了让用户减少“搜寻成本”:

    滴滴出行,在选择目的地后会显示“预计上车时间”。

    神州专车,不会显示“预计上车时间”,用户想要知道只能叫车后等待。

    优步中国,在未选择目的地之前就会显示“预计上车时间”。

    图7:滴滴、神州、优步中国“预计上车时间”提示

    Ⅱ、简化高频操作,降低“实施成本”。

    滴滴快车的订单操作中,有三步是必须的:选择位置选择车型支付车费。要降低用户的实施成本,需要围绕这3个关键步骤做优化。

    图8:滴滴出行用车流程

    ①预测用户行为

    在通勤、蹦迪回家的场景中,用户的出发、目的地往往是固定的,可基于用户历史的订单数据,预测目的地,减少用户操作。

    图9:滴滴、神州目的地预测

    ②主动替用户选择

    打开APP,第一步是定位用户位置,对比了滴滴、神州专车:

    滴滴出行,在初始状态会选择基于当前定位的最佳上车点,减少了用户的操作。

    神州专车,在初始状态提示“定位可能有偏移,请确认您的上车地点”。实际上选择了推荐的上车地点后,上车位置几乎没有变化,说明产品对“起始点合适程度”的判断逻辑还需要改进。

    图10:上车点选择

    ③简化高频节点

    开通免密支付,每次行程结束后自动扣除车费,大幅减少了用户的操作成本。

    图11:滴滴开通免密支付

    Ⅲ、想要降低用户的“寻价与决策成本”,往往需要解决供需瓶颈、提升标准化的程度。

    图12:标准化与决策成本

    滴滴出行的服务是即时的,相对同城运输、干线车货匹配,其实时性要求更高,如果平台在某一时段出现运力短缺,则需要通过“价格机制”或者“时间顺序”解决供需失衡的问题。

    需求端:
    乘客动态加价(价格机制)

    提高车价(价格机制)

    乘客排队(时间顺序)

    供给端:
    任务奖金(价格机制)
    提高车价/降低抽成比例(价格机制)

    滴滴曾在一段时间使用以动态加价为主的供需调整策略,但遭受了舆论的强烈压力,后改用先到先服务的排队机制。然而,这种机制无法保障“最需要服务的人(也就是愿意出更高价格的人)获得服务”,资源的利用效率并不是最优的。算是“效率”向“公平”妥协的典型案例。

    更重要的是,“排队”并不比“价格机制”更能解决短缺的问题,因为“即使出行”的用户决策时间很短,排队实际上也是变相的挤走了部分的需求(如下图),而这些被挤出的需求可能是更需要出行资源的人(也就是愿意出更高价格的人)。

    图13:高峰期北京打滴滴的体验

    总结:想要持续地交付用户价值,就是不断创造增量效用并不断降低交易成本的过程。

    Part5  产品经理的选拔与成长

    5.1 选人的逻辑

    首先是专业:有四个维度可以进行判断

    ① 批判性思维

    这里只提“批判性思维”而不是“深度思考”,是因为批判性思维不是特别依赖天赋,也是后天可以有效提升,提升后也能有效提高输出决策的质量。

    相对“深度思考”,“批判性思维”确实更容易建立,因为对于绝大多数的事情,多元的观点都能具有说服力,并且可以将其产生过程标准化:

    对论证义务的拆解

    比如讨论“真善美是不是普世价值”,就“普世价值”的定义正反双方就可以有不同的划分。反方认为在艺术领域“假”的东西,“抽象”的东西可能更美,所以“真”不一定是普世价值。这里他给反方的定义就是“普世价值”代表了所有领域都需要适用。

    极值论证

    比如讨论“恐婚应不应该通过药物治疗”,正方可能会问:“当恐婚的恐惧已经近似抑郁症的程度,又无法通过沟通解决的时候,应不应该吃药?”这里正方就是试图通过“极值”论证己方观点。

    但我不认同“深度思考更多依赖天赋”,因为“深度思考”不仅是一种思维的链路,更是信息水平的体现,假设你完全不懂一个行业,你是无法深度思考的,只有具备大量的实践经验与对抽象规律的掌握(例:经济学、新闻学)才能建立深度思考的模型,这并不强依赖天赋。

    ② 同理心

    同理心之所以重要,是因为市场化的“交易行为”都是个体利己的结果。产品经理要体会这种利己的动机,而不是用“父权思维”对待用户的诉求。

    用户不想做饭,才会选择付费点外卖。如果你不能理解这个动机,却高高在上的教育用户:“天天吃外卖对身体不好,都快三十岁的人了,面都不会煮,这样以后能找着媳妇儿吗?”我相信这样的产品经理永远无法找到满足用户效用的解决方法。

    ③ 用户模

    前面已经讲过了,不再赘述。

    ④ 产品技能熟练度

    产品技能熟练度用于判断候选人的产品基础扎实程度,但一定程度也依赖过往产品实践机会的质量,从此可以反推候选人的产品心、学习能力。

    应该考察包括:用户调研、竞品分析、业务逻辑产品化、异常流程覆盖、项目管理、沟通、数据分析等方面的能力。如果是TO B业务,会要求产品对业务逻辑、行业发展有更深入的掌握,否则很难设计出满足业务需求的方案。

    其次是潜力:三个核心判断项

    ① 自省(发现和承认自己的短处:学习、合作、雇佣、回避)是毫无疑问的第一潜力。

    ② 学习意愿和学习能力。

    ③ 高成就动机。

    我对这三大点的思考是,学习意愿、学习能力更多是由高成就动机推动的,能够明白企业的根本性质(企业家与劳动力的关系),有强烈获得成就的欲望,就能明白学习的重要性并坚持实践。

    而自省则是维持学习意愿的重要手段,不自省的管理者容易沉溺于赞美的PUA之中,对有价值的质疑漠视、抗拒,掩住了输入的大门,甚至对人才实施逆向选择,这在企业中是比较常见的。

    努力挣脱人性的桎梏,需要日复一日的自省自知。

    已加入购物车的书单

    俞军老师利他的本性,在荐书的行为中就可以体现,并非简单列举名目,而是详细概述每本书的价值,帮助大家有选择性地阅读。

    以下三本书,都是既可以当作产品经理的入门书,又可以在职业生涯中反复读的书。

    《社会心理学》:适合成为「产品经理的第一本书」。科学方法、人文关怀、实践精神浸透字里行间,这些恰好是产品经理的三类核心素质。书中还介绍了大量心理学实验和人性常识。

    《第一本经济学》:经济学帮助人们洞察世事,这一本相对简单,写作目标是让高中生也能读。

    《学会提问》:介绍批判性思维,学习辨别信息和言论的真假对错。

    学习理性思维决策的书,以下四本就够用很久了,因为仅仅多阅读是没用的,最终还是阅读、思考、实践中的最短板决定决策水平。

    《认知心理学及其启示》:阐释人类认知和思维的基本机制。

    《思考,快与慢》:讲人如何有偏见、有缺陷地思考。

    《超越智商》:教人如何克服缺陷做理性决策。

    《思维与决策》:系统介绍思维与决策领域的研究。

    学习经济学,不能像学习自然科学一样仰视着众多定律公式,而要带着批判性思维学,这就需要多看几本不同的经济学教材。进行基础入门后,对产品经理来说,最有学习价值的三个方向是行为经济学、新制度经济学、奥地利经济学派的理论。

    《经济学原理:微观经济学分册》(曼昆):这是最通用的大学经济学入门教材。

    《「错误」的行为》:行为经济学离产品经理最近,通过这本书可以理解学科起源。

    《新制度经济学:一个交易费用分析范式》:学习交易费用,思考商业模式。

    《现代制度经济学》:把历史上很多制度经济学名家的经典文章选编在一起,对于学习新制度经济学比较方便。

    《薛兆丰经济学讲义》:薛兆丰是中国成功的经济学普及者,他是当代中国人,也很接地气,使得这本书更易读,适合中国人学经济学入门知识。除了看,还可以在「得到」App上听他讲。

    下面这几本书,也是很好的。

    《博弈与社会》:用通俗语言介绍了博弈论的方法、结论和社会应用。

    《自私的基因》:用一种全新视角再次解答了人类永恒三问——我是谁?我从哪里来?要往哪里去?

    《消费者行为学》:研究人在消费产品过程中的行为,并应用于营销战略,内容非常适合产品经理。

    《组织行为学》:研究人在组织中的行为,内容比较适合产品经理。

    《沟通的艺术:看入人里,看出人外》:人际沟通对于产品经理来说既重要又令人困扰。本书兼具深度、广度和完整性,非常适合产品经理学习人际沟通。

    《进化心理学》:进化心理学是进化生物学和现代心理学相融合的新理论,解释人类的很多心理机制(人性)是怎样的以及为什么会这样。

    《发展心理学:儿童与青少年》:通过考察从胎儿期到青年期的人是怎样发展的,我们会更加了解自己,更加了解人类行为背后的决定因素。

    虽然我只读过一点点书,但也有3本作为补充推荐给大家:

    《洞穴奇案》:一个虚拟的人吃人案件的刑事审判,14位法官各抒己见,我们从中可以读到非常多辩证的观点,包括:法律实践与道德预期、自由裁量权、生命价值量化论、常识判断等等,对于培养批判性思维非常有帮助,希望你能成为第15位法官。

    《社会学动物》:通过大量实验透视人性,包括:付出高成本得以加入后对实验目的的认知变化;预期过高并得不到满足后,对周边人群的暴力倾向的变化;受到羞辱又无法反驳时,对周边人群的暴力倾向的变化;色情、暴力电影影响男性对女性的施暴倾向等等,心理学大成之作。

    《当代中国经济改革教程》:本书详尽地讲解了中国经济改革的点滴,不但包括了:产权制度改革、财税改革、对外贸易改革、金融改革、价格改革;还对政治体制改革、社会保障体系改革以及世界宏观经济政策做了概述分析,非常有助于理解中国经济制度的发展历程。

    如俞军老师所说,读书不应该是教条主义,而是获取信息、知识的一种比较不错的途径,根据自己的情况选择合适的书读即可。不能把希望全部寄托在读书上(尤其是应届毕业后),成长是配置时间资源的效用集合,读书占多少比例,还要取决于当下其他选择的边际收益。

    俞军方法论的扩展思考

    Prat1  对交易平台的思考

    交易平台的效用构成,核心在于:

    1、供给的多样性

    对于个性化需求较强烈的平台尤其重要。例:贝壳、Airbnb、天猫、美团外卖。但对于标准化程度高的平台则不太强烈,例:滴滴、货拉拉。

    2、供给的及时性

    尤其对于滴滴这类即时出行服务,提供高质量的服务响应,除了建设算法模型,本质上还是依赖供给端的量,否则业务会迅速分流到其他平台(例:高德),切换成本很低。

    3、供给的壁垒

    对于重决策的交易,服务的效用非常高,线下服务能力不再是累赘,而是业务的护城河。

    例如链家庞大的线下服务网络,对于自如、贝壳等业务的支撑是非常有效的。

    4、供给的弹性

    当价格发生变化时,如果供给量能够大幅变动,则称之为富有弹性的产品。

    例如:当天猫的YSL 5折促销,此时尽管需求倍增,供给也能尽快跟上,这种类型的交易平台,对于供需双方都有很高的价值。但滴滴就不一样,高峰期的需求倍增,无法瞬时提供额外的运力,只能通过价格调控,这类交易平台的价值就存在局限性。

    5、供给的边际

    滴滴这类招车公司最大的业务局限就在于单位时间内一辆车只能提供一次服务,边际收入只能通过拼车实现,最多4人/辆(天花板),而淘宝、天猫这类交易平台,单位时间的边际收入可以是非常大的,这也造就了李佳琪、薇娅几位带货顶流的成功。

    一个交易平台要想做好,更重要的是对供给端的整合、运营、打磨,这个基本的问题,我想了整整三年。我认为产品经理的天赋差异,体现在“透过现象看本质”的能力上,看本质不等同于深度思考,它是一种意识/感觉,有些人没有特别强的深度思考能力,也能很快看透事物的本质,令人羡慕不已。

    Prat2  一个产品学派的诞生

    回到本文最初提到的豆瓣差评问题,我个人的看法是,俞军这种中国互联网顶级的产品经理写书,更有价值的是开创一个学派,将自己的产品观理论化(“道”的层面),而不是教大家如何做好“用户中心、订单系统”这种具体的模块(“术”的层面)。

    就像经济学,有偏向政府干预的凯恩斯学派、以林毅夫为代表的新结构主义;也有提倡自由主义的奥地利学派、芝加哥学派。不同学派的内在逻辑、论证方法都有很大的区别。

    我们来看一下,2016年11月9日在北京大学国家发展研究院举行的“产业政策思辨”会上,林毅夫老师(新结构主义)与张维迎(奥地利学派)老师的辩论节选:

    经济不断发展需要政府帮助这些企业家来解决在技术上和软硬上的问题,但是他需要协调的软硬基础设施,不同的产业是不一样的,或是有些差异的。

    如果政府有无限多的资源,当然我什么都需要,什么都给支持。但是政府的执行能力是有限的。就像美国那么有钱的政府,现在支持美国科研的基础上钱也是有限的,不可能说所有的可能的基础科研都支持,因为它还是有选择的,有选择的就说明有产业政策,需要战略性资源。这样才能够让有限的政府跟执行能力取得最大的成绩。

    ——林毅夫

    我注意的是中国的产业政策,其实产业政策就是“穿着马甲的计划经济”。从上世纪80年代开始,产业政策失败的例子可以说是比比皆是,成功的例子很少,我没找到。中国经济的持续失调,产能过剩,哪一个不是我们政府产业政策主导的?

    我更有兴趣地是如何在理论上解释产业政策为什么失败,我发现产业政策失败的原因和计划经济失败的原因完全一样,简单地说,产业政策之所以失败,第一是由于人类认知能力的限制,第二是激励机制的扭曲。通俗地讲,第一是无知,第二是无耻。

    ——张维迎

    图14:2016年产业政策思辨会,林毅夫(左)、张维迎(右)

    俞军老师开创的则是将经济学、心理学融合到产品实践中的学派。包括了微观经济学的效用、边际、产权、机会成本等,包括行为经济学里的心理账户、厌恶损失、锚定效应等;并针对供需定律、交易成本做了重点解读。

    图15:厌恶损失对收益的边际影响(图:信量投资)

    我相信,这个学派的开创一定会在中远期影响几代的产品经理,推动他们不断发展这套理论。

    这个功利主义的时代,人人都想成为成功者的门徒。

    也许在未来,张小龙也会开创一个学派,一个朴素哲学的产品学派,没有这么多抽象的经济计算,只有对用户的敬畏之心。

    做对用户有价值的事情,这句话是很朴素的,跟公司以前倡导的一切以用户价值为依归,没什么区别。但是越朴素做起来越困难,没有认真想会出现很多意想不到的问题。

    ——张小龙

    当真正的布道者走在时代的前面,就有可能创造出繁荣的思想市场,这恰恰是当下中国最缺乏的东西。

    点个“在看”吧

    展开全文
  • 2021五一杯数学建模B题消防救援问题 消防救援问题 随着我国经济的高速发展,城市空间环境复杂性急剧上升,各种事故灾害频发,安全风险不断增大,消防救援...问题1将每天分为三个时间段0:00-8:00为时段Ⅰ8:00-16:

    2021五一杯数学建模B题消防救援问题

    消防救援问题
    随着我国经济的高速发展,城市空间环境复杂性急剧上升,各种事故灾害频发,安全风险不断增大,消防救援队承担的任务也呈现多样化、复杂化的趋势。对于每一起出警事件,消防救援队都会对其进行详细的记录。
    某地有15个区域,分别用A、B、C…表示,各区域位置关系及距离如图1所示,各区域的人口及面积见附件1,该地消防救援队出警数据见附件2。
    请依据该地的消防出警数据,建立数学模型,完成以下问题:
    问题1:将每天分为三个时间段(0:00-8:00为时段Ⅰ,8:00-16:00为时段Ⅱ,16:00-24:00为时段Ⅲ),每个时间段安排不少于5人值班。假设消防队每天有30人可安排值班,请根据附件数据,建立数学模型确定消防队在每年2月、5月、8月、11月中第一天的三个时间段各应安排多少人值班。
    问题2:以该地2016年1月1日至2019年12月31日的数据为基础,以月份为单位,建立消防救援出警次数的预测模型;以2020年1月1日至2020年12月31日的数据作为模型的验证数据集,评价模型的准确性和稳定性,并对2021年各月份的消防救援出警次数进行预测,完成表1。
    问题3:依据7种类别事件的发生时间,建立各类事件发生次数与月份关系的多种数学模型,以拟合度最优为评价标准,确定每类事件发生次数的最优模型。
    问题4:根据图1,请建立数学模型,分析该地区2016-2020年各类事件密度在空间上的相关性,并且给出不同区域相关性最强的事件类别(事件密度指每周每平方公里内的事件发生次数)。
    问题5:依据附件2,请建立数学模型,分析该地各类事件密度与人口密度之间的关系(人口密度指每平方公里内的人口数量)。
    问题6:目前该地有两个消防站,分别位于区域J和区域N,请依据附件1和附件2,综合考虑各种因素,建立数学模型,确定如果新建1个消防站,应该建在哪个区域?如果在2021-2029年每隔3年新建1个消防站,则应依次建在哪些区域?

    问题分析:

    针对问题 1,关于确定人数值班问题,首先筛选并统计出 2020 年、2019 年、
    2018 年、2017 年、2016 年的 2 月、5 月、8 月、11 月的第一天的三个时间段的出警次数,通过灰色预测方法得到每年的这 2 月、5 月、8 月、11 月这四个月第一天的三个时间段出警次数的预测数据。在对三个时间段各分配 5 人的基础上,根据每个
    月第一天的三个时间段对应的权重比例对剩余 15 人进行合理分配,计算出人员分配的人数。
    针对问题 2,我们引入 ARIMA 预测模型,利用差分法对数据进行平稳性处理, 使得模型更加稳定和准确,对模型的检验我们采用平稳性 R 方与显著性检验。
    针对问题 3,我们选用了插值拟合和 ARIMA 两种模型,以此来建立各类事件发生次数与月份的关系。

    针对问题 4,我们首先绘制散点图判断出各类事件在空间上具有相关性,为了直观表示各指标在不同区域之间的相关性,采用皮尔逊系数进行直观展示。
    针对问题 5,我们首先绘制散点图判断出人口密度与事件具有线性关系,由此可以采用灰色关联模型进行分析。
    针对问题 6,选择消防站需要考虑的因素最多的就是平均出警距离,所以在本问题中我们选择出警距离作为建立消防站的唯一评判因素。利用 Dijkstra 算法计算各区域之间的最短距离,计算在区域 J 和区域 N 以外的 13 个区域新增一个消防站后的平均出警距离,取新增后平均出警距离最小的区域作为建消防站的区域。

    模型的建立与求解:

    在这里插入图片描述
    针对问题 3,确定每类事件发生次数的最优模型。第一步:建立模型
    先按照年份区分所有数据,观察发现数据基本无规律性,是属于随机事件。后决定采用插值与拟合和 ARIMA 预测模型,来建立各类事件发生次数与月份关系的数学模型 ,评价出拟合度最优的模型。

    1. 插值与拟合
      先求出 5 年数据相对应月份的均值,再分别对 7 类事件进行拟合,采用三次样
      条插值的方法,拟合效果如图 5 所示
      在这里插入图片描述

    问题求解时的部分程序代码:

    第一问:

    load &apos;xx.mat&apos; n=length(y); yy=ones(n,1);
    yy(1)=y(1);
    for i=2:n
    yy(i)=yy(i-1)+y(i)
    end
    B=ones(n-1,2);
    # 数据的计算逻辑
    # 企鹅 917267119
    for i=1:(n-1)
    B(i,1)=-(yy(i)+yy(i+1))/2; B(i,2)=1;
    end BT=B&apos;; for j=1:(n-1)
     
    YN(j)=y(j+1);
    end YN=YN&apos;;
    A=inv(BT*B)*BT*YN; a=A(1);
    u=A(2);
    t=u/a;
    t_test=input(&apos;输入需要预测的个数&apos;); i=1:t_test+n;
    yys(i+1)=(y(1)-t).*exp(-a.*i)+t; yys(1)=y(1);
    for j=n+t_test:-1:2 ys(j)=yys(j)-yys(j-1);
    end x=1:n;
    xs=2:n+t_test; yn=ys(2:n+t_test);
    plot(x,y,&apos;^r&apos;,xs,yn,&apos;*-b&apos;); det=0;
    for i=2:n
    det=det+abs(yn(i)-y(i));
    end det=det/(n-1);
    disp([&apos;百分绝对误差为:&apos;,num2str(det),&apos;%&apos;]);
    disp([&apos;预测值为:&apos;,num2str(ys(n+1:n+t_test))]);
    

    第三问:

    load(&apos;data_of_202151B.mat&apos;)
    
    PolicyTimes=[]; for i=2016:2020
    for j=1:12
    
    index =intersect(find(Year==i),find(Month==j)); PolicyTimes=[PolicyTimes;i,j,length(index)];
    end
    end
    %% 绘制图像
    for i=2016:2020
    plot(PolicyTimes(PolicyTimes(:,1)==i,2),PolicyTimes(PolicyTimes(:,1)==i,3),&apos;line width&apos;,3)
    hold on grid on end
    legend(&apos;2016&apos;,&apos;2017&apos;,&apos;2018&apos;,&apos;2019&apos;,& apos;2020&apos;,&apos;Location&apos;,&apos;Best&apos;);
    
    
    s = 12;
    x = PolicyTimes(1:48,3)&apos;; n = 12;
    m1 = length(x); for i = s+1:m1;
    y(i-s) = x(i) - x(i-s);
    end
    w = diff(y);
    m2 = 12;%length(2); k=0;
    % for i = 0:5
    %	for j = 0:5
    %	if i == 0 & j == 0
    %	continue
    %	elseif i == 0
    %	ToEstMd = arima(&apos;MALags&apos;,1:j,&apos;Constant&apos;,0);
    %	elseif j == 0
    %	ToEstMd = arima(&apos;ARLags&apos;,1:i,&apos;Constant&apos;,0);
    %	else
     
    %	ToEstMd = arima(&apos;ARLags&apos;,1:i,&apos;MALags&apos;,1:j,&apos; Constant&apos;,0);
    %	end
    %	k = k + 1;
    %	R(k) = i;
    %	M(k) = j;
    %	[EstMd,EstParamCov,LogL,info] = estimate(ToEstMd,w&apos;);
    %	numParams = sum(any(EstParamCov));
    %	[aic(k),bic(k)] = aicbic(LogL,numParams,m2);
    %	end
    % end
    % fprintf(&apos;R,M,AIC,BIC 的对应值如下\n%f&apos;);
    % check = [R&apos;,M&apos;,aic&apos;,bic&apos;]
    
    R=5; M=2;
    ToEstMd = arima(&apos;ARLags&apos;,1:R,&apos;MALags&apos;,1:M,&apos;Consta nt&apos;,0);
    [EstMd,EstParamCov,LogL,info] = estimate(ToEstMd,w&apos;); w_Forecast =  forecast(EstMd,n,&apos;Y0&apos;,w&apos;); yhat = y(end) + cumsum(w_Forecast);
    for j = 1:n
    x(m1 + j) = yhat(j) + x(m1+j-s);
    end
    
    fprintf(&apos;2020 年各月份预测出警次数为&apos;); x(m1+1:end)
    
    
    hold on plot(1:12,x(m1+1:end),&apos;linewidth&apos;,3) axis([1 12 0 280])
    legend(&apos;2016&apos;,&apos;2017&apos;,&apos;2018&apos;,&apos;2019&apos;,& apos;2020&apos;,&apos;2020predict&apos;,&apos;Location&apos;,&apos;Best&apos;);
    
    fprintf(&apos;各月份预测的准确性为&apos;);
    Accuracy=(x(m1+1:end)-PolicyTimes(49:end,3)&apos;)./PolicyTimes(49:end,3)&apos;
    
    
    s2 = 12;
    x2 = PolicyTimes(1:60,3)&apos;; n2 = 12;
    m_2 = length(x2); for i = s2+1:m_2;
     
    y2(i-s2) = x2(i) - x2(i-s); end
    w2 = diff(y2);
    
    
    R2=5; M2=2;
    ToEstMd2 = arima(&apos;ARLags&apos;,1:R2,&apos;MALags&apos;,1:M2,&apos;Con stant&apos;,0);
    [EstMd2,EstParamCov2,LogL2,info2] = estimate(ToEstMd2,w2&apos;); w_Forecast2 = forecast(EstMd2,n2,&apos;Y0&apos;,w2&apos;);
    yhat2 = y2(end) + cumsum(w_Forecast2); for j = 1:n2
    x2(m_2 + j) = yhat2(j) + x2(m_2+j-s2);
    end
    fprintf(&apos;2021 年各月份预测出警次数为&apos;); x2(m_2+1:end)
    
    %% 绘制图像
    hold on plot(1:12,x2(m_2+1:end),&apos;linewidth&apos;,3)
    legend(&apos;2016&apos;,&apos;2017&apos;,&apos;2018&apos;,&apos;2019&apos;,& apos;2020&apos;,&apos;2020predict&apos;,&apos;2021predict&apos;,&apos;Location &apos;,&apos;Best&apos;
    

    第五问:

    load(&apos;x.mat&apos;) x=x1;
    for i=1:5
    for j=1:9 x(i,j)=x(i,j)/x1(1,j) end
    end x1=x
    for i=1:5
    for j=1:9 x(i,j)=abs(x(i,j)-x1(i,1)) end
    end max=x(1,1) min=x(1,1) for i=1:5
    for j=1:9 if x(i,j)>=max
    max=x(i,j)
    end
    end end
    for i=1:5
    for j=1:9 if x(i,j)<=min
    min=x(i,j)
    end end
    end
    k=0.5 %分辨系数取值
    l=(min+k*max)./(x+k*max)%求关联系数矩阵guanliandu=sum(l&apos;)/n [rs,rind]=sort(guanliandu,&apos;descend&apos;) %对关联度进行排序
    
    
    
    
    展开全文
  • 想挑战一下自己能不能做一做数据相关的工作,准备在暑期尝试投一投数据分析相关的实习。 虽然希望不大,但还是要努力准备一下,整理了一部分面试/笔试时可能会考的业务题...、指标搭建/选取问题 四、异常归因问题
  • 题目A题 疫苗生产问题 新冠肺炎肆虐全球,给世界带来了深重的灾难。各国控制疫情纷纷研发新冠疫苗。假定疫苗生产需要经过CJ1工位、CJ2工位、CJ3工位以及 CJ4工位等4工艺流程。每工艺流程一次性均能处理100剂...
  • 五一数学建模B题消防救援问题详解【附联系方式,不懂可问】 网上很多人都给出了自己的解题思路,有的没啥参考价值,完完全全是错的。 我参考了网上其他人的解题思路,再通过自己的理解,现在已经把B题完完整整地做...
  • 消防救援问题

    2021-05-19 15:24:53
    消防救援问题 随着我国经济的高速发展,城市空间环境复杂性急剧上升,各种事故灾害频发,安全风险不断增大,消防救援队承担的...问题1将每天分为三个时间段0:00-8:00为时段Ⅰ8:00-16:00为时段Ⅱ,16:00-24:00为时
  • 医疗器械答疑解惑之

    千次阅读 2019-09-16 14:41:25
    答:对于外周血管内支架产品,目前临床试验采用的主要研究终点一般建议12月的靶血管通畅率。 57 有源医疗器械组合产品中每单独的模块都是《免于进行临床试验的医疗器械目录》中的产品,组合产品是否也可视...
  • 通信原理(复习)

    万次阅读 多人点赞 2020-10-25 14:39:27
    (±1交替出现,但连0数必须≤3) 步骤: 现原信息变为AMII码 当Number(0)=4,用取代节“000V”(前方奇数±1)或“B00V”(前方偶数±1)代替 V(Violation)的极性与前一0符号(包括B)的极性相同,B...
  • 读书笔记-袁腾飞讲高效学习法

    千次阅读 2018-08-20 16:59:32
    作者:袁腾飞 李峰学序言1 没有笨学生,只有笨方法也有一些学生,他们该学的时候学,该玩的时候玩,花费的学习时间相对较少,每次考试却总能考高分,让埋头于书山题海的同学羡慕不已。这些学生的智力并不比其他学生...
  • 2021五一数学建模B题思路

    千次阅读 2021-05-08 15:22:39
    2021五一数学建模B题 消防救援问题 B题 消防救援问题 随着我国经济的高速发展,城市空间环境复杂性急剧上升,各种事故灾害频发,安全风险不断增大,消防救援...问题1将每天分为三个时间段0:00-8:00为时段Ⅰ8:00-
  • 2.2.4异常值处理(时间不在范围内) #检查时间始末 select MAX(Date_time),Min(Date_time) from userbehavior #时间最大值2017-12-04 00:00:06 #时间最小值2017-09-11 16:16:39 不符合 要删除异常值 delete ...
  • 认知科学期末复习笔记

    千次阅读 多人点赞 2021-12-20 18:18:51
    1)人格动力观:潜意识、欲力、生死之本能解释人 类行为的内在动力 2)人格发展观:解释个体心理发展的历程 3)人格结构观:用本我、自我、超我者解释个体 的人格结构,以冲突、焦虑以及各种防卫机制等观 念解释...
  • 电商用户行为分析——sql实战项目

    千次阅读 2022-03-09 17:18:14
    1)检查是否存在重复值 #检查是否存在重复值 SELECT * FROM userbehavior GROUP BY User_ID, Item_ID, Cate_ID, Behav_type, Timestamp HAVING COUNT(*)>1; 不存在重复值 2)缺失值处理 #缺失值处理 ...
  • 泵与泵站考试复习题

    2022-03-30 14:52:33
    n 外加的机械能转化被输送液体的能量,使液体获得动能或势能的机械设备叫做泵。 1-2.水泵的分类,叶片泵的分类。 n 1. 叶片泵:靠叶片运动拨动水,使水产生运动来完成能量传递的泵 n (1)离心泵:液体质点主要受...
  • 文章目录前言一、项目背景和需求1.项目背景2.分析目的二、数据集摸底并找出问题2.1...以类别字段主-‘行为类型’3.5 查找缺失值3.6 处理与时间相关的问题(一致化处理)3.7 异常值处理3.8 最终数据范围(维度和数量)
  • 深入理解HTTP协议

    千次阅读 2011-07-14 17:01:06
    http协议学习系列1. 基础概念篇1.1 介绍 HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写。它的发展是万维网协会(World Wide Web Consortium)和Internet工作小组IETF(Internet Engi
  • 1、【单选题】饮用水源地全年采样不少于( )次,采样时间根据具体情况选定。 A、6 B、8 C、10 D、12 参考资料【 】 2、【单选题】蒸馏法是利用水样中各污染组分具有 而使其彼此分离的方法。 A、不同组分 B、不同的...
  • 三相桥式全控整流电路

    千次阅读 2020-12-29 04:37:29
    1主电路的原理1.1 主电路其原理图如图...此外,习惯上希望晶闸管按从1至6的顺序导通,为此晶闸管按图示的顺序编号,即共阴极组中与a、b、c三相电源相接的3晶闸管分别VT1、VT3、VT5,共阳极组中与a、b、c三相电...
  • User Behavior 是来自淘宝的用户行为数据集,用于隐式反馈的推荐问题。数据集由阿里巴巴提供。随机选取了大约 100 万用户在 2017 年 11 月 25 日至 12 月 3 日期间具有点击、购买、添加商品到购物车和商品偏好等行为...
  • 1互联网的下半场过去,平台的黄金时代互联网上半场的商业模式,主要是以满足C端用户需求核心的平台产品,包括:社交平台、电商平台、团购平台、出行平台、内容平台。平台通过链接人与人,内容与人...
  • 《电力电子技术》提纲

    千次阅读 多人点赞 2013-01-02 16:18:33
    1 电力电子技术定义:是使用电力电子器件对电能进行变换和控制的技术,是应用于电力领域的电子技术,主要用于电力变换。 2 电力变换的种类 (1)交流变直流AC-DC:整流 (2)直流变交流DC-AC:逆变 (3)直流...
  • 大地测量学基础 (复习)

    千次阅读 多人点赞 2020-05-13 00:09:08
    写在前面 这篇博文是用来复习课程... AT=UT2-0.0039(s)AT=UT2-0.0039(s)AT=UT2-0.0039(s) 地球自转的不均性,原子时与世界时的误差逐年积累。 协调世界时(UTC) 原子时与地球自转没有直接联系,由于地球自转速度...
  • 软件测试选择题

    2019-03-16 22:51:36
    其中C是平均的并发用户数,n是平均每天访问用户数,L是一天内用户从登录到退出的平均时间(操作平均时间),T是考察时间长度(一天内多长时间有用户使用系统) 并发用户数峰值计算:C^约等于C + 3*根号C 其中C^是...
  • 大地测量学基础(复习)第二部分

    千次阅读 2020-05-14 21:40:28
    前面已经有一篇“大地测量学基础(复习)”了,但单篇博文篇幅过长,遂分割为三部分,第一、二、章为第一部分,第四章为第二部分,第五章为一部分。 本篇博文第二部分。 目录写在前面第4章 大地测量基本技术与...
  • 基于深度学习心电图(ECG)特征识别

    千次阅读 多人点赞 2020-06-01 12:19:10
    @[人工小将(深度医疗(1) - 基于深度学习心电图(ECG)特征识别)] 基于深度学习心电图(ECG)特征识别 深度医疗是笔者基于深度学习的医学项目应用开发实践,经过整理输出了文档和本系列课程,希望通过分享可以和大家...
  • 淘宝用户行为分析

    2020-02-08 16:16:44
    现在越来越多的线下转型到了线上经营,线下体验店线上购物成为日后消费的大趋势。分析用户行为,走好转型之路,掌握先机快人一步。 文章目录前言背景 数据来源Ⅱ 数据背景Ⅲ 分析目的 背景 数据来源 数据来源...

空空如也

空空如也

1 2 3 4
收藏数 76
精华内容 30
关键字:

问题1:将每天分为三个时间段(0:00-8:00为时段Ⅰ,8:00-16:00为时段Ⅱ,16:00-24:00