精华内容
下载资源
问答
  • 位置预测
    千次阅读
    2019-04-08 21:27:08


    文章来自:李雯. 动态关系下的移动对象位置预测方法研究[D].


    1.研究现状

      移动对象未来位置预测,主要以移动对象的历史行为数据,即轨迹数据作为研究对象,通过挖掘个体和群体运动中潜在的时空规律性以及移动对象运动中的交互情况来认识个体行为偏好,从而达到准确预测目的。在移动对象位置预测领域,大量的方法和策略被提出。根据位置预测时是否利用移动对象长期历史运动 模式,位置预测方法可以被分为基于运动函数的位置预测方法以及基于运动模型 的位置预测方法。

      基于运动函数的位置预测方法主要考虑移动对象的近期运动情况(例如速 度、方向等),通过模拟移动对象的运动行为,与线性或者非线性的运动函数拟 合,对未来位置进行预测 [28-30] 。然而,现实生活中,对象运动远比运动函数所描 述的更加复杂。由于运动函数利用近期的运动数据,仅能对距离现在较近时间的 位置进行预测,且无法解决突发事件对预测的影响。

      由于基于运动函数的位置预测方法存在很多缺点,且移动对象日常活动并非 随机的,在一定程度上体现出时空规律性。充分学习移动对象历史轨迹数据,能 够在对象处于相似情形时进行预测,于是,大量研究者们开始使用基于数据挖掘 的方法来学习移动对象的历史运动规律 [20, 39-44] 。例如,从移动对象历史轨迹数据 中提取关联规则 [45] 、频繁模式 [46] 、建立贝叶斯网络 [47-49] 、马尔可夫 [50-57] 或隐马 尔可夫模型 [58-62] 、神经网络模型 [63-65] 等。
    根据位置预测时使用的数据源是否来自单一移动对象,位置预测方法被分为 个性化的位置预测方法以及一般化的位置预测方法。个性化位置预测方法认为每 个人的运动都是相互独立的,因此仅以移动对象个人历史轨迹为输入,而一般化 位置预测方法认为不同移动对象间存在一定的相似性,且不同对象间的运动会相 互影响,因此其使用所有对象的运动数据或者与被预测对象具有相似运动模式、 行为偏好的其他用户数据 [66] 进行协同预测。

      个性化位置预测时仅利用单个用户的轨迹数据进行分析,不适用于其他用 户。另外,对于个人运动数据较少的用户或者新用户,可能会遇到数据稀疏问题。 因此,需要通过挖掘群体用户的轨迹数据来进行协同位置预测。一般化的位置预 测方法在利用其他用户轨迹数据训练预测模型时,由于日常行为习惯、运动偏好 间的不同,如果只使用运动重叠信息进行预测往往不能达到很好的效果 [67, 68] 。所 以为了提高预测精度,一般化的预测方法中经常需要针对移动对象运动中存在的 相似性进行度量,选择相似度更高的移动对象轨迹数据。

      由于移动对象的多样性以及运动的复杂性,不同移动对象具有不同的运动习 惯,相同移动对象在运动过程中,也可能包含多种运动模式,并且在与朋友进行 交互时,很可能受到其朋友活动的影响。因此,单一预测假设无法完整得描述移 动对象所有的日常行为。虽然大量的移动对象位置预测方法被提出,却无法找到 唯一的最优算法来取代其他算法,需要根据具体的数据类型、应用情况、甚至不 同时间的实时信息,选择不同的预测模型。例如, Jeung 等 [69] 提出根据预测的时期运动进行预测,而对较远时间的位置进行预测时,使用轨迹模式进行预测。 Vincent 等 [70] 使用多种策略来融合动态贝叶斯模型( DBN )、人工神经网络( ANN ) 以及梯度提升决策树( GDBT )的预测结果来达到更优的预测效果。

      在总结移动对象轨迹数据特征及现有的移动对象位置预测理论、方法、相关 技术的基础上,本文发现虽然在部分应用场景下,现有方法能够在一定程度上解 决位置预测问题,但是仍然存在几点挑战及问题:

      ( 1 )全面分析和建模。轨迹数据是移动对象在地理范围内活动时产生的历 史记录,是研究对象运动特征的基本数据。轨迹数据由若干包含时间和空间信息 的采样点序列组成,当前针对移动对象位置进行预测时,一般以预测移动对象未 来访问的兴趣区域(例如家、超市等具有语义含义的位置,而非具体的经纬度点) 为目标,过分关注兴趣区域(高层)活动行为,而忽略了轨迹数据中的低层采样 点序列形成的路径信息对未来位置的影响,因此,无法更全面的对移动对象运动 进行分析和建模。

      ( 2 )稀疏性问题。由于移动对象在日常生活中,一般仅访问少量位置,且 可能访问以往未访问过的新位置,因此无法捕获用户对所有潜在兴趣区域的偏好 程度,在一定程度上带来稀疏问题。此时需要借助额外的数据来帮助对用户行为 的分析,由于移动对象并非孤立的个体,日常活动中存在一定的社会交往且可能 接受别人的推荐,因此,需要研究更合理的方法来建立用户与社交朋友间的交互 运动模式。

      ( 3 )预测模型的多样性。现有的研究以特定领域内的全部用户作为研究对 象,并为其建立统一的运动模型,基于不同的个人数据训练不同的参数。然而, 不同对象具有多样的运动方式和行为习惯,结合个人运动的特殊性有针对性的建 模能够更好地理解移动对象运动模式,因此,在对移动对象轨迹进行分析时,需 要考虑不同模型对于个体运动的适应性。


    2.轨迹数据概述及移动对象位置预测相关技术

    2.1 移动对象轨迹数据概述

      移动对象轨迹可以看作是移动对象随时间在空间范围内运动所产生的记录, 采样点主要包含地理位置信息、时间信息,还可能含有移动个体的运动特征信息 (例如速度、加速度等),将这些信息按照时间顺序连接起来就是轨迹数据。

    2.1.1 轨迹数据的获取

      当前, GPS 设备、传感器网络、无线通信等技术以及基于位置的社交网络快 速发展,使得移动对象的物理位置能够很容易被收集到,移动对象轨迹数据能够 通过直接获取和隐式推理两种方式获得。

      ( 1 )直接获取。直接获取是指移动设备记录位置的方式为准确的经纬度数 值或者语义位置点,能够直接用于后续的分析和挖掘。例如,户外运动爱好者使 用带有 GPS 装置的移动设备记录运动路线,以一定的时间和地理距离间隔记录移 动对象具体的经纬度。众多用户在餐厅、商场、旅游景点等的签到(经纬度、地 点 ID 、签到时间)序列可以看作人们的移动轨迹。大量交通工具(例如私家车、出 租车、公交车、船、飞机等)使用定位设备采集移动对象在空间内的轨迹数据 [71] 。通 过为老虎、鸟类等动物携带定位设备可以研究动物的迁徙规律,行为和生存状况 [72] 。智能手机能够定位当前设备所处的基站位置,从而反映手机终端持有者的移 动轨迹数据。基于卫星遥感监测、天气雷达监测以及地面自动气象站监测等技术 可以获取的飓风、台风等自然现象的轨迹数据。

      ( 2 )隐式推理。隐式推理表示不能从原始记录的数据中直接读取固定的位 置值,需要通过一定的推理来获得其中隐含的位置信息。例如,用户在基于位置 的社交网络中以文字的形式记录行程,并涉及语义位置信息。在 Flickr 中,一系 列地理标记的照片能够形成一个空间轨迹,因为每张照片都有拍摄该照片的相应 地点标注和时间戳。视频监控系统对移动对象(人类、动物等)进行实时监控, 并从视频中不同帧提取所对应的地理位置,从而获得其运动轨迹。

    2.1.2 轨迹数据的分类

      不同应用场景下,不同的移动设备被用来记录移动对象的轨迹,使得空间轨 迹数据在特征属性、采样频率、轨迹长度、运动规律等方面都有很大的不同,最 常用的数据类型包括:

      ( 1 ) GPS 数据。 GPS 设备由于其小巧、便宜等特点,能够被嵌入至车载装 置或手持终端,从而很容易得获得轨迹数据;然而, GPS 设备在室内或室外有遮 挡的地方无法正常工作,存在一定程度的数据缺失,并且 GPS 数据为高频连续 采样数据,需要额外的处理将原始的采样点序列转化为语义位置序列。

      ( 2 )移动手机数据。随着智能设备的普遍使用,移动手机数据能够很容易 的被获取;然而,移动手机只在用户打电话、发短信或使用网络服务时记录距离 用户最近的信号塔位置。由于每个塔的覆盖范围由城市密集区域的几百米到郊区 的几千米范围不等,无法分辨出移动对象在小范围内的运动,常常将距离较远的 位置标记为相同位置,严重的限制了在细粒度水平分析对象运动模式的能力。

      ( 3 )基于位置的社交网络数据。当用户登录基于位置的社交网络( LBSNs , 例如 Foursquare, Gowalla, Facebook Places etc. )时,通过在线 check-in 行为来记 录用户当前所在位置。签到数据只在用户进行标记时被收集,具有数据稀疏性, 而用户很可能只在其感兴趣的位置进行签到,可能造成日常最常访问位置数据的 缺失。另外, LBSNs 数据集中还记录了用户社交圈内的朋友关系数据,可以研 究社交关系对用户移动行为的影响。

      ( 4 )无线网络定位。 Wifi 、 Zig Bee 等技术具有较高的定位精度,但需要在 环境中部署大量的无线节点,需要较多的前期投入,通常用于室内定位。

      ( 5 )混合数据。此类数据集包含多种来源的数据和额外数据,例如 GPS 、 加速度器、 GSM 、蓝牙、 WLAN 以及蜂窝网络等。在某种类型数据出现缺失时, 可以使用其他类型数据进行补偿。当多种定位技术和定位设备能够同时监测到一 个移动目标时,可以同时得到多个定位数据,通过采用合适的融合算法,可以提 高定位精度。然而,由于定位误差的存在,如何解决数据特征的不匹配以及数据 冲突是进行数据融合的关键。

    2.1.3 轨迹的相关概念

      轨迹是移动对象运动中在时空维度内留下的记录,虽然不同的定位设备、应 用场景下产生的信息量和信息维度有很大不同,例如,车载 GPS 设备产生的采 样点可能包含经纬度、时间标签、速度、加速度,而在基于位置的社交网络中, 除了用户签到时产生的时空信息,还可能包含用户间的朋友关系,每次签到时的 短文本信息。基本上移动对象的采样点都包含经纬度以及时间信息,本文以最基 础的特征为例,给出轨迹数据挖掘中涉及到的一系列定义的形式化表示。

       定义 2-1 :轨迹点是移动对象运动过程中每次采样时被记录的信息,通常包 含当前位置以及采样时间。采样点 p 可以表示为一个三元组
    p = ( x , y , t ) p=(x,y,t) p=(x,y,t)
    其中 x x x表示经度, y y y表示纬度, t t t为采样时间。轨迹点是移动对象轨迹中最基本的数据单元,由时间和空间信息组成。

    定义 2-2:移动对象的轨迹 T r a Tra Tra 由一系列按照时间排序的轨迹点组成。
    T r a = ( p 1 , p 2 , … , p n ) ( p i = ( x i , y i , t i ) ) Tra=(p 1 ,p 2 ,…, p n )(p i =(x i ,y i ,t i )) Tra=(p1,p2,,pn)(pi=(xi,yi,ti))
    其中 p i pi pi为移动对象在第 i 次采样时的轨迹点, n n n为轨迹中包含的轨迹点的数 量,即轨迹的长度。连续的轨迹点也常被称为轨迹段,例如 ( p i , … , p j ) (p i ,…, p j ) (pi,,pj)。移动对象 轨迹描述了用户在运动过程中产生的地理信息,是研究移动对象运动行为时最常 见的数据结构。

    更多相关内容
  • 传统的移动用户位置预测方法由于模式支持度计算方式不合理,存在预测精度偏低的问题。为此,提出了一种基于模式匹配度的用户移动规则挖掘及位置预测方法,并将其用于移动通信系统中,以基台覆盖范围网格为单元的用户...
  • 利用python的机器学习算法进行经纬度预测
  • 提出一种基于运动趋势的移动对象位置预测算法,不仅借鉴马尔可夫模型思想对移动对象的历史活动轨迹进行建模,而且将对象的运动趋势作为位置预测的重要因素。以全体历史停留区域作为未来位置的候选,根据位置的特征,...
  • 基于时空特性RNN的用户位置预测研究,李泽捷,张健明,自2009年开始,大数据一词逐渐进入人们的视野。大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合。来自通讯运营商的大��
  • 由于采集点丢失或出现新用户等原因,GPS轨迹数据往往具有稀疏性,使得基于单个用户数据的位置预测准确率较低.针对这种情况,提出了基于移动行为相似性和用户聚类的Markov位置预测方法.首先,基于Voronoi图和原始GPS轨迹...
  • 一种融合位置语义信息的位置预测算法,付莉莉,李朝晖,近年来,使用用户的历史位置信息挖掘用户移动轨迹信息并进行位置预测成为研究热点。针对现有研究工作仅使用用户地理位置及时间属
  • k-近邻算法-预测入住位置(数据集) kaggle下载很麻烦 下载txt文档,里面是百度网盘的链接,永久有效 k-近邻算法-预测入住位置(数据集) kaggle下载很麻烦 下载txt文档,里面是百度网盘的链接,永久有效
  • 根据给出的速度与位置向量,预测两天后卫星在轨道上面的位置
  • 典型的延迟容忍网络(DTN)中,由于中继...仿真分析表明,采用这样的位置预测算法,可以克服DTN中观测数据经常缺失的缺点,可实现对DTN节点的位置进行在线预测,与对坐标值进行直接预测相比,其准确性有进一步提高。
  • 您可以使用它来预测目标的未来位置,以减少检测到的位置中的噪声,或帮助将多个目标与其轨迹关联起来。
  • 卡尔曼滤波,能够进行目标位置预测与识别
  • 通过读取广播星历文件进行卫星位置计算,将计算出的位置转化到WGS-84坐标系中,根据设定的用户位置以及卫星的位置,可计算出可视卫星。并且该算法有位置预测功能。星历文件路径需要自己改。其中附带广播星历文件。
  • 利用模拟行为数据的 仿真结果表明,和其他的预测模型相比,周期时变马尔可夫位置预测模型具有较小的时间复杂度、较高的预测精度 和较快的预测精度收敛速度,能够在智能数字家庭环境中进行实时、高精度的位置预测
  • 基于概率后缀树的时空轨迹位置预测,李萍,孙礼,近年来,移动对象的位置预测引起了广大研究人员的关注。传统的位置预测算法主要考虑移动对象在空间上的转移规律,而忽略了历史轨��
  • 1.11 案例2:预测facebook签到位置--缩小范围后数据集
  • GPS信号中断时基于偏最小二乘回归的车辆位置预测,王东,廖嘉琦,在智能交通系统(ITS)中,车辆的位置预测是至关重要的,而对位置预测的精确度要求更是日益显著。本文提出了一种能够在GPS失效情况
  • 由于蛋白质的功能与亚细胞位置有关,可以通过预测蛋白质的亚细胞位置来推断蛋白质分子的功能.首先介绍了SOM模型和Batch-Type SOM模型,并用这两个模型分别预测了蛋白质的亚细胞位置,结果表明,使用SOM模型和Batch-Type ...
  • 现有方法通常要么关注长期到访位置预测,比如几天或者几个月这种时间窗,这可以看作是poi推荐问题,要么关注实时位置预测,此即轨迹预测。 这篇文章集中在弱实时条件下的位置预测,旨在预测用户在接下来的几分钟或者...

    HST-LSTM: A Hierarchical Spatial-Temporal Long-Short Term Memory Network for Location Prediction

    Dejiang Kong and Fei Wu

    Zhejiang University

    https://www.ijcai.org/Proceedings/2018/0324.pdf

    定位技术有助于挖掘人物运动情况,目前已经积累的大量额轨迹数据。

    如何高效利用这些数据来预测位置逐渐成为比较流行的研究课题,位置预测是位置服务(LBS)的基础。现有方法通常要么关注长期到访位置预测,比如几天或者几个月这种时间窗,这可以看作是poi推荐问题,要么关注实时位置预测,此即轨迹预测。

    这篇文章集中在弱实时条件下的位置预测,旨在预测用户在接下来的几分钟或者几小时的运动情况。作者们提出时空长短期记忆模型(ST-LSTM),该模型将时空影响因素加入lstm,进而可以缓解数据稀疏的问题。

    另外,作者们利用一种分层ST-LSTM,以编码解码的形式,对上下文历史到访信息进行建模,进而提升预测效果。

    这篇文章提出的HSTLSTM在真实轨迹数据集上进行了测试,结果表明了其有效性。

    用户轨迹及抽象和模型的图示如下

    不同时间窗之后的目的地分布图示如下

    先前的lstm没有考虑时空因素,作者们将时空因素加入了lstm

    这篇文章的主要贡献在于

    几个基本概念及解释如下

    lstm的组成部分主要有以下几个

    这篇文章的特色在于将时空因子加入lstm中

    时空因子的具体表达式如下,该因子是基于加法算子的,这种算子既精确又高效

    其中q和s的表达式如下

    到访session的编码过程如下

    全局上下文编码方式如下

    解码及预测过程如下

    整体目标函数形式如下

    数据集信息及参数设置如下

    参与对比的方法有以下几个

    衡量指标有以下两个

    效果对比图表如下(指标为ACC@k)

    效果对比图表如下(指标为MRR)

    不同时间窗和空间窗口下效果对比如下(以ACC@1为指标)

    指标随迭代次数的变化趋势图示如下

    时空因素作用于不同的门限单元效果对比如下


                  我是分割线


    您可能感兴趣

    IJCAI2019|基于会话和注意力机制的CTR预估模型DSIN(已开源)

    AISTATS2018|密歇根大学提出新型在线boosting算法用于多标签排序(已开源)

    KDD2019|基于注意力的深度学习如何实时预测购买还是浏览

    AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)

    ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)

    SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)

    SIGIR2019|基于注意力机制的新型深度学习模型(采莓树模型BIRD,已开源)

    SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)

    SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)

    KDD2018|基于GBM的动态定价回归模型

    KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)

    RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

    SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)

    IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN

    聊聊CatBoost

    聊聊XGBoost CatBoost LightGBM RF GBDT

    顶会中深度学习用于CTR预估的论文及代码集锦 (3)

    ICML 2018 深度学习论文及代码集锦(5)

    深度学习用于文本摘要的论文及代码集锦

    深度学习用于机器翻译的论文及代码集锦

    深度学习用于序列标注中的论文及代码集锦

    深度学习在推荐系统中的应用及代码集锦(4)

    深度学习在OCR中的应用论文及代码集锦 (2)

    展开全文
  • 位置预测系列(三)

    千次阅读 2014-06-17 20:56:34
    这篇文章来自于SDM’13年(SIAM InternationalConference on Data Mining 2013)的录用论文集,是关于在基于位置社交网络里面(LBSN)进行用户签到预测的。本文解决问题的角度很创新... 1.1 论文总结 为了预测用户的...

    What’s Your Next Move: User Activity Prediction in Location-based Social Networks

    这篇文章来自于SDM’13年(SIAM InternationalConference on Data Mining 2013)的录用论文集,是关于在基于位置社交网络里面(LBSN)进行用户签到预测的。本文解决问题的角度很创新,并没有直接入手于用户签到预测问题,而是先预测用户的下一个签到活动类型,然后在此基础上,再预测用户的下一个签到位置。

    1.1 论文总结

    为了预测用户的下一个签到活动类型,作者利用隐含马尔可夫模型(HMM)对用户的活动转移进行建模,如下图所示:


    图1:HMM建模用户活动转移

    这里面的解释是认为用户从事某个活动的意愿是由其本身隐含的一个状态所决定的。所以,根据观察到的用户活动序列,即活动1->活动2->...->活动n,可以采用保姆-韦尔奇训练算法(Baum-Welch Algorithm)来对HMM模型的参数进行训练,即各个隐含状态之间相互转化的概率,以及由某个隐含状态输出特定活动类型的概率。在获得这些参数之后,作者通过计算在已知模型参数和观察活动序列的情况下,最有可能达到的隐含状态n+1,然后通过隐含状态n+1来进一步计算活动n+1。但是,这个模型仅仅利用了活动的序列信息,没有考虑到地理位置、时间等因素,所以作者对模型进行改进,采用了混合的隐含马尔可夫模型(Mixed HMM),增加了时空状态对输出活动类型的影响(如图2)。


    图2:Mixed HMM建模用户活动转移

    由于用户签到数据的极大稀疏性,如果对每个用户的活动序列都分别训练出一个个性化的Mixed HMM,所估计的模型参数势必是不准确的。但是,如果集合了所有用户的活动序列,训练一个公共的Mixed HMM来统一表示用户的活动转移,也是不大可能的。因为用户间的活动转移有可能存在很大区别,根本不可能采用一个模型来统一表示。作者在文中采用了一个折中的办法,首先根据每个用户签到记录统计,对所有用户采用K-means方法进行聚类。然后,对每一类的用户的活动转移来分别用一个Mixed HMM来进行建模。这在文中被作者称为是考虑到了用户活动偏好来进行用户签到活动预测。

    在预测得到用户的下一个签到活动类型之后,作者通过搜索以用户当前签到位置为中心的方圆400m×400m的区域范围内,签到类型为所预测类型的位置场所。将这些场所为候选集,作者提出了四种策略来对其进行排序:(1)签到数目;(2)签到用户数;(3)签到数与签到用户数的乘积;(4)单个用户的最大签到数。对于top-k的预测方式,就选取前k个位置场所作为签到预测的结果。

    1.2 读后感

    优点:

    (1)为了避免预测的不平衡性问题,即在庞大的位置候选集中选取某一个位置作为预测的下一个位置,作者将原问题分解为了两个子问题:预测用户的下一个签到活动类型;在预测的签到活动类型的基础上来预测用户的下一个签到位置。由于签到活动类型的数目是极其有限的,从而规避了预测的不平衡性问题。

    (2)采用Mixed HMM来对用户的活动转移进行建模,从而包含了用户签到的时空信息。

    缺点:

    (1)在利用训练好的Mixed HMM来对用户的下一个签到活动类型进行预测的时候,仅仅是通过预测最可能的下一个隐含状态n+1,然后根据输出概率矩阵,得到由这个隐含状态n+1最有可能输出的活动类型n+1。事实上,没有必要确定下一个隐含状态n+1,直接通过计算输出每一个可能的活动类型n+1的概率,选取概率最大的活动类型即可。这在时间复杂度上并没有增加额外的负担。

    (2)在做签到位置预测的时候,作者并没有考虑到用户本身的历史签到位置,而是仅仅选取用户当前位置附近的签到场所作为候选集,并且附近场所的范围选定为400m×400m,这个参数怎么确定的也没给个明确说法。并且根据文中提供的数据统计情况,用户的下一个签到位置距离其当前的位置有40%的情况是大于1km的。所以,在做签到位置预测的时候,仅仅考虑到用户附近的签到场所作为候选集是不是显得不大合理。

    1.3 总结

    关于签到位置预测的候选集问题,一般有两种决策。一是简单地把用户的历史签到位置作为候选集。这就假设用户往往在其签到位置重复签到。事实上,对LBSN用户而言,这种情况还是比较少见的。另外一种决策是将用户所在城市的所有签到场所作为候选集。这个时候,由于候选集的过于庞大,并且需要从庞大的候选集中仅仅选取一个位置作为预测结果,预测的不平衡性问题就要面对了。这篇文章给我们提供了一种解法,即将问题转移到活动预测。因为在活动预测问题中,即使是将所有活动类型都作为候选集,也不会遭遇预测的不平衡性问题。

    参考文献:

    [1] 隐含马尔可夫模型导论:An Introduction to Hidden Markov Models


    展开全文
  • 位置预测系列(一)

    千次阅读 2014-05-12 21:48:37
    关于位置预测,在每年的顶级会议上都有很多文章出炉。下面就简单说说ubicomp'13年录用的一篇论文:The Influence of Temporal and Spatial Features on the Performance of Next-place Prediction Algorithms。 1.1 ...

    关于位置预测,在每年的顶级会议上都有很多文章出炉。下面就简单说说ubicomp'13年录用的一篇论文:The Influence of Temporal and Spatial Features on the Performance of Next-place Prediction Algorithms

    1.1 Motivation

    基于用户移动行为的规律性,现有的位置预测方法都能够获得一个很高的预测精度。然而,目前的方法未能够有效地检测出用户在两个不同位置间的转移。精确地预测出用户在不同位置间的转移行为是非常重要的,比如在智能家居服务中,需要有效地检测出用户是离开家还是回到家,以便智能地关闭或开启某些服务。

    1.2 Model

    在这篇论文里面,作者首先定义了几个跟位置转移相关的预测精度(预测算法的性能评估指标)。然后,基于所定义的评估指标分别分析了基于位置特征或时间特征的18个预测算法性能。根据对比结果,作者发现基于位置特征的预测算法虽然整体预测精度比较高,但是在检测用户位置间转移时表现不理想。基于时间特征的预测算法表现却恰恰相反。基于这个观察,作者通过多数票决的方式将这18个位置预测算法组合在一块,以便在保持预测精度的同时还能够有效地检测出用户在不同位置间的转移。在此基础上,作者进一步提出了参数优化方案来提高位置转移的检测精度。作者将位置预测分为两种情况:(1)位置发生转移的情况下进行位置预测(2)位置未发生转移的情况下进行位置预测。根据统计结果,当位置发生转移时,在组合算法的票数结果中,真正转移到的下一个位置所获得的票数平均是8;当位置没有发生转移时,组合算法所预测的转移位置获得的票数平均是3。作者设定阈值为6,即当组合算法预测的转移位置所得到的票数超过6时,那么这个转移位置就是所预测的下一个位置,即使用户当前的位置所得到的票数更多,也不予考虑。(有点绕,见下图说明)


    1.3 Merits and demerits

    作者对位置预测问题算是给出了一种稍微新颖的阐述,将一天分成96个时间段,每个时间段的时间间隔为15分钟,位置预测算法的目的就是预测出下一个时间段用户将会在哪。这样虽然可以更加有效地捕捉到比如用户离开家或者到家这样一些类似事件,但是每隔15分钟就要运行一次算法,智能手机难免有点吃不消。

    UbiComp'12年录用的位置预测的一篇论文是通过加权组合的方式将多个位置预测算法组合起来的。这里,作者采用的是多数票决的组合方式并结合阈值优化,从而省去了加权参数训练的过程。

    总的来说,这篇论文是属于应用马尔科夫模型来做位置预测的派别,所做的一个隐含假设是用户将要访问的下一个位置一定是以前去过的。因此,这篇论文所提出的方法在用户初期轨迹稀疏时会遭遇"冷启动"问题。




    展开全文
  • 位置预测系列(二)

    千次阅读 2014-06-12 20:13:22
    在这篇文章中,作者首先将位置预测问题阐述为位置排名问题,即把用户所在城市内的所有签到场所作为候选集,然后根据一定的规则将候选集中的场所进行排名。排名的规则所追求的目标就是尽可能的将用户下一次签到地点排...
  • 预测facebook签到位置

    千次阅读 2022-03-14 00:29:57
    对于给定的坐标集,您的任务将根据⽤户的位置,准确性和时间戳等预测⽤户下 ⼀次的签到位置。 数据被制作成类似于来⾃移动设备的位置数据。 请注意:您只能使⽤提供的数据进⾏预测。 2 数据集介绍 ⽂件说明 train....
  • FaceBook_train.csv.zip

    2021-08-11 14:27:14
    FaceBook签到位置预测——测试数据集
  • 看看杭州卫星地图就知道,杭州的平原都在那一块,很显然第一大区域在径山镇以东,东明山以南,西山森林公园-西湖群山以北,钱塘江以北(暂时叫杭州第一大平原)。杭州最近15年的发展重心在云城及周边,杭州发展看...
  • LSTM预测方式

    千次阅读 2022-02-14 11:07:51
    最近在做一个LSTM预测的程序,是多属性预测的程序,即预测的数值受多因素影响。 最初是仿照北京天气污染那个例子改写的,预测的方式就是真实一天预测下一天,以此类推,后来经过了解完成了其他预测方式的程序改写。 ...
  • keras构建LSTM模型,预测带高度的经纬度位置

    千次阅读 热门讨论 2020-01-14 11:46:20
    print('预测高度差:{:.4f} M'.format((y_hat[-1, 2]-y[-1, 2]) * 0.3047999995367)) # 1 feet = 0.3047999995367 m # 画测试样本数据库 p1 = plt.scatter(y_hat[:, 1], y_hat[:, 0], c='r', marker='o', ...
  • 船轨迹预测

    千次阅读 2020-07-21 09:39:05
    代码: ...以为很简单的任务,结果做了很多次的调整,才有一定的效果。最让人头疼的是,预测的第一个值总是跳很远。...单模型变双模型:因为是要预测两个数据坐标,我尝试用两个模型分别预测经度和纬度,效果有提升
  • 史上最详细的Yolov3边框预测分析

    万次阅读 多人点赞 2018-11-15 22:07:14
    我们读yolov3论文时都知道边框预测的公式,然而难以准确理解为何作者要这么做,这里我就献丑来总结解释一下个人的见解,总结串联一下学习时容易遇到的疑惑,期待对大家有所帮助,理解错误的地方还请大家批评指正,我...
  • 卡尔曼滤波的一个典型实例是从一组有限的,对物体位置的,包含噪声的观察序列中预测出物体的坐标位置及速度。在很多工程应用(雷达、计算机视觉)中都可以找到它的身影。同时,卡尔曼滤波也是控制理论以及控制系统...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 266,766
精华内容 106,706
关键字:

位置预测