精华内容
下载资源
问答
  • POI的标签可以促进基于位置的服务比如位置搜索或者地点推荐。但是很多POI的标签并不完备或者不精确,本文目的是自动填充缺失的标签纠正噪声标签。文章通过设计一个三自适应的协同学习框架搜索理想的POI-tag得分...

    摘要

    POI的标签可以促进基于位置的服务比如位置搜索或者地点推荐。但是很多POI的标签并不完备或者不精确,本文目的是自动填充缺失的标签和纠正噪声标签。文章通过设计一个三自适应的协同学习框架搜索理想的POI-tag得分矩阵。框架分为三个部分1)建模POI和tag之间的相似性2)通过矩阵分解恢复POI-tag的模式3)通过最大似然估计推测最有可能的标签s

    动机

    根据观察发现,尽管最初的POI标签不完美但仍然透漏着POIs和相关tag之间的语义信息。我们可以把这种关系看作得分矩阵,分数代表标签和POI之间的相关性。部分观察到的POI的标签可以表示为一个二元矩阵,其中元素ij为1代表POI i 打上标签j。本文的想法是理想的得分矩阵应该跟这个二元矩阵差的不太远。其二就是一个用户在较短时间内在地图应用上的连续密集的搜索行为可以帮助标签提纯工作,即一个用户可能会在短时间内连续搜索好几个餐馆之类的。这样,用户搜索到的POI的标签都有较高的相关性,如果搜到的POI有标签缺失或者噪声标签的情况,可以帮助恢复或推测真实标签。

    本文设计的协同学习框架由三部分组成,non-negative matrix factorization (NMF), pair-wise similarity matching and maximum likelihood estimation(MLE)。其中NMF用于寻找与观察到的POI-tag矩阵一致的最优得分矩阵;pair-wise similarity matching组件通过使用孪生网络建模特征相似性与POI-tag语义相似性之间的一致性;最后用MLE训练一个多标签的分类器推测可能的标签。通过使用相同的数据,同一优化过程同时训练三个组件可以从不同的角度提供一些额外的信息,降低噪声带来的偏差。

    符号

    • 使用p代表POI,代表pi的特征向量,tag类似用t表示。
    • 观察到的POI-tag矩阵用表示,其中表示pi用tj标注了。代表观察到的pi向量,代表观察到的tj向量
    • 我们的目标是预测POI-tag得分矩阵Y,其中yi,j代表pi被ti标注的置信度。
    • 整个预测过程是在给定POI特征矩阵和tag特征矩阵以及观察到的POI-tag矩阵后,寻找最优POI-tag得分矩阵

    特征

    • 把POI的基本属性按照字符串信息进行分割成词,然后查询对应词的embedding组成
    • POI的特征与相应访问它的用户也有密切的关系,本文通过对用户的地图查询数据和用户画像构建POI画像特征。POI画像特征向量就是用户分布的直方图的统计。

    根据上面的讨论,用户的地图搜索数据也会反应POI的信息,利用这些map query数据构建POI session图来获取POI另一个角度的信息。POI session图是一个有向图,节点代表POI,边代表节点之间的相关性(如果许多用户在pi和pj之间交互过,就会在这两个点之间 添加一个边),边的权重带表在一个会话中在两地之间有过交互的用户数量。构建好图谱后,通过节点pi的邻居节点的标签分布来提取节点pi的tag相关的特征。

    • OutNer代表从pi出去的节点
    • Iner带表指向pi的邻居节点,最后pi的特征向量表示为
    • tag的特征是从POI特征中得到的。在观察到的矩阵中,j列代表拥有该标签的所有POI,所以标签的特征向量表示为

    框架

    1. NMF:在给定观察的矩阵NMF的目标是找到两个非负矩阵,那么恢复的得分矩阵就可以表示为Q和R可以通过解决带有Frobenius归一化的优化问题找到。
    2. Pair-wise similarity matching:通过把POI和tag特征转化到另一个特征空间,然后通过点成计算POI和tag之间匹配的概率。
    • 函数f和g是两个多层感知机组成的孪生网络。如果标签tj属于pi的话,f(pi)g(tj)的值会比较高。优化函数f和g引入了两个目标函数,其一是最小化poi-tag对相似性与观察到的POI-tag矩阵之间的loss其二就是优化poi-tag对相似性与回复的矩阵之间的loss使用两个loss函数的原因是观察到的矩阵信息不全且会有噪声。
    • 函数f同时也表示了POI之间的相似性,在tag空间中POI相似性计算为为了确保在tag空间中POI相似性和f的一致性引入如下loss函数这样建立了QR与f之间的联系。
    • 同样的,在POI空间中tag相似性可计算如下为确保POI空间中tag相似性和学到的tag表征之间的一致性
    • 至此,整个pair-wised similarity matching的loss函数为

        3.MLE极大似然估计部分时一个多标签分类模型。。此处使用多层感知机预测POI的标签,预测函数为此处的loss与上一个部分相似

    最后,整个框架的loss为

    预测与优化

    式子16是个二次优化问题,除了QR外,其他参数都可以通过梯度下降优化。本文通过固定其他参数只优化QR,此时问题是个标准的二次优化问题。然后固定QR使用梯度下降优化其他变量。

    最终的提纯结果是三个组件的整合。对于给定的候选POI p0,我们的目标是生成一个tag置信向量y0,*。其中每个元素yi,j表示p0的标签是tj的得分。

    • pairwise部分的结果为
    • MLE模型的输出为
    • NMF部分,对于p0,首先根据函数f定义的相似性在训练数据中检索前kmf个POI。然后把这些POI在的索引记录为Ikmf。最后标签的置信向量为
    • 最终的预测结果为
    •  

    结果

    结论:TACL效果好且鲁棒性强

    展开全文
  • for example here <pre><code><?php //variables $author = sanitize_text_field(get_post_meta( get_the_ID(), 'author', true )); $link = esc_url(get_permalink()); ?> <?php if($count < ...
  • <p>You can refer to the following sample answer for the format: <pre><code> * Organization: XX Company * Location: Seoul, South Korea * Contact: foobar.org * usage scenario: At present, the exporter ...
  • <p>You can refer to the following sample answer for the format: <pre><code> * Organization: XX Company * Location: Seoul, South Korea * Contact: foobar.org * Version: v1.2.4 or v2.0.0rc1 * usage ...
  • 向你展示如何发现,创建分发播客 If you thought Internet radio was cool, wait ‘til you experience podcasting--regular audio programs delivered via the Internet, which you can listen to when you ...
  • 对于时空数据,每个地点每一年有多个样本这种,通常怎么处理?我看到有建议求平均值做成aggregate data,然后模型里添加weights= n 来account for the different amount of sampling...
  • date /t 、 time /t 使用此参数即“DATE/T”、“TIME/T”将只显示当前日期时间,而不必输入新日期时间 set 指定环境变量名称=要指派给变量的字符 设置环境变量 set 显示当前所有的环境变量...
  • 我们专注于这一市场功能:一to book with an one-click a place for an event 。 研讨会的目标是 计算预订booker的预订价格 计算bar的利润 计算的利润privateaser :woman::laptop: 告诉我该怎么办
  •  88 间接宾语前 to for 的省略  89 to 与表示沟通思想的动词连用时的省略与否 ]  90 表示时间日期的介词: at , on , by , before , in  91 表示时间的介词: from , since , for , during  92...
  • Who's using RocketMQ

    2021-01-08 15:58:32
    re willing to learn more RocketMQ use scenarios in the field for better planning.</li></ul> <h2>What we expect from you <p>Pls. submit a comment in this issue to include the following infomation: * ...
  • <ul><li>We’d like to listen to the community to make Hyperf better.</li><li>We want to attract more people to contribute to Hyperf.</li><li>We are willing to learn more Hyperf use scenarios in the ...
  •  (结尾敬辞) (salutation) today we take as a special pleasure to have your company at our celebration for the opening of ____ (place) branch shop. we hope that we could share this celebration with ...
  • <div><p>We are very grateful for your attention and support to Davinci. Our goal is to build the best open-sourced data visualization platform, which can smoothen the “last mile” in the big data ...
  • Who is using ChaosBlade

    2021-01-08 17:56:31
    <p>You can refer to the following sample answer for the format: * Company: Alibaba * Location: Hangzhou, China * Contact: x.caspar.com * Purpose: fault-injection for testing system fault tolerance ...
  • 英语四级作文预测2008

    2008-12-13 22:14:39
    交代度假的时间、地点和环境。  2.记述度假期间的一次经历。 第三题:  Part V Writing (30 minutes)  Directions:In this part, you are allowed 30 minutes to write a composition according to the ...
  • Your support is the motivation for us to move forward. DolphinScheduler Community 谁在使用DolphinScheduler 诚挚地感谢每一位持续关注并使用DolphinScheduler的朋友。我们会持续投入,力图把Dolphin...
  • 怎么写好邀请函.doc

    2020-12-27 09:42:35
    怎么写好邀请函 ①发出邀请a——“你能来参加... 发出邀请b——“你愿意我去参加xx活动吗” april 20, xx dear fiona, here is a piece of good news for you. the * will give a performance in the * tomor...
  • accumulated a large amount of error-prone, and opening up in the lab, the students it is difficult to view the free laboratory sessions, the administrator it is very difficult for students to prepare...
  • 地点: CQUPT 根据issue #136 提供的新方法,测试无法成功,然后看了一下,似乎是pppoe.log的格式不对 我这边的格式为: ~~~ Plugin /etc/ppp/plugins/rp-pppoe.so loaded. RP-PPPoE plugin ...
  • <p>We’d like to thank everyone in this community for your constant support of DataSphere Studio. We’re confident that, with our effort and your support, this community could grow more prosperous and...
  • arcgis10.1正式版下载加完美破解

    千次下载 热门讨论 2012-08-14 19:20:54
    ArcGIS10.1兼具云端化、移动化、智能化、个性化简捷化等五大特征,提供简便易用的使用方式,便捷灵活的开发手段,实现随时随地对空间信息的获取共享,使得任何人在任何地点通过任何方式都可以享用智能的地图服务...
  • ip地址库 很全的库

    2020-02-08 13:39:16
    if not, write to the Free Software * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA */ /** * 用来读取QQwry.dat文件,以根据ip获得好友位置,QQwry.dat的格式是 一. 文件头...
  • JSP校园交易平台论文

    2009-06-17 14:09:05
    电子商务的普及和迅猛发展,传统的商业模式正经受着前所未有的冲击和影响,固定销售地点和销售时间的店铺式经营模式正日益被以信息流为主体的电子商务模式所取代。 作为电子商务的一个重要组成部分,校园电子商务的...
  • city 市 birthplace 出生地点 county 县 home phone 住宅电话 prefecture 专区 office phone 办公电话 autonomous region 自治区 business phone 办公电话 nationality 民族;国籍 current address 目前住址 ...
  • Exhibitors are encouraged to contact the secretariat for details Working Language English is the official language of the conference Important Dates Paper submission: January 1, 2012 Decision ...
  • 魔兽世界(修订版)

    2017-02-06 07:45:54
    同一时间发生的事件,按发生地点从西向东依次输出. 武士前进的事件, 算是发生在目的地。 在一次战斗中有可能发生上面的 3 至 8 号事件。这些事件都算同时发生,其时间就是战斗开始时间。一次战斗中的这些事件,...
  • ZendFramework中文文档

    2011-03-22 10:11:12
    1. Introduction to Zend Framework 1.1. 概述 1.2. 安装 2. Zend_Acl 2.1. 简介 2.1.1. 关于资源(Resource) ... Using options to set metacommands for all rules 14.5.5. Adding Filter ...
  • <div><h1>Chinese translations for OpenTripPlanner. <h1>Copyright (C) 2015 ORGANIZATION <h1>This file is distributed under the same license as the OpenTripPlanner <h1>project. <h1>FIRST AUTHOR ...

空空如也

空空如也

1 2 3
收藏数 46
精华内容 18
关键字:

to地点和for地点