精华内容
下载资源
问答
  • Axure教程:为图片添加标签
    千次阅读
    2020-12-31 00:29:55

    本文介绍如何利用中继器实现给图片打标签的效果,enjoy~

    通常来说,有动态内容变化就要用到函数,有相同的数据增添删改的效果就要用到中继器,所以这篇文章就讲的是利用中继器实现给图片打标签的效果。

    一、功能分析

    鼠标点击哪,标签打在哪——需要用到鼠标指针方面的函数,并结合中继器的增添动作(难点)

    修改编辑标签的内容——中继器编辑功能

    删除标签——中继器删除功能(难点)

    以上几个功能看似很简单,其实很有逻辑难点。

    二、元件准备

    背景图片:bg

    中继器:

    tag 设置如下:

    repeater 中 text 存文本内容、x 存横坐标、y 存竖坐标、v 存可见状态(1 可见、0 不可见)

    中继器内部元件:tag_show

    局部变量:n   初始值为 1(可以用一个矩形承载这个局部变量)

    bg+tag 组合成动态面板 panel

    键盘:keyboard 初始状态 " 隐藏 "(由输入框 input、确定按钮 ok、删除按钮 del 组成)

    三、实现

    1. 鼠标点击哪,标签打在哪

    (1)在做动作之前先分析以下中继器的加载规律

    如图,虚线框是中继器在纵向排列时默认情况下增加行的路径,而我们要的是黄色、蓝色实心框的随意路径,就是要求得坐标(x2、y2)与(x3、y3)的值。

    这里需要用到鼠标指针方面的函数 Cursor.x、Cursor.y,这两个值是页面的绝对坐标值。

    因为中继器 tag 及其行的元件 tag_show 是居左上,即 tag.x=0、tag.y=0,tag_show.x=0、tag_show.y=0,所以得出以下计算:

    x2=Cursor.x-panel.x     y2=Cursor.y-panel.y-tag_show.height;

    x3=Cursor.x-panel.x     y3=Cursor.y-panel.y-tag_show.height*2。

    由此得出公式:

    N.x=Cursor.x-panel.x         N.y=Cursor.y-panel.y-tag_show.height* ( N-1 )

    可是

    这个点在左下角,所以

    N.x=Cursor.x-panel.x         N.y=Cursor.y-panel.y-tag_show.height*N

    (2)添加动作

    在动态面板 panel 上添加动作,不能直接在背景图上加动作是因为标签多了会遮挡背景图。

    在中继器 tag 上添加加载动作:

    2. 修改编辑标签的内容

    在确认按钮上加动作:

    注意在最后一步取消所有行标记。

    3. 删除标签

    我为什么要说删除功能也是一个难点呢?

    因为按照常规删除功能来做的话,中继器的行会自动靠拢,导致目标行之后的行会位移,也就是说删除中间一个标签,某些标签的位移会发生变化,为了解决这个问题,我们就不用删除,而用/隐藏/来代替此功能。

    所以中继器中的 v 就存放了该行的可见标识,v==1 表示可见、v==0 表示不可见。

    依次在中继器行元件 tag_show、删除按钮 del、中继器 tag 上添加动作如下:

    本文由 @灰 _ 白 原创发布于人人都是产品经理。未经许可,禁止转载。

    题图来自 Unsplash,基于 CC0 协议。

    更多相关内容
  • 图片标签及以图搜图场景应用

    千次阅读 2020-10-12 11:58:06
    图片标签以及应用探索,介绍多目标输出图片标签图片标签方案、图搜等推荐和搜索应用

    博客:https://wenjie.blog.csdn.net/
    作者:走在前方
    介绍:计算机硕士,多年工作经验,技术和产品负责人。 多年推荐系统/NLP/大数据工作经验。 负责公司多个AI项目产品落地,包括文本分类、关键词抽取、命名实体识别、对话系统中语义理解、FAQ智能问答、知识图谱、图搜、推荐系统等

    本文主要分享核心要点

    • 图片标签问题
      • 什么是多标签图像分类
      • 多标签图像分类与多类图像分类有何不同
      • 构建多标签图像分类模型的步骤
      • 你了解哪些多标签图像分类模型结构
      • 多分类和多标签分类器和损失函数选择
      • 图片标签在推荐和搜索系统应用
    • 不同图片业务应用
      • 二分类
      • 多分类
      • 多目标任务
      • 多标签
      • 以图搜图
    • 多目标输出图片分类应用
      • 背景和数据介绍
      • 自定义数据集合网络模型设计
      • 模型加载预测
      • 在线预测以及数据可视化
    • 多标签图片分类应用
      • 多标签和多分类区别
      • 二分类和多分类以及损失函数
      • 网络模型设计
      • 多标签预测
    • 以图搜图应用
      • 图搜应用场景和原理
      • 开源向量检索引擎
      • 系统架构
      • 图片特征抽取和在线实时检索

    图片标签问题

    图片

    • 什么是多标签图像分类
    • 多标签图像分类与多类图像分类有何不同
    • 构建多标签图像分类模型的步骤
    • 你了解哪些多标签图像分类模型结构
    • 多分类和多标签分类器和损失函数选择
    • 图片标签在推荐和搜索系统应用

    不同图片标签差异

    图片

    图片

    图片分类:二分类(binary-class classification)场景

    图片

    图片分类:多分类(Multi-class classification)场景

    图片

    以4类(猫、狗、兔子和鹦鹉)看下多分类特点:

    每张图片只能被分类为猫、狗、鹦鹉或兔子。没有任何一个图像属于多个类别的情况

    图片分类:多输出分类(Multi-output classification)场景

    3类(电商时尚类):性别+颜色+类型( 每张图片都有3个固定的标签 ),固定输出图片多标签

    图片

    图片分类:多标签图片分类(Multi-label classification)场景

    图片

    多标签图片分类

    ①每个图像都属于一个以上的类

    ②每个图片出现的标签并不是固定的

    ③标签获取从标签池中选择最可能标签展示

    以图搜图

    • 基于图片标签搜索
    • 基于图片特征搜索

    图片

    多目标输出图片分类

    背景介绍

    随着电子商务产业快速发展,有大量的数据集等待着我们去搜集和研究。除了专业拍摄高质量产品图像,商品本身还拥有多个标签属性,用于描述商品各种特征。另外,还提供了关于商品特性的描述性文本

    数据介绍:每个商品都有一个唯一编码(例如:ID =15970) ,商品信息主要字段信息如下所示

    图片

    数据分析

    图片

    自定义数据集**+**模型定义和设计

    自定义数据集

    ①加载指定的标签数据

    ②计算标签种类和数量统计

    ③构建标签字典

    ④自定义数据集工具类

    模型定义和设计

    ①加载预训练的网络(例如:mobilenet_v2,resnet,resnext. 用户可以自己选择进行实验)

    ②修改基础网络结构,原来网络最后一层仅支持一个分类标签输入

    ③每个标签属性损失函数选择cross-entropy loss (采用联合训练求loss)

    模型数据验证混淆矩阵可视化

    图片

    模型加载

    model = MultiOutputModel(n_color_classes,

    n_gender_classes,

    n_article_classes)

    model.to(device)

    checkpoint = “./checkpoints/2020-09-21_15-59/checkpoint-000049.pth”

    model.load_state_dict(torch.load(checkpoint,map_location=‘cpu’))

    model.eval()

    图片多标签预测

    图片

    多分类输出多标签案例演示

    图片

    多标签图片分类

    多标签和多分类应用

    • 不同任务的图片分类应用

    图片

    • 针对一张图片,强制只能一种数字,可以使用softmax分类器

    图片

    • 胸部X光片:一次胸部X光片可以同时显示多种不同的医疗状况。如果我们为胸部x光片构建一个分类器,我们希望该分类器能够指示存在多种情况。这是一张同时显示肺炎和脓肿的胸部x光照片,以及相应的标签。

    图片

    • 入院:根据患者的健康记录,我们可能需要预测该患者将来是否会入院。我们可以将其定义为一个分类问题:根据患者未来的入院诊断(如果有的话)对患者过去的健康记录进行分类。患者可能因多种疾病入院,因此可能有多个正确答案

    图片

    介绍两个重要的分类器

    Sigmoid和Softmax对比

    图片

    图片

    图片

    数据介绍

    图片

    图片

    分类器**+**损失函数

    图片

    图片

    网络模型设计

    图片

    多标签分类模型**-**效果可视化

    图片

    图片

    多标签图片分类功能演示

    图片

    图片

    以图搜图

    图像搜索应用场景

    随着数字时代的到来,传统单单的文字搜素已经无法满足人们的搜索了,图像搜索,甚至是视频搜索都已经比较成熟。

    图像搜索服务 (Image Search)是以深度学习大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的和以文搜图的智能图像搜索产品。图像搜索服务在基于图像识别技术基础上,结合不同行业应用和业务场景,帮助用户实现相同或相似图片搜索。

    现在大火的人工智能主要是:语音识别,自然语言处理,计算机视觉,推荐系统等等。

    人工智能技术应用:

    n语音识别+自然语言处理:amazon echo,google assistant/home,siri,国内一大票智能音箱

    n计算机视觉:微博面孔专辑(商汤提供的cv能力),海康威视/格林深瞳的安防,**拍立淘(手机淘宝里面的相机入口),百度识图(百度app里面的相机入口),**Google Photo

    n推荐系统:手机淘宝主页往下翻有个栏目叫猜你喜欢,qq/网易音乐的每日推荐歌曲等

    图片搜索的主要应用是二维码扫描、以图搜图、拍照搜题、拍照翻译、AR翻译、以图搜剧等

    图片

    图片

    百度图像搜索

    以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找、相似素材搜索、拍照搜同款商。

    相似图片搜索场景

    在自建图库中找到与检索图片语义相似的图片集,并给出相似度打分(综合图片类型、颜色、内容、布局等特征);适用于各种相似图片查找、相关内容推荐场景

    图片

    • 设计素材查找

    基于拍摄照片查找相似或相同的图片作品,满足设计师人群、工作人员更快捷高效查找原版大图或相似作品的需求

    • 商品搜索及推荐

    将用户拍摄的图片在商品库中搜索,找到同款或相似的商品,进行商品销售或者相关商品推荐,提升搜索查找的便捷性,优化用户体验

    • 相关内容推荐

    将文章内容或者产品服务中的图片入库,通过比对用户上传的图片,查找相似图片,从而找到相关的内容信息,实现相关内容搜索、推荐

    相同图片搜索场景

    在自建图库中找到与检索图相同的图片,支持找到局部内容相同的大图,或适度调整背景和角度的相同图片;可用于图片精确查找、重复图片过滤等场景

    图片

    应用场景

    • 重复图片过滤

    搜索图库中是否有相同或高度相似的图片,实现系统内图片去重或过滤,避免重复内容引起的资源浪费、体验下降等问题

    • 图片精确查找

    在图片库中找到主体相同的图片,结合相似度分值,判断图片内容是否严格相同,可用于特定图片查找、图片内容精准关联等场景

    商品图片搜索场景

    针对商品类图片,专项训练检索模型,在自建图库中搜索相同及相似的商品图片集,可找到不同颜色、背景、角度的同款商品;适用于电商平台拍照搜商品等场景

    图片

    • 商品搜索及推荐

    将用户拍摄的图片在商品库中搜索,找到同款或相似的商品,进行商品销售或者相关商品推荐,提升商品搜索查找的便捷性,优化用户购买体验

    • 商品识别

    将商品名称与图片相匹配一起入库,通过图片相似度判断实现指定集合内的商品识别,可用于户外广告拍照下单、供应链系统拍图找货等场景

    接下来我们就针对图搜场景进一步探索。

    阿里图像搜索

    电商图库类场景

    图片

    图片

    用户只需拍摄或者上传商品照片,就可以根据图片进行商品搜索。 省去了繁琐的文字描述,简化了商品搜索流程,大大提升用户的购物体验。

    布料纺织场景

    图片

    商标logo检索场景

    图片

    在商标、标识等场景下搜索相同或相似logo图形,大幅度简化人工肉眼比对的工作量,并有效提供工作效率。

    通用图库类场景

    图片

    图片分享和社交类网站通常有大量通用图片供用户搜索使用,利用图像搜索服务,可在云端快速构建百亿级图像搜索引擎,提供以图搜图功能,提升用户体验。

    以图搜图实践

    为方便更直观认知图像搜索场景应用,我们采用的方案:

    基于深度学习工具PyTorch + Facebook AI searcher Faiss向量相似性搜索算法库。

    举例说明如下:

    红色方框是查询图,绿色方框是完全匹配的结果,其它是最相似的top

    图片

    图片

    图像搜索发展历程

    图片

    卷积神经网络理论必备

    采用PyTorch深度学习工具进行图片特征提取。首先我们需要做的,要理解卷积神经网络如何特征提取的?这部分重点给大家讲解相关CNN的概念。

    • 初识CNN
    • CNN 卷积层概念
    • CNN 中的stride和zero-padding使
    • CNN 特征图计算
    • CNN PoolLayers和FC&训练过程演示开始学习
    • CNN 网络发展历史
    • 图形化介绍FC和CNN 区别以及CNN 层概念
    • keras 实现CNN 网络
    • 图形化方式介绍CNN在图像应用
    • CNN 在语音和文本中应用介绍

    Faiss向量搜索库基础入门

    faiss 向量化相似索引库,主要完成文本向量化特征的存储和检索。

    • faiss安装
    • faiss 快速入门
    • faiss 基础模块和索引选择
    • faiss 基础索引类型介绍和源码分析
      • Faiss indexes IO和index factory
      • Faiss indexes 前(后)处理
      • Faiss indexes 基础索引类型
      • Faiss indexes 多种index混合
      • Faiss indexes 进阶操作
    • faiss 索引优化方案
    • faiss一些基准实验

    以图搜图项目实战

    数据介绍

    数据集介绍

    图片集包含 17125 张图片,涵盖 20 个目录。

    n人类;

    n动物(鸟、猫、牛、狗、马、羊);

    n交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);

    n室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)

    数据集大小:~2GB

    说明:您也可以使用其他的图片数据进行图片索引构建和检索。

    索引构建压缩

    尝试20万照片构建图片索引生成439M索引文件

    索引降维压缩后,最后生成32M索引文件,效果基本不受影响

    以图搜图系统架构

    图片

    以图搜图技术架构原理

    图片

    为方面进一步的理解以图搜图业务场景执行方案,通过VISO 图再次演示如下:

    图片

    主要分为三个部分——图像特征抽取,图像特征构建索引、图像快速检索。

    **第一步:**图像特征抽取方法

    • 传统的方法有各种图像处理的方法,比如hog直方图,小波过滤等方法提取特征
    • 流行的深度学习方法,比如卷积神经网络等;

    **第二步:**使用特征抽取器对图像库抽取特征,并以向量的形式存储起来;

    **第三步:**构建索引后,图像索引的好坏影响搜索速度

    通过案例来看看图像检索基本的流程。首先,提供一张图像,然后按照下面的流程执行

    ->抽取特征

    ->图像库特征匹配(余弦相似度或者欧式距离)

    ->相似度的大小进行排序

    -> 输出匹配结果

    图片

    深度学习框架选型

    主要借助深度学习框架,完成图片特征提取,一般采用TensorFlow 或者 PyTorch

    项目: 采用PyTorch深度学习工具,同时采用Faiss 完成图片特征存储和检索(毫秒)

    ** Faiss 开源向量检索引擎**

    Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库。它包含多种搜索任意大小向量集(备注:向量集大小由RAM内存决定)的算法,以及用于算法评估和参数调整的支持代码。Faiss用C++编写,并提供与Numpy完美衔接的Python接口

    图片

    Faiss 不同类别索引

    图片

    Faiss索引构建源码解读

    图片

    图片特征抽取

    图片

    图片

    在线实时检索演示

    • 第一张照片:用户检索照片,后面相似照片推荐(相似得分:从左到右、从上到下排序)
    • 索引库采样降维压缩,压缩前后减少1/4
    • 图片检索速度在毫秒级别( 5000 万图片库)

    图片

    更多以图搜图的效果案例**>>**

    展开全文
  • jQuery选项标签切换手机图片代码是一款模拟手机滚屏交互图片滚动切换,适用于手机产品介绍展示页面代码。
  • jQuery选项标签切换手机图片代码是一款模拟手机滚屏交互图片滚动切换,适用于手机产品介绍展示页面代码。
  • 1、RFID标签介绍

    千次阅读 2021-11-20 15:45:54
    本文介绍传统RFID标签技术,回答:什么是RFID?RFID标签用于什么?RFID标签如何工作?等问题。本文还简介了这项技术的发展过程和实现低成本的困难,为今后的无芯片RFID标签技术介绍做好铺垫。

    \qquad 本文介绍传统RFID标签技术,回答:什么是RFID?RFID标签用于什么?RFID标签如何工作?等问题。本文还简介了这项技术的发展过程和实现低成本的困难,为今后的无芯片RFID标签技术介绍做好铺垫。

    射频识别

    \qquad 射频识别 (Radio frequency identification, RFID)是一种利用射频(radio frequency, RF)波对物体进行自动识别的无线数据采集技术。RFID依靠RF波在称为RFID标签(RFID tag)的数据传输设备和询问器之间进行数据传输。

    \qquad 如图1所示,一个典型的RFID系统由三个主要部件组成:

    • 一台阅读器(reader)或询问器(interrogator),它将询问信号发送到一个待识别的RFID标签;
    • 一个RFID标签(tag)或应答器(transponder),它包含ID码;
    • 以及中间件软件(middleware software),它维护接口和软件协议,将来自阅读器的ID数据编码和解码到大型机或个人计算机上。

    RFID阅读器只能读取处于它询问区之内的标签。阅读器通常连接到一台主机,主机执行额外的信号处理,以及显示标签的特征。主机也可以通过互联网连接,以实现全球连接/联网。

    图1. 一个典型的RFID系统

    图1. 一个典型的RFID系统 (3)

    RFID标签的发展

    \qquad RFID于1948年由Stockman首次在其具有里程碑意义的论文“Communication by Means of Reflected Power”中提出。Stockman提出,通过使标签天线的负载交替地变化,有可能让反射功率的大小发生改变,从而实现调制(也称为“天线负载调制”)。这种新型无线技术现在被称为RFID。从那时起,研究人员和工程师一直致力于开发低成本的RFID系统。

    \qquad RFID技术自1970年代开始得以应用。最初,RFID标签被用于跟踪长途运输的大型物品,如奶牛、火车车厢、航空行李。这些最初的标签称为感应耦合RFID标签(inductively coupled RFID tags),是由金属线圈、天线、玻璃制品组成的复杂系统。这种RFID标签由一台RFID阅读器产生的点磁场供电。

    图2. 跟踪行李和大包裹的RFID标签

    图2. 这样的RFID标签过去只用于跟踪行李和大包裹
    (图片来自:electronics.howstuffworks.com)

    \qquad
    \qquad 接着,为了降低标签成本,人们创造了电容耦合标签(capacitively coupled tags)。这是一种一次性标签,可以应用于较便宜的商品,并像条形码一样通用。电容耦合标签使用导电碳墨水代替金属线圈来传输数据。墨水印在纸质标签上,并用阅读器扫描。摩托罗拉的BiStatix RFID标签是这项技术的领先者。它们使用的硅芯片只有3毫米宽,能够存储96-位信息。这项技术没有受到零售商欢迎,BiStatix于2001年关闭。

    \qquad RFID行业较新的创新包括有源、半无源、以及无源RFID标签(active, semi-active and passive RFID tags)。这些标签可以存储多达2千字节的数据,由微芯片、天线、以及电池(对于有源和半无源标签而言)组成。标签的组件封装在塑料、硅、或有时在玻璃内。

    \qquad 这些标签的基本工作方式相同:

    • 储存在一个RFID标签芯片中的数据等待读取。
    • 标签的天线接收来自一台RFID阅读器的天线的电磁能量。
    • 标签使用其内部电源或从这台阅读器电磁场获取的电源,将射频波发送回这台阅读器。
    • 这台阅读器接收这个标签的射频波,进而将频率解释为有意义的数据。

    实现低成本的困难

    \qquad 感应耦合和电容耦合RFID标签现在已不常用,因为它们既昂贵又笨重。有源、半无源、以及无源RFID标签正在使RFID技术变得更加容易使用。这些标签的生产成本较低,可以制作得足够小,还适用于几乎任何产品。

    \qquad 然而,用RFID取代光学条形码尚未实现,原因是RFID标签的价格(10美分)高于光学条形码的价格(低于0.1美分)。至于为什么没有廉价的RFID标签,基本的论点是,专用集成电路(Application Specific Integrated Circuit, ASIC)设计和测试以及标签天线和ASIC组装会导致昂贵的制造过程,从而无法进一步降低芯片RFID标签的价格。图3显示了制造芯片RFID标签的基本步骤。

    图3. RFID标签制造工艺

    图3. RFID标签制造工艺 (3)

    \qquad 硅芯片的设计已经标准化了30多年,建造一家硅制造厂的成本高达数十亿美元。硅芯片是在一片一片晶圆基础上制造的,而每片晶圆的成本是固定的(大约1000美元)。由于晶圆成本与IC设计无关,因此可以根据RFID芯片所需的硅面积估算RFID芯片的成本。在缩小晶体管尺寸方面取得了重大成就,使每个晶圆面积有更多的晶体管。减少所需晶体管的数量会导致更小的硅面积,从而降低RFID芯片的成本。为此,麻省理工学院(Massachusetts Institute of Technology, MIT)做出了巨大努力,设计了一个少于8000个晶体管的RFID ASIC。虽然这将降低硅芯片成本,但其微型尺寸带来了限制和进一步的处理成本。

    \qquad 尽管RFID芯片的成本几乎为零,但分割晶圆、处理芯片、以及将其放置在标签上的成本仍然很高。使用比标准芯片小的芯片会增加处理芯片的成本,原因仅仅是电子行业还没有标准化芯片。因此,通过高度优化的低晶体管数ASICs、贯彻组装工艺、以及极大提高RFID芯片的年销售量(超过10亿),芯片RFID标签的5美分最低成本是现实的。

    \qquad 最后说明一点,本小节对低成本RFID标签实现困难的讨论并不全面,其中的分析和数据也不是最新的,它们大体上反映 了2010年左右的情况。

    参考文献

    (1) H. Stockman (2009), “Communication by Means of Reflected Power”, Proceedings of the IRE, pp: 1196-1204, October 1948.

    (2) Kevin Bonsor and Wesley Fenlon (2021). How RFID Works. Available from the web page.

    (3) Stevan Preradovic and Nemai Karmakar (2011). Fully Printable Chipless RFID Tag, Advanced Radio Frequency Identification Design and Applications, Dr Stevan Preradovic (Ed.), ISBN: 978-953-307-168-8, InTech, Available from the link.

    展开全文
  • LOFTER,又名网易轻博客,是网易旗下图片社交APP,产品覆盖web及移动各端,用户量巨大。 轻博客的特点是每个博文都可以添加“标签”,博文在发布之后,会被推送到对应标签的各个专栏里。所以用户添加的标签越多,越...
  • 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 ...公众号:搜索与推荐Wiki ... 标签系统的传统用法是,在一些网站中,用户会为自己感兴趣的对象打上一些标签,如豆瓣、网易...

    转载请注明出处:http://blog.csdn.net/gamer_gyt
    博主微博:http://weibo.com/234654758
    Github:https://github.com/thinkgamer
    公众号:搜索与推荐Wiki
    个人网站:http://thinkgamer.github.io


    标签系统的传统用法是,在一些网站中,用户会为自己感兴趣的对象打上一些标签,如豆瓣、网易云音乐、Last.fm等。这些社会化标签即资源的分类工具,也是用户个人偏好的反映,因此社会化标签为推荐系统获得用户偏好提供了一个新的数据来源。之所以说“传统”,是因为这些标签是用户主观意愿的表达,是主动行为。但是,有些电商网站也会对用户或商品进行一些客观的打标,如对一个经常网购数码产品的用户打上一个“数码达人”的标签,以便后继给该用户推荐数码类商品。

    标签系统的应用

    推荐系统的目的是联系用户和物品,这种联系需要不同的“媒介”。例如:

    • 相似用户(给用户推荐相似用户喜欢的物品),媒介是用户。
    • 相似物品(给用户推荐他喜欢物品的相似物品),媒介是物品。
    • 隐含的特征(根据用户的历史行为构造特征,进而预测对新物品的偏好程度),媒介是行为特征。

    本章将介绍一种新的联系媒介——标签。工业界中的主流标签系统包含:

    • Last.fm
    • Delicious
    • 豆瓣
    • 网易云音乐

    数据标注与关键词提取

    关键词是指能够反映文本语料主题的词语或短语。在不同的业务场景中,词语和短语具有不同的意义。例如:

    • 从电商网站商品标题中提取标签时,词语所传达的意义就比较突出。
    • 从新闻类网站中生成新闻摘要时,短语所传达的意义就比较突出。

    数据标注

    数据标注即利用人工或AI(人工智能)技术对数据(文本、图像、用户或物品)进行标注。
    标注有许多类型,如:

    • 分类标注:即打标签,常用在图像、文本中。一般是指,从既定的标签中选择数据对应的标签,得到的结果是一个封闭的集合。
    • 框框标注:常用在图像识别中,如有一张环路上的行车照片,从中框出所有的车辆。
    • 区域标注:常见于自动驾驶中。例如从一张图片中标出公路对应的区域。
    • 其他标注:除了上述常见的标注类型外,还有许多个性化需求。例如,自动摘要、用户或商品的标签(因为其中总有一些未知标签,当然也可以看成是多分类)。

    数据标注的一般步骤为:
    (1)确定标注标准:设置标注样例和模板(如标注颜色时对应的比色卡等)。对于模棱两可的数据,制定统一的处理方式。
    (2)确定标注形式:标注形式一般由算法人员确定。例如,在垃圾问题识别中,垃圾问题标注为1,正常问题标注为0。
    (3)确定标注方法:可以使用人工标注,也可以针对不同的标注类型采用相应的工具进行标注。

    那么,数据标注与标签的对应关系是什么呢?

    数据标注在推荐系统中的应用

    关键词提取在推荐系统中的应用也十分广泛,主要用于用户物品召回(根据用户对关键词的行为偏好,召回相应关键词下的物品)和特征属性构造(对物品的属性进行补充)。

    具体的案例这里不过多做介绍。

    推荐系统中的关键词提取

    关键词是指能够反映文本语料主题的词语或短语。在不同的业务场景中,词语和短语具有不同的意义。例如:

    • 从电商网站商品标题中提取标签时,词语所传达的意义就比较突出。
    • 从新闻类网站中生成新闻摘要时,短语所传达的意义就比较突出。

    这里所介绍的关键提取和数据标注同样都是一个动作,都是为了得到一些标签或属性特征。
    关键词提取从最终的结果反馈上来看可以分为两类:

    • 关键词分配:给定一个指定的词库,选取和文本关联度最大的几个词作为该文本的关键词。
    • 关键词提取:没有指定的词库,从文本中抽取代表性词作为该文本的关键词。
      不管通过哪种方式生成,关键词都是对短文本所传达含义的抽取概述,都直接反映了短文本的所传达的属性或特征

    标签的分类

    在推荐系统中,不管是数据标注还是关键词提取,其目的都是得到用户或物品的标签。但是在不同场景下,标签的具体内容是不定的。例如,同样是分类标注,新闻的类别里可以有军事、科技等,但音乐的类别里就很少会涉及军事或科技了。
    对于社会化标签在标识项目方面的功能,Golder和Huberman将其归纳为以下7种:

    • 标识对象的内容。此类标签一般为名词,如“IBM”“音乐”“房产销售”等。
    • 标识对象的类别。例如标识对象为“文章”“日志”“书籍”等。
    • 标识对象的创建者或所有者。例如博客文章的作者署名、论文的作者署名等。

    标识对象的品质和特征。例如“有趣”“幽默”等。

    • 用户参考用到的标签。例如“myPhoto”“myFavorite”等。
    • 分类提炼用的标签。用数字化标签对现有分类进一步细化,如一个人收藏的技术博客,按照难度等级分为“1”“2”“3”“4”等。
    • 用于任务组织的标签。例如“to read”“IT blog”等。
      当然以上7种类别标签是一个通用框架,在每一个具体的场景下会有不同的划分。

    基于TF-IDF提取标题中的关键词

    TF-IDF(Term Frequency–Inverse Document Frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF算法的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或短语具有很好的类别区分能力,适合用来分类。TF-IDF实际是TF*IDF。

    那么TF-IDF的具体算法原理是什么?以及我们如何从商品标题中提取关键词呢?

    基于标签的推荐系统

    标签是用户描述、整理、分享网络内容的一种新的形式,同时也反映出用户自身的兴趣和态度。标签为创建用户兴趣模型提供了一种全新的途径。
    本节将展开介绍基于标签的用户如何进行兴趣建模。

    标签评分算法

    用户对标签的认同度可以使用二元关系表示,如“喜欢”或“不喜欢”;也可以使用“连续数值”表示喜好程度。

    二元表示方法简单明了,但精确度不够,在对标签喜好程度进行排序时,也无法进行区分。所以,这里选用“连续数值”来表达用户对标签的喜好程度。

    为了计算用户对标签的喜好程度,需要将用户对物品的评分传递给这个物品所拥有的标签,传递的分值为物品与标签的相关度。

    1.用户对标签的依赖程度

    如图6-13所示,用户u对艺术家A的评分为5星,对艺术家B的评分为3星,对艺术家C的评分为4星。
    艺术家A与标签1、2、3的相关度分别为:0.6,0.8,0.4;
    艺术家B与标签1、2、3的相关度分别为:0.3,0.6,0.9;
    艺术家C与标签1、2、3的相关度分别为:0.5,0.7,0.6。

    对应的用户(u)对标签(t)的喜好程度计算公式为:

    式中:

    • rate(u,t)表示用户u对标签t的喜好程度。
    • rate(u,i)表示用户u对艺术家i的评分。
    • rel(i,t)表示艺术家i与标签t的相关度。

    根据式(6.4)计算出用户u对标签1的喜好程度为:
    (50.6+30.3+40.5)/(0.6+0.3+0.5)=4.21

    同理可以计算出用户u对标签2的喜好程度为 4.10,对标签3的喜好程度为3.74。

    2.优化用户对标签的喜好程度

    如果一个用户的评分行为较少,就会导致预测结果存在误差。那么该如何改进呢?

    标签评分算法改进

    这里使用TF-IDF算法来计算每个标签的权重,用该权重来表达用户对标签的依赖程度。
    TF-IDF算法在6.3.1节中进行了介绍,这里不再赘述。每个用户标记的标签对应的TF值的计算公式为:

    式中:

    • n(u,ti)表示用户u使用标签ti标记的次数。
    • 分母部分表示用户u使用所有标签标记的次数和。
      TF(u,t)表示用户u使用标签t标记的频率,即用户u对标签t的依赖程度。

    优化用户对标签的依赖程度

    在社会化标签的使用网站中存在“马太效应”,即热门标签由于被展示的次数较多而变得越来越热门,而冷门标签也会越来越冷门。大多数用户标注的标签都集中在一个很小的集合内,而大量长尾标签则较少有用户使用。
    事实上,较冷门的标签才能更好地体现用户的个性和特点。为了抑制这种现象,更好地体现用户的个性化,这里使用逆向文件频率(IDF)来对那些热门标签进行数值惩罚。

    每个用户标记的标签对应的IDF值的计算公式为:

    • 分子表示所有用户对所有标签的标记计数和。
    • 分母表示所有用户对标签t的标记计数和。
    • IDF( u, t)表示t的热门程度,即一个标签被不同用户使用的概率。
      对于一个标签而言,如果使用过它的用户数量很少,但某一个用户经常使用它,说明这个用户与这个标签的关系很紧密。

    用户对标签的兴趣读

    综合式(6.6)和式(6.7),用户对标签的依赖度为:

    在6之前分析了用户对标签的主观喜好程度,本节分析了用户对标签的依赖程度,综合可以得到用户u对标签的兴趣度为:

    标签基因

    标签基因是GroupLens研究组的一个项目。
    在社会化标签系统中,每个物品都可以被看作与其相关的标签的集合,rel(i, t)以从0(完全不相关)到1(完全正相关)的连续值衡量一个标签与一个物品的符合程度。
    例如图6-13中:

    • rel(艺术家A,标签1)=0.6;
    • rel(艺术家A,标签2)=0.8;
    • rel(艺术家A,标签3)=0.4。
      采用标签基因可以为每个艺术家i计算出一个标签向量rel(i),其元素是i与T中所有标签的相关度。这里,rel( i)相当于以标签为基因描绘出了不同物品的基因图谱。形式化的表达如下:

    例如,图6-13中,艺术家A的标签基因为:rel(艺术家A)=[0.6,0.8,0.4]。
    选用标签基因来表示标签与物品的关系有以下三个原因:
    (1)它提供了从0到1的连续数值;
    (2)关系矩阵是稠密的,它定义了每个标签t∈ T与每个物品 i∈ I的相关度;
    (3)它是基于真实数据构建的。

    用户兴趣建模

    根据训练数据,可以构建所有商品的标签基因矩阵Ti和用户最终对标签的兴趣度Tu,则用户对商品的可能喜好程度为:

    式中:

    • Tu:用户u对所有标签的兴趣度矩阵(1行m列,m为标签个数)。
    • Ti^T:所有商品的标签基因矩阵Ti的转置矩阵(m行n列,m为标签个数,n为商品个数)。
    • T(u,i):用户u对所有商品的喜好程度矩阵(1行n列,n为商品个数)。
      最终从计算结果中选取前K个推荐给用户。

    基于标签推荐算法实现艺术家推荐

    利用标签推荐算法实现一个艺术家推荐系统,即,根据用户已经标记过的标签进行标签兴趣建模,进而为用户推荐喜好标签下最相关的艺术家。

    这里使用Last.fm数据集中的数据作为基础数据,该数据集在3.3节有相关的介绍。该实例的具体实现思路如下:
    (1)加载并准备数据;
    (2)计算每个用户对应的标签基因;
    (3)计算用户最终对每个标签的兴趣度;
    (4)进行艺术家推荐和效果评估。


    注:《推荐系统开发实战》是小编近期要上的一本图书,预计本月(7月末)可在京东,当当上线,感兴趣的朋友可以进行关注!


    【技术服务】,详情点击查看: https://mp.weixin.qq.com/s/PtX9ukKRBmazAWARprGIAg

    扫一扫 关注微信公众号!号主 专注于搜索和推荐系统,尝试使用算法去更好的服务于用户,包括但不局限于机器学习,深度学习,强化学习,自然语言理解,知识图谱,还不定时分享技术,资料,思考等文章!

    展开全文
  • 腾讯位置 - 产品介绍(结尾附源码)

    千次阅读 多人点赞 2021-01-13 18:10:11
    本文关键字:腾讯位置、产品介绍、基础产品、开发者工具、知识总结。本篇文章将会为大家介绍腾讯位置服务的核心产品,我们在进行应用开发的时候,经常会用到和位置相关的数据,是网络IP、GPS位置等数据可以很好的...
  • 【HTML 元素】嵌入图像的实现方法

    千次阅读 2021-06-08 15:33:33
    要嵌入一张图像需要使用src和alt属性,代码如下:显示效果:1 在超链接里嵌入图像img元素的一个常见用法是结合a元素创建一个基于图像的超链接,代码如下:XML/HTML Code复制内容到剪贴板浏览器显示这张图片的方式...
  • 1.问题概述 工作中经常需要将产品明细表转换成标签,贴在送货单上,或者将学生成绩转换成标签打印出来发送给学生。...接下来我向您介绍一个工具,标签打印的利器——E灵。 2.软件下载 E灵下载地址
  • 【技术综述】多标签图像分类综述

    千次阅读 2019-09-27 12:10:28
    在这里只介绍标签分类常用的指标,有关单标签分类的指标不再赘述。 4.1 平均准确率(AP)和平均准确率均值(mAP) 同单标签分类一样,当一张图片中的所有标记均预测正确时,准确率才可以置1,否则置零。每个类别下的...
  • 转自:拆解声磁软标签(超市电子防盗标签),顺便恶补一下工作原理| http://bbs.mydigit.cn/read.php?tid=2142954 电子防盗标签 之二:声磁软标签电子防盗标签属于电子商品防盗(EAS)技术,通过放置在商场超市...
  • 下面的li标签立刻就多了起来,在一个个打开,发现果然是高清的图片 于是就有办法了,我可以在每次获取页面的html详情前都先把这图片都点击一下,然后再获取页面html信息,再进行xpath解析,再对获取到的标题,介绍,...
  • alt标签是什么意思,alt标签的作用及优化内容导读:关于alt标签的问题,本文重点介绍了alt标签是什么意思,以及alt标签的作用和优化方式。总之来说,alt标签的优化无论是对搜索引擎还是对用户都有好处,所以如果页面...
  • 目录 云计算基础(Cloud Essentials): 安全(Security): ...云基础产品体系完整度全球领先,基础产品及功能持续投入建设,源源不断的通过新技术提高企业云上的计算、运维、开发和管理能力。...
  • 视频打标签算法探讨

    千次阅读 2019-03-20 23:21:29
    随着内容时代的来临,多媒体信息,特别是视频信息的分析和理解需求,如图像分类、图像打标签、视频处理等等,变得越发迫切。目前图像分类已经发展了多年,在一定条件下已经取得了很好...
  • 本篇文章主要的介绍了关于html img标签图片的等比例缩放的介绍和使用实例,最后还有关于html img标签图片等比例缩放的总结,接下来让我们一起来看这篇文章吧 首先我们先看看html img图片如何等比例缩放: 在DIV CSS...
  • 这里有一个有趣的视频:大致介绍了Atlassian家族DevOps的工具。世界上没有哪种工具能够像DevOps这么神奇(或敏捷,或精益)。DevOps在开发和运营团队之间建立了完美的合作与沟通,因此与其说这是一种神奇的工具,...
  • HTML 基本开发方式,学会常用的 HTML 标签

    千次阅读 多人点赞 2022-04-28 19:13:22
    是每个标签都有的) alt 替换文本:如果图片挂了,就会用这个 alt 中的属性来表示图片,如果图片能正常展示,就不会显示 alt 中的内容 title:提示文本,鼠标放到图片上,就会有提示 width / height:控制宽度高度,...
  • 1.2 电子敏感标签产品分类及头部企业 1.3 全球及中国市场电子敏感标签行业相关政策 2 全球电子敏感标签市场产业链分析 2.1 电子敏感标签产业链 2.2 电子敏感标签产业链上游 2.2.1 上游主要国外企业 2.2.2 上游主要...
  • 首先调研和了解小米官网及登录页面的整体布局,首页大的方面分为概览、产品介绍、售后服务这三个功能,下来请看我写的静态页面的具体分析: 首页概览: 部分产品介绍: -售后服务: 2.写代码:分享一下我所用到的...
  • AI产品经理成长路

    千次阅读 2018-08-31 16:54:13
    AI产品经理——成长路   https://www.cnblogs.com/DicksonJYL/p/9566740.html     以下都是自己平时知识的一些总结,只是一些个人的愚见,下面出现的公司、书籍、视频、网站都是自己看过体验过的,不是给...
  • 对跨境卖家来说,产品图片的采集与处理是绕不开的工作,精美的产品图片能够提升产品及店铺在用户心中的关注度,提升产品的搜索排名。今天小编给大家总结了20个国外免费、高清图片素材网站,希望对各位跨境卖家有所...
  • 1 B 端产品经理 如何理解B端产品? B端产品主要分为两大类: 为公司的管理服务,如:HR系统、OA系统; 为公司的运营服务,如:供应链系统、ERP系统的。 B端产品即要符合商业组织的战略要求,能够满足商业用户...
  • 艺赛旗RPA8.0产品介绍

    千次阅读 2019-02-18 15:29:57
    关于艺赛旗产品的功能介绍,官网的论坛有比较详细的文档,链接如下,可自行查看。 http://support.i-search.com.cn/recent 或者点击艺赛旗RPA设计器的链接图标: 本文从以下内容探讨艺赛旗RPA产品功能:组件...
  • 金士顿标签含义,如何鉴别真假?

    千次阅读 2021-08-05 09:51:38
    4、内存真假难辨,想知道内存条上的每个字母是不是也有真假之分?每个字母代表什么含义?希望以金士顿为例子讲解一下。...金士顿单条4GB DDR3-1333内存标签对于内存标签,用户不必太在意,只要知道一些基本信息即可...
  • vue插件之vue-piczoom 图片放大镜介绍

    千次阅读 2020-04-14 15:21:30
    自己最近在做产品详情页面的时候,需要实现图片放大这么一个功能,因为偷懒,就在网上找了一个插件,想跟大家分享一下。今天分享的主角是vue-piczoom,它是基于vue2.x的电商图片放大镜插件。 二、vue-piczoom介绍 ...
  • Tagoram DAH 射频全息图 利用商业化产品对移动射频标签进行实时高精度追踪 图2(a)相位值分布(相位值遵循高斯分布) (ii)为了证实在RF相位测量上存在标签多样性,我们一次将70枚标签放置在了相同的位置。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 36,584
精华内容 14,633
关键字:

产品介绍标签图片