博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
论文笔记|Open-world Learning and Application to Product Classification
阅读量:4289 次
发布时间:2019-05-27

本文共 966 字,大约阅读时间需要 3 分钟。

单位:燕山大学

作者:徐甘霖


  在开放领域文本分类的基础上,提出开放世界学习的概念,即一个系统在能识别已知类、拒绝未知类的基础上,能够通过不断的学习未知类。当学习的未知类的数量足够多时,能够将这个未知类增加到系统的已知类集合中。为此,作者提出一个L2AC模型,如下图所示。模型的核心组件有Ranker和Mete-Classifier组成。在这里插入图片描述

Ranker的作用是在每个已知类中抽取与一个测试样例的最近邻的k个已知类样例,然后将这些已知类的k个样例存入Meta-Classifier的Memory中。Meta-Classifier将测试样例与Memory中,经过Matching layer与Aggregation layer输出测试样例属于相应已知类的概率得分。
  在进入两个layer之前,先通过Lstm对数据进行编码。测样样例Xt与Memory中每个已知类的k个训练样例,分别进行绝对值相减、相加之后再计算两者之间距离得到Xai,进行sim+全连接+sigmod之后得到相应概率值。
在这里插入图片描述然后经过BiLSTM进行+全连接操作输出最后概率得分。
在这里插入图片描述判断该测试样例是unknown或者是known,采用和前面论文相同的做法。
在这里插入图片描述不过,在这里作者为了能够使算法具有更好的通用性,不同与其他论文的做法,直接将阈值设置为0.5。
  本文最大的新颖之处在于,在解决开集识别问题时,采用meta-learning的思想,训练集、测试集、验证机中的类别完全不相交。这样做的好处是模型具备增量学习的能力,当源源不断的unknown样例进行测试时,完全不必重新训练模型,提供了open-set classification一种新的模式。此外作者提出,当测试样例的unkwon数量达到一定规模时,模型能够学习到该类别,也就是把unknown变为known。但是,作者只是人工改变kown集合,增加或者删除know集合中类别的个数,以此使模型具备学习unknown的能力。例外,在测试时,除了需要测试样例,还需要已知类的作为辅助测试,这显然不够“智能”。


论文地址:https://arxiv.org/pdf/1809.06004.pdf

代码地址:https://github.com/howardhsu/Meta-Open-World-Learning

转载地址:http://femgi.baihongyu.com/

你可能感兴趣的文章
epoll 边沿触发
查看>>
String类 默认生成的函数
查看>>
Linux 软连接与硬链接
查看>>
视音频数据处理入门:H.264视频码流解析
查看>>
视音频数据处理入门:AAC音频码流解析
查看>>
视音频数据处理入门:UDP-RTP协议解析
查看>>
视音频数据处理入门:FLV封装格式解析
查看>>
最简单的基于FFMPEG的封装格式转换器(无编解码)
查看>>
base64 编码原理
查看>>
单链表是否有环的问题
查看>>
判断两个链表是否相交并找出交点
查看>>
归并排序
查看>>
STL常见问题
查看>>
time_wait和close_wait状态
查看>>
STL中vector、list、deque和map的区别
查看>>
Linux下多线程查看工具(pstree、ps、pstack)
查看>>
PID PPID LWP NLWP
查看>>
查看线程CPU占用情况
查看>>
查看个线程的CPU 内存占用
查看>>
Fiddler 教程
查看>>