论文笔记|Open-world Learning and Application to Product Classification-白红宇

论文笔记|Open-world Learning and Application to Product Classification

阅读量：4289 次

发布时间：2019-05-27

本文共 966 字，大约阅读时间需要 3 分钟。

单位：燕山大学

作者：徐甘霖

在开放领域文本分类的基础上,提出开放世界学习的概念，即一个系统在能识别已知类、拒绝未知类的基础上，能够通过不断的学习未知类。当学习的未知类的数量足够多时，能够将这个未知类增加到系统的已知类集合中。为此，作者提出一个L2AC模型，如下图所示。模型的核心组件有Ranker和Mete-Classifier组成。在这里插入图片描述

Ranker的作用是在每个已知类中抽取与一个测试样例的最近邻的k个已知类样例，然后将这些已知类的k个样例存入Meta-Classifier的Memory中。Meta-Classifier将测试样例与Memory中，经过Matching layer与Aggregation layer输出测试样例属于相应已知类的概率得分。

在进入两个layer之前，先通过Lstm对数据进行编码。测样样例Xt与Memory中每个已知类的k个训练样例，分别进行绝对值相减、相加之后再计算两者之间距离得到Xai，进行sim+全连接+sigmod之后得到相应概率值。

然后经过BiLSTM进行+全连接操作输出最后概率得分。

判断该测试样例是unknown或者是known，采用和前面论文相同的做法。

不过，在这里作者为了能够使算法具有更好的通用性，不同与其他论文的做法，直接将阈值设置为0.5。

本文最大的新颖之处在于，在解决开集识别问题时，采用meta-learning的思想，训练集、测试集、验证机中的类别完全不相交。这样做的好处是模型具备增量学习的能力，当源源不断的unknown样例进行测试时，完全不必重新训练模型，提供了open-set classification一种新的模式。此外作者提出，当测试样例的unkwon数量达到一定规模时，模型能够学习到该类别，也就是把unknown变为known。但是，作者只是人工改变kown集合，增加或者删除know集合中类别的个数，以此使模型具备学习unknown的能力。例外，在测试时，除了需要测试样例，还需要已知类的作为辅助测试，这显然不够“智能”。

论文地址：https://arxiv.org/pdf/1809.06004.pdf

代码地址：https://github.com/howardhsu/Meta-Open-World-Learning

转载地址：http://femgi.baihongyu.com/

你可能感兴趣的文章