博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
论文浅尝 | 多标签分类中的元学习
阅读量:4204 次
发布时间:2019-05-26

本文共 1822 字,大约阅读时间需要 6 分钟。

论文笔记整理:叶群,浙江大学计算机学院,知识图谱、NLP方向。


640?wx_fmt=png

会议:EMNLP 2019

链接:https://arxiv.org/abs/1909.04176

Abstract

这篇论文首次在多标签分类问题中提出了 meta-learning 的方法,学习weight policy 和 decision policy,分别指代训练时损失函数中不同标签的权重和预测时不同标签的阈值,从而更好地建模不同标签之间的依赖和复杂性。在实验表明在 entity typing 和 text classification 两个任务中都取得了更好的实验结果。

Introduction

     传统的多标签分类模型,在训练时采用标准的交叉熵损失函数,即每个类别的权重一致;在测试时,每个类别的阈值一般都取0.5。这种简单的设定忽略了标签之间的依赖关系,忽略了不同标签的重要性。实际中很多标签之间存在着关系,比如/organization和/company, /urban和/economics。本文利用meta learning的方法学习weight policy和decision policy,分别指代训练时损失函数中不同标签的权重和预测时不同标签的阈值。实际上权重和阈值可以被看做两个超参数,meta-learning学习到这两个超参数之后,传递给下游模型进行训练,所以本文的meta-learning方法是模型无关的。

Method

模型图如图1所示,基本结构分为两部分:meta-learner 和 classification model。Meta-learner的任务是学习 weight policy 和 decision policy,即权重和阈值两个超参;Classification model 根据学习到的两个超参,训练一个 Batch,并进行测试得到测试结果,并以测试结果作为 reward 去更新 meta-learner 和 classification model的参数。

640?wx_fmt=png

图1 模型结构示意图

Meta-learner

    Meta-learner 的结构采用了 GRU,采用了强化学习的方法去进行weight policy和decision policy的学习。其中,强化学习的state是GRU的隐层表示:

640?wx_fmt=png

Weight policy和decision policy的定义:

640?wx_fmt=png

640?wx_fmt=png

Reward的定义:

640?wx_fmt=png

Classification Model

分类模型可以是任何形式的,只要损失函数是交叉熵形式即可,这里采用的损失函数为:

640?wx_fmt=png

其中类别数为N,w为不同类别的权重。只训练一个Batch就进行测试,这样可以减轻训练的开销。

Experiments

      实验在entity typing和text classification两个任务上进行了评测。在entity typing上选取的数据集为FIGER、OntoNotes、BBN,分类模型采用了entity typing中的SOTA模型,其结构如下:

640?wx_fmt=png

图2 entity typing模型结构示意图

实验结果如表1所示,加入weight policy和decision policy,模型的结果可以有2~3个百分点的提升。

表1 entity typing实验结果

640?wx_fmt=png

      由于本文中 meta-learning 的方法是基于强化学习的框架,而强化学习通常缺乏鲁棒性和对初始化敏感。实验采用不同的初始化方法进行多次实验,结果如表2所示。

表2 模型鲁棒性实验

640?wx_fmt=png

    文本分类任务模型选取了经典的 text CNN 模型,数据集有 Reuters-21578、RCV1-V2,实验结果如表3所示。

表3 文本分类实验结果

640?wx_fmt=png

          模型的鲁棒性分析如表4所示。

表4 模型鲁棒性实验

640?wx_fmt=png

 

Conclusion

       本文在多标签分类任务中,利用 meta-learning 的方法学习 weight policy和 decision policy,从而为不同标签学习到不同的权重和阈值,在entity typing 和文本分类两个任务上效果有所提升。但是针对作者所说的,可以建模不同标签之间的 dependency,我觉得这一点上模型并没有显式地体现这一点。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

转载地址:http://ztsli.baihongyu.com/

你可能感兴趣的文章
Gym 101196C The Key to Cryptography字符串加密
查看>>
Gym 101196D Lost in Translation(BFS)
查看>>
KMP求前缀函数(next数组)
查看>>
KMP
查看>>
线段树从零开始
查看>>
用链表实现一元多项式的加、减、乘、求导运算
查看>>
区间不同gcd的个数
查看>>
Class(ACM ICPC 2008–2009, NEERC, Northern Subregional Contest)
查看>>
数字图像处理 实验指导书
查看>>
hdu 4911求逆序数
查看>>
hdu 4920矩阵连乘
查看>>
hdu 4611循环节 Balls Rearrangement
查看>>
Java Number & Math 类
查看>>
数字图像处理实验一代码部分
查看>>
给一个不多于5位的正整数,要求:一、求它是几位数,二、逆序打印出各位数字。
查看>>
poj 3869 Headshot(全概率公式)
查看>>
poj 3862 Asteroids三维凸包➕重心
查看>>
poj 3863Business Center
查看>>
POJ 3865 - Database 字符串hash
查看>>
Deposits Gym - 100623D区间能整除的个数
查看>>