空间元素抽取及其 关系识别 施林锋
空间元素抽取 任务目标 空间元素种类 识别句子中的空间元素的位置及其类别 如:Saitama is northwest of Tokyo. Saitama-Place, northwest-Spatial Signal, Tokyo-Place 空间元素种类 Place, Spatial Entity, Motion, Spatial Signal, Motion Signal, Path, Nonmontion event
尝试方法 BiLSTM+CRF Word representation Contextual word representation Word embedding Character bi-LSTM Contextual word representation Bi-LSTM Decoding Softmax Linear-chain CRF
Word representation Word embedding Character bi-LSTM 预训练好的词向量 – Glove
Contextual word representation 建模单词之间的上下文信息 每个向量在经过一层全连接层,得到对应类型的 分数似然
Decoding Softmax Linear-CRF 每个单词的向量转化成概率分布,取概率最大的类型 缺点:局部的,没有充分利用上下文信息 New York Linear-CRF Given a seq of words { 𝜔 1 ,…, 𝜔 𝑚 }, seq of score vectors { 𝑠 1 ,…, 𝑠 𝑚 }, a seq of tags { 𝑦 1 ,…, 𝑦 𝑚 }
结果 下一步 混淆矩阵,每个类的分类效果 尝试加入手工特征 尝试基本的CRF Embedding Precision Recall F1 不使用 0.65 0.75 0.69 使用 0.78 0.66 0.71 Fine-tune 0.77 0.72 0.74