地点识别调研 施林锋
相关工作 命名实体识别 Location, Person, Organization, Other Chiu, J. P., & Nichols, E. (2015). Named entity recognition with bidirectional LSTM-CNNs. arXiv preprint arXiv:1511.08308.
相关工作 事件报道中地点实体的提取研究 地点实体抽取的困难 基于规则 嵌套现象: 同一个地点的多种表示 事件词:地震、火灾、袭击、中毒…… 位于伊朗中央省首府阿拉克市西南的一家化工厂 同一个地点的多种表示 托科皮亚以南120公里的安托法加斯塔市 安托法加斯塔 安市 基于规则 事件词:地震、火灾、袭击、中毒…… 词性:loc 地点指示词:在、位于、距离…… 事件共性:时间+地点+发生+事件词 高燕. 事件报道中地点实体的提取研究[D].北京语言大学,2009.
相关工作 地点识别及关系抽取 地点识别:词表的方式 关系抽取: bootstrap <subject, verb, geo-entity> 他飞往南京 <geo-entity, adj> 泰山风光秀丽 <geo-entity, position> 北京市市长 Location/Neighbor relations: 南京位于江苏省/南京东连富饶 的长江三角洲 bootstrap Cao, Cungen, Shi Wang, and Lin Jiang. "A Practical Approach to Extracting Names of Geographical Entities and Their Relations from the Web." International Conference on Knowledge Science, Engineering and Management. Springer, Cham, 2014.
数据集 英文: CoNLL-2003 NER, OntoNotes 中文: 人民日报 微软分词语料
中文的研究相对较少 针对地点,缺乏标准的、较新的数据集