初探高考地理题目中折线图的表示 王彬
目录 01 02 背景介绍 折线图分析 03 04 折线图形式化定义 折线图本体及规则实现 05 06 折线图实验 总结与展望
背景介绍
863项目“开放域知识关联、推理与检索关键技术及系统” 背景介绍[1] 4 863项目“开放域知识关联、推理与检索关键技术及系统” 项目号:2015AA015406 问答系统的研究与实现 在高考地理中对问答系统进行测试与评价
背景介绍 5 统计图表题在高考地理试题中占较高比重 图1.1 2008年-2012年五地地理高考试卷统计图表题分值比重统计[3]
背景介绍 6 折线图是一种有代表性的统计图表 折线图的推理是解答此类问题的重要环节 研究折线图的表示和推理具有重要意义
折线图分析
折线图组成 坐标轴 折线图分析——组成结构 图名、坐标轴、图例、折线、折线上的点 分类坐标轴:标示折线上点的类型 8 折线图组成 图名、坐标轴、图例、折线、折线上的点 坐标轴 分类坐标轴:标示折线上点的类型 数值坐标轴:标示折线上点的数值
折线图数值信息 折线图分析——组成结构 折线图分析 折线图中点的坐标数据 折线图由一组折线构成 折线由一组点构成 9 折线图数值信息 折线图中点的坐标数据 折线图由一组折线构成 折线由一组点构成 图2.1 2003年高考地理全国卷第7-9题干材料
例:图2.1 折线图分析——组成结构 折线图分析 每个点由四个数据确定,如:(煤炭,生产,1985年,72) 前两个数据用于确定折线类别 10 例:图2.1 每个点由四个数据确定,如:(煤炭,生产,1985年,72) 前两个数据用于确定折线类别 后两个数据是坐标系确定的数据 最后一个数据称为数值数据 其余数据称为分类数据 同一折线上的点的分类数据有一个 互不相同 图2.1 2003年高考地理全国卷第7-9题干材料
特殊折线图 折线图分析——组成结构 折线图分析 有多个纵坐标或横坐标 几个图的一种简便表示方法,折线点仅在一个坐标系中有意义 11 特殊折线图 有多个纵坐标或横坐标 几个图的一种简便表示方法,折线点仅在一个坐标系中有意义 图2.3 2005年高考地理全国卷第10-12题图 图2.2 2006年高考地理全国卷第3-5题图
同一折线上不同点之间的变化幅度和变化趋势 折线图分析——考查模式 12 同一折线上不同点之间的变化幅度和变化趋势 煤炭消费量的比重增加最多 天然气生产量的比重变幅最大 … 不同折线上点的比较 煤炭生产量所占比重低于其消费量所占比重 …
对折线点的查询,涉及折线上点的比较 折线的总体变化趋势 折线上两个点的数据变化率 折线图分析——考查模式 13 对折线点的查询,涉及折线上点的比较 2000年消费量超过生产量20%以上的能源种类有哪些 … 折线的总体变化趋势 天然气消费呈下降趋势 … 折线上两个点的数据变化率 图中的气温降低速率在3000米以下低于垂直递减率 …
两条折线的相关性分析 判断折线的类别 其他 折线图分析——考查模式 该河流的补给主要来源于降雨 … 14 两条折线的相关性分析 该河流的补给主要来源于降雨 … 判断折线的类别 下列四幅图中,表示台风过境气压变化的是哪个 … 其他 模糊信息理解,如1994年,石油生产量和消费量所占比重相近 …
折线图分析——总结 15 折线图结构形式化定义的指导原则 保持结构精简 保持功能单纯 保持数据直观
折线图 形式化定义
折线图是一个二元组(DS,DP) 数据点是一个三元组(id,CD,vd) 折线图形式化定义——组成结构 17 折线图是一个二元组(DS,DP) DS表示所有折线的集合,称为数据序列集合 DP表示所有点的集合,称为数据点集合 数据点是一个三元组(id,CD,vd) id表示数据点在数据序列上的顺序序号,是一个整型数 CD表示数据点的分类数据的集合 vd表示数据点的数值数据
约束条件 折线图形式化定义——组成结构 集合DS是集合DP的一个划分,且DS中每个元素的大小相同 18 约束条件 集合DS是集合DP的一个划分,且DS中每个元素的大小相同 同一数据序列中的不同数据点之间,其分类数据集合CD仅有一个元素不同
折线图考察模式中的基本运算 折线图形式化定义——考查模式 数据点的比较 数据点之间的变化幅度和变化趋势 数据点之间的变化率 19 折线图考察模式中的基本运算 数据点的比较 数据点之间的变化幅度和变化趋势 数据点之间的变化率 数据集合上的聚合函数如:最大值、最小值、求和等
两个数据点相等equal(dp1,dp2) 两个数据序列相等equal(ds1,ds2) 折线图形式化定义——考查模式 20 两个数据点相等equal(dp1,dp2) CD1 = CD2 则 id1 = id2, vd1 = vd2且equal(dp1,dp2)=true; CD1!= CD2 则 equal(dp1,dp2) = false。 两个数据序列相等equal(ds1,ds2) ∀dp1 ∈ ds1, ∃dp2 ∈ ds2, equal(dp1, dp2) =true则 equal(ds1,ds2)=true; ∃dp1 ∈ ds1, ∃dp2 ∈ ds2, equal(dp1, dp2) =false 则equal(ds1,ds2)=false。
两个数据点是否属于同一个数据序列isInSameDataSeries(dp1,dp2) 折线图形式化定义——考查模式 21 两个数据点是否属于同一个数据序列isInSameDataSeries(dp1,dp2) 假设dp1∈ds1,dp2∈ds2,那么 equal(ds1,ds2)=true 则 isInSameDataSeries(dp1,dp2)=true; equal(ds1,ds2)=false 则 isInSameDataSeries(dp1,dp2)=false。 两个数据点的比较compare(dp1,dp2) equal(dp1,dp2)=true则compare(dp1,dp2)=0; equal(dp1,dp2)=false则 compare(dp1,dp2)=vd1-vd2。
同一数据序列上两个数据点的变化幅度 variation(dp1,dp2) 折线图形式化定义——考查模式 22 同一数据序列上两个数据点的变化幅度 variation(dp1,dp2) isInSameDataSeries(dp1,dp2)=false则 variation(dp1,dp2)=error; isInSameDataSeries(dp1,dp2)=true 且 id1 >= id2则variation(dp1,dp2)= compare(dp1,dp2); isInSameDataSeries(dp1,dp2)=true 且 id1 < id2则variation(dp1,dp2)= compare(dp2,dp1)。
同一数据序列上两个数据点的变化趋势trend(dp1,dp2) 折线图形式化定义——考查模式 23 同一数据序列上两个数据点的变化趋势trend(dp1,dp2) variation(dp1,dp2)=error 则 trend(dp1,dp2)=error; variation(dp1,dp2)>0,trend(dp1,dp2)=上升; variation(dp1,dp2)<0,trend(dp1,dp2)=下降; variation(dp1,dp2)=0,trend(dp1,dp2)=保持。
同一数据序列上两个数据点的变化趋势trend(dp1,dp2) 折线图形式化定义——考查模式 24 同一数据序列上两个数据点的变化趋势trend(dp1,dp2) variation(dp1,dp2)=error 则 trend(dp1,dp2)=error; variation(dp1,dp2)>0,trend(dp1,dp2)=上升; variation(dp1,dp2)<0,trend(dp1,dp2)=下降; variation(dp1,dp2)=0,trend(dp1,dp2)=保持。
两个数据点之间在指定分类数据上的变化率rate(dp1,dp2,CDi) 折线图形式化定义——考查模式 25 两个数据点之间在指定分类数据上的变化率rate(dp1,dp2,CDi) CD1i-CD2i=0则rate(dp1,dp2,CDi)=error; CD1i-CD2i!=0则 rate(dp1,dp2,CDi)=compare(dp1,dp2)/(CD1i-CD2i)。
数据点实体集合中的最大值点max(DPsub) 折线图形式化定义——考查模式 26 数据点实体集合中的最大值点max(DPsub) 返回值是一个数据点的集合DPmax,该集合中点的满足条件: ∀dpi ∈ DPmax,对于∀dpj ∈ DP-DPmax,满足vdi>vdj 同理可定义 min(DPsub) 数据点实体集合的求和sum(DPsub) 对数据点集合的求和等价于对数据点集合DPsub中数据点的数据值的求和,即sum(DPsub)=sum({vd}),{vd}是DPsub中数据点的数据值的集合
折线图本体 及规则实现
用DLV-HEX[13]系统实现规则结合本体的推理 折线图本体及规则实现 28 用OWL2本体表示折线图的组成与结构 用ASP规则表示折线图的基本运算 用DLV-HEX[13]系统实现规则结合本体的推理
折线图本体及规则实现——本体 29 折线图本体 类 对象属性 数据属性 图4.1 折线图本体
两个数据点相等equal(dp1,dp2) 折线图本体及规则实现——规则(选) sameCD(P1,P2,CD1,CD2):- 30 两个数据点相等equal(dp1,dp2) sameCD(P1,P2,CD1,CD2):- hasCategoryData(P1, CD1), hasCategoryData(P2, CD2), CD1 = CD2. equalPoint(P1,P2) :- CNT1=#count{scd(P1,P2):sameCD(P1, P2,CD1,CD2)}, CNT2=#count{hcd (CD1): hasCategoryData (P1,CD1)}, CNT1 = CNT2.
两个数据点相等equal(dp1,dp2) 折线图本体及规则实现——规则(选) -equalPoint(P1,P2) :- 31 两个数据点相等equal(dp1,dp2) -equalPoint(P1,P2) :- CNT1=#count{scd(P1,P2):sameCD(P1, P2,CD1,CD2)}, CNT2=#count{hcd (CD1): hasCategoryData (P1,CD1)}, hasCategoryData(P1, CD1), hasCategoryData(P2, CD2), CNT1 != CNT2.
折线图实验
实验目的 实验环境 实验对象 折线图实验 分析折线图本体和规则的表达能力和可用性 Windows平台 本体建模工具protégé 33 实验目的 分析折线图本体和规则的表达能力和可用性 实验环境 Windows平台 本体建模工具protégé 规则推理机clingo4.0 目前是采用手工查询本体 实验对象 2003年-2014年高考地理全国卷和北京卷中以折线图为考查内容的选择题共38道
折线图实验 34 折线图本体实验分析 图5.1 折线图组成与结构建模示例
折线图实验 35 折线图本体实验分析 hasCategoryData的值域为字符串型数据,但是实际使用中很多折线图的分类数据可以为数值型数据,并且会参与到数值运算中,将分类数据限制为字符串会给推理的过程带来不便。
折线图实验 36 折线图推理实验分析 图5.2 折线图基本运算使用频率统计
折线图实验 37 折线图推理实验分析 复杂的运算难以定义,如:整体折线的变化趋势等; 模糊概念不易处理;
总结与展望
总结 总结与展望 为本体结合规则的方法在高考地理试题求解中的作用提供了事实依据,证明了这种方法的可行性; 39 总结 为本体结合规则的方法在高考地理试题求解中的作用提供了事实依据,证明了这种方法的可行性; 为地理试题中众多图表的结构化表示提供了一种简单可行的方法; 为实现本体结合规则的推理机提供了一定的指导
总结与展望 40 展望 OWL2本体中数据类型属性的值域的数据类型不灵活,无法适应各种应用需求。一种可行的解决方案是将数据类型属性全部设置为字符串型,并增加新的数据类型属性用于描述每个数据值的数据类型为地理试题中众多图表的结构化表示提供了一种简单可行的方法; 研究开发规则结合本体推理机。
展望 总结与展望 折线图的复杂运算和模糊运算不易定义,这需要我们对折线图及其在高考地理中的考查作更加深入的研究; 41 展望 折线图的复杂运算和模糊运算不易定义,这需要我们对折线图及其在高考地理中的考查作更加深入的研究; 除了上述三个问题之外,未来还可以将本文工作从折线图扩展到整个统计图表在高考地理中的考查领域,从而解决更多的问题;
规则结合本体解答地理题目的系统模块初步设想 42 公共知识库 私有知识库 普遍适用的地理知识的RDF数据集或基于其他表示方法的数据集 题目中的局部数据 计算函数库 规则集 公式计算或数学运算库 用于题目求解的规则
参考文献 43 [1] 瞿裕忠. 863项目“开放域知识关联、推理与检索关键技术及系统”申报书, 项目号: 2015AA015406, 2014. [2] 李振波. 新世纪以来我国高考地理试题变化研究[D]. 华中师范大学, 2013. [3] 朱树亭. 地理文综高考统计图表题解析探讨[D]. 重庆师范大学, 2013. [4] Gelfond M, Lifschitz V. The stable model semantics for logic programming[C]//ICLP/SLP. 1988, 88: 1070-1080. [5] Statistical Graph Ontology (complex),http://ontology.dumontierlab.com/statistical-graph-complex-2.1.owl [6] Statistical Graph Ontology (primitive), http://ontology.dumontierlab.com/statistical-graph-primitive-2.2.owl [7] Dumontier M, Ferres L, Villanueva-Rosales N. Modeling and querying graphical representations of statistical data[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2010, 8(2): 241-254.
参考文献 44 [8] Horrocks I, Patel-Schneider P F, Boley H, et al. SWRL: A semantic web rule language combining OWL and RuleML[J]. W3C Member submission, 2004, 21: 79. [9] Golbreich C, Dameron O, Bierlaire O, et al. What reasoning support for Ontology and Rules? the brain anatomy case study[C]//Workshop on OWL Experiences and Directions. 2005. [10] Grosof B N, Horrocks I, Volz R, et al. Description logic programs: Combining logic programs with description logic[C]//Proceedings of the 12th international conference on World Wide Web. ACM, 2003: 48-57. [11] Schindlauer R. Answer-set programming for the Semantic Web[M]. na, 2006. [12] Eiter T, Ianni G, Lukasiewicz T, et al. Combining answer set programming with description logics for the semantic web[J]. Artificial Intelligence, 2008, 172(12): 1495-1539. [13] Eiter T, Ianni G, Schindlauer R, et al. DLV-HEX: Dealing with semantic web under answer-set programming[M]. na, 2005.
THANK YOU