APEX数据和知识管理实验室简介 http://apex.sjtu.edu.cn 上海交通大学 计算机科学与工程系
议程 实验室概况 研究主题与方向 团队与项目 合作伙伴
实验室概况 基础设施 服务器: IBM x240, x250, x360, pSeries;每台服务器都拥有 ~ 4 GB 内存,4 CPUs。 服务器总计有~2 TB 高可靠存储容量 (光纤连接IBM FAStT磁盘阵列) 个人工作站最低配置:P4, 1G, 17” 液晶显示器 实验室内可无线接入Internet 提供在闵行的实验实习环境
实验室概况 实验室人员 APEX实验室现有成员包括博士生导师俞勇教授,博士和硕士研究生共约30人。 俞勇教授曾带队赢得2002年ACM国际大学生程序设计竞赛(ACM ICPC)的世界冠军。 多数研究生获得过各类奖学金,有多名研究生曾在微软和IBM研究中心进行过实习,拥有获得过ACM ICPC世界冠军的多名队员。
实验室概况 实验室毕业学长 共17人,其中: 4人加入了IBM中国研究中心 5人就职于Intel软件实验室 其它去向包括, SONY, SHARP, UBI Soft, 宝信, 华为等企业.
研究主题与方向 研究主题: 数据与知识管理 什么是知识管理? 为什么进行知识管理? 如何进行知识管理? 对分散在各处的知识进行发现、建模、表示、组织、存储、查找、分析、共享和交换。 为什么进行知识管理? 企业和个人的核心竞争力之一就是其获取和利用知识的能力。 如何进行知识管理? 管理层面和技术层面
研究主题与方向 研究方向蓝图
研究主题与方向 三大研究方向 本体工程(ontology engineering) 下一代搜索 语义Web服务 建模、表示、组织和存储各类知识 下一代搜索 更好的在各类环境中搜索信息和知识 语义Web服务 将知识转化为行动
研究方向:本体工程 本体是知识建模和知识表示的核心, 是实现异构数据源语义整合的核心。 我们的研究主要包括对本体的学习, 建造, 版本, 映射, 合并和评价等核心技术的研究。 同时,我们正在开发一个基于Eclipse的本体工程环境ORIENT来集成我们的研究成果。 相关理论与技术: 数理逻辑、软件工程与UML、数据库ER模型
Better Web Search Engine 研究方向:下一代搜索 更好的Web搜索 China Web Graph Analysis Large Scale Data Analysis Heterogeneous Data Analysis Better Web Search Engine 相关理论与技术 机器学习,文本挖掘,随机过程,图论
研究方向:下一代搜索 在对等环境(P2P)下的搜索 WEB中的信息增长速度极快。从理论上说,任何集中式的搜索引擎(例如Google和Yahoo)都无法有效的处理大量出现的新信息。P2P系统得出现,提供了一种新的处理海量信息的手段。 在P2P系统中,信息是分布在系统中的各个节点上的,而信息的搜索是在系统中部分节点上完成的。这样既使得海量信息的存储成为可能,又降低了对系统的性能的要求。我们不再需要Google那样的机群(cluster)便可以实现对海量信息的有效搜索。
研究方向:下一代搜索 在对等环境(P2P)下的搜索 相关理论和技术 在P2P系统中,兴趣相同的用户可以形成兴趣小组(Community)。我们通过分析用户收集的文档的相似性来自动的构建兴趣小组 在完成自动兴趣小组构建的基础上,我们会根据P2P系统的特点同时结合信息检索中的查询优化技术,对用户查询进行优化。 对于兴趣小组中各个节点返回的结果进行整理 相关理论和技术 统计自然语言处理,信息检索,机器学习,模糊数学,图论
研究方向:下一代搜索 语义Web环境下的搜索 当前的Web中的信息都是HTML格式的,机器无法理解其中信息的准确意义,因而难以进行自动的分析和查找 语义Web是Web标准化组织W3C倡导的下一代Web。语义Web上的信息都有基于本体的明确的机器可读的意义。 在语义Web上进行的搜索可以不仅仅通过关键字查找,可以更精确的回答结构化的查询。
研究方向:下一代搜索 语义Web环境下的搜索 相关理论与技术 如何让用户自然的输入混合有关键字的结构化查询? 如何综合推理与检索来满足用户的查询? 如何展示混合有文档、对象和知识的搜索结果? 如何搭建实验平台和展示该方法的应用? 语义门户网站及其上的搜索 相关理论与技术 描述逻辑与推理、信息检索、智能界面
研究方向:语义Web服务 Web服务使Web向着一个基于Internet的计算平台发展。然而现在的Web服务标准的描述能力有限,极大的限制了对Web服务的自动查找、发现、匹配和整合。 基于Web的知识表示语言具有恰当的表达能力和可计算性。如果能将它们应用到对服务的语义描述上,将使得对Web服务的自动查找、发现、匹配和整合成为可能。
研究方向:语义Web服务 本项研究试图扩展语义Web上的知识表示语言,以使用它们来更好的描述Web服务的语义信息,从而在此基础上,实现对Web服务的自动查找,发现,匹配和整合。
团队与项目 ORIENT项目 (本体工程方向) 基于Eclipse平台的本体工程环境 与IBM中国研究中心联合研发 暑期实习内容 已提交论文 1 篇,正撰写论文 1 篇 ORIENT第一版即将在IBM AlphaWorks网站发布 暑期实习内容 通过使用ORIENT构建本体,对系统进行测试(1人) 需要初步学习RDF(S)并使用Bugzilla 基于Eclipse的UI开发(1人) 需要学习Eclipse的Plug-in开发技术
团队与项目 Web搜索团队 (下一代搜索方向) 由2位在微软亚洲研究院的博士主持工作 已发表论文多篇 暑期实习内容 做Yahoo目录数据分析的相关工作 (1人) 中国Web Graph演化分析的相关工作 (1人) Web聚类算法的相关工作(1人)
团队与项目 P2P搜索团队(下一代搜索方向) 已发表论文多篇 暑期实习内容 实现一个P2P模拟器,需要比较强的Java编程能力(1人)
团队与项目 语义搜索团队(下一代搜索方向) 已发表论文一篇 暑期实习内容 智能用户界面相关工作(1人) 语义门户网站相关工作(1人) 需要熟悉 JavaScript 和 HTML DOM 模型 语义门户网站相关工作(1人) 需要熟悉 CSS
团队与项目 语义Web服务团队 暑期实习内容 学习并构建本体和相应的OWL-S描述的Web服务 (1人) 需要学习OWL, OWL-S 学习推理机的搭建与使用,并研究和比较其性能 (1人) 需要学习Racer、Jess、Able 以及Prolog
团队与项目 普及运算团队 (移动数据管理前期) 开发移动设备(Pocket PC, Palm, Mobile Phone)上的各种应用程序 新e代技术研究中心合作开发(上海交大-IBM-香港大学联合) 当前项目: 无线外汇买卖系统 已成为 IBM 全球演示项目 Pocket PC 上的贪吃蛇游戏
团队与项目 普及运算团队 (移动数据管理前期) 暑期实习内容 基于JAVA/J2ME/J2SE/J2EE的移动应用开发和测试 (2人) 需要较强的快速学习能力和良好的沟通能力
合作伙伴 IBM中国研究中心 微软亚洲研究院 新e代技术研究中心(上海交大-IBM-香港大学联合)
APEX实验室期待您的加入 !