Download presentation
Presentation is loading. Please wait.
1
自然语言处理培训课程提纲 Find Real Matter
2
前导知识 Core Java 编译原理 概率论 数据结构 《 Java技术手册》
《 Modern compiler implementation in Java 》 概率论 《应用随机过程:概率模型导论》 数据结构 《 JAVA算法》 Find Real Matter
3
搜索引擎的主要部分 爬虫 全文索引 自然语言处理 框架 《 Web数据挖掘》 《 Lucene In Action 2 edition》
《自然语言处理综论》 框架 《 Solr 1.4 搜索服务器》 Find Real Matter
4
中文分词处理 Lucene 中的中文分词 Lietu中文分词的使用 中文分词的原理 词性标注 正向最大匹配(代码) 查找词典算法
隐马尔可夫模型 Find Real Matter
5
查找词典算法 语法解析树 数字搜索树 Tire树 最佳前驱匹配(代码) Trie树的生成过程(代码) 使用Trie树的常规的API(代码)
Find Real Matter
6
隐马模型 发射概率概念 转移概率概念 统计一个词库中的发射概率和转移概(代码) 隐码模型的实际应用(代码) Find Real Matter
7
文档排重 语义指纹 语义指纹的概念 语义指纹的实际应用(代码) Find Real Matter
8
中文关键词提取 关键词提取的基本方法 关键词提取的设计 从网页提取关键词 关键词提取的实际应用(代码) Find Real Matter
9
拼写检查 英文拼写检查 中文拼写检查 英文拼写检查的实际应用(代码) Find Real Matter
10
自动摘要 自动摘要技术 自动摘要的设计 具体的应用(代码) Find Real Matter
11
自动分类 自动分类的接口定义 自动分类的SVM方法实现 多级分类 Find Real Matter
12
自动聚类 聚类的定义 K均值聚类方法 K均值实现 Find Real Matter
13
语义库 同义 上下文 时态 WordNet缺少词对应的不同时态 Find Real Matter
14
跨语言处理 简繁转换 机器翻译 英文到中文 中文到英文 Find Real Matter
15
Thank you Question? Find Real Matter
Similar presentations