搜索引擎优化
搜索引擎(SEO)概述 影响SEO的因素 关键词与SEO 内容策略 链接策略 数据监测与分析 SEO进阶 经典案例分析 1 2 3 4 5 6 数据监测与分析 7 SEO进阶 8 经典案例分析
URL命名技巧 A、中文命名方式 以关键字的中文形式为URL组成部分进行命名要比使用英文或拼音更为简单。因为,中文形式的关键字不需要考虑分隔符等问题,只需要选择与目录或者页面内容相关的关键字即可。但并不是所有的的搜索引擎都检索含中文字符的URL。 B、英文命名方式 以关键字的英文形式为URL各组成部分进行命名是目前最常用的URL命名方式之一,需要注意2点: 使用一个实际存在的单词或者词组作为URL各组成部分名称; 组成词组的单词必须用分隔符进行分割,一般在URL中使用“-” 拼音形式的关键字搜索:dianshihudong(点石互动),yuxiang(鱼香肉丝);关于电子商务的未来:guan-yu-dian-zi-shang-wu-de-wei-lai.html;This-is-a-book.html; 拼音命名方式的代表:百度,李宁。英文命名方式:中国制造网。 C、拼音命名方式 目前,绝大多数的搜索引擎都支持拼音形式的关键字搜索。也就是说,中文搜索引擎可以识别拼音形式的关键字。因此,也可以使用关键字的拼音形式对URL各组成部分进行命名,这对于提高中文页面的相关性非常重要。 用“-”在各个汉字对应拼音之间分割
URL长度 URL长度组成 URL长度=Internet资源类型+域名长度+端口号+路径长度+文件名长度 URL长度的影响 关键字词频 在一个完整的URL中,不管是对普通用户还是搜索引擎,主关键字只出现一次都是较为友好的。 Internet资源类型,一般是http服务,也有可能是ftp服务;80端口被微软的默认iis占用;www.baidu.com就是一个域名 关键字组合 在URL中,可以使用分隔符对URL各部分名称进行组合,从而产生新的词组(或短语)来拓展URL的意义。
URL优化 域名长度 域名长度不适合取太长的,无论记忆还是输入都不方便。 域名商标 注册域名时,应该避免使用已知注册商标作为网站域名。这样会侵犯别人的权益,对方有权收回。 关键字词频 在申请域名时还需要注意域名中关键字词频的问题,应该避免在域名中重复出现同一关键字。 网站比较大的时候考虑用子域名,否则用子文件夹就可以了,主域名+目录的案例代表:www.163.com下的学院新闻;子域名:http://tech.163.com,新浪底下的专题; 子域名 一般而言,使用子域名的方式比“主域名+目录”的方式更有优势。
URL优化 文件名 目录名称与文件名称的组合需要满足: 目录与文件之间必须是相邻的; 目录名称与文件名称是 独立存在的关键字,且组合后所产生的关键字是独立存在的; 组合后的关键字与页面内容是相关的 http://www.mobile-phone.com/nokia/e71.html
URL拼写规则-目录层级 建议目录层级最多三层,最好不要像下面这样(4层): http://www.unsbiz.com/dir1/dir2/dir3/page.html Unsbiz 首页招聘新闻 http://www.unsbiz.com/exhibition/liveshow/hotshow/hot2.html
URL拼写规则- URL写法 目录和文件包涵关键词:可采用拼音或者英文。如: 跑步新闻:http://www.unsbiz.com/wangye/paobu.html 新闻频道:http://www.unsbiz.com/news.html ;http://news.unsbiz.com URL中关键词的分隔:遵循分词原则,使用半角英文字符 分隔,一般采用“-” 等: made-in-china.html = made In china.html (正确);made_in_china.html = madeinchina.html(错误,madeinchina不会被英文分词)
网站基本要求 性能稳定 速度较快 内容/功能丰富 具有:价值、吸引力、粘贴力。
网页代码规范 代码规范有助于Spider高效率爬行 CSS、JS与HTML分离 尽量(非必须)使用DIV+CSS 网页代码精简 避免重要信息出现不利因素
网页静态化 网页静态化可以提高浏览速度,有利于搜索引擎蜘 蛛高效率的爬行,提高并加快搜索引擎收录 实现方式 ASP、PHP、JSP等生成静态网页 利用Apache、IIS的Rewrite伪静态 很多公司使用的是伪静态 http://hotels.ctrip.com/hotel/shanghai2/ / 地址中包含关键词shanghai、hotel 目录形式 机票、酒店、度假、目的地指南、社区、英文、 CHINATRAVLE中都有使用
网页静态化 内页优化 A、纯静态 一般以htm和html为文件后缀,并且不包含任何表单和交互信息。 B、伪静态 1)Re-write的使用 2)SSI和Ajax技术的使用 项目 纯静态化 伪静态化 动态化 收录 容易 不易 相似网页 不易产生 易产生 更新 互动性 没有 有 响应速度 最快 较快 较慢
网页静态化标准 静态化的标准:URL中不带任何参数。 静态化的原因: 如果必须用动态网址,URL中参数别超过3个。 常见错误: 举例: 只要不带参数,.php .asp .aspx等都是静态的。 静态化的原因: 静态的URL被搜索引擎收录的效率明显高于动态; 静态的URL一般比较短,方便用户传播。 常见错误: URL中带有此类符号: # ? = $ PHP编写的页面,URL中出现临时用的SESSID。 举例: http://www.abcd.com/bbs/?PHPSESSID=88f44d9c1b4834ab7314597d494025b3 因为每次访问页面的URL都不一样,这样的页面是不会被搜索引擎收 录的。 如果必须用动态网址,URL中参数别超过3个。
关键词部署 内页优化 A、网页Title B、Keywords中 Keywords是页面关键词,虽然已经被众多黑帽SEO利用,导致权重下降,但仍然是搜索引擎关注点之一。Keywords应该限制在6~8个关键词。 页面位置 首选Title写作 次选Title写作 首页 A网 A网 | Slogan 栏目页/主题页 B频道_A网 B频道_A网_关键词 内页 C文章_B频道 C文章_B频道_A网 页面位置 首选Keywords写作 次选Keywords写作 首页 3~4个核心关键词,3~4个拓展关键词 6~8个核心关键词 栏目页/主题页 频道名,频道关键词,网站核心关键词 频道名,频道关键词 内页 文章TAG,1~2个网站核心关键词 文章TAG
关键词部署 内页优化 C、Description中 对于关键词的作用明显降低,但由于很多搜索引擎,仍然大量采用网页的MATA标签中描述部分作为搜索结果的“内容摘要”。 我们提倡,Description作为网站的总体业务和主题概括,多采用“我们是…”“我们提供…”“×××网作为…”“电话:010…”之类语句。 我们坚决反对,Description与Keyword完全相同或者Description包含Keyword,同时反对Description出现“全球最大”“永久免费” 等不着边际的词句和单独出现的关键词。
内页优化 关键词部署 D、正文重点浏览处 页面靠顶部、左侧、标题,正文前200字和代码结束处200字,是搜索引擎的重点抓取点,也是判断网页与事前设定的关键词是否匹配或者匹配度有多高的重要依据。 Nielsen Norman Group用户网页浏览行为研究表明,用户浏览注意力呈“F”型结构,而根据SEO们的研究发现,搜索引擎蜘蛛的浏览注意力呈“E”型。
关键词部署 内页优化 E、超链接采用有意义的“文本链接”和Title属性的使用 超级链接的作用,大概相当于搜索引擎的领路人,如果链接过多的采用类似于“A网”“A.COM”这样的“锚文本”,搜索引擎基本上会忽略;如果采用LOGO作为链接,那搜索引擎根本看不懂;只有采用“A网站的相关业务关键词”或“中国某行业第一站”这样的锚文本,搜索引擎才能按照新的关键词建立索引,才能真正意义上影响到PageRank和Ranking。 链接中的Title属性是SEO经常采用并且具有较好效果的手段之一。 <a href=“underwear.htm” title=“内衣连锁加盟”>女大学生月入百万</a> 具体的外部链接策略将在第五课中详细讲解。 F、H1>H2>Strong≥Em>普通正文>Alt>Flash 根据搜索引擎的一些官方文件,和一些测试,我们总结出“ H1>H2>Strong≥Em>普通正文”,这样一个权重顺序。 一般而言,我们用H1定义正文标题,或者频道名;H2一般用来定义副标题和频道关键词,Srtong和Em则用在正文中,对关键词起强调作用。Alt属性则用来表明图片的主题和关键词。 另外,Flash中的纯文本(即没有成为动画组件的文字)可以被搜索引擎抓取,但权重比普通正文要低因此建议少用Flash。
内页优化 关键词部署 G、导航的关键词利用 根据前面的用户浏览注意力的E型和F型图,我们知道导航对于一个网站的意义。决不仅仅是帮助用户找到内页,也决不仅仅是帮助搜索引擎找到内页。而应该是两者的结合体,那么在这种情况下,我们就应该对导航采取特殊的关键词部署策略,来体现这样的重要地位。 1)突出核心关键词或拓展关键词。很多商业站点的导航喜欢采取“新闻中心”这样的名字,要知道,新闻中心作为一个 词,具有很高的搜索量,但对于一个站点,只要他不是sina,那么他就应该改成“环保新闻“或者“金融新闻”,至少,包含环保这样的专业关键词,或者公司名关键词。 2)突出转化率较高的关键词。另外,由于导航条对应的页面应该是栏目列表页,总体来说其权重是高于内页的,对应该频道的关键词,其权重甚至高于首页,那么我们在导航条的关键词部署上还应该考虑ROI的问题,适当增加1~3个”如何创业“”小本创业项目“这样的栏目名称。
关键词部署 内页优化 H、图片 Alt 属性和周围文字 Google、Yahoo、Ask和Baidu等中英文主流搜索引擎均推出了自己的图片垂直搜索,并得到了用户的积极相应,下表给出了各搜索引擎的图片搜索占总流量的比例。 搜狗3.0给出了一个存储图片相关元数据的Meta_Data,它包含所有图片的相关元数据,格式如下: <PIC> <PIC_URL>图片在互联网中的URL地址</PIC_URL> <PAGE_URL>图片所在网页的URL地址</PAGE_URL> <ALT_TEXT>图片的替换文字</ALT_TEXT> <ANCHOR_TEXT>以图片为目标的超链接的显示文本</ANCHOR_TEXT> <SUR_TEXT>页面中提取的图片周围的文本</SUR_TEXT> <PAGE_TITLE>图片所在页面的标题</PAGE_TITLE> <WIDTH>图片的宽度</WIDTH> <HEIGHT>图片的高度</HEIGHT> </PIC> 搜索引擎 Baidu Google Ask Sogou Iask 均值 图片搜索比例 13% 10% 19% 16% 23%
内页优化 基于Sogou_Meta_Data文件元数据条目,我们可以针对图片搜索的搜索引擎优化提出如下相关建议: (1)补充完善图片的ALT信息,最好使用带有目标关键词的描述; (2)图片周围应该有关于图片信息描述,描述内容围绕图片内容所确定的关键词展开; (3)图片所在的页面标题和URL应该包含图片信息中提炼的关键词; (4)不仅网页需要外部链接,图片同样也需要外部链接,而且链接锚文本最好含有关键词。
代码优化 内页优化 A、将JAVA脚本置入一个 .js扩展名的文件,并尽量放置在页底。 用<script language=“JavaScript” src=“seo.js”></script>代替 N 行搜索引擎视而不见的代码! 在不影响业务和页面展开效果的情况下,建议,尽量将JS文件放在页尾加载,既保证关键词的第一时间展现给搜索引擎,也保证了页面的加载速度。 B、Nocontent标签的使用(暂只适用于Yahoo) 页面上经常包含有头部、底部、导航栏、重复的文本内容、版权声明、广告等板块内容,这些内容对于用户是有用的,但是对于搜索引擎则没有意义。在这种情况下,站长们可以通过使用”robots-nocontent”标签来提示搜索引擎这些与页面核心内容无关的板块。具体使用时,可以在div,span等XHTML元素中使用class=”robots-nocontent”格式。 当页面的某一部分内容被标记为”robots-nocontent”时,Yahoo在搜索结果中将不会使用这些内容。注意:使用“robots-nocontent”标签来标记页面的内容重复部分不为被当作“桥页”(Cloaking),因为在这里所有的页面内容,对于用户来说,仍然是全部可见的。 具体的使用格式案例如下: <div class=”robots-nocontent”> 。。。需要屏蔽的内容。。。 </div> <span class=”robots-nocontent”>This 。。。需要屏蔽的内容。。。 </span> <p class=”robots-nocontent”>。。。需要屏蔽的内容。。。 </p>
代码优化 内页优化 C、 Nofollow标签的使用 赋予链接nofollow属性很简单,只需在链接代码中加入“rel=’nofollow’”即可。这种情况下,相当于告诉搜索引擎,“该链接所指向的网页非我所能控制,对其内容不予置评”,或者,简单地说,该链接不是对目标网站或网页的“投票”,这样,搜索引擎在计算目标的网站的外链数量时,将会把这个链接排除在外,让Spammer意图通过这样提高网站流行度的目标落了空。
代码优化 内页优化 D、网站语言编码的合理使用 E、采用CSS+DIV进行网页重构 (1)表现和内容相分离 中文网站:<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=gb2312"> 西欧网站:<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1“ 通用编码:<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8"> E、采用CSS+DIV进行网页重构 (1)表现和内容相分离 将设计部分剥离出来放在一个独立样式文件中,HTML文件中只存放文本信息。 (2)提高搜索引擎对网页的索引效率 用只包含结构化内容的HTML代替嵌套的标签,搜索引擎将更有效地搜索到你的网页内容,并可能给你一个较高的评价。 (3)提高页面浏览速度 对于同一个页面视觉效果,采用CSS+DIV重构的页面容量要比TABLE编码的页面文件容量小得多,前者一般只有后者的1/2大小。 (4)易于维护和改版 你只要简单的修改CSS文件就可以重新设计整个网站的页面。
内页优化 代码优化
细节优化 内页优化 C、人物照片的合理使用 随着google“人像搜索”的正式启用,网站中照片(尤其是知名人士)的合理使用尤为重要。 A、页面的信息与权威机构公布的信息保持一致 联系信息=域名注册信息=公司注册信息=ICP认证联系信息 网页描述=Dmoz描述信息 B、权威认证和重要战略伙伴 国内的ICP/ISP认证,国际通用的ISO900认证,其他权威认证信息及时公布。 与知名企业、财团、咨询机构和公益组织结成合作,及时在页面内容上有所体现(对方网站最好同步放置相应文本和链接信息) C、人物照片的合理使用 随着google“人像搜索”的正式启用,网站中照片(尤其是知名人士)的合理使用尤为重要。 另外,员工和照片也可以给客户以亲和力,提高诚信度。 英国《金融时报》 美国《纽约时报》
结构优化 一、网站扁平化 A、减少目录层次 网站扁平化是网站结构优化的第一步。搜索引擎蜘蛛和浏览者都不希望他所需要的内容被隐藏的很深,需要经过多次往返寻找才能到达。 网站扁平化的最具体提现是,URL的目录层次。 http://www.lention.com/inde.html 1级目录 http://search.tootoo.com/tqsse/search_products.jsp?q=mp3 2级目录 http://www.jm178.cn/clothing/2007/32973.shtml 3级目录 http://www.alibaba.com/trade/search/1i1ptyfchms/granite.html 4级目录 建议:大型网站,目录结构控制在3~4以下 中型网站,目录严格控制在3以下 小型网站,目录严格控制在2以下
结构优化 B、严格控制动态网页的参数个数 http://tag.diker.cn/16494/tagType=6 http://www.google.cn/support/webmasters/bin/answer.py?answer=34432&topic=8524 http://www.google.cn/search?complete=1&hl=zh-CN&q=seo http://search.tootoo.com/TQSSE/search_products.jsp?q=mp3&p=20&st=0&domain_id=25 在google已公布的资料中,Google明确指出动态参数小于3的动态网页,蜘蛛可以顺利抓取,达到3个参数的页面,蜘蛛将有选择的进入,而超过3~4个参数的动态页面,Google将基本不予理睬。 1、防止蜘蛛被死循环套牢。 2、参数越多,对应的动态页越多,可能超过蜘蛛的荷载。 3、参数多,则参数失效的几率越大。 4、参数多的站点存在更大的漏洞风险。
结构优化 二、内页立体化 A、增加首页到内页和内页到首页的链接通路 1)首页→文章推荐→ 内页 2)首页→文章推荐→ 栏目页→内页 3)首页→网站地图→栏目页→内页 4)首页→网站目录→内页 5)首页→ TAG CLOUD →内页 6)内页→内页导航→首页 7)内页→内页导航→栏目页→首页
结构优化 B、网站地图的合理使用 网站地图文件原本是方便访问用户更好的了解站点的架构而设置的,它能帮助用户便捷得查阅到所需信息。 WEB界面形式 它作为构成网站的诸多网页之一,以纯文本超级链接形式为最佳表现形式,用户和搜索引擎机器人都可以识别。 传统网站用来方便用户,现在更主要是帮助搜索引擎找到神层次的页面。大型网站可使用Xenu等工具来制作。 XML文本形式 不易于绝大多数访问用户理解阅读,专为搜索引擎机器人而准备。可在Robots.txt文件中进行描述 Sitemap: http://www.tootoo.com/sitemap.xml 目前,包括google在内的四大搜索引擎均支持sitemaps协议。
结构优化 Google SiteMap文件生成后格式如下: Xenu生成的网站地图如下: <urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>http://www.yaphon.com</loc> <lastmod>2005-06-03T04:20-08:00</lastmod> <changefreq>always</changefreq> <priority>1.0</priority> </url> <loc>http://www.yaphon.com/300687.html</loc> <lastmod>2005-06-02T20:20:36Z</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </urlset> XML标签 changefreq:页面内容更新频率。 lastmod:页面最后修改时间 loc:页面永久链接地址 priority:相对于其他页面的优先权 url:相对于前4个标签的父标签 urlset:相对于前5个标签的父标签 Xenu生成的网站地图如下: 数据恢复|磁盘修理|电脑维修,广州硬盘数据恢复公司 数据恢复|电脑维护(广州)公司联系方式 广州数据恢复:raid,scsi,ide硬盘.数据恢复广州公司 数据恢复问题解答 数据恢复 SQL数据文件恢复 电脑维护(广州)公司 液晶显示器保养和维护 硬盘引导型病毒破坏的数据恢复 电脑主板维修 硬盘修理和数据恢复联盟 飞客数据恢复(广州)公司 加密狗加密锁(广州)公司:加密狗复制,软件狗,软件破解 电脑上门服务 在线销售无盘工作站 windows终端 数据恢复培训
结构优化 C、网站目录(Directory)的使用 大型站点,往往具有较为庞大的注册用户和其他数据库信息,为了更合理的展现 ,我们需要进行各种分类,整理成目录,以确保用户和搜索引擎均能较快的找到 所需信息。 企业信息常用分类方式 行业分类 地区分类 首字母分类 企业规模和性质分类 会员信息常用分类方式 兴趣分类 地区分类 首字母分类 性别分类 网站目录与网站地图的区别 网站地图以信息本身为索引主体,而网站目录以信息的类型为索引主体。不是同一个概念。
结构优化 D、增加栏目页之间的链接 栏目是网站的“中间层”,起承上启下的作用,并且作为一个主题鲜明的网站,其栏目间必然具有较高的相关性,例如,创业网包括“创业项目”、“大学生创业”、“创业计划书”和“创业贷款”这三个栏目。 大学生创业必定需要“创业项目”,有了创业项目必然考虑“创业计划书”,写好“创业计划书”就是“创业贷款”,那么基于这样一种流程式的关系,我们除了在每个栏目中做一个推荐外,还可以做这样一个流程图,来加强栏目间的链接,并帮助用户更快的找到最终内容。 E、内页之间增加基于业务的链接 基于业务的链接包括“相关内容”“热门内容”“推荐内容”“最新信息”“其他人在搜索”“浏览过该商品的用户还浏览过”等。
结构优化 F、内页之间增加基于关键词的链接 网站:创业网 形式:Tag 作用:直接通过关键词链接到其他内页, 增加搜索引擎爬行的通路 网站:网易 形式:相关新闻 作用:通过对关键词进行相关性拓展, 可直接链接到相当数量的相关内 页,增加PV和页面相关度。
结构优化 网站:搜狐 形式:关键词拓展 作用:通过对关键词的拓展,原本一个 内链变成了3个或更多个内链,增 加PV,和搜索效率 网站:新浪 形式:关键词搜索 作用:虽没有直接的链接,但通过关键词 搜索,可以比较明显的增加PV,并 且较好的链接了相关的页面。
生成sitemap的方法 第一种方式:http://www.xml-sitemaps.com/:网站地 图自动生成器,在这里大家可以选择一个自己熟悉的网站 生成一个网站地图的xml文件,生成的速度比较慢,所以选 择不要太大的网站。 生成的xml文件应该借助ftp协议上传到自己网站的根目 录下。 你网站的“网站地图”查看状态栏就是指向sitemap.html P29
生成sitemap的方法 第二种方式:Site Map Builder .NET 官方下载地址: http://www.sitemapbuilder.net/downloads/SiteMapBuilder.zip 需 要Microsoft® .NET Framework 1.1支持 官方下载地址: http://www.microsoft.com/downloads /details.aspx?familyid=262D25E3-F589-4842-8157- 034D1E7CF3A3&displaylang=zh-cn ; 注意:【安装方式:先安装.NET Framework 1.1,然后安装 Site Map Builder .NET 】 介绍google网站管理员工具,介绍网站通过验证的4种方式。这里的教学难点是,学生没有自己的独立域名,故网站的验证不能通过,故里面的管理员工具的功能也就不能用了!P30。 这里主要是将sitemap提交给网站管理员工具。 关于site map builder----url ok:正常的链接;url with error:有问题的链接;filter url:过滤掉的链接;在tools菜单下的options功能可以设置过滤选项;file菜单下的save file as菜单可以保存成不同格式的文件;
生成sitemap的方法 第三种方式:XENU.EXE工具生成.html的地图 1、运行XENU.EXE文件,先单击“options”菜单,取消除“Valid text Url”外的其他多选按钮前的“√”,如果不取消则会结果中出现更多的选项。 2、然后选择“File”菜单下的“Check Url”命令,在第一个输入框里输 入你的网址,最后单击“确定”。 3、过一段时间,系统会提示你检查完毕; 4、这时选择“File”菜 单下的“Report”命令,系统会自动打开一个IE 窗口,这就是生成的静态页面了。 5、最后,将此文件保存,并根据自己的要求,在DreamWeaver 或 者FrontPage里面把这个静态页面修改一下即可。