网站应具有清晰的层次结构和文本链接。每个网页应至少可以通过一个静态文本链接打开。
为用户提供网站地图,列出指向网站重要部分的链接。如果网站地图上的链接超过或大约为 100 个,则需要将网站地图拆分为多个网页。
网站应实用且信息丰富,网页文字应清晰、准确地表述要传达的内容。
要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。
尽量使用文字而不是图形来显示重要的名称、内容或链接。搜索引擎抓取工具无法识别图形中所含的文字。
确保对 TITLE 和 ALT 标记属性的描述和表达准确无误。
检查链接是否损坏,并确保 HTML 格式正确。
如果您决定采用动态网页(即网址中包含"?"字符),请注意并非所有搜索引擎的抓取工具都能像抓取静态网页一样抓取动态网页。动态网页有助于缩短参数长度并减少参数数目。
将特定网页上的链接限制在合理的数量内(少于 100 个)。
技术指南
由于大部分搜索引擎 Spider 查看网站的方式与 Lynx 一样,所以可以使用 Lynx 之类的文本浏览器来查看您的网站。如果因应用了 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在抓取您的网站时可能会遇到麻烦。
允许搜索漫游器在不采用会跟踪其在网站上浏览路径的会话 ID 或参数的情况下抓取您的网站。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。
确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省您的带宽和开销。
利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具哪些目录能够抓取,哪些不能抓取。
如果您的公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎 Spider 可以抓取您的网站。
使用 robots.txt 可避免抓取搜索结果页或其他自动生成的页面,这些页面对来自搜索引擎的用户没有太多附加值。
质量指南
设计网页时该考虑的是用户,而不是搜索引擎。
请不要为了提高搜索引擎排名而弄虚作假。一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助?如果不存在搜索引擎,我是否还会这样做?"
请不要参与旨在提高您的网站排名或 PageRank 的链接方案。尤其要避免链接到违禁的网站或"恶邻",因为您自身的排名会受到这些链接的负面影响。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!