腾达首页 网站建设 精典案例 网络产品 行业新闻 走进腾达 客户服务
腾达网络--先建站后付款 专业的网站建设,网站优化推广服务.在线QQ交流:82040118 271508598 739999813 电话:020-39995170 34515904
您当前的位置:腾达网络建站知识 → 文章内容
一个月PR由0升到3的经验以及对SEO的看法
作者:佚名  来源:本站整理  发布时间:2008-4-26 10:27:00  点击:
帖子和某个文章里多次 在多次的出现 并且字体加粗  加大 加深颜色 加上你的网站超链接!
都很好的!我每天看网站统计里 从百度来的流量 去分析!有个会员在我的论坛发了几个 情色 擦边球的帖子 迅雷下载的!!如观月雏乃的 电影 一开始我没在意 就是最近拿这个站做试验发现 每天搜索观月雏乃 迅雷下载 等等有关的 能带来接近100的流量 而且在百度的排名里 都是 前6位以上!现在还发现了我的网站一些其他帖子的关键字 均在第一页显示!!!那我就可以做些手脚了!分析下不同的关键字带来流量的大小 和关键是 是什么 自己进行组合 吧帖子 换成这些关键字组合的样子,并且在帖子里加粗显示,接着把下载链接 进行回复可见!
果然 现在大家看看这个帖子 http://www.xzjhw.cn/bbs/viewthread.php?tid=432  回复了N个 色狼了 = =!短短几天。。。


我对DZ的优化认识目前就这么多了!!!希望高手给于指点!


那么还有除了 标签 和关键字 和网站内容 等 还要注意 最好能在网站的某个项目做自己网站的地图 ,在一个是 ROBOTS.TXT 这个文件


ROBOTS.TXT语法和作用

我们知道,搜索引擎都有自己的“搜索机器人”(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库。


对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是The Robots META标签。 

一、    robots.txt

1、 什么是robots.txt?
robots.txt是一个纯文本文件,通过在这个文件中声明该网站中不想被robots访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。当一个搜索机器人访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果找到,搜索机器人就会按照该文件中的内容来确定访问的范围,如果该文件不存在,那么搜索机器人就沿着链接抓取。


robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。
网站 URL
相应的 robots.txt的 URL
http://www.jinpingmei.org.cn
http://www.jinpingmei.org.cn/robots.txt

http://www.w3.org/
http://www.w3.org/robots.txt

http://www.w3.org:80/
http://www.w3.org:80/robots.txt

http://www.w3.org:1234/
http://www.w3.org:1234/robots.txt

http://w3.org/
http://w3.org/robots.txt

2、 robots.txt的语法


"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:

    ": "。


在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:


User-agent:


该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中, "User-agent:*"这样的记录只能有一条。


Disallow :


该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow 开头的URL均不会被robot访问到。例如"Disallow: /help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow: /help/"则允许robot访问/help.html,而不能访问/help/index.html。

任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果 "/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。


下面是一些robots.txt基本的用法:

l         禁止所有搜索引擎访问网站的任何部分:
User-agent: *
Disallow: /

l         允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 "/robots.txt" file

l         禁止所有搜索引擎访问网站的几个部分(下例中的cgi-bin、tmp、private目录)
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/

l         禁止某个搜索引擎的访问(下例中的BadBot)
User-agent: BadBot
Disallow: /

l         只允许某个搜索引擎的访问(下例中的WebCrawler)


User-agent: WebCrawler
Disallow:

User-agent: *
Disallow: /

3、  常见搜索引擎机器人Robots名字

名称                     搜索引擎

Baiduspider            http://www.baidu.com
Scooter              http://www.altavista.com
ia_archiver             http://www.alexa.com
Googlebot           http://www.google.com
FAST-WebCrawler http://www.alltheweb.com
Slurp                  http://www.inktomi.com
MSNBOT            http://search.msn.com


4、 robots.txt举例

下面是一些著名站点的robots.txt:
http://www.cnn.com/robots.txt
http://www.google.com/robots.txt
http://www.ibm.com/robots.txt
http://www.sun.com/robots.txt
http://www.eachnet.com/robots.txt

5、 常见robots.txt错误


l         颠倒了顺序:
错误写成
User-agent: *
Disallow: GoogleBot

正确的应该是:
User-agent: GoogleBot
Disallow: *

l         把多个禁止命令放在一行中:
例如,错误地写成
Disallow: /css/ /cgi-bin/ /images/

正确的应该是
Disallow: /css/
Disallow: /cgi-bin/
Disallow: /images/

l         行前有大量空格
例如写成
        Disallow: /cgi-bin/
尽管在标准没有谈到这个,但是这种方式很容易出问题。

l         404重定向到另外一个页面:
当Robot访问很多没有设置robots.txt文件的站点时,会被自动404重定向到另外一个Html页面。这时Robot常常会以处理robots.txt文件的方式处理这个Html页面文件。虽然一般这样没有什么问题,但是最好能放一个空白的robots.txt文件在站点根目录下。

l         采用大写。例如
USER-AGENT: EXCITE
DISALLOW:
虽然标准是没有大小写的,但是目录和文件名应该小写:
user-agent:GoogleBot
disallow:

l         语法中只有Disallow,没有Allow!
错误的写法是:
User-agent: Ba

上一页  [1] [2] [3] [4] [5] [6] [7] [8]  下一页

上一条:soho一族做外贸的必要条件和成功经验
下一条:我是如何在1个月内把新网站做到IP8000的
腾达首页 | 网站建设 | 虚拟主机 | 域名注册 | 企业邮局 | 关于我们 | 服务报价 | 联系我们 | 建站经验交流 | 中国OK商务网 | 中国热线 | 名索网
领航网B2B
中国跑酷网
外贸建站
番禺建站
深圳建网站
广州建网站
pps奥运视频直播
双色球
双色球
免费推广
レーシック 失敗
インプラント
賃貸 事務所
出会い
格安航空券 国内
ERP
不動産 求人
固定ip
くりっく365 比較
ドレス
广州分类信息
更多连接
更多连接
更多连接
更多连接
更多连接
更多连接
Copyright © 2005-2008 广州腾达网络科技有限公司 All Rights Reserved 网址:http://www.jz800.com
地址:广州市番禺区富华中路75号403 联系电话:020-39995170 34515904 33111194 传真:020-34515904
业务范围:大中小企业网站建设 网络广告设计 网络推广 企业网络商业策划 网络营销 网站建设 企业建站
建站一条龙服务(域名注册 虚拟主机 外贸主机 网站备案 网站维护)电信业务经营许可证号:粤ICP备07010100号