Mar 14
Google的技术细节创新永不止步,是科技、技术型企业学习的楷模。最近我发现Google可以根据外部链接的文字描述来将搜索结果精确化,比如Google搜索企业名称相关的周边关键词(或者叫外延关键词吧。)出现的搜索结果均以网站主页的meta信息来显示网页的标题,而不是显示网页真正的标题。
网站主页的meta信息包括"Author"、"Copyright"、"Description"中所描述的信息来确定某一个企业网站的企业名称,或者是品牌名称。以武汉首佳科技有限公司为例,举例说明相关的周边关键词搜索结果:
1、Google一下:武汉首佳科技有限公司
标签:
google,
Meta标签,
创新,
外部链接,
搜索引擎,
百度,
谷歌
Dec 19
按以往的PR分配的规律,不同的域名既使是指向同一个页面,它们所分配到的PR也是不同的。Google在今年很早的时候就作了一个调整,对于域名www.whsjsoft.com和whsjsoft.com分配于同样的PR值。当然这不是偶然的相同,因为whsjsoft.com的反向链接远远低于www.whsjsoft.com,PR却是相同;经过多个网站的验证这个谷歌的这个调整是属实的。这两个域名基本相同,如果不同的域名指向相同的IP解析,那它们的PR也会是相同的。
由此可以得到一个结论, Google对不同的URL地址如果指向同一个页面的话PR值是相同的。
下面这个例子又将会推翻这个结论:
http://www.whsjsoft.com/chinese/Bs_Download.asp的PR为0。
http://www.whsjsoft.com/Chinese/Bs_Download.asp的PR为2。
它们之间的区别只差一个C的大小写之 ... 阅读全文...
标签:
google,
搜索引擎,
搜索引擎研究
Oct 22
看到一些网友搜索"如何写sitemap文件"进入本站,有些奇怪,本之前并未写过这样的文章,竟然在百度和谷歌中排名第一,搜索结果是这篇文章:sitemap和robots的关系,robots如何写?
为了不负众望吧,本文解释一些与sitemap相关的知识与大家分享。
什么是 Sitemap 文件?为什么网站需要它?
通过Sitemap 文件,您可以告诉谷歌关于您网站上的所有网页;另外,还可以选择是否告诉谷歌关于这些网页的信息,如哪些网页最重要以及更改频率。Sitemap 有助于加速网页的查找,这也是抓取网页和编制索引重要的第一步,但还有其他很多因素会影响抓取/编制索引过程。Sitemap 可让您告诉google关于您网页的信息(您认为哪些网页最重要,这些网页的更改频率如何)。
Sitemap是对原来robots.txt的扩展,它使用XML格式来记录整个网站的信息并供Google读取,使搜索引擎能 ... 阅读全文...
标签:
google,
robots,
sitemap,
网站地图,
谷歌,
谷歌网站管理员工具
Oct 22
我这个博客的侧边栏原来有标签云(即tag群),标签云聚集了博客内的所有tag。Yo2的博客平台支持侧边栏中加入标签云的功能,这点倒是很方便,其它的博客倒是没有看见有这个功能。
为了增加文章的相关性,所以我的文章一般都有好几个相关的关键字作为标签。比如写一篇汽车维修管理制度的文章,贴上了汽车修理厂管理制度、汽车维修厂管理制度、汽修厂管理制度、汽修管理制度等多个意思相同的标签,目的只为客户能找到这篇文章,也为搜索引擎在搜索相关关键字时能找到这篇文章。为搜索引擎设计,还是为客户设计,两者都有吧。但是这个结果将导致标签云庞大,放在侧边栏后标签云是可以不断的自动拉长,但是将会增加每一个页面的关键字密度,包括首页。
在博客开始收录后的一段时间,文章基本上被百度收录了,但是没过两个星期,收录减少了一半,某些关键字排名也急速下滑。意识到这个问题之后,我把侧边栏的标签云取消了,降低了每个页面的关键字密度,而后收录也重新增长,排名也慢慢提升了,文章不多,所以开始基本上有google带 ... 阅读全文...
标签:
google,
seo,
tag,
WordPress,
Yo2,
搜索引擎,
搜索引擎研究,
标签云,
百度
Oct 13
原文:http://hi.baidu.com/whsjsoft/blog/item/1ffb90268e4645148b82a174.html
刚看到的,给大家分享一下。以前写过一篇相关的文章:解决Google的blogspot.com博客不能访问的方法
但是这个方法只能解决一个博客,如何批量的解决这个问题?一劳永逸的办法最好不过了。下面的方法我测试过了,确实不错,只要是blogspot.com下的所有子域名都可以通过自动设置代理服务器来达到访问的目的。以下内容来自:http://www.williamlong.info/info/archives/184.html
打开记事本(或者其他文本编辑器),将 小狼诺夫写的内容粘贴进去,并保存为proxy.pac文件。
function FindProxyForURL(url, host)
{
if ( dnsDomainIs(host, ".blogs ... 阅读全文...
标签:
blogspot,
google,
代理服务器
Oct 03
网站或博客如果能向Google提供Sitemap,可以很详细的让Google了解你的站点情况,比如网站的结构、更新情况等。Google Sitemaps插件可以给博客创建一个 Google Sitemap XML 文件,并自动递交到 Google ,以达到更快的搜索引擎收录。通常网站更新时,都是手工更新Sitemap XML 文件,然后上传到网站服务器,再提交给Google。
这个插件允许你设置在博客更新时自动更新Sitemap XML 文件,而且可以自动通知Google你的博客有更新了。无需做那些繁杂的锁事。对Yo2博客来说,实现这些只要在管理后台启用这个插件就可以了。
wordpress中文博客在语言上是个特殊,比如Google Sitemap.XML 文件的识别、Sitemap的规范等,对中文的支持不是太好。Sitemap.XML 文件中不允许出现中文字符,否则谷歌网站管理员工具会报告错误而无法正常的抓取。wordpress中文博客结合google sitemaps插件应该如何设置才能自动的生成正确的Sitemap.XML 文件?Sitemap的作用除了告诉google你的站点内有哪些页面及更新信息之外,还要尽量的保证不要提交不 ... 阅读全文...
标签:
google,
sitemap,
WordPress,
wordpress使用技巧,
Yo2,
网站地图,
谷歌网站管理员工具
Oct 01
大部分YO2博客都反映在谷哥网站管理员工具中存在robots.txt文件问题,错误都是一样的:
网络无法访问: robots.txt 无法访问
我们访问您的 Sitemap 时遇到错误。请确保您的 Sitemap 符合我们的指南要求,并能够通过您所提供的位置访问,然后重新提交。
按 照robots相关的帮助里说,robots并不是必须的,我可以不上传这个文件。而且相关的帮助也说明了如果robots不存在的话,将再次访问并抓 取,为什么谷歌来了两次还是只找这个robots文件呢?这不符合谷歌的帮助说明嘛。并且也不合理。不能因为网站没有robots文件,谷歌就不给收录。
谷歌中文网站管理员回应说:http://www.googlechinawebmaster.com/2007/09/blog-post_6441.html
你的错误一定与有没有robots.txt无关.请检查你的sitemap文件是否有问题.
有了这个提示,今天重新看了一下sitemap文件,里面包含中文页面的网址。 我记得以前用另外的网站提交过sitemap时,里面包含了中文的网址结果提交后报告返回错误,去掉这部分网页后正常。
这个问题表面 ... 阅读全文...
标签:
google,
robots,
WordPress,
wordpress使用技巧,
Yo2,
网站地图,
网站管理员工具
Sep 26
今天查看谷歌的网站管理员工具,发现这个站的sitemap错误达29个. 问题都是:
网络无法访问: robots.txt 无法访问
我们访问您的 Sitemap 时遇到错误。请确保您的 Sitemap 符合我们的指南要求,并能够通过您所提供的位置访问,然后重新提交。
搞不懂谷歌在搞什么鬼,还是YO2服务器的问题, robots.txt文件的状态是503(服务器不可用)。但是我手工查看这个robots.txt文件确实是存在的,并且是正常的。
另外还发现一个安全隐患,搜索引擎竟然试图抓取了根目录下的cookies.php文件,这个文件是里面存有博客的登录账号、博客名称等重要信息。这还了得?有了账号,剩下就是密码的问题,相信破解也不会很难。这就比较可怕了,要是给破了密码,数据就很不安全了,还得经常做好博客的备份工作啊!做到万无一失!
另外,针对YO2博客的安全问题,可以把 cookies.php文件放到robots.txt文件中限制抓取的目录下,比如Disallow:后面的目录中的一个,尽量把重要文件放在深一点的目录。这样搜索引擎就抓取不到了,别人通过谷歌也搜不到这些关键文件了。< ... 阅读全文...
标签:
google,
WordPress,
Yo2,
博客安全,
搜索引擎
Sep 25
这是google网站管理员工具提供的最新报告。 robots.txt文件内容可当一个robots的参考范例:
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
几乎所有搜索引擎都尊从robots协议,并按网站根目录下的robots.txt文件进行网站的抓取。 这个例子的意思是:允许所有搜索引擎抓取,并且/wp-admin/、/wp-content/、 /wp-includes/这三个目录不可以抓取。有关 robots.txt 语法的更多信息,请参阅 robotstxt.org。谷歌对有关robots.txt的设置信息请参考:http://www.google.com/support/webmasters/bin/answer.py?answer=40364&topic=8846&hl=zh_CN
在robots.txt文件无法访问或按要求验证 ... 阅读全文...
标签:
google,
robots,
sitemap,
Yo2,
网站管理员工具
Sep 23
这两天都在建造我的博客,做了很多工作,也发现很多问题。发现Wordpress博客看起来功能强大,但用起来真的不是很简单。也许我是新手才会这样觉得吧。
关于google网站管理员工具部分的内容,请看上篇:
如果你有google的账号,就可以在我的账户里面进入网站管理员工具,并对自己的网站进行管理。通过网站验证,可以访问关于您网站网页的完整统计信息和抓取错误等信息。
如何验证?google提供两种验证方法。您可以使用我们指定的名称上传 HTML 文件,或将元标记添加到网站的索引文件中。Yo2的博客不允许上传文件,那只能是添加元标记了。例如: 复制以下列出的元标记并将其粘贴到网站主页的第一个 <head> 部分和第一个 <body> 部分之间。
<meta name="verify-v1" content="0DZuSHJihBkHEmCzWNg01UsFTYLMpi3QnDe/aRa2pTk=" />
加这个元标记需要修改网站头文件,在博客后台管理中,主题编辑器中修改hea ... 阅读全文...
标签:
google,
WordPress,
Yo2,
网站访问统计,
谷歌网站管理员工具
Recent Comments