Google细节创新:企业名周边搜索结果精确化

IT技术及应用, google应用及研究 No Comments »

Google的技术细节创新永不止步,是科技、技术型企业学习的楷模。最近我发现Google可以根据外部链接的文字描述来将搜索结果精确化,比如Google搜索企业名称相关的周边关键词(或者叫外延关键词吧。)出现的搜索结果均以网站主页的meta信息来显示网页的标题,而不是显示网页真正的标题。

网站主页的meta信息包括"Author"、"Copyright"、"Description"中所描述的信息来确定某一个企业网站的企业名称,或者是品牌名称。以武汉首佳科技有限公司为例,举例说明相关的周边关键词搜索结果:

1、Google一下:武汉首佳科技有限公司

阅读全文...

标签: , , , , , ,

Google PR分配与网站页面URL应该注意的细节

google应用及研究 No Comments »

按以往的PR分配的规律,不同的域名既使是指向同一个页面,它们所分配到的PR也是不同的。Google在今年很早的时候就作了一个调整,对于域名www.whsjsoft.comwhsjsoft.com分配于同样的PR值。当然这不是偶然的相同,因为whsjsoft.com的反向链接远远低于www.whsjsoft.com,PR却是相同;经过多个网站的验证这个谷歌的这个调整是属实的。这两个域名基本相同,如果不同的域名指向相同的IP解析,那它们的PR也会是相同的。

由此可以得到一个结论, Google对不同的URL地址如果指向同一个页面的话PR值是相同的。

下面这个例子又将会推翻这个结论:

http://www.whsjsoft.com/chinese/Bs_Download.asp的PR为0。

http://www.whsjsoft.com/Chinese/Bs_Download.asp的PR为2。

它们之间的区别只差一个C的大小写之 ... 阅读全文...

标签: , ,

google应用:如何写sitemap.xml文件?

google应用及研究 2 Comments »

看到一些网友搜索"如何写sitemap文件"进入本站,有些奇怪,本之前并未写过这样的文章,竟然在百度谷歌中排名第一,搜索结果是这篇文章:sitemap和robots的关系,robots如何写?

为了不负众望吧,本文解释一些与sitemap相关的知识与大家分享。

什么是 Sitemap 文件?为什么网站需要它?

通过Sitemap 文件,您可以告诉谷歌关于您网站上的所有网页;另外,还可以选择是否告诉谷歌关于这些网页的信息,如哪些网页最重要以及更改频率。Sitemap 有助于加速网页的查找,这也是抓取网页和编制索引重要的第一步,但还有其他很多因素会影响抓取/编制索引过程。Sitemap 可让您告诉google关于您网页的信息(您认为哪些网页最重要,这些网页的更改频率如何)。

Sitemap是对原来robots.txt的扩展,它使用XML格式来记录整个网站的信息并供Google读取,使搜索引擎能 ... 阅读全文...

标签: , , , , ,

Yo2博客tag将增加关键字密度引起百度的反感

WordPress及维护日志, google应用及研究, 百度搜索引擎研究 No Comments »

我这个博客侧边栏原来有标签云(即tag群),标签云聚集了博客内的所有tag。Yo2的博客平台支持侧边栏中加入标签云的功能,这点倒是很方便,其它的博客倒是没有看见有这个功能。

为了增加文章的相关性,所以我的文章一般都有好几个相关的关键字作为标签。比如写一篇汽车维修管理制度的文章,贴上了汽车修理厂管理制度汽车维修厂管理制度汽修厂管理制度汽修管理制度等多个意思相同的标签,目的只为客户能找到这篇文章,也为搜索引擎在搜索相关关键字时能找到这篇文章。为搜索引擎设计,还是为客户设计,两者都有吧。但是这个结果将导致标签云庞大,放在侧边栏后标签云是可以不断的自动拉长,但是将会增加每一个页面的关键字密度,包括首页。

在博客开始收录后的一段时间,文章基本上被百度收录了,但是没过两个星期,收录减少了一半,某些关键字排名也急速下滑。意识到这个问题之后,我把侧边栏的标签云取消了,降低了每个页面的关键字密度,而后收录也重新增长,排名也慢慢提升了,文章不多,所以开始基本上有google带 ... 阅读全文...

标签: , , , , , , , ,

解决blogspot.com博客不能访问的自动代理方法

IT技术及应用 No Comments »

原文:http://hi.baidu.com/whsjsoft/blog/item/1ffb90268e4645148b82a174.html

刚看到的,给大家分享一下。以前写过一篇相关的文章:解决Google的blogspot.com博客不能访问的方法

但是这个方法只能解决一个博客,如何批量的解决这个问题?一劳永逸的办法最好不过了。下面的方法我测试过了,确实不错,只要是blogspot.com下的所有子域名都可以通过自动设置代理服务器来达到访问的目的。以下内容来自:http://www.williamlong.info/info/archives/184.html
打开记事本(或者其他文本编辑器),将 小狼诺夫写的内容粘贴进去,并保存为proxy.pac文件。

function FindProxyForURL(url, host)
{
if ( dnsDomainIs(host, ".blogs ... 阅读全文...

标签: , ,

wordpress中文博客:如何正确使用Google Sitemaps插件?

WordPress及维护日志, google应用及研究 No Comments »

网站或博客如果能向Google提供Sitemap,可以很详细的让Google了解你的站点情况,比如网站的结构、更新情况等。Google Sitemaps插件可以给博客创建一个 Google Sitemap XML 文件,并自动递交到 Google ,以达到更快的搜索引擎收录。通常网站更新时,都是手工更新Sitemap XML 文件,然后上传到网站服务器,再提交给Google。

这个插件允许你设置在博客更新时自动更新Sitemap XML 文件,而且可以自动通知Google你的博客有更新了。无需做那些繁杂的锁事。对Yo2博客来说,实现这些只要在管理后台启用这个插件就可以了。

wordpress中文博客在语言上是个特殊,比如Google Sitemap.XML 文件的识别、Sitemap的规范等,对中文的支持不是太好。Sitemap.XML 文件中不允许出现中文字符,否则谷歌网站管理员工具会报告错误而无法正常的抓取。wordpress中文博客结合google sitemaps插件应该如何设置才能自动的生成正确的Sitemap.XML 文件?Sitemap的作用除了告诉google你的站点内有哪些页面及更新信息之外,还要尽量的保证不要提交不 ... 阅读全文...

标签: , , , , , ,

Yo2博客关于robots.txt问题的最新进展

google应用及研究 3 Comments »

大部分YO2博客都反映在谷哥网站管理员工具中存在robots.txt文件问题,错误都是一样的:

网络无法访问: robots.txt 无法访问
我们访问您的 Sitemap 时遇到错误。请确保您的 Sitemap 符合我们的指南要求,并能够通过您所提供的位置访问,然后重新提交。

按 照robots相关的帮助里说,robots并不是必须的,我可以不上传这个文件。而且相关的帮助也说明了如果robots不存在的话,将再次访问并抓 取,为什么谷歌来了两次还是只找这个robots文件呢?这不符合谷歌的帮助说明嘛。并且也不合理。不能因为网站没有robots文件,谷歌就不给收录。

谷歌中文网站管理员回应说:http://www.googlechinawebmaster.com/2007/09/blog-post_6441.html

你的错误一定与有没有robots.txt无关.请检查你的sitemap文件是否有问题.

有了这个提示,今天重新看了一下sitemap文件,里面包含中文页面的网址。 我记得以前用另外的网站提交过sitemap时,里面包含了中文的网址结果提交后报告返回错误,去掉这部分网页后正常。
这个问题表面 ... 阅读全文...

标签: , , , , , ,

搜索引擎给Yo2博客带来的安全隐患

google应用及研究 2 Comments »

今天查看谷歌网站管理员工具,发现这个站的sitemap错误达29个. 问题都是:

网络无法访问: robots.txt 无法访问
我们访问您的 Sitemap 时遇到错误。请确保您的 Sitemap 符合我们的指南要求,并能够通过您所提供的位置访问,然后重新提交。

搞不懂谷歌在搞什么鬼,还是YO2服务器的问题, robots.txt文件的状态是503(服务器不可用)。但是我手工查看这个robots.txt文件确实是存在的,并且是正常的。

另外还发现一个安全隐患,搜索引擎竟然试图抓取了根目录下的cookies.php文件,这个文件是里面存有博客的登录账号、博客名称等重要信息。这还了得?有了账号,剩下就是密码的问题,相信破解也不会很难。这就比较可怕了,要是给破了密码,数据就很不安全了,还得经常做好博客的备份工作啊!做到万无一失!

另外,针对YO2博客的安全问题,可以把 cookies.php文件放到robots.txt文件中限制抓取的目录下,比如Disallow:后面的目录中的一个,尽量把重要文件放在深一点的目录。这样搜索引擎就抓取不到了,别人通过谷歌也搜不到这些关键文件了。< ... 阅读全文...

标签: , , , ,

sitemap和robots的关系,robots如何写?

google应用及研究 4 Comments »
robots.txt 网址 http://soft.whsjsoft.com/robots.txt
最新下载 2007年9月25日 上午02时24分03秒
状态 200 (成功)

这是google网站管理员工具提供的最新报告。 robots.txt文件内容可当一个robots的参考范例:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/

几乎所有搜索引擎都尊从robots协议,并按网站根目录下的robots.txt文件进行网站的抓取。 这个例子的意思是:允许所有搜索引擎抓取,并且/wp-admin/、/wp-content/、 /wp-includes/这三个目录不可以抓取。有关 robots.txt 语法的更多信息,请参阅 robotstxt.org谷歌对有关robots.txt的设置信息请参考:http://www.google.com/support/webmasters/bin/answer.py?answer=40364&topic=8846&hl=zh_CN

在robots.txt文件无法访问或按要求验证 ... 阅读全文...

标签: , , , ,

Wordpress博客如何得到google网站管理员工具的验证?

WordPress及维护日志 6 Comments »

这两天都在建造我的博客,做了很多工作,也发现很多问题。发现Wordpress博客看起来功能强大,但用起来真的不是很简单。也许我是新手才会这样觉得吧。

关于google网站管理员工具部分的内容,请看上篇:

给你的wordpress博客加谷歌的sitemap

如果你有google的账号,就可以在我的账户里面进入网站管理员工具,并对自己的网站进行管理。通过网站验证,可以访问关于您网站网页的完整统计信息和抓取错误等信息。

如何验证?google提供两种验证方法。您可以使用我们指定的名称上传 HTML 文件,或将元标记添加到网站的索引文件中。Yo2的博客不允许上传文件,那只能是添加元标记了。例如: 复制以下列出的元标记并将其粘贴到网站主页的第一个 <head> 部分和第一个 <body> 部分之间。

<meta name="verify-v1" content="0DZuSHJihBkHEmCzWNg01UsFTYLMpi3QnDe/aRa2pTk=" />

加这个元标记需要修改网站头文件,在博客后台管理中,主题编辑器中修改hea ... 阅读全文...

标签: , , , ,
ndesign-studio提供免费的Wordpress主题,WP平台服务商yo2.cn提供WordPress博客服务
文章RSS 评论RSS 登录