Results for googlebot. 搜索了0.06 秒.
Google宣布Googlebot已可通过提交表格抓取更多内容
in GSeeker, on 2008-04-13
... 作为Google索引网络的主要工具,Google的爬虫Googlebot的最终目的是可以快速并准确地抓取互联网上所有类型的内容。之前我们已经知道Googlebot除了能抓取文本、视频、音频、 Flash 等类型的内容外,它还可以 通过JS代码抓取链接 。并且在未来,Googlebot还 有望直接识别图片及视频里的文字 。为了进一步抓取互联网的内容,Google 宣布 Googlebot已...
Google网站管理员工具增加robots.txt文件生成器
in GSeeker, on 2008-03-28
...Google网站管理员工具新增的robots.txt文件生成器了。
进入 控制台>工具 >生成 robots.txt就可以看到有关选项:
你可以允许或禁止某种Googlebot访问你的某些目录或文件,十分方便。你要做的只是填写目标目录或文件:
生成新的robots.txt文件后,还可以使用工具里的"分析 robots.txt"来分析...
Googlebot官方形像曝光
in GSeeker, on 2008-03-07
... 作为Google的主力助手, Googlebot 一直在不断地访问互联网上的网页,并且将它们抓取进Google搜索引擎的索引数据库里。一直以来,站长们都对Googlebot有一种比较特殊的感情:Googlebot怎么还不来看我的网页?我才刚发完文章Googlebot就来抓取了?很多人还因此而专门为Googlebot画了肖像,比如 Philipp在06年所画的版本 就最精彩。到底Googl...
禁止Google收录网站图片的方法
in GSeeker, on 2008-02-21
...sallow: /*.gif
这样就等于告诉Google及其它搜索引擎,不要收录你的网站里的gif格式的图片。
(Thanks beussery, Philipp and Matt Cutts !)...
Google将可直接识别图片及视频里的文字
in GSeeker, on 2008-01-07
...收录 。但一直以来这种机械式的爬虫最大的缺点便是它们对文本以外的内容比如图片及视频等基本无能为力,只能通过分析图片或视频附近的文字来猜测其内容。但互联网的发展趋势已是多媒体内容的比重日益增大,因此如果无法很好地解决图片、视频等内容的分析及收录,搜索引擎本质上还只是文字搜索工具而已。但现在看起来情况或许有改变。
根据 TechCrunch 引述信息周刊的报道,Google在去年7月获得了 一项...
Google的“unavailable_after”标签的详细使用方法
in GSeeker, on 2007-07-18
...得注意的是,Google Cache里的相关的网页快照依然会存在。要想移除Google Cache里的记录,得给网页加上 noarchive标签 。
30日更新 :Google今天正式 宣布 这个标签已生效。...
Google给出Flash在网站里的最佳使用建议
in GSeeker, on 2007-07-06
... 尽管Google的爬虫( Googlebot )的功能越来越强大,但直至目前,它都没有办法像人类那样,能很好地识别视频或Flash动画里的内容。即使对于JS代码,Googlebot也只具有初步的分析能力。用Google的话来形容,那就是Googlebot没有眼睛,它暂时还无法"看"视觉媒体的内容。除了视频外,Flash动画也是网站的常见内容之一。为了让网站能更好地被G...
Google将会收录会员制网站的特定内容
in GSeeker, on 2007-03-06
Google的终极目的是要索引全世界的信息,并且把它们变成人人随手可取。不过这样的目标无法在短期内实现。即使单看互联网上的信息,有很多网站实行会员制,即需要注册并登录后才能看到特定内容。一般情况下,我们在Google的搜索结果里并不能看到这些内容。但这种情况很可能将要发生改变。
Google员工Adam Lasnik在Google的Webmaster Help网上论坛里 透露 (via SEW ),他和他的同事正在进行一个计划,将会允许Google抓取并收录会员制网站的特定内容,并且会把它们列在Google搜索结果页里。我们可以想像,一旦Google这样做了,它将很可能在搜索...
网站代码不符合标准并不是影响Googlebot抓取的因素
in GSeeker, on 2006-12-26
...容。Google的 Adam Lasnik (via SER )透露,Googlebot具有足够的能力去抓取非标准网页,因此在大多数情况下,网站在被Google收录或者在Google上的排名出现了问题,都不是因为网站的代码不符合标准。当然,Google仍然建议网站依照它的 官方指南 来建议和优化,以方便Googlebot抓取。另外,要了解Googlebot的抓取原理,请看 本站之前的文章 。...
趣图:Googlebot肖像
in GSeeker, on 2006-12-06
...大概明白G ooglebot的工作原理 了。不过假设如果Googlebot也有实体,那到底它会是怎样的呢?像上面这样的?
漫画迷 Philipp (没错:)付了100美元给MmoArt.com,让它自由发挥,画一幅Googlebot肖像图,结果就得到了上面这张图。Philipp及他的读者们均觉得物有所值,唯一遗憾的是这张图等了两个半月才到手。
大家认为Googlebot是不是长这个样子...
Must-know SEO Jargon
in The Search Engine Weblog, on 2006-10-04
...engine. (Ex. SERPS on Google)
2. Bots/Spiders - are programs that search engines use to crawl. (Ex. Googlebot, YahooSlurp and MSNbot)
3. KD - short for Keyword Density. It refers to the number of time...
手动设置Googlebot的抓取频率
in GSeeker, on 2006-09-19
...现在,你可以自己控制Googlebot的抓取频率了。如果你在自己的 Google Sitemaps 里看到上面这个图片的提示,那么证明你可以手动设定Googlebot的抓取频率了。由于这个功能还处于Alpha的原始测试阶段,因此不能保证它绝对有效。另外请注意,Googlebot抓取你的网站的频率越高,那么它消耗你的空间的带宽也就越厉害,因此设置时请考虑空间的承受能力。我自己的Google Site...
雅虎招聘“蜘蛛福利专员”
in GSeeker, on 2006-09-07
...登出一则很有趣的招聘启事,即雅虎也决定公开招聘SEO专家,只不过雅虎把这个职位叫做"蜘蛛福利专员",非常有意思。...
Googlebot生于1969年?!
in GSeeker, on 2006-08-26
... 我们都知道Google会不断派出搜索爬虫即Googlebot来分析及抓取网页,至于它是如何工作的,可看 Google工程师Matt Cutts的解释 。另外,Googlebot种类也不少,详细分类也可看 本站的旧文 。我们都知道Google于1998年9月正式成立,而Google这个名字也是1997年才采用的,但为什么Googlebot却会与1969年扯上关系呢?...
Link buyers beware of link scams
in The Search Engine Weblog, on 2006-08-11
... people do is to redirect google BOTS to another high PR site (ie. PR7 site), and if its not googlebot, they show their normal web page. The result is a webpage with high PR. But these are fake...
Google:在2003年我们每个月才抓取一次网页
in GSeeker, on 2006-07-26
GigaOM 的主人、著名的IT爆料者Om Malik最近亲身访问了Google总部即位于美国山景城的Googleplex,并且和互联网上名气最大的Google工程师Matt Cutts叙了旧。在Om Malik与Matt Cutts的交谈里,我们可以找到一些Google轶事或趣闻,下面和大家分享一下
What are the different google bots?
in The Search Engine Weblog, on 2006-07-21
...st of Google bots for your reference.
Adsense: "Mediapartners-google/2.1"
Adwords: "googleBot/2.1"
google-: "Mozilla/5.0 (compatible; googlebot/2.1; http://www.google.com/bot...
Google 已经注册的500多个域名
in Wangtam, on 2006-07-19
21150.com 3576.net 38389438.com 466453.com 7sou.com 95539.com adsbygoogle.com adsense.net adwords.com adwords.net adwords.org adwordselect.com adwordsexample.com adwordsgoogle.com adwordsselect.com adwords-select.com adwordsselect.net adwordsselect.org akwan.com allevil.org altos.us android.com ...
Google域名大全(2006.7.18)
in GSeeker, on 2006-07-18
之前我列出过来自Google 官方给出的域名大全 ,还有网友搜集的 非官方的域名 以及 非官方的Google子域名 等等,这些域名都与Google有着直接或间接的关系,因为其中大部分是Google自己所注册的,不一定有特定的内容,有时候是Google为了避免别人抢注而注册的;而另外一些虽然不是由Google所注册的,但因为注册的公司被Google收购了,因此这些域名也成为Google的了。如果你对Google的相关域名感兴趣,下面有一个更完整的列表,超过520个Google相关域名,由网友 Neil Patel 所收集
让Google或MSN不再使用网站的DMOZ标题
in GSeeker, on 2006-07-14
ODP即dmoz.org一直以来都是各大搜索引擎的重要收录来源之一,即当你的网站被DMOZ收录了,一般情况下也会被Google等搜索引擎收录。比如"幻灭的麦克风"被收录在DMOZ简体中文目录下的 "博客->个人"分类 里,当初我提交申请的时候,把标题写成了"一个以IT资讯及电脑技巧为主的个人blog"。不过有时候Google或其它搜索引擎在收录的时候会直接使用了网站在DMOZ上面的相关标题,即使该网站的网页里不包含该标题。比如当初你的网站内容是关于"Google"的,后来你改写"百度&qu...
Google AdSense新增网站诊断功能
in GSeeker, on 2006-06-09
... Google Sitemaps 里有一项功能,可以显示一个网站上面的网页被Googlebots抓取的情况。比如哪些网页无法抓取,原因是什么,发生在什么时候。这个功能对于站长而言是非常实用的,因为可以清楚地了解自己的网站对搜索引擎的友好程度。现在Google把这项网站诊断功能也加进了Google AdSense里了。现在你登入AdSense后面,就会发现这项功能已经生效...
Googlebots一览
in GSeeker, on 2006-06-06
... 之前我们介绍了Google的spider(爬虫)--Googlebot的 相关原理 ,那么到底Google一共有多少种Googlebot呢?因为Google需要派出不同的类型的Googlebot来分析及抓取不同的网页内容。SERT的 Phoenix 整理出了一个列表,如下: 1.Googlebot(即普通抓取网页的Google爬虫) 2.MediaBot(用来分析投放了AdS...
更多关于Googlebot抓取JS链接的报道
in GSeeker, on 2006-05-02
... 还记得上次报道过的Googlebot" 杀站事件 "么?的确,那次只是一次意外。不过前些天我们从Google的Matt Cutts那里了解了Googlebot的 抓取原理 后,你应该会猜得到,新一代的Googlebot的本领的确得到了加强。不但提高了网页爬行的效率,更令人意外的是,这一代的Googlebot已经学会爬行JS代码了...
Google工程师解释Googlebot抓取网页的原理
in GSeeker, on 2006-04-24
... 前几天我们 报道 了Google的 Matt Cutts 确认了AdSense的Mediabot的确是会帮助Googlebot抓取网页的消息,但有部分人不相信Matt Cutts,或者不相信他能代表Google官方。作为Matt Cutts的blog的一名忠实读者,我觉得完全没必要花费篇幅再去特别说明Matt Cutts的权威性。我想说的是,Matt Cutts在是Google品质管理部门...
Google官方确认AdSense有助于网页收录
in GSeeker, on 2006-04-20
... Google的网页收录的其中一种途径是通过Googlebot的爬行来实现的,也就是说,Google派出它自己的网络蜘蛛,主动去抓取有价值的网页内容。类似地,Google的AdSense也有自己的bot,它的名字为MediaBot。它会自动去到放置了AdSense广告代码的网页,然后对网页内容进行分析,以投放与网页内容相关的广告。但一直以来都有一个争论,那就是到底AdSense的Media...
Google爬虫的威力有多大?
in GSeeker, on 2006-03-29
...先锋部队,Googlebot一定会不断地加强,或者有一天,它们真的会像Philipp写的 科幻短文 那样,会上门偷听你所说的话,或者把你家的垃圾桶全搬走调查呢。不过不用怕,就算真有那么一天,也要快则等个十年八年,慢则几十年后...
Google趣味域名大全
in GSeeker, on 2006-03-06
本站之前给大家 介绍 过Google的官方公布的域名,也就是说,只要你记住那一大批域名中的任意一下,你都不会找不到Google。但Google还注册了非常多的域名,并且没有在官方列表中列出来的。比如,很多朋友都因为466453.com这个域名而佩服Google的想像力。因为466453即对应手机键上的Google字母。如果你觉得这个域名已经算厉害了,那么下面这一大堆不为人知的Google域名一定够你想上一阵子的了
the Technorati business model
in TJ's Weblog, on 2004-04-15
... a competing service." Mmh, maybe I'm getting something wrong, but in my understanding the Googlebot does exactly the same thing as the TechnoratiBot. Both oft them crawl the listed sites and...




