分类: Seo&Hacker预览模式: 普通 | 列表
09-12
10

百度分词切词研究 如何获取优质长尾流量

对与百度的分词研究原来也没有在意,但有一次我在作优化时无意中发现一个词也就是差了一个字,结果排名大不相同。我作的是二手房的关键词,但是我的页面上的关键词设置却是“二手房源”,可能有的朋友会说,这个没什么问题啊,“二手房源”不是包含了二手房这个关键词吗?如果没有仔细对百度的分词进行研究,大家可能看不出这两个词会有什么区别,不过大家只要稍微留心一下搜索出来的结果,就可以看出端倪了,百度在对“二手房”和 “二手房源”这两个词分词出来是不一样的,百度自己建立有自己的词库,所以他会把“二手房“这个词当作一个整体,但是对于”二手房源“这个词,百度则拆分成了”二手“和”房源“两个词,自然别人在搜索二手房这个关键词的时候就找不到我的页面了。通过这个小细节,我觉得有必要对百度的分词进行一下深入的研究,我大概地总结出了以下这么几点:

  1、百度分词是根据内容中,第一次出现关键词相关词为标准来分的。例如”今日新开热血江湖sf“这个词
  如果你的正文中第一个出现的是”今日“这个词,那么你的页面上的关键词就会被拆分成”今日”和“新开热血江湖sf“两个词,标题中一定要包含关键词,但不一定要完全匹配,但内容中出现的关键词是要跟百度分词完全匹配的,在完全匹配中又会根据文件URL路径的深度来进行排序,在关键词都完全匹配的情况下,比如说目录比文件有优先权,根目录下的文件要比二级目录下的文件有优先权,完全匹配的会排在前面,然后再是部分匹配的。

  2、在关键词没有完全匹配的情况下,如果有分词,比如说:游览器下载
  这个关键词,有一个网页里第一次出现的关键词是游览器,并且有较高的关键词密度,但是这个网页中却没有”下载“这个关键词
  而另一个网页里第一次出现的关键词是下载,那么这个网页的关键词就会被拆分成 游览器 下载 两个词,虽然第二个网页里包含有“游览器” “下载” 但是第一个网页还是会排在第二个网页的前面,这说明关键词的前面部分是最重要的。

查看更多...

Tags: 分词 切词 百度

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 230
09-11
04

分析常用网络推广的八种方法

  到这里来的都是想学习网络推广,那如何进行网络推广,一般网络推广常用的方法有哪些可能很多人并不知道,这里我列举八个常用的网络推广方法,供大家参考。

  1.百度推广:为什么我要把百度放到首位呢,在如今的网络时代搜索引擎已经是家喻户晓的网络媒体,更是让客户准确的找到相关信息的一个必不可少的工具,它的魅力在与怎样让别人看到我们的推广并且点击进来与我们及时沟通。这块的文字需要仔细的策划一番,你用什么样的语言可以让病人去接受产生好奇,并且与之沟通。

  2.Google推广:谷歌的推广,大多数人会认为没有什么大的作用,都会认为在中国所有人都在用百度,谁还用谷歌呢?其实用不用是一会事,怎样把它利用好是一回事,谷歌的搜索不是采用百度的竞价排名制,而是采用侧栏竞价推广。这中推广形式,从网络营销的角度上去考虑的话,是没有多大作用的,只有确实有意向的病人才会去点击并且去咨询。

  3.新闻式营销和广域营销:新闻营销不明思议,是指对一件总所周知的新闻来做一个导向,例如某某明星得了什么病,导致怎样怎样,通过这件事情让大家明白的哪里?这样的不会让网友所反感,更会带来可观的流量。这样推广方式可以考虑论坛式营销和百度知道,雅虎知识堂等。利用一种众人皆知的新闻来达到推广的策略。采用此类推广以不出现医院名称为好,毕竟论坛等各大发布信息的地方是舆论最多的地方,很容易遭到同行或者网友的一阵口水。所以此推广方式,还是因院而定。在就是广域营销,这是我自己想的词语,广域就是覆盖面大,怎样才能让它覆盖面大呢?就拿电子商务来讲,什么是电子商务?说白了就是网上卖东西,B2B B2C 等这些东西就是一个良好的推广平台,他们卖的是产品,我们做的是服务,我们为什么不能利用这些资源来做一下SEO做一下网站的外链呢?这不都是一个给自己打广告的好机会吗?还有例如114 黄页等这些地方,医疗网站的注册这些地方我们都可以去做一下医院的形象和介绍。又不收费,而且搜索引擎收录这些东西又快,只要我们做的介绍不是很露骨,一般的平台是都可以通过的。这样的推广不花费资金不占用人力不耽误时间,是很好的一种网络营销策略。

  4.本地网络营销:在着茫茫的网络世界中,我们都很渺小,但是咱一个城市的社区中,我们却可以打出自己的知名度。本地的网络媒体是可以利用的一种营销方式。

查看更多...

Tags: 推广

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 243
  我们先了解下什么是锚文本?锚文本就是一组关键词带着一个链接。可以是站内的链接,也可以是站外的链接。只要带着文字的链接,就叫链接锚文本。

  在自建博客上添加锚文本,首先要明确自建博客一定要被引擎收录才管用,如果你的是刚建的那要先提交到搜索引擎里。这是一个很好的自力更生获得外链的办法,希望seoer的同行们重视。

  一般情况下,如果网站规模比较大,内容页面的长尾关键词只需通过站内锚文本,就可以实现很好的排名。对于一些竞争性强一些长尾关键词,可以通过在自建博客上添加锚文本来增加它们的权重,而且这样方法可以有目的地对更多的相关关键词做锚文本,也就是说只是用来做几个目标关键词的锚文本,显得有些资源浪费了。

  综合了一下下,下面是注意点:

  1、再次强调下一定要在被收录的博客上添加锚文本才有用。

查看更多...

Tags: 锚文本

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 216
09-09
11

面向PageRank和HITS算法的网站设计

  思亿欧曾经讨论过PageRank算法和HITS算法,同时也提到了Google,因为它是唯一一个使用PageRank算法的搜索引擎。虽然各种排序算法都是保密的,但可以肯定的是,这些算法一定比我们所讨论的更为复杂。很可能,大部分搜索引擎都采用了某种基于链接的排序算法,吸纳了PageRank算法和HITS算法的精华,同时也使用其他的数据源,这些数据源中应该包含任何具体查询与网页文本的匹配程度;目标网页的更新频率(即网页所提供的信息的新鲜度);甚至可能包括用户输入查询后,在搜索引擎返回的结果中点击链接的频度。下面基于对PageRank算法和HITS算法的分析,给出了关于如何提高网站对搜索引擎的可见性的几点建议。

  ·网站应该设计成这样:搜索引擎能够从其首页开始爬行所有网页,且能够从中找到标准的HTML链接。

  ·每个网页的HTML文件中应含有与它们主题内容相关的词语,尤其是用户可能用作检索词的那些词语。

  ·应尽可能早的创建网站,在网页的索引和排序中,网页年龄是很重要的。PageRank算法对较老的网页有利,搜索引擎不大容易发现较新的网页,因为新网页的人链较少。

  ·网站的URL应尽可能保持不变。URL的改变将会导致死链,这就意味着要失去许多访问者,因为他们无法沿着死链访问到该网站,同时PageRank值也会流失。

查看更多...

Tags: HITS PageRank

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 189
09-09
11

SEO Google算法解析系列之HillTop算法

  上一遍我们介绍了潜在语义索引(LSI),今天我们将介绍超链分析的颠峰之作:HillTop算法,作为现在Google现在最核心的排名算法之一,网上不乏大量介绍她的文献。本文侧重于原始算法的分析,不考虑过多复杂因素,让您更容易理解算法本质。

  HillTop算法集PageRank,HITs、相关性算法大成于一身,由康柏系统研究中心的Krishna Bharat和多伦多大学的George A.Mihaila在2001年提出并申请了专利,后授权于Google,2003年12月Google算法更新,其成为Google核心排名算法之一。

  HillTop是一种查询相关性链接分析算法,克服了的PageRank的查询无关性的缺点。简单的说HillTop算法是针对热门查询关键词来对搜索结果重新排序的一种算法。之所以针对热门关键词,这是因为HillTop算法运行效率较低的原因。算法主要分为两个过程:

  一、 专家页面的寻找和评分;搜索引擎根据用户查询日志发现热门关键词后,开始针对这些热门关键词寻找专家页面,成为专家页的2个必要因素,1)必须拥有足够多而且不存在隶属关系的出链,2)至少存在一个短语包含该热门关键词的所有术语。确定专家页以后,在该页面上找出所有全部包含热门关键词中术语、或者差1到2两个术语的短语,将这些短语分为三个等级,分别为全部包含,差1个和差2个术语,分别对这个三等级计算等级分,等级是分对各个等级中所有短语得分的 和,而短语得分取决于这个短语在页面中位置,分数从高到低依次标题、头部和锚文本等等,然后的综合计算这个三个等级得分就得到专家分。以下举个简单的以 “汽车消费”这个热门关键词为例,“中国汽车消费网”的首页和友情链接页就是这个关键词的专家页面,因为他具有足够多而且不隶属315che.com主机域名和同C类ip的出链,同时标题中的“中国汽车消费网”也包含“汽车”和“消费”这两个术语。接下来评分,先算第一等级(包含所有术语的短语)的得分,短语“中国汽车消费网”在标题中得到16分(假设),以及在锚文本中“中国汽车消费理财倾向大调查”得了1分,那么第一等级得分为17分,再算第二等级(差一个术语),第三等级(差两个术语)。这样再算三个等级得分的加权和,就是专家分。

  二、 对目标页评分;一个专家页对目标页的评分等于专家本身分值×专家页可区分的短语数量。取前N个指向目标页的专家页,对于多个同一隶属的专家页指向该目标页,取分值最高的专家页,然后这些专家页对目标网页的评分的和就得到,这个页面对应这个热门关键词的得分,有人称之为行业得分。

查看更多...

Tags: HillTop 算法 google

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 292
09-09
11

SEO Google算法解析系列之潜在语义索引(LSI)

  作为一个SEOer,我们必须对搜索引擎排名算法有一定的理解,才能真正谈优化,接下来将针对Google一系列算法就我的一点理解和心得与大家共享,希望大家多多指教,相互学习。这里我们先从关键词的相关性算法开始。

  搜索引擎作弊最快的方法当属关键词堆砌,这源于信息检索中相关性算法本身的缺陷,为了对抗这种作弊方法,搜索引擎通过潜在语义索引(Latent Semantic Indexing,LSI)算法来发现这些作弊页面,LSI算法也是信息检索领域一种古老的算法,1988年由S.T. Dumais等 人提出,主要用于自然语言理解,通过统计的方法对文档的进行语义分析,发掘同义词,相关词组等等。举个简单的例子:比方“汽车消费”这个词,通过分析大量 页面发现这个词频繁的出现在“汽车消费贷款”,“中国汽车消费网”等等这些词组中,那么机器可以认为人们的语言习惯是将“汽车消费”和“汽车消费贷款”、 “中国汽车消费网”等等联系在一起来描述一些事情。通过这样的分析发现一些由机器生成的关键词堆砌页面,因为搜索引擎认为机器生成的页面不会出现这些相关 联的词组。

  LSI算法被用于 Google的很多应用,如Adwords,Google Suggest,以及上面提到的反作弊等等。

  LSI算法提醒我们在搜索引擎优化的时候要注意页面的关键词密度,以及相关词组的使用,尽量使用比较自然的语言方式来提高页面的相关性。

Tags: LSI

分类:Seo&Hacker | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 247