发布时间:2021-2-17 分类: 行业动态
在高调推出雷霆算法后,百度发布了低调《移动搜索建站优化白皮书》(以下简称白皮书)。在《白皮书》中,百度详细阐述了移动搜索引起的规则,并为网站管理员提供了安全网站建设和网站优化的相关建议。
以下是百度搜索资源平台《百度移动搜索建站优化白皮书》的《网站建设篇》内容:
1前言
移动百度是一个拥有6亿用户的移动搜索客户端。它在中国用户信息获取中发挥着不可替代的作用。移动搜索引擎每天向高质量的安全网站分发数亿流量,以满足用户的搜索需求。需求;对于大多数网站管理员而言,高质量和安全的网站有助于在搜索引擎中实现良好的排名和展示,吸引更多用户并获得更多流量。
移动搜索引擎优化,从站的建设开始到用户的吸引力,通过所有的流程,以使百度搜索重要的合作伙伴— —广大网站管理员完全了解百度搜索引擎规则,并根据网站建设的规则和安全,优化网站,更好地获取搜索流量;百度搜索资源平台历时3个月,访问了各个内部技术部门,并将百度搜索内部技术原则剥离,归零,整理出来《百度移动搜索建站优化白皮书》,希望与网站管理员合作,为用户提供健康,安全,高效的搜索环境。
2网站建设
2.1域名选择
网站域名的选择不仅可以快速直观地让用户了解网站定位,域名设置,还会影响网站的搜索和抓取。因此,选择一个简单易记,安全的域名是网站建设初期最重要的一步。
2.1.1域名选择的注意事项
在网站建设之初,建议选择网站的域名。域名是独立的,易于记忆;独立移动台域名选择也遵循此规则。
移动台的域名需要与PC站的域名分开。移动台不建议与PC站共享域名;例如,PC网站的域名建议是www.test.com,相应移动台的域名是m.test.com而不是www。 test.com/m/的形式;如果它是一个响应式网站,则不考虑这种情况。
在选择网站域名时,互联网上的一些开放注册域名,如:
,需要规避。类似于:.party,.science等。
这种域名的注册成本相对较低,通常是骗子群的温床。对于此类域名后缀,建议网站管理员不要使用它们。使用后,可能会出现搜索爬行延迟等问题;如果找到任何合法操作对于此类域名站点,请在搜索资源平台上验证该站点。系统验证网站内容后,将保持与其他普通域名相同的抓取优先级。
2.1.2使用子域或目录
网站是否需要建立子域名或多级目录可以根据网站自身的定位和网站的内容级别来确定。一般而言,具有全面类别或大量内容的网站可以根据不同的二级域清楚地划分内容;如果网站内容很小,建议不要打开太多的子域名。
例如,一个博客表单站点,一些站点为每个博客作者提供一个单独的三级域,但如果作者发布的频率较低,则整个三级域处于更新频率较低的状态,并且发布频率较高太低了。搜索引擎不友好。
2.2内容发布系统
内容发布系统,无论是自建网站还是第三方网站建设系统,都支持百度;所有发布系统,除了遵循一个组织良好,逻辑上建立的网站,还要注意网站建设的安全问题,避免网站安全风险,更好地提高网站的价值。
2.2.1自建内容发布系统
网站自建内容发布系统,注意事项包括:
&拉迪奇;主体内容清晰,可以很好地识别和区分;
&拉迪奇;请勿设置后台发布时间,请遵循发布时间和显示时间;
&拉迪奇;内容分发系统的内容设置正确。例如,标签标签不应设置太多,并且不适合列出关键字;
&拉迪奇;分类是明确定义的,分类主题的文章相应地发布到相应的类别;
&拉迪奇;文字是一致的,不要挂卖狗肉,欺骗搜索引擎流量,并损害用户体验;
&拉迪奇;这些段落清晰合理,字体大小适中,字体颜色不应使用与背景颜色相似的颜色;
&拉迪奇;发布内容的内容目录已明确定义。有关详细信息,请参阅第2节中的网站结构设置。
2.2.2第三方发布系统
使用第三方发布系统构建网站需要网站管理员注意以下注意事项:
&拉迪奇;建议不要频繁更换模板主题;
&拉迪奇;与Wordpress和其他系统类似,不建议使用太多插件,这会影响网页打开的速度;
&拉迪奇; URL伪静态处理,命名约定,清晰度;
&拉迪奇;开源网站系统存在很多安全风险,在使用过程中需要进行一些安全设置和优化;
2.2.3页面生成规范
无论网站的自建出版系统,还是第三方网站建设系统和网站页面生成的使用,都应注意以下几点:
网页的结构清晰,每个类别的名称都设置得很明显;
导航和痕迹导航设置合理,机器可读,位置突出。用户可以很好地了解访问过的页面在网站上的位置;
没有任何广告元素会掩盖正文内容;
没有琐碎的图形,音频元素;
注重网站建设系统的安全性,消除网站的安全隐患
需要根据相应的类型正确设置访问请求中的内容类型,如下所示:
另外,关于页面规范标准,建议参考搜索研究所发布的《百度搜索Mobile Friendly(移动友好度)标准V1.0》
。2.3网站结构
合理设置网站结构是网站快速抓取并获取搜索流量的基础;由于网站结构设置不合理,网站无法快速识别和抓取的情况经常出现在百度的日常反馈中,域名将被更改。它给网站造成了一些损失。因此,我希望网站管理员从站点建立之初就要注意网站的结构,以免造成不必要的损失。
2.3.1 URL结构设置
是否对URL构造有严格要求,请参阅以下几点:
在构建网站结构和创建URL时,尽量避免非主流设计,并追求简单和简单。越简单越好,例如,URL中出现不常见的字符,例如异常的“II”,将导致搜索引擎识别。错误
建议不要在URL中包含中文字符。汉字很容易编码转换问题,导致识别错误
URL长度要求删除协议头http(s): //。 url的长度不应超过256个字节。
谨慎使用参数,有效参数不能放在后面;可能会被截断并导致网页抓取异常
2.3.2目录结构设置
网站目录结构的构建是否合理,是否会影响搜索引擎对网站的爬行。这里应该提到的是,网站目录结构可以由搜索引擎找到,无论是平面结构还是树结构,但注意以下几点。事项:
建议将不同的内容放在不同的目录或子域中。域名分为2.1。 2详细提到了域名划分章节
不要使用筒仓链接,搜索引擎很难找到岛屿链接;如果网站上已有大量孤立的链接,建议使用搜索资源平台的链接提交工具向百度提交数据
深层目录中不建议使用重要内容。如果内容没有大量的内部链接,搜索引擎很难判断页面的重要性
这是图像的一个例子:
2.4服务提供商/自建服务器
选择服务提供商或自建服务器是网站建设中非常重要的一部分;服务器的安全性和稳定性将直接影响百度搜索引擎对网站的整体判断。
2.4.1域名服务
2.4.1.1域名服务&域名部署
关于域名服务和域名部署,有以下注意事项:
&拉迪奇;网站管理员应仔细检查域名部署的所有方面,并且没有域名部署错误。
&拉迪奇;建议不要对网站进行全面解析。如果该网站没有进行大规模的泛分析并且影响很大,那么它将被搜索策略所压制
&拉迪奇;尝试选择一个优质的域名服务提供商
2.4.2服务器
做网站还有一个非常重要的部分,即服务器的选择。在服务器选择中,无论是虚拟主机,云主机还是独立服务器,都应注意以下四点:
&拉迪奇;不建议中文网站选择国外服务器
&拉迪奇;服务器的稳定性非常重要,您需要保持访问流畅,服务器稳定,您可以使用百度搜索资源平台(以前的百度网站管理员平台)来抓取异常,抓取诊断工具进行检测和维护。 (服务器通常无法访问或崩溃,这对爬虫来说是致命的)
&拉迪奇;除了自身的稳定性外,服务器还选择考虑网站的业务量,如带宽,内存,CPU可以承受的访问量,是否可以在突发流量下正常访问。
&拉迪奇;服务器主机设置时,需要注意是否有设置禁止爬虫爬行,或者有404错误信息设置,这会造成不必要的搜索引擎爬行判断异常,给网站造成不必要的损失。
2.4.2.1虚拟主机
通常,建议在购买虚拟主机时特别注意:
&拉迪奇;主机是否对搜索引擎访问有限制;
&拉迪奇;主办公司的资格是否符合要求;
&拉迪奇;无论主机公司的技术沉淀是否足够,建议选择更大品牌的托管;
&拉迪奇;主机托管的主机房的物理条件和网络状况是否足够好;
&拉迪奇;托管公司的技术和客户支持是否足够好;
&拉迪奇;主人是否会有过剩的能力;
&拉迪奇;主机是否存在非法访问高风险站点的问题,或者是否存在同一IP下的高风险站点。
&拉迪奇;国内网站建议购买国内云主机站;
2.4.2.2独立主机
独立主机为网站带来了更轻松的使用环境和个性化软件的安装。因此,独立主机需要网站管理员的技术实力,以确保网站的正常运行和安全。
我们建议网站管理员购买和托管独立主机:
&拉迪奇;请注意虚拟主机是否已将爬网程序IP列入黑名单。对于百度UA,请参阅3.1.2。 1百度蜘蛛章;
&拉迪奇;建议使用具有单独IP地址的主机;
&拉迪奇;建议使用组织较大的主机,这在安全配置和稳定性方面相对较好;
&拉迪奇; IDC服务提供商的建设标准需要一定的考虑因素,如防火,防盗,UPS保障,室内温度控制,防火等。
&拉迪奇; IDC服务提供商的服务质量和技术均达到标准,无论是24小时值班,是否可以帮助排除故障,免费重启和重新安装系统。
&拉迪奇; IDC会议室资格证书已完成,无论该站点是否存在高风险站点或服务器。
2.4.3安全服务
2.4.3.1 HTTPS
目前,百度已实施全站点HTTPS安全加密服务。百度HTTPS安全加密已覆盖主流浏览器,旨在创建更私密的互联网空间并加速国内互联网的HTTPS。与此同时,我希望更多网站加入HTTPS团队,为网络安全做出贡献。
HTTPS安全原则分析
HTTPS主要由两部分组成:HTTP + SSL/TLS,即用于处理加密信息的模块被添加到HTTP。服务器和客户端信息传输都是通过TLS加密的,因此传输的数据是加密数据。可以在下图中看到HTTPS和HTTP之间的区别:
HTTS的复杂加密机制有效地提高了网站的安全性。加密机制和认证机制可以降低网站劫持和伪造的风险。建议网站管理员通过HTTPS转换来增强网站的安全性。
为了更好地捕获和识别HTTPS网站,百度搜索资源平台也在2017年推出了HTTPS认证工具。完成HTTPS转换的网站可以在搜索资源平台上提交网站的HTTPS数据 - 网站支持 - HTTPS认证工具。百度更善于抓取身份识别网站。有关HTTPS身份验证工具的详细说明,请参阅5.3.2 HTTPS身份验证工具部分。
2.4.3.2防止黑客攻击措施的网站
该网站被黑客入侵,通常是在网站上发布大量类似赌博内容的情况下,或者网站页面直接跳转到赌博页面;以下是网站被黑客攻击后发布的内容:
内容未在网站上发布,内容包含大量指向以下内容的赌博网站:
网站页面直接跳转到投注网站:
网站黑客代表网站安全存在严重问题或漏洞,如何防止网站黑客入侵,请参考以下内容:
首先,自我检查是否被黑客攻击
&拉迪奇;黑客网站具有数据特征,即在短时间内异常数据中的索引量和来自搜索引擎的流量异常。因此,网站管理员可以使用百度搜索资源平台(以前的百度网站管理平台)的索引工具来观察网站的索引是否异常;如果发现数据异常,则使用流量和关键字工具检查流量获得的关键字是否与网站是否涉及赌博和色情有关。
&拉迪奇;通过网站语法查询网站,结合一些常见的色情和赌博关键词,最好找到不属于网站的非法网页。
&拉迪奇;由于百度的流量巨大,一些黑客行为只会重定向到百度带来的流量,网站管理员很难找到,所以当你检查你的网站是否被黑客攻击时,你必须从百度搜索结果中点击网站页面才能查看。你跳到另一个网站?
&拉迪奇;百度搜索结果中显示网站内容存在风险。
&拉迪奇;后续行动可以要求网站技术人员进一步确认网站是否通过后台数据和程序被黑客入侵
第二,被黑客攻击后如何处理
&拉迪奇;在确认网站被黑客入侵后,除了快速纠正技术人员外,SEO人员还需要做一些善后和预防工作。
&拉迪奇;如果网站有更改页面,则更改页面会建议使用链接提交工具向百度提交数据
&拉迪奇;立即停止网站服务以防止用户继续受到影响并防止对其他网站的进一步攻击
&拉迪奇;如果同一主机提供商中的多个站点在同一时段内被黑客攻击,您可以联系托管服务提供商并敦促另一方做出响应。
&拉迪奇;清理发现的黑客内容,将被黑客入侵的页面设置为404死链,并通过百度搜索资源平台(原百度网站管理员平台)死链提交工具提交。 (我们发现有些网站使用被黑网页跳转到主页,这是非常不受欢迎的。)
&拉迪奇;检测可能的黑客攻击时间,与服务器上的文件修改时间相比,处理黑客上传和修改的文件;检查服务器中的用户管理设置,确认是否有异常变化;更改服务器访问密码的用户。注意:您可以从访问日志中确定可能的黑客入侵时间。但是,黑客也可能会修改服务器的访问日志。
&拉迪奇;做好安全性,检查网站中的漏洞,防止黑客攻击。
网站自我保护注意事项:
&拉迪奇;多个安全保护同步:适用于中小型信息网站
该网站程序已修补:如今,许多信息网站使用内容管理系统(CMS)。作为新闻发布系统,功能还可以,但作为更常见的内容管理系统(CMS),还有另一个问题。也就是说,漏洞更受欢迎,因为源代码是开放的,因此很容易被利用,并且网站程序需要及时修复。
&拉迪奇;服务器的一般安全保护
在工作时间之外,在服务器上设置网站权限,禁止文件修改,隐藏后台文件或迁移到根目录
参考某些网站的安全设置,不能将不合格的IP写入数据库。
&拉迪奇;不使用开源程序的默认机器人文件
下图显示了地级信息站点的机器人文件。从机器人文件中可以看出,网站使用编织的梦想背景,黑客可以通过各种软件进行操作以进行梦想攻击。可以针对Dreamweaver网站中的常见漏洞进行扫描和针对性攻击。
2.4.4网络服务
2.4.4.1 CDN
从搜索和捕获机制来看:百度蜘蛛以与普通用户相同的方式抓取网站,只要普通用户可以访问内容,百度蜘蛛就可以抓取。无论使用何种技术,只要用户可以确保顺利访问网站,就不会对搜索引擎产生影响。但是,网站管理员使用CDN后,网站爬行异常,甚至出现异常流量等问题。主要因素有两个因素:
首先,一些CDN服务提供商没有足够的硬件,而且往往存在不稳定的情况,这会导致大量蜘蛛无法抓取,这会影响网站的抓取效果,有的甚至会影响索引数据;所以选择一个强大的CDN服务提供商。重要;
其次,当网站出现死链,无法打开或被黑客入侵时,缓存机制起到了推波助澜的作用。一些不利的快照是在短时间内产生的,影响了排名。不要担心这种情况,及时清理源文件和CDN缓存,并在百度搜索资源平台(以前的网站管理员平台)中保存相关的死链数据等方法进行恢复。
« 新鲜电子商务的原始仓库模式能否贯彻? U店主宣布上海已实现盈亏平衡 | 在构建安全的共同黄金产品时需要考虑的事项 »