
常用文档转换API汇总
页面SEO是指改进网页技术层面的做法,搜索引擎利用这些技术来确定网页的搜索排名。与站外SEO通过反向链接和锚文本间接起作用不同,页面SEO直接通过创建独特且相关的内容并优化元数据来发挥作用。它还涵盖关键字、标题和视觉效果,需要高水平的专业知识和信任。
优化始于网站审核——这是一个繁琐的过程,需要深入研究技术细节。搜索引擎从未停止设置新的排名标准。然而,在DataForSEO,我们意识到仅仅提供网站健康状况的全面分析不足以打入市场。我们通过提供抓取自动化、执行和分析JavaScript以及采用用户至上的方法来适应市场趋势。如果您为数字营销人员开发新的解决方案或为现有的SEO工具实现新功能,那么集成OnPage API是必经之路。
DataForSEO OnPage API是一个基于云的Web爬虫,涵盖多个端点。它会检查网站的技术基准,以便您可以迅速修复缺陷并进行优化调整。
在本文中,我们将探讨超过120个灵活的页面指标及其问题,以及它们对您网站的意义和影响。
设置OnPage API任务
URL或域名和页面限制外,您还可以添加可自定义的参数,例如与错误、大小、速度和内容相关的各种性能指标的阈值;JavaScript规则,在抓取时运行自定义的JS代码;获取并存储爬取的网站的原始HTML;加载资源(如图像、样式表、脚本、损坏的项目);启用浏览器渲染来测量核心网络生命力;测量关键词密度,以避免关键词堆砌。
您还可以优先处理某些页面,禁用对其他页面的检查,设置或禁用全站检查或自定义站点地图以进行抓取。某些特定参数仅与规范页面有关。根据Google的说法,所有重复页面的链接权益都合并到这样的页面,它是索引并显示在搜索结果中的页面,也是一组重复页面中的最佳代表。规范标记表示某个URL代表页面的主副本。
检索API任务结果
在网站被抓取后,您可以开始使用任务标识符(ID)检索结果。您可以根据您的目标请求以下OnPage端点:
您可以在我们的爬虫处理页面时逐步获取结果,而无需等待所有页面都被爬取。爬取进度和状态显示在“摘要”端点中。或者,您可以在结果准备好后请求完整的结果。
仅对实际扫描的页面收取费用:未扫描页面的差额将自动退还到您的账户。价格取决于您要使用的页数和附加参数。
页面得分
我们选择从OnPage API SEO分数开始,因为这个DataForSEO专有指标可能是最通用和最有洞察力的。它显示了以用户为中心和技术方面如何有助于搜索引擎优化,并最终提高排名和自然流量。
它以100分制评估网站质量,其中100分是最高分,表示没有关键问题,0分是最低分,表明页面积累了各种错误和警告,并且根本没有进行优化。
该指标考虑了页面上发现的严重错误和警告。它可以在以下端点中找到:
有34个OnPage API参数影响OnPage分数。
负责关键问题的参数包括:
负责重要问题的参数包括:
在DataForSEO团队中,我们深入分析了Google的声明、竞争解决方案和常见的SEO实践,为每个参数分配权重。结果,我们的数字与其他工具几乎相似,尽管可能略有不同。它们取决于优化的重要性。例如,加载缓慢的页面得分为10分,因为它会让用户感到沮丧,从而导致更高的跳出率。而规范重定向和规范链问题分别只得分3分,因为它们可能会让搜索引擎感到困惑,但不会损害用户体验。
OnPage API响应返回每个已抓取页面的分数。然而,Summary端点提供了整个域的平均值,因此,这里它取决于已抓取页面的数量。原理保持不变,但我们添加了其他变量:出现特定错误或警告的页面数量,以及已抓取页面的总数。损坏的页面的OnPage分数始终为零。
按类别划分的OnPage API指标
DataForSEO提供了详尽的OnPage API文档,详细描述了每个端点、返回的内容和返回方式。我们根据常见的数字营销实践对它们进行了分组,以方便搜索。因此,您可以快速找到关注的指标或参数,了解其用途,以及最重要的是找到相关和关联的参数。具体而言,响应中返回的页面指标属于以下类别:
网站通常包含大量不可索引的页面,例如分面类别或不可用的产品。这些页面对网站访问者毫无用处,他们也不应该找到它们,因此不应将其放置在站点地图中。
负责索引的字段是:
DataForSEO可让您跟踪带有noindex标签的页面,以确保它们仅出现在搜索引擎实际上不应考虑的页面上。我们建议将此步骤添加到您的发布清单中。
对于不可索引的页面,我们提供了专用的不可索引端点。它返回通过robots.txt、HTTP标头或元标记设置阻止被Google和其他搜索引擎索引的页面列表。它返回以下信息:
我们的API中的这些指标收集在Waterfall端点以及其他端点的数组中。速度会形成良好的第一印象,影响转化率和跳出率以及重复交易。因此,一秒钟的改进可以使移动转化率大幅提高27%。搜索引擎优先考虑用户体验,因此加载缓慢的页面会对排名产生负面影响。
high_loading_time
(高加载时间) – 指示页面的加载时间是否过长;以页面完全加载所需的时间(以毫秒为单位)指定;默认值为3000毫秒。此类页面的数量。如果加载时间大于或等于POST请求的tests_threshold数组中指定的值,则符合设定条件的页面将在API响应中被标记。这是OnPage Score的一个关键问题。waiting_time
(等待时间) – 第一个字节时间 (TTFB) 以毫秒为单位 – 响应能力的衡量标准。客户端浏览器需要从服务器接收响应的第一个字节的时间。high_waiting_time
(高等待时间) – 表示页面等待时间是否过长。以毫秒为单位指定为TTFB。默认值为1500毫秒。此类页面的数量。如果等待时间大于或等于POST请求的tests_threshold数组中指定的值,则符合设置条件的页面将在API响应中被标记。time_to_interactive
(可交互时间) – TTI性能时间。用户与页面完全交互所需的时间(以毫秒为单位)。dom_complete
(DOM完成时间) – 下载资源的时间。页面及其所有子资源下载完成所需的时间(以毫秒为单位)。connection_time
(连接时间) – 与服务器建立连接所需的时间(以毫秒为单位)。request_sent_time
(请求发送时间) – 向服务器发送请求所需的时间(以毫秒为单位)。download_time
(下载时间) – 浏览器接收响应所需的时间(以毫秒为单位)。duration_time
(持续时间) – 浏览器从服务器收到完整响应所需的总时间(以毫秒为单位)。获取资源所需的时间(以毫秒为单位)。fetch_start
(获取开始时间) – 浏览器开始下载HTML源码或页面其他资源所需的时间(以毫秒为单位)。fetch_end
(获取结束时间) – 浏览器完成下载HTML源码或页面其他资源所需的时间(以毫秒为单位)。time_to_secure_connection
(安全连接时间) – 与服务器建立安全连接所需的时间(以毫秒为单位)。ttl
(生存时间) – 浏览器缓存资源所需的时间(以毫秒为单位)。lighthouse
– 一个端点,运行一系列单独的测试以根据项目的官方文档生成数字分数。执行性能、可访问性、渐进式和移动Web应用程序、SEO和最佳实践合规性的审核。has_render_blocking_resources
(有渲染阻塞资源) – 指示页面是否包含阻止渲染的资源,通常是阻止页面快速加载的脚本和样式表。此类页面的数量。render_blocking_scripts_count
(渲染阻塞脚本数量) – 页面上阻止页面渲染的脚本数量。render_blocking_stylesheets_count
(渲染阻塞样式表数量) – 页面上阻止页面渲染的CSS样式的数量。不安全的登录页面、网络钓鱼诈骗和恶意软件会导致敏感数据(如个人和财务详情以及凭证)丢失或被盗。对用户和企业而言,后果是身份盗窃、财务损失和声誉受损。OnPage API重点突出了以下安全问题:
ssl
– 提供https://连接。http2
– 表示目标网站是否使用HTTP2协议。is_www
(是否为www子域) – 表示页面是否位于www子域中。此类页面的数量。表示具有给定资源的页面是否位于www子域中。is_https
(是否使用HTTPS) – 表示页面是否使用HTTPS协议加密。此类页面的数量。is_http
(是否使用HTTP) – 表示页面是否具有非安全HTTP协议。此类页面的数量。这是OnPage Score的一个关键问题。https_to_http_links
(HTTPS页面指向HTTP页面) – 表示安全HTTPS页面是否具有指向非安全HTTP页面的链接。此类页面的数量。所有策略的核心都是内容,所有营销人员都在努力实现内容。内容能够产生潜在客户、提高转化率、增加参与度和 Google 排名。根据您的业务模式和产品,您可能会相对频繁地更新内容,因此即使原创内容经过专业且精心制作,后续的添加或编辑也可能会损害 SEO 效果。
plain_text_size
– 页面上文本的总大小(以字节为单位)。在 Filters 端点中,您可以按特定的纯文本大小对页面进行排序。plain_text_rate
– 纯文本比率值。plain_text_size 与 size 值的比率。在 Filters 端点中,您可以按特定的纯文本比率对页面进行排序。plain_text_word_count
– 页面上的字数。在过滤器端点中,您可以按特定的纯文本字数对页面进行排序。low_content_rate
– 表示页面内容率太低。指定为纯文本大小与页面大小的比率。此比率小于 0.1 的页面数。如果页面上的字符数小于或等于 POST 请求的 tests_threshold 数组中指定的值,则符合设定条件的页面将在 API 响应中被标记。high_content_rate
– 表示规范页面内容率过高。指定为纯文本大小与页面大小的比率。此比率超过 0.9 的页面数。如果此比率超过或等于 POST 请求的 tests_threshold 数组中指定的值,则符合设定条件的页面将在 API 响应中被标记。这是 OnPage Score 的一个重要问题。low_character_count
– 表示页面包含的字符数少于 1024 个。此类页面的数量。指定为页面上的字符数。如果页面上的字符数小于或等于 POST 请求的 tests_threshold 数组中指定的值,则符合设置条件的页面将在 API 响应中被标记。这是 OnPage Score 的一个重要问题。high_character_count
– 表示页面包含超过 256,000 个字符;此类页面的数量。指定为页面上的字符数。如果页面上的字符数大于或等于checks_threshold
POST 请求数组中指定的值,则符合设置条件的页面将在 API 响应中被标记。这是 OnPage Score 的一个重要问题。internal_links_count
– 页面上的内部链接数量。external_links_count
– 页面上的外部链接数量。images_count
– 页面上的图像数量。images_size
– 以字节为单位测量页面上图像的总大小。scripts_count
– 页面上的脚本数量。scripts_size
– 页面上脚本的总大小(以字节为单位)。stylesheets_count
– 页面上的样式表的数量。stylesheets_size
– 页面上样式表的总大小(以字节为单位)。title_length
– 标题标签的长度(以字符为单位)。description_length
– 描述标签的长度(以字符为单位)。irrelevant_title
– 表示规范页面的标题与其内容不相关。为了计算相关性,我们从页面标题中取出所有唯一单词,并从页面内容中取出所有唯一单词。如果标题中此类单词在内容中出现的数量少于 30%,则我们认为它不相关。此类页面的数量。指定为页面标题与其内容的匹配率;相关性阈值为 0.3。如果分数小于或等于 POST 请求的 tests_threshold 数组中指定的值,则符合设置条件的页面将在 API 响应中被标记。这是 OnPage Score 的一个重要问题。irrelevant_description
– 表示规范页面描述标签与页面内容无关。为了计算相关性,我们从页面描述中取出所有唯一单词,并从页面内容中取出所有唯一单词。如果内容中出现的描述中此类单词的数量少于 20%,则我们认为它不相关。此类页面的数量。指定为页面描述与其内容的匹配率;相关性阈值为 0.2。如果分数小于或等于checks_threshold
POST 请求数组中指定的值,则符合设置条件的页面将在 API 响应中被标记。这是 OnPage Score 的一个重要问题。description_to_content_consistency
– meta_description 标签与页面内容的一致性,测量范围从 0 到 1。title_to_content_consistency
– meta_title 标签与页面内容的一致性,测量范围从 0 到 1。charset_consistency
– 表示页面是否具有元字符集标记,用于设置该页面的字符编码。此类页面的数量。has_misspelling
– 指示页面是否有拼写错误。如果在 POST 请求中将 check_spell 字段设置为 true,则提供有用信息。此类页面的数量。spell
– Hunspell 拼写检查错误和建议。Hunspell 是 Google Chrome、OpenOffice.org、LibreOffice、Mozilla Firefox 和 Thunderbird 的拼写检查器,也被 MacOS、MemoQ、SDL Trados、Opera 和 InDesign 等专有软件包使用。Pages 和 Summary 端点中提供的此对象返回拼写检查语言代码、拼写错误的单词以及在页面及其内容中找到的社交媒体标签。支持的标签包括但不限于Open Graph和Twitter Card。low_readability_rate
– 表示页面的可读性是否较低,即在Flesch-Kincaid可读性测试中得分低于 15 分。此类页面的数量。这是 OnPage Score 的一个重要问题。title_too_long
– 表示页面是否具有长标题。表示标题标签的内容是否超过 65 个字符。此类页面的数量。这是 OnPage Score 的一个重要问题。title_too_short
– 表示页面标题是否较短。表示标题标签的内容是否短于 30 个字符。此类页面的数量。这是 OnPage Score 的一个重要问题。keyword
– 在网站或网页上找到的关键字,其字数在将任务设置为关键字密度端点时指定。frequency
– 关键字频率。将任务设置为关键字密度端点时,关键字在指定的网站或页面上出现的次数。density
– 关键词密度。网站或页面上指定关键词长度的关键词频率与关键词总数的比率。keywords_to_content_consistency
– 元关键词标签与页面内容的一致性,测量值从 0 到 1。irrelevant_meta_keywords
– 表示规范页面具有与其内容无关的元关键字标签。指定为页面元关键字与其内容的匹配率。相关性阈值为 0.6。如果分数小于或等于checks_threshold
POST 请求数组中指定的值,则符合设置条件的页面将在 API 响应中被标记。automated_readability_index
coleman_liau_readability_index
dale_chall_readability_index
flesch_kincaid_readability_index
smog_readability_index
数据驱动的 SEO 并非一劳永逸的过程。用户期望会随着时间而改变,从而影响搜索引擎的要求。搜索引擎寻求提供更快、更具互动性和高度个性化的内容。
借助 DataForSEO OnPage API,网站所有者可以准确指出转化率下降、跳出率上升、购物车被遗弃以及其他不再有用的迹象的原因。我们友好的可自定义抓取引擎可以根据 120 多个指标检查网站。价格合理,无需内部构建复杂的抓取工具,您可以节省优化资源。
DataForSEO OnPage API 拥有 SEO 机构和软件提供商构建自定义工具所需的一切。在内部运行全面的网站审核或出售它们。我们邀请您根据数十个页面参数评估您的网站 -免费试用DataForSEO 的 API。我们响应迅速的 24/7 支持团队随时准备为您提供帮助。