输出格式:API v2 | 文档 v2 | 网站分类 API | WhoisXML API

输出格式:API v2

{
    "categories": [
        {
            "tier1": {
                "confidence": 0.6479678859489982,
                "id": "IAB-379",
                "name": "News and Politics"
            },
            "tier2": {
                "confidence": 0.9644738361093003,
                "id": "IAB-390",
                "name": "Weather"
            }
        }
    ],
    "domainName": "cnn.com",
    "websiteResponded": true
}

输出参数

域名
网站的 URL
网站响应

确定网站在信息抓取过程中是否处于活跃状态。以下情况网站被视为处于活跃状态:

  • 超时 20 秒内响应(连接超时 - 10 秒,响应读取超时 - 10 秒)
  • 200 HTTP 代码响应
  • 发送Content-Type 抬头信息,内容为text/htmltext/plain
分类

潜在的网站分类列表。此处获取所有可能的分类。

categories[0].tier1

顶级类别对象。

网站分类 API 根据IAB Content Taxonomy 2.2 进行分类。

最初,IAB 分类法对某些类别最多使用 4 个层级。但是,低级别的类别过于狭窄,因此我们合并了较低级别的层级,将分类法缩减为 2 级,以提高准确性和可读性。 所有原始 ID 均保持不变,如有必要,用户可以从 IAB 文件中恢复完整路径。

  • 1 级:反映内容的顶级类别。通常,此类别过于宽泛,只指向一般的内容主题。
  • 第 2 级:反映了IAB的第 2、3 和 4 级。这些类别的范围更窄, 描述具体内容。

通常,网站分类 API 会得到多个分类,且按照相关性从高到低排序。如果没有 "minConfidence "参数,API 会返回所有相关性大于 0.5 的类别,且所有结果按相关性降序排序。 相关性按两层概率的最大值计算。例如,如果 第 1 层的概率是 0.90,第 2 层的概率是 0.99,那么这组结果的总体相关性就是 0.99。反之亦然,如果第 1 层的概率为 0.98,第 2 层的概率为 0.8,则最终概率为 0.98。

categories[0].tier2
二级类别对象(如果存在)。
categories[0].tier1.id
唯一的类别标识符。
categories[0].tier1.confidence
类别与网站相关的可能性。
categories[0].tier1.name
类别的可读名称。