智能分词-天聚数行
专用API
服务商:
上海觉克信息科技有限公司
【更新时间: 2024.07.03】
NLP智能分词,快速把一段文本切分为一个个词组,并标注了词性。当参数str为1时,返回字符串形式的词组结果,以空格分隔。大文本分词时,应该使用post请求方式。且最大不能超过1000个字符。
10元(10W天豆) 可用20000次
去服务商官网采购>
|
服务星级:2星
浏览次数
5
采购人数
0
试用次数
0
SLA: N/A
响应: N/A
适用于个人&企业
收藏
×
完成
取消
×
书签名称
确定
|
- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐
什么是天聚数行的智能分词?
智能分词是一种自然语言处理技术,通过分析文本,将其切分成独立的词语和短语。它不仅识别出单词,还能标注词性,帮助理解文本的语义结构。这项技术在处理中文文本时尤为重要,因为中文没有明显的词语分隔符,需要通过算法来准确识别词语边界。 | |
什么是天聚数行的智能分词?
天聚数行的智能分词有哪些核心功能?
- 文本切分:将一段文本切分为多个独立的词语或短语。
- 词性标注:标注每个词语的词性(如名词、动词等)。
天聚数行的智能分词的核心优势是什么?
- 高准确率:算法精确,能有效识别词语边界。
- 速度快:处理速度快,适合大规模文本处理。
- 易于集成:支持多种请求方式和返回格式,方便开发者集成到各种应用中。
- 更多的接口:170+免费接口,会员用户一键调用,60+计费接口,价格实惠可测试
5、统一性:接口高度统一,简单易用,毫秒级响应
在哪些场景会用到天聚数行的智能分词?
搜索引擎优化:通过分词技术,提高搜索引擎对文本内容的理解和索引能力,提升搜索结果的相关性和准确性。
|
|
文本分析:在数据分析和自然语言处理任务中,分词是文本预处理的关键步骤,有助于提取关键词、主题分析等。 |
|
|
自动将一段文本按词义切分
- 接口地址:https://apis.tianapi.com/nlpwords/index
- 请求示例:https://apis.tianapi.com/nlpwords/index?key=你的APIKEY&content=今天小天和kitty去上海外滩和南京东路玩
- 支持协议:http/https
- 请求方式:get/post
- 返回格式:utf-8 json
post方式请求时,enctype应为application/x-www-form-urlencoded
上传文件二进制数据流方式,enctype必须为multipart/form-data
参数url、base64中有特殊字符时,建议对值urlencode编码后传递
名称 | 类型 | 必须 | 示例值/默认值 | 说明 |
---|---|---|---|---|
key | string | 是 | 您自己的APIKEY(注册账号后获得) | API密钥 |
content | string | 是 | 今天小天和kitty去上海外滩和南京东路玩 | 文本内容 |
str | int | 否 | 0 | 返回类型,数组0[默认]、字符串1 |
接口数据样例仅作为预览参考,请以实际测试结果为准
旧域名返回的json结构和现在略有不同,请点击此处查看说明
成功调用,code=>200并产生计费:
{
"code": 200,
"msg": "success",
"result": {
"list": [
{
"word": "今天",
"word_tag": "132",
"index": "0"
},
{
"word": "小天",
"word_tag": "96",
"index": "1"
},
{
"word": "和",
"word_tag": "108",
"index": "2"
},
{
"word": "kitty",
"word_tag": "95",
"index": "3"
}
]
}
}
错误调用,查看接口错误码释义:
{
"code": 150,
"msg": "API可用次数不足"
}
▼ 返回参数
公共参数指所有接口都会返回的参数,应用参数每个接口都不同
名称 | 类型 | 示例值 | 说明 |
---|---|---|---|
公共参数 | |||
code | int | 200 | 状态码 |
msg | string | success | 错误信息 |
result | object | {} | 返回结果集 |
应用参数 | |||
word | string | 今天 | 词语 |
word_tag | string | 132 | 词性代码 |
index | string | 0 | 词组序号 |
详情参考:https://www.tianapi.com/apiview/209
自动将一段文本按词义切分
- 接口地址:https://apis.tianapi.com/nlpwords/index
- 请求示例:https://apis.tianapi.com/nlpwords/index?key=你的APIKEY&content=今天小天和kitty去上海外滩和南京东路玩
- 支持协议:http/https
- 请求方式:get/post
- 返回格式:utf-8 json
post方式请求时,enctype应为application/x-www-form-urlencoded
上传文件二进制数据流方式,enctype必须为multipart/form-data
参数url、base64中有特殊字符时,建议对值urlencode编码后传递
名称 | 类型 | 必须 | 示例值/默认值 | 说明 |
---|---|---|---|---|
key | string | 是 | 您自己的APIKEY(注册账号后获得) | API密钥 |
content | string | 是 | 今天小天和kitty去上海外滩和南京东路玩 | 文本内容 |
str | int | 否 | 0 | 返回类型,数组0[默认]、字符串1 |
接口数据样例仅作为预览参考,请以实际测试结果为准
旧域名返回的json结构和现在略有不同,请点击此处查看说明
成功调用,code=>200并产生计费:
{
"code": 200,
"msg": "success",
"result": {
"list": [
{
"word": "今天",
"word_tag": "132",
"index": "0"
},
{
"word": "小天",
"word_tag": "96",
"index": "1"
},
{
"word": "和",
"word_tag": "108",
"index": "2"
},
{
"word": "kitty",
"word_tag": "95",
"index": "3"
}
]
}
}
错误调用,查看接口错误码释义:
{
"code": 150,
"msg": "API可用次数不足"
}
▼ 返回参数
公共参数指所有接口都会返回的参数,应用参数每个接口都不同
名称 | 类型 | 示例值 | 说明 |
---|---|---|---|
公共参数 | |||
code | int | 200 | 状态码 |
msg | string | success | 错误信息 |
result | object | {} | 返回结果集 |
应用参数 | |||
word | string | 今天 | 词语 |
word_tag | string | 132 | 词性代码 |
index | string | 0 | 词组序号 |
详情参考:https://www.tianapi.com/apiview/209