腾讯云智能识别-人脸识别
专用API
服务商:
腾讯云计算(北京)有限责任公司
【更新时间: 2024.04.15】
腾讯云智能识别(Intelligent Identification,II)基于腾讯各实验室最新研究成果,为您提供视频内容的全方位识别,支持识别视频内的人物、语音、文字以及帧标签,对视频进行多维度结构化分析。
咨询
去服务商官网采购>
|
- API详情
- 使用指南
- 常见 FAQ
- 关于我们
产品介绍
什么是人脸识别的腾讯云智能识别?
腾讯云智能识别(Intelligent Identification,II)基于腾讯各实验室最新研究成果,为您提供视频内容的全方位识别,支持识别视频内的人物、语音、文字以及帧标签,对视频进行多维度结构化分析。
什么是人脸识别的腾讯云智能识别接口?
由服务使用方的应用程序发起,以Restful风格为主、通过公网HTTP协议调用人脸识别的腾讯云智能识别,从而实现程序的自动化交互,提高服务效率。
人脸识别的腾讯云智能识别有哪些核心功能?
- 人脸识别:识别视频中的人脸信息并定位视频中的人物所在帧以及人脸所在区域,支持自定义人物信息。
- 语音识别:快速识别视频中的声音并转化成文字,适用于字幕生成及生成检索文本等场景。
- 文字识别:识别视频中出现的文字信息,可用于视频内自定义关键词的提取,支持竖版文字的识别。
- 语音翻译:支持将视频中的语音识别并翻译成目标语言文本,支持中文、英语、日韩语等多种语言识别翻译。
- 帧标签识别:支持识别标签及位置,涵盖人物、风景、建筑、动植物、食物等9个大类,支持自定义标签。
- 片头片尾识别:根据视频画面特征、文字、语音等信息自动识别定位电影/电视剧片头片尾时间点。
人脸识别的腾讯云智能识别的核心优势是什么?
引擎整合
海量标签
简单易用
倍速可控
高可定制
准确高效
在哪些场景会用到人脸识别的腾讯云智能识别?
- 视频生产:通过智能识别,您可轻松高效地从海量视频中找出所关注的目标人物在视频中出现的时间点,以及人脸所在画面区域和持续时间,便于快速查找相关创作素材,提升后期创作效率。
- 广电编目:通过内容识别分析等相关能力,快速理解内容结构化信息,辅助人工编目,提升运营效率。
- 智能字幕:通过智能识别,您可根据点播视频中音频自动生成字幕文件,同时也支持自动给直播流加上实时字幕,以及进行会场实时转译,便于会后进行会议纪要整理。
- 视频广告:通过智能识别,您可自动识别出视频中用户关注的物体、品牌 LOGO 和场景等出现的时间点以及所在区域。借助这些综合信息可帮助您进行广告精准投放,提升广告转化率和收益率。
使用指南
产品问答
?
智能识别支持哪些视频格式?支持音频吗?直播流呢?
音频支持 wav、mp3、aac、flac。 视频支持 mp4、flv、mkv、avi、rmvb、ts、fmp4 等常见音视频容器格式。 直播流支持 flv、rtmp、hls、dash等音视频传输协议。 若有其他不常见格式且视频量较大可以联系您的腾讯云商务提出申请。
?
何挑选入库人脸图片能达到较好的视频识别结果?
入库图片请尽量选择正面人脸较清晰的单人像照片,图片格式选择jpg或png ,像素不低于200X200px。同时,您新增的人脸图片若越接近需要处理的视频中目标人物,识别的效果就越好。 若您需要识别目标人物在不同时期且时间间隔跨度较大的视频,建议新增入库的目标人物人脸图片尽量涵盖该人物不同时期的人像图片,以便获得更高的识别准确度。
?
默认处理速度如何?如何申请调整默认处理速度或者默认并发限制?
若在下载速度不影响处理的前提下,智能识别接口默认处理速度约为4倍速(注意:默认截图间隔1秒),相当于长度为1小时的视频约在15分钟左右处理完。 如果视频量级较大且稳定,可以联系您的腾讯商务提出调整处理速度和并发限制的申请。直播处理时延可以控制在1~2秒内。
?
为什么视频中目标人物是连续出现的但是识别结果是离散的点?
主要考虑返回人脸区域的精确性,对应相邻间隔截图中识别出的人脸如果人脸区域 IOU > 0.85 默认会进行合并,否则会分开显示,可以根据用户要求配置 IOU 自定义合并阈值,用户也可以根据自身业务场景自行合并。
关于我们
腾讯云计算(北京)有限责任公司是腾讯云的运营主体,提供包括云服务器、数据库、人工智能、容器服务等在内的300多款云计算产品。公司依托腾讯强大的技术积累,构建了覆盖全球的云计算基础设施,致力于帮助企业实现数字化转型,推动产业升级。腾讯云以安全、稳定、高效的服务,赢得了众多行业客户的信任,成为推动数字经济发展的重要力量。
联系信息
服务时间:
7*24
电话号码:
+86 755 8601 3388
电话号码:
+1 844 606 0804(美国)
电话号码:
+44 808 196 4551(英国)
邮箱:
cloudlegalnotices@tencent.com
网页在线客服:
咨询
为何选择腾讯云
了解各行各业的领先企业为何选择腾讯云来解决最艰巨的挑战。
|
|
|
|
|
合作客户
API接口列表
使用指南
依赖服务
产品问答
?
智能识别支持哪些视频格式?支持音频吗?直播流呢?
音频支持 wav、mp3、aac、flac。 视频支持 mp4、flv、mkv、avi、rmvb、ts、fmp4 等常见音视频容器格式。 直播流支持 flv、rtmp、hls、dash等音视频传输协议。 若有其他不常见格式且视频量较大可以联系您的腾讯云商务提出申请。
?
何挑选入库人脸图片能达到较好的视频识别结果?
入库图片请尽量选择正面人脸较清晰的单人像照片,图片格式选择jpg或png ,像素不低于200X200px。同时,您新增的人脸图片若越接近需要处理的视频中目标人物,识别的效果就越好。 若您需要识别目标人物在不同时期且时间间隔跨度较大的视频,建议新增入库的目标人物人脸图片尽量涵盖该人物不同时期的人像图片,以便获得更高的识别准确度。
?
默认处理速度如何?如何申请调整默认处理速度或者默认并发限制?
若在下载速度不影响处理的前提下,智能识别接口默认处理速度约为4倍速(注意:默认截图间隔1秒),相当于长度为1小时的视频约在15分钟左右处理完。 如果视频量级较大且稳定,可以联系您的腾讯商务提出调整处理速度和并发限制的申请。直播处理时延可以控制在1~2秒内。
?
为什么视频中目标人物是连续出现的但是识别结果是离散的点?
主要考虑返回人脸区域的精确性,对应相邻间隔截图中识别出的人脸如果人脸区域 IOU > 0.85 默认会进行合并,否则会分开显示,可以根据用户要求配置 IOU 自定义合并阈值,用户也可以根据自身业务场景自行合并。
关于我们
腾讯云计算(北京)有限责任公司是腾讯云的运营主体,提供包括云服务器、数据库、人工智能、容器服务等在内的300多款云计算产品。公司依托腾讯强大的技术积累,构建了覆盖全球的云计算基础设施,致力于帮助企业实现数字化转型,推动产业升级。腾讯云以安全、稳定、高效的服务,赢得了众多行业客户的信任,成为推动数字经济发展的重要力量。
联系信息
服务时间:
7*24
电话号码:
+86 755 8601 3388
电话号码:
+1 844 606 0804(美国)
电话号码:
+44 808 196 4551(英国)
邮箱:
cloudlegalnotices@tencent.com
网页在线客服:
咨询
为何选择腾讯云
了解各行各业的领先企业为何选择腾讯云来解决最艰巨的挑战。
|
|
|
|
|
合作客户
合作案例