使用Python语言调用零一万物API实战指南
提取人脸嵌入向量
本文将讨论如何使用开源中提供的预训练模型,并从图像中提取人脸编码或人脸嵌入。
它分析给定的图像并返回表示图像中检测到的每个人脸的数值向量。向量的大小不同,为 64、128、256、512。这里我们将讨论返回 128 个大小向量的模型。
我们可以使用这种嵌入来执行人脸识别、人脸验证和人脸匹配应用程序。
这是一种基于深度学习的方法来表示个人面部的身份。名为 FaceNet 的架构用于提取人脸嵌入,要了解有关它的更多信息,
1、Dlib
我们可以使用 Dlib 来定位图像中的人脸,此外,使用它可以提取图像中人脸的人脸编码向量。模型 dlib_face_recognition_resnet_model_v1.dat
用于提取 Dlib 模块中的编码。
在这里,我们需要说出给定图像中人脸的位置。Dlib 的优势在于,它是一个轻量级模型,即使在计算能力较低的 CPU 中也能运行,并且与其他模型相比,推理时间也较短。Dlib 的一个优点是,默认情况下它有一个面部检测模块。
# Load the model using Dlib
dlib.face_recognition_model_v1('dlib_face_recognition_resnet_model_v1.dat')
获取编码的函数:
def encodings(img,face_locations,pose_predictor,face_encoder):
predictors = [pose_predictor(img, face_location) for face_location in face_locations]
return [np.array(face_encoder.compute_face_descriptor(img, predictor, 1)) for predictor in predictors]
2、TensorFlow 模型
还有一个预先训练的 TensorFlow 模型,可用于提取图像中人脸的编码。两种情况下使用的架构相同,但损失函数和训练数据会发生变化。因此,从中返回的编码向量将与之前的模型不同,但其大小为 128 维。
在这里,对于一个模型,我们只需要传递裁剪后的图像,其中只有一张脸,因为它会检测图像中的脸,它只需读取图像并将图像传递到网络中并返回一个向量,即人脸编码。
为了处理上述情况,我们需要从图像中裁剪人脸并将其传递到模型中。要检测和裁剪图像中的脸,请使用上一篇博客中讨论的任何一种方法。
为了加载模型…
def load_model(modelpath):
detection_graph = tf.Graph()
with detection_graph.as_default():
od_graph_def = tf.GraphDef()
with tf.gfile.GFile(modelpath, 'rb') as fid:
serialized_graph = fid.read()
od_graph_def.ParseFromString(serialized_graph)
tf.import_graph_def(od_graph_def, name='')
return detection_graph
计算嵌入:
def get_embedding(graph,img):
input_array = preprocess_input_img(img)
with graph.as_default():
with tf.Session() as sess:
images_placeholder = tf.get_default_graph().get_tensor_by_name("input:0")
embeddings = tf.get_default_graph().get_tensor_by_name("embeddings:0")
phase_train_placeholder = tf.get_default_graph().get_tensor_by_name("phase_train:0")
embedding_size = embeddings.get_shape()[1]
feed_dict = {images_placeholder: input_array, phase_train_placeholder: False}
embeddings = sess.run(embeddings, feed_dict=feed_dict)
return embeddings
需要传递模型图和图像(如果需要,可以传递预处理图像)。
我们还可以根据机器容量一次传递多个图像,以设置批处理大小。
它在 CPU 和 GPU 上都运行,而在 GPU 上运行速度更快。
比较这些模型,与 TensorFlow 模型相比,Dlib 简单且在提取人脸嵌入的情况下复杂度较低。但在具有高计算能力的情况下,TF 模型表现良好。
3.相关API
人脸识别验证服务【SKYBIOMETRY】是一种高效、灵活的面部识别解决方案,能够集成到各种应用中。它支持面部检测、面部识别和面部分组,适用于广告、照片管理、安全认证等多个领域。
人脸检测 API 能够快速精准地检测图片中的人脸,并及时返回人脸位置,同时还会输出人脸关键点坐标,而且它具备强大的能力,支持对图片中多张人脸进行识别,可广泛应用于多种场景。
Facecheck人脸搜索 是一个调查搜索引擎,允许您使用面部照片搜索互联网。搜索结果将向您显示互联网上的网页链接,我们在这些网页中看到过这个人或看起来相似的人的面孔。
人脸属性 API 服务,可对人脸的诸多属性进行精准分析,涵盖年龄、性别、头部朝向、情绪、颜值以及视线等方面的属性。其能够提供详细且准确的人脸属性信息,以便于在各种场景中实现多样化的应用与需求。
人脸对比 API 可通过人脸比对操作,来精准判断两张人脸之间的相似程度,进而深入分析这两张人脸属于同一个人的可能性,能在诸多场景中提供高效且准确的人脸相似性判别服务。