
IT咨询顾问的关键抓手-DeepSeek+企业架构-快速的熟悉和洞察一个新的行业
TorchCodec 用 CPU 或 GPU 将视频解码为 PyTorch 张量,进而用于机器学习模型的训练和推断。
GitHub:https://github.com/pytorch/torchcodec
下面通过一个例子演示 TorchCodec 的基本功能。本示例改编自下列教程,选入本文时有改动。https://pytorch.org/torchcodec/stable/generated_examples/basic_example.html
首先从网络上下载一个视频:(这个部分和 TorchCodec 无关)
然后构造一个 TorchCodec 译码器:
查看视频的基本信息:
输出结果为:
利用索引得到视频译码结果:
输出为
对译码器进行索引可以得到图像帧的 torch.Tensor 对象。默认情况下帧的形状为 (N, C, H, W) ,其中 N 是批大小,C 是通道数,H 是图像高度,W 是图像宽度。N 只有在对多个帧进行译码时才会存在。 可以修改 VideoDecoder 的参数 dimension_order 使得顺序改为 N, H, W, C。元素的类型总是 torch.uint8 。我们可以把得到的帧图像绘制出来。
TorchCodec 的安装步骤如下:
# CPU 安装命令示例
# GPU 安装命令示例
# 参数 --index-url 对应的 CUDA 版本应和 PyTorch 版本一致
点击“阅读原文”查看 TorchCodec 官方文档(英文)。↓↓↓
IT咨询顾问的关键抓手-DeepSeek+企业架构-快速的熟悉和洞察一个新的行业
基于Ollama与AnythingLLM的DeepSeek-R1本地RAG应用实践
模型引擎的技术债务?一个Deepseek三种API引发的连锁反应
Windows 上快速部署.NET Core Web 项目
.NET开发者看过来!DeepSeek SDK 集成
LangChain4j实战-Java AI应用开源框架之LangChain4j和Spring AI
后端开发人员Docker快速入门
生产级满血版Deepseek-r1 671B部署实例
生产级满血版Deepseek-r1 671B部署后续问题、调优以及压测