所有文章
> 当前分类:AI驱动
神经网络算法 - 一文搞懂Loss Function(损失函数)
2024/12/31
损失函数 一、损失函数的本质 机器学习“三板斧”:选择模型家族,定义损失函数量化预测误差,通过优化算法找到最小化损失的最优模型参数。 机器学习 vs 人类学习 定义一个函数集合(模型选择) 目标...
神经网络算法 – 一文搞懂回归和分类
【AI驱动】
回归和分类 一、回归和分类的本质 回归和分类是机器学习中两种基本的预测问题。它们的本质区别在于输出的类型:回归问题的输出是连续的数值,分类问题的输出是有限的、离散的类别标签。 回归(Regression)的本质:回归的本质...
2024/12/31
神经网络算法 – 一文搞懂Back Propagation(反向传播)
【AI驱动】
反向传播 一、反向传播的本质 前向传播(Forward Propagation):前向传播是神经网络通过层级结构和参数,将输入数据逐步转换为预测结果的过程,实现输入与输出之间的复杂映射。 前向传播 ...
2024/12/31
大模型开发 – 一文搞懂 Prompt Engineering(提示工程)
【AI驱动】
提示工程 一、提示工程的本质 Prompt(提示):Prompt(提示)在人工智能,特别是AGI(通用人工智能)时代,扮演着至关重要的角色。它不仅是用户与AI模型如ChatGPT交互的桥梁,更是一种全新的“编程语言”,用于指导A...
2024/12/31
大模型开发 – 一文搞懂 Function Calling(函数调用)
【AI驱动】
函数调用 一、函数调用的本质 自然语言接口(NLI):Natural Language Interface,自然语言连接一切。 自然语言接口(NLI) NLI的定义自然语言接口(NLI)允许用户通过日常语言...
2024/12/31
大模型开发 – 一文搞懂 LangChain(五):Chains
【AI驱动】
一、Chains的本质 Chains是什么?Chains 在 LangChain 框架中的核心概念是用于将多个组件及其他 Chains 组合成更复杂功能,通过模块化与复用提高开发效率、代码可读性及可维护性。 模块化:提高代码复...
2024/12/31
大模型开发 – 一文搞懂 LangChain(四):Agents
【AI驱动】
一、Agents的本质 Agents是什么? Agents 的核心概念是利用语言模型来选择一系列要执行的动作。与传统的硬编码动作链不同,Agents 使用语言模型作为推理引擎来确定要执行哪些动作以及它们的执行顺序。 基于...
2024/12/31
大模型开发 – 一文搞懂 LangChain(三):Retrieval
【AI驱动】
本文将从Retrieval的本质、Retrieval的原理、Retrieval的应用三个方面,带您一文搞懂 LangChain(三):Retrieval。 一、Retrieval的本质 Retrieval是什么...
2024/12/31
一文彻底搞懂机器学习 – 基础知识
【AI驱动】
机器学习是人工智能的一个分支,通过让计算机系统从数据中自动学习并改进性能以做出预测或决策,它分为监督学习、无监督学习、半监督学习、强化学习等多种类型,并面临数据质量、过拟合与欠拟合、梯度消失和梯度爆炸等挑战。 机器学习流程涵盖数据收集...
2024/12/31
一文彻底搞懂机器学习 – 分类(Classification)
【AI驱动】
分类(Classification)是机器学习中的一种有监督学习任务,其目标是根据输入数据的特征将数据点分配到预定义的类别中。 二分类、多类分类、多标签分类和多输出分类是机器学习中的四种重要分类问题。其中二分类区分两个类别,多类分类选...
2024/12/31
一文彻底搞懂机器学习 – Softmax回归(Softmax Regression)
【AI驱动】
混淆矩阵(Confusion Matrix)是机器学习中评估分类模型性能的重要工具。通过混淆矩阵,可以直观地了解模型在各个类别上的表现,包括正确分类和错误分类的样本数量。基于混淆矩阵,我们可以计算准确率、精确率、召回率、F1分数以及真正率和...
2024/12/31
一文彻底搞懂机器学习 – 混淆矩阵(Confusion Matrix)
【AI驱动】
混淆矩阵(Confusion Matrix)是机器学习中评估分类模型性能的重要工具。通过混淆矩阵,可以直观地了解模型在各个类别上的表现,包括正确分类和错误分类的样本数量。基于混淆矩阵,我们可以计算准确率、精确率、召回率、F1分数以及真正率和...
2024/12/31
时间序列+预训练大模型!
【AI驱动】
大家好,我是泳鱼。时间序列预测可以使用经典预测方法和深度学习方法。经典预测方法如ETS、ARIMA等为每个时间序列独立地拟合模型,而深度学习方法在给定的数据集中学习时间序列。如今,大型语言模型(LLM)在自然语言处理任务中表现出色,基于tr...
2024/12/31
手把手拆解:从零实现Llama3大模型(Python)
【AI驱动】
自Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并在代码生成任务上全面领先。太强了!10大开源大模型!此后,开发者们便开始了本地部署和实现,比如 llama3 的中文实现、llama...
2024/12/31
神经网络算法 – 一文搞懂ANN(人工神经网络)
【AI驱动】
本文将从生物神经网络、人工神经网络、神经网络训练、分类与应用四个方面,带您一文搞懂人工神经网络ANN。 一、生物神经网络 基本定义: 百度百科:生物神经网络(Biological Neural Networks)一般指生...
2024/12/31
一文彻底搞懂大模型 – LLM四阶段技术
【AI驱动】
在探讨大模型(LLM)的四阶段技术时,我们可以从Prompt Engineering(提示工程)、AI Agent(人工智能代理)、Fine-tuning(微调)以及Pre-training(预训练)这四个关键阶段来详细阐述,这四个阶段技术...
2024/12/31
搜索文章
热门话题