所有文章 > 当前分类:AI驱动
图解机器学习特征工程
图解机器学习特征工程
2024/12/23
本篇内容,我们给大家展开对数据预处理和特征工程的实战应用细节做一个全面的解读。 上图为大家熟悉的机器学习建模流程图(扩展阅读:一文全览机器学习建模流程(Python代码)),整个建模流程非常重要的一步,是对于数据的预处理和特征...
Python数据分析指南(全)
Python数据分析指南(全)
【AI驱动】 前言 数据分析是通过明确分析目的,梳理并确定分析逻辑,针对性的收集、整理数据,并采用统计、挖掘技术分析,提取有用信息和展示结论的过程,是数据科学领域的核心技能。 本文从数据分析常用逻辑框架及技术方法出发,结合python...
2024/12/23
Python特征选择(全)
Python特征选择(全)
【AI驱动】 1  特征选择的目的 机器学习中特征选择是一个重要步骤,以筛选出显著特征、摒弃非显著特征。这样做的作用是: 减少特征(避免维度灾难),提高训练速度,降低运算开销; 减少干扰噪声,降低过拟合风险,提升模型效果; ...
2024/12/23
机器学习模型迭代方法(Python)
机器学习模型迭代方法(Python)
【AI驱动】 一、模型迭代方法 机器学习模型在实际应用的场景,通常要根据新增的数据下进行模型的迭代,常见的模型迭代方法有以下几种: 1、全量数据重新训练一个模型,直接合并历史训练数据与新增的数据,模型直接离线学习全量数据,学习得到一个全新的...
2024/12/23
全面解析Kmeans聚类算法(Python)
全面解析Kmeans聚类算法(Python)
【AI驱动】 一、聚类简介 Clustering (聚类)是常见的unsupervised learning (无监督学习)方法,简单地说就是把相似的数据样本分到一组(簇),聚类的过程,我们并不清楚某一类是什么(通常无标签信息),需要实现的目标只是...
2024/12/23
全面解析并实现逻辑回归(Python)
全面解析并实现逻辑回归(Python)
【AI驱动】 一、逻辑回归模型结构 逻辑回归是一种广义线性的分类模型且其模型结构可以视为单层的神经网络,由一层输入层、一层仅带有一个sigmoid激活函数的神经元的输出层组成,而无隐藏层。其模型的功能可以简化成两步,“通过模型权重[w]对输入特征[...
2024/12/23
文本标注在自然语言处理中的重要性
文本标注在自然语言处理中的重要性
【AI驱动】 通过自然语言处理(NLP),机器能够逐渐进化到理解人类交谈、表达情感、理解、回应、分析和模仿人类对话以及情感驱动行为的方式。NLP 是聊天机器人、文本到语音工具、语音识别、虚拟助手等背后的关键技术。为了训练机器学习模块执行更复杂的任务,需要...
2024/12/22
贝叶斯机器学习前沿进展的综述
贝叶斯机器学习前沿进展的综述
【AI驱动】 前言  机器学习是人工智能及模式识别领域的共同研究热点,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题.2010年的图灵奖获得者为哈佛大学的LeslieValliant 教授,其获奖工作之一是建立了概率近似正确(...
2024/12/20
机器学习模型可解释性的综述
机器学习模型可解释性的综述
【AI驱动】 导读:模型可解释性方面的研究,在近两年的科研会议上成为关注热点,因为大家不仅仅满足于模型的效果,更对模型效果的原因产生更多的思考,这样的思考有助于模型和特征的优化,更能够帮助更好的理解模型本身和提升模型服务质量。本文对机器学习模型可解释性相...
2024/12/20
弱监督学习的综述
弱监督学习的综述
【AI驱动】 摘要:监督学习技术通过学习大量训练样本来构建预测模型,其中每个训练样本都有一个标签标明其真值输出。尽管当前的技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标签这样的强监督信息。因此,能够使用...
2024/12/20
因果机器学习的前沿进展综述
因果机器学习的前沿进展综述
【AI驱动】 机器学习是实现人工智能的重要技术手段之一,广泛应用于计算机视觉、自然语言处理、搜索引擎和推荐系统等领域。但当前的机器学习方法通常注重数据中的相关关系而忽视其中的因果关系,存在可解释性、可迁移性、鲁棒性和公平性等方面的问题。 研究者开始...
2024/12/20
图解 72 个机器学习基础知识点
图解 72 个机器学习基础知识点
【AI驱动】 1. 机器学习概述 1)什么是机器学习 人工智能(Artificial intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是一个笼统而宽泛的概念,人工智能的最终目...
2024/12/20
一文解决样本不均衡(全)
一文解决样本不均衡(全)
【AI驱动】 一、样本不均衡的介绍 1.1 样本不均衡现象 样本(类别)样本不平衡(class-imbalance)指的是分类任务中不同类别的训练样例数目差别很大的情况,一般地,样本类别比例(Imbalance Ratio)(多数类vs少数类...
2024/12/20
机器学习可视化技术概览(Python)
机器学习可视化技术概览(Python)
【AI驱动】 机器学习的可视化(VIS4ML)是利用可视化技术来解释和理解机器学习模型的过程。由于数据质量极大地影响了机器模型的性能,如图1,本文从数据出发,介绍了机器学习模型输入常见的五种数据类型,并介绍了六个以数据为中心的任务应用于来自机器学习流程不...
2024/12/20
机器学习中的最优化算法(全面总结)
机器学习中的最优化算法(全面总结)
【AI驱动】 导言 对于几乎所有机器学习算法,无论是有监督学习、无监督学习,还是强化学习,最后一般都归结为求解最优化问题。因此,最优化方法在机器学习算法的推导与实现中占据中心地位。在这篇文章中,小编将对机器学习中所使用的优化算法做一个全面的总结,并...
2024/12/20
机器学习模型,全面总结!
机器学习模型,全面总结!
【AI驱动】 机器学习是一种通过让计算机自动从数据中学习规律和模式,从而完成特定任务的方法。按照模型类型,机器学习可以分为两大类:监督学习模型和无监督学习模型。 附注:除了以上两大类模型,还有半监督学习和强化学习等其他类型的机器学习模型。半监督学习...
2024/12/20
1 52 53 54 55 56 83