所有文章 > 当前分类:AI驱动
复现 Nature 图表可视化——基于模型残差分析与显著性检验的模型解释
复现 Nature 图表可视化——基于模型残差分析与显著性检验的模型解释
2025/01/06
背景 在数据科学和机器学习领域,模型的评估和结果的可视化是至关重要的环节,残差分析通过衡量预测值与真实值之间的差异,为我们提供了深入了解模型性能的关键手段,Nature文章中的b图展示了一种有效的残差可视化方式,不仅能够直观呈现预测误...
SCI图表复现:整合数据分布与相关系数的高级可视化策略
SCI图表复现:整合数据分布与相关系数的高级可视化策略
【AI驱动】 背景 有效的可视化不仅能够揭示数据的分布,还可以帮助识别不同变量之间的关系,一种流行的多变量数据可视化方法是将散点图、直方图和相关系数组合成一个综合图表,这种可视化方法,通常被称为成对图或相关网格,在探索性数据分析中尤为有用,能帮助研...
2025/01/06
树模型系列:如何通过XGBoost提取特征贡献度
树模型系列:如何通过XGBoost提取特征贡献度
【AI驱动】 背景 在机器学习的众多模型中,树模型因其易于解释、可处理多种数据类型以及强大的泛化能力,广受数据科学家的青睐,而XGBoost作为树模型家族中的一员,以其高效的并行计算和良好的预测能力,成为了回归与分类任务中的首选之一 今天这篇...
2025/01/06
SCI图表复现:优化SHAP特征贡献图展示更多模型细节
SCI图表复现:优化SHAP特征贡献图展示更多模型细节
【AI驱动】 背景 机器学习模型的可解释性需求:  随着机器学习模型在各个行业的广泛应用,尤其是在高风险领域(如金融和医疗),模型的可解释性变得越来越重要,简单来说,模型的预测过程需要能够清晰地向用户展示,以便增加信任度,特别是当决策会对人类...
2025/01/06
使用GeoJSON数据进行SHAP值地图可视化解释ML模型
使用GeoJSON数据进行SHAP值地图可视化解释ML模型
【AI驱动】 背景 随着机器学习在环境和社会经济研究中的应用越来越广泛,人们对模型的透明性和可解释性的需求也在不断增加。本文将探讨如何使用SHAP值在GeoJSON格式的地理数据上可视化和解释机器学习模型。本文所使用的数据来源于德拉瓦谷区域规划委员...
2025/01/06
深度学习二分类模型中的 SHAP 解释:深入浅出的解读与代码实践
深度学习二分类模型中的 SHAP 解释:深入浅出的解读与代码实践
【AI驱动】 背景 假设正面临一个真实业务场景:某电信公司希望预测客户是否可能流失,为了实现这个目标,可以使用客户特征信息(如服务类型、消费金额等)来预测客户是否会流失,这个问题可以被建模成一个二分类问题,即客户是否会流失 (Churn),用 0 ...
2025/01/06
基于贝叶斯优化的支持向量机(SVM)模型构建
基于贝叶斯优化的支持向量机(SVM)模型构建
【AI驱动】 背景 支持向量机(SVM)是一种监督学习算法,广泛应用于分类问题中,SVM 通过寻找最优的超平面来区分不同类别的数据,为了提升 SVM 模型的表现,超参数调优至关重要,然而,传统的超参数调优方法,如网格搜索和随机搜索,往往需要大量的计...
2025/01/06
ROC曲线深度解析:从基础二分类到多分类任务的全方位理解
ROC曲线深度解析:从基础二分类到多分类任务的全方位理解
【AI驱动】 背景 ROC曲线(Receiver Operating Characteristic curve)是一种广泛用于评价分类模型性能的工具,尤其适用于二分类问题。它通过在不同阈值下计算模型的真阳性率(True Positive Rate,...
2025/01/06
K折交叉验证结合RFE与随机森林:特征选择全过程可视化
K折交叉验证结合RFE与随机森林:特征选择全过程可视化
【AI驱动】 背景 在机器学习和数据建模中,特征选择是一个至关重要的步骤,如何从成百上千的特征中选择对模型最有效的少数特征,直接影响到模型的准确性、泛化能力以及解释性,本文的灵感来源于一项研究(见下图),该研究利用随机森林(Random Fores...
2025/01/06
贝叶斯优化在随机森林中的应用:从参数调优到性能提升
贝叶斯优化在随机森林中的应用:从参数调优到性能提升
【AI驱动】 背景 在模型训练中,超参数如树的数量、最大深度、最小样本分割比例等对随机森林的表现有很大影响。传统的网格搜索法(Grid Search)和随机搜索法(Random Search)虽然简单,但效率相对较低,贝叶斯优化则是基于概率模型,逐...
2025/01/03
复现Nature图表——基于PCA降维与模型预测概率的分类效果可视化
复现Nature图表——基于PCA降维与模型预测概率的分类效果可视化
【AI驱动】 背景 在机器学习模型的分类性能评估中,如何有效地将高维数据的分类效果直观地展示出来是一个问题,Nature Communications 的一项研究展示了一种通过结合预测概率与主成分分析(PCA)的方法来可视化模型的分类效果,这一方法...
2025/01/03
SCI图表复现:如何直观展示机器学习模型预测结果的准确性和一致性
SCI图表复现:如何直观展示机器学习模型预测结果的准确性和一致性
【AI驱动】 背景 在机器学习建模过程中,常常需要评估模型预测值与真实值之间的拟合程度,这种图表的主要作用是直观展示机器学习模型预测结果的准确性和一致性,尤其在回归任务中用来评估模型对连续变量的预测效果,以下是图表中的几个关键元素及...
2025/01/03
贝叶斯优化在XGBoost中的应用:从参数调优到性能提升
贝叶斯优化在XGBoost中的应用:从参数调优到性能提升
【AI驱动】 背景 在机器学习项目中,XGBoost被广泛应用于各类回归和分类任务,尤其因其高效的性能和优秀的预测效果而备受推崇,但在面对大量超参数时,手动调参不仅费时费力,效果也往往不尽如人意,接下来将介绍如何利用贝叶斯优化自动化地调整XGBoo...
2025/01/03
基于Optuna的机器学习超参数调优与自定义可视化分析
基于Optuna的机器学习超参数调优与自定义可视化分析
【AI驱动】 背景 在机器学习调参过程中,Optuna是一个强大的自动化超参数优化工具,它通过智能搜索算法在定义的参数空间中寻找最佳参数组合,从而提升模型性能。Optuna-dashboard虽然提供了一定的可视化功能,让用户能够观察到调参过程的变...
2025/01/03
实用机器学习技巧:带有95%置信区间的ROC曲线绘制
实用机器学习技巧:带有95%置信区间的ROC曲线绘制
【AI驱动】 背景 在机器学习模型的性能评估中,ROC曲线和AUC(曲线下面积)是常用的工具,它们能清晰展示模型的分类能力,但是一般ROC曲线展示的AUC值不会去展示置信区间,但是带有95%置信区间的ROC曲线在医学研究中非常常见,因为它能...
2025/01/03
整合数据分布+拟合线+置信区间+相关系数的皮尔逊相关可视化
整合数据分布+拟合线+置信区间+相关系数的皮尔逊相关可视化
【AI驱动】 背景 在数据分析中,探索特征之间的相关性是非常重要的一步,皮尔逊相关系数、散点图以及线性模型是最常用的三种方法,它们各具优势,通过将这三种方法整合到一个可视化图表中,可以帮助更全面地判断特征之间是否存在线性相关趋势 皮尔逊相关系...
2025/01/03
1 6 7 8 9 10 52