数据分享|spss modeler用贝叶斯网络分析糯稻品种影响因素数据可视化

发布时间 2023-11-18 23:19:46作者: 拓端tecdat

全文链接:https://tecdat.cn/?p=34271

原文出处:拓端数据部落公众号

在农业科学领域,对糯稻品种的研究一直备受关注。糯稻作为一种重要的粮食作物,其产量和质量均对农业生产具有深远的影响。然而,影响糯稻品种的因素是多元化的,理解这些因素之间的关系以及如何通过数据可视化来呈现这些关系,是提高糯稻生产的关键。本文将帮助客户探讨使用SPSS Modeler软件结合贝叶斯网络分析方法,对糯稻品种影响因素的数据进行可视化分析。

本文的目的是通过使用SPSS Modeler中的贝叶斯网络分析,对糯稻品种影响因素的数据进行可视化,以便更好地理解各因素之间的关系以及其对糯稻品种的影响。我们希望通过这种方法能够提供更深入的见解,以支持糯稻生产的决策制定。

贝叶斯网络和SPSS Modeler概述

贝叶斯网络是一种概率图模型,它利用节点间的依赖关系来表达变量之间的概率关系。贝叶斯网络由两部分组成:有向无环图(DAG)和条件概率表(CPT)。其中,DAG描述了各变量之间的依赖关系,CPT描述了每个变量的条件概率分布。

SPSS Modeler是一个强大的数据挖掘工具,它提供了一系列的高级分析技术,包括贝叶斯网络。在SPSS Modeler中,通过构建贝叶斯网络模型,我们可以对数据进行全面的分析,并利用数据可视化工具直观地呈现结果。

数据收集和处理过程

本文所使用的数据来自某地区的糯稻种植基地。数据包括环境因素(如气候、土壤等)、品种信息和产量等。

使用SPSS Modeler进行贝叶斯网络建模

在SPSS Modeler中,我们可以使用以下步骤进行贝叶斯网络建模:

  1. 导入数据:将处理后的数据导入SPSS Modeler中。
  2. 创建贝叶斯网络模型:在SPSS Modeler中创建一个新的贝叶斯网络模型。
  3. 定义节点:在模型中定义各个节点,包括环境因素、品种信息和产量等。
  4. 构建依赖关系图:根据数据中的依赖关系,构建各节点之间的有向无环图(DAG)。
  5. 估计参数:使用贝叶斯方法估计模型中的参数,包括条件概率表(CPT)中的参数。
  6. 进行推理:根据建立的模型进行推理,以分析各因素对糯稻品种的影响。
  7. 可视化结果:将推理结果进行可视化处理,生成各因素与糯稻品种之间的关系图。

变量重要性

变量重要性是指特征对目标变量的影响程度,即在模型中特征的重要性程度。

image.png

依赖关系图

从结果来看,品种和各个因素有着重要联系,同时海拔和其他因子之间存在联系。

image.png

image.png

l  通过条件概率可以看到不同因子中不同品种的概率变化

各个节点的概率变化

image.png

image.png

image.png

image.png

image.png

image.png

image.png

l  各影响因子的 关联度 。

因子(节点)的关联度 离散化分段 Importance
0.4975   糯稻品种数
0.9466 0 : <= 28.4 1 : 28.4 ~ 56.8 2 : 56.8 ~ 85.2 3 : 85.2 ~ 113.6 4 : > 113.6 祭祀
0.3356 0 : <= 9.467 1 : 9.467 ~ 18.933 2 : 18.933 ~ 33.133 3 : > 33.133 轮种
0.4142 0 : <= 9.267 1 : 9.267 ~ 17.533 2 : 17.533 ~ 25.8 3 : 25.8 ~ 34.067 4 : > 34.067 混种
0.8144 0 : <= 9.8 1 : 9.8 ~ 24.5 2 : 24.5 ~ 39.2 3 : > 39.2 留种
0.6932 0 : <= 5.667 1 : 5.667 ~ 11.333 2 : 11.333 ~ 19.833 3 : > 19.833 交换
0.0722 0 : <= 10 1 : 10 ~ 20 2 : 20 ~ 35 3 : > 35 饮食
0.5875 0 : <= 9.6 1 : 9.6 ~ 24 2 : 24 ~ 38.4 3 : > 38.4 节日
0.5012 0 : <= 8.3 1 : 8.3 ~ 16.6 2 : > 16.6 社会交往
0.202 0 : <= 10.4 1 : 10.4 ~ 20.8 2 : 20.8 ~ 31.2 3 : 31.2 ~ 41.6 4 : > 41.6 人类礼仪
0.5012 0 : <= 13.5 1 : 13.5 ~ 31.5 2 : > 31.5 海拔

l  预测变量重要性  这将显示一个图表,以指示在估计模型时所使用的各个预测变量的相对重要性。

l  给出各影响因子的重要性 ( 用图排序表示)

image.png

Nodes Importance V4
祭祀Bins 0.0961 祭祀
轮种Bins 0.0962 轮种
混种Bins 0.0963 混种
留种Bins 0.0964 留种
交换Bins 0.0965 交换
饮食Bins 0.0966 饮食
节日Bins 0.0967 节日
社会交往Bins 0.0968 社会交往
人类礼仪Bins 0.0969 人类礼仪
海拔Bins 0.1291 海拔

最终我们得到了下面的结果文件:

image.png


GettyImages-1030840184-BT.jpg 最受欢迎的见解

1.matlab使用贝叶斯优化的深度学习

2.matlab贝叶斯隐马尔可夫hmm模型实现

3.R语言Gibbs抽样的贝叶斯简单线性回归仿真

4.R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归

5.R语言中的Stan概率编程MCMC采样的贝叶斯模型

6.R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数

7.R语言使用贝叶斯 层次模型进行空间数据分析

8.R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型

9.matlab贝叶斯隐马尔可夫hmm模型实现