国内或国外 期刊或论文

您当前的位置:发表学术论文网医学论文》 基于居民健康大数据的肥胖与常见慢病关联规则分析> 正文

基于居民健康大数据的肥胖与常见慢病关联规则分析

所属分类:医学论文 阅读次 时间:2020-10-27 10:00

本文摘要:摘 要 目的 探讨肥胖程度与常见慢性病之间的关联关系,为常见慢病的预防和管理提供大数据 支撑。 方法 基于社区公共卫生系统数据集,通过使用 Apriori 关联规则算法挖掘高血压、冠心

  摘 要 目的 探讨肥胖程度与常见慢性病之间的关联关系,为常见慢病的预防和管理提供大数据 支撑。 方法 基于社区公共卫生系统数据集,通过使用 Apriori 关联规则算法挖掘高血压、冠心病、糖尿病 这 3 种常见慢病与肥胖程度(超重或肥胖)之间的关联关系,并根据关联规则的支持度、置信度和提升 度评价肥胖程度对发生常见慢病的影响。 结果 共对 196 554 名居民的健康数据进行分析,高血压的患 病率(48􀆰 6%)明显高于冠心病(22􀆰 9%)和糖尿病(20􀆰 3%) ,51􀆰 0%的人至少患有其中一种慢病,10􀆰 6% 的人同时患有该 3 种慢病。 关联规则分析结果显示,超重与高血压、冠心病之间均有强关联性,肥胖与 高血压之间也有强关联性,而糖尿病与体型因素的关联性较弱。 3 种慢病之间均有强关联性,饮食嗜好 与这 3 种慢病都有关联,老年人常常伴随发生高血压、糖尿病与冠心病。 结论 超重和肥胖会增加高血 压、冠心病和糖尿病的发生风险,因此,为尽可能减少这些慢病的发生,健康人群要关注自身的肥胖情 况,特别是老年人、有饮食偏好的人以及女性。

  关键词 高血压;冠心病;糖尿病;肥胖;关联规则挖掘

中国慢性病预防与控制

  0 引言

  我国居民常见的慢性疾病,如冠心病、高血压、 糖尿病,逐渐呈现发病率上升、发病年龄降低的趋 势。 这些疾病通常病程长且难以治愈,而且会导致 其他疾病的发生或加重[1] 。 而我国医疗卫生系统 目前仍存在人员配置不足、资源分布不均等问题,难 以满足快速增长的慢性病防治需求,因此预防慢性 病的发生成为重中之重。

  有研究[2-4] 表明,多项慢 性病相关危险因素的联合作用会增加心血管疾病、 糖尿病肾病和癌症等的发生及死亡风险,所以发现 慢病的潜在危险因素十分必要。 研究发现,慢性病 通常以慢性共患病的形式出现。 因此通过分析常见 慢性病之间的关联性,制定有效的综合防治措施,有 助于改善慢性病防治效果[5-6] 。

  随着社会经济的快速发展和人们生活方式的 改变,一些不良生活习惯或不良工作环境及其造 成的身体负担加速了各种慢性病的扩大化和普遍 化。 根 据 《 中 国 居 民 营 养 与 慢 性 病 状 况 报 告 (2015) 》的阐述,吸烟、过量饮酒、身体活动不足和 不健康饮食已成为我国成人居民慢性病发生、发 展的主要行为危险因素[ 7] 。

  此外,我国成人的肥 胖率已达 11􀆰 9%[ 7] ,越来越多的研究[ 8-12] 开始涉 及体型与这些慢病发生的关系及其对人体健康的 影响。 有研究显示[ 13] ,老年人肥胖者和超重者慢 性病的发病率高于体重正常者,且肥胖者比超重 者慢性病的发病率更高。 但其研究使用的人口样 本小,且仅统计了患病概率而未研究肥胖程度与 慢性病的关联性强弱。 据此,本研究利用北京市某社区居民健康数据 系统集,对高血压、冠心病和糖尿病的潜在影响因素,特别是肥胖程度进行关联规则挖掘与分析,找出 危险因素之间的关联性和关联强度,从而为这 3 种 慢性病的针对性筛查和防治提供有效的建议,以减 少慢性病的发生。

  1  材料和方法

  1􀆰 1  数据来源与数据筛选

  数据来源于北京市某社区公共卫生系统数据 集,其中包含有人口学数据,如性别、年龄、工作情况 等;家族史、本人慢性病患病情况,如高血压、糖尿 病、冠心病、脑卒中等;生活习惯,如吸烟、饮酒、锻 炼、饮食嗜好等,共计 101 个指标。 本研究提取性 别、年龄、身高、体重、是否患高血压、是否患糖尿病、 是否患冠心病、是否患脑卒中、是否患其他慢病、是 否药物过敏、父母有无高血压、父母有无糖尿病、有 无兄弟姐妹病史、有无子女病史、吸烟、饮酒、锻炼、 饮食嗜好共 18 个主要指标进行分析。

  根据身高和体重计算体重指数 BMI,参考世界 卫生组织的标准,以 BMI<18􀆰 5 kg / m2 定义为偏瘦, 18􀆰 5 kg / m2≤BMI< 24 kg / m2 定义为正常,24 kg / m2 ≤BMI<28 kg / m2 定义为超重,BMI≥28 kg / m2 定义 为肥胖。 将年龄大于 60 岁定义为老年,将饮食嗜好 的指标细分为是否偏咸、是否偏甜、是否偏油、是否 偏烫、是否吃素、是否吃辣共 6 项指标。

  1􀆰 2  数据挖掘与关联规则

  数据挖掘技术是一种通过各种工具与手段将未 知的、大量的、有潜在实用价值的数据自动地、智能 地转化为对人们有使用意义的信息、知识的技术,它 是数据库快速发展和智能化的产物。 数据挖掘技术 能够帮助技术人员从大量的数据库文件数据或其他 信息文件数据中发现并提取出人们感兴趣的信息与知识,而基于关联规则的数据挖掘则是一种有效的 数据挖掘方法[14-15] 。

  关联规则挖掘的数据处理算法从庞大而冗杂的 数据项集中获取各个数据对象之间不同程度上的关 联性,而从这些关联性组合中可以预见到数据项之 间的依赖性,因此,根据这些关联性的组合可以从其 中一些数据对象的信息推测一些未来的适用于大多 数情况的数据信息和知识。 在关联规则挖掘方法 中,有如下一些重要定义[16] 。

  项集支持度是指数据项集在数据库的所有记录 中出现的频率。 Support(X) = Num(X) ÷ N (1)     式中:X 表示数据项集;Num (X)表示项集 X 在 数据库中出现的次数;N 表示数据库的总记录次数。 对于数据库中的某一条记录,若其同时具有特 征属性 X 与特征属性 Y,则称 X 和 Y 是关联的,即构 成一条关联规则 X→Y。 关联规则 X→Y 的支持度 计算: Support(X → Y) = P(XY) (2)     即在样本数据中 X、Y 同时发生的频率。 关联 规则 X→Y 的置信度计算: Confidence(X → Y) = P(Y | X) (3)     即在样本数据中 X 发生的前提下,Y 发生的频 率。

  关联规则 X→Y 的提升度计算: Lift(X → Y) = P(Y | X) ÷ P(Y) (4)     即在样本数据中两种情况下频率的比值。 关联 规则挖掘算法中较为典型是 Apriori 算法,它的核心 思想是在确定支持度和置信度以及给定数据库的前 提下,通过扫描数据库中的数据记录,从而挖掘出其 中满足最小支持度阈值和最小置信度阈值的关联规 则组合。 本研究采用 Python 软件对社区居民数据集进 行分析, 将最小支持度、 最小置信度分别设置为 0􀆰 01 和 0􀆰 05,得出该数据集的强关联规则。 为了更 为直 观 地 表 示 关 联 关 系, 采 用 R3􀆰 6􀆰 1 软 件 ( https: / / cran􀆰 r⁃project􀆰 org / )进行可视化。

  2  结果

  原始数据集经过清理和筛选后共确定 196 554 条居民记录、101 个指标,其中老年人占半数以上。 在所有记录中,100 211 人(51􀆰 0%) 至少患有高血 压、冠心病或糖尿病之一,其中 95 473 人(48􀆰 6%)患高血压,44 996 人( 22􀆰 9%) 患冠心病,39 936 人 (20􀆰 3%)患糖尿病,20 893 人( 10􀆰 6%)同时患有这 3 种慢病。 从性别和年龄看,女性高血压、冠心病、 糖尿病的发生率( 50􀆰 4%、24􀆰 7%及 21􀆰 0%)均略高 于男性(46􀆰 4%、20􀆰 8%及 19􀆰 6%) ,老年人患病概率 高于非老年人(表 1) 。

  2􀆰 1  肥胖程度与高血压的关联规则

  列出部分单一先导或另包含肥胖程度的关 联规则(支持度≥4%、提升度≥1􀆰 2) 。 在社区居民中超重人群高血压的发生率达 56􀆰 1%, 71􀆰 9%的肥胖者患有高血压,冠心病、糖尿病及其他 慢性病患者合并高血压的情况非常突出。 超重或肥 胖使老年人、有饮食嗜好的人患高血压的风险明显 提高(老年人:从 67􀆰 0%提高到 68􀆰 9%和 82􀆰 0%,有 饮食嗜好:从 60􀆰 2%提高到 69􀆰 1%和 78􀆰 8%) ,提示 老年人、有饮食偏好的人更应注意控制体型,降低高 血压的发病风险。

  2􀆰 2  肥胖程度与冠心病的关联规则

  列出包含有一个或两个先导的部分关联规 则(提升度≥1􀆰 0) 。 结果显示,在社区居民中超重 者冠心病的发生率达 26􀆰 2%,32􀆰 8%的肥胖者患有 冠心病,高血压、糖尿病及其他慢性病患者合并冠心 病的发生率高于其他状态的人群;超重或肥胖使老 年人、有饮食嗜好的人、女性患冠心病的风险有所提 高(老年人:从 34􀆰 4%提高到 35􀆰 1%和 41􀆰 5%,有饮食嗜好:从 31􀆰 5%提高到 35􀆰 7%和 40􀆰 9%,女性:从 24􀆰 7%提高到 29􀆰 8%和 37􀆰 6%) ,提示老年人、有饮 食偏好的人、女性更应注意控制体型,降低冠心病的 发病风险。

  2􀆰 3  肥胖程度与糖尿病的关联规则

  列出部分与糖尿病有关的关联规则(提升 度≥1􀆰 0) 。 结果显示,在社区居民中超重者糖尿病 的发生率达 24􀆰 1%,30􀆰 2%的肥胖者患有糖尿病,冠 心病、高血压及其他慢性病患者合并糖尿病较其他 情况人群更普遍;超重或肥胖使老年人、有饮食嗜好 的人、女性患糖尿病的风险有所提高(老年人:从 28􀆰 7%提 高 到 30􀆰 4% 和 35􀆰 3%, 有 饮 食 嗜 好: 从 25􀆰 5%提高到 30􀆰 2%和 33􀆰 9%,女性:从 21􀆰 0%提高 到 26􀆰 3% 和 32􀆰 8%) ,提示老年人、有饮食偏好的 人、女性更应注意控制体型, 降低糖尿病的发病风险。

  2􀆰 4  高血压、冠心病、糖尿病的共同影响因素

  体型因素及其他 单一先导影响因素的规则可视化结果。可见超重和肥胖均与高血压、冠心病之间有较强的关联性,而糖尿病与肥胖程度的关联性较弱。老年、 饮食嗜好、女性与三种慢病都有关联,当这些因素和超重、肥胖共同作用时,置信度和提升度都有显著提高。

  医学论文投稿刊物:《中国慢性病预防与控制》报道内容涉及慢性病预防与控制的战略重点、战略布局、战略目标和对策研究;各种慢性病的危险因素研究、发病机制的基础实验研究、临床救治方法研究及救治经验;健康管理疾病管理的方法、效果评价方法的研究以及成本、效益分析;慢性病防治与社区卫生服务相结合研究及其实践经验;国内外慢性病预防与控制的进展和动态等。

  3  讨论与结论

  本研究利用近 20 万名社区居民健康大数据,采用机器学习中的关联规则技术,分析了高血压、冠心 病、糖尿病这 3 种常见慢性病之间以及与肥胖程度及其他人口学因素、生活习惯等的关联性,展示了它们之间相互作用的强度。 从关联规则得出的结果可 见,本研究涉及的 3 种慢性病相互之间且与体型等 因素之间均具有关联性,其关联性的强弱不等。

  关联规则可视化结果显示,超重→高血压、超重→冠心 病、肥胖→高血压、肥胖→冠心病等均有较高的置信 度和提升度,高血压、冠心病、糖尿病相互之间具有 关联性并且有较高的置信度和提升度,可见这 3 种 慢性病不仅在人群中患病率高,常常伴随发病,而且 这 3 种慢性病之间以及各自与其他疾病之间也存在 着很广泛的关联,这与其他研究的结果一致[17-18] 。

  从两个先导的关联规则中可以得出,冠心病患者超 重的情况下超重增加了高血压的患病可能性,而当 高血压患者同时超重时超重会增加糖尿病的患病可 能性。 提示体型管理在高血压、冠心病等慢性病防 治领域有重要作用,相对而言,肥胖与超重体型在慢 性病的防治中尤为重要。

  本研究的数据分析结果显示,女性高血压、冠心 病、糖尿病的发生率均略高于男性,从国外相关研究 结果也提示了男性情况与女性情况的差异,如 Park 等[19]主题为韩国慢性病相关危险因素分析的研究 中,其监测数据显示:肥胖、吸烟并且不吃早餐的女 性出现睡眠不适的概率会更大,与慢性病有关联性。 提示可以从更多方面和多角度的因素去分析由于性 别差异造成慢性病产生的原因和防治方法。 在年龄 方面,老年患者高血压、冠心病、糖尿病的发生率均 高于非老年患者。

  老年患者由于身体机能下降,新 陈代谢缓慢,抵抗力下降,更易于暴露在危险因素 下,而其身体屏障难以防御,各种疾病的发生率相较 青年而言都会有显著提升,提示医疗工作者需要对 老年患者给予更多关心和爱护,定期提供体检服务, 更好地预防和及早发现疾病发生。 提倡老年人进行 适当的身体锻炼和拥有更健康的生活方式(如戒 烟[20]和改掉不良饮食嗜好) ,改善个人的身体机能, 从根本上预防与控制慢性病。 以上通过对高血压、冠心病、糖尿病患者以体型 因素为主的关联规则分析,提示患者和临床医生在 慢性病的初期就应做好与其存在关联性的疾病和危 险因素的筛查和预防工作,以免共患病和加重病情。 本文研究结果中所显示的一些疾病和危险因素的关 联性,使得相关疾病的预防更有针对性, 也更有效率。

  参考文献

  [ 1 ]  陈大方. 慢性非传染性疾病分子流行病学研究现状与展望 [ J]. 中国慢性病预防与控制, 2016, 24(2) :81-83.

  [ 2 ]  Koroukian SM, Warner DF, Owusu C, et al. Multimorbidity redefined:prospective health outcomes and the cumulative effect of cooccurring conditions[ J]. Preventing Chronic Disease, 2015, 12:E55.

  [ 3 ]  Dunkler D, Kohl M, Teo KK, et al. Population⁃attributable fractions of modifiable lifestyle factors for CKD and mortality in individuals with type 2 diabetes: a cohort study [ J ]. American Journal of Kidney Diseases, 2016, 68(1) :29-40.

  [ 4 ]  Bahler C, Huber CA, Brüngger B, et al. Multimorbidity, health care utilization and costs in an elderly community⁃dwelling population: a claims data based observational study [ J ]. BMC Health Services Research, 2015, 15(1) :23.

  作者: 陈晨1 王妮2 黄艳群2 周阳1 李盛俊1 陈卉2

转载请注明来自发表学术论文网:http://www.fbxslw.com/yxlw/24615.html