人工智能揭示人生奥秘:预测生死与个性差异

发表时间: 2023-12-20 07:08


社会科学家对人类生活是否能被预测的问题看法不一。虽然我们对在人类生活中起到重要作用的社会人口学因素已有充分了解,但却一直无法对生命结局进行准确预测


Transformer方法正在彻底改变计算机处理人类语言的方式。利用人类生活(被视为事件序列)和自然语言句子之间的结构相似性,一种名为life2vec的Transformer方法被用来创建人类生活的丰富向量表示,并从中可以做出准确的预测。


2023年12月18日,Nature 子刊 Nature Computational Science 上发表了题为:Using sequences of life-events to predict human lives 的研究论文。

该研究描述了一个Transformer方法,该方法或能从不同方面准确预测人类生活,包括早死可能性和个性的细微差异。该模型或能提供对人类行为的量化认知,允许研究人员发现影响生活结果的潜在机制以及个性化干预的相关可能性。



在这项研究中,研究团队利用丹麦一个国家登记处上约600万人的教育、健康、收入、职业和其他生活事件数据,设计了一个机器学习方法,来构建个体的人类生活轨迹。


研究团队通过调整语言处理技术,用类似模型中语言的方式表示人类生活。他们的这种方法能以类似语言模型捕捉词语间复杂关系的方式生成一个生活事件的术语表。他们提出的模型名为life2vec能确定健康相关诊断、居住地、收入水平等概念之间的复杂关系,并用一个压缩向量表示来编码个人生活,以此作为预测生活结局的基础


life2vec模型的个体级数据表示示意图


该研究证明,该模型预测早死率(具体而言是年龄组35-65岁的个体自2016年1月1日起存活4年的概率)捕捉细微个性差异的能力超过了当下先进的模型和基线标准,表现至少提升11%。


life2vec模型在死亡率预测任务上的表现

将life2vec模型应用于生命序列,能够捕捉到细微个性差异


研究结果表明,通过表征社会结局和健康结局之间的复杂关联,准确预测生活结局也许是可以做到的。但作者也强调,他们的研究只是对可能性的探索,而且只应在确保个人权利受到保护的监管下才可用于现实世界。


论文链接

https://www.nature.com/articles/s43588-023-00573-5