人工智能揭示全球包装食品中隐藏的糖含量

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

突破性的算法可以揭示食物中隐藏的糖分含量,并显示哪些国家和产品符合健康碳水化合物的标准。在全球人类平均饮食中,碳水化合物约占每日能量摄入的 70%。然而,碳水化合物质量的重要性常常被其数量所掩盖。在《营养前沿》杂志最近发表的一项研究中,一个欧洲研究小组开发了一种算法来预测包装食品中的游离糖含量,从而提供对全球范围内碳水化合物质量的见解。饮食中的碳水化合物碳水化合物是重要的能量来源,在全球...

人工智能揭示全球包装食品中隐藏的糖含量

突破性的算法可以揭示食物中隐藏的糖分含量,并显示哪些国家和产品符合健康碳水化合物的标准。

在全球人类平均饮食中,碳水化合物约占每日能量摄入的 70%。然而,碳水化合物质量的重要性常常被其数量所掩盖。在最近发表在该杂志上的一项研究中营养限制欧洲研究小组开发了一种算法来预测包装食品中的游离糖含量,从而提供对全球范围内碳水化合物质量的见解。

饮食中的碳水化合物

碳水化合物是重要的能量来源,在全球营养中发挥着至关重要的作用。虽然有关营养的讨论通常集中在碳水化合物的数量上,但碳水化合物的质量对于保持身体健康同样重要。科学证据表明,碳水化合物的质量会影响代谢功能和慢性疾病的风险。

评估碳水化合物质量的一种工具是碳水化合物质量比 (CQR),它评估食物中总碳水化合物、纤维和游离糖的平衡。该比例每 10 克总碳水化合物含有至少 1 克膳食纤维,每 1 克纤维含有不超过 2 克游离糖。这个比例有助于区分营养食品和可能导致不良健康结果的食品。

然而,准确测定包装食品中的游离糖含量仍然是一个挑战。只有少数国家要求对额外糖进行明确标签,限制了消费者和研究人员的透明度。世界卫生组织 (WHO) 定义的游离糖包括添加糖以及蜂蜜、糖浆和果汁中天然存在的糖,而 FDA 将添加糖定义为仅在加工过程中引入的糖。信息的缺乏阻碍了有效评估碳水化合物质量的努力,使得难以做出明智的饮食决定和研究碳水化合物消耗对健康的影响。

关于该研究

该算法优先考虑标签上首先列出的成分,因为食品制造商通常按重量订购成分,从而提供有关产品成分中糖的主导地位的线索。

在本研究中,研究人员开发了一种算法来预测全球包装食品中的游离糖,解决了碳水化合物质量方面的关键知识空白。他们使用了英敏特全球新产品数据库 (GNPD) 的数据,该数据库包含来自 86 个国家的包装食品的大量信息,包括营养成分和成分列表。

在分析之前,团队仔细清理和标准化数据以确保一致性。一个关键步骤涉及使用正则表达式手动管理和标记成分,将其分类为添加糖或天然存在的糖 - 这一区别对于准确估计游离糖含量至关重要。

为了构建预测模型,研究人员使用了机器学习技术。他们使用来自美国 (US) 的数据训练模型,并在 14 个选定国家/地区正式测试其性能,同时将模型应用于另外 81 个国家/地区的产品。这些模型分析了产品标签,考虑了前六种成分(添加糖、水果或乳制品),以及详细的营养信息,如能量含量、脂肪、碳水化合物、纤维、蛋白质、糖和钠。

该管道包括三个二元分类器来检测是否存在额外的糖,以及基于树的堆叠回归模型来估计其数量。此外,预测的添加糖水平被用作游离糖的估计值,但某些食品类别(例如果汁饮料和糖果)除外,由于其独特的糖成分,直接使用总糖。

最后,将模型应用于没有明确额外糖解释的产品来预测碳水化合物成分。使用预定义的 10:1 至 1:2 比例的碳水化合物、纤维和游离糖来评估碳水化合物质量。

主要发现

植物性牛奶替代品(例如燕麦或杏仁饮料)表现出令人惊讶的高度符合碳水化合物质量标准,优于全球许多乳制品。

研究发现,机器学习模型在预测包装食品中的游离糖含量方面表现出很高的准确性。测试集的平均绝对误差经计算为 0.96 g/100 g,表明预测值和声明值之间的平均差异相对较小。

此外,该模型在预测值和声明值之间实现了 0.98 的高 R²,优于先前模型(例如 K 最近邻)的错误率更高的模型,证实了预测的可靠性。值得注意的是,该模型的预测能力并不局限于美国。研究人员发现,该模型在 14 个国家正式测试时表现准确,并在另外 81 个国家应用,凸显了其全球适用性。

该研究还调查了符合目标碳水化合物质量比的食品比例,并显示食品和食品国家之间存在显着差异。在美国,达到碳水化合物质量比的产品差异很大,从相对较高的热麦片 60% 到风味牛奶和麦芽饮料 0%。即使在一个国家,这种广泛的范围也证明了碳水化合物质量的多样性。

巧克力味产品(如麦片或零食棒)是最严重的问题之一,95% 的产品由于游离糖过多和纤维含量低而未能达到目标比例。

纵观所有食品类别,达到目标比例的产品百分比从英国的 67%(代表质量标准的合规水平相对较高)到马来西亚的 9.8%(表明满足所需碳水化合物质量的产品比例明显较低)。

值得注意的是,与大多数饮料类别不同,植物基饮料由于其较高的纤维含量和较低的糖含量,在各国对碳水化合物质量比率的遵守相对较高。

然而,研究人员承认,对特定国家的预测准确性可能在一定程度上受到样本量较小的限制,这可能会影响结果对这些特定地区的普遍适用性。

此外,作者还进行了 Z 检验,比较了美国 18 种食品类别的预测和公布的游离糖水平,发现了统计上的显着差异,证实了模型的稳健性。

文凭

总之,该研究成功开发并验证了一种基于机器学习的方法,用于使用大型全球数据库预测包装食品中的游离糖含量。这种完全自动化且可扩展的方法在不同国家和食品类别中表现出很强的准确性,并且可以扩展到需要游离糖估计的其他数据库和营养指标。

预测的游离糖水平还可以改善营养分析系统,例如 Nutri-Score,由于标签要求有限,该系统目前依赖于总糖。

这种创新的方法为监测和评估全球食品供应中的碳水化合物质量提供了宝贵且强大的工具,并为公共卫生和营养建议举措提供了重要见解。


资料来源:

Journal reference: