南加州大学:人工智能如何帮助 2 位南加州大学环境科学家解开自然世界的奥秘

机器学习是一种非常特殊的人工智能形式。通过旨在从经验中学习的算法,机器学习(也称为 ML)随着时间的推移随着更多数据的添加而适应并提高效率。ML 驱动的程序从错误中“学习”,这样做可以将分析海量数据所需的时间从几年缩短到几分钟。

两位最近聘用的南加州大学教员Melissa Guzman和Sam Silva已经因使用机器学习来洞察看似不可知的自然世界背后的模式而受到关注。古兹曼正在寻找蜜蜂迁徙模式的趋势,在我们最重要的传粉媒介中,以及它们的社区构成。席尔瓦正在研究云的化学成分。最近获得南加州大学箭牌环境研究所教师创新奖的获奖者都在利用他们的专业知识来开发应对环境挑战的解决方案。

Melissa Guzman 和 Sam Silva 正在使用机器学习来洞察自然世界背后的模式。(照片/由 Melissa Guzman 和 Sam Silva 提供)“博士。古兹曼和席尔瓦博士正在使用令人兴奋的新计算工具来解决复杂的环境问题,”箭牌研究所研究和参与副主任杰西卡·达顿 ( Jessica Dutton ) 说。“他们的计划不仅准备产生有关气候和生物多样性的新科学知识,而且还为决策者提供关于变化世界中趋势和可能解决方案的新见解。

气候变化扰乱蜜蜂的迁徙模式和群落形成:人工智能和科学如何提供帮助

加利福尼亚是整个北美最多样化和最大的蜜蜂种群的家园。在美国发现的 4,000 种蜜蜂中,该州可以找到 1,600 种。它们也是自然界最活跃的传粉者之一——从你的后院花园到主要的农业经营,一切都在某种程度上取决于它们在生态系统中的作用。

然而,随着它们的数量在过去十年中下降,识别和保护安全和可持续的蜜蜂保护区变得越来越重要。但是您如何找到它们最有可能蓬勃发展的地方呢?南加州大学多恩西夫文理学院生物科学 Gabilan 助理教授 Guzman 表示,这是一个比你想象的更大的挑战。

“要弄清楚昆虫发生了什么,最困难的事情之一是我们在几个地方有几个物种的非常好的数据,”古兹曼说。“研究人员将前往同一个地方并计算不同昆虫的总数,这让您了解种群如何随时间波动。但这些数据非常罕见。我试图用我的研究做的是通过空间科学方法来填补空白。”

使用博物馆记录、社区科学应用程序和来自多样性调查的数据,古兹曼确定了分布模式和社区构成的趋势。她说,即使有这些资源,数据也不是很好——通常是有偏见的,而且在地理上很集中。这导致数据聚集在城市周围和靠近道路的地方,但不在更偏远的地方。

我们在大黄蜂的案例中发现的一件事是,并非每个物种都在衰退

梅丽莎古兹曼,南加州大学多恩西夫分校进入机器学习。Guzman 利用这些工具来加快数据清理过程。数据库经常可能包含错误或不完整的信息,不正确的物种名称、日期和地点会破坏研究。通过引入专家来分析和纠正数据,研究人员可以获取这些知识,将其应用于数据集,并允许机器学习工具隔离和纠正不正确的数据点。

“大黄蜂是一种非常不同的蜜蜂——它们大、挑剔、毛茸茸——它们通常更喜欢温带地区。我们发现的一件事是,上个世纪的温度变化似乎可以解释为什么有些物种正在减少,”古兹曼说。“我们希望利用生活史特征来了解哪些物种从气候变化等因素中受益最多,哪些物种受到的阻碍最大。我们在大黄蜂的案例中发现的一件事是,并非每个物种都在衰退。”

人工智能和科学:高级计算为更准确、更快的气候模型铺平了道路

如果出于所有错误的原因,洛杉矶的空气是传奇的。对于南加州大学多恩西夫学院地球科学助理教授席尔瓦来说,这非常适合他的研究:分析大气的化学成分。

“云和地球大气的化学成分几乎在空气质量和气候变化的各个方面都很重要,”同时也是南加州大学维特比工程学院土木与环境工程系成员的席尔瓦说。“就空气质量而言,我们正在研究空气中不利于我们呼吸的化学成分。同时,气候变化的部分原因是进入系统的化合物数量与离开系统的化合物数量之间的不平衡——这就是导致变暖的原因。

“由于很多原因,我们对所有这些过程的理解并不完美:要么我们没有足够的数据,要么我们根本不知道,要么我们可能有一个好主意,但是当我们将其输入计算机模型时永远运行代码。我们利用机器学习来帮助我们筛选我们拥有的数据——有时是大量部分相关的数据——并弄清楚发生了什么。”

席尔瓦将云描述为“我们对物理气候的理解中最大的不确定性”,因为它们复杂地混合了物理(风速和风向)和化学(各种分子在大气中混合)。了解它们的行为很重要,因为它们在将阳光反射回太空和全球水文循环中所起的作用。正确测量它们的位置、亮度和持续时间对于正确理解和预测它们的行为至关重要。

席尔瓦说,目前的气候模型可以为云的形成方式提供非常详细的解释,但实际的模拟“需要数年时间才能完成”。这部分是由于参数化,这是科学家用来在数学上近似这些现象的影响的过程。但是,参数化在效率方面具有优势,但缺乏准确性。Silva 表示,利用机器学习将保持参数化提供的速度,而不会牺牲准确性。

我们希望能够更好、更快地进行气候预测,同时还能识别有趣的数据以潜在地激发未来的研究。

山姆席尔瓦,南加州大学多恩西夫分校“我们认为参数化的局限性可能是云和气候模型如此不确定的原因之一,”他补充说。“我们将在这个项目中做的是使用机器学习技术来加速这个非常缓慢的过程,让我们从模型中获得极高的准确性,而无需相关的计算成本。我们希望能够更好、更快地进行气候预测,同时还能识别有趣的数据以潜在地激发未来的研究。

不幸的是,随着其他城市的情况开始模仿南加州的情况,他在洛杉矶学到的东西将具有更大的相关性。

“洛杉矶在很多方面与其他城市相似。大多数城市人口众多,汽车很多,而且它们不是超级适合步行的,”他说。“我们在洛杉矶学到的化学反应可以转移到许多其他地方。这里发生的事情与人类健康和空气质量有关。

“这不是一个只影响像中国或印度这样的地方的人们的问题,我们通常认为这些地方的空气质量很差——这也是这里的一个问题。”

快速申请