> 文章列表 > 在废水中可以找到精确的见解

在废水中可以找到精确的见解

在废水中可以找到精确的见解

今年早些时候,圣路易斯华盛顿大学Fangqiong Ling实验室的研究表明,废水系统中SARS-CoV-2的数量与其所服务地区的疾病负担(COVID-19)相关。

但在完成这项工作之前,Ling需要知道:如何确定随机废水样本中代表的个体数量?

与一位同事的偶然相遇帮助麦凯维工程学院能源、环境和化学工程系助理教授Ling开发了一种机器学习模型,该模型使用废水中发现的各种微生物来梳理出他们代表多少人。展望未来,这种方法可能能够将废水中的其他属性与个人层面的数据联系起来。

该研究发表在PLOS Computational Biology杂志上。

问题很简单:“如果你只拿一勺废水,你不知道你测量了多少人,”Ling说。这与研究通常的设计方式背道而驰。

“通常当你设计你的实验时,你设计你的样本量,你知道你正在测量多少人,”Ling说。在寻找SARS-CoV-2与COVID患者人数之间的相关性之前,她必须弄清楚她正在测试的水中有多少人。

最初,Ling认为机器学习可能能够揭示微生物多样性与其所代表的人数之间的直接关系。尽管如此,使用“现成”机器学习完成的模拟并没有成功。

然后,Ling偶然遇到了艺术与科学数学和统计学助理教授Likai Chen。两人意识到他们对处理新颖、复杂的数据有着共同的兴趣。Ling提到她正在做一个项目,陈也许可以做出贡献。

“她和我分享了这个问题,我说,这确实是我们可以做的事情,”陈说。陈正在研究一个问题,这个问题使用了Ling也发现有用的技术。

梳理出样本中有多少人代表的关键与以下事实有关:样本越大,它就越有可能与平均值或平均值相似。但实际上,个人往往并不完全是“平均”。因此,如果样本看起来像普通的微生物群样本,它很可能由许多人组成。离平均值越远,就越有可能代表个人。

“但现在我们正在处理高维数据,对吧?”“陈斌说。有近乎无穷无尽的方法可以将这些不同的微生物分组以形成样品。“所以这意味着我们必须找出我们如何在不同地点汇总这些信息?”

利用这种基本的直觉和大量的数学知识,Chen与Ling合作开发了一种更量身定制的机器学习算法,如果对来自1,100多人的真实微生物群样本进行训练,可以确定废水样本中有多少人(这些样本与训练数据无关)。

“它的速度要快得多,并且可以在笔记本电脑上进行训练,”Ling说。它不仅对微生物组有用,而且,通过足够的例子 - 训练数据 - 这种算法可以使用来自人类病毒组或代谢化学物质的病毒将个体与废水样本联系起来。

“这种方法被用来测试我们测量人口规模的能力,”Ling说。但它走得更远。“现在我们正在开发一个框架,允许跨研究进行验证。

民族服饰网