本文作者Robert F. Service,是俄勒冈州波特兰的科学新闻记者,涉及化学,材料科学和能源故事,由雷锋网AI科技评论编译。

辨识颜色是件容易的事情:只要光的波长为510纳米,大多数人就会说它是绿色。然而,要想根据一个特定的分子特征辨识出对应的味道,那是非常困难的。现在这个难题有新的解决方案了。雷锋网(公众号:雷锋网)了解到,22个计算机科学家团队公布了一套算法,能够根据不同分子的化学结构来辨识不同气味。这些方案可以发挥什么作用仍有待观察。但是有一种可能,这些的算法可以帮助香味商和食品生产者设计新型的气味剂,而且可以量身定制某种味道。

嗅觉研究员Leslie Vosshall与纽约洛克菲勒大学的同事在最近的一项研究中,让49名志愿者评价了476小瓶纯气味剂。志愿者用19个标签对每一瓶气味剂打标评价,包括“鱼”、“大蒜”、“甜”或“烧焦”等。他们还评定每个气味剂带来的愉悦感及强烈度,总共收集超过100万个数据点,构建了关于这些气味分子的海量数据库。

两年前,计算生物学家Pablo Meyer在洛克菲勒大学学习时,他发现计算机科学家可以用这套数据集来研究人类评价气味的机制。除了在纽约约克敦海茨的IBM Thomas J. Watson研究中心工作之外,Meyer还主导了一个名为DREAM挑战的竞赛,旨在让计算机科学家团队解决突出的生物医学问题,例如基于临床数据预测前列腺癌治疗的结果,或从乳房的X线照片数据检测乳腺癌。“我从研究生院知道,嗅觉的运行机制仍然是一个谜,”Meyer说。尽管研究人员已经在人体中发现了大约400种不同的气味受体,但他补充说,这些气味受体是如何协作来区分不同气味,很大程度上仍然是一个谜。

2015年,Meyer和他的同事们举办了DREAM嗅觉辨识挑战赛。他们将洛克菲勒团队收集到的气味数据集分为三部分,参与者被给予三分之二的志愿者评级数据集,包括产生每种气味的分子化学结构。他们还给每种分子打了超过4800个标签,例如分子的原子组合,排列和几何形状,构成了超过200万个数据点的独立数据集合。然后使用这些数据集来训练他们的计算机嗅觉辨识模型,输入的特征是分子的化学结构。剩余的三分一的数据作为验证集,包括69个味道评价数据及其相应的化学信息,被用来评估模型的辨识味道的准确度,辨识结果与49人的平均评级结果和个体的评级结果做比较。

来自全球的22个团队迎接了挑战。许多团队表现良好,但有两个团队脱颖而出,安娜堡的密歇根大学计算机科学家Yuanfang Guan领导的一个小组,在模拟单个受试者的气味评价中表现最佳。坦佩亚利桑那州立大学Richard Gerkin领导的另一个团队,在模拟参与者平均气味评价中表现最佳,Meyer和他的同事在《Science》期刊中报道。

“我们了解到,我们可以将特定的分子结构与气味的描述对应起来,”Meyer说。例如,具有硫基团的分子倾向于产生“大蒜”气味,具有香草醛类似的化学结构的分子,受试者则会感受到“面包店”气味。

Meyer建议这样的模型可以帮助香料和香料公司构建新的分子结构,调出特定的气味,如檀香或柑橘味。但是,来自科罗拉多州柯林斯堡Synesthetics的生物心理学家Avery Gilbert,一个经验丰富的香水和香精行业老兵,不太确定这种方式的可行性。Gilbert认为这项研究工作是有用的,因为它提供了庞大的数据集。但是,用19种标签来标识不同气味的实在是太局限了,用来描述气味的属性太少。另一项研究中已经让志愿者用80个或更多属性来评价不同的气味。

据雷锋网了解,当前的研究表明,计算机可以预测人们会用19个标签中的哪一个来描述闻到的这一组气味,但不清楚如果有更多的标签,同样的人工智能程序是否还能准确预测人类会使用的标签。 Gilbert说,如果你用不同的描述符,可能需要不同的模型才能预测他们的评价,所以他不知道这个方法在什么程度可以超越人类。也许这个观点的主要作用是提醒,气味辨识仍然是人类科学家和人工智能的挑战。

viaArtificial intelligence grows a nose