×

登录 是一种态度

logo
手机
访问
公众
账号
󰀳 返回
顶部

人工智能: 生命科学的下一波浪

核心提示:机器计算程序解决统计濒危动物数量难题;人工智能小盒子提前掌握流感疫情动态;一款基于人工智能的程序正在深入学习如何让孩子充分受益于人工耳蜗。

第1篇 人工智能利用度假照片拯救野生动物

作者:David Freedman,贸泽电子专稿

机器学习(ML)专家塔尼娅·伯格-沃尔夫(Tanya Berager-Wolf)因为打赌而进入了野生动物保护领域。伯格-沃尔夫现为俄亥俄州立大学的一名科学家;2003年,她在罗格斯大学离散数学和理论计算机科学中心工作;当时,她抽时间参观了肯尼亚的一个野生动物保护区。在保护区内,她遇到了一名野生动物研究人员;这名研究人员为了辨认附近的一匹斑马,正在煞费苦心地将它的条纹与此前在保护区拍摄的数百只斑马的条纹进行对比。

他花了20分钟才找到匹配的斑马;这时,伯格-沃尔夫评论说,肯定还有更好的方法。野生动物研究员回答说,可能有;但伯格-沃尔夫肯定找不到这个方法。“我想都没想就脱口而出‘要打个赌’吗?”她回忆道。“直到后来我才意识到,我就这样把自己的声誉押在了找出一种鉴别斑马的更好方法上。”

避免重复性工作

伯格-沃尔夫的声誉没有受到任何影响。事实上,她和伙伴们发明的基于图像的生态信息系统(IBEIS)反而让她名声大噪。IBEIS是一款专为用于匹配特定斑马(及其他动物)图像而设计的机器学习程序。

格雷维斑马的IBEIS热点图 IBEIS发现图像中独特信息高多变性区域(热点),并使用这些热点来识别单个动物(图片由Wildbook Media提供)

对于野生动物保护来说,特定动物的匹配是一项至关重要的任务。各种资金和其他资源(如分配给一群动物的土地数量)以及政府针对开发商和盗猎者而对这些动物所提供的保护程度等,通常都与动物数量有关。此外,科学家和野生动物管理人员需要知道种群数量是在增长还是减少,以验证现有的保护措施是否有用。但我们很难准确计算一个种群的数量,除非我们能够采取措施避免重复计算 — 也就是,避免再次算入已经统计过的动物。因此,就需要检查之前清点过的动物照片。

科学家在肯尼亚使用个体动物识别软件HotSpotter(图片由Wildbook Media提供)

对于这个问题,伯格-沃尔夫想到了机器学习。传统的计算机算法无法处理这项任务,因为即使是同一个动物的照片,也会因为照片的角度、阴影、动物的位置和其他因素而看起来不尽相同。相比之下,我们可以训练机器学习程序,使其忽略这些变化,并在照片中找到特定动物保持不变的特定模式。在训练过程中,他们给IBEIS输入了数千张照片。首先,系统会随机猜测哪些照片与哪些动物相匹配。当研究人员在系统中确认哪些猜测正确、哪些猜测错误之后,程序会不断调整其模式寻找技术,以增加猜对的次数,直到在大多数情况下都能得出正确的答案。

不仅用于斑马

斑马是理想的动物匹配对象,因为它们基本上是行走着的条形码。但是,IBEIS能否在其他需要保护的动物身上同样发挥作用呢? 为了找到答案,伯格-沃尔夫加入了一个名为“Wild Me”的非营利组织;该组织承担了一项特别艰巨的任务:通过收集研究人员、休闲潜水员和船上游客的照片来计算濒危鲸鲨的数量。

研究人员建立了一个名为“Wildbook”的项目,并获得了著名美国国家科学基金会的资助;他们发现,IBEIS在识别鲸鲨重复计算方面也表现很好。其成功的原因在于,这些鲨鱼身上都有各自的特有斑点。该项目最终从8000多名民间科学家所提供的近75,000万张照片和视频中筛选出了大约8100头不同的鲸鲨。伯格-沃尔夫说:“用各类照片带给科学家和决策者值得信任的数据,这是建立可靠性路上走出的坚实的第一步。”

通过斑点识别鲸鲨(图片由Wildbook Media提供)

Wildbook项目在鲸鲨统计上的成功揭示了一种全新的可能性。为什么不使用互联网上任意来源的各种照片来挑选需要统计的濒危动物呢? “全球各地的生物多样性都在下降,各种物种正以前所未有的速度消失。”伯格-沃尔夫表示; “通过大量相机镜头所拍摄到的照片,我们有机会创造一个更清晰的全球视角,以了解这些物种的具体情况。”

Wildbook将继续针对30多种物种进行统计处理,包括北极熊、长颈鹿和座头鲸。为了增加机器学习程序可以从中提取的照片和视频的数量,该软件会筛选在Instagram、YouTube和Flickr等社交媒体网站上公开发布的相关动物图片和视频剪辑。

统计嘉年华

为了增加实用性,软件必须尽可能了解照片拍摄的地点和时间;这意味着需要阅读照片的附带文本;或者,如果文本中没有提供相关信息,就得联系发布照片的人进行询问 — 这将是一个非常耗时的任务。

在这方面,人工智能(AI)又一次完美救场。伯格-沃尔夫和她的Wildbook同事们设置了两个组件:一个是从文本中提取所需信息的自然语言处理系统,一个是人工智能聊天机器人;聊天机器人可以联系到照片发布者,和他们谈谈照片,从而确定拍摄的时间和地点。“当人们发现自己正在与一个人工智能程序对话时,都感到很兴奋。”伯格-沃尔夫表示; “有一个人给聊天机器人提供了信息,然后要求它不要征服人类。”

(图片由Wildbook Media提供)

与此同时,伯格-沃尔夫找到了暂时将注意力重新集中到斑马身上的理由。2016年,肯尼亚向她求助,希望她能准确计算出格雷维斑马的数量;这是该国严重濒危动物之一。在20世纪70年代,格雷维斑马的数量大约是15000只,但自然资源保护主义者认为它们的数量已经急剧下降,所以想要确认实际情况。为了修正他们的估计,科学家们邀请了所有愿意帮忙的人员在动物聚集地周围游走并进行为期两天的拍摄。数百人前来参加了这项活动,包括专业环保人士、游客、部落首领和当地三岁大的小孩子。最终,他们提供了4万张图片,以供机器学习软件进行分析。

格雷维斑马的最终统计数量为2350只;这也证实了自然资源保护者的担忧。但是,在记录数量减少的同时,我们还可以采取各种步骤。在2018年和2020年1月组织的两次集体拉力摄影大会上,人们对斑马群进行了两次重新统计,发现它们的数量稳步上升,接近3000只 — 这是非常显著的增长。“通过邀请普通人来参与照片收集过程,他们最后会对物种生存贡献自己的一份力量。”伯格-沃尔夫说道。“这让人们对科学家的工作更有信心。”

无论对科学还是濒危动物来说,这都是非常不错的消息。一个机器学习程序就解决了这么大的难题,这就是人工智能的力量!

第2篇 依据声音监测流感疫情

作者:David Freedman,贸泽电子专稿

在流感季节里,我们都不想听到有人咳嗽的声音,但Tauhidur Rahman可不这么想。这位麻省大学 (UMass) 的计算机科学研究员可绝不是喜欢看到人们生病; 事实上,他研究的目的正是为了控制疾病:他已经找到了一种方法,可以通过机器学习 (ML) 将咳嗽的声音转化为一种潜在的重要工具,在年复一年抗击流感的战斗中发挥作用——仅在美国,流感每年都会造成数万人死亡。

Rahman是麻省大学移动传感与普适计算实验室的负责人之一,他在这里与同事和学生进行过的一项试验就是将传感器放置于人体和周围环境,通过拾取生物信号和其他数据来改善健康状况。该实验室还曾进行的项目包括对毒瘾渴求度的监测以实现及时干预,以及对睡眠质量的测量。

2018年初,Rahman萌生了一个想法:是否可以在诸如候诊室、办公室、学校以及其他各种人群聚集的地方使用能够检测症状的传感器,来检测包括流感在内的呼吸道疾病传播? 他说:“当我提交有关这个想法的论文时,一些科学家怀疑这种方法是否会起作用。” 但是Rahman深信这样的方法是可行的,决定要试一试。

流行病学走向数字化

很长时间以来,跟踪流感和呼吸道传染病疫情一直都是一项挑战。有关这些传染病疫情的大部分数据来自医院确诊病例数的报告。但是,这样的数据会比疾病的传播滞后一周甚至更长时间,因为人们只会再病情严重到一定程度后才会上医院,而后医院需要收集和处理血样,实验室需要进行测试并报告结果,医院需要将结果上报美国疾病控制与预防中心 (CDC),CDC需要将报告汇总并确定哪里有传染病以及传播的速度有多快,这一切都需要时间。这一流程的耗时限制了响应的有效性,因为在应对爆发的疫情时每一天都很重要。越能及早发现流感热点,相关部门就能越快地有的放矢,从而避免更大范围的传播。

Rahman认为,数字流行病学这项全新领域(也就是使用智能手机、传感器和在线行为来发现疾病趋势)可以加快呼吸道疾病传播的检测速度。Rahman与博士生Forsad Al Hossain合作,他的第一个想法是使用红外线 (IR) 摄像头来测量人群中的发热人数。对此,医生同事警告他,大多数患有呼吸系统疾病的人并不表现出发热症状。此外,精确的红外摄像头可能要花费2万美元以上。Rahman说:“我们想要大大降低成本,以便让这套系统能在包括发展中国家在内的任何地方使用。”

用热能枪测量人群的体温(图片来源:smuki - stock.adobe.com)

咳嗽是关键所在

咳嗽似乎是比发热更保险的一种依据,因为这是呼吸系统疾病最常见的症状,不过人群规模过小或过大、常年性咳嗽以及吸烟引起的咳嗽都会大大影响到与流感相关的咳嗽数据的准确性。另外,在一天的不同或是一周的不同日子里,咳嗽症状会有所不同。不过,毕竟捕捉声音这件事情哪怕是很便宜的麦克风也可以做到,而打喷嚏和吸鼻涕的次数也有助于区分咳嗽的类型。

幸运的是,获得Rahman和Al Hossain所需的所有数据并非难事,只需要部署一个能够检测声音方向的小型麦克风阵列和一个很便宜的体温检测摄像头。将这些技术组合在一起,Rahman就能够计算附近有多少人、其中有多少人咳嗽;这些设备并不能识别个人身份,这有助于保护人们的隐私。

然而,鉴于有各种变量存在,要用精准的方式将它们组合在一起来准确评估感染率是一个非常棘手的数据分析难题—— 这就是ML软件的用武之地。ML是一种人工智能 (AI) 技术,可以将繁复的信息浓缩为简单的决策,这就类似于人脑在繁忙嘈杂的城市环境中可以轻松判断过马路是否安全那样。具体到这项研究中,Rahman所采用的软件是建立在一种称为卷积神经网络 (CNN) 的ML软件上的。CNN旨在将来自传感器的大数据集(例如单个图像或声音)分解为一系列大大简化的版本,剔除次要信息并保留重要部分,从而识别出图像或声音中的内容。

Rahman成功运用经过训练的CNN来检查房间内的简短录音,然后通过仅关注声音中有意义的元素来确定录音中是否包含咳嗽声。同样,另一个CNN对热成像进行分析,以确定图像的哪些部分显示的是人像。上述及其他ML模块在Rahman的系统中协同发挥作用,以估算房间中可能有多少人感染了流感。

CNN如何收听房间内的录音并分析是否包含咳嗽声的例子(图片来源:Mouser Electronics)

盒子中的流感监控器

开发了软件之后,Rahman接下来要确保系统可以轻松部署。包括两台运行ML软件并实时处理数据的板载计算机在内,整个系统安装在一个烤箱大小的盒子中。无需互联网连接。为增强隐私保护,数据在分析后会立即删除。

虽然系统具有这样的计算力并包含多个传感器,但Rahman仍成功地将造价控制在每台500美元。对于因抗击新冠疫情的巨额开支而受到财政重创的公共卫生和其他州和地方机构来说,新系统的价格不会造成预算压力。为了让系统能被发展中国家采用,他希望在未来几个月内将成本降低到200美元以下。

但是,这套系统在计算感染人数方面能否发挥作用? 2018年末至2019年中,Rahman和Al Hossain将他们的检测箱放在附近医院的候诊区,记录了约2100万段音频和35万张热像。系统的AI软件尽职尽责地推算出候诊室中流感病毒感染人数的每日估算值。为了验证估算值的准确性,Rahman从医院取得了他的系统记录的每组人员中后来确诊的感染数,但不包含任何身份信息。果不其然,ML软件能够预测人群中呼吸道疾病的真实感染率,并且比医院获得诊断化验结果要提前许多天。

遏制传染激增

Rahman现在正在听取对部署这项被他称为FluSense的技术感兴趣的流行病学家、政府机构和资助团体的意见。他希望FluSense到仲夏前能推广到马萨诸塞州和弗吉尼亚州的一些医院,然后在接下来的几个月扩大规模,以便在全国各种医疗保健设施和公共场所进行部署。他说:“科学家们预计今年秋天感染数将会激增,我们需要为此做好准备。”

FluSense将测量人群的人数以及人群中咳嗽声的数量(图片来源:ceramaama - stock.adobe.com)

最终,FluSense可以成为常规设备,帮助控制季节性流感的蔓延,并为未来出现的呼吸道感染提供预警,以便医生及时消除疫情苗头,防止发展成流行病甚至全球流行病。他说:“我们可以在咖啡馆、教室甚至老年人和易感人群的家中使用它。”

第3篇 扫描大脑寻找语言的秘密

作者:David Freedman,贸泽电子专稿

鸡尾酒会上可能会发生许多有趣的事情,然而,可以肯定的是,先进的医学科学通常不在其中。然而,2012年,芝加哥Ann & Robert H. Lurie儿童医院的儿科医生兼研究员Nancy Young与神经学家Patrick Wong的相遇改写了这个规律。

这两位科学家最终达成一项长期合作,以提高用于改善儿童听力的药物效力。为了实现这个共同的目标,他们选择了人工智能(AI),并希望以此解开人类大脑如何学习识别语言的奥秘。

快速学习的关键

Patrick是西北大学的教员,并且长期以来一直执着于一个特定问题:为什么有些人能很快学会第二语言,而有些人却连上手都很难? 他觉得,可以在慢速和快速语言学习者的大脑结构差异中找到答案。在脑部磁共振成像(MRI)扫描中,我们可以看到这些差异;MRI可帮助揭示大脑不同区域的相对大小、厚度和形状以及相同区域的褶皱和连接模式的差异。

各种大脑的磁共振成像(MRI)扫描(图片来源:Nomad_Soul - stock.adobe.com)

科学家们已大致了解大脑的哪些区域会影响语言学习;Patrick收集学习了第二语言人们的电脑扫描图像,尝试在这些或其他大脑区域中发现任何细节,从而对语言学习能力进行预测。在他和其他研究人员看来,这些线索都不明显。“我们可以在扫描图像中看到特定的模式,但我们不知道这些模式中哪些细节更为重要。”Patrick说道。

为了找到答案,Patrick Wong开始求助于机器学习(ML)软件。该软件将每个大脑图像分割成数百个不同的立方体部分,然后测量这些部分中的所有可见细节。接下来,该软件采用数百万种方法来组合立方体部分的各个不同细节,以测试每种组合与语言学习能力之间的关联程度如何。随着对越来越多的语言学习者的大脑扫描图像进行深入探究,该软件开始瞄准扫描图像中的某些特定模式,从而帮助预测一个人学习第二语言的难易度。

Patrick不由自主地想道:是否有方法可将他的技术应用到临床医学上。此时,西北大学的一位院长邀请他参加一个学院的鸡尾酒派对;也就是在这次的鸡尾酒派对中,他遇到了Nancy。

大脑中的重担

作为一名儿科外科医生,Nancy擅长于人工耳蜗的植入——通过手术方式将两件式电子设备植入头骨和耳朵深处。这些植入物旨在对于会损害听力的内耳部分缺陷进行补偿。然而,这些植入物远不能有效治愈听力障碍,因为接收到的是很难辨识的、模糊不清的嗡嗡声。

由于通过人工耳蜗接收到的声音不够清晰,从长期来看,接受人工耳蜗植入的6岁以下儿童在语言理解评估上的平均表现要比听力正常的儿童低15%。为了缩小这种差距,接受植入手术的儿童还需要接受语言治疗。一般来说,为了达到最佳的语言理解效果,孩子们需要进行每周几天每天几个小时的强化治疗,且治疗周期需要持续一年或更长时间。“大脑必须学会使用来自植入物的信息,”Nancy说, “这可不像修复一条断腿那么简单。”

一个小男孩和他的语言治疗师一起练习(图片来源:kasto - stock.adobe.com)

遗憾的是,治疗并不一定对每个人都有效。并且,完整的长期、密集语言治疗疗程通常极其昂贵。专家和治疗项目的数量不足;这意味着他们只能帮助一小部分有需要的人们。更重要的是,不同的孩子在接受高水平治疗后所获得的收益也会大相径庭。“有些人收效良好,而有些人却见效甚微。”Nancy说。她补充说,由于这些强化项目属于宝贵的资源,更明智的做法是,尝试将这些资源留给那些可能从这些项目中获益最大的孩子们。

但是,如何预测哪些患者在植入人工耳蜗后经过大量治疗能有较好的疗效? 和Patrick一样,Nancy也认为,这个问题的答案在于大脑结构的变化。医生通常会对等待植入手术的儿童进行MRI脑部扫描(附图1);但是,如何测量和解读这些结构,以帮助预测接受植入手术患者在一定时间之后可能会有多大程度的改善,仍然是个不解之谜。“这些植入物可大幅改变人们的生活,”Nancy说。“但是,我们需要知道大脑的哪些部分在挑起这个重担。”

附图1: 医生通常会对准备植入人工耳蜗的儿童进行MRI脑部扫描,尽管目前还不知道如何预测患者在一定时间之后可能会有多大程度的改善。(来源:Andrewshots/Shutterstock.com)

思想的交会

仅在鸡尾酒会上交谈几分钟后,Patrick和Nancy都发现,自己所寻找的答案就掌握在对方的手中。“我意识到,在我的整个职业生涯中,我都在寻找像Patrick这样的人,”Nancy说道。

于是他们很快就开始合作,将机器学习应用于预测哪些接受人工耳蜗植入的儿童在语言治疗中有可能获得最大的疗效。(在此期间,Patrick曾到香港中文大学(CUHK)担任语言、学习和大脑实验室主任。) 基于机器学习的软件在此扮演了关键角色:他们使用软件来检查大脑扫描图像,以寻找关于大脑结构的线索。但是,这一次,扫描图像来自接受植入手术前的儿童——大多数年龄在8个月到4岁之间。该软件能够在扫描图像中搜索各种大脑结构与在六个月治疗后每个孩子语言理解能力改善程度之间的关联。

这个项目从一些看起来非常重要的线索开始着手。准备接受植入手术的儿童通常从一出生起就失去了听觉刺激,因此,在植入前,其大脑的某些区域看起来与听力正常的同龄人有所不同。“如果孩子没有获得相应的信息,大脑结构就不会以完全相同的方式发育。”Patrick说。这个发现表明,这些特定的大脑区域可能是关键的预测因素。

然而,当基于机器学习的软件开始检查扫描图像时,其结果令人惊讶。结果表明,在预测儿童在语言治疗中的表现时,大脑中与听力和语言没有特别联系的其他区域更为重要。“我们发现,负责高级认知、注意力和工作记忆的区域有助于预测疗效。”Patrick表示。

改变人生的预测

经过多年的努力,Patrick和Nancy对该软件进行了改进,使其能够仅基于手术前大脑扫描图像做出预测,以确定某个孩子在人工耳蜗手术后接受强化语言治疗是否会比普通的孩子获得更快的进步,并且,其预测准确率达到了82%。目前,他们正在探索如何将研究成果应用到Nancy的临床工作中,然后应用到整个领域,使全球各地的儿童都能从这项研究中受益。

Nancy强调这项工作不是为了阻止某些儿童接受植入手术或语言治疗,而是为了帮助那些可能原本没有机会接受植入手术的儿童。“有些弱听孩子很脆弱,有些还有其他学习障碍;他们在接受植入手术后似乎不太可能有特别突出的表现。”她表示, “但是,其中有些孩子在重获听力后会获得巨大的力量,进而培养其他技能。”

也许,用不了多久,机器学习软件就能用于识别这些孩子,帮助改变他们的生活。

0