想象一下你去当地的五金店,看到货架上有一种新的锤子。你可能听说过这把锤子:它比其他锤子更快更准确地敲击,在过去的几年里,至少在大多数情况下,许多其他锤子都被淘汰了。几周之后,你发现只要稍微调整一下,这里加一个附件,那里加一个转动,这个工具就变成了锯子,它至少可以像其他工具一样快速准确地切割。事实上,一些工具开发前沿领域的专家说,这把锤子可能预示着所有工具将汇聚到一个单一的装置中。
类似的故事也在人工智能工具中上演。这种多用途的新型锤子是一种人工神经网络——一种通过训练现有数据“学习”如何完成某项任务的节点网络——称为transfromer。它最初设计用于处理语言,但最近开始影响其他人工智能领域。
transfromer最早出现在年的一篇论文中,那篇论文含糊地宣称“注意力就足够了”在人工智能的其他方法中,系统首先