欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

谷歌研发出AI多功能模型:能处理语音图像多种任务

程序员文章站 2022-05-11 09:54:05
位于加州山景城的谷歌总部据外媒报道,谷歌研发了一种“能学习所有任务的多功能模型”,在AI领域取得巨大进步。近日,谷歌低调发布了一份学术论文,在论文中描绘了机器学习的蓝图。谷歌研...

谷歌研发出AI多功能模型:能处理语音图像多种任务

位于加州山景城的谷歌总部

据外媒报道,谷歌研发了一种“能学习所有任务的多功能模型”,在AI领域取得巨大进步。

近日,谷歌低调发布了一份学术论文,在论文中描绘了机器学习的蓝图。谷歌研发新的机器学习系统,它被称为“能学习所有任务的多功能模型”,这一模型为以后的研究提供了一个模板,即如何创造一个能够很好地处理多个任务的机器学习模型。

正如谷歌研究人员所称的那样,“多功能模型”接受了各种各样的任务训练,包括翻译、语言解析、语音识别、图像识别和目标检测。虽然它的结果并没有显示出对现有方法的根本性改进,但至少表明,在不同的任务上训练机器学习系统有助于提高它的整体性能。

相比只是在单一运算机器上进行了训练,“多功能模型”在机器翻译、语音和语法分析方面的准确性都得到了提高。

谷歌的论文可以为未来机器学习系统的开发提供一个案例,这些系统可以更广泛地被应用,而且也可能它比目前市场上大部分的狭义解决方案都要准确。更重要的是,这些技术(或它们衍生的)可以帮助减少训练可行的机器学习算法所需的训练数据量。

该团队的研究结果表明,当“多功能模型”接受了它所能完成的所有任务时,它的准确性就会随着训练数据的减少而提高。这很重要,因为在某些领域很难积累足够多的训练数据。

然而,谷歌并没有宣称拥有一种可以同时学习所有任务的算法。正如它的名字所暗示的那样,“多功能模型”是为应对不同挑战而量身定制的系统,以及帮助直接输入这些专家算法的系统。这项研究的确表明,谷歌采取的方法可能对未来开发不同领域的同类型系统有所帮助。

同样值得注意的是,“多功能模型”还有大量的测试要做。谷歌的搜索结果还没有被证实,而且很难知道这项研究如何推广到其他领域。谷歌的大脑团队已经承诺开放“多功能模型”的源代码,让更多的人去尝试,但没有给出具体的开放。

对于“多功能模型”,谷歌也有一些明显的改进思路。谷歌团队指出,他们没有花很多时间优化系统的一些固定参数(在机器学习中被称为“超参数”),而未来调参优化将有助于提高准确性。