欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

SwiftScribe如何使用 AI音频转录工具SwiftScribe最全攻略

程序员文章站 2023-12-09 17:19:57
SwiftScribe如何使用 AI音频转录工具SwiftScribe最全攻略...

wiftscribe的基本功能是把音频资料转录成文字,以解决消耗大量时间逐字听写转录的问题。swiftscribe支持上传时长1个小时以内的wav或mp3文件,暂时只支持受英文,swiftscribe在1分钟的录音需要不到30秒、1小时的录音需要20分钟左右。swiftscribe怎么用?百度美国推出了ai音频转录工具,可能还有不会用的,下文介绍ai音频转录工具swiftscribe使用教程,一起来了解下吧!

ai音频转录工具swiftscribe使用教程:

百度美国推出了转录工具swiftscribe,一个利用人工智能,让用户能快速将音频快速转成文字的免费网页工具。

百度在近年一直在持续改善其新一代深度语音识别系统deepspeech2。deepspeech2系统由百度硅谷人工智能实验室(svail)研发,并在去年被麻省理工科技评论评为2016年十大突破技术。

百度在语音技术领域不断进步,语音接口更为实用和有效。用户可以愈加便利地与身边的设备进行互动。百度的深度语音识别系统(deepspeech2)包含了一个非常庞大的神经网络,引入了数以百万计的转录语音。有时它在识别汉语语音片段方面,要比人为识别更加准确。麻省理工科技评论写道。

百度在去年也推出了应用deepspeech2的安卓输入法应用talktype,让用户能够快速语音输入文字。国际科技巨头如微软、亚马逊、苹果以及谷歌同样在语音识别领域投入大量精力,但在长段语音识别转录上仍不及百度。

swiftscribe支持上传转录wav和mp3格式的音频文件。一段30秒左右的音频转录成文本时间大概为10秒,而一段1分钟左右的文件大致需要30秒的转录时间。swiftscribe最大支持用户上传1小时长的音频文件,1小时的音频则需要20分钟左右的处理时间,百度的项目管理人武田介绍道。

但swiftscribe的功能目前还没有很完善,在转录成功后,用户还需自行对文本进行编辑。swiftscribe转录出来的文本是不带标点符号的,用户需要自行断句、并对可能出现的错误进行更正、以及编辑英文单词大小写等。不过swiftscribe同样提供变速阅读工具,让用户在校对编辑时可以调慢播放速度。

SwiftScribe如何使用 AI音频转录工具SwiftScribe最全攻略

SwiftScribe如何使用 AI音频转录工具SwiftScribe最全攻略

swiftscribe的开发灵感源于武田在加州大学圣芭芭拉分校读研期间的采访经历。

我的母语不是英语,要整理一段1小时录音对我来说要花上10个小时。而对于专业人士来说,时间也不短,大概要6小时,武田说道。

武田和同事nina wei在跟几个速记员交流过后也为开发swiftscribe找到了不少灵感。武田的团队认为swiftscribe能给速记员带来1.67倍的效率提升,能缩短40%的工作时间,这也意味着他们能花同样的时间赚到更多的钱。

显而易见,swiftscribe并不只是单单面向于速记员,它基于网页,并免费为用户提供服务,对于其他如记者等需要经常整理音频文件的职业,swiftscribe可谓是提高效率的神器。

我们希望在未来能够将其商业化,武田说道,透露在技术成熟后增加收费服务的打算。

武田的团队计划未来给swiftscribe加入音频自动转录文字、为视频上字幕等功能,以及增加支持文件格式,并加入自动添加标点符号的功能,希望大家在这里都能获得自己需要的东西。