看日本电影真痛苦,本来就听不懂!还没字幕!6行代码音频转文字
前面几天想看一个电影(至于什么电影就不说了),搜了半天没有中文字幕。
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
这么贵!
好在这难道不了一个吃苦耐劳的程序员,在知乎某位大佬哪里找到了这个东西 !
点击现有服务,找到已有的服务。
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
点击服务名称查看详情。
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
看到页面下方显示服务凭证,且username和password都是加密符号表示。
点击右侧的「显示」,打开眼睛,
把username和password记下来
(复制到记事本里啦不要翻小本本了!)
好了,任务完成,我们可以把官网关掉了。
第三步:
安装SpeechRecognition包
打开cmd,输入pip install SpeechRecognition,耐心等待一会就安装成功了。
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
出现这个就安装成功了!
第四步:
打开Jupyter Notebook开始撸代码!
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
运行这一步发现报错了
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
原来要wav格式。
给大家推荐一个好用的神器:格式工厂。
音频视频文件转格式我都用它,方便小巧。
转格式后把引号里的内容改成1.wav就可以运行了。接着定义账号密码,
把引号里的XXX改成你自己的
IBM_USERNAME = 'XXXXXXXX'
IBM_PASSWORD= 'XXXXXXXX'
以及调用IBM的Speech to text。
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
我这2分多钟的音频大概运行了半分钟左右吧。
这个text,就是你音频转过来的文字了。
让我们来试试:
print(text)
看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字
虽然准确率没有100%,但是也很厉害了!
它还支持很多语言。只要把language变量改成以下这些语言就可以了
- ar-AR 阿根廷语
- en-UK 英式英语
- en-US 美式英语
- es-ES 西班牙语
- fr-FR 法语
- ja-JP 日语
- pt-BR 巴西葡萄牙语
- zh-CN 中文
温馨提示:每个免费账户每个月都可使用100分钟,30天不活跃服务将会被删除
话不多说,我去看电影去了。
希望对你有帮助!