Pythonで文字列を音声に変換する方法をご紹介します。
Google翻訳のAPIを叩くだけなので、とても簡単に高品質な音声データを取得できますよ!
pythonで文字列→音声するには、「gTTS」を使う
「gTTS」は、「Google Text-to-Speech」の略で、文字通りGoogle翻訳を扱うためのライブラリです。

gTTS
gTTS (Google Text-to-Speech), a Python library and CLI tool to interface with Google Translate text-to-speech API
以下、サンプルコードです。
from gtts import gTTS
tts_ja = gTTS(text='こんにちは', lang='ja', slow=False)
tts_ja.save('hello_ja.mp3')
tts_en = gTTS(text='hello', lang='en', slow=True)
tts_en.save('hello_en.mp3')
英語はもちろん、日本語やその他様々な言語に対応しています。
また、slowというパラメータを使って、ゆっくり話すかどうかを選択できます。
言語学習時などゆっくり話してもらいたい時に便利ですね。
欠点としては、当然ですがインターネット環境が必須です。
また、gTTSライブラリ自体に音声出力する機能はなく、.mp3などにファイル化する必要があります。
pythonで文字列→音声をする場面
ユーザに音声で指示する必要があるアプリケーションで利用できます。
特に近年は音声インターフェースを導入するアプリケーションが増えていると思います。
音声入力は認識精度を高めるのが難しいですが、音声出力はgTTSを使えば簡単に実装できそうですね。
まとめ
pythonで音声出力できるライブラリ「gTTS」を紹介しました。
わずか数行で音声出力できる、とても簡単なライブラリですが、音声インターフェースを採用しようと思ったら欠かせない技術ですね。
以上!
コメント