【python】文字列を音声に変換する | リーマンエンジニアのブログ

Pythonで文字列を音声に変換する方法をご紹介します。

Google翻訳のAPIを叩くだけなので、とても簡単に高品質な音声データを取得できますよ！

Amazonで詳細を見る

pythonで文字列→音声するには、「gTTS」を使う
pythonで文字列→音声をする場面
まとめ

pythonで文字列→音声するには、「gTTS」を使う

「gTTS」は、「Google Text-to-Speech」の略で、文字通りGoogle翻訳を扱うためのライブラリです。

gTTS

gTTS (Google Text-to-Speech), a Python library and CLI tool to interface with Google Translate text-to-speech API

以下、サンプルコードです。

from gtts import gTTS

tts_ja = gTTS(text='こんにちは', lang='ja', slow=False)
tts_ja.save('hello_ja.mp3')

tts_en = gTTS(text='hello', lang='en', slow=True)
tts_en.save('hello_en.mp3')

英語はもちろん、日本語やその他様々な言語に対応しています。

また、slowというパラメータを使って、ゆっくり話すかどうかを選択できます。

言語学習時などゆっくり話してもらいたい時に便利ですね。

欠点としては、当然ですがインターネット環境が必須です。

また、gTTSライブラリ自体に音声出力する機能はなく、.mp3などにファイル化する必要があります。

pythonで文字列→音声をする場面

ユーザに音声で指示する必要があるアプリケーションで利用できます。

特に近年は音声インターフェースを導入するアプリケーションが増えていると思います。

音声入力は認識精度を高めるのが難しいですが、音声出力はgTTSを使えば簡単に実装できそうですね。

まとめ

pythonで音声出力できるライブラリ「gTTS」を紹介しました。

わずか数行で音声出力できる、とても簡単なライブラリですが、音声インターフェースを採用しようと思ったら欠かせない技術ですね。

以上！