|
この記事は、AI関連ニュースメディアQuantumBit(WeChat ID: QbitAI)の許可を得て転載しています。転載の許可については、元の情報源にお問い合わせください。 写真を見せたら、どんな音がするか想像できますか? SpectroGraphicと呼ばれる強力なツールがまさにそれを実現します。 たとえば、「シュレック」の写真が与えられた場合、このツールは対応するスペクトログラムを生成できます。 画像埋め込みスペクトログラムほとんどの音は多くの音波の複雑な組み合わせであり、それぞれの音波は異なる周波数と強度を持っています。 スペクトログラムは、水平軸に時間、垂直軸に周波数スペクトルをとって音を表す方法です。 △スペクトログラムの例SpectroGraphicは、画像を取得してそれをスペクトログラムとして解釈するだけです。 このようにして、生成されたサウンドを使用して、画像をスペクトログラムに埋め込むことができます。 すごくクールだと思いませんか? このプロジェクトは現在オープンソースになっており、誰でも体験できます。 プロジェクトのインストールまず、次のコードを実行して、コマンドライン ツール spectrographic を取得します。
あるいは、スタンドアロン フォルダー内の spectrographic.py ファイルをコマンド ライン ツールとして直接使用することもできます。 さらに、requirements.txt ファイルにリストされているすべての依存関係が満たされていることを確認する必要があります。 インストールは次のコマンドを使用して実行できます。
pip を使用してインストールした後、コンソールで spectrographic [...] を実行するだけです。 スタンドアロン スクリプトを使用する場合は、python spectrographic.py [...] を使用する必要があります。 あるいは、SpectroGraphic.base から SpectroGraphic クラスをインポートすることもできます。 コマンドラインツールの使用
ソース イメージが ./source.png にあり、周波数範囲が 10kHz ~ 20kHz の 10 秒のオーディオ ファイルを生成し、sound.wav として保存し、最終的にオーディオを再生する場合は、準備は完了です。 次に、次のコードを実行します。
スタンドアロン スクリプトを使用している場合:
著者について△右:レヴィ・ボロデンコレヴィ・ボロデンコは現在、オックスフォード大学で数学と統計学の修士号を取得中です。彼女の研究は、確率解析と機械学習に重点を置いています。 彼はオックスフォード大学で学士号を取得しました。2017年から2018年までPROMYSオックスフォードで講師を務め、2018年から2019年までPROMYSボストンで主任講師を務めました。 その他のオープンソース プロジェクトについては、次のリンクをご覧ください。 ポータルプロジェクトアドレス: |