-
エッセイNo.434
週刊 日本医事新報
2026年1月3日発刊
国内の医学雑誌で発行部数最大で100年の歴史のある週間日本医事新報1月第1号のエッセイ特集「炉辺閑話(ろへんかんわ)」に院長のエッセイが掲載されました。
今回で炉辺閑話への掲載は4回目になります。『レコードのVの溝からなぜオーケストラが見事に再現出来るのか?
AI(Artificial Intelligence 人工知能)は音楽を理解できるのか?』井尻整形外科 井尻慎一郎
音楽とレコードに関して疑問があります。針がレコードに彫られたV字型の溝に接し、左右の溝の2方向の振動を電気信号に変換してアンプで増幅しスピーカーを鳴らします。レコード針のたった2方向の電気信号からなぜオーケストラの全貌が聞こえるのか? そしてAIは音楽を理解できるのでしょうか? iPhoneに音楽を聴かせると瞬時に曲名、演奏者、CDジャケットまで示します。でもストリートライブは「すみません、分かりません」という答えが返ってきます。iPhoneが認識するのは膨大なデータベースにヒットする曲です。
なぜ人間は音楽を認知しさらに心地の良いと感じるかは現在の脳科学でもよくわかっていません。マサチューセッツ工科大学の研究では脳内の血流を視覚化するfMRIを用いて音楽と話し声は脳内の聴覚野でエリアが分かれ、それぞれ相反する入力に対して無反応です。しかし歌詞のある歌はその領域が重なり合い処理します。
言語処理では話を理解し人間と聞き間違えるほど滑らかに話すAIが進化しました。しかし音楽は音一つ一つに意味はなく「音」が集まって「音楽」になり「意味」を持つことが言語とは全く異なります。「音楽か非音楽か」をAIが理解することはまだ難しいそうです。我々が電話の着信音を自分の携帯かどうかを聞き分けるときは「音楽」として聞いていません。仕事をしながら良い感じの着信音だなと聞いているときは「音楽」として聞いています。鈴虫の音を雑音と感じるか音色と感じるか。原始人にオーケストラの音楽を聴かせても雑音にしか感じないかもしれません。
さて最初の疑問「レコードのVの溝からなぜオーケストラが見事に再現出来るのか?」ですが、二つ目の疑問「AIは音楽を理解できるのか?」から見えてきた私の回答は、V字の溝でレコード針が拾う振動はさまざまな音が混じった渾然たる振動である。しかしそれをアンプで増幅しスピーカーから振動が人間の耳に入り、脳にインプットされた瞬間にバイオリンやチェロ、トランペットの音楽に見事に分離され、音楽として感じるのだと。
AIを使って音楽の中から一つの楽器の音だけを取り出せる「音源分離」の技術はかなり進んでいます。しかし目をつむってオーケストラの演奏を思い浮かべながら浸る、身体を揺すって楽しむ、という音楽つまり「音を楽しむ」能力は 現時点では人間の方に軍配が上がる特質・能力だと思います。




