AI의 노래 히트 가능성 예측, 적중률 97%

문광주 기자 / 기사승인 : 2023-07-07 08:17:56
  • -
  • +
  • 인쇄
3'10" 읽기
- 대중가요가 히트할 자격이 있는지는 듣는 사람의 신경생리학적 반응에 의해 결정.
- 음악은 좋은 감정을 유발하고, 소름이 돋고, 우리 뇌에서 신호의 폭죽을 촉발할 수 있다.
- 알고리즘은 적중률을 97%로 예측, 거의 모든 곡을 정확하게 분류

인공 지능이 노래의 히트 가능성을 인식한다.
신경 데이터 및 기계 학습은 적중률이 97%인 적중률을 식별다.


히트를 칠 것인가 아니면 실패할 것인
대중가요가 히트할 자격이 있는지는 듣는 사람의 신경생리학적 반응에 따라 결정될 수 있다는 연구 결과가 나왔다. 그 안에서 연구원들은 피실험자들이 들을 음악이 어떤 곡이 히트할지 97%의 정확도로 예측할 수 있었다. 이를 위해 그들은 특정 신경생리학적 매개변수를 측정한 다음 이 데이터를 기계 학습과 결합했. 이 접근 방식은 향후 스트리밍 서비스, 라디오 방송국 등이 사용자에게 적합한 음악을 제공하는 데 도움이 될 수 있다. 

▲ 언제 이 음악 작품이 히트가 될까?

매일 수천 개의 신곡이 공개된다. 따라서 스트리밍 서비스와 라디오 방송국은 사용자에게 제공할 서비스를 선택할 수 없다. 음악의 인기를 예측하는 이전의 기술은 예를 들어 사용자 설문 조사 및 음악의 형식적 특성을 기반으로 한다. 그러나 적중률은 낮다. 그 이유 중 하나는 음악이 형식적 특성의 합 이상이라는 것이다. 음악은 좋은 감정을 유발하고, 소름이 돋고, 우리 뇌에서 신호의 폭죽을 촉발할 수 있다.

이것이 바로 많은 사람이 주어진 척도에서 노래를 얼마나 좋아하는지 평가하기 어려운 이유다. 특히 들을 때의 감각은 항상 현재 기분에 달려 있기 때문이다.
▲ 매일 수천 개의 신곡이 공개된다.

예후 도구로서의 신경생리학 침수

대안으로 연구원들은 음악 청취자의 뇌파와 생리적 반응을 분석하는 실험을 하고 있다. 캘리포니아 Claremont 대학원의 Sean Merritt가 이끄는 팀도 이 접근 방식을 사용했습니다. 측정을 위해 연구원들은 신경 활동과 심박수를 측정하는 상업적으로 이용 가능한 비침습적 장치를 사용

이러한 측정값은 부교감 신경계의 활동을 유도하는 데 사용될 수 있으며 따라서 뇌에서 옥시토신 및 도파민과 같은 특정 신경 전달 물질이 얼마나 강력하게 방출되는지를 유도할 수 있다. 이를 통해 사용자가 음악이나 가상 환경, 이른바 몰입에 얼마나 정신적으로나 감정적으로 자신을 두는지에 대한 결론을 도출할 수 있다. Merritt와 그의 동료들은 "신경생리학적 몰입은 주의와 감정적 반응과 관련된 신호를 결합한다"고 설명했다.
▲ 실험의 타임라인(출처: 관련논문 Accurately predicting hit songs using neurophysiology and machine learning)

테스트 24곡

연구팀은 최근 음악 스트리밍 서비스에서 제공하는 24곡의 노래에 대해 33명의 피험자를 대상으로 신경생리학적 반응을 측정하기 위해 이 측정법을 사용했다. 그중 13곡은 70만 회 이상의 조회수를 기록하여 스트리밍 서비스에서 조회수로 분류되었으며, 11곡은 조회수가 수만 회에 달하는 실패작으로 판명되었다. 트랙은 록, 힙합, 전자 댄스 음악(EDM) 등 다양한 장르에서 나왔다.

또한 연구원들은 피실험자들에게 해당 작품을 얼마나 좋아하는지, 이미 알고 있는지, 다시 듣거나 추천할 것인지를 물었다. 왜곡을 피하기 위해 각자가 모르는 노래만 분석에 포함시켰다.

적중률 97%

이전 연구와 일관되게 사용자가 보고한 주관적 선호도는 의미가 없었다. 반면 실험 대상자의 신경생리학적 데이터는 더 많은 것을 드러냈다. Merritt의 동료인 Paul Zak은 "신경생리학적 데이터에 기계 학습을 적용함으로써 거의 완벽하게 히트를 식별할 수 있었다"고 보고했다.

비결은 음악이 몰입도를 높일수록 히트작이 될 가능성이 높아진다는 것이다. 연구원들이 실제 측정 데이터를 기반으로 만든 합성 데이터로 훈련 단계를 거친 후 알고리즘은 적중률을 97%로 예측할 수 있었다. 24곡의 실제 곡에 적용했을 때 그는 거의 모든 곡을 정확하게 분류했다.
▲ 신경생리학적 침수 및 후퇴를 독립 변수로 사용하는 전통적인 로지스틱 회귀 모델은 69% 정확도로 적중을 올바르게 분류하고 62% 정확도(N = 5,000)로 플롭을 분류했다. 동일한 두 개의 독립 변수를 사용하는 배깅된 기계 학습 모델은 안타 분류에서 96.6%의 정확도를 보인 반면 실패는 97.6% 정확도로 분류했다. 막대는 표준 편차다.(출처: 관련논문 Fig 2)

감정적 반응 중요

"33명의 신경 활동이 수백만 명의 다른 사람들이 새 노래를 들었는지 여부를 예측할 수 있다는 것은 꽤 놀라운 일이다"고 Zak은 말했다. "이렇게 정확한 것을 이전에 보 적이 없었다." 팀 보고서에 따르면 신경학적 매개변수를 사용하여 노래의 히트 적합성을 결정하려는 이전 시도는 최대 50%의 성공률을 보였다.
▲ 노래의 첫 번째 분에 대한 신경생리학적 반응에 대해 훈련된 로지스틱 회귀 모델은 77% 정확도로 히트를 올바르게 분류하고 56% 정확도(N = 10,000)로 플롭을 분류했다. Bagged 기계 학습 모델은 노래의 74%를 올바르게 분류했다. 적중률은 82%의 정확도로 분류된 반면 플롭은 66%의 정확도로 식별되었다. 모델 교육은 1,000회 반복 동안 반복당 5,000회 관찰의 부트스트랩 평가를 사용하여 합성 데이터 세트(N = 5,000)의 절반을 사용했다. 막대는 표준 편차다.

과학자들은 그들의 방법의 높은 예측 정확도가 테스트 대상의 관심과 감정적 반응을 모두 기록한다는 사실에 기인한다. "감정은 경험의 주관적 가치를 나타낸다"고 그들은 설명한다. "우리의 분석은 감정적 반응도 어떤 노래가 히트곡이 되는지 결정하는 데 도움이 된다는 것을 나타낸다." 연구원들은 지금까지 24개의 실제 노래에 대해서만 알고리즘을 테스트했다고 지적했다. 그러나 그들은 다른 음악에서도 마찬가지로 좋은 결과를 얻을 수 있다고 가정한다.

스트리밍 서비스를 위한 도구

연구원의 관점에서 이 기술은 미래에 스트리밍 서비스와 라디오 방송국을 위한 귀중한 도구가 될 수 있다. 개별적으로 조정된 권장 사항도 생각할 수 있다. "미래에 우리가 이 연구에 사용한 것과 같은 웨어러블 신경 과학 기술이 보편화된다면, 청중은 신경생리학을 기반으로 올바른 엔터테인먼트를 제공받을 수 있다"고 Zak은 말했다.
(Frontiers in Artificial Intelligence, 2023, doi:10.3389/frai.2023.1154663)
출처: 프론티어

[더사이언스플러스=문광주 기자]

[저작권자ⓒ the SCIENCE plus. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

Basic Science

+

AI & Tech

+

Photos

+