교육 수준과 모바일 데이터 사용 방식 간의 연관성

문광주 기자 / 기사승인 : 2022-01-01 21:41:45
  • -
  • +
  • 인쇄
3'30"읽기
- 연구의 기반은 모바일 데이터 트래픽에 대한 약 37억 건의 기록, 2017년 수집
- 소득, 교육 수준 높은 지역 : 뉴스, Google 및 메일, 온라인 거래와 음악 스트리밍과 같은 정보 검색 영역에서 더 많은 트래픽을 발생
- 사회경제적 지표가 낮은 지역에서는 소셜 미디어와 동영상 스트리밍 트래픽이 더 많다.

정보 출처: 뉴스 또는 소셜 미디어?
모바일 데이터 사용과 사회적 지위 사이의 상관관계


Facebook 또는 고전적인 뉴스?
연구원들이 사람들의 교육 수준과 모바일 데이터 사용 방식 간의 연관성을 발견했다.
교육 수준이 높고 소득이 높은 주거 지역에서는 다이렉트 뉴스가 소비될 가능성이 높으며, 교육 수준이 낮은 주거 지역에서는 소셜 미디어를 통해 더 많은 데이터가 생성된다. 

▲ 당신은 어떤 소스에서 뉴스를 얻습니까? © Tero Vesalainen / 게티 이미지

긍정적인 방식으로 사람들을 서로 연결하려는 소셜 미디어의 원래 의도는 개발 과정에서 점점 더 많은 어두운 면을 갖게 됐다. 가짜 뉴스와 온라인 혐오는 소셜 미디어에서 오랫동안 일상생활의 일부였으며 선거와 정치적 결정에 영향을 미친다고 한다.

연구에 따르면 미국 국민 사이에는 정보 출처로서의 소셜 미디어와 사용자의 교육 수준 사이에 연관성이 있다. 교육 수준이 높은 그룹은 보다 고전적인 출처에 귀를 기울이는데, 교육 수준이 낮은 그룹은 이러한 유형의 정보 생성에 의존함에 틀림없다.

37억 데이터 연결 분석

마드리드 카를로스 3세 대학의 Iñaki Ucar와 그의 팀은 최근 정보 출처의 휴대폰 데이터가 주거 지역의 사회경제적 상태와 어느 정도 연결될 수 있는지 조사했다. 이를 위해 프랑스 네트워크 사업자 Orange가 수집한 사용 데이터를 분석했다.
연구의 목적은, 이렇게 개발된 모델로 휴대폰 데이터를 사용해 인구통계학적 예측을 할 수 있도록 하는 것이었다.

이 연구의 기반은 모바일 데이터 트래픽에 대한 약 37억 건의 기록으로, Orange는 GDPR에 따라 2017년에 수집했다고 밝혔다. 데이터에는 휴대폰 마스트에 의해 할당된 시간 및 지리적 사양이 모두 포함돼 있으며 지문을 사용하여 특정 앱에 할당할 수 있다.
해당 개인의 거주지에서 발생했을 가능성이 있는 데이터만 고려하기 위해 과학자들은 오후 8시에서 오전 6시 사이에 발생한 데이터만 연구에 포함했다.

상대는 2014/2015년 프랑스 인구 조사로 소득, 교육 수준 및 사회적 불평등과 같은 데이터 세트의 사회 경제적 특성을 특정 영역에 대해 평균화했다. 스페인 과학자들은 지리적 교차점을 사용해 두 데이터 세트를 결합한 다음 특정 앱과 사회경제적 특성 사이에 연관성이 있는지 조사했다.
▲ 그림 1. 영역 보간 인포그래픽. 모바일 트래픽 데이터 세트는 25,000개의 지리적 위치에 있는 기지국(BS, 하단 레이어)에 대한 모바일 서비스 사용 통계로 구성된다. BS의 커버리지 영역은 모바일 트래픽이 균일하게 분포된 것으로 가정되는 Voronoi 폴리곤(중간 레이어)으로 근사된다. 모바일 트래픽은 가중치가 부여되어 프랑스 행정 구역(IRIS 영역, 최상위 계층)으로 삽입. 상단 플롯은 두 가지 대표적인 모바일 서비스인 Facebook(빨간색)과 뉴스(파란색)에 대한 파리의 가장 부유한 5%(점선) 및 가장 가난한 5% IRIS 영역에서 거주자당 다운링크 트래픽의 평균 일일 시계열을 나타낸다. 알 수 있는 바와 같이, 동일한 영역에 있는 원시 바이트 수의 시계열은 높은 상관 관계가 있으며 거의 정보를 나타내지 않는다. 그러나 서로 다른 영역에서 두 서비스에 의해 생성된 상대 트래픽은 SES 예측에 악용될 수 있는 고유한 패턴을 노출한다. (출처: 관련논문 News or social media? Socio-economic divide of mobile service consumption)

사회 집단 간의 큰 차이점

연구원들은 보고서에서 "요약하면, 소득이 높고 교육 수준이 높은 지역이 뉴스, Google 및 메일, 온라인 거래 및 음악 스트리밍과 같은 정보 검색 영역에서 더 많은 트래픽을 발생시킨다고 말할 수 있다"고 말했다. 한편 사회경제적 지표가 낮은 지역에서는 소셜 미디어와 동영상 스트리밍 트래픽이 더 많다”고 말했다.

모바일 게임 분야에서도 과학자들은 특별한 특징을 지적했다. "캔디 크러쉬(Candy Crush)는 저소득층과 교육 수준이 낮은 지역에서 더 많이 사용되지만 ‘크래시 오브 클랜(Clash of Clans)’는 그 반대였다.

Android 사용자의 더 많은 스트리밍

또한 연구원들은 함께 자주 등장하는 특정 앱 클러스터를 발견했다.
Apple App Store 및 Google Play와 같은 시스템별 앱을 사용해 특정 운영 체제를 클러스터에 할당할 수도 있다. 이에 따르면 애플 사용자는 정보 데이터 사용이 더 많았고 안드로이드 폰에서는 동영상 스트리밍과 게임이 더 흔했다.

"소셜 미디어 트래픽도 두 그룹 간에 차이가 있다. Instagram 및 Twitter 트래픽은 뉴스 및 메일 그룹과 더 많은 상관관계가 있지만 일반 비디오 스트리밍 및 Google Play와 함께 Facebook 또는 Snapchat 사용량이 많다"고 과학자들은 말했다.
▲ 그림 4. 고려된 세 가지 SES 응답에 대한 상대적 효과 크기: 중위 소득, 고등 교육 비율 및 지역 불평등. 95% CI가 있는 모델 추정치는 트래픽 특성(a), 인구 변수(b) 및 공간 용어(c)에 대해 로그 스케일로 표시. 중요하지 않은 추정치는 회색으로 표시. 고등 교육 비율에 대한 모델은 전반적으로 더 강한(긍정적 및 부정적) 효과를 나타낸다. 중위 소득 응답은 더 높은 공간 상관 관계를 보여준다. MMS, 멀티미디어 메시징 서비스; P2P, 피어 투 피어; SF, 공간 필터링; VOIP, 인터넷 프로토콜을 통한 음성. (출처: 관련논문 News or social media? Socio-economic divide of mobile service consumption)

적중률이 80%인 예측

연구에 따르면 주거 지역의 사회적 불평등과 선호하는 운영 체제 사이에는 연관성이 있다.
"불평등의 특히 좋은 지표는 소득 격차가 더 큰 지역에서 iOS 기기의 확산이고 주민의 경제적 상태가 더 동질적인 지역에서 Android 기기의 분포다."

연구원들에 따르면 사용 행태의 차이가 너무 커서 생성된 휴대폰 데이터를 기반으로 사회경제적 분포를 예측할 수 있는 적중률은 80% 정도다. 그들은 선택된 기간이 부정확성을 초래할 수 있다고 지적했다.

과학자들은 "다른 인구통계학적 그룹이 모바일 소비의 전반적인 패턴이 비슷할 수 있지만 하루 동안 다르게 분포되어 있을 수 있다"고 말했다. 홈 WLAN의 사용은 셀룰러 데이터에서도 고려되지 않았다.

양극화 증가에 대한 접근?

그들의 발견으로 연구원들은 사회적 불평등을 다루는 방식을 더욱 개선하고 정보에 대한 접근을 개선하기를 희망한다. 과학자들은 "소셜 미디어의 양극화와 가짜 뉴스의 확산이 더 광범위하다는 점을 감안할 때 우리의 결과는 이러한 문제에 더 취약한 인구와 지역을 식별하는 데에도 사용될 수 있다"고 말했다.

정보 출처로서의 소셜 미디어의 사용이 인구 집단의 발전에 정확히 영향을 미치는지와 방법은 여기에서 명확하게 설명할 수 없다. “우리의 결과는 설명적이며 인과 관계를 암시하지 않는다. 그럼에도 불구하고 우리는 그것들이 사회경제적 불평등의 중요하고 이전에 간과된 요소를 지적하는 데 사용될 수 있다고 믿는다.”
(Journal of the Royal Society, 2021; doi: 10.1098 / rsif.2021.0350)
출처: Journal of the Royal Society

[더사이언스플러스=문광주 기자]

[저작권자ⓒ the SCIENCE plus. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

Basic Science

+

AI & Tech

+

Photos

+