인공 지능은 사람들의 삶에서 일어나는 사건을 예측할 수 있습니다
문자 언어를 모델링하기 위해 개발된 인공 지능은 사람들의 삶에서 일어나는 사건을 예측하는 데 활용될 수 있습니다. DTU, 코펜하겐 대학교, ITU 및 미국 노스이스턴 대학교의 연구 프로젝트에 따르면 사람들의 삶에 대한 대량의 데이터를 사용하고 ChatGPT와 같이 언어를 처리하는 데 사용되는 소위 ‘변환기 모델’을 훈련하면 , 그들은 데이터를 체계적으로 정리하고 사람의 삶에 어떤 일이 일어날지 예측할 수 있으며 심지어 사망 시간을 추정할 수도 있습니다.
새로운 과학 논문 ‘인간의 삶을 예측하기 위해 생활 사건의 순서를 사용’이 에 게재되었습니다. 자연계산과학, 연구자들은 life2vec라는 모델을 통해 600만 명의 덴마크인에 대한 건강 데이터와 노동 시장에 대한 애착을 분석했습니다. 모델이 초기 단계에서 훈련된 후, 즉 데이터의 패턴을 학습한 후에는 다른 고급 신경망(사실 상자 참조)보다 성능이 뛰어나고 성격 및 사망 시간과 같은 결과를 높은 정확도로 예측하는 것으로 나타났습니다.
“우리는 이 모델을 사용하여 과거의 조건과 사건을 기반으로 미래의 사건을 어느 정도 예측할 수 있는지에 대한 근본적인 질문을 해결했습니다. 과학적으로 우리에게 흥미로운 것은 예측 자체가 아니라 데이터의 측면입니다. 모델이 정확한 답변을 제공할 수 있게 해줍니다.”라고 DTU 교수이자 해당 기사의 첫 번째 저자인 Sune Lehmann이 말했습니다.
사망 시간 예측
Life2vec의 예측은 ‘4년 내 사망’과 같은 일반적인 질문에 대한 답변입니다. 연구자들이 모델의 반응을 분석할 때 결과는 사회 과학 내의 기존 연구 결과와 일치합니다. 예를 들어, 모든 조건이 동일하다면, 리더십 위치에 있거나 소득이 높은 개인은 생존 가능성이 더 높은 반면, 남성이거나 기술이 있거나 정신 진단을 받은 사람은 사망 위험이 더 높습니다. Life2vec은 다양한 데이터를 구성하는 수학적 구조인 대규모 벡터 시스템으로 데이터를 인코딩합니다. 모델은 출생 시간, 교육, 교육, 급여, 주택 및 건강에 대한 데이터를 어디에 배치할지 결정합니다.
“흥미로운 점은 인간의 삶을 언어의 문장이 일련의 단어로 구성되는 것과 유사한 일련의 긴 사건으로 간주하는 것입니다. 이것은 일반적으로 AI의 변환기 모델이 사용되는 작업 유형이지만 우리 실험에서는 우리는 이를 생명 순서라고 부르는 것, 즉 인간의 삶에서 일어난 사건을 분석하는 데 사용합니다.”라고 Sune Lehmann은 말합니다.
윤리적인 질문 제기
기사를 쓴 연구자들은 민감한 데이터 보호, 개인 정보 보호, 데이터 편견의 역할 등 life2vec 모델을 둘러싸고 있는 윤리적 문제를 지적합니다. 예를 들어 개인이 질병에 걸릴 위험이나 기타 예방 가능한 생활 사건을 평가하기 위해 모델을 사용하기 전에 이러한 과제를 더 깊이 이해해야 합니다.
“이 모델은 정치적으로 논의하고 다루기 위한 중요한 긍정적이고 부정적인 관점을 열어줍니다. 인생 사건과 인간 행동을 예측하기 위한 유사한 기술은 오늘날 기술 회사 내에서 이미 사용되고 있습니다. 예를 들어 소셜 네트워크에서 우리의 행동을 추적하고, 우리를 매우 정확하게 프로파일링하며, 이러한 프로필을 사용하여 우리의 행동을 예측하고 우리에게 영향을 줍니다. 이 토론은 기술이 우리를 어디로 데려가는지, 그리고 이것이 우리가 원하는 발전인지 고려할 수 있도록 민주적 대화의 일부가 되어야 합니다.”라고 Sune Lehmann은 말합니다.
연구원들에 따르면 다음 단계는 텍스트, 이미지, 사회적 관계에 관한 정보 등 다른 유형의 정보를 통합하는 것입니다. 이러한 데이터 사용은 사회과학과 보건과학 사이에 완전히 새로운 상호작용을 열어줍니다.
연구 프로젝트
연구 프로젝트 ‘인간의 삶을 예측하기 위한 생활 사건의 순서 사용’은 노동 시장 데이터와 국립환자등록부(LPR) 및 덴마크 통계청의 데이터를 기반으로 합니다. 데이터 세트에는 600만 명의 덴마크인이 모두 포함되어 있으며 소득, 급여, 급여, 직업 유형, 산업, 사회적 혜택 등에 대한 정보가 포함되어 있습니다. 건강 데이터 세트에는 의료 전문가 또는 병원 방문 기록, 진단, 환자 유형 및 긴급 정도가 포함됩니다. 데이터 세트의 범위는 2008년부터 2020년까지이지만 여러 분석에서 연구자들은 2008~2016년 기간과 연령 제한이 있는 개인 하위 집합에 중점을 둡니다.
변압기 모델
변환기 모델은 언어 및 기타 작업을 학습하는 데 사용되는 AI, 딥 러닝 데이터 아키텍처입니다. 모델은 언어를 이해하고 생성하도록 훈련될 수 있습니다. 변환기 모델은 이전 모델보다 더 빠르고 효율적으로 설계되었으며 대규모 데이터 세트에서 대규모 언어 모델을 훈련하는 데 자주 사용됩니다.
신경망
신경망은 인간과 동물의 뇌와 신경계에서 영감을 받은 컴퓨터 모델입니다. 신경망에는 다양한 유형이 있습니다(예: 변환기 모델). 뇌와 마찬가지로 신경망도 인공 뉴런으로 구성됩니다. 이 뉴런들은 서로 연결되어 있으며 서로 신호를 보낼 수 있습니다. 각 뉴런은 다른 뉴런으로부터 입력을 받은 다음 다른 뉴런으로 전달되는 출력을 계산합니다. 신경망은 대량의 데이터를 학습하여 작업 해결 방법을 학습할 수 있습니다. 신경망은 훈련 데이터를 사용하여 시간이 지남에 따라 정확성을 학습하고 향상시킵니다. 그러나 이러한 학습 알고리즘이 정확성을 위해 미세 조정되면 데이터를 고속으로 분류하고 그룹화할 수 있는 컴퓨터 과학 및 인공 지능 분야의 강력한 도구가 됩니다. 가장 잘 알려진 신경망 중 하나는 Google의 검색 알고리즘입니다.
출처: https://www.sciencedaily.com/releases/2023/12/231218125850.htm
댓글 없음
아름다운 덧글로 인터넷문화를 선도해 주세요