주뇽's 저장소

1. 소개 CS224W: Machine Learning with Graphs 정리 본문

GNN/CS224

1. 소개 CS224W: Machine Learning with Graphs 정리

뎁쭌 2024. 3. 13. 16:53
728x90
반응형

https://web.stanford.edu/class/cs224w/

목차

- 왜 그래프인가

- GNN의 어려움

🤔 왜 그래프인가?

  • 그래프는 관계/상호 작용이 있는 엔티티를 설명하고 분석하기 위한 일반적인 언어이다. 그렇다면 관계 또는 상호작용이 있는 엔티티란 무엇일까? 아래의 다양한 형태의 데이터 그래프를 보면 직관적으로 이해하기 쉽다.

다양한 형태의 데이터 그래프

아래 그림과 같이 소셜 네트워크, 지하철 노선도, 인터넷, 네트워크, 분자구조 등 다양한 데이터들은 그래프로 표현이 가능하다.

 

출처 : https://web.stanford.edu/class/cs224w/slides/01-intro.pdf
출처 : https://web.stanford.edu/class/cs224w/slides/01-intro.pdf

🤖 그래프 머신러닝

위 그림에서와 같이 복잡한 도메인은 풍부한 관계 구조를 가지고 있으며, 이는 관계 그래프로 표현할 수 있다. 그래프 머신러닝은 이러한 관계를 명시적으로 모델링함으로써 더 나은 성능을 얻을 수 있다!  그렇다면 더 나은 예측을 위해 관계형 구조를 어떻게 활용할 수 있을까?

 

현대의 머신러닝

현대의 머신러닝은 문자나, 음성신호와 같이 시퀀스한 데이터 또는 이미지와 같은 그리드 형태의 데이터를 처리하기 위해 디자인 되었다. 하지만 실제 세상은 더욱 더 복잡한 관계로 엮여 있다. 그렇다면 훨씬 더 광범위하게 적용할 수 있는 신경망을 개발하려면 어떻게 해야 할까? 이에 대한 해답으로 그래프는 딥 러닝의 새로운 개척지가 될 수 있다.

출처 : https://web.stanford.edu/class/cs224w/slides/01-intro.pdf

 

 

😅 그래프 머신러닝의 어려움

하지만 복잡한 데이터를 표현하는 그래프를 사용한다는데 있어 많은 어려움이 존재한다. 아래와 같이 그리드 형태의 이미지와 시퀀스한 텍스트 타입의 데이터와 다르게 래프 데이터는 다음과 같은 특징이 있다.

  1. 그래프는 임의의 크기와 임의의 복잡한 토폴리지 구조를 가지고 있다.
  2. 그리드(이미지), 텍스트 처럼 공간적 지역성이 없다.

출처 : https://web.stanford.edu/class/cs224w/slides/01-intro.pdf

이러한 특징들로 인해 그래프 머신러닝에는 어려움이 존재한다. 그렇다면 이제부터 그래프 머신러닝을 성공적으로 수행하기 위해서는 도메인에 맞게 어떠한 네트워크 표현을 선택해야하는지 알아보자.

 

2024.03.13 - [GNN] - 2. 그래프 선택 CS224W: Machine Learning with Graphs 정리

 

2. 그래프 선택 CS224W: Machine Learning with Graphs 정리

https://web.stanford.edu/class/cs224w 목차 - 그래프 표현 선택 - 방향 그래프와 무방향 그래프 - 이분 그래프 👉 그래프 표현 선택 1. 동종그래프 2. 이종그래프 1. 일반적인 그래프(동종) 그래프는 노드와

jypark1111.tistory.com