Interpretable Graph Classification

1. 문제 (Problem)

그래프는 분자 구조, 소셜 네트워크, 프로그램 실행 추적, 지식 베이스 등 다양한 실세계 데이터를 자연스럽게 표현하는 기본 자료구조이다. 특히 신약 개발과 같이 의사결정이 중요한 도메인에서는 정확한 예측뿐만 아니라 명확한 설명이 함께 요구된다.

현재 그래프 분류의 주류 방법인 GNN(Graph Neural Network) 은 높은 정확도를 보여주지만 블랙박스로 동작한다. 예측의 근거가 연속적인(continuous) 임베딩에 얽혀 있어서, 어떤 구조적 패턴이 예측을 이끌었는지 명시적으로 식별하기 어렵다.

이를 해결하기 위해 다양한 explainable/interpretable GNN 기법들이 제안되었으나 다음과 같은 한계가 있다.

정확도 vs. 설명 품질 trade-off: 강한 GNN 인코더의 정확도를 유지하는 방법(예: SubgraphX, GSAT)은 약하거나 불안정한 설명을 제공하는 반면, 본질적으로 해석 가능한 방법(예: PL4XGL)은 예측 정확도를 희생한다.
Instance-level isolation: 설명 구조가 인스턴스별로 독립적으로 생성되어, 데이터셋 전체에서 공유·재사용 가능한 구조적 vocabulary를 학습하지 못한다. 이로 인해 태스크의 일반화된 로직을 포착하지 못하고 설명이 불안정해진다.

즉, “설명 구조가 예측 메커니즘의 first-class, 재사용 가능한 구성요소”로 다뤄지지 않는 것이 공통된 한계이다.

2. 목표 (Goal)

다음을 동시에 만족하는 interpretable graph classification framework를 설계한다.

높은 예측 정확도: 최신 GNN 수준의 분류 성능
Faithful한 설명: 예측 logit이 인간이 이해할 수 있는 구조적 증거 단위로 명시적으로 분해되어야 함
Dataset-level 재사용성: 인스턴스별 독립적 설명이 아닌, 데이터셋 전반에서 공유되고 재사용 가능한 구조적 vocabulary 기반 설명 제공