AI-Resistant Programming Language Generation

1. 문제 (Problem)

대규모 언어 모델(LLM)의 코드 생성 능력이 급격히 향상되면서, AI는 기존 프로그래밍 언어로 작성된 코드를 이해하고, 생성하고, 변환하는 데 있어 인간에 근접하거나 이를 초월하는 성능을 보이고 있다. 이로 인해 다음과 같은 근본적 문제가 대두된다.

자율 무기 및 악성 코드: 악의적 행위자가 AI를 이용하여 malware, exploit, 자율 공격 시스템을 대량으로 생성할 수 있다.
Human-in-the-loop 보장: Safety-critical 시스템에서 “이 코드가 인간에 의해 작성·검증되었는가”를 확인할 기술적 수단이 없다.
인간 프로그래머의 역할: 인간만이 수행할 수 있는 프로그래밍 활동의 영역을 기술적으로 정의하고 보존하는 것이 중요하다.
AI 능력 통제: 프로그래밍 능력은 AI의 가장 강력한 능력 중 하나이며, 이를 선택적으로 제한할 수 있다면 AI safety의 중요한 도구가 된다.

현재 AI의 코드 능력을 제한하는 접근법은 대부분 사후적(post-hoc)이다:

사전적(proactive)이고 언어 수준(language-level)에서의 접근 — 즉 AI가 원천적으로 사용할 수 없는 프로그래밍 언어를 설계하는 것 — 은 아직 연구되지 않았다.

인간은 사용할 수 있지만 AI(특히 LLM)는 사용할 수 없는 프로그래밍 언어가 존재하는가? 존재한다면, 그러한 언어를 체계적으로 생성하는 함수를 구축할 수 있는가?

이 질문은 다음과 같은 인지적·계산적 비대칭에 기반한다:

인간의 강점: 시각·공간적 추론, 물리적 세계에 대한 직관, 유추에 의한 학습, 소수 예제로부터의 일반화, 사회적·문화적 맥락 이해, 감각 운동 통합
LLM의 약점: 진정한 시각적 이해 부재, 새로운 형식 체계에 대한 few-shot 학습의 한계, 학습 분포 밖의 구문·의미론에 대한 취약성, 장거리 구조적 의존성의 불완전한 추적

인간은 사용할 수 있지만 현재의 AI(LLM)는 사용할 수 없는 프로그래밍 언어를 체계적으로 생성하는 함수 G를 개발한다.

G : AI_capability × HumanCognition × SecurityParam → PL

구체적 목표: