TargetDiff 재현 코드

TargetDiff 원본 코드를 참고해 학습과 샘플링 흐름을 간단히 재작성한 코드임. 이 저장소의 핵심 목적은 62000.pt checkpoint를 사용해 test set pocket 100개(data_id=0..99)에 대해 ligand를 샘플링하는 것임.

전체 흐름:

src/train_diffusion.py -> checkpoint 생성
src/sampling.py        -> test set pocket별 ligand 샘플링

주요 파일

config.yml: 학습 설정 파일
sampling.yml: 샘플링 설정 파일. 기본 checkpoint는 62000.pt
run_sample_test100.sh: data_id=0..99 전체에 대해 샘플링 실행
run_full_train_and_sample.sh: 학습 수행 후 최신 checkpoint로 test100 샘플링 실행
src/train_diffusion.py: diffusion model 학습 코드
src/sampling.py: 특정 pocket에 대해 ligand를 샘플링하는 코드
src/dataset.py, src/diffusion.py, src/network.py, src/reconstruct.py: 데이터 처리, 모델, diffusion, 분자 재구성 핵심 코드
src/build_lmdb.py: pocket/ligand 파일에서 LMDB를 만드는 선택용 유틸리티
src/evaluate_diffusion.py: 보조 평가 스크립트. 원본 TargetDiff의 utils/ 계열 코드와 docking 도구 필요. 최소 샘플링 재현 경로에는 포함되지 않음

필요한 파일

데이터 파일은 용량이 커서 Git에 포함하지 않음. 실행 전에 아래 경로에 직접 준비 필요.

data/crossdocked_pocket10_pose_split.pt
data/crossdocked_v1.1_rmsd1.0_pocket10_processed_final.lmdb

샘플링에 사용하는 checkpoint는 저장소에 포함.

logs_diffusion_full/targetdiff_cjkim_full_gpu/checkpoints/62000.pt

위 경로는 sampling.yml과 run_sample_test100.sh의 기본값과 일치.

환경

conda 환경 생성:

conda env create -f environment.yml
conda activate targetdiff

environment.yml은 CUDA 11.8용 PyTorch/PyG wheel 기준으로 작성됨.

주요 필요 패키지:

torch
torch_geometric
torch_scatter
rdkit
openbabel
lmdb
scipy
numpy
pyyaml
tqdm
tensorboard

특히 torch, torch_geometric, torch_scatter는 서로 호환되는 버전으로 설치 필요.

Test100 샘플링

기본 실행:

bash run_sample_test100.sh

샘플 수, batch size, diffusion step 수 변경은 환경변수 사용.

NUM_SAMPLES=100 BATCH_SIZE=16 NUM_STEPS=1000 bash run_sample_test100.sh

결과 저장 위치:

sampling_results_full_test100/

학습부터 샘플링까지 실행

학습을 다시 수행한 뒤, 생성된 최신 checkpoint로 test100 샘플링까지 실행하는 스크립트:

bash run_full_train_and_sample.sh

예시:

TRAIN_MAX_ITERS=71000 TRAIN_TAG=cjkim_full_gpu bash run_full_train_and_sample.sh

Git에 포함하지 않는 파일

아래 파일과 폴더는 로컬 데이터 또는 실행 산출물이므로 .gitignore에 포함.

data/
logs_diffusion*/              # 단, 62000.pt는 예외로 포함
sampling_results*/
targetdiff_eval_meta_full_test100/
sampling_runtime*.yml
*.lmdb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TargetDiff 재현 코드

주요 파일

필요한 파일

환경

Test100 샘플링

학습부터 샘플링까지 실행

Git에 포함하지 않는 파일

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
logs_diffusion_full/targetdiff_cjkim_full_gpu/checkpoints		logs_diffusion_full/targetdiff_cjkim_full_gpu/checkpoints
src		src
.gitignore		.gitignore
README.md		README.md
config.yml		config.yml
environment.yml		environment.yml
run_full_train_and_sample.sh		run_full_train_and_sample.sh
run_sample_test100.sh		run_sample_test100.sh
sampling.yml		sampling.yml

Folders and files

Latest commit

History

Repository files navigation

TargetDiff 재현 코드

주요 파일

필요한 파일

환경

Test100 샘플링

학습부터 샘플링까지 실행

Git에 포함하지 않는 파일

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages