강좌 정보
2026 제20회 통계유전학워크샵
20th Asian Institute in Statistical Genetics and Genomics
기본 개요
강좌명
13. 고급통계분석 모델을 활용한 유전체 연관성 분석
주강사
선호근 (부산대학교)
조교
-
날짜
2026.07.22 09:20 ~ 2026.07.22 17:10
강좌 방식
오프라인
강좌 정보
이 수업은 유전체 데이터 연관성 분석(genetic association study)을 목적으로 하며 고급통계분석 모델을 활용하여 질병 관련 유전체 및 마커를 선별하는 방법을 학습한다. 주로 penalized regression 통계분석 모델들을 다룰 예정이며 기초 이론에 대한 설명과 R 패키지를 활용한 실습을 병행한다. 주요 분석모델로는 고차원 유전체 데이터 분석에 가장 많이 사용되는 lasso와 elastic-net, 그리고 유전체 그룹 및 genetic pathway를 선별하는 group lasso를 포함하고 있다. 또한 유전체 네트워크를 활용한 network-based regularization, 유전체의 개별 효과와 그룹 효과를 동시에 고려하는 sparse group lasso와 group exponential lasso에 대해서도 간략하게 소개한다. 수업에서 사용하는 데이터는 breast cancer 관련 gene expression 데이터와 ovarian cancer 관련 DNA methylation 데이터이다. Penalized regression 통계분석 모델들을 활용하여 각각 breast cancer 관련 genes와 ovarian cancer 관련 CpG sites 및 genes를 선별하는 R 실습을 진행한다.
기타
인터넷 접속 필요여부
웹서핑
동영상
파일 다운로드
기타
교육생 개인 노트북
필요 필요하지 않음
세부 안내사항
R 프로그램이 원활하게 실행되는 노트북 필요 (Windows 와 Mac 모두 사용 가능)
수강생 수준

- 강좌 난이도: 상

- 수강생 수준: R 프로그램에서 사용하는 기본 명령문들을 이해하고 통계 선형회귀모형(linear regression model)에 대한 기초 지식을 가지고 있는 수강생을 대상으로 함.

수강생 준비물
R 최신버전 및 필요한 R 패키지를 설치한 후 참석하기 바람.
기타 안내사항

- 수업시간에 사용할 R 패키지 설치 관련하여 추후 안내가 있을 예정임.

- R code를 포함한 강의 노트는 추후 pdf 파일로 제공됨.

교육일정
구분 세션 시간 강의내용 강사명 비고
Day 1 Session 1 09:20~10:50 유전체 선별을 위한 Lasso (Lasso for gene selection) 선호근 강의/실습
Day 1 Session 2 11:00~12:30 유전체 선별을 위한 Elastic-net (Elastic-net for gene selection) 선호근 강의/실습
Day 1 Session 3 14:00~15:30 유전체 그룹 선별을 위한 group lasso 와 추가 분석모형들 (Group lasso and other models for genetic pathway selection) 선호근 강의/실습
Day 1 Session 4 15:40~17:10 난소암 DNA 메틸화 데이터 분석 (Analysis of high-dimensional DNA methylation ovarian cancer data) 선호근 강의/실습