빅데이터을 활용한 바이오인포매틱스 + 통계기초 + 딥러닝 실습에 대한 스터디입니다.
https://drive.google.com/drive/folders/0B6bSLTlVnagfTFJqV0dwRGdGMWs
- 통계 기초
- 딥러닝 실습( tensorflow )
- 빅데이터 기초
- 구글 genomics
- 빅데이터 유전체 분석
- 윈도우즈 환경에서 Jupyter와 R연동
- Markdown 문법
- Bengio 교수의 딥러닝 강의 - 딥러닝에 대한 깊은 통찰을 얻을 수 있음.
- 인공신경망과 딥러닝-무료 동영상 강의 한글
- udacity의 Deep Learning-무료 동영상 강의 영어
- Spark - 무료 동영상 강의 한글
- Hadoop - 무료 동영상 강의 한글
- Deepmind DQN 설치
- 논문 : Human-level control through deep reinforcement learning
- Distributed TensorFlow
- 분산 TensorFlow 컴파일 및 테스트
- 빅데이터분석-무료 동영상 강의 한글
- 하둡 및 Spark로 개발된 바이오인포 도구 목록
- 클라우데라 배포판으로 하둡 설치하기
- 실습 주제 : 암 환자 RNA정보를 활용한 암 예측 모델 개발
- 암환자 RNA 정보 획득방법 및 Data 구조파악
- 암환자 mRNA 데이터 수집 및 구조
- 암환자 mRNA데이터를 DB와 HBase에 올리기
- 암환자 mRNA에서 학습용, Valiaiotion용, Test용 데이터 만들기
- 공유폴더 > 빅바이오 > 참고자료 > 학습용 데이터
- mrna_20160125-200855_type1_00.pkl.gz 와 같은 파일이 24개, 전체 용량 700MB
- 장소: 토즈 신촌 아트레온토즈점 ( http://www.toz.co.kr/branch/main/index.htm?id=6 )
- 매주 화요일, 저녁 7시 30분~10시
- 시작: 2016년03월 08일
- 04월 05일 빅바이오:파트 2 - 1회차
- 03월 29일 빅바이오:파트 1 - 4회차
- 03월 22일 빅바이오:파트 1 - 3회차
- 03월 15일 빅바이오:파트 1 - 2회차
- 03월 08일 빅바이오:파트 1 - 1회차
| seq. | 날짜 | 내용 | 후기 |
|---|---|---|---|
| 1 | 2016. 3. 8 | (통계기초) Introductory Statistics with R (Chap. 1~2)(이승우) | 후기 |
| (딥러닝 실습) Getting Started(남광우) | 후기 | ||
| (빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 2장(지용기) | |||
| 2 | 2016. 3.15 | (통계기초) Introductory Statistics with R (Chap. 3~4)(성민경) | 후기 |
| (딥러닝 실습) MNIST For ML Beginners의 발표자료(유재용), MNIST For ML Beginners의 코드 | |||
| (빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 3장(우륭) | |||
| 3 | 2016. 3.22 | (통계기초) Introductory Statistics with R (Chap. 5~6), 이론설명(조현선) | |
| (딥러닝 실습) Deep MNIST for Experts, 용어설명(박혜진) | |||
| (빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 4장(이재환) | |||
| 4 | 2016. 3.29 | (통계기초) Introductory Statistics with R (Chap. 7~8)(서승연) | 후기 |
| (통계기초) 7장 실습, 8장실습 | |||
| (딥러닝 실습) TensorFlow Mechanics 101(박세진) | |||
| (빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 5장(박지환), 참고자료 |
| seq. | 날짜 | 내용 | 후기 |
|---|---|---|---|
| 1 | 2016.5.3 | (딥러닝 실습) 암 환자의 유전체데이터 및 데이터 변환작업 소개 ( TCGA )(지용기) | |
| (빅데이터 기초) 러닝 스파크(Learning Spark) 이론 : 3장(이승우) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) 실습 : 3장(이승우) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) : 4장(박혜진) | |||
| 2 | 2016.5.10 | (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 1, 실습1)(조익연) | |
| (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 1, 실습2)(조익연) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) 이론 : 5장(손준영) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) 실습 : 5장(손준영) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) : 6장(박세진) | |||
| 3 | 2016.5.17 | (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 2)(조익연) | |
| (빅데이터 기초) 러닝 스파크(Learning Spark) : 7장(지용기) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) : 8장(박혜진) | |||
| 4 | 2016.5.24 | (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(MLP) 이론(한성국) | |
| (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(MLP) 코드(한성국) | |||
| (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(데이터 변환 및 PCA 활용)(박혜진) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) : 9장(박세진) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) : 11장 이론(지용기) | |||
| (빅데이터 기초) 러닝 스파크(Learning Spark) : 11장 실습(지용기) |
| seq. | 날짜 | 내용 | 후기 |
|---|---|---|---|
| 1 | 2016.5.31 | (구글 genomics) https://cloud.google.com/genomics/what-is-google-genomics : | |
| What Is Google Genomics?, Pricing and Quotas , Getting Started | |||
| (빅데이터 유전체 분석) Data Algorithms: 1장 , 2장 | |||
| 2 | 2016.6.7 | (구글 genomics) https://cloud.google.com/genomics/what-is-google-genomics : | |
| Tutorials : Analyze Variants Using BigQuery | |||
| (빅데이터 유전체 분석) Data Algorithms: 5장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 6장 | |||
| 3 | 2016. 6.14 | (구글 genomics) https://cloud.google.com/genomics/what-is-google-genomics : | |
| Tutorials : Load Genomic Variants | |||
| (빅데이터 유전체 분석) Data Algorithms: 7장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 8장 | |||
| 4 | 2016. 6.21 | (구글 genomics) https://cloud.google.com/genomics/what-is-google-genomics : | |
| Tutorials : Running Broad Institute GATK | |||
| (빅데이터 유전체 분석) Data Algorithms: 9장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 10장 |
| seq. | 날짜 | 내용 | 후기 |
|---|---|---|---|
| 1 | 2016. 6.28 | (구글 genomics) https://cloud.google.com/genomics/what-is-google-genomics : | |
| Tutorials : Finding Public Data | |||
| (빅데이터 유전체 분석) Data Algorithms: 11장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 12장 | |||
| 2 | 2016. 7. 5 | (구글 genomics) http://googlegenomics.readthedocs.org/en/latest/ : | |
| Process Data on Google Cloud | |||
| (빅데이터 유전체 분석) Data Algorithms: 13장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 14장 | |||
| 3 | 2016. 7.12 | (구글 genomics) http://googlegenomics.readthedocs.org/en/latest/ : | |
| Access Genomic Data using | |||
| (빅데이터 유전체 분석) Data Algorithms: 15장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 16장 | |||
| 4 | 2016. 7.19 | (구글 genomics) http://googlegenomics.readthedocs.org/en/latest/ : | |
| Analyze Data in Google Genomics -> Analyze Reads | |||
| (빅데이터 유전체 분석) Data Algorithms: 17장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 18장 |
| seq. | 날짜 | 내용 | 후기 |
|---|---|---|---|
| 1 | 2016. 7.26 | (구글 genomics) http://googlegenomics.readthedocs.org/en/latest/ : | |
| Analyze Data in Google Genomics -> Analyze Variants | |||
| (빅데이터 유전체 분석) Data Algorithms: 19장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 20장 | |||
| 2 | 2016. 8. 2 | (구글 genomics) http://googlegenomics.readthedocs.org/en/latest/ : | |
| Analyze Data in Google Genomics -> Annotate Variants | |||
| (빅데이터 유전체 분석) Data Algorithms: 21장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 22장 | |||
| 3 | 2016. 8. 9 | (구글 genomics) http://googlegenomics.readthedocs.org/en/latest/ : | |
| Analyze Data in Google Genomics -> Learn More 1 | |||
| (빅데이터 유전체 분석) Data Algorithms: 23장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 24장 | |||
| 4 | 2016. 8.16 | (구글 genomics) http://googlegenomics.readthedocs.org/en/latest/ : | |
| Analyze Data in Google Genomics -> Learn More 2 | |||
| (빅데이터 유전체 분석) Data Algorithms: 25장 | |||
| (빅데이터 유전체 분석) Data Algorithms: 26장 |
