< 생물학 관련 대규모 포탈 >
National Center for Biotechnology Information (NCBI)
http://www.ncbi.nlm.nih.gov/
국제생명기술정보센터(National Center for Biotechnology Information, NCBI)에서는 염기서열 데이터베이스(GeneBank)를 비롯하여, 논문검색 데이터베이스(PubMed), 유전자 데이터베이스(Entrez Gene), 상동유전자 데이터베이스(HomoloGene), 단일염기서열 변이 데이터베이스(dbSNP), 단백질 구조 데이터베이스(PubChem) 등 50가지가 넘는 데이터베이스들과 이들을 활용하기 위한 프로그래밍 도구들(BLAST 등)을 제공한다.
Entrez Gene
http://www.ncbi.nlm.nih.gov/gene
Entrez Gene은 NCBI의 유전자 데이터베이스로서, 각 유전자에 대한 명명법, 간략한 설명, 유전자 서열, 전사 단백질 서열, 염색체상 위치 등의 정보를 담고 있다. 특히 Entrez Gene에서는 유전자마다 고유한 정수로 geneID를 부여하여, 이를 HomoloGene, UniGene, RefSeq 등 NCBI의 여러 데이터베이스 및 외부 다양한 데이터베이스에서 특정 유전자를 가리키는 ID로 널리 사용하고 있다.
Online Mendelian Inheritance in Man (OMIM)
http://www.ncbi.nlm.nih.gov/omim
OMIM은 존스 홉킨스 대학에서 생물학자 및 의사들이 인간 유전자와 유전질병 및 표현형질에 대한 연구와 논문 정보들을 모아서 정리한 데이터베이스이며, Entrez 데이터베이스 모음과 함께 국제생명기술정보센터에서 서비스를 제공하고 있다.
EVEX
http://www.evexdb.org/
EVEX는 Pubmed 에서 초록, 본문의 단어 검색을 통해 유전자와 단백질에 대해 간접적 또는 직접적으로 관련이 있는 정보를 검색해주는 text mining resource 이다.
Pathway Commons
http://www.pathwaycommons.org/
Pathway Commons는 생물학적 경로에 대한 정보를 제공하고 있다.
SpikeDB
http://www.cs.tau.ac.il/~spike/
Spike database는 interactive software tool과 함께 엄격하게 검증된 human signaling pathway들을 제공하고 있다.
IntAct
http://www.ebi.ac.uk/intact/
IntAct는 protein-protein, protein-small molecules, protein-nucleic acid 등의 통합된 문자 상호작용 정보를 제공한다.
STRING
http://string.embl.de/
STRING은 기존에 알려져있거나, 새로 예측된 protein-protein 상호작용 데이터베이스이다.
MINT
http://mint.bio.uniroma2.it/
MINT는 전문가들에 의해 쓰여진 과학저널의 protein-protein interaction중 실험으로 검증된 정보를 제공한다.
NCI-Nature Pathway Interaction Database (PID)
http://pid.nci.nih.gov
The Pathway Interaction Database (PID)는 인간 세포 신호 경로의 공개된 생의학적 데이터베이스를 제공하고 있다.
microRNA.org – Targets and Expression
http://www.microrna.org/microrna/home.do
microRNA.org는 microRNA target 예측과 expression profile의 통합된 자료를 제공하고 있다. Target 예측은 mammalian microRNAs의 최신 개요와 target rule에 대한 생물학 정보를 포함한 miRanda algorithm에 의해 이뤄진다.
bioDBnet
https://biodbnet-abcc.ncifcrf.gov/db/db2db.php
bioDBnet은 데이터베이스간의 식별자를 이용하여 데이터베이스간 네트워크를 제공한다.
Netpath
http://www.netpath.org
Netpath는 검증된 인간의 생체 신호 전달 경로들을 제공한다.
ConnectivityMap (cmap)
http://www.broadinstitute.org/cmap/
Connectivity Map은 유전자 발현 변화 특징을 이용하여 약물, 유전자, 질병 간의 기능성 연결을 발견하기 위해 pattern-matching algorithm과 bioactive small molecules 등을 처리하여 배양된 인간 세포로부터 얻은 genome-wide transcriptional expression data를 제공하고 있다.
SignaLink Database
http://signalink.org/
SignaLink 2.0은 신호 상호작용을 직접적으로 제어하는 단백질, 신호성 단백질의 발현량에 영향을 미치는 제어요소(transcription factors, miRNAs 등)에 대한 정보를 제공한다.
Tissue-specific regulatory circuits
http://regulatorycircuits.org
FANTOM5 data에 근거한 394개의 cell type-, tissue-specific gene regulatory network를 제공한다.
BioModels Database
http://www.ebi.ac.uk/biomodels-main/
BioModels Database는 biological processe의 컴퓨터 모델의 저장소로써, 수작업으로 검증된 613개의 모델과 검증되지 않은 903개의 모델이 있다.
BioModels Database
http://www.ebi.ac.uk/biomodels-main/
BioModels Database는 biological processe의 컴퓨터 모델의 저장소로써, 수작업으로 검증된 613개의 모델과 검증되지 않은 903개의 모델이 있다.
< 대규모 국제 공동 프로젝트 >
The Encyclopedia of DNA Elements (ENCODE)
http://genome.ucsc.edu/ENCODE/
ENCODE는 대규모 국제 유전체 프로젝트로 전사조절인자(transcription factor)의 결합부위, chromatin 3차원 상호작용, 후성유전체(epigenome) 데이터 등을 통합하는 데이터베이스이다. 이를 잘 모델링함으로써 정확한 조절 네트워크를 구성할 수 있는 가능성이 열리게 되었다.
Human Connectome Project (HCP)
http://www.humanconnectome.org/
HCP는 인간의 뇌 신경 연결망을 구조적, 기능적으로 매핑(mapping)하려는 프로젝트로, 뇌 이미징 장치의 발달로 쏟아지는 수많은 데이터를 통해 구축해나가고 있다.
Cancer Genome Project (CGP)
http://www.sanger.ac.uk/genetics/CGP/
CGP는 밝혀진 암과 관련된 유전적 돌연변이 정보들을 모으고, 특정 암에 대한 실험이 가능한 세포주를 개발하고, 약물에 대한 반응까지 집대성하려는 프로젝트이다.
Personal Genome Project (PGP)
http://www.personalgenomes.org/
PGP는 비영리단체에 의해, 인간의 생물학적, 특성별 정보를 해석하고 취합하여 제공하는 프로젝트이다.
< 시스템생물학 학회 및 커뮤니티 >
International Conference on Systems Biology (ICSB)
http://www.icsb2013.dk/
국제 시스템 생물학 학회(International Conference on Systems Biology, ICSB)는 매해 개최지의 조직위원회가 주관하고 시스템 생물학 및 합성 생물학의 세계적인 연구 동향을 파악할 수 있는 범세계적 국제 학술 대회이다. 2000년, 동경에서 1회 ICSB가 개최된 것을 시작으로 올해 코펜하겐에서 열리는 14회 째를 맞이하며 시스템 생물학의 중요성이 점차 대두되고 있는 만큼 시스템 수준의 세포 생물학, 생리학 및 약리학 그리고 의학에 이르기까지 포괄적인 생물학 분야를 다루고 있다.
Conference on Systems Biology of Mammalian Cells (SBMC)
http://www.sbmc2012.de/
포유류 세포 시스템 생물학 학회(Conference on Systems Biology of Mammalian Cells, SBMC)는 매 2년마다 개최되며 다양한 시스템 생물학 연구 분야 중 포유류 세포를 대상으로 한 연구 활동을 다루고 있으며 컴퓨터 시뮬레이션과 분자세포생물학적 실험이 결합된 융합적 방법론을 강조한다는 점이 특징적이다.
European Conference on Computational Biology (ECCB)
http://www.eccb12.org/home
유럽 지역 계산 생물학 학회(European Conference on Computational Biology, ECCB)는 컴퓨터 생물학 및 시스템 생물학 분야 학회 중에서도 가장 규모가 큰 학회 중 하나로 2002년에 시작되어 매년 혹은 2년에 한 번씩 유럽 지역에서 열린다. 시스템 생물학과 의약학 등을 포함한 다양한 컴퓨터 생물학 분야의 연구 활동에 대한 발표 및 논의로 진행되며 전산학, 수학 그리고 물리학의 근본 원리를 통해 생체 현상을 이해하는데 중점을 둔다.
The International Society for Systems Biology (ISSB)
http://www.issb.org/
ISSB는 국제 시스템생물학 공동체로 시스템생물학 연구에 관한 포럼과 토론 등의 학술 서비스를 제공하며, 매년 국제 시스템생물학 학회(ICSB)를 비롯하여 다양한 심포지엄, 워크숍, 교육 프로그램 등을 개최한다.
< Genome 관련 데이터베이스 >
Ensembl Genomes
http://ensemblgenomes.org/
Ensembl Genome은 영장류, 설치류, 로라시아테리아 등의 생물 60여종의 유전체 정보를 제공하는 데이터베이스이다.
Mouse Genome Informatics (MGI)
http://www.informatics.jax.org/
MGI는 Mouse의 전체 유전자 및 유전자 발현, 유전자 기능, 세포내 신호전달경로 등의 정보 뿐 아니라, 다양한 표현형 및 질병모델, 암 연구를 위한 여러 Mouse 모델에 대한 정보를 제공한다.
Zebrafish Information Network (ZFIN)
http://zfin.org/
ZFIN는 Zebrafish에 대한 유전체 정보 및 돌연변이 정보등을 제공하는 데이터베이스이다.
The Arabidopsis Information Resource (TAIR)
http://www.arabidopsis.org/
TAIR는 Arabidopsis thaliana에 대한 유전체 정보, 유전자 발현정보, 유전자 마커 및 대사정보 등을 통합적으로 제공하는 데이터베이스이다.
Flybase
http://flybase.org/
Flybase 는 모델 생물인 Drosophila melanogaster의 유전체 정보를 제공하는 데이터베이스이다.
Wormbase
http://www.wormbase.org/
Wormbase는 Caenorhabditis elegans에 대한 유전제 정보를 제공한다.
Xenbase
http://www.xenbase.org/
Xenbase는 모델 생물인 Xenopus tropicalis와 Xenopus laevis에 대한 유전제 정보를 제공한다.
Saccharomyces Genome Database (SGD)
http://www.yeastgenome.org/
SGD는 Budding yeast인 Saccharomyces cerevisiae에 대한 유전체정보 및 신호전달경로, 표현형정보 등을 통합적으로 제공하는 데이터베이스이다.
Encyclopedia of Escherichia coli K-12 Genes and Metabolism (EcoCyc)
http://ecocyc.org/
EcoCyc는 E-Coli. K-12 MG1655 관련 문헌들에 대한 전문가들의 검토를 기반으로 만들어진 데이터베이스로 전체 유전체 정보 및 전사 조절 정보, transporter 및 대사조절경로 등의 정보를 담고 있다.
Viral Bioinformatics Resource Center (VBRC)
http://www.vbrc.org/
VBRC는 Arenaviridae, Bunyaviridae, Flaviviridae, Filoviridae, Paramyxoviridae, Poxviridae, and Togaviridae 과에 속한 바이러스들에 대한 유전제 정보를 제공한다.
Gene Expression Omnibus (GEO)
http://www.ncbi.nlm.nih.gov/geo/
GEO는 국제생명기술정보센터에서 제공하는 유전자 염기서열기반 정보 및 유전자 발현 프로파일 실험결과들을 모아둔 데이터베이스로서, 마이크로어레이나 칩-칩(ChIP-chip) 실험 등을 통해 측정된 mRNA, 유전자 DNA, 단백질 분자 등의 정보를 담고 있는 데이터베이스이다. 현재 약 40,000 여 개의 실험 데이터를 포함하고 있다.
ArrayExpress
http://www.ebi.ac.uk/arrayexpress/
ArrayExpress는 유럽에 위치한 분자 생물학 연구 기관에서 제공하는 마이크로어레이를 통한 유전체 발현량 및 시퀀싱 데이터를 모아둔 데이터 베이스이다. 현재 약 30,000 여 개의 실험 데이터를 포함하고 있다.
Stanford Microarray Database
http://smd.princeton.edu/index.shtml
Stanford Microarray Database는 유전자 발현량 및 유전자 복제 수 변이(Copy Number Variation, CNV)등을 포함하는 데이터 베이스이다. 현재 약 20,000 여 개의 실험 데이터를 포함하고 있다.
cBioPartal
http://www.cbioportal.org/
cBioPortal은 Cancer Genomics의 가시화, 분석 정보와 large-scale cancer genomics data를 제공한다.
Genomic Data Commons (GDC)
https://gdc-portal.nci.nih.gov/
Genomic Data Commons (GDC)는 Data portal 사이트로써, NIH에 의해 제공된다. 39개의 프로젝트, 250,498개의 파일과 함께 14,531의 case들에 대한 정보를 제공한다. 대부분의 프로젝트들은 TCGA, 일부는 TARGET에 의해 제공된다. 기존의 TCGA data portal 을 대체하는 사이트이다.
Colon Cancer Atlas
http://www.colonatlas.org/
Colon Cancer Atlas는 다양한 형태의 실험-mass spectometry, Western blotting, immunohistochemistry, confocal microscopy, immunoelectron microscopy, FACS 등-으로부터 얻어진 정보로 구성된 데이터베이스이다. Mutation data는 sequencing으로부터, pathway data는 Reactome, NCI, Cell map, HumanCyc으로부터, protein-protein interactions은 BioGRID, HPRD로부터, Gene Ontology data는 Entrez Gene으로부터 얻은 정보이다.
OncoKB
http://oncokb.org/#/
OncoKB는 oncogenic mutation의 기능에 대한 정보를 제공한다.
TRED
https://cb.utdallas.edu/cgi-bin/TRED/tred.cgi?process=home
TRED는 human, mouse, rat에 대한 완성도 높은 genome wide promoter annotation을 제공하고 있다.
< 단백질 관련 데이터베이스 >
Protein Data Bank (PDB)
http://www.rcsb.org/
PDB는 핵산이나 단백질과 같은 생체분자에 대한 3차원 구조 정보를 무료로 제공한다. PDB 웹사이트는 생체분자의 3차원 구조를 시각화하는 도구도 포함하고 있으며, 해당 생체분자의 각종 관련 정보도 함께 제공하고 있다.
The Universal Protein Resource (UniProt)
http://www.uniprot.org/
UniProt는 단백질 서열 정보 및 기타 관련 정보에 관한 포괄적인 데이터베이스를 제공한다. 모든 데이터를 손수 관리(manual curation & annotation) 하기 때문에 고품질의 정보를 얻을 수 있다. UniProt의 재정적 지원은 주로 미국 NIH와 유럽 EMBL에 의해 뒷받침 되고 있다.
The Human Protein ATLAS
http://www.proteinatlas.org/
The Human Protein ATLAS는 항체-기반 단백질체(Antibody-Based Proteomics)를 통해 얻은 인체 단백질체에 관련된 각종 정보를 제공한다. 유전자나 단백질에 관하여, 여러 가지 인체조직, 암, 세포주에서 발현되는 단백질 정보 (면역조직화학 기반), 세포 내 단백질 위치 정보, 유전자 발현 정보 등의 다양한 정보를 제공한다.
< 생체네트워크 데이터베이스 >
Kyoto Encyclopedia of Genes and Genomes (KEGG)
http://www.genome.jp/kegg/
KEGG는 인간, 쥐, 식물, 곰팡이, 세균 등에 해당하는 대표 종들 및 여러 포유동물들에 대해 유전자 및 유전체 정보, 상호작용 정보 등을 제공하는 종합적인 데이터베이스이다. 유전자 정보에 대한 데이터를 포함하는 GENES, 효소에 대한 데이터를 포함하는 ENZYME, 네트워크에 대한 데이터를 포함하는 PATHWAY 등으로 이루어져 있다.
Reactome
http://www.reactome.org/
Reactome은 인간의 생체분자 상호작용 네트워크에 대한 데이터베이스로서, 전문가들에 의해 직접 수집 및 검열된 데이터로 이루어져있다. 현재 3,000여 개의 인간 단백질과 3,000여 개의 생체반응에 대한 정보를 포함하고 있으며, 이는 UniProt에 검열을 통해 등록되어있는 20,000개 인간 단백질의 12.5%에 해당한다.
Human Protein Reference Database (HPRD)
http://www.hprd.org/
HPRD는 30,000여개의 인간 단백질에 대하여 도메인 구조, 전사 후 변형 등에 대한 정보를 포함하는 40,000개 이상의 단백질 상호작용 정보를 제공하며, 이러한 정보들을 유저의 통합하여 보여주는 플랫폼이다.
The Biological General Repository for Interaction Datasets (BioGRID)
http://www.thebiogrid.org/
BioGRID는 주요 모델 종들에 대한 40,858개의 문헌 정보와 696,237개의 단백질/유전자 실험 데이터들을 통합하여 네트워크 정보를 제공하는 데이터베이스이다. 전체 상호작용 정보를 파일 형식이나 모델 종, 실험 방법 등에 따라 분류하여 제공한다.
Biomolecular Interaction Network Database (BIND)
http://bind.ca/
BIND는 세포내 단백질 상호작용, 분자 복합체, 신호전달경로들에 대한 정보들을 담고 있다. 이 데이터베이스는 분자들 간의 결합과 상호작용에 대한 개별적인 실험결과들과, 효모단백질잡종법(yeast two hybrid method), 질량분석 등을 통한 대규모 실험결과들로부터 수집된 정보들로 구축되어 있다.
< Cancer 관련 데이터베이스 >
Cancer Cell Line Encyclopedia (CCLE)
http://www.broadinstitute.org/ccle/home
CCLE는 대량의 human cancer cell lines의 유전적 특성을 상세하게 밝혀내기 위한 프로젝트로, 1000여 개의 cancer cell lines에 대한 DNA copy number, mRNA expression, mutation 등의 정보를 제공하고 각 cell line의 다양한 drug sensitivity도 제공한다.
The Cancer Genome Atlas (TCGA)
https://tcga-data.nci.nih.gov/tcga/
TCGA는 High-throughput genome sequencing을 통하여 다양한 cancer type의 mutation과 cancer patient의 clinical information을 함께 제공한다.
Catalogue of Somatic Mutations in Cancer (COSMIC)
http://cancer.sanger.ac.uk/cancergenome/projects/cosmic/
COSMIC은 문헌으로부터 cancer sample들의 somatic mutation 정보를 추출하여 정리한 사이트이다. 특정 cancer type에서 특정 gene의 mutation frequency도 제공한다.
< Drug 관련 데이터베이스 >
Drug Bank
http://www.drugbank.ca/
DrugBank database는 통합적인 drug target(sequence, structure, pathway 등) 정보와 구체적은 drug(chemical, pharmacological, pharmaceutical 등) 정보를 취합하여 고유의 생물정보학, 화학정보학 정보를 제공한다.
TARGET
https://ocg.cancer.gov/programs/target
Therapeutically Applicable Research To Generate Effective Treatments (TARGET)은 효과적인 치료를 위해 치료법으로 응용가능한 연구를 제공한다. 소아암을 유발하는 분자 변화를 알아내기 위한 통합적인 Genomic approch를 통해 molecular target을 발견하고 이를 임상적으로 이용될 수 있도록 정리된 정보를 제공한다. TARGET은 NCI의 Cancer Genomics and Cancer Therapy Evaluatino Program에 의해 운영된다.
PharmGKB
https://www.pharmgkb.org/
PharmGKB는 인간 유전자 변이의 약물반응에 대한 통합적인 정보를 제공한다.
GDSC
http://www.cancerrxgene.org
여러 약물에 대한 cell line의 drug sensitivity 정보를 제공한다.