SlideShare a Scribd company logo
#NGLSBI

これから の
ライフサイエンス研究と
バイオインフォマティクス
Next Generation Life Science & Bioinformatics

坊農 秀雅
情報・システム研究機構(ROIS)
ライフサイエンス統合データベースセンター
(DBCLS)
Pictures from
http://g86.dbcls.jp/togopic/

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!1
#NGLSBI

坊農秀雅
• 読み: ぼうのうひでまさ
• 趣味: 道の駅&温泉巡り、スキー、元鉄オタ
• 専門:
‒バイオインフォマティクス
‒ゲノム生物学(微生物→マウス、最近は昆虫)

• ドメイン: bonohu.jp

• twitter可
• ハッシュタグは

!2

bonohu!
!

bono@dbcls.jp

#NGLSBI
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

本日のお題
1. ライフサイエンス研究の現状
2. バイオインフォマティクスとは
3. これからのライフサイエンス研
究とバイオインフォマティクス

!3

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

1. ライフサイエンス研究
の現状

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

Nature 464, 670-671 (2010)

!5

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

DNA塩基配列解読の超高速化
• かつてはSanger法
• 最近は「次世代シーケンサー(NGS)」
‒Illumina: Sequence By Synthesis
• http://www.youtube.com/watch?v=womKfikWlxM 	


‒Life Technologies(Applied Biosystems)
•ヌクレオチドがDNA鎖に取り込まれる過程でポリメ
ラーゼによって放出される水素イオンを検出
• https://www.youtube.com/watch?v=MxkYa9XCvBQ 	


‒PacBio: 一分子・リアルタイム(SMRT®)検出
• https://www.youtube.com/watch?v=NHCJ8PtYCFc
!6

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

exomeの例

!7

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

whole genomeの例

!8

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

遺伝医学の入門書
• 遺伝医学やさしい系統講義18講
‒ 例えば…
‒ 単一遺伝子疾患とメンデル遺伝学
‒ 多因子疾患の遺伝学
‒ エピジェネティックス
‒ 集団遺伝学
‒ 薬理遺伝学・ゲノム薬理学
‒ 遺伝カウンセリング
‒ など
!9

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

個人ゲノム解読: 新たな問題も

!10

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

MiSeq
• Illumina社のデスクトップ次世代シーケンサ
• 富山大学にも導入済み
• 最新の v3 試薬だと1runで
‒300塩基(base)
‒5000万リード
‒→15 Gb(参考: ヒトハプロイドゲノム 約3Gb)

!11

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

次世代シーケンサからのデータ
• FASTQフォーマットのファイル
‒4行/readが基本単位
‒MiSeq v3
•5000万リードx4行
•=2億行

SRR001356.1 2023DAAXX:5:1:123:563 length=33
TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC
+SRR001356.1 2023DAAXX:5:1:123:563 length=33
-IIIIIIII8IIIIIIIIIII6IIIIIIIII9I
@SRR001356.2 2023DAAXX:5:1:123:476 length=33
TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG
+SRR001356.2 2023DAAXX:5:1:123:476 length=33
IIIIIIIIIIIIIIIIIIIIIGIIIIIII-III
@SRR001356.3 2023DAAXX:5:1:121:746 length=33
GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT
+SRR001356.3 2023DAAXX:5:1:121:746 length=33
IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIII

• ファイルサイズも2Gbyte/file超
‒FAT32フォーマットでは扱えない

• いわゆる「開く」ことが不可能
!12

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

(・́ω`・)困ッタナァ...

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

2. バイオインフォマティクス
とは?

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

バイオインフォマティクスとは
• コンピュータを実験デバイスとして
使って、生物学的に有意な結論を引
き出そうとする学問
‒坊農秀雅(2002)

• 計算機科学の技術を応用して生物学
の問題を解こうとする学問
‒日本語版Wikipedia(2013/12/7版)

!15

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

バイオインフォマティクスの教科書
1. バイオインフォマティクスの歴史と全貌
2. 配列の収集と蓄積
3. 対にした配列のアラインメント
4. 配列アラインメントの確率的,統計的解析入門
5. 多重配列アラインメント
6. 類似配列のデータベース検索
7. 系統推定
8. RNA二次構造の予測
9. 遺伝子予測と遺伝子調節
10.タンパク質の分類と構造予測
11.ゲノム解析
12.PerlとPerlモジュールを用いたバイオインフォマティクス・プログラミング
13.マイクロアレイの解析
!16

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

バイオインフォマティクスの範疇
イメージ解析
遺伝子発現解析
!

アミノ酸配列解析
塩基配列解析
!

パスウェイ解析
シミュレーション

!17

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

(かつての)バイオインフォマ
ティクス研究者の職種別分類
• アルゴリズム屋!

数学的
抽象的

–方法を考える人!
–「NP完全」がキーワード!

• 実装屋!
–プログラムやツールを書く人!

ライフサイエンス研究
–プログラムを使って実際に生データを相手に手を
動かす人
者の範疇

• 解析屋!

生物的
具体的

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!1
!18 8
#NGLSBI

あなたも
バイオインフォマティクス研究者!
!19

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

!20

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

バイオインフォマティクス研究者の分類(改)
∼富山城の天守に喩えて∼

3. ガチ系
2. コマンドライン系
1. コピペ系
0. 他力本願

Photo by Hidemasa Bono on Dec.08, 2013
!21

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

1. コピペ系バイオインフォマティクス
• 配列断片などをコピー&ペースト(コピペ)して
GUI(Graphical User Interface)で解析
‒ウェブブラウザ上や専用ソフトウェア
‒コピペマティクスw

• 武器
‒ショートカットキー(例:

+C,

+V)

‒グーグル先生
‒ソーシャルネットワーク(SNS)
•Twitter
!22

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

2. コマンドライン系バイオインフォマティクス
• UNIXのコマンドライン上で、既存のツールを
組み合わせて解析をする
‒Command line User Interface(CUI) (cf. GUI)

• たまに捨てコードを書く
• 武器
‒shell script
‒Perl, Ruby
‒Python
‒R
!23

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

3. ガチ系バイオインフォマティクス
• ある解析技術に特化したプログラムを書く
‒例えば、BLAST

• ライフサイエンスに興味あるのかな…!?
• でもそういう人がプログラム作ってくれない
と…いつも大変感謝しております
• 武器
‒C, C++
‒Fortran
!24

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

0. 他力本願
• 他人にやらせる系
• 自分の研究テーマなのに
• 「あなた、本当に研究者?」
• 武器
‒自然言語(関西弁が多い)

!25

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

考察
•レベル0は論外。すぐにレベルアップを
•時代が経ってソフトウェアが進化すれば、
レベル1でもなんとかなる(はず)
•早く目的の課題を解きたいのであれば、
自らのレベルをさらに上げるしかない

ぼうのふは レベル2にあがった!
!26

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

レベルを上げるとは?
• レベル0→1
‒インターネットをもっと活用、ソフトウェア導入
など、自らの意識改革で実現可能

• レベル1→2
‒UNIX使いましょう
•MacOSX: 「アプリケーション」→「ユティリティ」
の「ターミナル」を常時起動
•Windows: cygwinを導入。できればMacOSXへ
‒ cygwin: UNIX系の便利なプログラムを利用するためのツール
!27

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

レベル1: GUIを決め込む
• NGS解析GUIソフトウェア(有償)
– CLC Genomics workbench http://www.clcbio.co.jp/	

– Avadis NGS http://www.avadis-ngs.com/	


• 遺伝子発現解析	

‒無償でいいものが多数	

–例えば、GSEA(Gene Set Enrichment Analysis)のDAVID!
–Google 検索して調べましょう

!28

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

マイクロアレイ解析
レベル1で可

遺伝子アノ
テーション

oligoprobeに対応する

遺伝子ごとの発現量
!29

Genespring
© 2013 DBCLS Licensed under CC 表示 2.1 日本

!29
#NGLSBI

データ形式の実際(マイクロアレイ)
• タブ区切りテキスト!
–数万(=スポットの数)行!

• (古い)Excelでも「開ける」!
–Excel2003の行数制限内!

• コマンドライン操作なしで中身が直接見れる

!30
!30

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

RNAseq
• 「次世代シーケンサを利用して、サンプル中
の RNA の中身に関する情報を得るために 
cDNA をシーケンシングする方法」!
–http://en.wikipedia.org/wiki/RNA-Seqより勝手に翻訳!

• Whole transcriptome shutgun
sequencing(WTSS) や!
• Transcriptome sequencingとも
!31

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

SRR001356.1 2023DAAXX:5:1:123:563 length=33!
TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC!
+SRR001356.1 2023DAAXX:5:1:123:563 length=33!
-IIIIIIII8IIIIIIIIIII6IIIIIIIII9I!
@SRR001356.2 2023DAAXX:5:1:123:476 length=33!
TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG!
+SRR001356.2 2023DAAXX:5:1:123:476 length=33!
IIIIIIIIIIIIIIIIIIIIIGIIIIIII-III!
@SRR001356.3 2023DAAXX:5:1:121:746 length=33!
GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT!
+SRR001356.3 2023DAAXX:5:1:121:746 length=33!
IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIII

FASTQ

RNAseq データ
解析の流れ 上流はレベル2

ゲノム
1.tophat
(bowtie)

2.cufflinks

ゲノムに対する多重配列アラインメント

.gtf
ゲノムアノ
テーション

予測転写単位ごとの
(推定)発現量情報
!32

.fa

.bam
遺伝子アノ
テーション

3.cummeRbund
© 2013 DBCLS Licensed under CC 表示 2.1 日本

!32
#NGLSBI

レベル2: UNIXの使い方(CUI)デモ
• 出典: http://bit.ly/unixdemo131209	

‒ grep	

‒ less	

‒ cut, sort, wc	

!

• どうしてもWindowsという人はcygwinを	

–http://togotv.dbcls.jp/20110520.html 

!33

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

レベル1-2

http://www.hiroogakuen.jp/weblog/archives/17598
!34

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

学部生でレベル2だとこんなことも
• 現在、学部4年生!
• First authorの論文がすでにaccepted

!35

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

3. これからの
ライフサイエンス研究と
バイオインフォマティクス

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

バイオインフォマティクス
スキルがあれば、ライフサ
イエンス研究はできるか?
NO
http://www.geocities.jp/papertoy_box/make/98CmdCar.html

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

車輪の両輪
http://www.geocities.jp/papertoy_box/make/98CmdCar.html

•バイオインフォマティクス
を含めた実験スキル
•ライフサイエンスの知識
研究前進
!38

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

ライフサイエンスの知識
•蓄積された事実
‒ (これまで)教科書
‒(最近は)データベース
• 特定のテーマに沿ったデータを集めて管
理し、容易に検索・抽出などの再利用を
できるようにしたもの
!39

© 2013 DBCLS Licensed under CC 表示 2.1 日本
ライフサイエンス分野の
データベース

#NGLSBI

• PubMed, PubMedCentral(PMC)
‒論文のデータ

• DDBJ/EMBL/Genbank
‒塩基配列データ

• UniProtKB(かつてのSwissProt)
‒アミノ酸配列データ

• PDB
!40

‒タンパク質の立体構造データ

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

データベース乱立時代
• Nucleic Acids Research
• 毎年年頭にDatabase issueを発刊
• 2013年(最新版)の巻頭言
– http://nar.oxfordjournals.org/content/41/D1/D1.abstract	


• 1,512のDB!
• 多すぎ。把握困難

統合しましょう
!41

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

日本の「統合DB」とは?
• 生命科学分野のいわゆる「公共データベース」
• ライフサイエンスデータの流通業
• NBDC 、 DBCLS、DDBJ

を中心に  

日本中のさまざまな大学・研究機関が協力
• 安心してすぐに利用できるデータを提供
• 公共DBとして外に出す際にデータを綺麗に

!42
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

無料で使えます
• 基本的にユーザー登録なし
• for profit(企業の方)もタダ

!43
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

じゃ、どうやって?
• やりたいことを「インターネット検索」して
見つかります
‒ 要するにググって下さい

• 見つからない場合は、NBDC portalから
‒ かつてのYahoo!的なindexサイト

!44
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

http://biosciencedbc.jp/

!45
© 2013 DBCLS Licensed under CC 表示 2.1 日本
IntegbioDBカタログ

#NGLSBI

!46
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

生命科学DB横断検索

!47
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

生命科学DBアーカイブ

!48
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

バイオサイエンスデータベース
センター(NBDC)
•National Bioscience Database Center
‒Since 2011

•独立行政法人 科学技術振興機構(JST)の傘下

!49
http://biosciencedbc.jp/about-us/projects-and-activitiesより引用

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

RDFによるDB統合
ゲノムの配列情報と多種多様なアノテーションデータを個別のオン
トロジー、データ変換プログラムを開発し RDF 形式にして統合
ゲノム配列
NCBI: BioProject/RefSeq
-- 既存のリファレンス配列
DDBJ: Annotation
pipeline/GTPS -- 新規ゲノ
ム配列

実験・メタデータ
INSDC, NCBI: SRA, GEO

DBCLS: RefEx, Kusarinoko
GOLD, GSC: 環境メタデータ

Bulk data: 文献, 画像 ...

オントロジー
NCBO: BioPortal, OBO
(GO, SO ...)
DBCLS: MEO, GMO,
MCCV ...


アノテーション
UniProt: Protein
functions and links
Formats: GFF3, GTF,
GVF, DAS, BED ...
Tools: Cufflinks, BLAST,
InterProt ...

Slide from トーゴーの日シンポジウム2013
「データベース統合の実現に向けて2」
by 岡本忍 (DBCLS)
!50

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
http://qa.lifesciencedb.jp/

#NGLSBI

LSQA

!51
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

和を以て貴しと為す

継続的に維持管理していくことが大事
!52
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

全部紹介している時間ないので

!53
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

統合DBの活用法
統合TV

http://togotv.dbcls.jp/
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

統合TV (togoTV)
•動画によるDBやツールのチュートリアル
‒ 各DBやツール名で検索

http://togotv.dbcls.jp/

•統合データベース講演会AJACSの動画も
•YouTubeにも
http://youtube.com/togotv

•約750の動画             
(アップデート込)
クリエイティブ・コモンズ 表示 2.1 日本

!55

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

NGS

!56
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

!57
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

!58
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

!59
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

MotDB
• Master of the DB「データベースの達人」
‒ 「もっとDB? もういらん、増やさんといて!」

• 統合DB講習会のテキスト置き場
‒ DBやツールの使い方の宝庫

http://MotDB.dbcls.jp/

‒ 例えば…
•RNAseq,ChIPseqのRによる解析方法
•遺伝子発現データの生物学的解釈方法
•Local BLASTのやり方(MacOSX, Windowsの両方)
!60
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

統合DBの活用法
1. 文献データ
新着論文レビュー
領域融合レビュー
Allie: 生命科学分野の略語/展開形検索
inMeXes: 逐次PubMed表現検索
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

大人気のサービス
!62

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
#NGLSBI

新着論文レビュー
http://first.lifesciencedb.jp/

クリエイティブ・コモンズ 表示 2.1 日本
!63

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
#NGLSBI

領域融合レビュー
http://leading.lifesciencedb.jp/

クリエイティブ・コモンズ 表示 2.1 日本
!64

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
#NGLSBI

http://allie.dbcls.jp/

!65

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
#NGLSBI

inMeXes

!66

http://docman.dbcls.jp/im/

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
#NGLSBI

!67

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
#NGLSBI

Life
Science
Dictionary
のサイトにリンク

!68

©© 2013 DBCLS Licensed under CC 表示 2.1 日本
2013 DBCLS Licensed under CC BY 2.1JAPAN
#NGLSBI

統合DBの活用法
2. 塩基配列データ
DDBJ
DBCLS SRA
GGRNA
GGGenome
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

突然ですが…DBCLS移転します
• 2013年度末に
‒ 柏の葉キャンパス駅前のビル
‒ 遺伝研DDBJ/CIBの隣のビル

• 「統合」なのに分割移転w
‒ 予算的、制度的な都合

• 物理的に「統合」
‒ DDBJ+DBCLS(一部)
でも、前から協調してやっています
© 2013 DBCLS Licensed under CC 表示 2.1 日本

!70
#NGLSBI

!71
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

1. DBCLS SRA
Pipeline to help re-use public NGS data
Search data

• Yellow pages for NGS data archived!
–Indexed by metadata. Search by....!

Download

Quality Check

• Statistics!
• Publications!
• Diseases!

–Direct link to original DB(SRA)!
Data processing

Analysis

• Pre-calculated QC data

http://SRA.dbcls.jp/
!72
© 2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

Statistics: studies

!73

Picture from Togo Picture Gallery http://g86.dbcls.jp/togopic/©2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

PUBLISHED OR NOT
公開されたデータを元にした論文はあるのか

19%

「論文を公開してから
データを公開する」!
とは限らない
paper published
not published

NUMBER OF SUBMITTED STUDY

!74
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

Search by publications

http://bit.ly/sra2pubmed

!75
© 2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

Search by diseases

!76
© 2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

Search by diseases(cont.)

Nakazato T, Ohta T, Bono H!
Experimental design-based functional mining and characterization of
high-throughput sequencing data in the Sequence Read Archive.!
PLOS ONE. 2013; doi: 10.1371/journal.pone.0077910
© 2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本

!77
#NGLSBI

GGRNA

GooGle ライクな RNA 検索エンジン
http://GGRNA.dbcls.jp/

■ あらゆるキーワードや塩基配列・

  アミノ酸配列からすばやく簡単に

  遺伝子を検索するウェブサーバ
■ RefSeqのmRNA+ncRNAを

  高速に全文検索する
■ PCRのプライマー、マイクロ

  アレイのプローブ、siRNAの

  標的配列を即座に確認
■ REST API提供により外部の

  システムと連携可能

!78
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

GooGle ライクな Genome 検索エンジン
http://GGGenome.dbcls.jp/
Genomeも検索できたらええなあ…

やりましょう!!

!79
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

統合DBの活用法
3. 遺伝子発現データ
NCBI GEO目次
RefEx

© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

GEO目次

!81
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

同じようなものが一杯あって、
どれを選んでいいか、わからない

!82
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

RefEx: 遺伝子発現
リファレンスデータセット
• 臓器ごとの発現比較を4つの実験手法と
BodyParts3Dで
http://RefEx.dbcls.jp/
‒正常組織・臓器における遺伝子発現のリファレンス
‒再利用可能で有用なパブリックデータの活用例
•「組織特異的遺伝子」検索機能の実装

EST

GeneChip

Classical Expressed Sequence Tags

Affymetrix’s microarray

CAGE

RNAseq

Cap Analysis of Gene Expression

Transcriptome Sequencing
© 2013 DBCLS Licensed under CC 表示 2.1 日本

!83
#NGLSBI

http://RefEx.dbcls.jp/

!84

© 2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

!85
© 2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

!86
© 2013 DBCLS Licensed under CC BY 2.1JAPAN
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

結語
整備されてきた
公共データベース
をうまく活用して
自分のやっている
ことに役立ててい
きましょう!
私もやっています
!87
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

いつでもどこでもタダじゃない…

!88
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

結語2

!89
© 2013 DBCLS Licensed under CC 表示 2.1 日本
#NGLSBI

御清聴ありがとうございました
We all level 2 and more!

スライドのありか	

http://bit.ly/bono131209

bonohu!
bono@dbcls.jp photo by @hirabat (1st Bono Conference on 20130113 )

!90
!90

© 2013 DBCLS Licensed under CC 表示 2.1 日本

More Related Content

PDF
DDBJing on 20140612 by Hidemasa Bono
Hidemasa Bono
 
PDF
バイオインフォマティクス(2013年度以降用改訂版)
Hidemasa Bono
 
KEY
Ajacs33 文献の検索とその整理方法
yayamamo @ DBCLS Kashiwanoha
 
PDF
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
Hidemasa Bono
 
PDF
20201125_DwCデータセットの作成方法
Kumiko Totsu
 
KEY
第52回生命科学夏の学校
yayamamo @ DBCLS Kashiwanoha
 
PDF
バイオインフォマティクスによる遺伝子発現解析
sesejun
 
DOC
克服拖延
fishhow
 
DDBJing on 20140612 by Hidemasa Bono
Hidemasa Bono
 
バイオインフォマティクス(2013年度以降用改訂版)
Hidemasa Bono
 
Ajacs33 文献の検索とその整理方法
yayamamo @ DBCLS Kashiwanoha
 
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
Hidemasa Bono
 
20201125_DwCデータセットの作成方法
Kumiko Totsu
 
第52回生命科学夏の学校
yayamamo @ DBCLS Kashiwanoha
 
バイオインフォマティクスによる遺伝子発現解析
sesejun
 
克服拖延
fishhow
 

Viewers also liked (6)

PPTX
Why Transcriptome? Why RNA-Seq? ENCODE answers….
Mohammad Hossein Banabazi
 
PDF
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)
Masahito Ohue
 
PDF
RNAseqによる変動遺伝子抽出の統計: A Review
sesejun
 
PDF
Python入門 : 4日間コース社内トレーニング
Yuichi Ito
 
PDF
学振特別研究員になるために~2018年度申請版
Masahito Ohue
 
Why Transcriptome? Why RNA-Seq? ENCODE answers….
Mohammad Hossein Banabazi
 
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)
Masahito Ohue
 
RNAseqによる変動遺伝子抽出の統計: A Review
sesejun
 
Python入門 : 4日間コース社内トレーニング
Yuichi Ito
 
学振特別研究員になるために~2018年度申請版
Masahito Ohue
 
Ad

Similar to “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics) (20)

PDF
ライフサイエンスデータベースの現状
Takeru Nakazato
 
PDF
新規医療開発に関わる統計学 (バイオインフォマティクス)
Hidemasa Bono
 
PDF
BioHackathon 2015 report
Toshiaki Katayama
 
PDF
Swc2013 yamamoto
yayamamo @ DBCLS Kashiwanoha
 
PDF
データベース活用による 知のめぐりのよい細胞生物学
Hidemasa Bono
 
PPTX
R勉強会20140421.upload
Hiromi Matsumae
 
PDF
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
DNA Data Bank of Japan center
 
PDF
NGSを用いた研究解析のためのオンラインリソースの現状
Takeru Nakazato
 
PDF
生物多様性情報をとりまくデータベースの現状
Takeru Nakazato
 
PDF
バイオインフォ講義1
Mas Kot
 
PPTX
Advanced medicalresearchcenterbioinformatics1
Jun Nakabayashi
 
PDF
StatGenSummerSchool2023_GenomeDataAnalysis1.pdf
The University of Tokyo, Osaka University, RIKEN IMS
 
PDF
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
Genaris Omics, Inc.
 
PDF
Qaシステム解説
yayamamo @ DBCLS Kashiwanoha
 
PDF
Now and then: next-generation sequencing database to encourage the big data s...
Tazro Ohta
 
PDF
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
Genaris Omics, Inc.
 
PDF
最近のRのランダムフォレストパッケージ -ranger/Rborist-
Shintaro Fukushima
 
PDF
rcast_20140411
Preferred Networks
 
PDF
[All-in-one2015] 文献情報関連サービス活用法
DNA Data Bank of Japan center
 
PDF
バイオインフォ講義4
Mas Kot
 
ライフサイエンスデータベースの現状
Takeru Nakazato
 
新規医療開発に関わる統計学 (バイオインフォマティクス)
Hidemasa Bono
 
BioHackathon 2015 report
Toshiaki Katayama
 
データベース活用による 知のめぐりのよい細胞生物学
Hidemasa Bono
 
R勉強会20140421.upload
Hiromi Matsumae
 
[All in-one2017] 誰でも使える最先端の研究成果/今日からあなたも生命科学者
DNA Data Bank of Japan center
 
NGSを用いた研究解析のためのオンラインリソースの現状
Takeru Nakazato
 
生物多様性情報をとりまくデータベースの現状
Takeru Nakazato
 
バイオインフォ講義1
Mas Kot
 
Advanced medicalresearchcenterbioinformatics1
Jun Nakabayashi
 
StatGenSummerSchool2023_GenomeDataAnalysis1.pdf
The University of Tokyo, Osaka University, RIKEN IMS
 
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
Genaris Omics, Inc.
 
Qaシステム解説
yayamamo @ DBCLS Kashiwanoha
 
Now and then: next-generation sequencing database to encourage the big data s...
Tazro Ohta
 
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
Genaris Omics, Inc.
 
最近のRのランダムフォレストパッケージ -ranger/Rborist-
Shintaro Fukushima
 
rcast_20140411
Preferred Networks
 
[All-in-one2015] 文献情報関連サービス活用法
DNA Data Bank of Japan center
 
バイオインフォ講義4
Mas Kot
 
Ad

“これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)