table browser

今週から本格的に「UCSC Table browserを使ってrefseqのGTFファイルを作成する」の動画を作成することになりました。
そのためにいろいろとお勉強。この時間が一番楽しかったりします。
興味ある分野をバイトとしてやれるのが素晴らしい。
動画の方針としては、UCSC Table browserを使ってrefseqのGTFファイルを作成することと、前身動画のUCSC Table Browserを使い倒す http://togotv.dbcls.jp/20080502.html#p01 で紹介されている内容をまとめることの2つを収めることになりました。

以下個人的なメモ書きです。

まずは言葉の定義から。言葉の定義は正確に把握してないといけません。
CDS…タンパク質コード領域
exon…最終的に機能する転写産物に残る塩基配列で、最終的にアミノ酸配列に翻訳される部位

CDS≒exonと考えてたよorz
全然違うですよ。用語は正確に覚えましょう。

次にRefseqをGTFファイルで取得する方法のメモ書き


Refseqの取得方法(human)
1,cladeはmammal、genomeはhuman、assemblyは最新のものを、trackはRefseq Genesを選択。
table: Selects the SQL table data to use. This list shows all tables associated with the track specified in the track list.
2,tableは上記の説明通り。とりあえずはRefGeneを選択してみる。
3,regionはchr1を選択。指定しないとファイルが大きくなりすぎて説明がしづらい。
4,outputはGTF形式を指定。
5,output file に名前を入力することでwebブラウザ上にではなく、取得できる。
6,もちろん取得ファイルは圧縮して。
7,表示はタブ区切りを活かしてメモ帳ではなくエクセルやオフィスなどの表計算ソフトを用いる。

Refseqを用いて自分の持っているデータと比較して得られるものを探す使い方をするみたい。要調査。
@yag_aysさんのブログにはとてもお世話になっています。m(_ _)m

とりあえず欲しいものは取得できるようにはなったのですが、得られたものがどのように使われるのかイマイチやったことないので、把握できてない感じです。
元動画で紹介されている内容の理解も含め、来週の月曜は引き続きお勉強の予定です。
金曜か、遅くとも再来週には動画の作成を始めたいところです。