ドリフトのアレル頻度変化のグラフ作成

遺伝的浮動 Java

ごく大雑把なつくりのドリフトシミュレーションソース package popGenet;public class Drift { /** * @param args */ int initpopsize; double mutrate; int numgen; //int popsizepattern;//0 constant, 1 exponential double expcoeff; public static void…

2007-06-27

関数

Java

Regularized Gamma functionをJavaで使う用があって、Apache JakartaプロジェクトのCommons Mathを入れることにした。パスの通し方など、基本的なところがまったくわかっていないので、右往左往した。結果は以下の通り。 Commonsのサイトから Mathを選んで、…

2007-06-01

トレンドテスト

ソースの書き直し

Java Perl

Java(など)は、構造を持ったデータを格納するのに便利だ。Perl(など)に書き直すときに、この構造を移転するには、perlのリファレンスを用いる。今、Javaのクラスで int v1; int[] v2; String[] v3; なるデータを格納したクラスがあるとする。これに対応し…

2007-01-28

ソート

Java

ソートにはいろいろある。整列した多数の配列を全部つなげて非常に長い配列を作るのに、時間がかかって困る。マージソートを使っているが・・・こんなサイトがありました。

2007-01-20

Allelic associationのこと

Genomic control 連鎖不平衡 Allelic assocition Java Fisher

Allelic associationとは、あるサンプル集合について、２箇所の多型のアレルの間に相関があることを言う。一般集団においては、連鎖不平衡による相関もあり、これはDNA上の物理的距離との関係が強い。また、集団に構造がある場合には、構造の存在によりAllel…

2007-01-16

丸めたい

Java

丸めるとき、四捨五入をよくする。Javaの四捨五入については、浮動小数点問題とか、いろいろあって、BigDecimalを使うこととかは、ウェブ上でもすぐに検索できる。今、double型で、かなり幅の大きな数値があるとする。とを丸めたいときとかがある。こんな…

2007-01-14

離散的統計量のハンドリング

Java 統計

統計量Sがある。この統計量は、なる値のいずれかをとるような離散的なものとする。たとえば、ある周辺度数を満足するような分割表には有限な場合しかなく、この周辺度数に対応するフィッシャーの正確確率Pはこのような統計量である。 Javaでこれをハンドリ…

2007-01-13

exactP値の確率

統計 Java

ある分割表データがある。その周辺度数がある。その周辺度数からは、有限個パターンの分割表が作れる。それらが与えるexactP値は有限個である(分割表の個数以下。異なる分割表から同一のexactP値が与えられることもあるので必ずしも一致しない）。そのex…

2007-01-03

正確確率検定では、P=1となる確率が高い

統計 Java

Fisherの正確確率検定においては、観測された分割表の周辺度数を満足するという条件の下に、とりうるすべての分割表について、その生起確率を求める。この確率が、観測された分割表のそれ以下であるような分割表について、生起確率を足し合わせたものが、P値…

2006-12-31

多次元度数分布

度数分布 Java

通常の度数分布(尺度がひとつ)の度数分布をさらさらと標準出力で描きたいことはよくある。さらに、多次元のdouble型データから、次元別に件数をカウントしたいこともある。"DiscreteMathTools.Tensor"はこちら。２次元尺度の度数をプロットするには、３次元…

2006-10-14

カイ自乗統計量

独立性検定 Java

複数のカテゴリカル変数からなる多次元分割表を考える。k変数あり、それぞれがdk個のカテゴリを持つとき、分割表のセル数はである。このセルについて、独立仮説に基づいた期待値を求め、観測値と期待値とから算出されるカイ自乗統計量は、多次元分割表の独立…

2006-10-06

標準化した分割表

検定 Java

先日、Staged approachデータをJoint analysisする件についての記事を書いた(こちら)。その中で、Staged approachでの各ステージでのサンプルサイズは、ケース・コントロールで同数であるものとして統計量を求め、その値の関係を論じた(引用文献に準拠)。そ…

2006-10-02

Fisherの正確確率検定

統計 Java

nxm分割表の正確確率検定先日、HWE検定の正確確率検定版について記載した(こちら)。ついでに、いわゆるFisherの正確確率検定のnxm分割表用のソースも載せる。解説は、群馬大青木先生のこちらのページがよくわかる。 public static double Fishernxm2(int[]…

2006-09-29

HWEの正確検定

Hardy Weinberg平衡 Java

わけあって、J.E. Wigginton, G.R. AbecasisらによるHWE正確検定をJava化する必要が出た。このソースは、著者らにより、C/C++,R,Fortranにて公開されている。 N人、2N本染色体、アレル(A/B)、,,、,、と表すこととすると、 ,と表せる。また、2N本のアレルの…

2006-09-18

Partial correlation coefficient関連ソース

統計相関 Java

Partial correlation coefficientの記事はこちらソースは、昨日の記事に追加

2006-09-17

Multiple correlation coefficient関連ソース

統計相関 Java

Multiple correlation coefficientの記事はこちら Utilesパッケージ(自分の)に以下の６ソース Calculator InOutUtils InvMat MiscUtil MultRegression TestRun DiscreteMathToolsパッケージ(自分の)以下のソースも呼び出している MatrixExec Utils.TestRunを…

2006-09-01

Nucleotide diversity

Java 集団遺伝学 Glossary

前項のnucleotide polymorphismではDNA配列集団に存在する多型の分布を見たが、nucleotide diversityでは、集団を構成するDNA分子同士の異同箇所を問題にする。全ペアにつき、異なる塩基箇所を数え、その和を、全ペア数ｘDNA配列長にて除す。その分散も、ソ…

2006-09-01

Nucleotide polymorphism

Java 集団遺伝学 Glossary

ある集団で、n本の染色体の長さkの配列を観測したところ、m箇所に多型性が認められた。今、 Principles of Population Genetics 作者: Daniel L. Hartl, Andrew G. Clark 出版社/メーカー: Sinauer Associates Inc 発売日: 1997/10 メディア: ハードカバー …

2006-08-13

False Discovery Rate

Multiple tesitngs FDR Java

多数の仮説検定を行っている。ある棄却水準を与え、多数の仮説のどれが棄却されどれは棄却されないかを判定する方法のひとつ。基本となる考え方はこう。具体的に。 100個の仮説を検定しているとする。100個の仮説のそれぞれに、個別仮説検定P値を得る。独…

2006-08-12

集合・べき集合・べき集合から作る組み合わせ

組み合わせ離散数学 Epistatis Java

要素数k個の集合があるそのべき集合はの要素を持つ。べき集合の要素であるサブセットは、i=0,...,k個の要素を持つ。i=pなるサブセットの数は通りある一方、要素数iの集合(サブセット)を、q=2,3,...,i個の更なるサブセットの組に分けるわけ方は、http://d.…

2006-08-11

第12章　アプリケーション

駆け足で読むシリーズパーミュテーションテスト多変量解析教科書 Java

著者のホームページ(こちら)

2006-08-11

第11章　繰り返し観測の取り扱い

駆け足で読むシリーズパーミュテーションテスト多変量解析教科書 Java

観測データは、系列になっていて、ある値はその系列の前の値(もしくは後の値、前後両方など)の影響を受けた値であるとする。このようなとき、個々の測定系列の増減に着目しないと違いがあるのにみつからないこととなる。たとえば、身長の経時変化など。系列…

2006-08-11

第10章　The Berrens-Fisher Permutation Problem

駆け足で読むシリーズパーミュテーションテスト多変量解析教科書 Java

おそらく、このシリーズでは扱わない

2006-08-11

第９章　Missing dataの取り扱い

駆け足で読むシリーズパーミュテーションテスト多変量解析教科書 Java

Missing dataとは Missing at random (MAR), Observed at random (OAR), missing completely at random (MCAR) MCARは一番簡単だが、MCARでなくても、観測データの分布の仕方と無関係にMissingしていれば、ignorableなmissing dataといえる Missin dataの対…