Chapter 1 [Genetic and Statistical Background]


▼[Alleles] pp.8

●allele(対立遺伝子)は互いに塩基配列が異なる(fig1.3)
例
DNA上のあるalleleはT-Aの対を持っており、もう片方は同じ位置にC-Gの対を持っている

違いの種類(1-4)
(1)alleleが塩基配列の置換により異なる
例
・コドンの3番目の塩基がピリミジン→ピリミジンの置き換え:アミノ酸そのまま(fig1.3B)
→すべての塩基配列がそれに対応した一種類のアミノ酸に置換されるわけではない。(遺伝暗号の冗長性)
・コドンの3番目の塩基がピリミジン→ヒスチジンの置き換え:アミノ酸置き換え(fig1.3C)
・コドンの1or2番目の塩基が置き換え          :アミノ酸置き換え(fig1.3D)


(2)alleleの中には塩基対が欠失したものや挿入が起きたものがある
・欠失や挿入される塩基の数は小さなものから大きなものまで(1~数千塩基対)ある
・数千塩基の挿入が起きているものもある:転移因子(transposable elements)の働きによる


(3)DNAの短い配列の直列コピー数が異なる
例
5'-CACACA...-3' のような配列は5'-(CA)n-3'と表され、nの数がalleleによって異なる。


(4)DNAの一部の塩基配列が逆転しているものがある



▼[Genotype and Phenotype] pp.8-

●生きた細胞中では、遺伝子はクロモソーム(chromosomes)と呼ばれるかたちで存在する

・クロモソームは数千の遺伝子を持ち、クロモソーム上のある遺伝子の位置は遺伝子座(locus)とよばれる
・大部分の高等生物では細胞中に2コピーのクロモソーム(卵由来+精子由来)を持っており、二倍体(diploid)とよばれる。
→すべてのlocusについて2つのallele(母由来のクロモソーム上のallele+父由来のもの)が存在することになる

・あるlocusのalleleが化学的に同一なとき(DNAの塩基配列が同一であるとき)、その生物はそのlocusについて同型(homozygous)であるといい、そうでないとき異型(heterozygous)であるという
→geneという用語は、一般的にたいていlocusの意で用いられる


・生物の遺伝的な構成は遺伝子型(genotype)とよばれ、問題とする形質に関わるすべてのlocusの上の特定のalleleを指す
例
ある形質が二つのalleleを持つ二つの遺伝子に影響されるとき、遺伝子型は全部で9通りになる
→Aとaは一つ目の遺伝子のalleleを、Bとbは二つ目の遺伝子のalleleを表す。

遺伝子がリンクしている(同じクロモソーム上にある)とき、Aa;Bbという遺伝子型をAB/ab,Ab/aBで区別することがあり、そのときは遺伝子型は10通りになる


・遺伝子型の物理的な発現は表現型(phenotype)とよばれる
例
髪・眼の色、身長、体重、トウモロコシの核の数、鶏の産卵数、豆の丸型と皺型


・genotypeとphenotypeは、形質に環境が影響するような場合に特に重要となる
→同じgenotypeを持つ生物が、異なる環境下のために異なるphenotypeになる
→異なるgenotypeをもつ生物が、環境によって同じphenotypeを持つ


○PROBLEM 1.1 diploidの生物がm個の異なるalleleを持つとき、考えうるgenotypeの数がm(m+1)/2となることを示せ
解
(ヘテロ+ホモ)= mC2 + m = m(m-1)/2 + m = m(m+1)/2 (証終)



▼[Dominance and Gene Interaction] pp.11-
●それぞれのgenotypeが一意な形質発現をするかどうかは、遺伝子のalleleの発生時の相互作用の仕方によって決まる

・あるalleleの存在が、もう一方のalleleの表現型の強い効果によって隠れてしまうような場合を優性(dominance)という
例
2alleleで、AA,Aa,aaの3通りの遺伝子型が考えられるとき、dominanceのタイプによって以下のようになる

・完全優性(Complete Dominance)
→AAとAaのphenotypeは区別できない


・不完全優性(Incomplete Dominance)
→AaはAAとaaの中間のphenotypeを示す。
partial Dominance もしくはintermediate dominance というよびかたをされることもある。
このときphenotypeは量的に計測可能である
例
Aaのphenotypeのトウモロコシの核の数は、AAとaaのものの正確な平均となる
→このalleleはadditive allele、優性のタイプは半優性(semidominance)とよばれる


・共優性(Codominance)
→Aaからは両方のalleleの産物が検出される。
Aとaからエンコードしている産物が異なるため、タンパク質レベルでは多くのalleleが共優性である
DNA配列レベルでは全てのalleleでDNA配列が異なるため、alleleはすべて共優性である


優性はalleleの特徴であるというより表現型を調べる方法の特徴である
→一つの方法で調べたときにあるalleleが優性を示したとしても、別の方法ではそうならないかもしれない。
例
豆の丸型についてのallele(W)は皺型のallele(w)に対して完全優性である
顕微鏡で見ると三つの遺伝型(WW,Ww,ww)で、でんぷん粒の形がわずかに異なっている(不完全優性)
WとwではDNA配列が異なり、共優性である。


●形質は複数の遺伝子の影響を受ける
→遺伝型と表現型の関係は、それぞれの遺伝子alleleの優性の程度だけでなく発生時の遺伝子間の相互作用のタイプにも依存する。
例
A,aとB,bという色素の沈着についてのalleleを持つ生物の形質が、AとBのalleleを持つ総数によって加算的に色素の沈着の度合いが決まるとするとき、形質はTable1.2のようになる。

このalleleは表現型に等量ずつ加算されるので、Table1.2のような遺伝子の相互作用は相加的(additive)であるという。


▼[Segregation and Recombination] pp.12-

●それぞれの遺伝子のalleleは生殖細胞や配偶子ができるとき(減数分裂時)に分離(segregation)する。
→分離によってヘテロな遺伝子型ではそれぞれのalleleを含む配偶子が同じ数できる。

配偶子は受精時にランダムに合体するので、単純なメンデル型分離の結果は教科書のようになる:

・AA×AA→全てAAの子孫
(以下略)

メンデル型の分離の物理的な基礎は、配偶子形成の際に母方と父方のクロモソームが分裂して別々の細胞に入るためである。


●分裂の前に、組換え(recombination)のプロセスでalleleの交換が起きる(Fig 1.4)。
Fig 1.4ではAbとaBという組替えが起き、ABとabは親と同じ(組換えなし)
→親のクロモソームの交換が一回だと、配偶子は組替えがおきたものが2、おきなかったものが2という結果になる


●XX-XY型の性決定のメカニズムを持つ生物では、メンデル型の分離によって受精時の性比はランダムになる
哺乳類や多くの動物では性は性染色体によって決定される(オスXY、メスXX)。
→オスのクロモソームがXとYに分離するため、受精すると 1/2XX(メス)と1/2XY(オス)になる



■[PROBABILITY IN POPULATION GENETICS] pp.15-

●Aa×Aaが交配したときの子孫の詳細(Fig 1.5)
(A)additive rule
子供の遺伝型ががA-になる確立は、AAになる確率とAaになる確立の和になる
(B)multicative rule
3個の子供が図の順番の遺伝型で生まれてくる確率は、各子供がその遺伝型になる確率(互いに独立)の積になる

●確率の計算では、考えうる全ての実験結果を明確にしておく必要がある。
この結果はelementary outcomeとよばれる
→何回実験を繰り返しても必ずelementary outcomeが再現されるように定義されている。
例
Aaが交配したときの子孫の遺伝子型を考えたとき、各子供のelementary outcomesはAA,Aa,aaのいづれかになる。
(これらをelementary outcomeと定めるとき、A,aから変異により新規のalleleが出てくる可能性はここでは考えない)

・遺伝学的推論、洞察、実験に基づいて、それぞれのelementary outcomeになる確率(区間[0,1])を求める
→ある結果がどのくらいの確かさで実現できるかを測定し、確率を定める。

・全てのelementary outcomeの確率を合計したとき、必ず1にならなければならない
例
Fig 1.5
elementary outcomeはAA,Aa,aaでそれぞれの確率は1/4,1/2,1/4になる。
→メンデル型の分離で予期される子供の遺伝型の相対的な割合による。


▼[The Addition Rule] pp.16

●イベント(event)
イベントは一つ以上のelementary outcomeを含む点でelementary outcomeと区別される。
例
Fig 1.5A
「子供が少なくとも一つAという優性alleleを持つ」というイベントは、AA,Aaの遺伝子型という二つのelementary outcomeからなる。→このイベントは[A-]と表記され、[-]はA,aのどちらでもかまわないことを表している。

・イベントをelementary outcomeに置き換えて定義すると、イベントの確率は構成するelementary outcomeの総和に等しい。

Pr(A-) = Pr(AA) + Pr(Aa) = 1/4 + 1/2 = 3/4

・addition rule
相互排他(mutually exclusive)である二つのイベントのうちどちらかが起きる確率は、それぞれのイベントが起きる確率の和に等しい

▼[The Multiple Rule] pp.16-

●子供の遺伝型をA-(3/4)とaa(1/4)にわけたときの、Aa×Aaの交配から得られる同腹の子供3個の全ての遺伝子型(Fig 1.5B)

・右側の確率はBirth Orderの順に表の遺伝子型の子供が生まれてくる確率はそれぞれの確率の積になる
→ある子供の遺伝子型は連続でうまれる他の仔の遺伝子型に影響されず、独立(independent)である
例
A- → A- → A- の順でうまれるとすると 3/4 × 3/4 × 3/4 = 27/64 となる。

・multiplication rule
互いに独立な二つのイベントが続きで起きる確立は、イベントが別々に起きる時の確率の積になる


▼[Repeated Rules] pp.17-

●繰り返し試行(repeated trials)の結果は、しばしば確率通りになる(サマ無しで賽を振りつづけるのと同じ)。

・集団遺伝学では繰り返し試行は重要である。
→交配の子供はそれぞれ独立のイベントであるため、繰り返し試行と同じ

・Fig 1.5BのBirth orderは明らかに相互排他であるため、それらの確率はaddtion ruleによって結合できる

Pr(2A- and 1aa) = 9/64 + 9/64 + 9/64 = 27/64 [sibship:2,3,4]
Pr(1A- and 2aa) = 3/64 + 3/64 + 3/64 = 9/64  [sibship:5,6,7]

→同数の遺伝子型を持つsibshipを纏めると、全確率は以下のように与えられる

(3/4A- + 1/4aa)^3 =
	  1 × (3/4A-)^3		A- A- A-
	+ 3 × (3/4A-)^2(1/4aa)^1	A- A- aa
	+ 3 × (3/4A-)^1(1/4aa)^2	A- aa aa
	+ 1 × (1/4aa)^3		aa aa aa

●全ての場合の独立な繰り返し実験で、全確率は上と同じように展開することで与えられる

・一回の試行で相互排他なイベントA,Bの起きる確率がそれぞれp,q(q=1-p)であるとき、n回の試行中Aがr回起きる確率はmultiplication ruleより、p^r・q^(n-r)となる。
→(p+q)^nを展開したとき、p^r・q^(n-r)の二項係数(binomial coefficient)は、

n!/(r!(n-r)!)			(1.1)

となることが知られている。(!は階乗を表す)

式(1.1)はr個のAと(n-r)個のBの異なる並びの数であリ、それぞれの並びが起きる確率はp^r・q^(n-r)であるため、それらの総和はaddition ruleにより、以下のように与えられる。

n!/(r!(n-r)!)・p^r・q^(n-r)	(1.2)

例
Aa×Aaの交配で12個の仔が得られたとき、(9A- and 3aa) となるような確率は?
→
[p=3/4, q=1/4, r=9, n-r=3]
eq(1.2)より、
Pr(9A- and 3aa) = 12!/(9!3!) ・ (3/4)^9 ・ (1/4)^3 = 220×0.0751×0.0156 = 0.258

この計算では、25%より少し多いsibshipでこのような内訳になることが期待される

▼[PROBLEM 1.2]
男児を出産した女性にそれ以上の出産を禁じる法律を可決させることで男性の数を制限しようとする社会があると仮定する。
(1)男児と女児の出生比率は1:1であるとき、この法律は性比にどのように影響するか?
(2)さらに女性が女児の出産後の継続をpの確率で任意に止めるとき、sibshipの数がnのうちの男児の割合はどうなるか
ans.
(1)この法律は性比になんの影響も与えない。
法的に出生可能な母数が期待値1/2で減少していくだけで、男児出生率は1/2であることに変わりがないため。

(2)
n回目で出産を止めるのは男児出生母または女児出生母中任意、である

やめる女性の割合は

男児出生母の場合:1/2
女児出生母中任意:p/2

よって、出産を止める女性の内訳は男児:任意=1/(1+p):p/(1+p)となる。
そのときの男児の割合は、

男児出生母の場合:1/n
女児出生母中任意:0

なのでn-sibship中の男児の割合は、1/n×[1/(1+p)] + 0×[p/(1+p)] = 1/n(1+p) となる。
ただし、(1)と同じ理由で集団中の性比は変らない



■[PHENOTYPIC DIVERSITY AND GENETIC VARIATION] pp.20-

●自然集団では、生物は形質に関わる表現型が異なる。

・集団遺伝学は表現型の多様性、特に遺伝子型によって起きる多様性について取り扱う。
→自然集団にどれだけの遺伝的な差異があるか調べ、そして、その起源、維持、進化的重要性を解明する

・遺伝的差異はほとんどの自然集団中に存在する。
→性による繁殖集団では、全ての遺伝子で遺伝子型が同一な生物は存在しない(一卵性のものを除く)。
→自然集団中でalleleがどのような遺伝子型を作っているかを記載することが重要になってくる


▼[Allele Frequencies in Populations] pp.20-

●多くの自然集団での表現型が1:1や1:3といった単純なメンデル型の分離に従っていない。

・表現型の違いは環境に由来し、メンデル型の分離を示すとは限らない
→しかし発現に遺伝的要因の影響を受ける形質でも、大抵単純なメンデル型の分離は見られない

・いくつかの要因によってメンデル型の分離は見えなくなってしまう。

(1)環境の影響が強く、遺伝的な分離を隠してしまう
(2)二つ以上の遺伝子のalleleの影響で、ある遺伝子の分離が別の遺伝子の分離で隠れてしまう。

・単純なメンデル型の分離に従うものもある
例
キンギョソウ(Antirrhinum majus)の花の色は一つの遺伝子のallele(I,i)で決まり、赤(II)、ピンク(Ii)、白(ii)となる不完全優性である。

●対立遺伝子頻度(allele frequency)

例
上述の花の色について、400個体の集団を仮定して、花の色についてそれぞれ赤165、ピンク190、白45が見つかったとき、この花の色が遺伝子型を表しているので、400サンプル中に165II,190Ii,45iiが含まれているといえる。
従って、I,iの数は以下のように与えられる。

I: 2×165 + 190 = 520
i: 190 + 2×45  = 280

っ子でホモの遺伝子型はそれぞれのalleleを二つづつ持っているので2を掛けている。サンプル中の全alleleは400×2=800なので、Iのallele頻度(p)とiのallele頻度(q)は以下のように表される(p+q=1)

p = 520/800 = 0.65
q = 280/800 = 0.35

I,iのalleleがランダムな組み合わせで遺伝子型を作るとき、式(1.2)より、(pI + qi)^2 = p^2II + 2pqIi + q^2ii であるので、

II:169,Ii:182,ii:49

となる。従って観察された数が理論上の数に非常に近いので、alleleの組み合わせはランダムであると期待される。
2つのalleleがランダムな組み合わせのとき、この3つのの遺伝子型のp^2,2pq,q^2の割合は、ハーディワインベルグ則(Hardy-Weinberg principle)になる。(詳細はChapter)

▼[PROBLEM 1.3]
キンギョソウのランダムな400サンプル中に、赤185、ピンク150、白65があるとき、I,iの対立遺伝子頻度p,qをもとめよ。
遺伝子型についてalleleがランダムに組み合わさると想定すると、三つの遺伝子型の期待値はどうなるか?
観察されたデータは期待値とあっているか?

ans.

全allele: 800
I: 2*185+150=520 , i: 150+2*65=280

よって

p=520/800=0.65 , q=280/800=0.35
(上記のものをallele頻度が同じなのに遺伝子型の数が異なることに注意)

ランダムであるときの期待値は II:169, Ii:182, ii:49 となる。
従って期待値に対してデータではホモが多くへテロが少ない。
(統計的に判断する方法については2章で)



▼[Parameters and estimates] pp.22

●Iの実際のallele頻度(p)と見積もられたallele頻度(^p)の区別
集団中のランダムなサンプルから全集団に付いての推定を行うときには上記の区別が必要になる。

・全集団に付いて記述するために、パラメータが用いられる。
→キンギョソウの例では、全集団中のIのallele頻度pが着目するパラメータとなる。

集団中400サンプルのみを扱っただけなので、pの真の値は不明である。
→サンプルが手段全体を代表していると考えて、サンプルに基づいてpの推定を行うことしかできない

サンプルから得られた推定は~pと表されて、推定であって真の値でないことが強調される
本書では、修飾無しのシンボルとその推定である符号付のシンボルを用いる



▼[The Standard Error of Estimate] pp.22-

●異なるサンプルが異なる推定値をもたらすため、パラメータとその推定との区別は重要である

・alleleが大きな集団からランダムにサンプリングされると仮定すると、allele頻度の推定は繰り返し試行として扱うことができる。
例
キンギョソウの800サンプルのallele
Iのallele頻度の真の値はp=0.65なので、これを800回の繰り返し試行とみなすと、(0.65I + 0.35i)^800 と表せる。
この二項式は根本的なランダムサンプリングのプロセスを明確にし、あるサンプルからの推定~pと次の推定との差異を説明する。

pが0または1に非常に近い値でないなら、二項式(pI+qi)^nで簡便な近似ができ、nがサンプリングされたalleleの数になる。
nが大きくなると、^pのばらつきは正規分布(normal distribution)に近づく。(正規分布についてはchapter9で詳しく述べる)


●^pの値が全平均値の周りに集まる度合いは、標準誤差(standard error)に依存する

s = sqrt[(^p)(^q)/n]		(1.3)
where ^q = 1 - ^p

同じ集団でサンプリングと^pの推定の回数が多くなると、^pの値は以下のように標準誤差に従ってpの周りに対照的に集まる
・^pのおよそ68%がpの±1SE内に位置する
・^pのおよそ95%がpの2SE内に位置する
・^pのおよそ99.7%がpの3SE内に位置する

別の見方をするとサンプリングを繰り返しても1SE以上で推定の32%が真の値と異なると予期される。2SE以上で5%、3SE以上でわずか0.3%となる

例
真のallele頻度がp=0.65であるような800alleleの生物集団からの100サンプルに基づいて推定された^Pの値(Fig 1.6)。

・100サンプルなので正確な形ではないが、正規分布に近い形になっている
→100サンプル全てを併せた全平均の推定値^pは^p=0.6492となり、真の値に非常に近くなる。

・推定値のばらつきは標準誤差に基づいた予測とよく一致する。

100サンプルの^Pのうち68%がp±s(0.65±0.017)の範囲に対称に分布すると予期される。
→実際には33が[p-s,p](0.633-0.650)の範囲に、35個が[p-s,p](0.65-0.667)の範囲に分布した。

その他のサンプルの^Pもそれぞれの予測範囲の内に分布している。


・推定値と標準誤差はしばしば^p±sで表され、つまりこの例では0.65±0.017となる

±1,±2,±3SEによって分けられる68%、95%、99.7%という値は、推定に信頼性を与える一つの方法といえる。
→推定値が信頼区間(confidence interval)と呼ばれる範囲に存在するとき、推定値はパラメータの真の値からある範囲内に存在することを表している。

よく見られるのは95%の信頼区間で、[^p-2s,^p+2s]の区間と定義されている。
→この場合、(^p-2s,)-(^p+2s)の区間に95%の確率でパラメータpの真の値が含まれると期待される
例
^p=0.65,s=0.017のキンギョソウでは、95%の信頼区間は0.616-0.684になる。


▼[PROBLEM 1.4]

ヒトのMN血液型はある単一の遺伝子の二つのallele(M,N)により決定される。それぞれのalleleは赤血球上に異なる多糖類分子を作り、試薬により区別できる。(イ)MとNのalleleに対応する分子はそれぞれM,Nで表される。M,Nのalleleは共優性で、MM型ではMのみ
NN型はNのみ、MN型は両方の分子を作る。1000人のイギリス人のサンプルで、それぞれの血液型が298M,489MN,213Nであった。
これらのデータを用いてMのallele頻度pを推定しその標準誤差を求めよ。またpの68%,95%,99.7%の信頼区間はどうなるか。

ans.
それぞれの遺伝子型が固有の表現型を持つので、サンプル中のM alleleの数は 2*298+489=1085 となる。よって、

^p=1085/2000=0.5425
s=sqrt[(0.5425)(10.5425)/2000]=0.0111

pの68%,95%,99.7%のpについての信頼区間はそれぞれ、^p±1s, ^p±2s, ^p±3s となるので、0.5314-0.5536(68%), 0.5202-0.5647(95%), 0.5092-0.5758(99.7%)となる。



■[MODLS IN POPULATION GENETICS] pp.26-

●モデル
集団遺伝学において、究極的には集団サイズをはじめとして全ての要素の影響を理解するのが望ましい。
→しかし、現実に要素は沢山ありそれらの相互作用は複雑になるので、それら全てを把握することはできない

そこで数個の要素を重視しその他の要素を無視することで、複雑な状況を単純化する。

●モデルの種類
・無関係なものを省き、中心的な要素に着目するためのモデル
・実験的なモデル
実際の生物を飼育することもあれば、自然集団の観察なども含まれる。

・概念的に単純化したモデル
メカニズムや相互作用について簡潔に述べることを目的とする。
観察の解釈をしたり、研究の優先順位を決める手がかりとする
既知のパラメータの範囲を超えた範囲の推測を可能にする
理論と観察の間の整合性をテストする

・概念的なモデルの種類
仮説と推論を論理的につなぎ合わせたもの
コンピュータによる複雑な系のシミュレーション(例 Fig 1.6のランダムサンプリング)

●集団遺伝学ではしばしば数理モデルが用いられる
→系やプロセスのパラメータについて、数学的な関係の仮説の組み合わせ。

・数理モデルは以下のように有用である:
パラメータ間の量的関係についての仮説を簡潔に表現できる
ある系でどのパラメータが重要か示し、そのために必要な実験や観察を提示できる
観察されたデータの収集、組織化、解釈についての指針を提供する
系の振舞いについての予測が誤りであると確認したり示すことができる


●モデルの妥当性はもとになった仮説や予測が観察とあっているかテストされなければならない。

・数理モデルは現実に比べるとシンプルであリ、現実での多くの系の性質が無視されている。
→モデルの構築には常に現実性と扱いやすさの間での妥協が求められる。
(完全に現実的なモデルは数学的に扱いきれないし、数学的に単純化すると非現実的になるかもしれない)

・理想的にはモデルは系の必須の性質を全て含み、そうでない要素はすべて排除されるべきである。
→モデルが以下によく便利であるかは、この理想にどれだけ近づいたかによる。
これらはある制限の内で妥当であり、それを超えると誤った結果をもたらすとか役に立たないことさえある。


数理モデル性質(と制限)の説明のために集団成長の動態について考える。

▼[Exponential Population Growth] pp.27-

●決められた量の培地での酵母の細胞数について(Fig 1.7)

細胞数の増加は ゆっくり(0-4h)→速く(4-12h)→ゆっくり(12-18h) となった。

成長の初期のステージでの近似として、時間ごとに細胞が一定の割合で増加すると想定し、さらに簡略化のために時間について連続的ではなく各時間の終わりに離散的に増加するとした。(集団成長の離散モデル)
この種のモデルは集団成長の離散モデルと呼ばれ、以下のように記述される。

N_t = N_(t-1) + rN_(t-1)		(1.4)

NtとNt-1はそれぞれ時間tとt-1における集団サイズを表し、rは内的自然増加率(intrinsic rate of increase)と呼ばれる各時間での細胞の増殖率を表す。
時間tにおける集団サイズは次の二つの成分の和で表される

(1)時間t-1に存在する全細胞数(細胞が死なないという想定を意味する)
(2)その時間で分裂してrNt-1個の子細胞となる

ここでのrは内的自然増加率を表すが、他の式では組換価だったり他いろいろ紛らわしいので注意する必要がある。
→上付き、下付き文字をつかうとか、文脈から分かるようにしておく。

式(1.4)を解いていくと Nt = (1+r)Nt-1 = (1+r)(1+r)Nt-2 … となるので、以下のように演繹できる。

Nt = (1+r)^t N0			(1.5)

ここでFig 1.7 のデータについて N0=10(観察値), r=0.7083 で、式1.5は最初の数点は非常によく当てはまるが、次第にずれていく。→多くのモデルには、その近似が実際に妥当である範囲がある。
例
酵母の培養を短時間で植え継ぐようなときには式1.5は妥当といえる

集団遺伝学のモデルの多くのモデルにおける問題は、それらの妥当な範囲が不明であるところである。

式1.5では。モデルの性質上Nはtについての正の整数と定義されているが、実際には集団サイズの増加は離散的ではなく連続的であるのでFig 1.7の破線のようになり、連続成長版の式は以下のように与えられる

N(t) = N(0)e^r_0t		(1.6)

r_0 = ln(1+r) と置いている。この式の理屈は(1.4)と同じであるが、時間スケールは小さくなっている(1h→たとえば1分)。

・単位時間あたりの増加量が過剰になってしまうので、時間スケールを落とすときには内的自然増加率も下げる必要がある。
→式1.4を Nt-N(t-i) = r0N(t-1) と書いたとき、ここでのr0は新しい時間スケールで値になる。


N(t)が連続的で急激に変化しなければ、Nt-N(t-i)はN(t)の微分であるといえる。
新しい時間スケールではN(t)は急激に変化しないため、小さな時間間隔ではNt-1はN(t)に近くなる。従って以下のように表すことができる

dN(t)/dt = r0N(t)		(1.7)

または

dN(t)/[N(t)dt] = r0		(1.8)

dlnN(t) = dN(t)/N(t)dt なので、式1.8を解くと

lnN(t) = r0t + C

t=0のときN(t)=N(0)なので、

lnN(t) = r0t + lnN(0)

これを変形すると、

N(t) = N(0)e^r0t		(1.6に同じ)

この式1.6を式1.5と比べると、以下は自明である。

N(0)e^r0t = (1+r)^t N0		(1.9)

従って r0 = ln(1+r) は連続もれるのパラメータr0と離散モデルのパラメータrとの関係を表すものである。
fig 1.7の破線は式1.6の指数関数をN(0)=10,r0=0.5355でプロットしたものである。


▼[PROBLEM 1.5]

最適な培養条件のもとでE.coliは20分ごとに集団サイズを倍にできる。集団サイズは連続的であるので式1.7が適切なモデルである。E.coliの細胞は円筒形で、体積がおよそ1.6μm^3である。標準的なサッカーボールの直径が22cmで、その体積が5600cm^3である。
(a)20分で2倍になるとき、毎分の内的自然増加率r0はいくらか
(b)最適な培養条件のもとでE.coliの一つの細胞から開始して、サッカーボールが一杯になるのにどれだけかかるか
(c)無制限に成長するとき、24時間でサッカーボール何個を一杯にできるか

ans.
(a)
N(20) = 2N(0) = N(0)exp(r0*20) よって r0 = (ln2)/20 = 0.034657

(b)
サッカーボール一個を一杯にするのに必要な細胞数は 5600/(1.6*10^-12) = 3.5*10^15 cells なので、

t = [ln(3.5*10^15)]/r0 = 1032.7min (= 17.2h)

(c)
[注:9桁の有効数字で計算]
24時間(1440min)後の無制限成長によって一つの細胞は exp(r0*1440) = 4.7 * 10^21 cells に増殖する。

4.7*10^21 * 1.6*10^-12 / 5600 > 1.35*10^6

従って1.35*10^6 より多くのボールを一杯にできる。


▼[Logistic Population Growth] pp.31-

問1.5の計算は、現実には崩壊することなくわずかな世代以上に指数的成長をする集団はありえないことを示唆している

●自然界では病気や捕食などの要因によってしばしば集団サイズが調節されているが、究極的には集団が大きくなりすぎると利用できる資源は枯渇してしまう。

・fig 1.7のような成長曲線は、新しい環境に広がった集団で典型的に見られる
→初期の成長は指数的であるが、やがて徐々に成長率が減少していく。

●ロジスティックモデル
・ロジスティックモデルでは集団の成長率が集団サイズに応じて減少すると想定している

式1.4と同様に集団成長の離散モデルによる集団サイズの変化は以下のように記述される

Nt = Nt-1 + rNt-1[(K-Nt-1)/K]		(1.10)

Kは環境収容力(carrying capacity of the environment)として知られる定数である。
NがKに比べて十分に小さいとき、Nt=Nt-1 +rNt-1 となり集団成長はほぼ指数的になる。

式1.4と違い、式1.10はN0についてNtの単純な解を持たない。
しかし集団成長が十分に遅ければ連続的に扱うことができ、式1.10は以下のようになる

dN(t)/dt = rN(t){(K-N(t))/K]		(1.11)

式1.11を解くと以下のようになる

N(t) = K/(1+Ce^-rt)			(1.12)

ここで C = (K - N0)/N0 となる。

式1.12はロジスティック成長曲線(logistic growth curve)と呼ばれ、Fig 1.7(r=0.5355, N0=10, K=665)のようなS字の曲線になる(rとN0は指数的成長のデータと同じもの)。


▼[PROBLEM 1.6]

N0=10,r=0.5355,K=665のとき、t=7,8,13,14 のときのN(t)を式1.12を用いて計算せよ。
式1.10でt=8,14のときrの値はどうなるか。なぜこれらの値は0.5355にならないか、なぜ等しくならないか。

ans.
代入して計算、N(7)=261.53, N(8)=349.43, N(13)=626.13, N(14)=641.68 となる。
式1.10をrについて解くと、t=8のときr=0.5540、t=14のときr=0.425 となる。

これらの値が同じにならないのは、式1.10が離散モデルについて、式1.12が連続モデルについての式であるから。
→集団成長が連続的なとき、ある不連続な時間で集団サイズを変化させるのに必要なrの値は、集団サイズの変化の大きさによって異なる

**
式1.12から式1.11に変形して、式1.11を変形すると r=dN(t)/dt*[K/(K-N(t))] となるから。



▼[PROBLEM 1.7]

intg[1/x(a+bx)]dx = -(1/a)ln(a+bx)/x を用いて 式1.11からロジスティック成長曲線(式1.12)を導け

ans.
式1.11を変形すると

 dN(t)/{N(t)[K-N(t)]} = rKdt

問いにある式より(a=K,b=-1)、

-(1/K)ln[K-N(t)]/N(t) = rt/K + cnst , cnstは積分定数

t=0のときN(t) = N(0)なので、

cnst=-(1/K)ln[K-N(0)]/N(0) = -(1/K)lnC ,  Cは式1.12で見られた定数で C = [K - N(0)]/N(0)

よって右辺と左辺に-Kをかけて、、

ln[K-N(t)]/N(t) = -rt + lnC となるので、

[K-N(t)]/N(t) = C * exp(-rt)

これをN(t)について整理すると式1.12になる。