COVID-19関連追加(20211031日)伝播のボトルネックについて

★当院HP関連ファイル:

202181

 

【ドナーとレシピエントのペアから得られたSARS-CoV-2のディープシーケンスデータを再解析した結果,伝播のボトルネックは非常に狭い(13ビリオン)】

Martin MA, Koelle K. Comment on “Genomic epidemiology of superspreading events in Austria reveals mutational dynamics and transmission properties of SARS-CoV-2”. Science Translational Medicine. Oct 27, 2021.

https://www.science.org/doi/10.1126/scitranslmed.abh1803.

Popaらは最近の研究論文(1)で,疫学データとウイルス遺伝子データを組み合わせて,20202月〜4月にかけてオーストリアで発生した重症急性呼吸器症候群コロナウイルス2SARS-CoV-2)の伝播動態を明らかにした.彼らが解析した遺伝子データは,>500のディープシーケンスされたウイルスサンプルで構成されている.著者らは,オーストリア国内の伝播クラスターを推定し,オーストリアがヨーロッパの他の地域での流行の火種となった役割を検証するために,consensus-level SARS-CoV-2 sequencesを用いるだけでなく,宿主内および短い伝播連鎖に沿った突然変異の動態を明らかにするために彼らのシーケンスサンプルを用いた.我々は,著者らのconsensus-levelの遺伝子解析から得られた結果は強固であると信じているが,ここで我々は,below-the-consensus levelにおける変異動態の解析について再検討する.具体的に我々は,彼らが推定したウイルス伝播のボトルネックの大きさ(ドナーからの感染に続くレシピエントの感染を成功させるビリオン数)を検討する.同時にそれは,感染したレシピエントのウイルス集団に遺伝的に寄与する感染を伝播する人のウイルス粒子数である.我々は再解析の結果,SARS-CoV-2の伝播ボトルネックサイズは,著者らが結論づけたような1000ビリオンのオーダーではなく,もっと小さいと結論づけた.

我々は,伝播のボトルネックサイズに関するPopaらの結論を再検討することにしたのは、彼らの図にいくつかのパターンが見られたことに起因する.まず,3% variant calling threshold(変異検出閾値)を用いて推定されたボトルネックサイズは二峰性(bimodal)で,伝播ペア39組のうち14組は推定ボトルネックサイズ(Nb)が<10で,残りの25組はNb1155000と推定された(著者らのfig. S4G).さらに,1% variant calling thresholdを使用した場合,Nb推定値が<10の伝播ペアはわずか1組だけであった(著者らのfig. 5B).これらのパターンを理解するために,我々はまず,彼らのディープシーケンスデータを再解析し,彼らのpipelineを用いて,変異を再検出(recall)した.以下の解析では,我々はこの検出された変異の頻度を使用する.この変異の頻度は,Popaらの論文の一部として発表された,特定された伝播ペアにおけるドナー個人の検出された変異の頻度とレシピエント個人のコールされたバリアント頻度を示すプロットに基づく頻度と非常に似ているようだ(10.5281/zenodo.4247401).

予想通り,variant calling thresholds1%と3%に設定して,伝播のボトルネックサイズを再推定したところ,(1)で示されたものと同様の結果が得られた(Fig. 1A, fig. S1, A and B, and data file S1).この解析の中で,宿主内一塩基変異(iSNV: intrahost single-nucleotide variant)の最大頻度が6%を超えるドナーを持つ13組の伝播ペアについて,カットオフ値を1から3%にすると、ボトルネックサイズの推定値が低下する(時には急激に低下)ことを我々は発見した(P= 0.004, paired t test; Fig. 1A).variant calling thresholdを上げると,低頻度のiSNVsは解析から除外されるので,ドナーの低頻度のiSNVsがボトルネックサイズが大きいことを示唆する場合,一方ドナーの高頻度のiSNVsがボトルネックサイズが小さいことを示唆する場合,Nb推定値の一貫した減少が生じるかもしれない.低頻度のiSNVsをドナーとレシピエントのペアで調べてみると,両者の頻度は高度に一致しており(Fig. 1B, inset, and fig. S2 in data file S2),これは伝播のボトルネックが広いことを示唆している.一方,ドナーの頻度の高いiSNVsでは,対応するレシピエントにほとんど伝わらないようで(fig. S2),伝播のボトルネックが狭いことが示唆された.

Fig. 1: Transmission bottleneck sizes and patterns of shared viral genetic diversity between the transmission pairs studied in Popa et al.

(A)疫学的に確認された39組のSARS-CoV-2伝播ペアについて,1%[0.01, 0.99]),3%[0.03, 0.97]),6%[0.06, 0.94])のvariant calling thresholdsを用いて推定したボトルネックサイズ.推定値は,quality-filtering thresholdsを通過したすべてのiSNVsに基づいている.最尤推定値は色付きの円で示され,縦線は95%CIsを示す.推定値は伝播ペアのドナーで観察された最大のiSNVs頻度に応じてプロットされている.同一の伝播ペアからの推定値は,視覚的に分かりやすくするために,X軸上でわずかにオフセットされている.iSNV頻度は,ドナー固有のreference sequencesに対するvariant callingに基づいている.

(B)疫学的に確認されたCoV_162CoV_161の伝播ペアのドナーまたはレシピエントで観察されたすべてのiSNVs.個体161番に固定されており,個体162番には存在しないレシピエント(C26894U)におけるde novo variantに注意.挿入図は,頻度の低いiSNVを強調している。赤の破線は1%variant calling thresholdを示す.iSNV頻度は,ドナー固有のreference sequencesに対するvariant callingに基づく.ここでは,1%variant calling thresholdを上回るあるいは下回るにかかわらず,quality filtering thresholdsを通過したすべてのiSNVsを示している.

(c) 伝播ペアで観察された低頻度のiSNVs.伝播ペアは,レシピエントで観察された最大のde novo iSNV頻度に応じて,3つのグループのいずれかに分類されている.赤の破線は1% variant calling thresholdを示し,iSNV頻度はドナー固有のreference sequencesに対するvariant callingに基づく.

(D)ドナーにおいて同定されたiSNVsのうち,レシピエントの宿主と共有されるものの割合.青点は,疫学的にリンクしたペアの割合を示し,一方,黒点は,疫学的にリンクしていないランダムなドナーとレシピエントのペアの割合を示す.ランダムペアは,ランダムレシピエントが焦点となるドナーまたはレシピエントと同じ家族の一員ではなく,そのドナーサンプルの既知のレシピエントでもないように生成された.iSNVsは,ドナーにおける頻度に基づいてビン分割(ビニング)された: [0.01, 0.02][0.02, 0.03][0.03, 0.06].アレル頻度(対立遺伝子頻度)は,Wuhan/Hu-1に関連したvariant callingに基づいている(9).疫学的にリンクしている分布とリンクしていない分布の違いは,Kolmogorov-Smirnov検定を用いて評価した.この検定では,ドナー頻度12%のグループ(P= 0.389),ドナー頻度23%のグループ(P= 0.752),およびドナー頻度36%のグループ(P> 0.999)において,これらの分布の間に有意な差を見出すことができなかった.

(E)39組の伝播ペアに関与した43サンプルの中で、最も多く共有されたiSNVsのトップ12iSNVsは,それが見つかったサンプルの数(n)で並べられている.各点は,あるサンプルにおけるそのiSNVのアレル頻度を表す.赤の点線は,1% variant calling thresholdを示す.アレル頻度は,Wuhan/Hu-1に関連したvariant callingに基づく.

(F) Nb= 1000という大きなボトルネックを仮定した場合の,伝播ペア間で共有されるウイルスの遺伝的多様性のパターン(赤点).黒点は,1%variant calling thresholdでボトルネックサイズが1000以上と推定されるすべての伝播ペアについて,ドナーまたはレシピエントのいずれかで観察されたすべてのiSNVsを示す.

(G)6%variant calling threshold,およびこの6%の閾値を超えるiSNVs1つ以上存在する13組のすべての伝播ペアのデータを用いて推定されたボトルネックサイズに基づく,サイズNbの伝播ボトルネックの確率.伝播が1個,2個,あるいは3個のビリオンのボトルネックサイズを含む確率は99%を超える.

これらの矛盾したパターンを解決するために,我々はレシピエント宿主におけるde novoで出現した(新たに出現した)遺伝的変異を考慮した.この遺伝的変異は,レシピエントに対するドナー変異頻度プロットにおいて,ドナーには存在しないが,対応するレシピエントには存在するiSNVsとして現れる.de novo変異がレシピエントサンプルで固定されていることが確認された場合,ドナーとレシピエントの間で共有されているiSNVs(宿主内での組換えが極めて急速に起こったか,固定されたde novo変異が異なる遺伝的背景で複数回生じたのでない限り,それはサブクローナルな頻度[つまり固定されていない]でレシピエントに存在する)は観察されないはずである.しかし,Popaらが解析した伝播ペアでは,共有されたサブクローナルなiSNVsが,レシピエントにも固定のde novo変異が存在するいくつかの伝播ペアで確認されている.CoV_162CoV_161の伝播ペアがその例である(Fig. 1B).つまり,CoV_162CoV_161に共通する低頻度のiSNVsは,見せかけ(spurious)であるか,あるいはレシピエントで独立して生じたものである(つまりホモプラシー[homoplasies]).最近のSARS-CoV-2研究では,iSNVのホモプラシーが多数報告されているが(2, 3),我々は,Popaらの伝播ペアに見られるこれらの低頻度iSNVsは,シーケンスプロトコルに関連したシステム上の問題に起因する可能性があり,見せかけ(spurious)である可能性が高いと信じている.なぜなら,これらの低頻度iSNVsは,ドナーサンプルとレシピエントサンプルの間で極めて類似した頻度で発生しており(Fig. 1B, inset, and fig. S2),iSNVsがホモプラシーであった場合には考えにくい.いずれにしても,CoV_162CoV_161の伝播ペアや,レシピエントの固定されたde novo変異が存在する伝播ペアにおける低頻度の共有されたiSNVsは,生物学的に見て非常にありえないシナリオでしか伝播された遺伝的変異(transmitted genetic variation)を構成しないので,これらの伝播ペアを含む伝搬ボトルネック解析からは除外すべきである.

Popaらが同定したすべての伝播ペアを包括的に解析した結果,低頻度の共有された遺伝的変異パターンは,伝播ペア間で定量的に非常に類似していることがわかった.これを説明するために,我々は,伝播ペアを次の3つのグループに分類した: すなわち,レシピエントにde novo固定変異を持つ伝播ペア(ここでは頻度が> 94%と定義),レシピエントにde novo高頻度(694%)変異を持つ伝播ペア,そして低頻度de novo変異のみを持つ伝播ペア(≦ 6%)である.Figure

1Cは,これら3つのグループを通して共有された低頻度iSNVsは,定量的に極めて類似していることを示している: 各グループにおいて共有されたiSNVsのほとんどは,中には6%に達するものもあるが,ドナーにおける頻度が12%となっている.第1のグループに属する伝播ペアにはサブクローナルな遺伝的変異は伝播しないと予想されるのに対し,第2のグループに属する伝播ペアの間で共有されるiSNVsは,ドナーとレシピエントの間で,レシピエントの高頻度de novo variantとの遺伝的連鎖により,頻度が著しく異なると予想される.第3のグループは,ボトルネックサイズが十分に大きければ,原理的にiSNVの頻度が非常に類似する可能性がある.これらの予想とは対照的に,Fig. 1Cは,すべての共有されたiSNVs(どのグループが考慮されるかにかかわらず)は,ドナーとレシピエントの間でその頻度が非常に一致していることを示しており,これらのiSNVsが見せかけ(spurious)である可能性が非常に高いことを再度示している.低頻度ドナーiSNVsのうち,疫学的にリンクしていないレシピエントで観察されるものに対する,対応するレシピエント(≧ 1%)で観察されるものの割合を計算すると,我々はこれらの割合の分布は非常に類似していることがわかった(Fig. 1D).この結果は,これらの共有された低頻度iSNVsは,伝播ペアの中では真の共有された遺伝的変異を構成していないことを示唆している; もしこれらの共有されたiSNVsが伝播すれば,対応するレシピエントでは,疫学的にリンクしていないレシピエントに比べて,共有された低頻度変異の割合が高くなると予想される.

このように,伝播された遺伝的変異を構成している低頻度iSNVsに疑問を呈する結果が得られたので,我々は,伝播ペア解析に用いたサンプルを通して特定のiSNVが存在している程度を定量的に調べることにした.その結果,43サンプル中40サンプル以上に5つのiSNVsが,非常に狭い範囲(12.2%)の頻度で存在していることがわかった(Fig. 1E).他の多くのiSNVsも多数のサンプルを通して存在しており(Fig. 1E, fig. S3 in data file S3, and fig. S4),いずれの特定のiSNVの頻度は,そのiSNVが出現するサンプルを通して非常に類似していた.このようなiSNV頻度の類似性は,これらの低頻度iSNVsがホモプラシーであることを否定し,これらのiSNVsが見せかけ(spurious)であることを強く主張する.この証拠を評価するために,我々は,少なくとも10サンプルにおける,その位置でのリードの深度に対する,リードの199%で観察されたすべての変異のゲノム上の位置をプロットした(fig. S5).これらの変異は,シーケンスカバレッジが特に低い領域には現れない傾向にあるが,少数のシーケンスされたampliconsの中に集まり,ゲノムを通して分布していた(fig. S6).

最後に,ドナーとレシピエントの間で観察されたiSNV頻度のパターンと,Popaらが推定した大きな伝搬ボトルネックサイズの下で予想されるパターンとを比較すると,低頻度の共有されるiSNVsの伝搬は否定的である.具体的には,推定ボトルネックサイズがNb≧ 1000の伝播ペアで観測されたiSNV頻度を見ると,iSNVsはドナーとレシピエントの両方に非常に似た頻度で存在しているか,またはドナーまたはレシピエントにのみ存在していることがわかる(Fig. 1F).この図に,我々はボトルネックサイズをNb= 1000と仮定した場合のiSNV頻度のシミュレーションを重ねた: Nbの値が約1000では,ドナーに2%以上存在するiSNVsのほぼすべて(少なくとも96.1%)が伝播され,レシピエントにおける1%variant calling thresholdを上回って観察されると予想される.しかし,1%以上の頻度で対応するレシピエントで観察されたのは,26%頻度範囲内のドナーiSNVs77.5%のみであった.この矛盾は,低頻度iSNVs自体が,大きな伝搬ボトルネックサイズでは解析的に説明できないパターンを示していることを示唆する.さらに,共有するiSNV頻度のパターンを定量的に再現するためには,Nb= 3000程度のボトルネックサイズが必要である(fig. S7; このボトルネックサイズでは,ドナーに≧2%で存在するiSNVsのほぼ100%がレシピエントに伝播されるはずだが,実際にはそうではない.

Popaらが検出した共有された低頻度iSNVsは見せかけ(spurious)である可能性が高いという我々の知見を考慮して,我々はβ二項法(4)を用いて,6%conservative variant calling thresholdで伝播ボトルネックサイズを再推定した(Fig. 1A, fig. S1C, and data file S1).variant calling thresholdを上げても,ボトルネックサイズの推定値に偏りはないが,推定値の統計的不確実性は高まる.この6%のカットオフ値では,ドナーiSNVs1つ以上残っている伝播ペアは13組しかなく,それゆえこれらのペアでのみボトルネックサイズを推定することができた.この13組のうち12組では,Nbの最尤推定値は1であり(95%信頼区間[CI]の最大上限はNb= 181ビリオン),残りの1組(CoV_198CoV_230)の推定値はNb= 143ビリオン(95%CI 4-951)であった.この伝播ペアは,ドナーiSNV(頻度は約22%)がレシピエントに伝播したものの,サブクローナル(頻度は約17%)のままであった唯一の感染ペアであった.これらの推定値の信頼区間が大きかったため,これら13組の伝播ペアのデータを用いて,全体的な伝播ボトルネックサイズを推定した.その結果,平均ボトルネックサイズは1.21と推定され,伝播成功の> 99%3個以下のウイルス粒子が感染(seeding)を成功させていることがわかった(Fig. 1G.なお,この推定値は,伝播ペアのドナーとレシピエントの間で観察される遺伝的変異のパターンに依存する.我々はここでは,Popaらが指定した伝播ペアを参考にした; これらのペアを誤って指定すると,ボトルネックの推定値が誤って小さくなる可能性がある.

我々は,Popaらが発表したウイルスディープシーケンスデータを再解析した結果,伝播のボトルネックが非常に狭い(very tight)ことがわかり,これはヒト(3, 5)や他の哺乳類におけるSARS-CoV-2伝播のボトルネックサイズを定量化した最近の他の研究の結論とも一致する(6)これらの結果は,SARS-CoV-2の伝播のボトルネックが狭く,A型インフルエンザウイルスと同様の大きさであることを示している(7)ボトルネックサイズが小さいということは,もしウイルスの遺伝的多様性があったとしても,ほとんどない状態で感染が始まるということでもあり,それゆえ,急性感染では,超感染(superinfection)の場合を除いて,ウイルスの多様性が低レベルという特徴がある.我々の再解析は,感染者間および感染者内でのSARS-CoV-2の進化についての理解を深める上で,重要な意味を持っている.

 

 

References

1) A. Popa, J.-W. Genger, M. D. Nicholson, T. Penz, D. Schmid, S. W. Aberle, B. Agerer, A. Lercher, L. Endler, H. Colaço, M. Smyth, M. Schuster, M. L. Grau, F. Martínez-Jiménez, O. Pich, W. Borena, E. Pawelka, Z. Keszei, M. Senekowitsch, J. Laine, J. H. Aberle, M. Redlberger-Fritz, M. Karolyi, A. Zoufaly, S. Maritschnik, M. Borkovec, P. Hufnagl, M. Nairz, G. Weiss, M. T. Wolfinger, D. von Laer, G. Superti-Furga, N. Lopez-Bigas, E. Puchhammer-Stöckl, F. Allerberger, F. Michor, C. Bock, A. Bergthaler, Genomic epidemiology of superspreading events in Austria reveals mutational dynamics and transmission properties of SARS-CoV-2. Sci. Transl. Med. 12, eabe2555 (2020).

2) A. L. Valesano, K. E. Rumfelt, D. E. Dimcheff, C. N. Blair, W. J. Fitzsimmons, J. G. Petrie, E. T. Martin, A. S. Lauring, Temporal dynamics of SARS-CoV-2 mutation accumulation within and across infected hosts. PLOS Pathog. 17, e1009499 (2021).

3) K. A. Lythgoe, M. Hall, L. Ferretti, M. de Cesare, G. MacIntyre-Cockett, A. Trebes, M. Andersson, N. Otecko, E. L. Wise, N. Moore, J. Lynch, S. Kidd, N. Cortes, M. Mori, R. Williams, G. Vernet, A. Justice, A. Green, S. M. Nicholls, M. A. Ansari, L. Abeler-Dörner, C. E. Moore, T. E. A. Peto, D. W. Eyre, R. Shaw, P. Simmonds, D. Buck, J. A. Todd; Oxford Virus Sequencing Analysis Group (OVSG), T. R. Connor, S. Ashraf, A. da Silva Filipe, J. Shepherd, E. C. Thomson; COVID-19 Genomics UK (COG-UK) Consortium, D. Bonsall, C. Fraser, T. Golubchik, SARS-CoV-2 within-host diversity and transmission. Science 372, eabg0821 (2021).

4) A. Sobel Leonard, D. B. Weissman, B. Greenbaum, E. Ghedin, K. Koelle, Transmission bottleneck size estimation from pathogen deep-sequencing data, with an application to human influenza A virus. J. Virol. 91, e00171-17 (2017).

5) K. Braun, G. K. Moreno, C. Wagner, M. A. Accola, W. M. Rehrauer, D. A. Baker, K. Koelle, D. H. O’Connor, T. Bedford, T. C. Friedrich, L. H. Moncla, Acute SARS-CoV-2 infections harbor limited within-host diversity and transmit via tight transmission bottlenecks. PLOS Pathog. 17, e1009849 (2021).

6) K. M. Braun, G. K. Moreno, P. J. Halfmann, E. B. Hodcroft, D. A. Baker, E. C. Boehm, A. M. Weiler, A. K. Haj, M. Hatta, S. Chiba, T. Maemura, Y. Kawaoka, K. Koelle, D. H. O’Connor, T. C. Friedrich, Transmission of SARS-CoV-2 in domestic cats imposes a narrow bottleneck. PLoS Pathog. 17, e1009373 (2021).

7) J. T. McCrone, R. J. Woods, E. T. Martin, R. E. Malosh, A. S. Monto, A. S. Lauring, Stochastic processes constrain the within and between host evolution of influenza virus. eLife 7, e35962 (2018).

8) G. Tonkin-Hill, I. Martincorena, R. Amato, A. R. J. Lawson, M. Gerstung, I. Johnston, D. K. Jackson, N. R. Park, S. V. Lensing, M. A. Quail, S. Gonçalves, C. Ariani, M. S. Chapman, W. L. Hamilton, L. W. Meredith, G. Hall, A. S. Jahun, Y. Chaudhry, M. Hosmillo, M. L. Pinckert, I. Georgana, A. Yakovleva, L. G. Caller, S. L. Caddy, T. Feltwell, F. A. Khokhar, C. J. Houldcroft, M. D. Curran, S. Parmar; COVID-19 Genomics UK (COG-UK) Consortium, A. Alderton, R. Nelson, E. Harrison, J. Sillitoe, S. D. Bentley, J. C. Barrett, M. E. Torok, I. G. Goodfellow, C. Langford, D. Kwiatkowski; Wellcome Sanger Institute COVID-19 Surveillance Team, Patterns of within-host genetic diversity in SARS-CoV-2. eLife 10, e66857 (2021).

9) F. Wu, S. Zhao, Y.-M. Chen, W. Wang, Z.-G. Song, Y. Hu, Z.-W. Tao, J.-H. Tian, Y.-Y. Pei, M.-L. Yuan, Y.-L. Zhang, F.-H. Dai, Y. Liu, Q.-M. Wang, J.-J. Zheng, L. Xu, E. C. Holmes, Y.-Z. Zhang, A new coronavirus associated with human respiratory disease in China. Nature 579, 265–269 (2020).

scitranslmed.abh1803_sm.pdf