COVID-19関連追加(2021313日)

宿主内多様性と伝播について

 

SARS-CoV-2の宿主内多様性と伝播】

Lythgoe KA, et al. SARS-CoV-2 within-host diversity and transmission. Science  09 Mar 2021: eabg0821. https://doi.org/10.1126/science.abg0821.

Abstract

パンデミックウイルスSARS-CoV-2の大規模なグローバルサンプリングとシーケンスによって,研究者はその広がりをモニターし,新たな変異株を特定することが可能になった.変異株の広がりを決定する2つの重要な要素は,変異株が宿主内でどのくらいの頻度で発生するか,そして伝播するにはどのくらいの可能性があるかどうかということである.宿主内多様性と伝播の特徴を明らかにするために,英国で採取した臨床サンプル1313例のディープシーケンスを行った.SARS-CoV-2 感染は,ウイルス量が多い場合には宿主内多様性が低レベルであり,伝播時のボトルネックが狭いことが特徴である.ほとんどの変異株は伝播の時点で,系統樹で観察される,共有された多様性パターンは最小限にとどまり,消失するか,時には固定化する.我々の結果は,伝播を促進する変異株や免疫逃避変異株はまれに発生する可能性があるが,もし伝播に成功した場合には急速に広がる可能性があることを示唆している.

Main

SARS-CoV-2の進化が進行していることは,パンデミックの発生とともに大きな関心事となっている.一塩基多型(SNP: single nucleotide polymorphisms)で定義される明確な系統が出現し(1),ウイルスの拡散を追跡することが可能になっているが(2, 3),新たな変異や変異の組み合わせがウイルスに選択的優位性(selective advantages)を与え,制御努力の妨げになるのではないかという懸念も生じている.パンデミックの最初の年に世界中に広まったスパイクタンパク質のD614G変異は,ウイルス伝播性を高めるという抗しがたい証拠がある(4-6).現在,懸念されている変異株(variants of concern)には,伝播率が約50%と推定されるB.1.1.7系統(7, 8),自然免疫あるいはワクチンによる獲得免疫に対する感受性が低下している可能性(12-14)があるB.1.351系統やP.1系統がある(10, 11).ここで示した系統コード(lineage codes)は,Pangolin software(1)で指定されたものである.

ほとんどの分析は,感染した個体内で優位な変異株を示すウイルスのコンセンサスゲノム(consensus genome※コンセンサス配列: DNARNA中で,一定の機能に関与している領域に高い頻度で出現する塩基やアミノ酸の平均的な配列)で観察される変異に焦点を当てている.しかし,最終的には個体内で新たな変異が出現し,それゆえ集団レベルでのウイルスの宿主内多様性を完全に理解し,それがどのくらいの頻度で伝播するのかを知ることは,適応(adaptation)や拡散のパターンを理解する上で重要である.

英国では,1000件以上の独立した輸入イベントが発生し,ウイルスの多様性が大きく変化した,最も深刻な感染の第1波を経験した(15).本研究では,感染第1波(20203月〜6, Table S1)に,主に入院中の有症者や医療従事者から採取した鼻咽頭スワブ1313サンプルから得られた1390SARS-CoV-2ゲノムを解析した.このデータセットは,1173人からのサンプルで構成されており,そのうち41人は24つのタイムポイントでサンプルを採取しており、さらに93人は匿名のサンプルである.そして,再現性を検証するために,76/1313サンプルの複数のRNA aliquotsを再シーケンスした.サンプルは,地理的に異なる2つの病院(60km離れたオックスフォード大学病院とベイジングストーク・アンド・ノース・ハンプシャー病院の2つの病院)で採取された.veSEQを用いて,quantitative targeted enrichment strategyに基づいたRNA-SeqプロトコルであるveSEQを用いて(16)(このプロトコルは,他のウイルスについてもすでに検証されている(16-19)),我々は,SARS-CoV-2の宿主内多様性の全容を明らかにするとともに,コンセンサス系統(consensus phylogeny)を背景にして解析した.

我々は,高ウイルス量のサンプルでは,スパイクを含むゲノム全体で宿主内進化が抑制され,宿主内多様性が低レベルであることを観察した宿主内変異株(WH variant: with-in host variant; 別名iSNVは,同じ系統クラスター内の複数の個体−その中には同じ世帯に住む者もいる−で観察されることがあるが,ほとんどのウイルス変異株は,伝播の時点で,伝播のボトルネックは狭く,失われているか,あるいは時には固定されているこれらの結果から,感染初期の,ウイルス量が多く,伝播の可能性が最も高い時期(20-22)には,感染性を高める変異や,ワクチンや治療を逃避する可能性のある変異株はめったに出現せず,その後に伝播させない可能性が示唆されたそれにもかかわらず,我々は,受容体への結合や抗体による中和に影響を及ぼす可能性のある変異が複数の個体に存在することを確認したワクチン接種率の高い集団や自然免疫レベルの高い集団では,逃避変異による適合性の利点(fitness advantage)が大きくなる可能性があり,変異の影響は,それが検出された遺伝的背景に依存する可能性があるため,これらの知見から,継続的な警戒とモニタリングの必要性が強調される.

Detection of variants is influenced by viral load:

変異株の頻度を確実に推定するためには,リード数が対象サンプル中の対応する配列の量に比例するような定量的なシーケンスが必要である.veSEQプロトコルは,RSVのような呼吸器ウイルスを含む多くの異なる病原体に対して定量的であることが示されている(17).我々は,SARS-CoV-2でも同様の定量的な関係が成り立つことを実証した.SARS-CoV-2についても同様の定量的な関係があることを示した。我々が得たマッピングされたシーケンスユニークリード数(uniquely mapped sequencing reads)は,合成RNAコントロールの段階希釈(serial dilutions)におけるRNAコピー数と対数線形(log-log linearly)に増加し(Figure S1A, r2= 0.87),結果として,臨床サンプルのCt値(cycle thereshold)と相関した(Figure S1B).これは,veSEQリードは,input RNA内のウイルス配列の代表的なサンプルとみなすことができることを示している.

宿主内多様性を理解するために,25%マイナーアレル頻度(MAF: minor allele frequencyの変異株を特定するためのさまざまな閾値を試し,1390のゲノムのフルセットでiSNV(宿主内一塩基変異)数を定量化したまた,iSNVと呼ぶためには,少なくとも100リードの深度(depth)が必要であり,MAFが閾値よりも大きい部位はすべて含まれた(Figure 1A

Figure 1: Characterization of iSNV frequencies.

(A) 各サンプルで同定されたiSNV部位の数と,マッピングされたユニークリード数の分布.色はマイナーアレル頻度(MAF)の閾値を表している; MAFが閾値よりも大きい場合,サンプル内でiSNVサイトが同定される.(B) MAFの閾値を適用しない場合の,マッピングされたユニークリード数に対する各サンプルの平均MAFの分布.緑のリボンは95%信頼区間であり,黒線は線形回帰による推定平均値.(C) 3%MAF閾値を設定した場合の,iSNV部位の数の分布.各色は異なる高深度サンプル(high-depth sample)を表す.

すべての閾値において,サンプルのウイルス量(マッピングされたユニークリードの合計で推定)と検出されたiSNVの数との間には非線形の関係が見られ,ウイルス量が中程度(マッピングされたリードが〜2000)のときにiSNVの数が最も多く検出されたしかし,閾値を適用しない場合,サンプルあたりの平均MAFはウイルス量に応じて変化しなかった(p= 0.291, linear regression, Figure 1Bこれは,マッピングされたリード数が減ると,観察されたMAFの分散が大きくなる一方で,平均値は変わらないことを示している.この効果は,二項分布において,総draw数とそれらのdrawで観察された成功の割合における分散との間にある逆の関係によると,少なくとも部分的である.Figure 1Cでは,我々は,高深度サンプルからダウンサンプリングすることでこの効果を示している: 最終的にはiSNVが検出されないほど少ないリードしかサンプリングされないが,サンプリングが疎になることで分散が大きくなり,閾値を超えるiSNVの数が増加する.

このような低ウイルス量によるサンプリング効果は,低ウイルス量サンプルにおいて宿主内多様性を高める生物学的メカニズムの存在を妨げるものではない.最初のピークの後,感染が進むにつれてウイルス量は減少するのが一般的であるが(20),一方で,HIVのような他のウイルス感染症で観察されるように,遺伝的多様性が増加する可能性がある(23).また,感染の進行に伴うRNAの傷害(24)も,低ウイルス量サンプルで観察される多様性の増加に寄与している可能性がある.

 

Within-host variant frequencies are reproducible:

variant callingの精度を高め,誤検出率を最小限に抑えるために,再配列されたコントロールの宿主内一塩基変異(iSNV: intrahost single-nucleotide variants)と,製造元(Twist Bioscience)から提供されたstock RNAの配列データを比較し,in vitroでの変異生成に対して脆弱な部位を保護(mask)した(Table S2).我々はまた,高ウイルス量である20サンプル以上において,変異株(3%を超えるMAF)が観察された18部位を保護(mask)した(Table S3, Figure S3).その多くはサンプル間で一貫して低いMAFを示しており,一部はstrand bias(※siRNA内部のエネルギー的な安定性に偏りがある場合、片方のRNA鎖だけが優先的にRNAi経路に利用される現象)や技術的な複製の再現性の低さを示していた(Figure S2)ことから,真の遺伝子変異株(genomic variants)ではないことが示唆された.46サンプルで観察された11083部位が除外され,それはGISAIDデータでは世界的に偏在していた.これは,我々のデータセットのマップされたリードを手作業で調べたところ,11082部位の上流にある宿主内多型欠失(poly-T homopolymeric stretchに発生する)のcommon mis-callingによるものと思われた.もし本物であれば,このhomopolymer stutterには構造的あるいは制御的な役割があるかもしれない; しかし,このマッピングが困難な領域を解決するための方法論的な問題は除外できない.

真の変異株頻度(variant frequencies)が不明な臨床サンプルに対して,信頼性の高いvariant calling閾値を設定するには,理想的には,複数のサンプルのRNAを再シーケンスして一致性を調べる必要がある.我々は,実験検査で残った少量のRNAという制約の中で,高ウイルス量の76サンプルに再シーケンスを行った.そのうち27の複製ペアでは,信頼性の高いminor variant検出に十分なリード数(50,000を超えるマッピングされたユニークリード数)が得られた.MAF2%未満の宿主内一塩基変異(iSNV)は,概してノイズと区別できなかったが,MAFが≧3%のものは複製間で非常に一致していた(Figure 2A, Figure S2).

 

 

Figure 2: Comparison of allele frequencies between sequencing replicates of the same sample and multiple time points from the same individual.

(A) RNAから再シーケンスされた27の複製ペアのMAFを比較した.各点は複製ペアの1つのゲノム位置を表す.このプロットは,両方の複製が50,000を超えるユニークリードを持っていた27サンプルのすべてのMAF頻度の比較を表している(54の複製のうち少なくとも1つでMAF> 0.02となったゲノム部位に限定している).緑色の線は,閾値である0.03を示している.(B, C) 異なる日に採取された41人から得られた対立遺伝子頻度(allele frequencies)の比較.各点は同一個体から得られた一対のサンプルのゲノム位置を表している.各個体は異なる色で表されており,各個体について,いずれかのサンプリング時点でMAF> 0.03および/またはコンセンサスの変化(change in consensus)が観察されたすべてのゲノム位置を考慮している.すべての例において,poly-A tailRNA合成コントロールで変化した部位は除外され,20を超えるサンプルでMAF> 3%の変化が観察された部位も,遺伝子変異株(genomic variants)である可能性が低いため除外された.(C)(B)の原点付近の領域を拡大したもの.

 

Within-host variants vary during infection:

さらに,サンプリング期間120日(中央値6, Figure 2B/C)で,複数回サンプリングした41人の異なる時点におけるiSNV頻度とコンセンサスの変化を比較した.感染が進行するとウイルス量が減少する傾向があるため,我々は,マッピングされたユニークリード数が50,000を超えるサンプルに限定せず,すべてのサンプルを対象とした.41人のうち,個体内の各時点におけるminor variant頻度の一致はほとんど観察されなかった.この観察結果は,他の研究(24-26)と一致しており,宿主内でのダイナミックなランドスケープ(”地形”, landscape)を示唆するが,ウイルス量の少ないサンプルの固有の確率論性(stochasticity)を反映している.

 

 

The transmission bottleneck size within households is small:

伝播のボトルネックサイズは,宿主内の新しい変異株が集団内で広がる可能性を決定する重要な要素である(27)SARS-CoV-2の場合,ボトルネックサイズの推定は困難である.なぜなら、感染源と感染者の間で伝播する可能性のある異なるウイルスを区別するために十分な遺伝的多様性(28-31)と,感染源と感染者の両者で観察される変異の原因が伝播であるという確信が必要だからである; 伝播によって共有されない変異株を含めることで,伝播のボトルネックサイズの推定値を大幅に増加させることができる(29).家族2人が互いに2週間以内に最初に陽性と認められた16世帯を特定し,その個体のコンセンサス配列の違いが3つ未満であれば,直接感染伝播と仮定した(したがって,1世帯を除外した).感染源と想定される者が3%を超えるMAFをもつ変異株を持たなかったため,さらに1世帯を除外した.

exact beta-binomial method(28)を用いると,家庭内感染伝播14ペアにおけるボトルネックサイズの最尤推定量は18であった(Figure 3A, Table S4.これらの結果は,インフルエンザ(30-32)SARS-CoV-2(33-37)で観察されたボトルネックサイズと一致しているが,最近のオーストリアの研究(25)における推定値よりもかなり低い.この相違の理由は明らかではないが,解析対象とした変異株の選択方法の違い(37),あるいは観察された多様性が伝播可能なウイルスと伝播に成功したウイルスの多様性をどの程度表現しているか,を反映している可能性がある.インフルエンザでは,曝露経路と伝播のボトルネックとの関連性が実験的に示されており(32),それゆえ環境の違いによるボトルネックの大きさの真の違いを除外することはできない.

 

 

Figure 3: Small transmission bottleneck size within households.

(A) exact beta-binomial method(28)を用いて算出した14世帯における推定ボトルネックサイズ.感染源に3%を超えるMAFを持つiSNVが確認されていない場合(8世帯),または家庭内の2人に2つを超えるコンセンサスの違いがある場合(15世帯)には,推定値は記録されなかった.エラーバーは,尤度比検定で求めた95%信頼区間を示す.(B) 家庭内で同定されたiSNVの運命(fate of identified iSNVs).各線は,家族1人におけるある変異株の対立遺伝子頻度と、2人目における対立遺伝子頻度を結んでいる; 点と線は家庭ごとに色分けされている.それぞれが少なくとも1人においてiSNVとして同定されたが,必ずしも両者で同定されたわけではない.サンプル採取日が1週間以上異なる場合は,家庭内の推定された感染源と感染者を示している.

 

Within-host variants are present in the majority of SARS-CoV-2 samples:

個体のiSNV部位の特徴をさらに明らかにするために,(i)高ウイルス量サンプルで少なくとも50,000のマッピングされたユニークリードが観察され(462サンプル, オックスフォードから160サンプル, ベイジングストークから302サンプル),(ii)深度(depth)が少なくとも100リードで,(iii)MAFが少なくとも3%で,(iv)合成RNAコントロールでの変化が観察されない,あるいは多数のサンプルにおいて低頻度で出現していない,高確信度iSNV部位(high-confidence iSNV)を563を特定した(Table S3).1313サンプルすべてを解析対象としたのは,あらかじめ定義された少数の部位を確認することで,上述の確率論的サンプリング効果(stochastic sampling effect)により,低ウイルス量サンプルのみMAF3%を超える部位が含まれる可能性が低くなるという仮定に基づいている.

変異株解析の対象となったiSNV部位のうち,ほとんどは1313サンプルのうち1つまたは2つでしか観察されなかったが(Figure 4A),50,000を超えるユニークリードを持つサンプルの大部分(305/462, 66%)には少なくとも1つのiSNVが存在していた(Figure 4B急性感染期におけるSARS-CoV-2の宿主内多様性の低さは,他の研究で報告されているレベル(26, 33)と一致しているが,他のいくつかの研究(24, 25)よりも低く,変異株の同定方法を反映していると考えられる.

Figure 4: Intra-host variable (iSNV) sites are often found in multiple samples and most samples have at least one iSNV.

(A) N個のサンプルで見つかったiSNV部位の数を示すヒストグラム.我々のデータセットの全てのサンプルを含む.(B) マッピングされたリードが50,000を超えるサンプル(暗赤色)と50,000未満のサンプル(明赤色)について,iSNV部位がn個存在するサンプルの数を示すスタック型ヒストグラム.変異株解析のために同定された563部位すべて(3UTRおよび5UTR内の部位を含む)を含むが,polyA tailは除外し,20人以上の個人で変動する18部位は除外した.

2つのサンプルでは,iSNVの数が特に多く(1518),それぞれのMAFが高く相関しており,2つの多様な変異株のハプロタイプによる重複感染と一致する(38).これらのサンプルのうち1つについては,感染源となりうるサンプルが特定できなかったので,実験によるコンタミネーションは考えにくい.もう1つのサンプルでは,2つの変異株のハプロタイプが共通の遺伝子型であったため,重複感染とコンタミネーションを区別することができなかった.

しかし一般的には,ウイルスの遺伝的多様性が低いため,重複感染やコンタミネーションを特定したり,それらを区別したりすることは困難である.もし多数のSNPが存在する部位(我々のデータセットでは共通の系統を区別する変異)が,重複感染やコンタミネーションによって,唯一宿主内変異株として観察される場合,我々は,サンプルの約12%が重複感染やコンタミネーションの影響を受けている可能性があると推定する(Table S2).コンタミネーションやバッチ効果(※実験環境 (機器や観測者など) の違いで生じるデータ変動)を予防するために,疫学的につながりのある既知のサンプルを,可能な限り異なるバッチ(batch)でシーケンスした(Figure S4).

我々は,観察された宿主内変動(within-host variation)の一部は,SARS-CoV-2感染の14%で報告されている季節性コロナウイルスとの重複感染によるものではないかと仮定した(39, 40).具体的には,類似のウイルスから得られた密接に一致するリードがSARS-CoV-2にマッピングされ,mixed base callsとして示される可能性がある.重複感染の影響を理解するために,SARS-CoV-2を除くすべてのヒトコロナウイルスのプローブを含むCastanet multi-pathogen enrichment panel(17)を用いて,SARS-CoV-2 VLsCt 14-33, 中央値19.8)が観測された全範囲にわたる180サンプルを再採取して解析した.我々は,SARS-CoV-2Castanetデータにおいて得られた111サンプルのうち,別のベータコロナウイルスであるヒトコロナウイルスOC43にも陽性であった1サンプルを確認した(Figure S5).このサンプルのSARS-CoV-2ゲノムは完全かつ高深度であったが,位置(position285801つのiSNVが観察されただけで,他のゲノム位置には塩基が混在している証拠はなかった.このことから,重複感染があったとしても,本プロトコルにおけるSARS-CoV-2の宿主内多様性の推定には影響しないと考えられる.しかし,OC43や他のコロナウイルスとの重複感染がSARS-CoV-2に選択圧を与えているかどうかは未解決の問題である.

Distribution of iSNVs across the genome:

次に,同定された確信度の高いiSNV部位のゲノム上の分布を検討した.iSNV部位の密度が非常に高いUTR領域を除いても,ゲノム全体にかなりのばらつきがあり,open-reading framesORF3a7a8,そしてnucleocapsidN)が最も高い密度を示した(Table 1).さらに,各iSNVが一度だけde novoで生成され,続いて伝播したと仮定して,dN/dS値を算出した(Table 1).他の研究(24, 33)と同様に,スパイクタンパク質(S)を含め,ゲノムのほとんどの領域はdN/dS値が1未満となり,浄化選択(purifyng selection)されているように見える.次に,同定された確信度の高いiSNV部位のゲノム上の分布を検討した.iSNV部位の密度が非常に高いUTR領域を除いても,ゲノム全体にかなりのばらつきがあり,open-reading framesORF3a7a8,そしてnucleocapsidN)が最も高い密度を示した(Table 1).さらに,各iSNVが一度だけde novoで生成され,続いて伝播したと仮定して,dN/dS値を算出した(Table 1).他の研究(24, 33)と同様に、ゲノムのほとんどの領域は浄化選択を受けているようで、スパイクタンパク質のSを含め、dN/dS値は1未満であった。宿主内の進化ダイナミクスや伝播を取り入れた完全なモデルがなければ,強い結論を出すことは困難である.しかし,各iSNVが観察された各個体でde novoで出現したと仮定しても,同様の結果が得られた(Table S5).これらのパターンは,SARS-CoV-2のコンセンサスゲノム(41)SNPsについて計算されたdN/dS値ともほぼ一致しており,少なくともウイルス量の多いサンプルの宿主内変異部位については,宿主内レベルでの進化の力が宿主間レベルで反映されていることを示唆している.

 

 

Table 1: iSNVs and dN/dS by gene and over the whole genome.

 

Within-host variant sites are phylogenetically associated:

我々は,SARS-CoV-2の進化について理解を深め,系統樹や感染伝播クラスターの解明にiSNVを利用できるかどうかを調べた.今回の研究では,1390のゲノムについて,(42)で概説されているrobustな手順を用いて系統樹を構築した(Figure 5A).ウイルス系統樹は,各サンプルのコンセンサス配列に基づいており,枝はサンプル間のコンセンサス配列の違いを示している.伝播のボトルネックが狭いと推測されることから,我々は系統樹上でのコンセンサスの変化は,宿主内変異株の出現(宿主内変異株は出現した個体内でコンセンサスに達するか,あるいはコンセンサスに達しなかったが,その後伝播して感染者においてコンセンサスが変化する)によって生じると仮定した.したがって,十分に密度が高いサンプルされた感染者集団では,iSNVを含むサンプルと,同じ遺伝子座(locus)でコンセンサスの変化をもたらす樹(ツリー)の枝との間に,系統的な関連性を観察することができるはずである.

 

 

Figure 5: Consensus phylogeny of all isolates.

(A)では,先端をサンプリングセンターで色分けしている(オックスフォード, オレンジ; 米ジングストーク, 緑).ツリーのスケールは部位(site)あたりの置換である。(BD) 3つの遺伝子座(loci)にiSNVを持つサンプルの分布.左上にゲノム座標(Wuhan-Hu-1参照配列を基準とする)を示す.樹の枝はその位置のコンセンサス塩基で色付けされ,塗りつぶされた円は,その位置で少なくとも100の深度を持つサンプルにiSNVが最低3%存在するサンプルを示し、存在する最も一般的なminor variantで色付けされている.位置28580(B)20796(C)では,コンセンサス変化が,関連するnucleotidesのペアを持つiSNVに近接している系統図の部分を拡大したパネルを挿入した.強調されたサンプルは別々のバッチで調製されたものであり,このパターンはコンタミネーションによるものではない.(D) 位置21575L5F)の変異株は14サンプルに存在するが,この部位のコンセンサス変化とは系統的な関連がない.これは,複数の個体でこの変異株が独立して出現したことを示しているのかもしれない.系統樹は,Morel(42)が示したrobustな手順に従って最尤法で構築した.

確信度が高いiSNV位置563のうち,少なくとも2つのサンプルに存在し,かつサンプル間のコンセンサスの違いが観察される153iSNV位置(SNPs)を同定した.これらの位置をiSNV-SNPsと呼ぶことにする.系統図上のコンセンサス変化の位置(iSNVの位置で2つの最も共通するbasesの間)に対するiSNVを持つ先端(tips)の近接性を調べた.その結果,あるサンプルのある位置のiSNVの存在と,同じ位置のコンセンサス変化の最も近い例までの系統経路距離(patristic distance)との間に,非常に有意な負の相関関係(one-sided Mann-Whitney U-test, p< 3x10-16; Figure S6A)が認められた; つまり,宿主内変動は,コンセンサスと同じ変異株が支持する枝を持つ樹(ツリー)にクラスター化していた.我々が,少なくとも2つのiSNVを個別に同定した位置をテストしたところ,Benjamini-Hochberg correction後に6つの位置が有意な関連性を示し(p< 0.05),各個体からの1サンプルのみを含む場合には5つに減少した.この手順を1000の系統的ブートストラップ複製のそれぞれに繰り返すと,ゲノム全体の位置を対象とした場合,普遍的に非常に強い関連性が得られた(maximum p= 2.46x10-10).また,すべてのブートストラップツリーには,19の有意なiSNV-SNPsが存在した(中央値7, IQR 5-7).

Figure 5Bでは,位置28580(ブートストラップ複製の85.8%において有意)の例を示している.赤いcladeは,グローバルコンセンサスG to ANにおける非同義変化D103N)からの変化を表しており,近くのiSNVは,変化の枝の先祖の節(node)ではminor Asとして,枝の直近の子孫の節ではminor Gsとして,発生している.対応する疫学データによれば,これは医療関連のクラスターであり,濃厚接触者への感染伝播を示している.Figure 5Cでは,ORF1aの同義置換L6843である位置20796(ブートストラップ複製の98.4%において有意)の例を示している.Benjamini-Hochberg correction後の他の有意な位置のツリーはFigure S7に示した.SNPiSNVの関係を裏付けるように,我々が調べた家庭内感染伝播ペアでは,十分な深度がある5つのコンセンサスの違いについて,すべてが2人のうちの1人の宿主内変異株であったことに注目したい(Figure 4B

少なくとも2個体に存在するが,コンセンサスに至らない261iSNVについて,我々は,各iSNVの系統との関連性を離散的な形質(discrete trait)として,関連性指数(association index(34)iSNV先端(tip)間の平均系統経路距離の2つの統計量を用いて分析した.多重検定を調整した結果,どちらの統計量でも系統とiSNVの関連性を示すp< 0.05の部位はなかった.同様に,全261iSNV部位において,iSNV先端(tips)と非iSNV先端の間で,最も近いiSNV先端までの距離を単純に比較した場合も,系統的な関連性を示す証拠はなかった(one-sided Mann-Whitney U-test p~=1, Figure S6B).しかし,いくつかの部位では,伝播後も多様性が維持される(2つの統計量のうち少なくとも1つの多重検定を調整する前にp< 0.0522部位, p< 0.0259部位, Figure S7iSNVの伝播を示唆するパターンが見られた.よって,いくつかの関連性を統計的に検出するパワーが不足している可能性がある.家庭内感染伝播15ペアのうち,同一世帯内の2人の個人に共通するiSNVはわずか1つだけであったことが観察された.このiSNVは,今回のデータセットではこの2人にしか存在せず,伝播したウイルスの多様性の一例であることを示している(Figure 3B).

これらの観察結果から,伝播のボトルネックは,複数の遺伝子型(genotypes)の共伝播(co-transmission)を可能にするほど広い場合もあれば,その後の少数の伝播では複数の変異株が存続しないほど狭い場合もあることが示唆された.伝播によって系統樹上のコンセンサス変化が得られる場合,これらのパターンは容易に観察できる.しかし,ほとんどの場合,共伝播(co-transmission)のパターンは,伝播しない,あるいは伝播しても失われるiSNVの割合が多いために,かき消されてしまうと我々は考えている.これらのパターンを完全に解明する(elucidate)ためには,複数世代にわたる感染伝播イベントの分析が必要である.

系統的な関連性がないにもかかわらず,繰り返し発生する変異株は,異なる個体において選択された部位を示している可能性がある(43)特に注目すべきは,Sにおける3つの部位で観察された変異株である: 21575L5F),22899G446V),24198A879V)であり,G446Vは受容体結合ドメイン(RBD: receptor binding domain)内に存在するminor variantであるF514サンプルで観察され,8サンプルではSNPを表していたが,我々のiSNV-SNP解析では系統的な関連性は見られなかった(多重検定調整前でp= 0.771, Figure 5D).このL5F変異は,in vitroでの感染力を高めることが示されており(44),選択の対象となる可能性のある部位として以前から同定されていた(45).この変異は,minor variantも含めて世界中のサンプルで繰り返し観察されているが,頻度の増加は緩やかであるようで,これは個体のごく一部のサブセットにおいてのみ有利であり,それに続く感染では変異株が”逆戻り(reverting)”する(HIV(46)で観察される)か,あるいは完全に伝播に失敗することを示唆している.

同様に,minor variantであるV446V879も,それぞれ4人と6人で観察された.この2つの変異株は,in vitroで回復期血清に対する感受性を低下することが示されており(44)V446は,REGN-Cov2抗体カクテルの中の1つの抗体(REGN10987)の結合を強く低下させることから(47),これらは抗体逃避変異である可能性が示唆される.懸念されている変異であるN501YE484K(48)は,いずれのサンプルでも観察されなかった.

Concluding remarks:

我々は,1000人以上の大規模データセットにおいて,iSNV部位(宿主内一塩基変異)は,同じ部位でコンセンサス変異株の変化と関連している場合,強い系統的なクラスタリングパターンを示し,SARS-CoV-2の宿主内多様性が一貫して再現可能なパターンであることを明らかにしたしかし,ほとんどのサンプルでは宿主内変異株はほとんど見られず,推定される伝播ボトルネックの大きさは非常に小さく,家庭内感染伝播ペアの最大尤度推定値は18であったつまり,もし変異が生じたとしても,それは伝播の時点で失われる傾向がある可能性が高いSARS-CoV-2の密度サンプリング(dense sampling)とディープシーケンスによって,ある個体で発生した変異株が伝播すると,その後に感染した個体でコンセンサス(consensus)と固定(fixation)が変化するという”行動における進化(evolution-in-action”を目撃することができた.このことから,コンセンサスの多様性が低い背景にある伝播パターンをよりよく解決させるために,少なくともいくつかの場合では,宿主内変異株が利用されることが示唆された.

我々の観察によって,ワクチンや治療逃避変異株が宿主内に出現することは,少なくともウイルス量が多い感染初期には,比較的稀であることが示されたしかし,たとえワクチンや治療による選択圧がない場合でも,宿主に適応する可能性のある変異は十分な頻度で観察され,まれな伝播イベントであっても,狭いボトルネックサイズと相まって,急速な広がりをもたらす可能性がある.今回,スパイクには,複数の個体に存在する非同義のminor variant30個確認された(Table S2).これらのうち2つ(G446VA879V)は抗体結合を逃避することが示されており(44)3つ目のL5Fはウイルスの感染性を高めることが示されている(44)特にワクチンや治療薬の普及に伴い,一般的に発生するiSNVや,感染性や重症度,免疫応答に影響を与えることが知られている変異株を調査し,モニタリングする必要があると考えられる

B.1.1.7B1.351P.1を含む,新たな懸念される変異株(variants of concern)が出現したことで,引き続き警戒する必要があることが明らかになった.多数の非同義変異を特徴とするこれらの変異株は,感染期間が長く,ウイルスが長期的な免疫圧にさらされていた宿主内で生まれたものであり(7, 8),宿主内での欠失(deletion)の出現(49)によって促進された可能性があるという仮説が代表的である.しかし,同じ遺伝的背景に複数の変異が存在することは,新たな変異株が懸念される不可欠な条件ではない.スパイクのD614G変異は,パンデミックの初期段階で出現した後,おそらく伝播上の優位性から世界的に広がった(50).伝播力が強いB.1.1.7を背景に出現する,宿主の免疫応答を回避する可能性があるN439KE484Kを含む変異(47, 51)は,特に自然感染やワクチン接種によって集団免疫が構築されている場合には問題となる.

宿主内変異株を解析に取り入れるためには,ディープシーケンスデータを作成するために使用された方法を背景に観察された宿主内多様性を理解することが不可欠であることが今回の研究によって示された.我々は,可能な限りシークエンスのアーティファクトとサンプルのコンタミネーションを最小限に抑えることを目指した.さらに,今回の結果は,パンデミックが進行する中でSARS-CoV-2を深く理解するためには,オープンデータ,大規模かつ厳密に管理されたデータセット,そしてゲノム,臨床,疫学の情報を統合することの重要性を強調するものである.

 

 

References

1) A. Rambaut, E. C. Holmes, Á. O’Toole, V. Hill, J. T. McCrone, C. Ruis, L. du Plessis, O. G. Pybus, A dynamic nomenclature proposal for SARS-CoV-2 lineages to assist genomic epidemiology. Nat. Microbiol. 5, 1403–1407 (2020).

doi:10.1038/s41564-020-0770-5pmid:32669681

2) J. Hadfield, C. Megill, S. M. Bell, J. Huddleston, B. Potter, C. Callender, P. Sagulenko, T. Bedford, R. A. Neher, Nextstrain: Real-time tracking of pathogen evolution. Bioinformatics 34, 4121–4123 (2018). doi:10.1093/bioinformatics/bty407pmid:29790939

3) J. Lu, L. du Plessis, Z. Liu, V. Hill, M. Kang, H. Lin, J. Sun, S. François, M. U. G. Kraemer, N. R. Faria, J. T. McCrone, J. Peng, Q. Xiong, R. Yuan, L. Zeng, P. Zhou, C. Liang, L. Yi, J. Liu, J. Xiao, J. Hu, T. Liu, W. Ma, W. Li, J. Su, H. Zheng, B. Peng, S. Fang, W. Su, K. Li, R. Sun, R. Bai, X. Tang, M. Liang, J. Quick, T. Song, A. Rambaut, N. Loman, J. Raghwani, O. G. Pybus, C. Ke, Genomic epidemiology of SARS-CoV-2 in Guangdong Province, China. Cell 181, 997–1003.e9 (2020).

doi:10.1016/j.cell.2020.04.023pmid:32359424

4) B. Korber, W. M. Fischer, S. Gnanakaran, H. Yoon, J. Theiler, W. Abfalterer, N. Hengartner, E. E. Giorgi, T. Bhattacharya, B. Foley, K. M. Hastie, M. D. Parker, D. G. Partridge, C. M. Evans, T. M. Freeman, T. I. de Silva, C. McDanal, L. G. Perez, H. Tang, A. Moon-Walker, S. P. Whelan, C. C. LaBranche, E. O. Saphire, D. C. Montefiori, A. Angyal, R. L. Brown, L. Carrilero, L. R. Green, D. C. Groves, K. J. Johnson, A. J. Keeley, B. B. Lindsey, P. J. Parsons, M. Raza, S. Rowland-Jones, N. Smith, R. M. Tucker, D. Wang, M. D. Wyles; Sheffield COVID-19 Genomics Group, Tracking changes in SARS-CoV-2 spike: Evidence that D614G increases infectivity of the COVID-19 virus. Cell 182, 812–827.e19 (2020). doi:10.1016/j.cell.2020.06.043pmid:32697968

5) E. Volz, V. Hill, J. T. McCrone, A. Price, D. Jorgensen, Á. O’Toole, J. Southgate, R. Johnson, B. Jackson, F. F. Nascimento, S. M. Rey, S. M. Nicholls, R. M. Colquhoun, A. da Silva Filipe, J. Shepherd, D. J. Pascall, R. Shah, N. Jesudason, K. Li, R. Jarrett, N. Pacchiarini, M. Bull, L. Geidelberg, I. Siveroni, I. Goodfellow, N. J. Loman, O. G. Pybus, D. L. Robertson, E. C. Thomson, A. Rambaut, T. R. Connor, C. Koshy, E. Wise, N. Cortes, J. Lynch, S. Kidd, M. Mori, D. J. Fairley, T. Curran, J. P. McKenna, H. Adams, C. Fraser, T. Golubchik, D. Bonsall, C. Moore, S. L. Caddy, F. A. Khokhar, M. Wantoch, N. Reynolds, B. Warne, J. Maksimovic, K. Spellman, K. McCluggage, M. John, R. Beer, S. Afifi, S. Morgan, A. Marchbank, A. Price, C. Kitchen, H. Gulliver, I. Merrick, J. Southgate, M. Guest, R. Munn, T. Workman, T. R. Connor, W. Fuller, C. Bresner, L. B. Snell, T. Charalampous, G. Nebbia, R. Batra, J. Edgeworth, S. C. Robson, A. Beckett, K. F. Loveson, D. M. Aanensen, A. P. Underwood, C. A. Yeats, K. Abudahab, B. E. W. Taylor, M. Menegazzo, G. Clark, W. Smith, M. Khakh, V. M. Fleming, M. M. Lister, H. C. Howson-Wells, L. Berry, T. Boswell, A. Joseph, I. Willingham, P. Bird, T. Helmer, K. Fallon, C. Holmes, J. Tang, V. Raviprakash, S. Campbell, N. Sheriff, M. W. Loose, N. Holmes, C. Moore, M. Carlile, V. Wright, F. Sang, J. Debebe, F. Coll, A. W. Signell, G. Betancor, H. D. Wilson, T. Feltwell, C. J. Houldcroft, S. Eldirdiri, A. Kenyon, T. Davis, O. Pybus, L. du Plessis, A. Zarebski, J. Raghwani, M. Kraemer, S. Francois, S. Attwood, T. Vasylyeva, M. E. Torok, W. L. Hamilton, I. G. Goodfellow, G. Hall, A. S. Jahun, Y. Chaudhry, M. Hosmillo, M. L. Pinckert, I. Georgana, A. Yakovleva, L. W. Meredith, S. Moses, H. Lowe, F. Ryan, C. L. Fisher, A. R. Awan, J. Boyes, J. Breuer, K. A. Harris, J. R. Brown, D. Shah, L. Atkinson, J. C. D. Lee, A. Alcolea-Medina, N. Moore, N. Cortes, R. Williams, M. R. Chapman, L. J. Levett, J. Heaney, D. L. Smith, M. Bashton, G. R. Young, J. Allan, J. Loh, P. A. Randell, A. Cox, P. Madona, A. Holmes, F. Bolt, J. Price, S. Mookerjee, A. Rowan, G. P. Taylor, M. Ragonnet-Cronin, F. F. Nascimento, D. Jorgensen, I. Siveroni, R. Johnson, O. Boyd, L. Geidelberg, E. M. Volz, K. Brunker, K. L. Smollett, N. J. Loman, J. Quick, C. McMurray, J. Stockton, S. Nicholls, W. Rowe, R. Poplawski, R. T. Martinez-Nunez, J. Mason, T. I. Robinson, E. O’Toole, J. Watts, C. Breen, A. Cowell, C. Ludden, G. Sluga, N. W. Machin, S. S. Y. Ahmad, R. P. George, F. Halstead, V. Sivaprakasam, E. C. Thomson, J. G. Shepherd, P. Asamaphan, M. O. Niebel, K. K. Li, R. N. Shah, N. G. Jesudason, Y. A. Parr, L. Tong, A. Broos, D. Mair, J. Nichols, S. N. Carmichael, K. Nomikou, E. Aranday-Cortes, N. Johnson, I. Starinskij, A. da Silva Filipe, D. L. Robertson, R. J. Orton, J. Hughes, S. Vattipally, J. B. Singer, A. D. Hale, L. R. Macfarlane-Smith, K. L. Harper, Y. Taha, B. A. I. Payne, S. Burton-Fanning, S. Waugh, J. Collins, G. Eltringham, K. E. Templeton, M. P. McHugh, R. Dewar, E. Wastenge, S. Dervisevic, R. Stanley, R. Prakash, C. Stuart, N. Elumogo, D. K. Sethi, E. J. Meader, L. J. Coupland, W. Potter, C. Graham, E. Barton, D. Padgett, G. Scott, E. Swindells, J. Greenaway, A. Nelson, W. C. Yew, P. C. Resende Silva, M. Andersson, R. Shaw, T. Peto, A. Justice, D. Eyre, D. Crooke, S. Hoosdally, T. J. Sloan, N. Duckworth, S. Walsh, A. J. Chauhan, S. Glaysher, K. Bicknell, S. Wyllie, E. Butcher, S. Elliott, A. Lloyd, R. Impey, N. Levene, L. Monaghan, D. T. Bradley, E. Allara, C. Pearson, P. Muir, I. B. Vipond, R. Hopes, H. M. Pymont, S. Hutchings, M. D. Curran, S. Parmar, A. Lackenby, T. Mbisa, S. Platt, S. Miah, D. Bibby, C. Manso, J. Hubb, M. Chand, G. Dabrera, M. Ramsay, D. Bradshaw, A. Thornton, R. Myers, U. Schaefer, N. Groves, E. Gallagher, D. Lee, D. Williams, N. Ellaby, I. Harrison, H. Hartman, N. Manesis, V. Patel, C. Bishop, V. Chalker, H. Osman, A. Bosworth, E. Robinson, M. T. G. Holden, S. Shaaban, A. Birchley, A. Adams, A. Davies, A. Gaskin, A. Plimmer, B. Gatica-Wilcox, C. McKerr, C. Moore, C. Williams, D. Heyburn, E. De Lacy, E. Hilvers, F. Downing, G. Shankar, H. Jones, H. Asad, J. Coombes, J. Watkins, J. M. Evans, L. Fina, L. Gifford, L. Gilbert, L. Graham, M. Perry, M. Morgan, M. Bull, M. Cronin, N. Pacchiarini, N. Craine, R. Jones, R. Howe, S. Corden, S. Rey, S. Kumziene-Summerhayes, S. Taylor, S. Cottrell, S. Jones, S. Edwards, J. O’Grady, A. J. Page, J. Wain, M. A. Webber, A. E. Mather, D. J. Baker, S. Rudder, M. Yasir, N. M. Thomson, A. Aydin, A. P. Tedim, G. L. Kay, A. J. Trotter, R. A. J. Gilroy, N.-F. Alikhan, L. de Oliveira Martins, T. Le-Viet, L. Meadows, A. Kolyva, M. Diaz, A. Bell, A. V. Gutierrez, I. G. Charles, E. M. Adriaenssens, R. A. Kingsley, A. Casey, D. A. Simpson, Z. Molnar, T. Thompson, E. Acheson, J. A. H. Masoli, B. A. Knight, A. Hattersley, S. Ellard, C. Auckland, T. W. Mahungu, D. Irish-Tavares, T. Haque, Y. Bourgeois, G. P. Scarlett, D. G. Partridge, M. Raza, C. Evans, K. Johnson, S. Liggett, P. Baker, S. Essex, R. A. Lyons, L. G. Caller, S. Castellano, R. J. Williams, M. Kristiansen, S. Roy, C. A. Williams, P. L. Dyal, H. J. Tutill, Y. N. Panchbhaya, L. M. Forrest, P. Niola, J. Findlay, T. T. Brooks, A. Gavriil, L. Mestek-Boukhibar, S. Weeks, S. Pandey, L. Berry, K. Jones, A. Richter, A. Beggs, C. P. Smith, G. Bucca, A. R. Hesketh, E. M. Harrison, S. J. Peacock, S. Palmer, C. M. Churcher, K. L. Bellis, S. T. Girgis, P. Naydenova, B. Blane, S. Sridhar, C. Ruis, S. Forrest, C. Cormie, H. K. Gill, J. Dias, E. E. Higginson, M. Maes, J. Young, L. M. Kermack, N. F. Hadjirin, D. Aggarwal, L. Griffith, T. Swingler, R. K. Davidson, A. Rambaut, T. Williams, C. E. Balcazar, M. D. Gallagher, Á. O’Toole, S. Rooke, B. Jackson, R. Colquhoun, J. Ashworth, V. Hill, J. T. McCrone, E. Scher, X. Yu, K. A. Williamson, T. D. Stanton, S. L. Michell, C. M. Bewshea, B. Temperton, M. L. Michelsen, J. Warwick-Dugdale, R. Manley, A. Farbos, J. W. Harrison, C. M. Sambles, D. J. Studholme, A. R. Jeffries, A. C. Darby, J. A. Hiscox, S. Paterson, M. Iturriza-Gomara, K. A. Jackson, A. O. Lucaci, E. E. Vamos, M. Hughes, L. Rainbow, R. Eccles, C. Nelson, M. Whitehead, L. Turtle, S. T. Haldenby, R. Gregory, M. Gemmell, D. Kwiatkowski, T. I. de Silva, N. Smith, A. Angyal, B. B. Lindsey, D. C. Groves, L. R. Green, D. Wang, T. M. Freeman, M. D. Parker, A. J. Keeley, P. J. Parsons, R. M. Tucker, R. Brown, M. Wyles, C. Constantinidou, M. Unnikrishnan, S. Ott, J. K. J. Cheng, H. E. Bridgewater, L. R. Frost, G. Taylor-Joyce, R. Stark, L. Baxter, M. T. Alam, P. E. Brown, P. C. McClure, J. G. Chappell, T. Tsoleridis, J. Ball, D. Gramatopoulos, D. Buck, J. A. Todd, A. Green, A. Trebes, G. MacIntyre-Cockett, M. de Cesare, C. Langford, A. Alderton, R. Amato, S. Goncalves, D. K. Jackson, I. Johnston, J. Sillitoe, S. Palmer, M. Lawniczak, M. Berriman, J. Danesh, R. Livett, L. Shirley, B. Farr, M. Quail, S. Thurston, N. Park, E. Betteridge, D. Weldon, S. Goodwin, R. Nelson, C. Beaver, L. Letchford, D. A. Jackson, L. Foulser, L. McMinn, L. Prestwood, S. Kay, L. Kane, M. J. Dorman, I. Martincorena, C. Puethe, J.-P. Keatley, G. Tonkin-Hill, C. Smith, D. Jamrozy, M. A. Beale, M. Patel, C. Ariani, M. Spencer-Chapman, E. Drury, S. Lo, S. Rajatileka, C. Scott, K. James, S. K. Buddenborg, D. J. Berger, G. Patel, M. V. Garcia-Casado, T. Dibling, S. McGuigan, H. A. Rogers, A. D. Hunter, E. Souster, A. S. Neaverson; COG-UK Consortium, Evaluating the effects of SARS-CoV-2 spike mutation D614G on transmissibility and pathogenicity. Cell 184, 64–75.e11 (2021). doi:10.1016/j.cell.2020.11.020pmid:33275900

6) Y. J. Hou, S. Chiba, P. Halfmann, C. Ehre, M. Kuroda, K. H. Dinnon 3rd, S. R. Leist, A. Schäfer, N. Nakajima, K. Takahashi, R. E. Lee, T. M. Mascenik, R. Graham, C. E. Edwards, L. V. Tse, K. Okuda, A. J. Markmann, L. Bartelt, A. de Silva, D. M. Margolis, R. C. Boucher, S. H. Randell, T. Suzuki, L. E. Gralinski, Y. Kawaoka, R. S. Baric, SARS-CoV-2 D614G variant exhibits efficient replication ex vivo and transmission in vivo. Science 370, 1464–1468 (2020). pmid:33184236

7) A. Rambaut, N. Loman, O. Pybus, W. Barclay, J. Barrett, A. Carabelli, T. Connor, T. Peacock, D. L. Robertson, E. Volz, on behalf of COVID-19 Genomics Consortium UK (CoG-UK), Preliminary genomic characterisation of an emergent SARS-CoV-2 lineage in the UK defined by a novel set of spike mutations (2020);

https://virological.org/t/preliminary-genomic-characterisation-of-an-emergent-sars-cov-2-lineage-in-the-uk-defined-by-a-novel-set-of-spike-mutations/563.

8) S. A. Kemp, W. T. Harvey, S. Lytras, The COVID-19 Genomics UK (COG-UK) consortium, A. M. Carabelli, D. L. Robertson, R. K. Gupta, Recurrent emergence and transmission of a SARS-CoV-2 Spike deletion H69/V70. bioRxiv 422555 [Preprint] 9 February 2021. .doi:10.1101/2020.12.14.422555

9) E. Volz, S. Mishra, M. Chand, J. C. Barrett, R. Johnson, L. Geidelberg, W. R. Hinsley, D. J. Laydon, G. Dabrera, Á. O’Toole, R. Amato, M. Ragonnet-Cronin, I. Harrison, B. Jackson, C. V. Ariani, O. Boyd, N. J. Loman, J. T. McCrone, S. Gonçalves, D. Jorgensen, R. Myers, V. Hill, D. K. Jackson, K. Gaythorpe, N. Groves, J. Sillitoe, D. P. Kwiatkowski, The COVID-19 Genomics UK (COG-UK) consortium, S. Flaxman, O. Ratmann, S. Bhatt, S. Hopkins, A. Gandy, A. Rambaut, N. M. Ferguson, Transmission of SARS-CoV-2 lineage B.1.1.7 in England: Insights from linking epidemiological and genetic data. medRxiv 20249034 [Preprint]. 4 January 2021. .doi:10.1101/2020.12.30.20249034

10) H. Tegally, E. Wilkinson, M. Giovanetti, A. Iranzadeh, V. Fonseca, J. Giandhari, D. Doolabh, S. Pillay, E. J. San, N. Msomi, K. Mlisana, A. von Gottberg, S. Walaza, M. Allam, A. Ismail, T. Mohale, A. J. Glass, S. Engelbrecht, G. Van Zyl, W. Preiser, F. Petruccione, A. Sigal, D. Hardie, G. Marais, M. Hsiao, S. Korsman, M.-A. Davies, L. Tyers, I. Mudau, D. York, C. Maslo, D. Goedhals, S. Abrahams, O. Laguda-Akingba, A. Alisoltani-Dehkordi, A. Godzik, C. K. Wibmer, B. T. Sewell, J. Lourenço, L. C. J. Alcantara, S. L. Kosakovsky Pond, S. Weaver, D. Martin, R. J. Lessells, J. N. Bhiman, C. Williamson, T. de Oliveira, Emergence and rapid spread of a new severe acute respiratory syndrome-related coronavirus 2 (SARS-CoV-2) lineage with multiple spike mutations in South Africa. medRxiv 20248640 [Preprint]. 22 December 2020. .doi:10.1101/2020.12.21.20248640

11) N. R. Faria, I. M. Claro, D. Candido, L. A. Moyses Franco, P. S. Andrade, T. M. Coletti, C. A. Silva, F. C. Sales, E. R. Manuli, R. S. Aguiar, N. Gaburo, C. da C. Camilo, N. A. Fraiji, M. A. Esashika Crispin, M. do Perpetuao, A. Rambaut, N. Loman, O. G. Pybus, E. C. Sabino, on behalf of CADDE Genomic Network, Genomic characterisation of an emergent SARS-CoV-2 lineage in Manaus: preliminary findings (2021);

https://virological.org/t/genomic-characterisation-of-an-emergent-sars-cov-2-lineage-in-manaus-preliminary-findings/586).

12) C. K. Wibmer, F. Ayres, T. Hermanus, M. Madzivhandila, P. Kgagudi, B. E. Lambson, M. Vermeulen, K. van den Berg, T. Rossouw, M. Boswell, V. Ueckermann, S. Meiring, A. von Gottberg, C. Cohen, L. Morris, J. N. Bhiman, P. L. Moore, SARS-CoV-2 501Y.V2 escapes neutralization by South African COVID-19 donor plasma. bioRxiv 427166 [Preprint]. 1 March 2021. .doi:10.1101/2021.01.18.427166

13) S. Cele, I. Gazy, L. Jackson, S.-H. Hwa, H. Tegally, G. Lustig, J. Giandhari, S. Pillay, E. Wilkinson, Y. Naidoo, F. Karim, Y. Ganga, K. Khan, A. B. Balazs, B. I. Gosnell, W. Hanekom, M.-Y. S. Moosa, NGS-SA, COMMIT-KZN Team, R. J. Lessells, T. de Oliveira, A. Sigal, Escape of SARS-CoV-2 501Y.V2 variants from neutralization by convalescent plasma. medRxiv 21250224 [Preprint]. 27 February 2021. .

doi:10.1101/2021.01.26.21250224

14) K. Wu, A. P. Werner, J. I. Moliva, M. Koch, A. Choi, G. B. E. Stewart-Jones, H. Bennett, S. Boyoglu-Barnum, W. Shi, B. S. Graham, A. Carfi, K. S. Corbett, R. A. Seder, D. K. Edwards, mRNA-1273 vaccine induces neutralizing antibodies against spike mutants from global SARS-CoV-2 variants. bioRxiv 427948 [Preprint]. 25 January 2021. .doi:10.1101/2021.01.25.427948

15) L. du Plessis, J. T. McCrone, A. E. Zarebski, V. Hill, C. Ruis, B. Gutierrez, J. Raghwani, J. Ashworth, R. Colquhoun, T. R. Connor, N. R. Faria, B. Jackson, N. J. Loman, Á. O’Toole, S. M. Nicholls, K. V. Parag, E. Scher, T. I. Vasylyeva, E. M. Volz, A. Watts, I. I. Bogoch, K. Khan, COVID-19 Genomics UK (COG-UK) Consortium, D. M. Aanensen, M. U. G. Kraemer, A. Rambaut, O. G. Pybus, Establishment and lineage dynamics of the SARS-CoV-2 epidemic in the UK. Science 10.1126/science.abf2946 (2021).

16) D. Bonsall, T. Golubchik, M. de Cesare, M. Limbada, B. Kosloff, G. MacIntyre-Cockett, M. Hall, C. Wymant, M. A. Ansari, L. Abeler-Dörner, A. Schaap, A. Brown, E. Barnes, E. Piwowar-Manning, S. Eshleman, E. Wilson, L. Emel, R. Hayes, S. Fidler, H. Ayles, R. Bowden, C. Fraser; HPTN 071 (PopART) Team, A comprehensive genomics solution for HIV surveillance and clinical monitoring in low-income settings. J. Clin. Microbiol. 58, e00382-20 (2020). doi:10.1128/JCM.00382-20pmid:32669382

17) C. Goh, T. Golubchik, A. Anzari, M. de Cesare, A. Trebes, I. Elliott, D. Bonsall, P. Piazza, A. Brown, H. Slawinski, N. Martin, S. Defres, M. J. Griffiths, J. E. Bray, M. C. Maiden, P. Hutton, C. J. Hinds, T. Solomon, E. Barnes, A. J. Pollard, M. Sadarangani, J. C. Knight, R. Bowden, Targeted metagenomic sequencing enhances the identification of pathogens associated with acute infection. bioRxiv 716902 [Preprint]. 28 July 2019. .doi:10.1101/716902

18) G.-L. Lin, T. Golubchik, S. Drysdale, D. O’Connor, K. Jefferies, A. Brown, M. de Cesare, D. Bonsall, M. A. Ansari, J. Aerssens, L. Bont, P. Openshaw, F. Martinón-Torres, R. Bowden, A. J. Pollard, H. Nair, H. Campbell, S. Cunningham, P. Beutels, L. Bont, J. Wildenbeest, A. Pollard, C. Butler, M. Snape, S. Drysdale, G.-L. Lin, D. O’Connor, E. Clutterbuck, K. Jefferies, J. McGinley, P. Openshaw, R. Thwaites, D. Wiseman, F. Martinon-Torres, A. Gómez-Carballa, T. Heikkinen, A. Meijer, T. K. Fischer, M. van den Berge, C. Giaquinto, M. Abram, K. Swanson, A. Leach, C. Demont, S. Gallichan, J. Aerssens, D. Öner, B. Rosen, E. Molero, H. Nair, H. Campbell, S. Cunningham, P. Beutels, L. Bont, J. Wildenbeest, A. Pollard, C. Butler, M. Snape, S. Drysdale, G.-L. Lin, D. O’Connor, E. Clutterbuck, K. Jefferies, J. McGinley, P. Openshaw, R. Thwaites, D. Wiseman, F. Martinon-Torres, A. Gómez-Carballa, T. Heikkinen, A. Meijer, T. K. Fischer, M. van den Berge, C. Giaquinto, M. Abram, K. Swanson, A. Leach, C. Demont, S. Gallichan, J. Aerssens, D. Öner, B. Rosen, E. Molero; RESCEU Investigators, Simultaneous viral whole-genome sequencing and differential expression profiling in respiratory syncytial virus infection of infants. J. Infect. Dis. 222, S666–S671 (2020). doi:10.1093/infdis/jiaa448pmid:32702120

19) D. Bonsall, M. A. Ansari, C. Ip, A. Trebes, A. Brown, P. Klenerman, D. Buck, P. Piazza, E. Barnes, R. Bowden; STOP-HCV Consortium, ve-SEQ: Robust, unbiased enrichment for streamlined detection and whole-genome sequencing of HCV and other highly diverse pathogens. F1000Res. 4, 1062 (2015).

doi:10.12688/f1000research.7111.1pmid:27092241

20) S. M. Kissler, J. R. Fauver, C. Mack, S. W. Olesen, C. Tai, K. Y. Shiue, C. C. Kalinich, S. Jednak, I. M. Ott, C. B. F. Vogels, J. Wohlgemuth, J. Weisberger, J. DiFiori, D. J. Anderson, J. Mancell, D. D. Ho, N. D. Grubaugh, Y. H. Grad, SARS-CoV-2 viral dynamics in acute infections. medRxiv 20217042 [Preprint]. 1 December 2020. .

doi:10.1101/2020.10.21.20217042

21) L. Ferretti, A. Ledda, C. Wymant, L. Zhao, V. Ledda, L. A. Dorner, M. Kendall, A. Nurtay, H.-Y. Cheng, T.-C. Ng, H.-H. Lin, R. Hinch, J. Masel, A. Marm Kilpatrick, C. Fraser, The timing of COVID-19 transmission. medRxiv 20188516 [Preprint]. 16 September 2020. .doi:10.1101/2020.09.04.20188516

22) M. Marks, P. Millat-Martinez, D. Ouchi, C. Roberts, A. Alemany, M. Corbacho-Monné, M. Ubals, A. Tobias, C. Tebé, E. Ballana, Q. Bassat, B. Baro, M. Vall-Mayans, C. G-Beiras, N. Prat, J. Ara, B. Clotet, O. Mitjà, C. G. Beiras, N. Prat, J. Ara, B. Clotet, O. Mitjà, Transmission of COVID-19 in 282 clusters in Catalonia, Spain: A cohort study. Lancet Infect. Dis. (2021). doi:10.1016/S1473-3099(20)30985-3

23) J. Raghwani, A. D. Redd, A. F. Longosz, C.-H. Wu, D. Serwadda, C. Martens, J. Kagaayi, N. Sewankambo, S. F. Porcella, M. K. Grabowski, T. C. Quinn, M. A. Eller, L. A. Eller, F. Wabwire-Mangen, M. L. Robb, C. Fraser, K. A. Lythgoe, Evolution of HIV-1 within untreated individuals and at the population scale in Uganda. PLOS Pathog. 14, e1007167 (2018). doi:10.1371/journal.ppat.1007167pmid:30052678

24) G. Tonkin-Hill, I. Martincorena, R. Amato, A. R. J. Lawson, M. Gerstung, I. Johnston, D. K. Jackson, N. R. Park, S. V. Lensing, M. A. Quail, S. Gonçalves, C. Ariani, M. S. Chapman, W. L. Hamilton, L. W. Meredith, G. Hall, A. S. Jahun, Y. Chaudhry, M. Hosmillo, M. L. Pinckert, I. Georgana, A. Yakovleva, L. G. Caller, S. L. Caddy, T. Feltwell, F. A. Khokhar, C. J. Houldcroft, M. D. Curran, S. Parmar, The COVID-19 Genomics UK (COG-UK) Consortium, A. Alderton, R. Nelson, E. Harrison, J. Sillitoe, S. D. Bentley, J. C. Barrett, M. Estee Torok, I. G. Goodfellow, C. Langford, D. Kwiatkowski, Wellcome Sanger Institute COVID-19 Surveillance Team, Patterns of within-host genetic diversity in SARS-CoV-2. bioRxiv 424229 [Preprint]. 25 December 2020. .doi:10.1101/2020.12.23.424229

25) A. Popa, J.-W. Genger, M. D. Nicholson, T. Penz, D. Schmid, S. W. Aberle, B. Agerer, A. Lercher, L. Endler, H. Colaço, M. Smyth, M. Schuster, M. L. Grau, F. Martínez-Jiménez, O. Pich, W. Borena, E. Pawelka, Z. Keszei, M. Senekowitsch, J. Laine, J. H. Aberle, M. Redlberger-Fritz, M. Karolyi, A. Zoufaly, S. Maritschnik, M. Borkovec, P. Hufnagl, M. Nairz, G. Weiss, M. T. Wolfinger, D. von Laer, G. Superti-Furga, N. Lopez-Bigas, E. Puchhammer-Stöckl, F. Allerberger, F. Michor, C. Bock, A. Bergthaler, Genomic epidemiology of superspreading events in Austria reveals mutational dynamics and transmission properties of SARS-CoV-2. Sci. Transl. Med. 12, eabe2555 (2020). doi:10.1126/scitranslmed.abe2555pmid:33229462

26) A. L. Valesano, K. E. Rumfelt, D. E. Dimcheff, C. N. Blair, W. J. Fitzsimmons, J. G. Petrie, E. T. Martin, A. S. Lauring, Temporal dynamics of SARS-CoV-2 mutation accumulation within and across infected hosts. bioRxiv 2021.01.19.427330 (2021). doi:10.1101/2021.01.19.427330pmid:33501443

27) M. P. Zwart, S. F. Elena, Matters of size: Genetic bottlenecks in virus infection and their potential impact on evolution. Annu. Rev. Virol. 2, 161–179 (2015).

doi:10.1146/annurev-virology-100114-055135pmid:26958911

28) A. Sobel Leonard, D. B. Weissman, B. Greenbaum, E. Ghedin, K. Koelle, Transmission bottleneck size estimation from pathogen deep-sequencing data, with an application to human influenza A virus. J. Virol. 91, e00171-17 (2017). doi:10.1128/JVI.00171-17pmid:28468874

29) A. Sobel Leonard, D. B. Weissman, B. Greenbaum, E. Ghedin, K. Koelle, Correction for Sobel Leonard et al., “Transmission bottleneck size estimation from pathogen deep-sequencing data, with an application to human influenza A virus”. J. Virol. 93, e00936-19 (2019). doi:10.1128/JVI.00936-19pmid:31409730

30) M. Ghafari, C. K. Lumby, D. B. Weissman, C. J. R. Illingworth, Inferring transmission bottleneck size from viral sequence data using a novel haplotype reconstruction method. J. Virol. 94, e00014-20 (2020). doi:10.1128/JVI.00014-20pmid:32295920

31) J. T. McCrone, R. J. Woods, E. T. Martin, R. E. Malosh, A. S. Monto, A. S. Lauring, Stochastic processes constrain the within and between host evolution of influenza virus. eLife 7, e35962 (2018). doi:10.7554/eLife.35962pmid:29683424

32) A. Varble, R. A. Albrecht, S. Backes, M. Crumiller, N. M. Bouvier, D. Sachs, A. García-Sastre, B. R. tenOever, Influenza A virus transmission bottlenecks are defined by infection route and recipient host. Cell Host Microbe 16, 691–700 (2014). doi:10.1016/j.chom.2014.09.020pmid:25456074

33) Z. Shen, Y. Xiao, L. Kang, W. Ma, L. Shi, L. Zhang, Z. Zhou, J. Yang, J. Zhong, D. Yang, L. Guo, G. Zhang, H. Li, Y. Xu, M. Chen, Z. Gao, J. Wang, L. Ren, M. Li, Genomic diversity of severe acute respiratory syndrome–coronavirus 2 in patients with coronavirus disease 2019. Clin. Infect. Dis. (2020). doi:10.1093/cid/ciaa203

34) T. H. Wang, Y. K. Donaldson, R. P. Brettle, J. E. Bell, P. Simmonds, Identification of shared populations of human immunodeficiency virus type 1 infecting microglia and tissue macrophages outside the central nervous system. J. Virol. 75, 11686–11699 (2001). doi:10.1128/JVI.75.23.11686-11699.2001pmid:11689650

35) K. M. Braun, G. K. Moreno, P. J. Halfmann, E. B. Hodcroft, D. A. Baker, E. C. Boehm, A. M. Weiler, A. K. Haj, M. Hatta, S. Chiba, T. Maemura, Y. Kawaoka, K. Koelle, D. H. O’Connor, T. C. Friedrich, Transmission of SARS-CoV-2 in domestic cats imposes a narrow bottleneck. bioRxiv 384917 [Preprint]. 4 January 2021. .

doi:10.1101/2020.11.16.384917

36) S. E. James, S. Ngcapu, A. M. Kanzi, H. Tegally, V. Fonseca, J. Giandhari, E. Wilkinson, B. Chimukangara, S. Pillay, L. Singh, M. Fish, I. Gazy, K. Khanyile, R. Lessells, T. de Oliveira, High resolution analysis of transmission dynamics of Sars-Cov-2 in two major hospital outbreaks in South Africa leveraging intrahost diversity. medRxiv 20231993 [Preprint]. 16 November 2020. . doi:10.1101/2020.11.15.20231993

37) M. A. Martin, K. Koelle, Reanalysis of deep-sequencing data from Austria points towards a small SARS-COV-2 transmission bottleneck on the order of one to three virions. bioRxiv 432096 [Preprint]. 22 February 2021. .doi:10.1101/2021.02.22.432096

38) M. Gelbart, S. Harari, Y. Ben-Ari, T. Kustin, D. Wolf, M. Mandelboim, O. Mor, P. S. Pennings, A. Stern, Drivers of within-host genetic diversity in acute infections of viruses. PLOS Pathog. 16, e1009029 (2020). doi:10.1371/journal.ppat.1009029pmid:33147296

39) M. D. Nowak, E. M. Sordillo, M. R. Gitman, A. E. Paniz Mondolfi, Coinfection in SARS-CoV-2 infected patients: Where are influenza virus and rhinovirus/enterovirus? J. Med. Virol. 92, 1699–1700 (2020). doi:10.1002/jmv.25953pmid:32352574

40) D. Kim, J. Quinn, B. Pinsky, N. H. Shah, I. Brown, Rates of co-infection between SARS-CoV-2 and other respiratory pathogens. JAMA 323, 2085–2086 (2020). doi:10.1001/jama.2020.6266pmid:32293646

41) B. Dearlove, E. Lewitus, H. Bai, Y. Li, D. B. Reeves, M. G. Joyce, P. T. Scott, M. F. Amare, S. Vasan, N. L. Michael, K. Modjarrad, M. Rolland, A SARS-CoV-2 vaccine candidate would likely match all currently circulating variants. Proc. Natl. Acad. Sci. U.S.A. 117, 23652–23662 (2020). doi:10.1073/pnas.2008281117pmid:32868447

42) B. Morel, P. Barbera, L. Czech, B. Bettisworth, L. Hübner, S. Lutteropp, D. Serdari, E.-G. Kostaki, I. Mamais, A. M. Kozlov, P. Pavlidis, D. Paraskevis, A. Stamatakis, Phylogenetic analysis of SARS-CoV-2 data is difficult. Mol. Biol. Evol. msaa314 (2020). doi:10.1093/molbev/msaa314pmid:33316067

43) L. van Dorp, M. Acman, D. Richard, L. P. Shaw, C. E. Ford, L. Ormond, C. J. Owen, J. Pang, C. C. S. Tan, F. A. T. Boshier, A. T. Ortiz, F. Balloux, Emergence of genomic diversity and recurrent mutations in SARS-CoV-2. Infect. Genet. Evol. 83, 104351 (2020). doi:10.1016/j.meegid.2020.104351pmid:32387564

44) Q. Li, J. Wu, J. Nie, L. Zhang, H. Hao, S. Liu, C. Zhao, Q. Zhang, H. Liu, L. Nie, H. Qin, M. Wang, Q. Lu, X. Li, Q. Sun, J. Liu, L. Zhang, X. Li, W. Huang, Y. Wang, The impact of mutations in SARS-CoV-2 spike on viral infectivity and antigenicity. Cell 182, 1284–1294.e9 (2020). doi:10.1016/j.cell.2020.07.012pmid:32730807

45) S. Pond. “Natural selection analysis of global SARS-CoV-2/COVID-19 enabled by data from GISAID” (Datamonkey, 2021);

https://observablehq.com/@spond/revised-sars-cov-2-analytics-page.

46) J. T. Herbeck, D. C. Nickle, G. H. Learn, G. S. Gottlieb, M. E. Curlin, L. Heath, J. I. Mullins, Human immunodeficiency virus type 1 env evolves toward ancestral states upon transmission to a new host. J. Virol. 80, 1637–1644 (2006).

doi:10.1128/JVI.80.4.1637-1644.2006pmid:16439520

47) T. N. Starr, A. J. Greaney, A. Addetia, W. W. Hannon, M. C. Choudhary, A. S. Dingens, J. Z. Li, J. D. Bloom, Prospective mapping of viral mutations that escape antibodies used to treat COVID-19. Science 371, 850–854 (2021).

doi:10.1126/science.abf9302pmid:33495308

48) A. J. Greaney, A. N. Loes, K. H. D. Crawford, T. N. Starr, K. D. Malone, H. Y. Chu, J. D. Bloom, Comprehensive mapping of mutations to the SARS-CoV-2 receptor-binding domain that affect recognition by polyclonal human serum antibodies. bioRxiv 425021 [Preprint]. 4 January 2021. .doi:10.1101/2020.12.31.425021

49) K. R. McCarthy, L. J. Rennick, S. Nambulli, L. R. Robinson-McCarthy, W. G. Bain, G. Haidar, W. P. Duprex, Recurrent deletions in the SARS-CoV-2 spike glycoprotein drive antibody escape. Science eabf6950 (2021). pmid:33536258

50) E. M. Volz, V. Hill, J. T. McCrone, A. Price, D. Jorgensen, A. O’Toole, J. A. Southgate, R. Johnson, B. Jackson, F. F. Nascimento, S. M. Rey, S. M. Nicholls, R. M. Colquhoun, A. da Silva Filipe, J. G. Shepherd, D. J. Pascall, R. Shah, N. Jesudason, K. Li, R. Jarrett, N. Pacchiarini, M. Bull, L. Geidelberg, I. Siveroni, I. G. Goodfellow, N. J. Loman, O. Pybus, D. L. Robertson, E. C. Thomson, A. Rambaut, T. R. Connor, Evaluating the effects of SARS-CoV-2 Spike mutation D614G on transmissibility and pathogenicity. medRxiv 20166082 [Preprint]. 1 September 2020. .doi:10.1101/2020.07.31.20166082

51) E. C. Thomson, L. E. Rosen, J. G. Shepherd, R. Spreafico, A. da Silva Filipe, J. A. Wojcechowskyj, C. Davis, L. Piccoli, D. J. Pascall, J. Dillen, S. Lytras, N. Czudnochowski, R. Shah, M. Meury, N. Jesudason, A. De Marco, K. Li, J. Bassi, A. O’Toole, D. Pinto, R. M. Colquhoun, K. Culap, B. Jackson, F. Zatta, A. Rambaut, S. Jaconi, V. B. Sreenu, J. Nix, I. Zhang, R. F. Jarrett, W. G. Glass, M. Beltramello, K. Nomikou, M. Pizzuto, L. Tong, E. Cameroni, T. I. Croll, N. Johnson, J. Di Iulio, A. Wickenhagen, A. Ceschi, A. M. Harbison, D. Mair, P. Ferrari, K. Smollett, F. Sallusto, S. Carmichael, C. Garzoni, J. Nichols, M. Galli, J. Hughes, A. Riva, A. Ho, M. Schiuma, M. G. Semple, P. J. M. Openshaw, E. Fadda, J. K. Baillie, J. D. Chodera, S. J. Rihn, S. J. Lycett, H. W. Virgin, A. Telenti, D. Corti, D. L. Robertson, G. Snell; ISARIC4C Investigators; COVID-19 Genomics UK (COG-UK) Consortium, Circulating SARS-CoV-2 spike N439K variants maintain fitness while evading antibody-mediated immunity. Cell 184, 1171–1187.e20 (2021). doi:10.1016/j.cell.2021.01.037pmid:33621484

 

Supplementary Material