간행물

생화학분자생물학회입니다.


TiBMB

RNA-Chromatin 상호작용 연구를 위한 시퀀싱 분석기술

  • 작성자

    임도환 (숭실대학교 자연과학대학 의생명시스템학부)
  • 작성일자

    2023-11-16
  • 조회수

    1684

RNA-Chromatin 상호작용 연구를 위한 시퀀싱 분석기술

 


임도환

숭실대학교 자연과학대학 의생명시스템학부

dhlim@ssu.ac.kr

 

1. 서론


전통적인 관점에서 RNA는 유전체 일부 부위에서 DNA로부터 전사과정을 통해 단백질 암호화(protein-coding) mRNA로 합성된 후 핵에서 다양한 처리과정을 거쳐 세포질로 이동되어진 후  단백질로 번역되어 지는 것으로 이해되었다. 그러나 대량 염기서열 분석기술의 개발과 발전으로 유전체는 이전에 이해하던 것 보다 더 많은 부위에서 전사 활성을 가지는 것으로 밝혀졌다 (1). 예를 들면 긴 비암호화 RNA(long non-coding RNA, lncRNA), enhancer RNA(eRNA), repeat-derived RNA 등의 다양한 비암호화 조절 RNA(non-coding regulatory RNA)들이 다양한 유전체 부위에서 활발히 생성되는 것으로 보고되었고, 이러한 비암호화 RNA들은 주로 유전자의 발현 조절에 관여하는 것으로 알려졌다 (2-4). 이러한 비암호화 RNA들 중 많은 종이 주로 핵 내에 위치하고 있으며, 특정 RNA가 가질 수 있는 특이 염기서열, 단일/이중 가닥의 위치 및 배열, RNA 내부 염기간 결합을 통한 2차 또는 3차원적인 구조 형성을 통해 핵 내에 위치한 다양한 RNA, 단백질, DNA와 상호작용을 할 수 있다. 이러한 상호작용을 통해 비암호화 조절 RNA들은 특정 유전체 부위에서 전사과정을 조절할 수 있고, 또는 염색체 구조 형성에 영향을 주거나 장거리 유전체 부위간 상호작용을 매개할 수 있는 것으로 알려졌다 (5). 따라서 특정 RNA와 상호작용하는 유전체 부위를 발굴하고 분석하는 것은 해당 RNA의 생물학적 기능과 그 잠재적인 분자생물학적 기작을 규명하는데 매우 중요한 접근 방법이라 생각할 수 있다. 본 글에서는 이러한 비암호화 조절 RNA들의 핵 내에서 유전자의 발현 조절 기능 연구의 접근 방식 중 현재까지 개발되어 있는 RNA-Chromatin 상호작용을 분석할 수 있는 다양한 시퀀싱 분석 기술들을 소개하고자 한다. 

 

2. 본론


2-1. RNA-Chromatin 상호작용 방법

 

핵 내에서 비암호화 조절 RNA가 chromatin과 상호작용할 수 있는 방법으로는 1) 단백질과 결합을 매개로 하여 간접적으로 상호작용을 할 수도 있고, 2-1) R-loop (RNA:DNA hybrid)을 형성하여 RNA가 이중 가닥의 DNA 중 한 가닥과 염기간 결합을 통해 직접적인 상호작용을 하거나, 2-2) Hoogsteen base pairing을 통해 RNA.DNA:DNA triple helix (triplex)을 형성하여 RNA가 직접적으로 chromatin과 상호작용을 할 수 있다 (그림 1). 이러한 상호작용 방법을 통해 비암호화 RNA는 핵내에서 유전자의 발현 조절에 관여하고 있다.

 


그림 1 RNA-Chromatin 상호작용 방법. (A) 단백질 매개 상호작용. (B) R-loop에 의한 상호작용. (C) Triplex에 의한 상호작용.

 

2-2. 단일종 RNA와 chromatin 상호작용 포착을 위한 시퀀싱 기술 (one-to-all)

 

비암호화 조절 RNA가 다양한 연구를 통해 핵 내에서 chromatin과 cis 또는 trans하게 상호작용하면서 유전자 발현에 영향을 줄 수 있다는 보고 이후로, 관심있는 특정 RNA가 유전체 어느 부위에 특이성을 갖고 상호작용을 하는지 많은 관심을 갖게 되었다. 이러한 관심은 대량 시퀀싱 분석기술의 발전과 함께 특정 RNA 전사체가 상호작용하는 chromatin 부위를 찾아낼 수 있는 시퀀싱 기술의 개발을 촉진하였다. 이러한 시퀀싱 기술들의 개발로 특히 비암호화 RNA와 chromatin의 상호작용 네트워크를 그려볼 수 있었으며, 이러한 기반 정보를 토대로 특정 비암호화 RNA가 조절 가능한 후보 표적 유전자 또한 발굴할 수 있었다. 

이렇게 특정 비암호화 RNA들을 각각 표적 하여 상호작용하는 유전체 부위를 발굴하기 위해서는 해당 RNA를 특이적으로 포착할 수 있는 기술과 더불어 이때 상호작용하고 있는 chromatin을 함께 정제할 수 있는 기술이 필요하다. 이러한 접근 방식을 통해 개발된 시퀀싱 라이브러리 제작 기술로는 1) Chromatin Isolation by RNA Purification (ChIRP) (6), 2) Capture hybridization analysis of RNA targets (CHART) (7), 3) RNA antisense purification (RAP) (8) 이 있다 (그림 2). 이러한 시퀀싱 기술들은 기본적으로 RNA-Chromatin 상호작용의 안정화를 위해 formaldehyde (FA) 또는 Disuccinimidyl glutarate (DSG)를 이용한 고정 및 crosslinking 과정을 거치고, 특정 RNA 포착 전략으로써 관심있는 RNA에 염기서열 상보적으로 결합할 수 있는 biotinylated antisense oligo (RNA 또는 DNA 형태)를 탐침(probe)으로 사용한다. 이후 biotin에 친화력을 가지고 있는 streptavidin beads를 이용하여 탐침에 결합된 RNA-Chromatin을 분리/정제할 수 있다. 이 때 해당 전략의 특이성 검증이 중요한데, 이를 위해서 동일한 표적 RNA를 포착하기 위한 여러개의 oligo 탐침을 두개의 분리된 pool로 나누어 이용하기도 하고 비 특이적인 탐침을 대조군으로 이용한다. 이러한 과정으로 핵 내에서 특정 단일종의 RNA가 유의미하게 상호작용하고 있는 유전체 부위를 발굴할 수 있다.

 

  


그림 2 RNA-Chromatin 상호작용 포착 방법 (one-to-all). 

 

2-3. 전종의 RNA들과 chromatin 상호작용 포착을 위한 시퀀싱 기술 (all-to-all)

 

앞서 언급한 것과 같이 초기에는 관심있는 단일 비암호화 RNA 만 초점을 두어 상호작용하는 유전체 부위를 포착하는 방법이 개발되었지만, 이후 핵 내에 존재하는 모든 RNA들과 상호작용하는 모든 유전체 부위를 한번에 포착하려고 하는 시도들이 몇몇 그룹을 통해 수행되었다. 이러한 all-to-all 접근 방식으로 개발된 시퀀싱 분석 기술로는 현재 아래와 같이 개발되어 있다: 1) mapping RNA-genome interactions (MARGI) (9), 2) global RNA interaction with DNA sequencing (GRID-seq) (10), 3) chromatin associated RNA sequencing (ChAR-seq) (11), 4) RNA and DNA interacting complexes ligated and sequenced (RADICL-seq) (12) (표1). 

 

표 1. RNA-Chromatin 상호작용 포착을 위한 시퀀싱 기술 (all-to-all)


RNA-Chromatin 상호작용 포착을 위한 all-to-all 접근 방식의 기본적인 전략으로는 한쪽은 RNA와 결합할 수 있는 단일 가닥의 형태를 가지고 다른 한쪽은 DNA와 결합할 수 있는 이중 가닥의 형태를 가지면서 linker 포착을 위한 biotinylated bivalent linker를 사용한다 (그림 3A). 이렇게 독립적으로 개발된 4가지의 기술들은 기본 전략은 유사하나 라이브러리 제작 과정 중 몇몇 단계에서의 차이로 각각의 장단점을 가지게 된다. 이러한 4가지 기술의 중요한 단계를 비교하면서 각 특징을 알아보고자 한다. 먼저 라이브러리 제작에 사용되는 초기 세포수는 GRID-seq과 RADICL-seq의 경우는 인간 또는 쥐 세포 기준으로 대략 2백만개 정도의 세포가 필요하나 나머지 다른 두 종류의 방법은 상대적으로 그 보다 많은 수의 세포를 사용한다. 이는 확보 가능한 세포 수가 충분하지 않을 경우 GRID-seq과 RADICL-seq이 상대적으로 유리한 방법으로 활용될 수 있다. 이렇게 확보된 세포들은 고정 및 crosslinking을 시킨 후 다음 과정으로 넘어가게 되는데, 이 때 GRID-seq의 경우는 DSG와 FA를 이용하여 더 강하게 이중 crosslinking을 수행하며 이는 RNA-Chromatin 상호작용을 더 강하게 포착할 수 있게 도움을 줄 수 있다. 그러나 한편으로는 다른 방법에 비해 상대적으로 비 특이적인 상호작용까지 포착되어 질 수 있다는 문제점들이 제기되기도 한다. 다음으로 genomic DNA (gDNA)를 조각화(fragmentation) 시키는 단계를 거치게 되는데 주로 HaeIII, AluI, DpnII와 같이 단지 4개의 염기서열만을 인식하여 자를 수 있는 제한효소를 통해 gDNA 조각화를 수행한다. 그러나 가장 최근에 개발된 RADICL-seq의 경우는 이와 달리 적절하게 조절된 조건에서의 DNase I을 이용하여 무작위 gDNA 조각화를 유도한다 (그림 3A). 염기서열에 따라 편향된 조각화를 유도할 수도 있는 제한효소를 이용하는 것 대신에 DNase I을 사용하는 것은 이러한 문제점을 해소할 수 있으나 적절한 조건을 유지하지 못한다면 너무 큰 DNA 조각을 만들거나 반대로 gDNA 및 이후 추가되는 DNA linker 등을 분해할 수 있는 문제점을 야기할 수 있다. 또한 RNA의 조각화도 필요하나 실제로 ChAR-seq을 제외하면 특별하게 조각화 단계를 포함하고 있지는 않다. 그러나 생성된 라이브러리의 시퀀싱 결과에 비추어 특정 단계에서 RNA의 조각화가 충분히 일어남을 알 수 있다. 이어서 bivalent linker와 RNA/DNA를 결합하는 단계를 진행하는데, 특히 DNA 부분 결합단계에서 GRID-seq, ChAR-seq의 경우는 blunt ligation 을 이용하여 수행되는 반면, MARGI, RADICL-seq에서는 ligation의 효율 향상을 위해 TA ligation 방법을 취한다. 이후 양말단에 adapter를 결합하기 전에 시퀀싱 길이를 감안하여 추가적으로 2차 조각화를 유도하게 되는데, 이 때 MARGI, ChAR-seq 경우는 sonication 과정을 통해 다양한 길이로 조각을 만들고, GRID-seq (MmeI, ~20bp), RADICL-seq (EcoP15I, ~27bp) 경우는 linker에 포함된 특정 서열을 인식할 수 있는 제한효소를 이용하여 RNA 및 DNA 부분을 특정 길이로 잘라주게 된다 (그림 3B). Sonication 방법은 무작위로 다양한 길이의 RNA/DNA 부분을 생성될 수 있게 하며, 이는  충분한 길이의 RNA/DNA 정보를 포함하는 라이브러리를 생산하여 높은 유전체 맵핑 효율을 가져올 수도 있다. 그러나 무작위 조각화를 조절하기 어렵기 때문에 오히려 RNA/DNA 두 부분 중 한 부분이라도 그 길이가 짧아 유전체에 맵핑을 하지 못하는 경우 정보를 유실할 가능성이 높아진다는 문제점을 가지고 있다. 이와 달리 제한 효소를 이용하여 조각화를 진행하는 경우 (GRID-seq/RADICL-seq) RNA/DNA 부분의 길이를 정확하게 자를 수 있고, 이를 통해 gel 상에서 정확한 DNA 라이브러리의 크기를 확인 후 추출할 수 있어서 linker를 기준으로 RNA/DNA 부분을 모두 가지고 있는 최종 산물을 취할 수 있다는 점에서 라이브러리 제작 효율을 높일 수 있는 장점을 가진다. 또한 최근 개발된 RADICL-seq에서와 같이 EcoP15I 제한효소를 사용하는 경우 RNA/DNA 부분을 대략 27bp로 자를 수 있어 맵핑 효율에 있어서도 MmeI을 사용하는 GRID-seq의 ~20bp RNA/DNA 맵핑 효율과 비교하여 크게 향상시킬 수 있다. 

 


그림 3 RNA-Chromatin 상호작용 포착 방법 (all-to-all). 

(A) gDNA 조각화 및 biotinylated bivalent linker를 이용한 RNA와 DNA의 연결. 

(B) 각 시퀀싱 기술별 RNA/DNA 부분의 조각화.

 

2-4. R-loop (RNA:DNA hybridization) 포착을 위한 시퀀싱 기술

 

R-loop은 구조상으로 RNA:DNA hybrid와 이러한 hybrid 형성 때문에 떨어진 비주형(non-template) DNA로 구성된 3 가닥의 특정 유전체 부위를 말한다. 현재까지 진행된 많은 연구를 통해 R-loop은 기본적으로는 유전체 안정성에 취약한 구조를 유지하게 함으로써 다양한 병리학적 과정에 관여하는 것으로 알려져 있다. 또한 이와 상반되게 염색체 분리(chromosome segregation), 유전자 발현 조절, DNA 손상 복구과정 등에 중요하게 작용하며 다양한 생리학적 과정에도 연관되어 있는 것으로 알려져 있어 많은 관심을 받고 있다. 이러한 배경으로 유전체상에서 어느 부위에 이러한 R-loop이 형성되는지 찾아내기 위한 시퀀싱 분석 기술들이 개발되었고, 2012년 DRIP-seq이 개발된 이후 (13), 다양한 형태로 효율 향상과 문제점 개선 위주로 지속적으로 발전되어 왔다 (표2). 

 

표 2. R-loop 포착을 위한 시퀀싱 기술 

 

현재까지 R-loop 포착 기술은 크게 보면 포착 방법에 의해 크게 2가지로 나누어 볼 수 있다. 첫번째로는 RNA:DNA hybrid에 특이적으로 결합할 수 있는 단일 클론 항체인 S9.6를 사용하는 방법 (DRIP-seq, RDIP-seq, DRIPc-seq, ssDRIP-seq)과 (그림 4A) (13-16), 두번째로는 RNA:DNA hybrid에 선택적으로 결합할 수 있는 특정 구조를 가지고 있는 RNase H 단백질을 이용하는 방법이 있다 (그림 4B) (17-20). 후자의 경우를 보면, RNase H는 RNA:DNA hybrid를 인식하고 결합하여 hybrid상의 RNA를 분해하는 기능을 가지고 있는데, 이러한 RNA를 분해할 수 있는 능력은 제거되고 결합 능력만 가지는 돌연변이 RNase H (D210N)를 이용함으로써 RNA:DNA hybrid를 RNA 분해 없이 선택적으로 포착할 수 있게 한다. 이러한 두가지 포착 방법은 각각의 장단점을 가지는데 S9.6의 경우 RNA:DNA hybrid 외에도 약하지만 이중 가닥의 RNA를 인식할 수 있는 단점을 가지고 있는 반면, 관심있는 세포 또는 조직에 전 처리과정 없이 직접 도입할 수 있다는 장점을 가진다. 이와 달리 돌연변이 RNase H를 사용하는 방법 (R-ChIP, RR-ChIP)의 경우는 돌연변이 RNase H를 해당 세포에서 미리 발현을 유도해야 하며 이러한 과정으로 발생할 수 있는 인위적인 R-loop 수준의 변화 가능성에 대한 우려가 제기되고 있다. 그러나 MapR 또는 R-loop CUT&Tag의 경우는 각각 정제한 돌연변이 RNase H-MNase 또는 RNase H의 RNA:DNA hybrid 인식/결합 도메인 (hybrid binding domain, HBD) 부분을 가져와 세포내에서 발현할 필요 없이 R-loop을 포착함으로써 이러한 문제점이 개선되었으나, 아직은 실험에 필요한 돌연변이 RNase H-MNase  또는 HBD를 실험실에서 직접 발현/분리/정제를 해야 하는 제한점을 가진다. 다음으로 제작 기술의 각 단계를 비교하면, 초기 개발된 기술들에서는 세포의 고정단계 없이 다양한 제한효소의 조합으로 gDNA의 조각화를 유도한 후 S9.6 항체를 이용하여 R-loop을 포착하였으나, 최근에 개발된 기술들에서는 돌연변이 RNase H를 이용하는 경우 ChIP-seq과 유사하게 고정단계를 포함하여 sonication을 통한 gDNA의 조각화를 유도하거나, Micrococcal Nuclease (MNase) 또는 Tn5 transposase와 같이 무작위로 DNA를 인식하고 자를 수 있는 효소를 이용하여 조각화 하는 방법으로 발전되어 왔다 (그림 4). 이러한 gDNA의 무작위 조각화는 기존의 기술들에서 나타나는 특정 부위의 편향성과 낮은 해상도를 크게 향상시켰다.

 

 

그림 4 R-loop (RNA:DNA hybrid) 포착 방법.

(A) S9.6 항체를 이용한 R-loop 포착 방법. (B) 돌연변이 RNase H를 이용한 R-loop 포착 방법.

 

그리고 또 다른 비교 관점으로는 R-loop 포착 후에 이중 가닥의 DNA 형태를 가지고 라이브러리를 제작하는지 또는 단일 가닥의 DNA 또는 RNA를 이용하여 라이브러리를 제작하는지에 따라 차이를 보인다. 이중 가닥의 DNA 형태를 이용하는 경우 가닥 특이성(strand-specificity)를 가지지 못함으로써 단지 R-loop이 형성되어지는 유전체 위치 정보만 얻을 수 있는 반면, 단일 가닥을 이용하는 경우는 유전체 위치 정보와 더불어 RNA:DNA hybrid를 형성하는 가닥정보를 같이 얻을 수 있다. 이러한 정보는 유전자의 발현 방향과 함께 분석하여 유전자 발현 조절에 관한 유용한 정보를 얻는데 도움을 줄 수 있다.

 

2-5. Triplex (RNA.DNA:DNA triple helix) 포착을 위한 시퀀싱 기술

 

RNA.DNA:DNA triplex 는 DNA:DNA 이중 가닥의 major groove에서 Hoogsteen base-pairing을 통해 RNA가 결합하는 구조이다. 예전부터 in vitro 상에서는 이러한 결합에 의한 RNA-DNA 상호작용이 규명이 되어 있었지만, 세포 핵 내에서는 유전체 어느 부위에서 일어나는지, 어떤 RNA가 이러한 상호작용 방법을 이용하는지, 그리고 어느 수준으로 발생하는지, 이러한 상호작용이 세포 기능에 어떻게 영향을 미치는지에 대한 연구들은 최근에 들어와서 일부 수행 되어지고 있다 (21). 이러한 triplex에 의한 상호작용을 포착하기 위해 TriplexRNA/TriplexDNA-seq 방법이 개발되어져 있다 (그림 5) (22). 기본적인 원리는 RNA.DNA:DNA triplex 방법 외에 RNA-Chromatin 상호작용 방법으로 언급했던 단백질 매개를 통한 상호작용과 R-loop에 의한 상호작용을 각각 제거하기 위해 proteinase K와 RNase H 를 처리한다. 이후 chromatin-associated RNA를 분리/정제를 위한 DNA immunoprecipitation (IP)는 SPRI beads 또는 anti-dsDNA를 이용하고, RNA-associated DNA를 분리/정제를 위한 RNA IP는 biotinylated linker 결합을 통해 수행한다. 그러나 위에 언급한 방법으로는 직접적으로 어떤 RNA가 어떤 DNA 부위와 triplex 방법으로 상호작용하는지 규명할 수는 없고, 단순하게 triplex 방법을 통해 상호작용하는 RNA 또는 DNA 부위를 각각 따로 포착하는 것만 가능하다. 그래서 단일 특정 RNA와의 직접적인 상호작용을 확인하기 위해 ChIRP/CHART/RAP에서 사용되었던 biotinylated probe를 이용한 포착 방법을 활용한다 (그림 5). 특정 RNA에 상보적으로 결합할 수 있는 biotinylated probe를 이용하면 해당 RNA와 triplex로 결합하고 있는 유전체 부위를 함께 분리/정제 할 수 있는 원리이다.   

 


그림 5 Triplex (RNA.DNA:DNA triple helix) 포착을 위한 방법.

 

그러나 앞서 설명한 이러한 방법들은 triplex 부위를 직접 포착하기 보다는 알고 있는 가능한 다른 RNA-Chromatin 상호작용 방법들을 제거하는데 있다. 따라서 이러한 접근 방식은 제거효율에 크게 의존적일 수 밖에 없고, 효율에 따라서는 잘못된 결과를 유도할 수 있는 문제점을 가지고 있다. 이러한 문제점을 해결하기 위해서는  앞으로 추가적인 연구를 통해 직접적으로 triplex를 포착할 수 있는 방법의 개발이 필요하다. 

 

3. 결론


대량 염기서열 분석 기술들은 생명과학 전 분야에서 이제 가장 많이 활용되는 중요한 연구 도구로 발전해 왔다. 이러한 기술은 초기의 단순 염기서열 자체의 정보 또는 발현 수준의 정보를 획득하는 것을 넘어서 더욱 더 다양한 형태의 정보를 생산하는데 핵심적으로 활용되고 있다. 최근 다양한 생체 내 정보 가운데 특히 각각의 분자들 사이의 상호작용을 이해하는 것은 더욱 중요해 지고 있는데, 본 글에서 기술한 시퀀싱 방법들을 이용하여 이에 대한 유용한 정보들을 얻고 있지만 아직도 방법적으로 극복하고 개선해야 할 여러 제한점/문제점들이 존재하며, 앞으로 추가 연구를 통해 이를 해결할 새로운 길이 열릴 것으로 생각된다. 더 나아가 단일 세포 시퀀싱 기술과 접목하여 상호작용에 대한 정보를 단일 세포내에서 확보하고, 다른 시퀀싱 기술들과 융합하여 한번에 상호작용에 대한 정보와 더불어 다양한 형태의 또 다른 정보를 얻는 multiomics 분야에도 활용될 것을 기대해 본다.

 

4. 참고문헌


1. Djebali S, Davis CA, Merkel A et al (2012) Landscape of transcription in human cells. Nature 489, 101-108

2. Long Y, Wang X, Youmans DT and Cech TR (2017) How do lncRNAs regulate transcription? Sci Adv 3, eaao2110

3. Johnson WL and Straight AF (2017) RNA-mediated regulation of heterochromatin. Curr Opin Cell Biol 46, 102-109

4. Li W, Notani D and Rosenfeld MG (2016) Enhancers as non-coding RNA transcription units: recent insights and future perspectives. Nat Rev Genet 17, 207-223

5. Chen JY, Lim DH and Fu XD (2019) Mechanistic Dissection of RNA-Binding Proteins in Regulated Gene Expression at Chromatin Levels. Cold Spring Harb Symp Quant Biol 84, 55-66

6. Chu C, Qu K, Zhong FL, Artandi SE and Chang HY (2011) Genomic maps of long noncoding RNA occupancy reveal principles of RNA-chromatin interactions. Mol Cell 44, 667-678

7. Simon MD, Wang CI, Kharchenko PV et al (2011) The genomic binding sites of a noncoding RNA. Proc Natl Acad Sci U S A 108, 20497-20502

8. Engreitz JM, Pandya-Jones A, McDonel P et al (2013) The Xist lncRNA exploits three-dimensional genome architecture to spread across the X chromosome. Science 341, 1237973

9. Sridhar B, Rivas-Astroza M, Nguyen TC et al (2017) Systematic Mapping of RNA-Chromatin Interactions In Vivo. Curr Biol 27, 602-609

10. Li X, Zhou B, Chen L, Gou LT, Li H and Fu XD (2017) GRID-seq reveals the global RNA-chromatin interactome. Nat Biotechnol 35, 940-950

11. Bell JC, Jukam D, Teran NA et al (2018) Chromatin-associated RNA sequencing (ChAR-seq) maps genome-wide RNA-to-DNA contacts. Elife 7

12. Bonetti A, Agostini F, Suzuki AM et al (2020) RADICL-seq identifies general and cell type-specific principles of genome-wide RNA-chromatin interactions. Nat Commun 11, 1018

13. Ginno PA, Lott PL, Christensen HC, Korf I and Chedin F (2012) R-loop formation is a distinctive characteristic of unmethylated human CpG island promoters. Mol Cell 45, 814-825

14. Xu W, Xu H, Li K et al (2017) The R-loop is a common chromatin feature of the Arabidopsis genome. Nat Plants 3, 704-714

15. Sanz LA, Hartono SR, Lim YW et al (2016) Prevalent, Dynamic, and Conserved R-Loop Structures Associate with Specific Epigenomic Signatures in Mammals. Mol Cell 63, 167-178

16. Nadel J, Athanasiadou R, Lemetre C et al (2015) RNA:DNA hybrids in the human genome have distinctive nucleotide characteristics, chromatin composition, and transcriptional relationships. Epigenetics Chromatin 8, 46

17. Wang K, Wang H, Li C et al (2021) Genomic profiling of native R loops with a DNA-RNA hybrid recognition sensor. Sci Adv 7

18. Yan Q, Shields EJ, Bonasio R and Sarma K (2019) Mapping Native R-Loops Genome-wide Using a Targeted Nuclease Approach. Cell Rep 29, 1369-1380 e1365

19. Tan-Wong SM, Dhir S and Proudfoot NJ (2019) R-Loops Promote Antisense Transcription across the Mammalian Genome. Mol Cell 76, 600-616 e606

20. Chen L, Chen JY, Zhang X et al (2017) R-ChIP Using Inactive RNase H Reveals Dynamic Coupling of R-loops with Transcriptional Pausing at Gene Promoters. Mol Cell 68, 745-757 e745

21. Leisegang MS, Bains JK, Seredinski S et al (2022) HIF1alpha-AS1 is a DNA:DNA:RNA triplex-forming lncRNA interacting with the HUSH complex. Nat Commun 13, 6563

22. Senturk Cetin N, Kuo CC, Ribarska T, Li R, Costa IG and Grummt I (2019) Isolation and genome-wide characterization of cellular DNA:RNA triplex structures. Nucleic Acids Res 47, 2306-2321