💻 IT/📌 DataBase

[IT] SAM 파일이란?

GODSU 2024. 4. 15. 21:10
반응형

 

오늘은 실무에서 사용하는 SAM 파일에 대해서 적어볼께요, 자주 사용하지만 알고 사용하는게 더 좋을 거 같아서 정리해볼께요~

 

 

 

SAM(Sequence Alignment/Map) File 이란?

SAM 파일은 Sequence Alignment/Map 형식의 약자로  alignment, mapping 정보를  정보를 포함하는 탭 제한 텍스트 파일입니다. SAM 파일은 텍스트 파일의 문자열 형태로 저장(save), 열람(read)가 가능한 파일이며, 파일을 열어보면 탭으로 분리되어 있는 것을 확인 할  수 있다.

출처 : https://www.incodom.kr/SAM

 

실무에서도 다양한 정보를 탭으로 구분해서 저장해서 사용한다, 예를들어 식별번호, 성별, 나이 등등 탭으로 구분해서 저장해서 사용한다. 

 

 

 

 

SAM파일 주요 구성요소

헤더 : 헤더에는 정렬에 사용되는 참조 시퀀스에 대한 정보와 읽기 그룹 정보, 샘플 정보 및 정렬 소프트웨어 설정과 같은 기타 관련 메타데이터가 포함되어 있습니다.

Alignment Records(정렬 레코드) : SAM 파일의 각 정렬 레코드는 참조 시퀀스에 정렬된 단일 읽기에 해당합니다. 이러한 레코드에는 다음과 같은 정렬에 대한 정보를 제공하는 다양한 필드가 포함되어 있습니다:

- 쿼리 이름: 읽기에 대한 고유 식별자입니다.
- 플래그: 정렬에 대한 정보(예: 읽기가 페어드 엔드인지, 제대로 정렬되었는지 등)를 제공하는 비트 단위 플래그 집합입니다.
- Reference Name(참조 이름): 읽기가 정렬된 참조 시퀀스의 이름입니다.
- Position(위치): 기준 시퀀스 상에서 판독값의 가장 왼쪽에 있는 1 베이스 매핑 위치입니다.
- Mapping Quality : Mapping의 품질을 나타내는 수치입니다.
- 시가 문자열: 정렬 세부 정보(예: 일치, 불일치, 삽입, 삭제)를 나타내는 컴팩트한 문자열입니다.
- Sequence(시퀀스): 읽기의 시퀀스입니다.
- Quality Scores(품질 점수): 판독값의 각 베이스에 해당하는 Phred 품질 점수입니다.
- 옵션 필드: SAM 파일에는 정렬 점수, 읽기 그룹 정보 및 주석과 같은 정렬에 대한 추가 정보를 제공하는 옵션 필드도 포함할 수 있습니다.

 

 


 

반응형