오늘은 실무에서 사용하는 SAM 파일에 대해서 적어볼께요, 자주 사용하지만 알고 사용하는게 더 좋을 거 같아서 정리해볼께요~
SAM(Sequence Alignment/Map) File 이란?
SAM 파일은 Sequence Alignment/Map 형식의 약자로 alignment, mapping 정보를 정보를 포함하는 탭 제한 텍스트 파일입니다. SAM 파일은 텍스트 파일의 문자열 형태로 저장(save), 열람(read)가 가능한 파일이며, 파일을 열어보면 탭으로 분리되어 있는 것을 확인 할 수 있다.
실무에서도 다양한 정보를 탭으로 구분해서 저장해서 사용한다, 예를들어 식별번호, 성별, 나이 등등 탭으로 구분해서 저장해서 사용한다.
SAM파일 주요 구성요소
✅ 헤더 : 헤더에는 정렬에 사용되는 참조 시퀀스에 대한 정보와 읽기 그룹 정보, 샘플 정보 및 정렬 소프트웨어 설정과 같은 기타 관련 메타데이터가 포함되어 있습니다.
✅ Alignment Records(정렬 레코드) : SAM 파일의 각 정렬 레코드는 참조 시퀀스에 정렬된 단일 읽기에 해당합니다. 이러한 레코드에는 다음과 같은 정렬에 대한 정보를 제공하는 다양한 필드가 포함되어 있습니다:
- 쿼리 이름: 읽기에 대한 고유 식별자입니다.
- 플래그: 정렬에 대한 정보(예: 읽기가 페어드 엔드인지, 제대로 정렬되었는지 등)를 제공하는 비트 단위 플래그 집합입니다.
- Reference Name(참조 이름): 읽기가 정렬된 참조 시퀀스의 이름입니다.
- Position(위치): 기준 시퀀스 상에서 판독값의 가장 왼쪽에 있는 1 베이스 매핑 위치입니다.
- Mapping Quality : Mapping의 품질을 나타내는 수치입니다.
- 시가 문자열: 정렬 세부 정보(예: 일치, 불일치, 삽입, 삭제)를 나타내는 컴팩트한 문자열입니다.
- Sequence(시퀀스): 읽기의 시퀀스입니다.
- Quality Scores(품질 점수): 판독값의 각 베이스에 해당하는 Phred 품질 점수입니다.
- 옵션 필드: SAM 파일에는 정렬 점수, 읽기 그룹 정보 및 주석과 같은 정렬에 대한 추가 정보를 제공하는 옵션 필드도 포함할 수 있습니다.
'💻 IT > 📌 DataBase' 카테고리의 다른 글
[DB] ORACLE DataBase 비밀번호 재설정 (초기화방법) 초간단 방법 (1) | 2024.08.10 |
---|---|
[DB/SQL] SQL SELECT 실행순서 정리 (1) | 2024.08.04 |
[DB/Join] 조인이란? 동등조인과 외부조인 ( Inner Join, Outer Join) (21) | 2022.04.26 |
[DB/Oracle] ORA-00904 : 부적합한 식별자 invalid identifier (4) | 2022.03.03 |
[CASE 표현식] SQL CASE 문 :: 복잡한 조건 논리 처리하기 (0) | 2021.07.28 |