[OS] 10장 - 파일 시스템
반효경 교수님의 운영체제 강의를 참고하였습니다.
- File
- 관련 정보를 이름을 가지고 저장
- 비휘발성의 보조기억장치(HDD, SSD)에 저장
- 운영체제는 저장 장치를 file이라는 동일한 논리적 단위로 볼 수 있게 해줌 → device special file
- Operation
- create, read, write, reposition(lseek), delete, open, close 등
- File attribute(file metadata)
- 파일을 관리하기 위한 각종 정보들
- 파일 이름, 유형, 저장된 위치, 파일 사이즈
- 접근 권한(r/w/x), 시간(생성/변경/사용), 소유자 등
- 파일을 관리하기 위한 각종 정보들
- File System
- 운영체제에서 파일을 관리하는 부분
- 파일 및 파일의 메타데이터, 디렉토리 정보 등을 관리
- 파일의 저장 방법 결정
- 파일 보호 등
Directory and Logical Disk
- Directory
- 파일의 메타데이터 중 일부를 보관하고 있는 일종의 특별한 파일
- 그 디렉토리에 속한 파일 이름 및 파일 attribute들
- operatiion
- 파일 찾기, 파일 생성, 파일 삭제, 파일명 변경, 디렉토리 조회, 파일시스템 탐색
- Partition(=Logical Disk)
- 하나의(물리적) 디스크 안에 여러 파티션을 두는게 일반적
- 여러 개의 물리적 디스크를 하나의 파티션으로 구성
- 디스크를 파티션으로 구성한 뒤 각 용도에 맞게 file system을 깔거나 swapping 용도로 사용
- ex) C drive, D drive 등
open()
-
파일의 메타데이터를 메인 메모리로 올리는 작업
-
open("/a/b")
- directory path를 search
- 루트 디렉토리 “/“를 open하고 그 안에서 “a"의 위치 획득
- 파일 “a"를 open한 후 read하여 그 안에서 파일 “b"의 위치 획득
- 파일 “b” open
- Directory path의 search에 너무 많은 시간 소요
- Open을 read/write와 별도로 두는 이유
- 한번 open한 파일은 read/write시 directory search 불필요
- Open file table
- 현재 open 된 파일들의 메타데이터 보관소(in memory)
- 디스크의 메타데이터보다 몇 가지 정보가 추가
- Open한 프로세스 수
- File offset : 파일의 어느 위치를 접근 중인지 표시
- File descriptor : (file handler, file control block)
- open file table에 대한 위치 정보(프로세스 별)
- directory path를 search
File Protection
- 각 파일에 대해 누구에게 어떤 유형(read/write/execution)을 허락할 것인가?
- Access Control 방법
- Access control matrix
- access control list : 파일이 주체가 되어 어떤 접근 권한이 있는지 표시
- capability : 사용자별로 자신이 접근 권한을 가진 파일 및 해당 권한 표시
- Grouping
- 전체 user를 onwer, group, public의 세그룹으로 구분
- 각 파일에 대해 세 그룹의 접근 권한(rwx)을 3비트씩 표시
- ex) rwx/r—/r—(owner/group/other)
- Password
- 파일마다 password를 두는 방법(디렉토리도 가능)
- 모든 접근 권한에 대해 하나의 password: all-or-nothing
- 접근 권한별 password: 암기 문제, 관리 문제
- Access control matrix
File System의 Mounting
- 마운팅이라는 것을 파일시스템에 다른 파티션을 연결시켜 서로 다른 파일 시스템에 접근 가능하도록 하는 것
Access Methods
- 순차 접근
- 카세트 테이프를 사용하는 방식처럼 접근
- 읽거나 쓰면 offset은 자동적으로 증가
- 직접 접근(임의 접근)
- LP 레코드 판과 같이 접근
- 파일 구성하는 레코드를 임의의 순서로 접근
Allocation of File data in Disk
Contiguous Allocation
- count 파일이라는 파일은 0번부터 시작해서 2칸 차지
- list는 28번부터 시작해서 4칸 차지
- 장점
- Fast I/O
- 한번의 seek/rotation으로 많은 바이트 transfer
- Realtime file용으로, 또는 이미 run 중이던 process의 swapping(swap area) 용
- Direct access(=random access) 가능
- Fast I/O
- 단점
- external fragmentation 발생
- file grow가 어려움
- file 생성시 얼마나 큰 hole을 배당할 것인가?
- grow 가능 vs 낭비(internal fragmenation)
Linked Allocation
- 장점
- External fragmentation이 발생 안함
- 단점
- No random access
- Reliablity 문제
- 한 sector가 고장나 pointer가 유실되면 많은 부분을 잃음
- Pointer를 위한 공간이 block의 일부가 되어 공간 효율성을 떨어뜨림
- 512 bytes/sector, 4bytes/pointer
- 변형
- File-allocation table(FAT) 파일 시스템
- 포인터를 별도 위치에 보관하여 reliability와 공간 효율성 문제 해결
- File-allocation table(FAT) 파일 시스템
Indexed Allocation
- 하나의 block에 file index를 저장 해 놓음
- 장점
- External fragmentation이 발생하지 않음
- Direct access 가능
- 단점
- Small file의 경우 공간 낭비(실제로 많은 file들이 small)
- Too Large file의 경우 하나의 block으로 index를 저장하기에 부족
- linked scheme
- multi-level index
UNIX 파일시스템의 구조
- Boot block
- 부팅에 필요한 정보(bootstrap)
- Super block
- 파일 시스템에 관한 총체적인 정보
- Inode list
- 파일 이름을 제외한 파일의 모든 메타데이터 저장
- 대부분의 파일은 굉장히 작기때문에 direct block에 저장 되고 파일이 커지는 경우 single, double, triple에 저장 됨
- Data block
- 실제 내용
FAT(File allocation table) File System
- 직접 접근이 가능하다 4번째 접근 하고 싶으면 FAT[FAT[FAT[217]]] 으로 가능..?
Free Space Management
Bit map or bit sector
- bit map의 크기는 data block의 갯수
- bit[i] = 0 → block[i] free 1 → block[i] occupied
- Bit map은 부가적인 공간을 필요로 함
- 연속 n개의 free block을 찾는데 효과적
Linked list
- 모든 free block들을 링크로 연결
- 연속적인 가용공간을 찾는데 어려움
- 공간의 낭비가 없음
Grouping
- linked list 방법의 변형
- 첫번째 free block이 n개의 pointer를 가짐
- n-1 pointer는 ㄹree data block을 가리킴
- 마지막 pointer가 가리키는 block은 또 다시 n pointer를 가짐
Directory Implementation
-
Linear list
- <file name, file metadata>의 list
- 구현이 간단
- 디렉토리 내에 파일이 있는지 찾기 위해서는 linear search
-
Hash table
- linear list + hashing
- hash table은 file name을 이 파일의 linear list의 위치로 바꾸어줌
- search time x
- collision 발생 가능
-
File의 metadata 보관 위치
- 디렉토리 내에 직접 보관
- 디렉토리에는 포인터를 두고 다른 곳에 보관
- inode, FAT 등
-
Long file name의 지원
- <file name, file metadata>의 list에서 각 entry는 일반적으로 고정 크기
- file name이 고정 크기 entry보다 길어지는 경우 entry의 마지막 부분에 이름의 뒷부분이 위치한 곳의 포인터를 두는 방법
- 이름의 나머지 부분은 동일한 directory file의 일부에 존재
VFS and NFS
- VFS(Virtual File System)
- 서로 다른 다양한 file system에 대해 동일한 시스템 콜 인터페이스(API)를 통해 접근할 수 있데 해주는 OS의 layer
- NFS(Network File System)
- 분산 시스템에서는 네트워크를 통해 파일이 공유될 수 있음
- NFS는 분산 환경에서의 대표적 파일 공유법0
Page cache and Buffer cache
-
Page cache
- Virtual memory 관점에서 page frame을 caching의 관점
- memory-mapped I/O를 쓰는 경우 file I/O에서도 page cache 사용
-
Memory-mapped I/O
- 파일의 일부를 virtual memory에 매핑
- 매핑 시킨 영역에 대한 메모리 접근 연산은 파일의 입출력을 수행
-
Buffer cache
- 파일 시스템의 내용을 buffer cache에 copy해놓고 사용자에게 전달
-
Unified Buffer cache
- 최근에는 Page cache와 buffer cache를 통합하여 관리