Pengertian
Berkas Sort Dan Merge
ž Salah satu kebutuhan dalam sistem
informasi adalah kemampuan komputer untuk menyortir data.
ž Record-record dari file transaksi
harus disusun dalam urutan tertentu dalam peng-update an sequential master file
secara efisien
ž Untuk membantu pembuatan laporan
sehingga mudah dibaca
Dalam
sistem penyortiran dikenal 2 metode, yaitu :
•
Metode
Sort Internal
•
Metode
Sort Eksternal
Perbedaannya
:
- Pada metode sort internal, semua record
yang akan diproses dimuat ke dalam memori komputer lalu diproses sort
(sortir).
- Pada metode sort eksternal,
record-record yang diproses tidak semuanya dapat dimuat ke dalam memori
komputer, karena keterbatasan memori komputer.
- Metode sort eksternal di dalam
penerapannya nanti, menggunakan pula metode sort internal.
Contoh :
Sebuah file
berisi 2000 record harus disortir ke dalam memori yang hanya dapat menampung 1000 record sekaligus. Untuk itu
digunakan metode sort eksternal.
Langkah-langkah
penyortiran ini adalah :
•
Record-record
dibagi ke dalam beberapa file agar dapat ditampung sekaligus di memori
komputer, lalu masing-masing bagian disortir internal. Bagian-bagian file yang
terlah tersortir ini disebut sorted sublist.
Maka
didapat :
v Sorted sublist 1 (record 1 – 1000)
dan
v Sorted sublist 2 (record 1001 –
2000)
•
Setelah
itu kedua sorted sublist ini (RUN) digabung (merge), sehingga didapat berkas
gabungan (merge file) yang record-recordnya telah disortir.
Maka
dapat disimpulkan langkah-langkah untuk metode sort eksternal ini adalah :
•
Sort
internal, dimana file dibagi menjadi beberapa bagian file, kemudian disortir.
•
Merge,
dimana bagian-bagian file ini (sorted sublist) digabung menjadi satu atau lebih
file gabungan. File-file gabungan kemudian digabung lagi sampai akhirnya
didapatkan sebuah file gabungan yang berisi semua record-record yang telah
disortir.
•
Output,
yang menyalin file gabungan yang telah tersortir ke media storage terakhir.
ž Faktor-faktor yang mempengaruhi
metode sort eksternal :
— Jumlah record yang akan disortir
— Ukuran record (panjang record)
— Jumlah storage yang digunakan
— Kapasitas internal memori
— Distribusi nilai key dalam input
file
Teknik
sort/merge file ini berbeda satu dengan yang lainnya dalam hal :
ž Metode sort internal yang digunakan
ž Jumlah main memori yang disediakan
untuk sort internal
ž Distribusi dari sorted sublist di
secondary storage menjadi satu atau lebih file gabungan dalam satu langkah
gabungan (merge pass)
Ada 4
teknik dalam sort/merge file, yaitu :
ž Natural Merge
ž Balanced Merge
ž Polyphase Merge
ž Cascade Merge
Natural
Merge
Merge yang menangani 2 input
file sekaligus disebut 2 way natural merge.
Merge yang menangani M input
file sekaligus disebut M way natural merge. M menunjukkan derajat
merge.
Pada
natural merge terbagi lagi menjadi :
2 way natural merge
3 way natural merge
:
:
M way natural merge
Pada M way natural merge, dapat
didefinisikan sebagai merge dengan :
M input file dan hanya 1 output
file.
Contoh :
Sebuah file yang terdiri dari
6000 record hendak disortir ke dalam memori komputer yang kapasitasnya 1000
record.
Buatlah
dengan menggunakan 3 way natural merge !
Balanced
Merge
Dari metode natural merge kita
lihat bahwa, jika kita gunakan M input file, maka file seluruhnya yang kita
gunakan adalah M + 1 file.
Sedangkan pada balanced merge,
jika kita gunakan M input file, maka file seluruhnya yang dipakai adalah 2 M
file.
Pada balanced merge terbagi lagi
menjadi :
2 way balanced merge
3 way balanced merge
:
:
M way balanced merge
Pada balanced merge, jumlah
input file sama dengan jumlah output file, walaupun pada akhirnya tak ada lagi
keseimbangan antara input dan output file.
Polyphase
Merge
ž Pada M way polyphase merge digunakan
2 M-1 input file dengan 1 output file. Jadi kita menggunakan 2 way polyphase
merge, maka banyaknya input file yang digunakan ada 3 input file.
ž Contoh :
Setelah phase sort internal,
misalkan kita mempunyai 17 subfile atau 17 run yang akan didistribusikan ke
input file. Jika kita menggunakan 2 way polyphase merge, berarti 17 run
tersebut harus didistribusikan ke dalam 3 input file.
Dari
pendistribusian tersebut, maka diperoleh :
Cascade
Merge
Jenis lain dari unbalanced merge
yang berusaha mengurangi penyalinan/copy dari record-record disebut cascade
merge.
Cascade merge dengan derajat M
menggunakan :
2 M-1, 2 M-2, 2 M-3, … ,
kemudian 2 input file selama merge
Setiap merge pass dimulai dengan
merge dari :
2 M-1 input file ke 1 outpt file
Pada cascade merge,
pendistruibusian run-nya sama dengan pendistribusian run pada polyphase merge,
hanya berbeda pada phase merge-nya.
No comments:
Post a Comment