Sigurnosno spremanje podataka - NAS storage
Izradili: Ivan Kudeljnjak, Đuro Kostelac
Napomena: pri izradi projekta oba člana tima su sudjelovala u svim dijelovima, no samo pisanje je podijeljeno što se vidi i prema potpisima, dok je praktični dio odrađen zajedno.
Sadržaj |
Uvod
Cilj ovog rada je proučiti i procijeniti načine sigurnosnog spremanja podataka. U radu ćemo proučiti sve važnije medije i načine skladištenja podataka kao načina održavanja efektivne strategije manipulacije podacima. Činjenica je da se količina podataka koja je generirana u poduzećima današnjice udvostruči u prosjeku svake godine, naravno ovisno o poduzeću. Također je činjenica da je skladištenje podataka, odnosno posjedovanje pravih podataka u pravo vrijeme jedna od okosnica kvalitetnog informacijskog sustava.
Tako je vrlo važan zadatak održavati korak sa našim podacima. Naravno, naglasak nije nikako isključivo na osiguravanju jednostavnog prostora za skladištenje podataka, već i na njegovoj sigurnosti. Za jedan informacijski sustav uvijek se moramo pobrinuti tako da osigurano da podaci neće biti izgubljeni u slučajevima nekog ispada ili slično. Zato danas poznajemo mnogo tehnologija koje omogućuju spremanje podataka na sigurno.
Tako u ovom radu trebamo za početak promotriti medije na koje sprememo podatke, koje su njihove prednosti i mane. Poznajemo mnoge medije, CD, DVD..., Čvrsti disk, SSD disk, magnetna vrpca, itd. No ipak, uglavnom ćemo se osvrnuti na čvrsti disk, kao današnji de facto standard te na njegove različite implementacije.
S druge strane, važno je promotriti i alternativnu tehnologiju, koja doduše koristi čvrsti disk, ali se razlikuje u arhitekturi, a to su mrežna spremišta podataka. Vidjet ćemo tako razliku između SAN, NAS, DAS i sličnih arhitektura mrežnog skladištenja.
--Dkostelac 15:56, 5. siječnja 2012. (CET)
Tehnologije skladištenja/mediji
Skladištenje podataka može se u stvarnosti odvijati na mnoge načine. Jedan od najočitijih je pisanje na papir i arhiviranje zapisa. No ipak, budući da se ovdje raspravljamo o računalnom spremanju podatka, razmotriti ćemo samo medije koji služe arhiviranju. Očita je potreba za zadržavanjem materije kroz duže vrijeme. Osobito je taj primjer prisutan u poduzećima koja nekada moraju vrlo dugo držati arhive. Iz tog razloga danas još uvijek imamo velike arhive u papirnatom obliku. Jedan od prvih načina smanjenja tog obujma dokumentacija je bio fotografiranje dokumentacije i čuvanje mikrofilma. Tako se mogao vjerno rekonstruirati zapis očuvan na papiru, ali u puno manjem obujmu. U nastavku ćemo ocijeniti neke od alternativnih (i modernijih) medija.
Optički mediji
Jedna od prvih dobrih alternativa papiru, koja je omogućila spremanje velike količine podataka u malom formatu su bili optički mediji. Tako jedan CD može čuvati 665600 stranica teksta s dvostrukim proredom. Očito je koliko je to unaprjeđenje od fizičkog arhiviranja 665600 stranica teksta na papiru. CD je tako dugo živio kao kralj skladištenja podataka. No, zahvaljujući naglom rastu konkurencije (čvrsti disk) došlo je pitanje koji je idući racionalni korak u budućnosti CD medija. Naime, kako su godine prolazile CD i dalje zadržava svoj osnovni obujam od 650 – 700 MB, a cijena čvrstog diskova u ovisnosti na broj GB opada. Uočeno je kako se CD mora naglo proširiti (ne dimenzijama, koliko kapacitetom). Rješenje je bilo unaprijediti gustoću zapisa podataka smanjenjem valne duljine laserske zrake za čitanje CD-a koja je iznosila λ = 780nm.
Tako je stvorena druga generacija optičkih diskova zasnovana na CD tehnologiji – DVD (Digital Versatile Disc). DVD je nudio kapacitet od 4.7GB po sloju diska, odnosno 9.4GB za dvoslojan disk ili 18.8GB za dvostrani, dvosloji disk. Kapacitet je tako povećan i više od 20 puta. Povećanje kapaciteta se ostvarilo gušćim zapisom podataka. Tako je DVD koristio lasersku zraku od λ = 650nm. Jednom kada je i DVD postao premali, stvorena je Blue-Ray tehnologija. Blue layer koristi λ = 405nm lasersku zraku i tako sprema 25GB po sloju. Pitanje je naravno trebamo li koristiti optičke medije kao medij za arhiviranje podataka. To naravno ovisi o nekoliko faktora:
- Optički mediji su u pravilu WORM tehnologije (Write-once-read-many), što predstavlja problem kod revizije podataka
- Pristupne brzine optičkih diskova su relativno sporije u odnosu na črvste diskove i slične tehnologije.
- Optičke medije je potrebno fizički skladištiti i fizički umetnuti u računalo kako bi se pročitali.
S druge strane, optički mediji nude i mnoge prednosti poput:
- Ukoliko su pravilno korišteni, mogu imati vrlo niske troškove. To počinje od niskih početnih ulaganja, a trajno predstavlja niska ulaganja u održavanje.
- Jedan od primarnih razloga jeftinog održavanja je gotovo neusporediva niska potrošnja energije u usporedbi sa RAID poljem istog kapaciteta.
- Predviđen je vrlo brz rast kapaciteta tih tehnologija
- Ostalo...
Jedna od zanimljivosti koju svakako moramo pogledati je da su optički mediji i danas popularni. Štoviše, ne samo to, oni ostvaruju rast. To vidimo i na sljedećem grafu :
--Dkostelac 16:04, 5. siječnja 2012. (CET)
Podatkovne vrpce
Podatkovna vrpaca je medij koji već dugo smatramo zaboravljenim. No ipak, po prijašnjem grafu vidimo da je to još uvijek daleko od istine. Zapravo, slučaj je da su se mnogi proizvođaći medija za pohranu podataka udružili kako bi stvorili veće, bolje i sigurnije vrpce.
Snaga vrpce kao medija leži u primjenama gdje se vrlo velika količina podataka mora spremiti na siguran i jeftin način te da pri tome zauzima čim manje mjesta je moguće. Tako vrpce imaju dvije osnovne namjene:
- Backup rješenja
- Skladištenje ogromnih količina podataka
Tehnologija podatkovnih vrpci ima svoje korijene u magnetskoj vrpci, vrlo sličnoj onima u audi kazetama. Sastoji se od duge i uskle plastične vrpe koja je obložena magnetskim materijalom. Radi zaštite, sama vrpca i traka su najčećše obložene plastičnim oklopom (kazetom).
Princip korištenja podatkovne vrpce je jednostavan, ali i vrlo sličan ostalim magnetski medijima. Traka se pomiče ispod magnetske glave koja zapisuje podatke. Promjena u smjeru struje predstavlja 0 ili 1.
Naravno, problem kod ovog pristupa je također karakterističan za sve magnetske medije. Budući da je kontakt između magnetske vrpce i glave stalno pristuan prilikom pisanja i/ili čitanja, dolazi do značajne deterioacije medija. Neke vrpce su tako dizajnirane da postoji malen oblak zraka između glave i vrpce, kako bi se smanjilo propadanje tijekom vremena.
U nastavku ćemo pogledati različite tehnologije vrpci i njihove karakteristike. Na slici ispodvidimo različite tipove vrpci . Ilustraciju količinu podataka koju možemo spremiti na pojedinu vrpcu vidimo na sljedećim tablicama:
Vidimo da vrpce ne zaostaju previše veličinom skladišta za HDD-ovima. Jedan osobitiji primjer su LTO vrpce, opisane u posljednjoj tablici. One su specijalno dizajnirane tako da je olaksana robotska manipulacija. Tako jedno skladište LTO vrpci može sadržavati i do nekoliko petabajta podataka. Skladišta LTO vrpci spajam s računalom preko SCSI-a ili optičkih kablova
--Dkostelac 17:26, 6. siječnja 2012. (CET)
Čvrsti diskovi
Čvrsti ili tvrdi disk (eng. Hard disk) služi za pohranu podataka u računalima. Povijest započinje još tamo 1956. kada IBM razvija prvi tvrdi disk te traje sve do danas. Taj prvi disk bio je veličine 4,4 MB, a zanimljiv je podataka da je IBM godišnji najam za taj disk naplaćivao u iznosu od 35.000 $. S obzirom na današnje razdoblje kada su prisutni diskovi od više TB (terabajta), koji su cijenom daleko povoljniji nego tadašnji najam koji je IBM naplaćivao, zapravo vidimo koji je razvojni put prošao čvrsti disk. Od nečega što je namijenjeno samo pojedincima do toga da danas gotovo svatko posjeduje računalo u kojem ima čvrsti disk.
Osnovni dijelovi diska su:
- Magnetska ploča
- Magnetska glava
- Upravljački mehanizam
- Nosač glave
- Osovina
Na slici ispod možemo vidjeti jedan čvrsti disk s prikazom svih njegovih dijelova.
Zapitamo li se kako čvrsti disk radi. Na sljedećem linku nalazi se video s kratkim prikazom rada čvrstog diska. Kako disk sadrži magnetske dijelove, on svoj rad upravo i temelji na magnetskom polju. Glava služi za upisivanje podataka (preciznije mala zavojnica koja je dio glave), tako da kroz spomenutu zavojnicu prolazi struja te se podaci zapisuju na principu binarnog sustava. Glava se može pomicati po cijelom disku, a to joj omogućuje upravljački mehanizam. U starim diskovima bila je jedna glava za čitanja i pisanje, dok je u današnjim čvrstim diskovima to odvojeno pa imamo čitaču i pisaču glavu.
Neka od pozitivnih svojstava čvrstog diska su:
- Veliki kapacitet
- Pristupačna cijena
- Postojanost podataka
- Relativno brzi pristup podacima
Negativna svojstva:
- Osjetljivost na prašinu i prljavštinu
- Osjetljivost na elektromagnetska polja
- Ograničena maksimalna gustoća podataka
Kroz povijest razvilo se je nekoliko sučelja, od kojih su poznatija:
- ST-412/506
- ESDI – razvila ga je tvrtka Maxtor, no nije previše zaživjelo
- ATA – vrlo popuralan i rasprostranjen, započeo s IDE, a trenutno aktualna SATA (serijska ATA)
- SCSI – jedna od mogućnosti ovog sučelja je priključivanje vanjskih jedinica (printer, skener)
U današnje vrijeme najpopularniji proizvođači diskova su:
- Hitachi
- Samsung
- Seagate
- Western digital
U zadnjih nekoliko godina sve popularniji postaju SSD diskovi koje odlikuje puno veća brzina čitanja i pisanja, ali isto tako imaju i oni neke svoje mane.
--Dkostelac 19:12, 6. siječnja 2012. (CET)
Arhitekture diskova
RAID
RAID ili Redundant Array of Inexpensive Disks (RAID) predstavlja upravo ono što mu ime govori. Osnovni cilj RAID polja je ponuditi jeftini način osiguravanja dostupnosti podataka i spriječiti njihovo gubljenje nekim oblikom redudancije. Postoje mnoge razine RAID-a od kojih svaka nudi različitu toleranciju na gubitak .
Sama RAID tehnologija potiče sa Barkeley-a, Sveučilište u Kaliforniji. Tijekom 1987, istraživači sa Barkeleya su se pitali kako skladištiti podatke jeftino, na više diskova, koji se predstavljaju kao jedan logički čvrsi disk . Pretpostavka je bila da je jedan veliki čvrsti disk skuplji od nekolicine manjih, te takođjer nudi manju toleranciju na propadanje. Ideja je bila pružiti rješenje koje će se sastojati od mnogo malih, jeftinih diskova, koji će dopuštati otkazivanje jednog ili više diskova. Pretpostavka osiguravanja mogućnosti ispadanja diska bez posljedica je bila logička raspodjela redudatnih podataka preko različitih diskova.
Tako za razliku od jednog velikog diska, RAID polje kombinira dva ili više fizičkih diskova koji tvore jedan logički disk. U usporedbi sa fizičkim diskovima, RAID polja često imaju znatno veću propusnost podataka, kao i znatno veći kapacitet spremanja podataka. Također, namjerna redudancija podataka povećava pouzdanost cijelog sustava, tako da je moguć ispad pojedinih komponenti, bez učinka na cijeli sustav. U modernijim sustavima je moguće zamijeniti čitave diskove, tijekom rada sustava, bez ometanja rada. Prednosti korištenja RAID polja su:
- Povećana sigurnost podataka (redudancija
- Povećan prijenos podataka
- Mogućnost kreiranja vrlo velikih logičkih diskova
- Uklanjanje pokvarenih diskova, bez narušavanja rada sustava
- Smanjenje troškova
RAID polja imaju mnoge implementacije i izvedbe. Tako poznajemo sljedeće razine RAID polja:
RAID razine - RAID 0
RAID 0 – RAID 0 / Striping predstavlja RAID polje koje ne ispunjava zahtjeve redudantnosti podataka. Poanta RAID 0 polja je isključivo povećavanje brzine pristupa i pisanja podataka. U takvom polju kombiniramo nekoliko diskova za pisanje podataka, gdje se pojedini dijelovi zapisuju na različite diskove. Tako postižemo veću brzinu. To je izvedeno pomoću dijeljenja datoteka u Strip-ove (naziv Striping) koji predstavljaju definiranu veličinu dijela datoteke. Svaki strip se zapisuje na drugi čvrsti disk. Ovakvo rješenje ne štiti od gubljenja podataka ali pospješuje brzinu čitanja.
Na sljedećoj slici vidimo primjer datoteka zapisanih u RAID 0 polju sa četiri diska. Veličina strip-a je 16KB, a veličine datoteka su :
- Crvena - 4KB
- Plava - 20KB
- Zelena - 100KB
- Roza - 500KB
Sa slike vidimo da će računalo moći čitati datoteku 4 sa sva četiri diska paralelno. RAID 0 zahtjeva minimalno dva diska, a podržano je maksimalno koliko to dopušta kontroler. Preporučena upotreba RAID 0 sustava je za ne kritične podatke, podatke koji se ne mijenjaju često, a postoji neki oblik back-upa, sustave kojima su potrebne visoke performanse kao što su grafički dizajn i igre.
--Dkostelac 16:37, 5. siječnja 2012. (CET)
RAID razine - RAID 1
RAID 1 polje obično je implementirano kao zrcaljenje podataka na diskovima. Tako poznajemo sinonime poput Mirroring ili Duplexing. Implementacija je obično izvedena sa dva različita diska koji su upareni sa hardware-skim ili software-skim RAID kontrolerom. Prednost ovakvog polja je zadržavanje istih podataka na oba diska. Tako u slučaju ispada jednog diska, svi podaci ostaju sadržani na drugom disku. Ilustracija zapisa datoteka iz prošlog slučaja je vidljiva na idućoj slici.
RAID 1 polje zahtjeva točno 2 diska, budući da se zrcaljenje odvija s jednog na drugi. Diskovi bi idealno trebali biti identične veličine, budući da je veličina polja zapravo veličina manjeg diska. Prednost ovog sustava je njegova visoka tolerancija na ispadanje, također, večina RAID kontrolera će podržavati hot-spare diskove i automatsku rekreaciju RAID polja. Neke od pozitivnih osobina RAID 0 polja su pozitivne i ovdje. Naime, budući da su svi podaci zapisani dvostruko, računalo ih može paralelno čitati. Tako je brzina čitanja jednaka 2X (gdje je X brzina čitanja jednog čvrstog diska). S druge strane, brzina pisanja je narušena zbog potrebe da se sve zapiše dva puta. Tako je brzina pisanja RAID 1 polja nešto manja od 1X. Sama RAID 1 izvedba je relativno skupa i ne nudi previše, budući da je cijeli jedan disk redundantan i ima najmanju efikasnost skladištenja podataka, u usporedbi sa ostalim RAID poljima. No, njegova jednostavna izvedba ga čini pogodnim za „kućne“ izvedbe. Osim toga, vrlo često je korišten u računovodstvu i financijama, budući da se „čvrsta“ kopija podataka smatra nečim opipljivijim od paritetnih podataka.
--Dkostelac 04:54, 6. siječnja 2012. (CET)
RAID razine - RAID 2
RAID 2 ne koristi tehnologije koje su poznate kod ostalih RAID razina (zrcaljenje, paritet i dijeljenje datoteka). Za razliku od ostalih strip RAID polja, RAID 2 koristi nešto slično dijeljenju datoteke s paritetom. Implementiran je podjelom datoteke na razini bita i širenjem na različite diskove koji sadrže podatke te na diskove koji sadrže redudantne podatke. Redundanti bitovi se računaju Hemmingovim kodovima, koji se također koristi u mrežama kao kod za ispravljanje pogrešaka prilikom mrežnog prijenosa. Tako se svaki put priliko zapisa podataka na disk računaju i bitovi koji će biti zapisani na redundante diskove. Prilikom svakog čitanja, pomoću tih bitova se provjerava i nepromijenjenost u podacima. Pogrešku u jednom bitu moguće je i ispraviti u samom radu. Na slici ispod vidimo arhitekturu RAID 2 polja. Arhitektura je pojednostavljena, budući da RAID 2 polje koristi znatno više diskova, ali je osnovna ideja tu.
Ono što je zanimljivo kod RAID 2 razine je da je ona jedina koja se ne koristi danas. Razlozi su mnogobrojni, ali je primaran i najočitiji – cijena. Naime, RAID 2 polje zahtijeva mnogo diskova, a sam RAID kontroler je kompliciran, stoga specijaliziran i skup. Zbog samog dijeljenja datoteke na razini bita, očito imamo i vrlo spore prijenose. Ovisno o implementaciji, RAID 2 polje tipično sadrži 14 ili čak 39 diskova. Osim toga, diskovi trebaju biti sinkronizirani u vrtnji. Konačno, perfromanse čitanja i pisanja su sve samo ne spektakularne. Zato se RAID 2 polje ne koristi.
--Dkostelac 04:54, 6. siječnja 2012. (CET)
RAID razine - RAID 3 i 4
RAID polje razine 3 koristi striping na razini bajta sa dediciranim paritetom. Podaci su podijeljeni tako da se zapisuju na različite diskove i s različitim veličinama. Informacije o paritetu podataka su poslane i zapisane na određeni paritetni disk. Tako se ispad svakog od diskova može tolerirati. Na slici desno vidimo tu arhitekturu.
Problem sa RAID 3 poljem je što paritetni disk predstavlja usko grlo RAID polja. Tako će se prilikom zapisa neke veće datoteke morati poduzeti dvije akcije :
- Distribuiranje datoteke preko diskova u RAID polju i
- Računanje i zapisivanje pariteta na paritetni disk
Očito gubimo mnogo vremena na zapisivanje svog rastavljanja na razini bajta, računanja pariteta i zapisivanja na određeni paritetni disk. Također, ješ jedan problem ove RAID izvedbe su relativno skupi kontroleri, te relativna neiskorištenost cijelog jednog diska.
S druge strane, RAID 3 polje trpi ispad jednog diska, te zbog više klase kontrolera obično posjeduje i Hot Spare te automatsku rekreaciju RAID polja u slučaju ispada. Također, jedna od iznenađujućih prednosti RAID 3 polja je odlična brzina zapisivanja sekvencijalnih podataka. Tako je RAID 3 preporučeno koristiti u poljima koja rade s velikim datotekama (multimedia).
RAID 4 polje koristi striping na razini bloka i dediciran paritet. Rastavljanje na razini bloka je prednost nad RAID 3 poljem. Osobine dopuštenog ispada, kapaciteta polja i efikasnosti zapisa ostaju iste.
--Dkostelac 04:58, 6. siječnja 2012. (CET)
RAID razine - RAID 5
RAID polje razine 5 koristi striping na razini bloka i distribuirani paritet. Predstavlja jednu od najpopularnijih implementacija RAID-a. Kao što možemo vidjeti, vrlo je sličan RAID 4 polju, osim što koristi distribuirani paritet. Distribuirani paritet se tako zapisuje preko tri ili više čvrstih diskova umjesto na specijalizirani paritetni disk. Tako je izbjegnuto usko grlo prisutno kod RAID 3 i RAID 4 polja. Tolerancija na ispade se osigurava tako da se svaki paritet bloka nužno sprema na disk koji nije isti onaj na kojemu je zapisan blok. Osim toga, RAID 5 omogućava različite primjenje promjenjivom veličinom bloka, ovisno o potrebama korisnika. Na sljedećoj slici vidimo implementaciju RAID 5 polja sa istim datotekama kao i u primjerima za RAID 1 i RAID 0.
RAID 5 zahtjeva minimalno tri diska u RAID polju te relativno skuplji kontroler. Neki OS-ovi nude software-sku podršku za ovu implementaciju RAID polja, ali uz ozbiljne nedostatke u performansama. Tolerira se ispad jednog čvrstog diska te su obično podržane Hot Spare opcije, kao i automatska rekreacija. Pisanje i čitanje na disk su obično vrlo dobri do izvrsni, zbog nedostatka potrebe za posebnim diskom za paritet.
Generalno se RAID 5 smatra najboljim kompromisom između dobrih performansi, dobre tolerancije na ispade i dobrog kapaciteta te iskorištenja prostora. Tako ga vrlo često vidimo u širokoj praksi, a osobito kao podršku ERP sustavima.
--Dkostelac 05:01, 6. siječnja 2012. (CET)
Usporedba RAID polja
U tablici ispod vidimo konačnu usporedbu RAID razina. Mogli bismo argumentirati kako je realizacija RAID polja skuplja ovisno o postignutim rezultatima. Npr. RAID 0 polje je relativno jeftino, ali nudi užasnu dostupnost podatka. Prateći 'zvjezdice' možemo reći kako je najbolji omjer cjene i kvalitete postignut u RAID polju 5 ili ugnježđenom RAID polju 01/10.
--Dkostelac 05:03, 6. siječnja 2012. (CET)
JBOD
JBOD (Just a Bunch Of Disks) je jedna od arhitektura diskovnih polja. U RAID poljima smo vidjeli agregaciju diskova koji podržavaju redundaciju kako bi se osigurala dostupnost podataka, u večini slučajeva čak i kada ispada pojedini disk. Međutim, čest je slučaj da se u pojedinom računalu nalazi više diskova koje iz ovog ili onog razloga ne želimo složiti u RAID polje (najčešći razlog pri tome je relativna cijena organizacije takvog polja – primarno RAID kontrolera).
JBOD je tako arhitektura koju moramo razlikovati od RAID polja. U suštini, JBOD je suprotnost od particioniranja naših diskova. Particioniranje primarno radi na tome da smanji diskove u manje logičke dijelove. S druge strane JBOD okrupnjava diskove koje imamo u veći logički disk. No, za razliku od RAID polja kod JBOD-a nema toleranicje na ispade, kao niti unaprjeđenje performansi.
Budući da u osnovi čak i RAID 0 nudi znatna unaprjeđenja performansi, pitanje je zašto bi koristili JBOD. Postoje dva osnovna razloga zašto bi koristili JBOD.
- Izbjegavanje gubitka prostora – JBOD nudi kombiniranje veličina diskova bez gubitaka. Tako će dva diska od 100 i 250 GB tvoriti jedan logički disk od 350GB. S druge strane RAID polje će najčešće tvoriti polje veličine manjeg diska, dakle 100GB.
- Lakše povraćanje podataka – Pod pretpostavkom ispada jednog diska, nisu izgubljeni svi podaci u JBOD polju, nego samo oni sadržani na takvom disku. Problem ovdje je da je nepoznatno koji podaci se nalaze gdje, zbog osobitosti pojedinog OS-a.
Vidimo da su prednosti JBOD-a zapravo minorne. Stoga se on uglavnom ne prakticira u stvarnosti.
--Dkostelac 05:06, 6. siječnja 2012. (CET)
MAID
MAID ili Massive Array od Idle Disks (MAID) je sustav diskova koji se sastoji od nekoliko stotina ili čak tisuća diskova koji se koriste za trajno skladištenje podataka. MAID sustavi imaju mnogo primjena ali su u osnovi dizajnirani za spremanje podataka koji se jednom zapišu, a onda vrlo rijetko čitaju. Osnovna ideja sustava je da što više smanji potrošnju energije budući da postoji vrlo malo zahtjeva za tim podacima, ali ih ipak treba posjedovati. Neke od osnovnih karakteristika MAID polja su:
- Vrlo visoka gustoća diskova u MAID arhitekturi – MAID diskovi su često nagurani u vrlo skučene uvjete. Poanta je da kontroleri u ovom polju često ograničavaju brzinu vrtnje diskova, ali i broj diskova koji se vrte u isto vrijeme. Tako je omogućeno da ti diskovi ne moraju biti hlađeni, te ih se može nagurati u vrlo male prostore. Samim time, aktivnije diskove imamo kamo smjestiti.
- Ograničeni broj diskova u uporabi – u MAID arhitekturi često imamo ograničenje na broj diskova koji se trenutno koriste. To je nekada čak i 25% diskova u polju. Takvo ograničenje donosi neke pozitivne stvari poput već spomenute prednosti da se diskovi ne moraju hladiti. Osim toga, uvijek jednak broj diskova u vrtnji osigurava manju potrošnju struje te svakako manju mogućnost oštećenja uslijed vibracija.
- Dugo dohvaćanje podataka – MAID diskovi često imaju mali broj okretaja u minuti te tako pristup podacima traje i do desetak sekundi.
Osnovno polje korištenja ovakvih polja je u poduzećima koja moraju čuvati arhive podatka dugo vremena. Neki od primjera takvih podataka su stari financijski podaci i slično. Također, slična rješenja implementiraju i internetski servisi za skladištenje fotografija, budući da je analizama utvrđeno da korisnici svoje fotografije pregledavaju nekoliko puta, a onda sve rjeđe i rjeđe, ako ne i nikada više. Međutim, te arhitekture su znatno složenije i predstavljaju cijeli sustav servera koji se brine o promoviranju i degradiranju podataka kroz mrežu servera.
--Dkostelac 05:08, 6. siječnja 2012. (CET)
Mrežna spremišta podataka i njihova organizacija
DAS
DAS predstavlja akronim za Direct-Attached storage. Za razliku od SAN ili NAS mreža kod DAS tehnologije teško možemo govoriti o mrežnom spremištu podataka. DAS se odnosi primarno na digitalno skladištenje podataka koje je direktno priključeno na neki server ili radnu stanicu gdje ne postoji mreža između računala. Možemo reći da je arhitektura DAS sustava vrlo jednostavna. Ona podrazumijeva spremišta podataka koji su direktno priključeni na neko računalo, te se mogu dijeliti posredstvom tih računala. Primjer takve arhitekture vidimo na slici ispod:
Spremitšte podataka u kontekstu DAS arhitekture može biti bilo koji uređaj za skladištenje podataka, kao što je ormar sa diskovima ili jedan disk sadržan u klijentskom računalo. Poanta DAS skladištenja je da ne postoje mrežne karakteristike povezivanja između samog uređaja za skladištenje podataka i „klijentskog računala“. Tako na slici vidimo jedno klijentsko računalo koje je spojeno na DAS storage box, te dva servera koja su spojena na pojedinačne uređaje. Bitno je primjetiti postojanje Ethernet usmjerivača koji ne služi spajanju samog DAS uređaja, već komunikaciji računala koja su spojena na DAS uređaje. Dakle, u DAS arhitekturi ne postoji direktan pristup spremištima podataka, već je on izveden kroz eventualno dijeljenje kroz računala.
Nedostaci takve arhitekture su očiti. Čest je termin „informacijski otoci“ kada govorimo o DAS skladištenju. Ukoliko nije direktno omogućeno, drugi serveri i/ili klijenti ne mogu pristupiti podacima koji su sadržani na DAS uređajima.
S druge strane, budući da je to vrlo raširen i poznat koncept, mada možda nismo svjesni njegovog postojanja u našim računalima, očito je kako je inicijalni trošak postojanja minimalan, kao i kasniji troškovi održavanja i slično.
--Ikudeljnj 05:23, 6. siječnja 2012. (CET)
NAS
Općenita arhitektura
NAS predstavlja akronim za Network-Attached Storage. NAS arhitektura skladištenja podataka je računalno skladište podataka koje je priključeno u mrežu. Svojim mrežnim osobinama dopušta pristup različitim klijent računalima koji su na neki način priključeni u mrežu. Jedan od primjera bi bila kućna mreža koja sadrži nekoliko računala (desktop, laptop) koji su povezani u LAN mrežu usmjernikom. NAS uređaj se tako priključuje u LAN mrežu ravnopravno s ostalim računalima, te mu ostali klijenti mogu pristupiti, gdje su klijenti potencijalno na različitim operacijskim sustavima i slično. Na slici vidimo ilustraciju jedne takve mreže. Tri klijenta i dva servera su međusobno umreženi u lokalnu mrežu ethernet usmjernikom. Na usmjernik je također priključen i NAS server. Ta računala tako mogu dijeliti podatke.
NAS skladišta podataka postoje još od osamdesetih godina prošlog stoljeća, ali svoju popularnost stiču tek nedavno. Naime, uočeno je kako je NAS skladištenje podataka iznimno prikladna metoda ne samo skladištenja podatka, već i pristupanja podacima s različitih računala. Ta prednost dolazi iz različitosti s podatkovnim serverima. Naime, umjesto da se NAS skladišta postavljaju na npr. desktop računala ili servere opće namjene, oni se često izgrađuju kao specijalizirana računala koja služe isključivo NAS realizaciji. Tako se znatan dio potrebne infrastrukture NAS mreže može riješiti u samom hadrware-u računala. Takva računala često imaju sljedeće osobine :
- Velike diskove
- Relativno jeftine ostale komponente
- Ne zahtjevaju periferne jedinice
- Troše malo energije
Prednost takvog pristupa je uklanjanje potrebe da centralni serveri poslužuje podatkovne zatheve. Tako uviđamo i prednosti NAS arhitekture:
- Olakšana administracija pristupa i prava
- Jednostavnije postavljanje usluge
- Decentralizacija podataka
- Redudantnost podataka
- Lako postavljanje RAID polja
- Brži pristup podacima
- Neovisnost o operacijskom sustavu i mrežama pristupa
--Ikudeljnj 05:26, 6. siječnja 2012. (CET)
Protokoli za komunikaciju s klijentima
Osobito bi trebali promotriti točku sedam iz prethodnog razmatranja. Naime, budući da NAS uređaji često vrte neki LINUX / UNIX operacijski sustav, potrebno je organizirati pristup podacima sa Windows ili Mac računala. Takav pristup se rješava mrežnim protokolima za dijeljenje podataka. Ti protokoli su:
- NFS
- SMB/CIFS
- AFP
- rsync
NFS – Network File System protocol (NFS) razvijene je od strane Sun Microsystem-s. Odmah je prihvaćen kao standard za UNIX servere. Njegova implementacija izvedena je kroz korištenje RPC protokola, koji je dizajniran da podržava pokretanje procedura s udaljenosti. Njegove osobine su slične onima RPC protokola, budući da je sto stateless te RRP (request-reply protocol) često ima vrlo loše performanse na mrežama širokog raspona. Najbolje performanse se ostvaruju na manjim ili srednjim LAN mrežama.
SMB/CIFS - Server Message Block (SMB) protokol je mrežni protokol za dijeljenje podataka. Implementirao ga je Microsoft te je samim time i poznat kao MicrosoftSMB. SMB je tako standardni dio MS Windowsa i pruža podršku za dijeljenje podataka preko mreže na Windows pokretanim računalima. SMB protokol može imati različite setove naredbi koje zovemo dijalekti. CIFS (Common Internet File System) je tako jedan od dijalekata SMB protokola. Osim Windows računala, koristi se i na nekim LINUX računalima. Za razliku od NFS protokola koji je Stateless protokol, SMB podržava i:
- Pregovaranje dijalekta
- Pronalaženje drugih SMB uređaja i pretraživanje mreže
- Print preko mreže
- Autentifikacija na razini datoteke i direktorije
- Zaključavanje direktorija i datoteka
- Praćenje promjena
AFP – Apple Filing Protocol je protokol za komuniciranje sa Apple datotečnim serverima. AFP je nasljednik AppleTalk protokola.
rsync - Rsync je alat koji služi kopiranju podataka preko mreže ili lokalno. Prednosti su mu brzina i svestranost. Najčešća uporaba rsynca je za sigurnosne pohrane podataka i zrcaljenje podataka. Jedno od najvažnijih obilježja rsync-a je njegov lqquic checkrq algoritam. Taj algoritam provjerava datoteke za promjenu u veličini i/ili last-modified tag-u. Upotrebom tog algoritma rsync efektivno smanjuje broj svakog prijenosa podataka tako da izbjegava kopiranje podataka koji se nisu promjenili od zadnjeg prijenosa. Ostale prednosti su:
- Podrška za kopiranje poveznica, uređaja, vlasnika, grupa i ovlaštenja
- Uključi i isključi-iz opcije
- Ne zahtjeva SU privilegije
- Uporaba cjevovoda za smanjivanje latencije
--Ikudeljnj 05:30, 6. siječnja 2012. (CET)
NAS OS
Kao što smo već rekli, NAS se najčešće realizira preko NAS jedinice, odnosno NAS servera. Mada je arhitektura NAS servera prilično slična običnom serveru, često nije u potpunosti prilagođena da bude server opće namjene. Također, za NAS jedinice su izrađeni i posebni OS-ovi koji služe primarno jednostavnom radu s podacima. Primjer takvog OS-a su:
- FreeNAS
- Darma NAS OS
- unRaid
- EON
Oni posjeduju različite osobine i implementacije načina kako NAS funkcionira. Primarni interes prilikom odabira OS-a su svakako:
- Brizna pisanja i čitanja
- Kvaliteta kompresije
- Sigurnost podataka
- Organizacija podataka
Primjer jednog testa brzine pisanja i čitanja različitih OS-ova na istoj konfiguraciji možemo pronaći na slici ispod:
--Ikudeljnj 05:31, 6. siječnja 2012. (CET)
Datotečni sustavi
U nastavku ovog poglavlja ćemo promotriti datotečne sustave i što oni omogućavaju a spefifični su za NAS uređaje. Datotečni sustavi naranvo ovise o vrsti i distribuciji OS-a koji se nalazi na određenoj NAS jedinici. Zato ćemo promotriti datotečne sustave koje podržava FreeNAS OS. Važnost razmatranja datotečnih sustava koje podržavaju NAS uređaji potiče iz činjenice da su oni često specijalizirani za skladištenje podataka.
ZFS
ZFS je datotečni sustav koji je osmislio i implementirao SunMicrosystems tijekom 2004. Godine. ZFS je akronim za Zettabyte File System. Osnovna ideja ZFS-a je kombiniranje datotečnog sustava i upravljanja logičkim cjelinama. Osim toga ZFS uključuje :
- Verifikaciju integriteta podataka
- Podršku za velike diskove
- System Snapshot
- Copy-on-Write
- Raid-Z
Verifikaciju integriteta podataka – predstavlja osobito važan dio ZFS datotečnog sustava. Integritet podataka je jedan od najvažnijih razloga zašto je ZFS dizajniran od nule, za razliku od ostalih modernih datotečnih sustava. Naime, uočeno je da se ostali datotečni sustavi, kao niti alternativna rješenja poput RAID polja, ne mogu efektivno boriti sa gubitkom integriteta podataka koji potiče iz raznoraznih izvora. Integritet podataka je u ZFS datotečnom sustavu postignut korištenjem kontrolnih zbirova (Checksum-a) kroz cijelo datotečno stablo. Zbirovi se spremaju na odvojene lokacije od samog podatka, tako da postoje kopije koje provjeravaju ispravnost podataka. Odvojeni kontrolni zbirovi tvore Markle-ovo stablo. Jednom kada postoji zahtjev za nekim podatkom, on se provjerava nasuprot kontrolnog zbira te u slučaju neispravnosti, mijenja sa nekom redundantnom kopijom (ukoliko ona postoji).
Podršku za velike diskove – ZFS datotečni sustav podržava „Storage Pools“. To znači da ZFS konstruira virtualnu, logičku jedinicu za skladište podataka koju naziva zpools. Svaki uređaj u Zpool-u predstavlja virtualizaciju jednog blok uređaja (datoteka, particija, cijeli disk). Osim toga, ZFS je 128-bitni datotečni sustav. Tako može adresirati mnogo više podataka od NTFS datotečnog sustava. ZFS tako podržava više zapisanih podataka nego što se u teoriji može pohraniti.
System Snapshot – predstavlja trenutnu sliku stanja operacijskog sustava na razini datotečnog sustava. Slika koja je stvorena u svakom datom trenutku nema veličinu sama po sebi, nego se ona povećava sa promjenama datoteka i zapisima novih datoteka. Premda slikama sustava nije moguće pristupiti na razini samog datotečnog sustava, definirane su akcije tipa roll-back, restore i slično.
Copy-on-Write
RAID –Z –nije po strogoj definiciji RAID polje, kao što je to na primjer RAID 1 polje. No ipak adresira dva temeljna nedostatka RAID polja:
- RAID rupe u pisanju
- Uzastopne provjere pariteta na datotekama manjim od veličine stripe-a.
RAID-Z je vrlo sličan RAID 5 polju. Koristi striping i dinamičan paritet. No, unaprjeđuje ga sa dinamičkim veličinama stripova. Tako nikada neće postojati prostor koji nije popunjen jer je datoteka manja od stripa. Ovdje treba naglasiti da dinamička veličina stripova ne znači da korisnik može odrediti veličinu stripa na razini logičkog diska, već da se OS, odnosno datotečni sustav brine da je svaki stripe velik kao i datoteka. Rješenje problema je zapravo vlo očito, ali ne može funkcionirati na razini hardwarea, osobito u konjukciji s RAID poljem druge vrste. Zato je RAID-Z nužno inkorporiran u datotečni sustav pojedinog OS-a. Postignuća RAID Z-a su dakle:
- Podaci koji se sami popravljaju, što znači na razini bloka, kao i cijelog logičkog diska
- Ne traži nikakavu posebnu računalnu opremu.
--Ikudeljnj 05:35, 6. siječnja 2012. (CET)
Ostali
Osim ZFS-a podržani su i mnogi drugi datotečni sustavi koje ovdje nećemo pregledavati u velike detalje jer su unaprijed poznati. Tu imamo:
- UFS – Unix File System je datotečni sustav primarno stvoren za UNIX operacijske sustave. Posjeduje hijerarhijsku strukuru sa / direktorijem u korijenu. / direktorij tako sadrži sve ostale direktorije. Također, u Unixu-u se sve smatra datoteku, uključujući i disketne jedinice, CD/DVD uređaje, itd. U pravilu UFS se koristi i u sustavima sličnim UNIX-u poput Linux-a. No, on se u današnje vrijeme koristi kao podloga za legacy software, budući da je esencijalno zastario i zamijenio ga je ext2 i slični datotečni sustavi.
- NTFS – „NTFS (New Technology File System) datotečni sustav. Poboljšava sigurnost, omogućavajući šifriranje datoteka i mapa te ograničavanje pristupa datotekama. Najmanja dostupna jedinica za upis također je klaster. Podaci o datoteci čuvaju se u MFT (Master File Table) tablici u kojoj su svi njeni potrebni atributi. Podrazumna veličina klastera NTFS sustava također ovisi o veličini volumena. Jedna od pogodnosti NTFS sustava je formatiranje particije (volumena) s klasterom veličine po želji i veći broj atributa koji se mogu pridružiti datoteci, ali je najvažnija razlika u odnosu na FAT što je NTFS 'journaling' tip operativnog sustava, odnosno mogućnost samooporavka po nasilnom isključivanju računala. Zapisi o promjenama tijekom rada indeksiraju se i popisuju u JOURNALU na osnovu čega se potom promjene upisuju u datoteke te se sprječava gubitak podataka i oštećenje datotečnog sustava.“.
--Ikudeljnj 05:37, 6. siječnja 2012. (CET)
S.M.A.R.T.
Self-Monitoring, Analysis and Reporting Technology (SMART) tehnologija je računalni sustav praćenja rada čvrstih diskova u računalima kako bi uvidjeli postojeće greške u radu i eventualno sprječili konačne fatalne ispade.
S.M.A.R.T. (u daljnjem tekstu SMART) se uglavnom implementira kao hardware kontroler u samom čvrstom disku. No, operativni sustav mora podržavati SMART tehnologiju i primati upozorenja od čvrstog diska. Naravno postoje slučajevi u kojima se ispad ne može predvidjeti. Primjer takvog ispada je nepropisno rukovanje (op.a. kada disk ispadne na pod) i slično.
SMART tehnologija koristi sljedeće podatke kao moguće razloge za upozorenje na postojeći problem :
- Visina leta glave čvrstog diska – ukoliko visina lebdenja glave pada s vremenom, to može biti znak za probleme.
- Broj pogrešaka i korištenja ECC-a – ukoliko se ECC algoritam često koristi, postoji mogućnost pogreške na čvrstom disku
- Temperatura – porast temperature u pravilu znači da se nešto loše događa s motorom
- Propusnost podataka – smanjenje propusnosti je upozorenje na problem
--Ikudeljnj 05:38, 6. siječnja 2012. (CET)
iSCSI
S SCSI protokolom smo upoznati i znamo da je mapiran preko mnogo medija prijenosa, kao što su SCSI, IPI, IEEE-1394. Ovi načini prijenosa su I/O specifični i imaju limitirane funkcionalnosti preko većih udaljenosti.
Tako iSCSI (Internet Small Computer System Interface, iSCSI) protokol definiramo kao način slanja SCSI paketa preko TCP/IP protokola. iSCSI tako pruža interoperabilno rješenje koje koristi postojeće prednosti trenutne infrastrukture interneta kako bi doskočio nedostacima SCSI-a.
iSCSI je razvijen od strane IETF-a, s ćije stranice smo i preuzeli prijašnju definiciju. Osnovna ideja je bila koristiti IP mreže (internet) kako bi pospješili prijenos podataka preko većih udaljenosti od obične LAN mreže. Tako je iSCSI jedna od vrlo važnih tehnologija u NAS i SAN mrežama. Kažemo da iSCSI služi prijenosu podataka preko WAN-ova (široke mreže) i interneta te omogućuje prijenos podataka neovisan o udaljenosti.
U iSCSI protokolu, kada krajnji korisnik pošalje zahtjev, operativni sustav generira prikladne naredbe koje poznajemo i u SCSI protokolu. Za razliku od prenošenja na lokalni vod, kao kod SCSI protokola, iSCSI enkapsulira zahtjev za IP prijenos. Pakete je moguće i enkriptirati, ukoliko se to pokaže potrebnim.
Jednon kada je paket primljen na drugoj strani (koristeći standardnu ISO OSI arhitekturu interneta), dekriptira se, i rastavlja na zaglavlja te korisni payload. Payload je u ovom slučaju zahtjev i SCSI naredbe. SCSI naredbe se prosljeđuju SCSI kontroleru i potom SCSI skladištu podataka (čvrsti disk).
SCSI skladište dostavlja potrebne podatke i budući da je iSCSI protokol dvosmjeran, odgovoara na zahtjev. iSCSI je jedan od glavnih protokola za prijenos skladištenih podataka preko IP mreža. Alternativa mu je FCIP (Fibre Channel over IP) protokol. FCIP koristi sličan princip da prenosi kodove i podatke u IP pakete preko geografski udaljenih FCIP SAN-ova. Problem ove konkurencije, što ide u korist iSCSI-u je da FCIP isključivo koristi Fibre Channel tehnologije, samim time, ovisan je o mediju. Dakle, za razliku od iSCSI-a ne koristi trenutnu infrastrukturu interneta, nego zahtjeva izdvojenu implementaciju.
--Ikudeljnj 17:06, 6. siječnja 2012. (CET)
iSCSI koncepti
Sada kada smo svjesni generalnog funkcioniranja iSCSI protokola pogledajmo neke od važnijih oznaka sudionika i načina prijenosa u jednoj iSCSI transakciji. One su sve definirane u [RFC3720] dokumentu koji je i javno dostupan.
- Inicijator (SCSI inicijator) – iSCSI inicijator predstavlja stranu koja inicira, odnosno započinje „razgovor“. Samim time, sukladno tradiciji mrežnih tehnologija, automatski mu dodjeljujemo i ime iSCSI klijenta. Inicijator generira neki zahtjev koji SCSI kontroler treba obraditi i dostaviti podatke. Kao što smo već napomenuli, temeljna razlika kod iSCSI incijatora je posebitost da se naredbe i podaci enkapsuliraju u IP datagram i šalju kroz mrežu.
- Meta (SCSI Target) – iSCSI meta predstavlja odredišni skladišni resurs koji je lociran na serveru na koji iSCSI inicijator upućuje. iSCSI meta je tako najčešće neka određena skladišna jedinica ili disk.
- SCSI naredba – predstavlja temeljni SCSI podatkovni segment. Njegov detaljan opis vidimo na slici ispod:
- SCSI – iSCSI mapiranje – predstavlja način na koji se SCSI upiti pretvaraju i iSCSI protokol. Opis vidimo na slici ispod.
--Ikudeljnj 17:10, 6. siječnja 2012. (CET)
SAN
SAN ili Storage Area Network je po definiciji tip LAN mreže koja je dizajnirana da podnosi velike količine prijenosa podataka. SAN tehnologija je slična ali i različita od NAS tehnologije. Razlika leži primarno u protokolima odvijanja protoka podataka. U NAS mrežama se prijenos odvija primarno TCP/IP prijenosom, što olakšava kućnu uporabu. S druge strane SAN mreže koriste mrežne protokole niske razine . Arhitektura SAN mreže izgleda ovako:
SAN mreže najčešće koriste SCSI (Small Computer Storage Interconnect) i FC (Fibre Channel) protokole da presele podatke preko mreže i smjeste ih na diskove u obliku blok podataka. Arhitektura podrazumjeva mnogo uređaja za spremanje podataka koji su međusobno povezani i tako dijele svoje podatke. Na slici vidimo LAN mrežu klijenata koja je preko servera spojena na mrežu SAN uređaja. Ti uređaji su na slici prikazani kao uređaji u blizini jedan drugoga. U praksi je to i često slučaj. Najčešće SAN mreže prepoznajemo kao gomilu SAN jedinica u pojedinoj sobi. Međutim, osnovna arhitektura i komunikacijske osobine SAN mreže dopuštaju i disperziju SAN jedinica preko udaljenosti.
--Ikudeljnj 05:39, 6. siječnja 2012. (CET)
Sigurnost skladištenih podataka
Sigurnost podaka u računalnom smislu je praksa osiguravanja podataka od neovlaštene promjene sadržaja te pristupanju istom. Promjena se može dogoditi ili neautoriziranim pristupom podacima korisnika, nekim kvarom ili nekom trećom silom koja utječe na podatke.
Kako bi pokazali važnost sigurnosti uskladištenih podataka prikazati ćemo jednu statistiku iz 2005. g. Tablica ilustrira neke od prijavljenih incidenata koji su zabilježeni tokom te godine. Također, u krajnjem desnom stupcu vidimo i broj korisnika na koje je propust utjecao.
Vidimo da je okviran broj osoba na koje su utjecali različiti sigurnosni propusti oko 52.000.000. Stručnjaci govore da je ovih 10 navedenih slučajeva zapravo svega 20% stvarnog broja. Naravno, po pretpostavci, taj broj će samo i rasti.
Definiramo nekoliko osnovnih zahtjeva prilikom razmišljanja o podatkovnoj sigurnosti. Oni su redom :
- Tajnost
- Integritet
- Dostupnost
Gdje tajnost predstavlja zahtjev da podaci koji su u vlasništvu jednog korisnika i obilježeni su kao privatni takvi i ostanu. Integritet predstavlja zahtjev da podaci ostanu u jednakom stanju, osim u slučaju da ih korisnik sam ne mijenja, a dostupnost zahtjev da su podaci dostupni na traženje korisnika.
Postoje brojne mjere koje na ovaj ili onaj način osiguravaju jedan, više ili sve ove zahtjeve u podatkovnoj sigurnosti, stoga ćemo ih u nastavku ovog poglavlja razmotriti.
Ali prvo, razmotrimo neke realne prijetnje. Oracle u svojem dokumentu Oracle9i Security overview definira sljedeće rizike za naše uskladištene podatke.
Vidimo da svaki od ovih sigurnosnih prijetnji krši neke od zahtjeva koje smo postavili. Očit primjer je da neautoriziranim korisnicima mora biti zabranjen pristup podacima. Stoga koristimo autentifikaciju i slično. Budući da se u ovom radu primarno bavimo skladištenjem podataka, nećemo u detalje analizirati sigurnosne aspekte pristupanja podacima, već samu razinu podataka.
--Ikudeljnj 05:40, 6. siječnja 2012. (CET)
Enkripcija diska
Enkripcija diska može se realizirati na razini očvrsja računala, kao i programskom podrškom. Primarni cilj enkripcije diska je tako enkriptirati svaki pojedini bit podatka koji je sprema na disk računala.
Osim enkripcije diska poznajemo i enkripciju na razini datotečnog sustava, s njom se srećemo gotovo svaki dan. Vrlo je važno shvatiti da su te dvije enkripcije sve samo ne međusobno isključive. Naime, enkripcija diska podrazumijeva (u pravilu) korištenje jednog tajnog ključa za cijeli disk. Tako bi napadač, ukoliko dobije pristup računalu prilikom rada, imao otvorena vrata cijelom disku. Ovdje je preporučljivo koristiti alate koji koriste drugačije ključeve za različite particije ili druge logičke cjeline. Također, nije loša ideja povrh toga koristiti i enkripciju na razini datotečnog sustava.
Neke od prednosti enkripcije diska su:
- Korisnik se ne mora brinuti je li kriptirao pojedinu datoteku, odnosno korisnik je zaštićen ukoliko zaboravi kriptirati pojedine datoteke.
- Uništavanje tajnog ključa uništava sve podatke, što osigurava tajnost u budućnosti
- Praktički cijeli disk je enkriptiran, što osigurava vrlo malo prostora za napade.
--Ikudeljnj 17:19, 6. siječnja 2012. (CET)
Backup
Backup je operacija koja je zamišljena da spriječi gubitak podataka redudantim kopiranjem podataka. Cilj backupa je stvoriti kopije podataka koji su nam važni kako bi ih u slučaju gubitka mogli povratiti u orginalno stanje. Jedan od najosnovnijih principa backupa je ručno kopiranje s lokacije na lokaciju. Naravno, takav pristup je zahtjevan i vremenski i prostorno. Stoga najčešće koristimo neki oblik programske podrške za izvođenje backup operacije. Definiramo četiri različita načina backup-a.
- Potpuni backup – predstavlja ishodišnu točku svih ostalih tipova backupa. Funkcionira na način da se odabrane datoteke i direktoriji kopiraju na sigurnu lokaciju. Idejno bi bilo idealno uvijek raditi potpune backupe. Razlog koji stoji iza toga je da se takav backup najlakše povrati u prvotno stanje. No, naravno, postoji i problem. Naime, prilikom korištenja potpunog backupa gubimo mnogo vremenena da svaki put kopiramo sve podatke na sigurnu lokaciju. To nije toliko izražen problem ukoliko se radi o svega nekoliko MB ili stotina MB podataka, ali u slučaju mnogo GB već imamo problem. Osim toga, zadržavanje svake potpune kopije podataka raste s vremenom, tako da je svaki put kopija znatno veća.
- Inkrementalni backup – Inkrementalni backup započinje sa jednim potpunim backupom. Ova prva promjena snima trenutno stanje podataka. No, za razliku od potpunog backupa, idući put kada se backup izvršava dohvaćaju se samo podaci koji su noviji od posljednjeg backupa. Tako je svaki idući backup inkrement prijašnjeg. Za razliko od ostalih tipova backupa, inkrementalni ima vrlo brz proces backupa i čuva prostor. S druge strane, relativno je sporo za povrat podataka, te je relativno teško pronači točan podatak (odnosno njegovu verziju u vremenu).
- Diferencijalni backup – je u osnovi vrlo sličan inkrementalnom. Razlika je što diferencijalni skladišti sve podatke koji su različiti od prijašnjeg backupa. Tako stvara „verzije“ podataka u vremenu koje možemo koristiti. Ovakav backup koristi i Apple-ov TimeMachine kako bi dostavio dojam pregleda datoteka kroz vrijeme. Jedan od nedostataka ovog principa je što backup podaci mogu doseći i orginalnu veličinu potpunog backupa – tako nepotrebno trošeći prostor.
- Backup zrcaljenjem – u osnovi identičan potpunom backupu. Razlika je da se zrcaljenje ne sažima kao što je često slučaj kod potpunog backupa. Ovakva realizacija se primarno nalazi u RAID poljima i služi trenutnom povraćanju podataka u slučaju problema.
Na sljedećoj slici vidimo usporedbu karakteristika backupa:
--Ikudeljnj 17:20, 6. siječnja 2012. (CET)
Cijena skladištenja podataka
Prilikom odabira medija i načina skladištenja naših podataka od izuzetne važnosti je uzeti u obzir mnogo faktora. No ipak, očito je kako najveći dio odluke pada upravo na cijenu pojedine implementacije. Ono što je pogrešno vjerovati je da je najvažniji faktor u cijeni trenutna investicija, odnosno cijena same opreme i slično. Vrlo je važno ocijeniti koji su faktori u dugoročnom poslovanju. Zato uvodimo pojam TCO (Total Cost of Ownership over time). TCO predstavlja sumu svih direktinih i indirektnih troškova u životnom vijeku poslovanja neke ekonomske jedinice. Osim početnih troškova tako ćemo u TCO uključiti i sljedeće (naborajni su neki od najvažnijih) faktore :
- Prilagodba opreme
- Troškovi osposobljavanja osoblja
- Troškovi održavanja opreme
- Troškovi energije za opremu
- Troškovi prostora za opremu
- Konačni troškovi odlaganja opreme
Tijekom 2006. godine The Enterprise Strategy Group (ESG) provodi istraživanje koje je trebalo utvrditi kolika je cijena pojedine tehnologije za skladištenje podataka. Zadani su parametri bili:
- Veličina – 12TB
- Mogući porast dnevnog prometa – 8GB
- Broj upita po danu – 2500
Rezultati su analizirani tijekom tri godine, uzevši u obzir sve moguće troškove koje smo naveli i gore. Rezultat je sljedeći graf koji prikazuje cijene nekoliko tehnologija, s obzirom na različite aspekte troškova pojedine tehnologije. Tako vidimo cijene za optičke medije (DVD, UDO), vrpce (LTO3) te čvrste diskove (Centera).
Rezultati grafa su zapravo prilično jednostavni. Očito je kako Optički mediji uvjerljivo prethode kolonu. Osobito je zanimljivo da imaju jednako niske inicijalne troškove kao i one latentne. Vrpca (LTO3) je u sličnom cjenovnom rangu. Međutim, moramo primjetiti kako je inicijalan trošak kupnje opreme zapravo duplo veći od Blu-Ray tehnologije. Također, vidimo i jednu zanimljivost kod rješenja s čvrstim diskovima. Naime, rješenje sa zrcaljenjem ima dvostruku veću inicijalnu investiciju u opremi.
Pitanje je naravno, kako to da danas ipak vidimo čvrste diskove kao rješenje u večini poduzeća. Stvar je tome da je u posljednjih pet godina otkada je provedeno to istraživanje, broj kompanija koje posluju većim dijelom preko interneta naglo porastao. Takve kompanije zahtjevaju visoku propusnost podataka prema korisniku, kao i visoku brzinu zapisivanja podataka. Očit je problem s korištenjem ostalih medija u ovom slučaju.
Tako je zapravo vidljivo da je najisplativija opcija korištenje optičkih medija, ali to naravno uvelike ovisi o samoj prirodi poduzeća. Budući da je istraživanje provedeno u financijskom sektoru, koji ne pretpostavlja nužnu brzinu transakcija, vidimo da to i je najoptimatlnije rješenje u tom slučaju.
--Ikudeljnj 05:45, 6. siječnja 2012. (CET)
Projektni rad
Kao praktični dio ovog projekta napraviti ćemo jedan NAS server koji će posluživati datoteke Windows i Linux računalima. Budući da se nadamo ostvariti i neke multimedijalne funkcionalnosti, ali i VPN mrežu koristiti ćemo Ubuntu Server. Za realizaciju ovog projekta koristimo :
- Ubuntu server 11.10
- Hamachi Linux 0.9.9.9-20
- Hamachi Windows 2.1.0.1234
- OpenSSH Server
- Putty v0.60
Za početak stvaramo računalo koje posjeduje sljedeće karakteristike:
Dodali smo pet diskova na SCSI kontroler kako bi mogli kasnije konfigurirati RAID polje. Disk za OS ima preporučenu veličinu 8GB, dok su ostali diskovi redom veliki 40GB što će po pretpostavci biti dobovoljno za primjer. Možemo započeti s instalacijom. Početni koraci su jednostavni, kao odabiranje jezika i lokacije.
Prilikom upita o automatskom particioniranju izabiremo ručno podešavanje. Vidimo sljedeći zaslon:
Ovdje definiramo željene diskove kao RAID fizički prostor. Potom koristimo opciju konfiguriraj RAID i sljedimo korake:
- Stvori novi MD pogon
- Odaberemo RAID5
- Broj uređaja za RAID5 – 3
- Hot Spare uređaja 2
- Odaberemo particije koje želimo koristiti
- Kliknemo na završi.
Ubuntu automatski formatira daljnje particije.
Instalacija se nastavlja dalje i definiramo osnovni korisnički račun. Potom smo upitani želimo li unijeti proxy. U ovom slučaju nam to nije bilo potrebno, ali je svakako poželjno ukoliko ga stvarno i koristite.
Instalacija potom dalje slijedi uobičajan slijed, dovoljno je samo pratiti recommended opcije. Jednom kada je dovršena, sustav nas moli da ukonimo instalacijski pogon i izvršava reboot računala. Konačno, vidimo sljedeći zaslon:
Potrebno je logirati se sa korisničkim računom kojega smo definirali prilikom instalacije. Nakon Logina smješteni smo u vlastitu korijensku mapu, koja je montirana za trenutnog korisnika.
Za početak koristimo ifconfig da provjerimo status mrežnih adaptera.
ifconfig
Budući da će nam trebati direktan pristup routeru, odnosno IP formata 192.168.1.xxx potrebno je u postavkama virtualnog stroja promijeniti tip veze. Ona je trenutno postavljena na NAT. Zato postavljamo sljedeće postavke:
Potrebno je virtualni stroj ponovno pokrenuti:
sudo reboot
VAŽNO! Prilikom rada na UbuntuServeru, gotovo sve što radimo mora biti s prefiksom SUDO, kako bi osigurali ovlasti za izvršenje radnji. Ponovno koristimo naredbu za pregled NIC sučelja.
ifconfig
Vidimo da je sada eth0 adapter s IP adresom tpa 192.168.1.xxx.
Idući korak je instalirati SSH server kako bi mogli raditi sa serverom iz ugodnije okoline. Koraci su:
sudo apt-get install openssh-server
Jednom kada je SSHServer instalrian, moguće je koristiti neki SSH klijent za remote access na računalo. Sada virtualni stroj možemo minimizirati.
Odabiremo SSH klijent po želji. U ovom slučaju koristimo PuTTY klijent jer je lagan za korištenje i besplatan. Konfiguracija je jednostavna, potrebno je samo unijeti IP koji ste pročitali u ifconfig naredbi.
Kliknemo na Open i unesemo korisničke podatke, kao i kod prijavljivanja na server.
Za početak potreban nam je način za komuniciranje sa Windows računalima. Za to koristimo SAMBA servise. Sambu smo mogli unaprijed instalirati tijekom instalacije, ali ovako pokazujemo kako to učiniti unutar OS-a. Koristimo:
sudo apt-get install samba
Ukoliko želimo editirati samba konfiguraciju, to možemo učiniti naredbom:
sudo nano /etc/samba/smb.conf
Sada ćemo nadograditi i ažurirati sve pakete na računalo naredbama :
sudo apt-get update sudo apt-get upgrade
Također, kako bi osigurali da virtualni stroj ima uvijek isti IP u lokalnoj mreži ćemo napraviti statični IP za računalo. Za početak kopiramo konfiguracijsku datoteku za sučelja:
$ sudo cp /etc/network/interfaces /etc/network/interfaces.orig
... a zatim i editiramo konfiguracijsku datoteku:
$ sudo nano /etc/network/interfaces
Ovo je orginalna konfiguracija:
A mi želimo napraviti sljedeće:
Definirali smo statično IP sučelje, koje nije prepušteno DHCP-u. Podaci su isti za sve, osim IP adrese naravno.
Kada smo završili s editiranjem, pospremimo promjene i ponovno pokrenemo mrežu.
$ sudo /etc/init.d/networking restart
Sada smo posložili mrežne postavke. Idući korak je konfigurirati Samba servis. Kao što smo rekli, sve što trebamo konfigurirati tamo nalazi se u smb.conf datoteci. Prvo napravimo kopiju.
$ sudo cp /etc/samba/smb.conf /etc/samba/smb.conf.orig
Stvorit ćemo dva direktorija koja dijelimo:
$ sudo mkdir /home/javno $ sudo chmod 777 /home/javno/ $ sudo mkdir /home/zajednicka $ sudo chmod 777 /home/zajednicka/
Vidimo sljedeću strukturu:
Konfiguriramo Sambu:
$ sudo nano /etc/samba/smb.conf
Zamijenimo cijelu conf datoteku sa sljedećim tekstom:
[global] workgroup = VAŠA RADNA GRUPA server string = VAŠE IME SERVERA encrypt passwords = yes wins support = yes local master = yes domain master = no guest account = nobody disable spoolss = yes security = share guest ok = yes guest only = yes force user = nobody force group = nogroup create mask = 0777 directory mask = 0777
[common] comment = Common Folder path = /home/zajednicka public = yes writable = yes
[public] comment = Public Folder path = /home/javna public = yes writable = yes
Spremimo promjene i ponovno pokrenemo samba servis:
$ sudo /etc/init.d/samba restart
I to je to. Iz Windowsa vidimo UbuntuServer kao mrežno računalo:
Koje ima naše zadane direktorije:
To zaključuje prvi dio posla. Sada ćemo omogućiti dostupnost ovog NAS Servera preko interneta, koristeći VPN. VPN je sigurna virtualna privatna mreža koja će spajati računala u prividni LAN. Tako će se svim sudionicima u mreži činiti kao da je Ubuntu server zapravo lokalno računalo koja pruža usluge NAS računala. Za uspostavljanje VPN mreže koristimo Hamachi. Hamachi je jednostavan software koji nudi Zero-Configuration VPN.
Hamachi funkcionira tako da medijacijski server pohranjuje nadimke računala zajedno sa njihovim IP adresama. IP adrese su statički alocirane u formatu 5.x.x.x/8. Svako od računala dobije svoju IP adresu tog tipa te tako mogu uspješno komunicirati.
Za početak preuzmemo hamachi sa servera, link
$ wget files.hamachi.cc/hamachi-0.9.9.9-20-lnx.tar.gz
Nakon što je preuzimanje završeno, potreban nam je paket za manipulaciju takvima datotekama.
$ sudo apt-get install make binutils
Budući da je Hamachi za Linux sustave 32 bit aplikacija, treba obratiti pažnju na verziju Ubuntu servera koju koristimo. Ukoliko je to:
- 32 bit verzija – nema problema i samo nastavljamo
- 64 bit verzija – potrebno je instalirati run-time library-e koji omogućavaju pokretanje 32 bit aplikacija na OS-u to radimo naredbom:
$ sudo apt-get install ia32-libs
Kada smo sigurno da smo spremni za pokretanje hamachi-a, mozemo ga kompaljirati i instalirati:
$ tar –zxvf hamachi-0.9.9.9-20-lnx.tar.gz $ cd hamachi-0.9.9.9-20-lnx $ sudo make install
Očekujemo sljedeći output:
Sada je Hamachi instaliran na UbuntuServeru. Idući korak je stvoriti mrežu. Mreža služi konstruiranju međusobno poznatih računala koja su u virtualnom LAN-u. Hamachi sam po sebi zahtjeva TUN/TAP jezgrene upravljačke programe kako bi stvorio i upravljao virtualnim mrežnim sučeljima. TAP simulira Ethernet sučelje i funkcionira na drugom sloju ISO OSI modela, dok TUN simulira mrežni sloj. Instalacija sama po sebi stvara te modele, ali ih je potrebno pokrenuti. Sljedećom naredbom rješavamo taj problem:
$ sudo tuncfg
Sljedeći korak je stvoriti kriptografski par ključeva koji će se pohranjivati u Hamachi direktoriju.
$ hamachi –init
Sada moežmo pokrenuti i konfigurirati Hamachi
$ hamachi start (pokreće Hamachi) $ hamachi login (uspostavlja vezu s medijacijskim serverom) $hamachi set-nick „VAŠ NADIMAK“ (Daje ime računalu na medijacijskom serveru) $ hamachi create „IME MREŽE“ „LOZINKA MREŽE“ (stvara mrežu u koju ćemo uključiti ostala računala)
Hamachi go-online „IME MREŽE“ (postavlja mrežu on-line, tako da je mogu pretraživati ostala računala).
Ovako treba izgledati konačni output:
I to je to što se tiće konfiguracije servera. Premjestimo se sada u Win okolinu da vidimo što se dogodilo. Za početak nam treba Hamachi unmannaged klijent. Može ga se preuzeti sa :
Kada smo ga instalirali i pokrenuli vidimo sljedeće sučelje.
Slijedimo korake:
Network -> Join an Existing network
Upišemo podatke i kliknemo na JOIN
Rezultat je virtualna mreža u kojoj se nalazimo mi i server. To vidimo na sljedećoj slici:
Kao što je rečeno i prije. Oba računala su dobila IP adrese tipa 5.x.x.x. Vidimo da su to u ovom slučaju računala
- MONIKA IP: 5.6.23.1
- UbuntuServer IP: 5.27.176.44
Testirajmo svjesnost ta dva računala preko mreže 5.x.x.x:
Međusobni Ping pokazuje:
Od računala prema serveru i....
Od servera prema računalu.
Sada smo zamolili jedno drugo računalo koje se ne nalazi u ovom „kućnoj“ mreži da se priključi Hamachi VPN-u. To na sučelju izgleda ovako:
To računalo se nalazi nekoliko kilometara dalje, i čak iza PROXY servera i FireWalla. Komunikacija je sigurna, budući da se koristi Hamachi protokol kripitranja. Iz perspektive drugog računala mreža izgleda ovako:
Vidimo da je to računalo svjesno UbuntuServera:
Te može pristupiti zajedničkim mapama:
Isto tako na slici ispod možemo vidjeti dodavanje jedne datoteke u direktorij common
Vidimo da je dosadašnja konfiguracija protekla uspješno. Sada su na redu sitni prepravci i prilagodbe. Za početak, pitamo se što se dogodi kada se linux server ugasi i ponovno upali. Hoće li se Hamachi sam podignuti i uspostaviti konekciju? Odgovor je da ne. Dakle, tom problemu treba doskočiti. Tako ćemo koristiti skriptu koja to radi za nas. Samu skriptu je dizajnirao IceFlatLine, a vidimo je na sljedećem linku.
Kako bi iskoristili skriptu, moramo je editirati u NANO editoru (promijeniti user-a) te spremiti u:
$ /etc/init.d hamachi $ chmod +x hamachi
$ sudo update-rc.d hamachi defaults
Posljednjim retkom smo je omogućili prilikom svakog pokretanja računala.
--Dkostelac 18:36, 6. siječnja 2012. (CET)
--Ikudeljnj 18:36, 6. siječnja 2012. (CET)
Zaključak
U radu smo obradili mnoge medije, tehnologije i načine skladištenja podataka, kao i njihovu zaštitu. Praktični dio rada je bio osobito zanimljiv jer smo učinili nešto relativno nekonvenvionalno. Naime, upornim pretraživanjem interneta uočili smo kako NAS skladištenje podataka uz potporu VPN-a nije osobito eksponirano rješenje.
Prednosti takvog rješenja su svakako očite, podaci su dostupni preko cijelog svijeta, ali ipak iz „sigurnosti“ LAN mreže vlastitog doma. Činjenica je da je Hamachi sigurnosni protokol pouzdan i čvrst, tako da ne postoji prevelika briga oko prijenosa podataka.
S druge strane, moguće je argumentirati da ovo rješenje nije idealno, osobito uzevši u obzir prenošenje velikih paketa. Naravno, taj slučaj možemo podržati i priznati, ali uzevši u obzir da je rješenje lako implementirati čak i u kraćem vremenskom roku (pod uvjetom da znate što radite), vidljivo je zašto je dobar izbor.
Što se tiče izbora OS-a. Premda danas mnogi daju prednost FreeNAS-u, StarWindu ili sličnim rješenjima specijaliziranim za NAS, odlučili smo se za Ubuntu. Razlog je bio jednostavan, FreeNAS nije uspio ponuditi podršku za implementaciju VPN-a bez većih modifikacija. Ubuntu pak tu zadaću obavlja vrlo lako i pouzdano, a jedini potencijalni nedostatak je implementacija ZFS datotečnog sustava.
Sve u svemu, osobito je privlačna konačna nota rada, a to je da je rješenje izuzetno proširivo, moguće je implementirati i media servere koji bi opsluživala računala multimedijalnim podacima, pa čak i video streaming-om. Osim toga, potpuno je neosjetljivo na platformu izbora korisnika, jer može funkcionirati preko svih OS-ova uz vrlo male prilagodbe.
--Dkostelac 18:37, 6. siječnja 2012. (CET)