A GridFS a MongoDB specifikációja nagyméretű fájlok, például képek, hangfájlok, videofájlok stb. tárolására és visszakeresésére. Ez egyfajta fájlrendszer a fájlok tárolására, de az adatokat a MongoDB gyűjteményeken belül tárolja. A GridFS képes a dokumentum 16 MB-os mérethatáránál is nagyobb fájlok tárolására.
A GridFS a fájlt darabokra osztja, és minden egyes adatdarabot külön dokumentumban tárol, amelyek maximális mérete 255k.
A GridFS alapértelmezés szerint két gyűjteményt használ fs.files és fs.chunks a fájl metaadatainak és a darabok tárolására. Minden egyes chunkot az egyedi _id ObjectId mező azonosít. Az fs.files szülődokumentumként szolgál. Az fs.chunks dokumentum files_id mezője összekapcsolja a chunkot a szülőjével.
A következő az fs.files gyűjtemény egy mintadokumentuma –
{ "filename": "test.txt", "chunkSize": NumberInt(261120), "uploadDate": ISODate("2014-04-13T11:32:33.557Z"), "md5": "7b762939321e146569b07f72c62cca4f", "length": NumberInt(646)}
A dokumentum megadja a fájl nevét, a chunk méretét, a feltöltés dátumát és hosszát.
A következő az fs.chunks dokumentum mintadokumentuma –
{ "files_id": ObjectId("534a75d19f54bfec8a2fe44b"), "n": NumberInt(0), "data": "Mongo Binary Data"}
Fájlok hozzáadása a GridFS-hez
Most egy mp3 fájlt fogunk tárolni a GridFS segítségével a put parancs segítségével. Ehhez a MongoDB telepítő mappájának bin mappájában található mongofiles.exe segédprogramot fogjuk használni.
Nyissuk meg a parancssort, navigáljunk a MongoDB telepítő mappájának bin mappájában található mongofiles.exe programra, és írjuk be a következő kódot –
>mongofiles.exe -d gridfs put song.mp3
Itt a gridfs annak az adatbázisnak a neve, amelyben a fájlt tárolni fogjuk. Ha az adatbázis nincs jelen, a MongoDB automatikusan létrehoz egy új dokumentumot menet közben. Song.mp3 a feltöltött fájl neve. Ahhoz, hogy megnézzük a fájl dokumentumát az adatbázisban, használhatjuk a find lekérdezést –
>db.fs.files.find()
A fenti parancs a következő dokumentumot adta vissza –
{ _id: ObjectId('534a811bf8b4aa4d33fdf94d'), filename: "song.mp3", chunkSize: 261120, uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41", length: 10401959 }
Az fs-ben lévő összes darabot is láthatjuk.chunks gyűjteményt a tárolt fájlhoz kapcsolódóan a következő kóddal, az előző lekérdezésben visszaadott dokumentum azonosítóját használva –
>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})
Az én esetemben a lekérdezés 40 dokumentumot adott vissza, ami azt jelenti, hogy a teljes mp3 dokumentum 40 adatdarabra lett felosztva.