Araştırma projeleri sayısız veri türü oluşturur ve toplar. Bir veri yönetimi planını formüle etmek için, verilerinizi dört şekilde kategorilere ayırmak yararlıdır: kaynağa, biçime, dayanıklılık ve miktara göre.
Verilerin kaynağı nedir?
Veriler birçok farklı kaynaktan gelse de, bunlar dört ana kategoriye ayrılabilir. Verilerinizin geldiği kategoriler, veri yönetimi planınız boyunca yaptığınız seçimleri etkileyecektir.
Gözlemsel
Deneysel
Simülasyon
Türetilmiş / Derlenmiş
Verilerin şekli nedir?
Veriler, aşağıdakiler de dahil olmak üzere birçok biçimde olabilir:
Veriler ne kadar kararlı?
Veriler ayrıca proje boyunca (ve belki de projenin sonunda) sabitlenebilir veya değiştirilebilir. Veriler hiç değişti mi? Büyüyorlar mı? Önceden kaydedilmiş veriler düzeltilmeye tabi mi? Veri sürümlerini takip etmeniz gerekecek mi? Zamanla ilgili olarak ortak veri seti kategorileri şunlardır:
Bu sorunun cevabı, verileri nasıl düzenlediğinizi ve üstlenmeniz gereken sürüm düzeyini etkiler. Hızla değişen veri kümelerini takip etmek zor olabilir, bu nedenle sizi tüm veri yönetimi sürecine taşımak için bir planla başlamanız zorunludur.
Proje ne kadar veri üretecek?
Örneğin, görüntü verileri genellikle çok fazla depolama alanı gerektirir, bu nedenle tüm görüntülerinizi saklayıp saklamayacağınıza (ve saklamayacaksanız hangisini atacağınıza nasıl karar vereceğinize) ve bu büyük verilerin nereye yerleştirilebileceğine karar vermek istersiniz. Arşivleme kuruluşunuzun depolama ve yedekleme kapasitesini bildiğinizden emin olun.
Yeterince hazırlıklı olabilmek için verilerinizin büyüme oranını tahmin edin. Dikkate alınması gereken bazı sorular:
Kaynak: DMPTool
Verileriniz için seçtiğiniz dosya biçimi, başkasının bu verilere gelecekte erişebilmesi için birincil faktördür. Verilerinizi yönetmek, paylaşmak ve korumak için hangi dosya biçiminin en iyi olacağını dikkatlice düşünün. Teknoloji sürekli değişiyor ve tüm çağdaş donanım ve yazılımların modası geçiyor. Verinizi üretmek için kullanılan yazılım kullanılamaz hale gelirse verilerinizin nasıl okunacağını düşünün. Bugün seçtiğiniz herhangi bir dosya biçimi gelecekte okunamayabilir olsa da, bazı biçimlerin diğerlerinden daha okunabilir olma olasılığı yüksektir.
Gelecekte erişilebilir olması muhtemel biçimler şunlardır:
Tercih edilen biçim seçeneklerine örnekler:
Verilerle tescilli dosya biçiminde çalışmanın gerekli veya uygun olduğunu düşünüyorsanız, bunu yapın, ancak işiniz bittiğinde çalışmanızı arşiv biçiminde kaydetmeyi düşünün.
Önerilen biçimler hakkında daha fazla bilgi için, Birleşik Krallık Veri Hizmeti Kılavuzuna bakın.
Tablo Verileri
Tablo şeklinde veriler (özellikle Excel elektronik tabloları gibi) disiplinlerarası alanlarda çok yaygın kullanıldığı için özel bir ilgi gerektirir. Analizinizi Excel'de yaparsanız, işinizi tamamladığınızda .csv biçiminde dışa aktarmak için "Farklı Kaydet ..." komutunu kullanmanız gerekir. En iyi uygulamaları oluşturduğunuzda bakarsanız , e-tablolarınızı anlamak ve dışa aktarmak daha kolay olacaktır.
Erişilebilirlik için diğer riskler
Kaynak: DMPTool
Temel Dizin ve Dosya Adlandırma Kuralları
Bunlar, zaten kendi dahili sözleşmeleriniz yoksa veri dosyalarınızı yönetmenize yardımcı olması için izlenmesi gereken temel yönergelerdir. Dosyaları düzenlerken, üst dizin / klasör şunları içermelidir:
Alt dizin yapısının açık, belgelenmiş adlandırma kurallarına sahip olması gerekir. Ayrı dosyalar veya dizinler, örneğin, bir denemenin her çalışmasına, veri kümesinin her sürümüne ve / veya gruptaki her kişiye uygulanabilir.
Dosyayı Yeniden Adlandırma
Size yardımcı olacak araçlar:
Kaynak: DMPTool