มีเกณฑ์ต่างๆ ในการเลือกแหล่งข้อมูลดังนี้ −
การเข้าถึงข้อมูล − หากมีฟีดที่เป็นไปได้สองแบบสำหรับข้อมูล ตัวหนึ่งจะถูกเก็บไว้ในไฟล์ไบนารีที่ดูแลโดยชุดของโปรแกรมที่เขียนขึ้นก่อนที่สมาชิกทีมโปรเจ็กต์ที่อายุน้อยที่สุดจะเกิด และอีกฟีดมาจากระบบที่อ่านเอกสารไบนารีและสนับสนุนการประมวลผลที่มากขึ้น จากนั้น การตัดสินใจนั้นชัดเจน
ความถูกต้องของข้อมูล − เมื่อมีการส่งข้อมูลจากระบบหนึ่งไปอีกระบบหนึ่ง จึงมีการปรับเปลี่ยนหลายอย่าง บางครั้งมีการเพิ่มองค์ประกอบข้อมูลจากระบบอื่น และบางครั้งองค์ประกอบที่มีอยู่จะได้รับการประมวลผลเพื่อสร้างองค์ประกอบใหม่และองค์ประกอบอื่นๆ จะหายไป
แต่ละระบบทำงานได้ดี อย่างไรก็ตาม การระบุข้อมูลดั้งเดิมอาจกลายเป็นเรื่องยากหรือเป็นไปไม่ได้ ในบางกรณี ข้อมูลจะไม่แสดงถึงสิ่งที่ธุรกิจต้องการสำหรับการวิเคราะห์อีกต่อไป หากคุณให้ข้อมูลจากระบบดาวน์สตรีมเหล่านี้ ผู้ใช้อาจตั้งคำถามถึงความถูกต้อง
กำหนดการโครงการ − ในหลายองค์กร โครงการคลังข้อมูลเริ่มต้นโดยเป็นส่วนหนึ่งของการเขียนใหม่ของระบบ OLTP ที่มีอยู่ เมื่อโครงการพัฒนาระบบใหม่เริ่มเปิดเผย ผู้ใช้ทางธุรกิจที่เชื่อมั่นในคุณค่าของคลังข้อมูลอย่างปลอดภัยเริ่มยืนกรานให้ดำเนินการคลังข้อมูลไม่ช้าก็เร็ว
ในการให้ข้อมูลประวัติ คุณต้องรวมข้อมูลจากระบบที่มีอยู่ในคลังข้อมูลของคุณ หากการเขียนใหม่ของระบบเก่าถูกระงับ คลังข้อมูลสามารถใช้ระบบปัจจุบันต่อไปได้ เมื่อระบบใหม่ออกสู่การผลิตแล้ว ฟีดข้อมูลสามารถเปลี่ยนไปใช้ระบบใหม่ได้ ในหลายกรณี มีความเป็นไปได้ที่จะส่งมอบคลังข้อมูลก่อนที่ระบบปฏิบัติการใหม่จะเสร็จสมบูรณ์
ข้อมูลมิติข้อมูลบางอย่างมักจะมาพร้อมกับข้อมูลธุรกรรมหรือข้อมูลข้อเท็จจริง แต่โดยทั่วไปแล้วจะมีน้อยที่สุดและมักจะอยู่ในรูปแบบของรหัสเท่านั้น คุณลักษณะเพิ่มเติมที่ผู้ใช้ต้องการและจำเป็นนั้นมาจากหลายระบบหรือไฟล์หลักร่วม
ในหลายกรณี อาจมีไฟล์หลักหลายไฟล์ โดยเฉพาะอย่างยิ่งสำหรับมิติของลูกค้า มักจะมีไฟล์แยกกันที่ใช้ทั่วทั้งองค์กร การขาย การตลาด และการเงินอาจมีไฟล์หลักของลูกค้า
มีปัญหายากสองประการในตอนแรก ลูกค้าที่อยู่ในไฟล์เหล่านี้อาจแตกต่างกัน และคุณลักษณะเกี่ยวกับลูกค้าแต่ละรายอาจแตกต่างกัน ประการที่สอง ข้อมูลทั่วไปอาจไม่ตรงกัน หากมีเวลาและเงินไม่จำกัด ก็สามารถดึงข้อมูลที่สมบูรณ์จากทุกแหล่งแล้วรวมเข้าเป็นมุมมองที่ครอบคลุมของลูกค้าแต่ละราย
ในกรณีส่วนใหญ่ ไม่มีเวลาหรือเงินเพียงพอที่จะทำทั้งหมดในคราวเดียว ในกรณีเหล่านี้ ขอแนะนำให้ผู้ใช้จัดลำดับความสำคัญของข้อมูล และคุณเริ่มต้นด้วยสิ่งที่คุณทำได้และขยายต่อไปในอนาคต