• يك انبار داده ،دادههاي دلخواه را از يك يا چند منبع جمع آوري كرده و آنها را به موضوعاتي با و گروههاي اطلاعاتي تبديل مي كند، سپس آنها را به همراه اطلاعات زمان و تاريخ براي پشتيباني بهتر از تصميم گيريها ذخيره مي كند، اين سيستمها ، ديدهاي متعددي از اطلاعات براي طيفها ي مختلف كاربران فراهم مي كند، قدرت اين مفهوم در آن است كه به كاربران اجازه تحليلها و پرس و جوهاي گوناگون بر روي دادهها يي مي دهد كه قبل از آن هيچ ارتباطي با هم نداشتند.[16]
فهرست.........................................................................................................................1
فصل اول: انبارداده چيست؟..........................................................................................4
بخش يک: تعريف انبار داده..................................................................................4
بخش دو: 4 خصوصيت اصلي انبار داده.................................................................5
بخش سه: تفاوت انبار داده و پايگاه داده................................................................7
فصل دوم: فعاليتهاي انبارداده...................................................................................10
بخش يک: دريافت داده.....................................................................................10
بخش دو: پيش پردازش دادهها...........................................................................11
پاکسازي.................................................................................................11
يکپارچهسازي..............................................................................12
تبديل دادهها.............................................................................13
کاهش دادهها.............................................................................14
بخش سه:OLAP..............................................................................................15
مدلهاي دادهاي رابطهاي وچندبعدي...................................................16
حجمهاي دادهاي.................................................................................20
شماهاي دادهاي....................................................................................21
طراحي پايگاه داده چند بعدي انبار داده................................................24
ملاحظات مربوط به طراحي پايگاه داده انبار...........................................25
انتقال اطلاعات به جدولهاي طراحي شده............................................26
ساخت حجمهاي دادهاي (در AM ).....................................................27
عمليات بر روي حجمهاي دادهاي.........................................................27
Roll Up...................................................................................27
Drill Down.............................................................................28
Slice.........................................................................................28
Dice.........................................................................................28
Pivot........................................................................................29
Drill-acros.............................................................................30
Ranking.................................................................................30
سرورهاي OLAP................................................................................30
مفاهيم actions
named set
calculated member
نمايش حجمهاي دادهاي در AM و Excel
فصل سوم: دادهکاوي
فصل اول: انبارداده چيست؟
بخش يک: تعاريف انبارداده
• Bill Inmon: مجموعه اي از دادهها ي موضوع گرا، مجتمع، غيرفرار و وابسته به زمان كه براي پشتيباني از تصميم گيريها ي مديريتي مورد استفاده قرار مي گيرد.[15]
• نسخه اي از دادهها ي چند پايگاه داده، كه به منظور تسهيل پردازش و پرس و جوهاي كاربران طراحي شده است.
• يك انبار داده ،دادههاي دلخواه را از يك يا چند منبع جمع آوري كرده و آنها را به موضوعاتي با و گروههاي اطلاعاتي تبديل مي كند، سپس آنها را به همراه اطلاعات زمان و تاريخ براي پشتيباني بهتر از تصميم گيريها ذخيره مي كند، اين سيستمها ، ديدهاي متعددي از اطلاعات براي طيفها ي مختلف كاربران فراهم مي كند، قدرت اين مفهوم در آن است كه به كاربران اجازه تحليلها و پرس و جوهاي گوناگون بر روي دادهها يي مي دهد كه قبل از آن هيچ ارتباطي با هم نداشتند.[16]
• جمع آوري ، پاكسازي انتقال داده از سيستمهاي عملياتي متعدد و آماده كردن اطلاعات حاصل براي تحليل و گزارش گيري كاربران نهايي ، انبار داري دادهها ناميده مي شود. [22]
• انبار داده پايگاه داده بزرگي است كه براي پاسخگويي به سوالات، ايجاد شده است.متناسب با انبار ، سوالات مذكور هم با هم فرق مي كنند.انبار مي تواند در اندازهها ي بزرگ (در حدود گيگابايت) يا كوچكتر باشد.كاربران انبار ممكن است كاركنان داخلي ، افراد ناشناس شبكهها و يا هر دو باشند.
• انبار داده اساس هر سيستم نرم افزاري پشتيبان تصميم گيري است و براي اخذ دادههاي DSS و كارايي بهتر پرس و جوها طراحي شده است. [24][18]
• انبار داده يك پايگاه داده موضوع گرا است كه به منظور دسترسيهاي گسترده طراحي شده است. و ابزارهايي براي برآوردن نيازهاي اطلاعاتي مديران در همه سطوح سازمان آماده مي كند ، به بيان ديگر يك انبار داده به صورتي طراحي مي شود كه كاربران اطلاعات مورد نياز خود را شناسايي كنند و بتوانند با استفاده از ابزارهاي ساده اي به آنها دسترسي داشته باشند.[16]
• يك انبار داده مخزني از اطلاعات مجتمع شده است كه براي انجام پرس و جو و تحليلها آماده مي شود.
بخش دو: چهار خصوصيت اصلي انبار داده
بر اساس تعريف Bill Inmon (که او را پدر سيستمهاي انبار داده ناميدهاند) انبار داده، مجموعه اي از دادههاي موضوع گرا، مجتمع، غيرفرار و وابسته به زمان است كه براي پشتيباني از تصميم گيريهاي مديريتي مورد استفاده قرار مي گيرد. دراين بخش بر اساس اين تعريف، که معمولترين و شناخته شدهترين تعريف انبار داده است، چهار خصوصيت اصلي انبار داده را مورد بررسي قرار ميدهيم
• موضوعگرا :هر انبار داده دادههاي مرتبط با يک موضوع خاص را در خود نگاه ميدارد و اين دادهها را به منظور استخراج مفاهيم و نتايج خاصي به شكلي ويژه سازماندهي ميکند. بدين ترتيب سرعت جستجوها در انبار بسيار بالا خواهد بود. انبار داده براي پاسخگويي به پرسشهاي مختلف در مورد يک موضوع خاص بهينهسازي ميشود.[24]
• مجتمع : در سيستمهاي مختلف دادهها ممکن است از جنبههاي مختلفي با هم نامتناسب باشند. مثلاً منابع داده در کشورهاي مختلف با زمان و تاريخهاي مختلف ذخيره شدهاند. و يا منابعي که از ماشينهاي مختلف هستند در اعداد، حروف و ديگر فيلدها متناسب با محدوديتهاي ماشين، سيستمعامل و تطابق با استانداردهاي مختلف متفاوت هستند. [22] با توجه به مختلف بودن منابع انبارداده، قبل از ذخيره سازي آنها در انبار داده براي تأمين يکپارچگي تکنيکهاي پاکسازي دادهها و مجتمعسازي به کار ميرود. با توجه به اين موضوع که دادهها زير نظر مديريت واحدي ذخيره سازي ميشوند، دادههاي کاملاً سازگاري خواهيم داشت که داشتن چنين سازگاري در ساير سيستمها مثل سيستمهاي شبکهاي و توزيعي ناممکن است.
• متغير با زمان : دادهها در انبارداده براي تهيه اطلاعات تاريخي( مثلاٌ براي 5 تا 10 سال پيش) به کار ميروند. هر ساختار کليدي در انبار داده شامل عنصر زمان يا همان مهر زماني است اين مهر زماني به عنوان کليدي به ساير جداول عمل ميکند.[24]سيستم انبار داده دادهها هرگز به روز درآوري نميشوند. بلكه دادههاي جديد و يا تغيير يافته با مهرهاي زماني جديد به انبار اضافه ميشوند.