Formation Evaluation of Well Logs Analysis Approach for Nubian Sandston Reservoir Development within East of Sirt Basin

تاريخ النشر

2009

نوع المقالة

رسالة ماجستير

عنوان الرسالة

كلية العلوم - جامغة طرابلس

المؤلفـ(ون)

حنان عيسي سعيد اشتوي

ملخص

مؤخرا أصبح نظام مخزن البيانات (Data warehouse (DW)) مهم جدا لصانعيِ القرار. فمعظم الاستفسارات في مخزن البيانات ( Data warehouse (DW)) كبيرة معقدة ومتكررة. إمكانية إجابة هذه الاستفسارات بكفاءة هي مسألة صعبة في بيئة مخزن البيانات (Data warehouse (DW). نظام مخزن البياناتِ تم تحسينه لعمل التقارير وتحليل المعالجة المباشرة هذا التطبيقِ (on line analytical processing (OLAP) ) يُزوّدُ المستعملين بالأدواتِ لاستفسارات مخازنِ البياناتِ بشكل متكرر لكي يَتّخذوا قراراتَ أفضلَ وأسرعَ. هناك العديد مِنْ الحلولِ لتَسْريع معالجة الاستفسار مثل الجداول الملخصة (summary tables )، الفهارس (indexes )، الآلات المتوازية (parallel machines)، الخ؛ الجداول الملخصة يكون أدائها جيد عندما تكون الاستفسارات محدّدة مسبقا، ولكن عندما يظهر استفسار غير مُتوّقع، النظام يقوم بمسحَ ( scan )، جلب (fetch )، وتصنيف ( sort ) البياناتَ الفعليةَ، وهذا يقلل من ك كفاءة الأداءِ؛ إضافة إلى ذلك فعندما يتغيّر الجدول الأساسي ُ، يجب إعادة حساب الجداول الملخصة؛ الجداول الملخصة تَدعم الاستفسارات المتكرّرةَ المعروفةَ فقط، و في أغلب الأحيان تَتطلّبُ وقتَ أكثرَ ومساحةَ أكبرَ مِنْ البياناتِ الأصليةِ. لأننا لا نَستطيعُ بِناء كُلّ الجداول الملخصة المحتملة، و اختيار أي البيانات لبناء الجداول الملخصة لها صعب؛ وعلاوة على ذلك، تلخيص البياناتَ تَخفي معلوماتَ ثمينةَ؛ باستخدام الفهارس (indexes ) الفعالة، تم معالجة استفسارات معقّدةَ أسرع بكثيرَ مِنْ معالجتها باستخدام فهارس أقل فاعلية؛ لكن أداءَ الاستفسار يَعتمدُ أقل على عدد الفهارس التي تم تكوينها على الجداول أكثر مِنْها على نوعِ الفهارس التي تم تكوينها على الجداول; لذا الفَهْرَسَة هي المفتاحُ لإنْجاز هذا الهدفِ بدون إضافة أجهزةِ إضافيةِ. فقط إذا تم بناء الفهارس الصحيحةِ على الأعمدةِ، أداء الاستفسارات و خصوصا الاستفسارات الغير متوقعة (ad hoc) ستتحسن. عند تكوين الفهارس هناك خصائص الأعمدة التي يجب أخذها في عين الاعتبار عند اختيار الفهارس الصحيحةِ على الأعمدةِ، حيث أن لكل عمود خصائص خاصة به مثل Cardinality وهو يمثل عدد القيم المختلفة في العمود المراد فهرسته value rangeهو مدى القيم في العمود Distribution هو عدد القيم المتشابهة في العمود الواحد؛ و في نظام مستودع البيانات (DW) هناك عدة تقنيات للفهرسة وكل نوع من أنواع الفهرسة مناسب لحالة معينة؛ وفي هذا البحث سيتم دراسة و تقييم تقنيات الفهرسة وهي B_tree index و Bitmap index؛ و من خلال دراسة تقنيات الفهرسة وتقييمها في هذا البحث سنجد أن اختيار تقنية الفهرسة المناسبة لا تعتمد على (cardinality) ولكن تعتمد على نوع التطبيق والذي يجب على أساسه اختيار نوع الفهرسة المناسب.

Abstract

Recently, data warehouse (DW) system is becoming more and more important for decision-makers. In order to make better and faster decisions an Online Analytical Processing (OLAP) application provides users with tools to iteratively query the DW. The information stored in a DW is obtained through many different sources. Most of the queries against a large data warehouse are complex and iterative and contain a large number of records. Such complex queries could take several hours or days to process. The ability to answer these queries quickly is a critical issue in the data warehouse environment. There are many solutions to speed up query processing such as summary tables, indexes, parallel machines, etc. The performance when using summary tables for predetermined queries is good. But it often supports only known frequent queries, and requires more time and more space than the original data. Indexing is the key to achieve this objective without adding additional hardware. If the right index structures are built on columns, the performance of queries, especially ad hoc queries will be greatly enhanced. In indexing there are characteristics of a column that need to be considered in order to select the right index structure. Each column has its own characteristics these characteristics are Cardinality data, Distribution, and value range. In data warehouse systems, there are many indexing techniques. Each indexing technique is suitable for a particular situation. In this research, we describe and evaluate a b-tree and a bitmap indexing techniques and from this research we will find out that the usage of indexes is not in fact cardinality dependent but rather application dependent.