مفاهیم مدل سازی داده ۱
یک داستان عامیانه محبوب در مورد چهار مرد نابینا و یک فیل به نشان دادن هدف مدلسازی داده کمک میکند:
چهار مرد نابینا در طول سفر خود به یک فیل برخورد کردند. مردان نابینا تا به حال با یک فیل روبرو نشده بودند، اما آنها گروهی کنجکاو بودند. بنابراین، هر یک از افراد نابینا سعی می کرد با لمس فیل، آن را بیاموزد. اولین مرد نابینا فیل را از خرطوم گرفت و فریاد زد: «اوه! فیل مانند مار است – لوله ای بلند و لغزنده. مرد نابینای دوم دستش را دراز کرد، پهلوی فیل را لمس کرد و گفت: “نه، نه، فیل بیشتر شبیه یک دیوار است – بسیار صاف و محکم.” سومین مرد نابینا گیج شده بود، پس دستش را دراز کرد تا فیل را لمس کند، اما دستش را روی عاج گرفت و گفت: “نه، هر دو اشتباه می کنید، فیل بیش از هر چیز دیگری شبیه نیزه است!” چهارمین مرد نابینا پای فیل را گرفت و فریاد زد: “همه شما اشتباه می کنید، فیل بسیار شبیه درخت است – گرد و محکم.”
خب، هر نابینایی درست میگفت، اما اشتباه هم میکرد. مشکل در تجربه هر نابینا نبود، بلکه در دامنه آن تجربه بود. برای اینکه یک مدلساز داده موفق باشید، باید یاد بگیرید که کل «حقیقت» نیازهای دادهای کسبوکارتان را کشف کنید. شما نمی توانید به نیازهای یک کاربر یا حتی یک متخصص تکیه کنید، زیرا دامنه تجربه آن شخص جامع نخواهد بود. هدف یک مدل داده ثبت داده های مورد نیاز یک فرآیند تجاری است. دامنه مدل داده برای هر رشته کسب و کار باید جامع باشد. اگر یک مدل دادههای سازمانی برای سازمان وجود داشته باشد، هر مدل دادههای کسبوکار به تنهایی باید از نظر صحت در برابر مدل کلی دادههای سازمانی تأیید شود.
هدف یک مدل داده ثبت داده های مورد نیاز یک فرآیند تجاری است.
مدل سازی داده ها، در ابتدایی ترین سطح، به عنوان یک سرمایه گذاری مفهومی آغاز می شود. اولین هدف از مدل سازی داده های مفهومی، درک الزامات است. یک مدل داده، به خودی خود، ارزش محدودی دارد. البته، یک مدل داده با افزایش ارتباطات و مفاهیم، ارزش ارائه میکند و میتوان ادعا کرد که مدل داده ها کاملاً ارزشمند هستند. با این حال، ارزش اولیه یک مدل داده، توانایی آن برای استفاده به عنوان یک طرح برای ساخت یک پایگاه داده فیزیکی است.
هنگامی که پایگاه های داده از یک مدل داده به خوبی طراحی شده ساخته می شوند، ساختارهای حاصل ارزش بیشتری را برای سازمان فراهم می کنند. مقدار به دست آمده از مدل داده خود را در قالب به حداقل رساندن افزونگی داده، حداکثر یکپارچگی داده، افزایش ثبات، به اشتراک گذاری بهتر داده ها، افزایش ثبات، دسترسی به موقع به داده ها و قابلیت استفاده بهتر از داده ها نشان می دهد.
این ویژگیها به این دلیل به دست میآیند که مدل داده به وضوح نیازمندیها و روابط منابع داده را به شیوهای واضح و مختصر ترسیم میکند. ساخت پایگاه داده از یک مدل داده منجر به اجرای بهتر پایگاه داده می شود زیرا درک بهتری از داده هایی که باید در پایگاه داده خود ذخیره شوند خواهید داشت.
مدل داده های سازمانی
مدل داده سازمانی یک مدل داده واحد است که به طور جامع نیازهای داده کل سازمان را توصیف می کند. این فصل مدلهای داده را به عنوان پروژهها یا برنامههای کاربردی مورد بحث قرار میدهد و از پرداختن به موضوع نسبتاً پیشرفته مدل دادههای سازمانی خودداری میکند. مدیریت و نگهداری یک مدل داده سازمانی مملو از مباحث غیر مرتبط با پایگاه داده مانند سیاستهای شرکتی و ROI است که تعیین کمیت آنها دشوار است.
اگر سازمان شما متعهد به توسعه و حفظ یک مدل داده سازمانی است، قطعاً باید با مراجعه به کتابهایی که در پایان این فصل به آنها اشاره شده است، برای مطالعه بیشتر در مورد موضوع وقت بگذارید.
یکی دیگر از مزایای مدلسازی داده، فرصت کشف کاربردهای جدید دادهها است. یک مدل داده میتواند الگوهای داده و استفادههای بالقوه برای دادههایی را که ممکن است پنهان باقی بمانند، روشن کند. کشف چنین الگوهایی می تواند نحوه عملکرد کسب و کار شما را تغییر دهد و به طور بالقوه می تواند منجر به مزیت رقابتی و افزایش درآمد برای سازمان شما شود.
یک مدل داده می تواند الگوهای داده و کاربردهای بالقوه داده را روشن کند.
مدلسازی دادهها نیاز به ذهنیت متفاوتی از جمعآوری الزامات برای توسعه برنامهها و وظایف فرآیند محور دارد. به جای اینکه وظایف «چگونه» انجام شوند، به «چه چیزی» مورد علاقه است فکر کنید. برای انتقال به این شیوه تفکر جایگزین، این سه قانون را دنبال کنید:
• فیزیکی فکر نکنید. مفهومی فکر کنید. به جای مسائل ذخیره سازی فیزیکی و محدودیت های DBMS، خود را به مسائل و شرایط تجاری اهمیت دهید.
• فرآیند محور فکر نکنید. ساختارمند فکر کنید. نحوه انجام کاری، اگرچه برای توسعه اپلیکیشن مهم است، اما برای مدل سازی داده ها مهم نیست. چیزهایی که فرآیندها در مورد آنها اعمال می شوند، برای مدل سازی داده ها مهم هستند.
• خطی فکر نکنید. رابطه مند فکر کنید. نحوه ارتباط چیزها با یکدیگر مهم است، زیرا روابط مدل داده را ترسیم می کنند. روشی که در آن روابط طی می شود برای مدل سازی داده های مفهومی و منطقی اهمیتی ندارد.
به خاطر داشته باشید که همانطور که مدل های داده خود را ایجاد می کنید، واژگان کسب و کار سازمان خود را توسعه می دهید. همانطور که یک فرهنگ لغت به عنوان واژگان یک زبان خاص عمل می کند، مدل داده به عنوان واژگان اصطلاحات تجاری و کاربرد آنها عمل می کند.
نمودار موجودیت-رابطه
مدلهای داده معمولاً در قالب گرافیکی با استفاده از نمودار رابطه موجودیت یا به اختصار نمودار E/R ارائه میشوند. یک نمودار E/R به صورت گرافیکی موجودیت ها و روابط یک مدل داده را نشان می دهد. تصویر ۱ یک نمونه نمودار E/R را نشان می دهد. این نمودار با استفاده از ERwin، از Computer Associates، یک ابزار پیشرو در مدلسازی و طراحی داده، تولید شده است. بسیاری از ابزارهای محبوب مدل سازی داده از فروشندگان مختلف در دسترس هستند. برای فهرستی از ابزارهای مدل سازی داده ها و فروشندگان، به پیوست C مراجعه کنید.
تصویر ۱
یک نمودار E/R به صورت گرافیکی موجودیت ها و روابط یک مدل داده را نشان می دهد.
روش ها و تکنیک های نمودارسازی متعددی برای نمودار E/R موجود است. صرف نظر از روش استفاده شده، یک نمودار E/R موجودیت ها را در کادرها نشان می دهد و از خطوط یا فلش ها برای نشان دادن روابط استفاده می کند. قالب کادرها و خطوط با روش نموداری متفاوت است. تعدادی از متداول ترین روش های نمودار E/R در تصویر ۲ نشان داده شده است.هیچ روشی را بر سایر روش ها برتری ندهید، بنابراین یکی را انتخاب کنید و سعی کنید به آن پایبند باشید تا سردرگمی را به حداقل برسانید. در صورتی که تیم های مدل سازی مختلف از الگوهای متفاوتی استفاده کنند ، اشتراک دانش موجود در مدلهای داده را دشوارتر میکند. علاوه بر این، ادغام مدل های داده در یک مدل داده سازمانی را پیچیده می کند.
تصویر ۲
دوباره به تصویر ۲ مراجعه کنید. تفاوت عمده بین روش های نموداری در نحوه نشان دادن محدودیت قدرت است. محدودیت قدرت به حداکثر تعداد ارتباط که یک موجودیت می تواند ایجاد کند، اشاره دارد. هر ردیف از تصویر ۲ نشان می دهد که چگونه یک سبک نمودار E/R متفاوت روابط یک به یک، یک به چند و چند به چند را مدیریت می کند. روش های نمودار E/R به نام مبتکر این تکنیک نامگذاری شده اند. بر اساس ردیف، نام تکنیک های نموداری نشان داده شده در تصویر ۲ عبارتند از: راس، باخمن، مارتین، چن و رامبا.
اکثر ابزارهای مدل سازی از یک یا چند مورد از این تکنیک های نموداری پشتیبانی می کنند. محبوب ترین تکنیک های نمودارسازی مارتین ( به عنوان مهندسی اطلاعات شناخته می شود) و راس هستند. نمودار E/R در تصویر ۱ با استفاده از تکنیک مارتین توسعه یافته است. غیر از محبوبیت، هر یک از این تکنیکها توسط بسیاری از مدلسازان داده استفاده میشود، و شما باید تکنیکی را انتخاب کنید که استفاده و درک آن برای افراد سازمان شما آسانتر باشد.
یکی دیگر از تکنیک های مدل سازی محبوب، Unified Modeling Language است. UML تلفیقی از چندین نماد و مفهوم شی گرا است. این اثر از آثار گریدی بوچ، جیمز رامبو و ایوار جاکوبسون سرچشمه گرفته است. UML مجموعه ای استاندارد از نمودارها و نمادها را برای مدل سازی سیستم های شی گرا فراهم می کند. UML در واقع ۹ نوع نمودار برای مدل سازی انواع مختلف سیستم ها تعریف می کند. نمودار کلاس UML را می توان برای مدل سازی داده ها استفاده کرد، اما نمودارهای سنتی E/R اطلاعات بیشتری در مورد داده های خالص دریافت می کنند و نسبت به UML برای مدل سازی داده ها و وظایف طراحی پایگاه داده رابطه ای مناسب تر هستند. تصویر ۳ نمونه ای از نمودار کلاس UML را نشان می دهد که یک مدل داده برای یک شرکت هواپیمایی را نشان می دهد. از آنجایی که اشیا هم شامل داده ها و هم فرآیند می شوند، UML چیزی فراتر از یک تکنیک نمودارسازی مدل سازی داده است.
تصویر ۳
این مقاله نوشته کرگ مولینز است.
ترجمه: سجاد نوروزی