سیستم طراحی شده برای بهبود عملکرد بانک اطلاعاتی برای مراقبت های

بعضی اوقات بهتر است باهوش تر کار کنید و سخت تر نباشد. همین مسئله در مورد عملکرد اوج برای پایگاه داده نیز صادق است.

 

 

یکی از چالش های مهم استفاده از بانکهای اطلاعاتی - چه برای مراقبت های بهداشتی ، اینترنت اشیاء و چه برنامه های کاربردی دیگر - این است که سرعت های بالاتر با هزینه های عملیاتی بالاتر به وجود می آید و منجر به تأمین بیش از حد مراکز داده برای دسترسی به داده های بالا و عملکرد پایگاه داده

 

با حجم داده های بالاتر ، پایگاه های داده ممکن است بار کاری مانند خواندن و نوشتن را در صف خود قرار دهند و قادر به عملکرد پایدار و قابل پیش بینی نباشند ، که ممکن است یک معامله گر برای سیستم های خودمختار بحرانی در شهرهای هوشمند یا ارتش باشد.

 

تیمی از دانشمندان رایانه از دانشگاه پوردو سیستمی به نام SOPHIA ایجاد کرده اند که به منظور کمک به کاربران در پیکربندی پایگاه داده برای عملکرد بهینه با بارهای متغیر با زمان و برای برنامه های متنوع اعم از metagenomics گرفته تا محاسبات با کارایی بالا (HPC) تا IoT ، جایی که بالا است -throughput ، پایگاه داده های انعطاف پذیر بسیار مهم هستند.

 

تیم Purdue در کنفرانس فنی سالانه USENIX 2019 فناوری SOPHIA را ارائه کرد.

 

سومالی چاترجی ، استادیار Purdue ، مهندسی کشاورزی و مهندسی بیولوژیکی ، که مدیر نوآوری سلولها و ماشینهای عصبی [ICAN] را راهنمایی می کند ، می گوید: "شما باید قبل از اینکه جهش کنید ، نگاه کنید." "شما نمی خواهید یک مدیر سیستم باشید که بطور ساده ، پارامترهای پیکربندی پایگاه داده را بطور ساده و با پارامترهای بیش از 50 پارامتر حساس به عملکرد و اغلب وابسته به یکدیگر تغییر دهید ، زیرا هزینه عملکرد به مرحله تنظیم مجدد وجود دارد. جایی که آنالایزر هزینه و سود SOPHIA وارد بازی می شود ، زیرا این کار را مجدد می کند که پایگاه داده های noSQL را مجدداً تنظیم کند ، زیرا سود بیشتر از هزینه بازسازی آن است. "

 

تأثیر تنظیم مجدد بر عملکرد سیستم. SOPHIA برای برآورد هزینه و فواید هر مرحله از تنظیم مجدد از اطلاعات مربوط به مدت زمان کار استفاده می کند و برنامه هایی را تولید می کند که از نظر جهانی سودمند باشند. اعتبار: دانشگاه پوردو

سیستم SOPHIA Purdue دارای سه مؤلفه است: یک پیش بینی کننده بار کار ، آنالیزور هزینه و سود و پروتکل تنظیم مجدد غیرمتمرکز که از نیازهای در دسترس بودن داده های سازمان آگاهی دارد.

 

صوراب باغچی ، استاد پوردو ، مهندسی برق و کامپیوتر و گفت: "سه مؤلفه ما با هم کار می کنند تا بتوانیم حجم کار برای یک بانک اطلاعاتی را درک کنیم و سپس تجزیه و تحلیل هزینه و فایده را انجام دهیم تا در مواجهه با بارهای کاری پویا که به طور مکرر تغییر می کنند ، عملکرد بهینه ای را بدست آوریم." علم کامپیوتر (با ادب). "مؤلفه نهایی سپس تمام اطلاعات را برای تعیین بهترین زمان برای پیکربندی مجدد پارامترهای پایگاه داده برای دستیابی به حداکثر موفقیت انجام می دهد."

 

 

 

تیم Purdue با استفاده از Cassandra و Redis ، دو پایگاه داده مشهور noSQL ، یک کلاس بزرگ از بانکهای اطلاعاتی که به طور گسترده برای پشتیبانی از برنامه های کاربردی از جمله شبکه های اجتماعی و پخش محتوای صوتی و تصویری استفاده می شود ، این فناوری را محک زدند.

 

چاترجی گفت: "Redis یک کلاس خاص از پایگاه داده های noSQL است به این دلیل که این یک ساختار ساختار داده با ارزش کلیدی در حافظه است ، البته با دوام دیسک سخت برای دوام". "بنابراین ، با Redis ، SOPHIA می تواند راهی برای بازگرداندن ویژگی حافظه مجازی کاهش یافته Redis باشد ، که باعث می شود حجم داده ها بزرگتر از رم دستگاه باشد."

 

توسعه دهنده اصلی این پروژه اشرف محقق ، دکتری است. دانشجوی رشته کامپیوتر. او در تابستان امسال برای کارآموزی با تحقیقات مایکروسافت باز خواهد گشت ، و با بازگشت این پاییز ، وی به کار روی تکنیک های بهینه سازی بیشتر برای پایگاه داده های تحت میزبانی ابری ادامه خواهد داد.

 

 

آزمایش تیم پوردو نشان داد که SOPHIA در تنظیمات پایگاه داده به صورت پیش فرض و بهینه سازی شده با استاتیک به نفع چشمگیری کسب کرده است. این مزیت حتی در عدم وجود اطمینان در پیش بینی ویژگی های شغلی دقیق باقی می ماند.

 

این کار همچنین نشان داد که Cassandra می تواند در اولویت محبوبیت اخیر Drill-ScyllaDB ، یک پایگاه داده تنظیم خودکار ، با توان بیشتر در کل انواع انواع کار استفاده شود ، مادامی که یک تیونر پویا ، مانند SOPHIA ، پوشانده شود. در بالای کاساندرا.

 

SOPHIA با MG-RAST ، یک پلت فرم متاگانومیک برای داده های میکروبیوم مورد آزمایش قرار گرفت. بار کاری محاسباتی با کارایی بالا؛ و حجم کار IoT برای کشاورزی دیجیتال و اتومبیلهای خودران.